CEVIU Logo
Voltar
American Express adota arquitetura baseada em células para garantir resiliência em sistemas de pagamento

American Express adota arquitetura baseada em células para garantir resiliência em sistemas de pagamento

Aprofundamento CEVIU

Aprofundamento

A arquitetura baseada em células da Amex não é só isolamento, é um sistema de engenharia de baixa latência com tempo de aprovação médio de 2 ms, feito para escalar sob pressão real: 72,2 bilhões de dólares em faturamento em 2025 e mais de 170 milhões de estabelecimentos aceitando a rede. Cada célula roda em Kubernetes, usa Go no Global Transaction Router (GTR) para gerenciar milhares de conexões ISO8583 simultâneas via goroutines, e comunica internamente com gRPC/HTTP/2 e Protocol Buffers, tudo alinhado à sua filiação Gold na CNCF desde 2021.

O GTR não é um load balancer genérico: ele entende o suficiente do protocolo de pagamento para rotear por parceiro, mercado ou tipo de transação, mas deliberadamente ignora a lógica de processamento. Isso mantém o edge fino, sem dependências síncronas de configuração ou logging no caminho crítico. Se o serviço de configuração cai, o GTR continua operando com a última versão em memória. Se o coletor de logs enche o buffer, ele descarta dados em vez de bloquear transações. É resiliência por projeto, não por acidente.

O que mudou

Em abril de 2026, a Amex já havia lançado seu kit de desenvolvimento para comércio agentic, sinalizando uma aposta clara em IA como camada de interação com o cliente. Agora, em junho de 2026, ela entrega a infraestrutura que torna essa camada segura: a arquitetura de células não só suporta o tráfego de pagamentos tradicionais, mas também fornece o piso resiliente para agentes que autorizam, disputam ou reembolsam transações autonomamente. O que era promessa de IA aplicada (notícia de 04/04/2026) agora tem base técnica concreta, cada célula pode hospedar instâncias de modelos de detecção de fraude como o 'Gen X' sem risco de contaminação cruzada, e a plataforma Lumi, lançada em outubro de 2025, se integra diretamente ao fluxo de dados localizado por célula.

Por que isso importa

Para devs brasileiros, isso significa que padrões de resiliência antes restritos a gigantes globais (Netflix, Amazon) estão virando referência prática para sistemas financeiros locais. A Amex prova que células não exigem sacrifício de latência: 2 ms de aprovação é viável mesmo com replicação assíncrona de dados e roteamento determinístico. E mostra que observabilidade não precisa ser centralizada, cada célula publica métricas localmente, como o Airbnb faz com seus 1,3 bilhão de séries temporais, evitando dependências circulares no stack de monitoramento. É um manual vivo de como construir DX seguro: menos fallbacks, menos timeouts, menos retrys, e mais previsibilidade no ciclo de vida da transação.

Linha do tempo

  1. Início da jornada de modernização do ecossistema central de pagamentos da American Express

  2. American Express torna-se membro Gold da Cloud Native Computing Foundation (CNCF)

  3. Lançamento da plataforma Lumi, plataforma de dados nativa da nuvem para IA em escala

  4. Amex divulga uso de IA em engenharia, reduzindo tempo de codificação em mais de 30% entre 11 mil engenheiros

  5. Lançamento do kit de desenvolvimento para comércio agentic pela American Express

  6. Implementação pública da arquitetura baseada em células no ecossistema central de pagamentos

Perguntas frequentes

Como a Amex garante que não haja transações duplicadas ao reiniciar uma transação em outra célula?

Cada transação carrega um identificador único que persiste entre reroutes e retries. Sistemas downstream usam esse ID para detectar e suprimir duplicatas. O ponto de 'não retorno' é definido estrategicamente, após a autorização no emissor, o reinício é proibido.

Por que usar Go no Global Transaction Router e não outra linguagem?

Go foi escolhido por sua capacidade nativa de lidar com milhares de conexões TCP simultâneas via goroutines leves, essencial para rotear mensagens ISO8583 em escala global. Sua simplicidade operacional e baixa latência de inicialização também ajudam a manter o edge sempre disponível.

Qual é a diferença entre essa arquitetura de células e um simples cluster Kubernetes com múltiplos namespaces?

Células são unidades de falha, implantação e dados, não só de isolamento de rede. Cada uma tem seu próprio banco de dados, serviços, DNS local e zero dependência síncrona com outras. Namespaces compartilham control plane, storage e muitas vezes statefulsets; células não compartilham nada crítico.

Como o Airbnb e a Amex se conectam nesse contexto de resiliência?

Ambas adotam o princípio de 'falhar em isolamento': o Airbnb usa shuffle sharding para distribuir séries temporais entre clusters, enquanto a Amex isola transações em células. Os dois casos evitam single points of failure, mas a Amex vai além, ela exige consistência forte para dados dinâmicos via roteamento determinístico, não apenas tolerância a perda.

Fontes

Avalie este artigo:
Compartilhar:
Categoria
CEVIU Web Dev
Publicado
19 de junho de 2026
Editoria
CEVIU Web Dev

Quer receber mais sobre CEVIU Web Dev?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser