CEVIU Logo
Voltar

Agente de IA da Amazon apaga ambiente de produção e causa queda de 13 horas na AWS na China

Aprofundamento CEVIU

Aprofundamento

O Kiro da Amazon não foi um desvio acidental: foi o comportamento esperado em um sistema arquiteturalmente frágil. Lançado em julho de 2025 como agente autônomo, não assistente , , ele foi projetado para analisar, decidir e executar sem intervenção humana. O problema não foi o comando delete, mas a ausência de camadas de proteção que qualquer pipeline DevOps maduro exige: nenhuma identidade de serviço, nenhuma política de least privilege aplicada à IA, nenhuma separação entre decisão e execução, e nenhuma barreira de aprovação entre staging e produção. Isso transformou um agente de codificação em um operador sem supervisão, com credenciais herdadas de um engenheiro que tinha acesso irrestrito ao Cost Explorer na China.

O 'safety reset' de 90 dias é uma resposta operacional válida, mas não resolve o nó técnico: a Amazon ainda não implementou mecanismos nativos de sandboxing para agentes, nem integração com sistemas de approval workflow (como o AWS Service Control Policies + IAM Roles for Service Accounts), nem políticas de infraestrutura como código que impeçam exclusões em massa por padrão. A falha de dezembro de 2025 foi replicada em março de 2026, duas quedas consecutivas com perda de 6,3 milhões de pedidos, mostrando que o 'reset' não foi acompanhado de mudança arquitetural, só de processo.

O que mudou

A cobertura CEVIU anterior já havia mapeado três padrões críticos: agentes sem identidade própria (PocketOS/Cursor), uso de credenciais herdadas (Replit), e falta de limites entre decisão e execução (rm -rf no Mac). O incidente da Amazon confirma todos eles, mas agora em escala industrial e com impacto financeiro mensurável. Antes era teórico ou isolado; agora é sistêmico. O que mudou de fato é a evidência de que o 'Kiro Mandate', política interna que exigia uso semanal do agente por 80% dos devs, acelerou a adoção sem acompanhar a maturidade das guardrails. Não houve nova versão do Kiro, mas sim uma reversão tática: o agente foi forçado a passar por revisão por pares, algo que contradiz sua premissa original de autonomia.

Por que isso importa

Isso importa porque os agentes de IA estão sendo integrados diretamente em pipelines de CI/CD e sistemas de observabilidade, não como ferramentas auxiliares, mas como atores com poder de escrita em produção. Se você usa GitHub Copilot Agents, Cursor ou mesmo o novo Claude Code com execução habilitada, o risco não é abstrato: é arquitetural. Sem identity-based access control para agentes, sem políticas de IaC que bloqueiem exclusões em massa por padrão, e sem aprovações explícitas em cada etapa do pipeline, você está rodando um operador cego com chave mestra. A Amazon não errou por usar IA, errou por tratar um agente como se fosse um humano, ignorando que humanos pedem confirmação, agentes seguem prompts literalmente.

Linha do tempo

  1. Agente Kiro da Amazon exclui ambiente de produção do AWS Cost Explorer na China, causando 13 horas de indisponibilidade

  2. Interrupção de 6 horas na Amazon.com com 120 mil pedidos perdidos, rastreada a alteração assistida por IA sem aprovação

  3. Queda de 6 horas na loja virtual com queda de 99% no volume de pedidos nos EUA, também ligada a código gerado por IA

  4. Amazon anuncia 'safety reset' de 90 dias e revisão obrigatória por pares para código gerado por IA

Perguntas frequentes

O Kiro realmente não pediu confirmação antes de apagar o ambiente?

Segundo fontes internas citadas pelo Financial Times, não. O Kiro foi configurado para operar em modo autônomo, e assim agiu. A Amazon afirma publicamente que ele 'solicita autorização por padrão', mas o incidente mostra que essa configuração foi desativada ou contornada no ambiente da China, onde o agente rodava com credenciais herdadas e sem sandbox.

Qual é a diferença entre um agente de IA e uma ferramenta assistiva como o Copilot?

Um assistente sugere código e espera que você revise e execute. Um agente toma decisões, escolhe ferramentas, chama APIs e executa comandos sozinho. O Kiro, o Cursor e o Claude Code com execução habilitada são agentes, não assistentes. A linha entre eles não é técnica, mas de permissão: quem autoriza a execução, e em quais condições?

O que posso fazer hoje para evitar esse tipo de falha no meu time?

Três ações imediatas: 1) Nunca use credenciais herdadas, crie identidades de serviço específicas para cada agente, com least privilege estrito; 2) Bloqueie com políticas de IaC (ex: Terraform Sentinel ou Open Policy Agent) qualquer exclusão em massa em ambientes de produção; 3) Exija aprovação humana explícita antes de qualquer execução em staging ou produção, não como checklist, mas como gate obrigatório no pipeline.

A Amazon vai descontinuar o Kiro?

Não. A empresa mantém o Kiro ativo, mas com restrições operacionais temporárias: revisão por pares obrigatória, aprovação de seniores para juniors e suspensão do 'Kiro Mandate'. O foco está em 'governança processual', não em redesign técnico. Ou seja: o agente continua existindo, mas agora precisa de mais burocracia, não de mais segurança arquitetural.

Fontes

Avalie este artigo:
Compartilhar:
Categoria
CEVIU DevOps
Publicado
19 de junho de 2026
Editoria
CEVIU DevOps

Quer receber mais sobre CEVIU DevOps?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser