AWS DevOps Agent e Datadog MCP Server entram em produção para resolução autônoma de incidentes
Aprofundamento CEVIU
Aprofundamento
O AWS DevOps Agent não é só mais um agente de IA que roda em background: ele opera como um SRE virtual com permissão IAM, acesso estruturado a APIs via MCP e memória de incidentes resolvidos. Desde sua GA em 31/03/2026, ele já foi validado em ambientes com até 47 clusters EKS e 12 contas AWS vinculadas, e agora, com o Datadog MCP Server (GA desde 09/03/2026), passa a consumir dados de observabilidade sem parsing manual de JSON ou manutenção de endpoints customizados. O MCP Server da Datadog não expõe APIs cruas; ele traduz perguntas em linguagem natural para consultas segmentadas: por exemplo, 'qual o SLO do serviço X nos últimos 24h?' vira uma chamada direta ao endpoint /api/v2/slo, com autenticação automática e tratamento de rate limiting.
Essa camada de abstração é crítica para confiabilidade: em testes com clientes do setor financeiro, o uso direto de APIs da Datadog gerava falhas em 12% das investigações por timeout ou schema mismatch, taxa reduzida para 0,8% com o MCP Server. O agente também não depende apenas de telemetria: ele correlaciona logs do CloudWatch com commits do GitHub (via integração nativa) e eventos de deployment no CodePipeline, permitindo inferir causas raiz como 'rollback de versão 2.4.1 introduziu regressão em timeout de Lambda' sem intervenção humana.
O que mudou
A diferença entre a versão de pré-visualização (dez/2025) e a GA atual é técnica e operacional: antes, o DevOps Agent exigia configuração manual de cada fonte de dados (ex.: script Python para puxar logs do Datadog + parser personalizado); agora, ele se conecta ao Datadog MCP Server com três cliques no console, e o servidor lida com autenticação, versionamento de API, fallbacks e cache de contexto. Também mudou a granularidade da prevenção: na preview, as recomendações eram genéricas ('ajuste timeout'); na GA, são específicas ('aumentar function.timeout de 30s para 45s no arquivo serverless.yml, linha 87, conforme padrão definido no repositório infra-as-code'). Isso só foi possível porque o agente agora indexa código-fonte e IaC como parte do seu grafo de conhecimento interno.
Por que isso importa
Isso não é automação de alertas, é mudança no ciclo de vida do incidente. Antes, MTTR era medido em horas porque engenheiros gastavam 68% do tempo colhendo dados; agora, o agente entrega causa raiz + plano de mitigação em menos de 5 minutos, e o engenheiro avalia, aprova e executa. Em produção real, isso reduziu o esforço humano por incidente de 4,2 horas para 22 minutos, tempo que agora é usado para validar correções e ajustar políticas de confiabilidade, não para caçar logs. Para times de SRE, significa sair do modo 'firefighting' e entrar em 'reliability engineering': o agente cuida da detecção e triagem; o humano define os limites de tolerância, os critérios de sucesso e as trade-offs entre velocidade e estabilidade.
Linha do tempo
Datadog MCP Server entra em general availability
AWS DevOps Agent entra em general availability
CEVIU publica cobertura da GA do AWS DevOps Agent
Integração com Salesforce MCP Server é anunciada
AWS MCP Server entra em general availability
CEVIU detalha workflow SRE agentic end-to-end com DevOps Agent
AWS lança MCP personalizado para diagnóstico de nós EKS
Integração AWS DevOps Agent + Datadog MCP Server entra em produção
Perguntas frequentes
O AWS DevOps Agent substitui meu time de SRE?
Não. Ele substitui tarefas repetitivas de triagem, correlação de dados e geração de relatórios, não decisões estratégicas sobre trade-offs de confiabilidade, arquitetura ou risco. O papel do SRE evolui para supervisionar o agente, calibrar seus critérios de priorização e auditar suas recomendações.
Como o Datadog MCP Server difere do AWS MCP Server?
O AWS MCP Server dá acesso seguro às APIs da AWS (ex.: EC2, EKS, CloudWatch). O Datadog MCP Server dá acesso seguro aos dados de observabilidade da Datadog (logs, traces, SLOs). Ambos usam o mesmo protocolo, mas servem domínios distintos. O DevOps Agent pode usar os dois simultaneamente, por exemplo, correlacionar um pico de latência no Datadog com o estado de nós EKS via AWS MCP.
Quanto custa rodar o DevOps Agent em produção?
US$ 0,0083 por segundo de atividade, não por hora reservada. Um agente ativo 24/7 custa cerca de US$ 717/mês. Novos clientes têm 2 meses gratuitos com limite de 20 horas de investigação. Clientes com Enterprise Support recebem 100% de crédito mensal sobre o valor do suporte anterior.
Posso usar o DevOps Agent com ferramentas além da Datadog?
Sim. Ele suporta nativamente CloudWatch, Dynatrace, New Relic, Splunk, Grafana, GitHub, GitLab, Azure, Azure DevOps, PagerDuty e Salesforce MCP Server. Cada integração é feita via MCP Server próprio da ferramenta ou via conector oficial, sem scripts customizados.
Links relacionados
- 🔧AWS DevOps Agent agora está disponível de forma geral
- 🔍Automação da Investigação de Incidentes com AWS DevOps Agent e Salesforce MCP Server
- 🤖Construindo um SRE agentic de ponta a ponta usando AWS DevOps Agent
- 🔧Diagnóstico rápido de problemas em nós do EKS com AWS DevOps Agent e MCP personalizado
- 🚀O Servidor MCP da AWS agora está geralmente disponível
Fontes
- aws.amazon.comfonte original
- Categoria
- CEVIU DevOps
- Publicado
- 22 de junho de 2026
- Editoria
- CEVIU DevOps

