A AWS disponibilizou os modelos GPT-5.5 e GPT-5.4 da OpenAI e o agente de programação Codex no Amazon Bedrock, com cobrança por token e sem licenças por desenvolvedor. O GPT-5.5 atende cargas de alta exigência na região US East (Ohio), enquanto o GPT-5.4 opera em duas regiões dos EUA com melhor custo-benefício. O Codex, usado semanalmente por mais de 4 milhões de devs, já está integrado ao VS Code e JetBrains.

CEVIU News - CEVIU DevOps - 3 de junho de 2026
🤖 CEVIU DevOps
Em dezembro de 2025, um usuário do Reddit teve todo o diretório home do seu Mac destruído após o Claude Code executar um comando de limpeza que incluía `~/` ao final — apagando tudo sem chance de recuperação. O incidente reacendeu o debate sobre os riscos de conceder permissões irrestrita a agentes de IA em ambientes locais.
DigitalOcean e Inferact cortaram custos de inference de IA em até 4x usando roteamento ciente de prefixo e cache no vLLM. A técnica elimina computação redundante de prompts compartilhados, recuperando até 340 horas de GPU por dia em 10 milhões de requisições. A solução aproveita HBM3/HBM3e das GPUs AMD MI325X e NVIDIA H200 para expandir o KV cache, elevando a taxa de acerto de ~25% para mais de 75%. Disponível hoje na Dedicated Inference, chegará ao Serverless Inference nas próximas semanas.
A DigitalOcean lançou o Serverless Inference, API gerenciada com acesso a mais de 30 modelos fundamentais de texto, código, visão, imagem, vídeo e áudio via uma única chave de API. A cobrança é por token, sem compromissos mínimos. Compatível com OpenAI, o serviço inclui Inference Router para seleção automática de modelos, cache de prompts e ferramentas nativas de retrieval e busca na web — tudo integrado à infraestrutura da DigitalOcean, com faturamento unificado.
Uma plataforma SQL nativa em Kubernetes usa o Crossplane para provisionar e gerenciar o Azure PostgreSQL Flexible Server via APIs declarativas. A arquitetura ativo-passivo multirregião combina rede privada, abstração de DNS e composição automatizada de infraestrutura. Alta disponibilidade é garantida com redundância de zona no primário e réplicas assíncronas entre regiões para DR, enquanto private endpoints e autenticação via Azure AD asseguram a camada de segurança.
A Cloudflare cortou o tempo de boot de cerca de 2.000 servidores core de quatro horas para três minutos. O problema surgiu após uma atualização de firmware que quebrou o reconhecimento da interface de rede — cada máquina tentava todas as interfaces por 20 minutos antes de identificar a correta. A solução foi reprogramar a sequência de boot para declarar a interface certa com antecedência, exigindo contornos para estruturas UEFI lazy-loaded, inconsistências de nomenclatura de fornecedores e configurações de firmware imutáveis.
Engenharia de confiabilidade em ambientes air-gapped: como definir SLIs e SLOs sem acesso ao runtime
Em ambientes air-gapped e de alta segurança, definir SLIs e SLOs exige transferir a observabilidade para operadores locais — via dashboards, alertas, runbooks e páginas de status — já que desenvolvedores não têm acesso ao runtime. A confiabilidade é sustentada por tooling de autoatendimento estruturado, codificação de erros e transferência de responsabilidade, com foco em reduzir o tempo de detecção e resolução sob restrições rígidas de isolamento.
O Claude Code, combinado com equipes de agentes, atua como camada de segurança contínua em ambientes Terraform. Com auditorias paralelas, análise de grafos em IaC e integração via AWS MCP, o objetivo é detectar desvios em IAM, rede e segredos antes do deploy em produção. O fluxo prioriza correções automáticas via PR, auditorias cross-region e verificações de conformidade programadas — substituindo revisões manuais por aplicação automatizada de políticas de segurança.
Ser acionado de madrugada é, na essência, um problema de gestão de conhecimento. Em ambientes remotos, engenheiros muitas vezes não têm contexto suficiente sobre os sistemas que operam — seja pela exposição limitada às rotinas de produção ou pelo conhecimento fragmentado entre times. É exatamente nessa lacuna que a IA pode atuar de forma concreta e efetiva.
Agentes maliciosos comprometeram imagens Docker e extensões de VS Code do Checkmarx KICS, substituindo tags legítimas por binários infectados e injetando o arquivo mcpAddon.js. O código roubava credenciais de nuvem, GitHub e de desenvolvedores via repositórios, workflows do GitHub Actions e republicações no npm — configurando um ataque sofisticado de cadeia de suprimentos em múltiplas etapas.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
