Todas as notícias

CEVIU DevOps

Ferramentas, tendências e insights para engenheiros DevOps

458 notícias

A AWS lançou a próxima geração do Resilience Hub, introduzindo um sistema organizacional que ajuda Site Reliability Engineers (SREs) a estabelecer metas de resiliência consistentes em centenas de aplicações. O serviço utiliza análise de modo de falha impulsionada por IA, descoberta de dependências e políticas modulares com SLOs (Service Level Objectives) de disponibilidade, como 99,95%. Agora geralmente disponível nas regiões comerciais da AWS, o serviço adota um novo modelo de precificação baseado em serviço, incluindo duas avaliações de modo de falha gratuitas por mês. Ele se integra com AWS Organizations, permitindo que as equipes avaliem a resiliência a partir de uma única conta de administrador delegado.

Métricas de confiabilidade e SLIs perdem precisão com a evolução dos sistemas, à medida que escopos expandidos e semânticas variáveis fazem com que painéis verdes mascarem problemas reais. Melhorar a fidelidade exige instrumentação delimitada, métricas explícitas e forte correlação para evitar uma confiança operacional enganosa.

A equipe de Pesquisa de Ameaças da Sysdig observou o que parece ser o primeiro ataque cibernético documentado impulsionado por um agente de IA em 10 de maio. Um atacante explorou uma vulnerabilidade em marimo notebook (CVE-2026-39987) e utilizou um large language model para navegar autonomamente, desde o acesso inicial e credenciais AWS, até a exfiltração de um banco de dados PostgreSQL completo em menos de dois minutos. Quatro assinaturas-chave apontaram para uma composição de IA em tempo real, e não para automação pré-roteirizada: o agente tentou despejar uma tabela de credenciais inexistente baseada em suposições de esquema, deixou um comentário de monólogo interno em chinês durante o ataque, utilizou comandos distintamente formatados por IA com separadores e capturas delimitadas, e encadeou dinamicamente as saídas de um comando como entradas para o próximo — tudo isso enquanto espalhava as requisições por múltiplos IPs de Cloudflare Workers para evadir a detecção.

O Slack evoluiu sua infraestrutura de IA em quatro fases ao longo de três anos, migrando do AWS SageMaker para o Bedrock e, eventualmente, para uma arquitetura multi-cloud que abrangerá AWS e Google Cloud Platform até o início de 2026, visando acessar os melhores modelos do mercado, manter a segurança corporativa e evitar o aprisionamento tecnológico.

O Rust 1.96.0 foi lançado, estabilizando os novos tipos `core::range` que implementam `IntoIterator` em vez de `Iterator`. Essa mudança permite que valores de range sejam `Copy`, facilitando o armazenamento em structs leves como `spans` e `slice accessors`. A versão também inclui as macros `assert_matches!` e `debug_assert_matches!` para asserções baseadas em padrões com melhor saída de falha. Além disso, o Rust 1.96.0 aprimora o link WebAssembly, tratando símbolos indefinidos como erros por padrão. Foram corrigidas duas vulnerabilidades do Cargo que afetavam registros de terceiros, sem impacto para usuários do `crates.io`.

Um esforço de certificação ISO 27001 em uma startup AWS que prioriza Terraform exigiu que infraestrutura, controle de acesso, criptografia, monitoramento e gerenciamento de vulnerabilidades fossem transformados em código. Isso permitiu que as evidências de auditoria fossem geradas diretamente do Git e dos sistemas de produção. A conformidade evoluiu da documentação para práticas de engenharia incorporadas, utilizando métricas do Security Hub e pipelines automatizados como prova mensurável da eficácia dos controles.

O Azure Container Registry Artifact Cache armazena a lista completa do manifesto, mas apenas o manifesto da arquitetura solicitada, acionando uma cópia assíncrona onde puxadas subsequentes deixam de fazer proxy para o upstream assim que concluído. Uma puxada multi-arch de plataforma única emite três webhooks de push, e o evento de push de conclusão indica o cache local e o início da cobrança de armazenamento.

Sistemas de memória de agentes são mais bem compreendidos como um pipeline de extração, armazenamento e retrieval, em vez de uma única funcionalidade mágica de “memória”. Bibliotecas de agentes compactam conversas em fatos, armazenam-nos em vetores, tabelas ou grafos, e os recuperam posteriormente. Esses sistemas enfrentam desafios como contradições, contexto desatualizado, memória procedural e intenções futuras.

Nova é uma plataforma de nuvem interna do Dropbox para executar agentes de codificação em seus fluxos de trabalho de engenharia. Ela permite que engenheiros executem múltiplas sessões de codificação em paralelo, executem agentes em ambientes isolados fixados a commits específicos do repositório, validem mudanças propostas com comandos de build e teste via Bazel, e continuem sessões quando a validação falhar.

A aplicação de modelagem de ameaças em ambientes GitHub revela riscos como acesso não autorizado, execução de código CI malicioso e exfiltração de dados. Ataques históricos na cadeia de suprimentos reforçam a necessidade de ferramentas de detecção, varredura de dependências e monitoramento para garantir a segurança dos workflows de CI/CD e prevenir comprometimentos.

A resiliência operacional exige aceitar incidentes como inevitáveis, construindo sistemas e observability para detecção e recuperação rápidas. É fundamental combinar o design técnico com equipes preparadas que operam em culturas psicologicamente seguras e sem culpa. Organizações maduras focam no aprendizado contínuo a partir de incidentes e na liderança que reforça a melhoria constante.

O Project Glasswing da Anthropic oferece a organizações selecionadas acesso ao Claude Mythos Preview, um modelo restrito de cibersegurança projetado para identificar e ajudar a corrigir vulnerabilidades em software crítico. A análise da Cloudflare sobre o Mythos destaca como agentes de segurança de IA podem encadear problemas de baixa gravidade em exploits mais sérios, gerar código de prova de conceito e alterar a economia da descoberta de vulnerabilidades.

Um deploy do AWS Bedrock AgentCore construído com Terraform demonstra como orquestrar múltiplos runtimes de agentes, gateways, roles IAM, memória e aplicação de políticas em um único grafo de dependência, contornando lacunas atuais do provedor com workarounds baseados em CLI e null_resource.

O GitHub implementou a publicação faseada e novos controles no tempo de instalação para pacotes npm. Isso oferece aos mantenedores métodos mais seguros para lançar novas versões de pacotes e dá aos consumidores maior controle sobre o que é instalado. Essas mudanças são uma resposta direta ao risco crescente de pacotes e contas de mantenedores comprometidos, fortalecendo a defesa da cadeia de suprimentos do npm de forma operacional, em vez de depender apenas de remoções rápidas após a disseminação de uma versão maliciosa.

O 'pulumi do' é uma nova ferramenta de linha de comando que permite a desenvolvedores criar, ler, atualizar, excluir e consultar recursos de nuvem em milhares de provedores com um único comando de terminal. Não requer configuração de projeto, código ou rastreamento de estado. A ferramenta foi projetada tanto para humanos quanto para agentes de IA realizarem operações rápidas e pontuais na nuvem, com planos futuros de integrar o gerenciamento de credenciais via Pulumi ESC e oferecer um caminho de atualização para projetos completos de infraestrutura como código.

Outras categorias