Análise revela sandbox gVisor e isolamento robusto em Claude Managed Agents, mas configuração padrão é permissiva

19 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

O gVisor não é um sandbox genérico: é uma camada de execução de código não confiável com 8 anos de maturidade em produção no Google, usada em Cloud Run, App Engine e GKE Sandbox. A Anthropic o adota como base estrutural, não como um adendo, para os Managed Agents. Isso significa que a proteção não depende só de seccomp ou namespaces Linux, mas de uma ABI reescrita em Go que intercepta ~70% das syscalls nativas. O fato de o PID 1 ser /process_api (não bash ou sh) e o uso de 9p filesystem confirmam que o runtime foi projetado desde o início para ser descartável e observável, não para rodar aplicações tradicionais.

O proxy de egresso com TLS inspection não é só um filtro: ele é o único caminho para saída, com firewall de rede bloqueando até mesmo conexões TCP diretas para 8.8.8.8. Mas o JWT exposto no ambiente é um risco operacional real, não teórico. Ele entrega ao agente, por padrão, o UUID da organização, o session_id e seis hosts adicionais não documentados (como api-staging.anthropic.com), mesmo em modo restrito. Isso viola o princípio de mínima divulgação: um atacante com prompt injection não precisa quebrar o sandbox, só extrair esse token e planejar exfiltração para um dos hosts permitidos.

O que mudou

Em 2026-05-21, a Anthropic corrigiu uma falha crítica de bypass no sandbox do Claude Code via null-byte SOCKS5, um problema de implementação de rede. Agora, nos Managed Agents (lançados em 2026-04-08), a rede é totalmente desacoplada do sandbox: nenhuma ferramenta de rede está instalada, /etc/resolv.conf está vazio e o próprio DNS é feito pelo proxy. A defesa mudou de 'filtrar tráfego' para 'eliminar a pilha de rede dentro do contêiner'. Também houve evolução na gestão de segredos: enquanto o Claude Code ainda dependia de variáveis de ambiente para algumas credenciais, os Managed Agents isolam vault secrets por design, elas nunca entram no sandbox. Essa mudança estrutural foi confirmada pela Pluto Security em abril de 2026 e agora está em produção.

Por que isso importa

Agentes autônomos não são apenas mais rápidos, são superfícies de ataque novas. Um agente com always_allow habilitado e rede irrestrita pode, em segundos, ler todos os arquivos, executar comandos shell, fazer buscas web e enviar dados para qualquer endpoint autorizado. A segurança não está na inteligência do modelo, mas na rigidez da infraestrutura que o contém. Se sua equipe usa Managed Agents em produção sem hardening, está rodando código não confiável com privilégios root, acesso total à rede e visibilidade de todos os tokens não vault, tudo isso por padrão. E isso não é um bug: é a configuração inicial documentada pela Anthropic no quickstart.

Linha do tempo

01/04/2026
Lançamento em beta público dos Claude Managed Agents
21/05/2026
Correção de falha de bypass no sandbox do Claude Code via null-byte SOCKS5
04/06/2026
CEVIU analisa a estratégia de isolamento da Anthropic em múltiplos produtos
18/06/2026
Pluto Security revela detalhes técnicos do sandbox gVisor e riscos da configuração padrão dos Managed Agents

Perguntas frequentes

O gVisor usado nos Managed Agents é o mesmo do Cloud Cowork?

Sim. A Pluto Security confirmou que é o mesmo runtime, mas implantado em nuvem com adaptações: o mount com 9p filesystem, o cgroup sessions_api_public e a ausência de ferramentas de rede são idênticos aos achados anteriores no Cowork local. A diferença é operacional, não arquitetural.

Por que o JWT no ambiente é um risco se ele é assinado com ES256?

A assinatura impede falsificação, mas não leitura. Qualquer processo no sandbox, inclusive um agente sob prompt injection, pode ler o JWT com 'env | grep JWT' e extrair o UUID da organização, session_id e a lista completa de hosts permitidos. Isso dá ao atacante um mapa exato de onde exfiltrar dados.

Como o vault protege segredos se o agente tem acesso a arquivos e variáveis de ambiente?

O vault funciona como um serviço externo: as credenciais nunca são injetadas no sandbox. Quando uma ferramenta precisa de um segredo, o orquestrador (harness) busca no vault e passa só o valor necessário, mas só para chamadas específicas e validadas. Variáveis de ambiente, arquivos montados e o prompt continuam visíveis. Se você colocar um token no prompt ou em uma variável, o vault não o protege.

O que mudou desde a correção da falha SOCKS5 no Claude Code?

A falha de maio era no sandbox de rede local, explorável via injeção de byte nulo. Nos Managed Agents, a rede foi removida do sandbox inteiramente, não há netcat, curl ou resolução DNS local. Todo tráfego passa por um proxy com inspeção TLS e binding por IP de contêiner. É uma mudança de abordagem: de 'conter a rede' para 'eliminar a rede do ambiente não confiável'.

Links relacionados

🛡️Como a Anthropic contém a execução do Claude em diferentes produtos

Fontes

pluto.securityfonte original

Avalie este artigo:

Categoria: CEVIU Segurança da Informação
Publicado: 19 de junho de 2026
Editoria: CEVIU Segurança da Informação