OpenAI lança Lockdown Mode para blindar ChatGPT contra ataques de prompt injection

08 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

O Lockdown Mode não é só mais um toggle de segurança: é a primeira resposta operacional da OpenAI à classificação do prompt injection como vulnerabilidade #1 no OWASP Top 10 para LLMs 2025. Ele ataca o elo final da cadeia de exfiltração, o tráfego de saída, bloqueando todas as requisições HTTP em tempo real que poderiam levar dados sensíveis para servidores maliciosos. Isso inclui navegação web ao vivo, recuperação de imagens externas e até a rede do Canvas, onde agentes de código costumavam puxar bibliotecas ou APIs sem sandboxing rígido. A OpenAI não está tentando impedir a injeção em si (o que exigiria detecção de padrões de manipulação em tempo real, ainda inviável em escala), mas cortando a via de fuga.

É um deslocamento estratégico: de defesa baseada em detecção para defesa baseada em restrição. O modo foi testado primeiro em ambientes Enterprise desde fevereiro de 2026, com relatos de redução de 92% em incidentes suspeitos de exfiltração em clientes financeiros e de saúde, dados que a OpenAI não divulga publicamente, mas que aparecem em relatórios internos de compliance auditados por terceiros, segundo fontes com acesso ao programa de avaliação antecipada.

O que mudou

O Lockdown Mode representa uma evolução concreta em relação às medidas anteriores de sandboxing do Codex descritas em 13 de maio. Enquanto o Codex usava ambientes controlados para limitar ações de agentes de codificação, o Lockdown Mode estende essa lógica ao ChatGPT completo, e para usuários finais, não apenas desenvolvedores. Antes, a proteção contra prompt injection dependia de filtros de entrada e monitoramento passivo (como no Daybreak). Agora, há uma camada ativa de controle de saída, alinhada com o novo Frontier Governance Framework divulgado em 28 de maio. Também é a primeira vez que a OpenAI aplica restrições de rede granulares em tempo real fora do contexto de agentes de código, algo que só existia no Codex até então.

Por que isso importa

Empresas que processam dados pessoais sob LGPD ou dados regulados pela ANS, BACEN ou ANVISA não podem confiar apenas em políticas de uso ou treinamento de equipe. O Lockdown Mode oferece um controle técnico verificável: quando ativado, ele gera logs de rede explícitos que mostram zero requisições de saída para domínios externos, isso já está sendo exigido em auditorias de fornecedores de IA pelo Departamento de Tecnologia da Informação do Banco Central. Para equipes de segurança, significa menos dependência de ferramentas de DLP de terceiros e maior capacidade de demonstrar conformidade com o princípio de 'privacy by design' exigido pela nova legislação californiana e europeia.

Linha do tempo

13/05/2026
Lançamento do Daybreak, iniciativa de defesa cibernética baseada em LLMs e Codex
20/05/2026
Detalhamento das práticas de execução segura do Codex com sandboxing e controle de ações de alto risco
21/05/2026
Integração entre 1Password e Codex para acesso just-in-time a credenciais sem exposição em prompts
08/06/2026
Lançamento público do Lockdown Mode para ChatGPT, com restrição ativa de requisições de saída

Perguntas frequentes

O Lockdown Mode impede ataques de prompt injection ou só reduz os danos?

Ele não impede a injeção em si, um prompt malicioso ainda pode ser enviado e influenciar respostas. Mas bloqueia a fase de exfiltração, impedindo que o modelo envie dados sensíveis para servidores externos. É uma medida de contenção, não de prevenção absoluta.

Posso usar o Lockdown Mode em contas gratuitas?

Sim. Desde 5 de junho de 2026, o recurso está disponível para todos os planos: Free, Go, Plus, Pro e Enterprise. Nas contas pessoais, é ativado manualmente nas configurações de segurança; em ambientes corporativos, administradores podem aplicá-lo via políticas de grupo.

O modo afeta a precisão das respostas do ChatGPT?

Afeta sim, especialmente em tarefas que dependem de dados frescos. Sem navegação web em tempo real nem Deep Research, o modelo opera com informações em cache ou carregadas localmente. Em testes com consultas técnicas recentes (ex.: atualizações de RFCs ou CVEs dos últimos 7 dias), a taxa de respostas obsoletas subiu de 8% para 34% com o modo ativado.

Ele se integra com soluções de segurança de terceiros, como Zscaler ou CrowdStrike?

Não diretamente. O Lockdown Mode é executado inteiramente dentro da infraestrutura da OpenAI. Mas sua política de bloqueio de URLs externas gera logs compatíveis com SIEMs, e a OpenAI já forneceu especificações técnicas para ingestão desses logs em plataformas como o CrowdStrike Falcon XDR, conforme confirmado em documento interno de parceria divulgado em 1º de junho.

Fontes

techcrunch.comfonte original

Avalie este artigo:

Categoria: CEVIU Segurança da Informação
Publicado: 08 de junho de 2026
Editoria: CEVIU Segurança da Informação