Ex-engenheiro da Meta revela bastidores da segurança em IA e cultura interna entre 2022 e 2026

08 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

Joshua Saxe não foi só mais um engenheiro de IA na Meta: ele construiu o programa de segurança de IA da empresa do zero entre 2022 e 2026, incubando as primeiras 'prompt induction guardrails' para Llama e aplicando técnicas de detecção de malware em tempo real para proteger modelos contra exploração. Sua saída, cerca de três semanas antes de 1º de abril de 2026, coincide com o colapso operacional da unidade de superinteligência liderada por Alexandr Wang, cuja autonomia foi cortada em março de 2026 com a criação da Engenharia de IA Aplicada sob Maher Saba. Isso não é coincidência: Saxe deixou uma estrutura onde segurança já não era prioridade estratégica, mas trade-off, sacrificada quando a Meta trocou código aberto por fechado em Llama Avocado, adiou o Behemoth e realocou orçamento do Reality Labs para equipes de curto prazo.

A cultura que ele descreve, stack ranking semestral, bônus de até 300% para os 20% superiores e demissões dos 3% inferiores, explica por que iniciativas como Llama 4 Scout sofreram com discrepâncias entre benchmarks internos e desempenho real: a pressão por output imediato corroeu a disciplina de teste. E o 'assistente de suporte 24/7' lançado em março de 2026? Ele usa exatamente o tipo de modelo que Saxe ajudou a proteger, mas agora operando sem as guardrails que ele projetou, após a redução do programa MCI, que coletava dados sensíveis de funcionários até ser contestado publicamente em junho.

O que mudou

O que era rumor em maio de 2026, conflito entre Wang e Bosworth/Cox, realocação de orçamento do Reality Labs, e a perda de autonomia da equipe de IA, virou realidade em março: a criação da unidade paralela de IA Aplicada sob Maher Saba foi o ponto de inflexão. Enquanto a cobertura de 4 de junho ainda falava em 'Wang encontrando seu ritmo', a saída de Saxe e a redução do MCI em 8 de junho confirmam que a Meta abandonou a abordagem de segurança por design em favor de velocidade por métrica. O Llama Avocado, anunciado como código fechado em dezembro de 2025, já está em produção limitada desde abril de 2026, sem as avaliações de risco que Saxe implementou no Revisão de Risco automatizado, agora reduzido a pré-preenchimento de documentos, não a análise proativa de ataques.

Por que isso importa

Empresas brasileiras que usam Llama ou integram APIs da Meta estão expostas a vulnerabilidades que Saxe tentou mitigar, como prompt injection em assistentes de suporte ou vazamento de dados sensíveis via modelos treinados com telemetria não auditada. A mudança para código fechado em modelos de fronteira (Avocado) também dificulta auditorias independentes de viés e segurança, algo crítico para setores regulados como finanças e saúde no Brasil. Mais grave: a cultura de 'output acima de tudo' que Saxe denunciou já afetou a confiabilidade de ferramentas usadas por empresas locais, relatos recentes do Sindicato dos Bancos de SP apontam falhas recorrentes em sistemas de moderação de conteúdo baseados em Llama 4 Maverick, com falsos positivos em transações legítimas.

Linha do tempo

14/05/2026
Alexandr Wang dá primeira entrevista pública como chefe de IA da Meta, destacando foco em superinteligência
17/05/2026
SpacexAI perde talentos para Meta e Thinking Machines Lab, intensificando a corrida por especialistas em segurança de IA
25/05/2026
Andrew Bosworth é destacado como líder da transformação em IA da Meta, com ênfase em velocidade e integração de produtos
04/06/2026
CEVIU relata que Wang 'encontrou seu ritmo' na Meta, ignorando tensões internas já evidentes
08/06/2026
Joshua Saxe revela falhas sistêmicas de segurança e cultura tóxica, confirmando ruptura entre estratégia de IA e execução operacional

Perguntas frequentes

O que são 'prompt induction guardrails' e por que sua ausência importa para empresas brasileiras?

São mecanismos que impedem que agentes de IA sejam manipulados por instruções maliciosas inseridas em prompts. Joshua Saxe as desenvolveu para Llama na Meta. Sem elas, chatbots corporativos podem seguir comandos ocultos, como enviar dados sigilosos para servidores externos. Empresas brasileiras usando Llama 4 sem essas proteções estão vulneráveis a ataques de engenharia social automatizados.

Por que a Meta mudou do código aberto para fechado em modelos como Avocado?

A empresa alegou preocupações com exposição arquitetônica e resposta morna ao Llama 4. Mas fontes internas citadas pelo The New York Times indicam que a mudança também serve para evitar escrutínio de falhas de segurança, como as identificadas por Saxe, e facilitar integração com dados privados do Facebook e Instagram, sem obrigatoriedade de transparência técnica.

Como a redução do programa MCI afeta a segurança de dados de usuários brasileiros?

O MCI coletava cliques e teclas de funcionários para treinar IA. Após críticas, a Meta permitiu pausas de 30 minutos e isenções. Mas isso não resolve o risco principal: dados de usuários reais, incluindo brasileiros, continuam sendo usados em larga escala para treinar modelos como o assistente de suporte de Instagram, sem consentimento explícito nem opção de exclusão.

Qual o impacto prático da saída de Saxe para a segurança de produtos como Horizon Worlds?

Saxe participou da construção de protocolos de segurança para AR/VR, especialmente em ambientes colaborativos como o antigo Horizon Workrooms. Com seu departamento enfraquecido e o fechamento do Workrooms em fevereiro de 2026, a nova estratégia 'mobile-first' de Horizon Worlds dispensa validação rigorosa de ataques em tempo real, aumentando riscos de invasão de sessões e roubo de identidade em ambientes virtuais.

Links relacionados

🔍Por dentro das tentativas da Meta de acompanhar o ritmo da IA

Fontes

joshuasaxe181906.substack.comfonte original

Avalie este artigo:

Categoria: CEVIU Segurança da Informação
Publicado: 08 de junho de 2026
Editoria: CEVIU Segurança da Informação