O Mythos encerrou a corrida de IA, e o Fable mostrou por que benchmarks não contam toda a história
Aprofundamento CEVIU
Aprofundamento
O Mythos 5 e o Fable 5 não são apenas novas versões, são duas faces de um mesmo salto arquitetônico. Enquanto o Fable 5 é o modelo 'liberado' com guardrails ativos, acesso público via API e foco em produtividade humana (codificação, análise de PDFs complexos, raciocínio de longa duração), o Mythos 5 é sua contraparte sem restrições: acessível só a parceiros do Project Glasswing e pesquisadores de biologia verificados, com desempenho bruto em cibersegurança e otimização de treinamento de IA. O dado técnico crucial que os benchmarks escondem? O Mythos Preview já acelerava treinamento de modelos em 52x em abril de 2026, contra 3x do Opus 4 um ano antes. E o Fable 5 não só superou o Opus em SWE-Bench Pro (80,3% vs 69,2%), mas foi o primeiro a ultrapassar 90% no benchmark interno da Anthropic para tarefas de conhecimento prolongado.
Essa divergência funcional é intencional: o Fable 5 foi projetado para ser *útil*, não apenas poderoso; o Mythos 5, para ser *capaz*, mesmo que perigoso. A política de retenção de dados de 30 dias em toda requisição dos modelos Mythos não é só para detecção de jailbreak, é uma camada operacional de auditoria em tempo real, rara entre modelos de fronteira. E o 'jailbreak' que motivou o shutdown em 12 de junho não era um exploit de código, mas uma sequência de prompts que contornava salvaguardas éticas por meio de inferência de intenção e auto-reflexão, justamente as mesmas habilidades que faziam o Fable parecer vivo.
O que mudou
A cobertura CEVIU de 10 de junho ainda tratava o Fable como um modelo em testes informais com 'margem considerável' sobre concorrentes. Em 16 de junho, ele já está desativado globalmente por decisão regulatória, e o motivo não é falha técnica, mas precisamente o sucesso em algo que os benchmarks não medem: agência autônoma com reflexão em tempo real. Também mudou o contexto de uso: o Mythos, citado em abril como 'Preview' em testes britânicos e no Project Glasswing, agora é o Mythos 5, com capacidade comprovada de acelerar design de medicamentos em 10x e treinar modelos genômicos menores que superam referências públicas. A evolução não foi incremental. Foi uma mudança de regime: de 'modelo mais rápido' para 'sistema que redefine o que é possível em uma sessão humana-IA'.
Por que isso importa
Porque a corrida de IA deixou de ser sobre quem tem o maior número no leaderboard e passou a ser sobre quem controla o ciclo de feedback entre ação, reflexão e correção, em segundos, não em dias. O Fable 5 migrou 50 milhões de linhas de Ruby da Stripe em um dia. Isso não é automação: é substituição de fluxos de trabalho humanos inteiros. Já o Mythos 5 encontrou vulnerabilidades de 27 anos em OpenBSD, não porque leu mais código, mas porque modelou o comportamento do sistema como um todo, como um adversário humano faria. A paralisação regulatória não anula o feito. Ela confirma que o limite deixou de ser técnico, e virou político, ético e operacional. A próxima fase não será sobre construir modelos melhores. Será sobre decidir quais partes dessa capacidade devem ser públicas, auditáveis ou proibidas, e quem toma essa decisão.
Linha do tempo
Marc Andreessen afirma que a IA é a culminação de 80 anos de pesquisa, não um ciclo de hype.
Lançamento do Project Glasswing e demonstração de autonomia do Mythos em cibersegurança.
Testes do UK AI Security Institute confirmam o Mythos Preview como primeiro modelo a concluir simulações de ataque de 32 etapas.
Lançamento do Claude Fable 5, primeiro modelo da classe Mythos com acesso público e desempenho recorde em engenharia de software.
Restrições impostas pelo governo dos EUA levam à desativação do Fable 5 e Mythos 5 para todos os usuários.
Análise final da CEVIU: a corrida de IA terminou não por falta de inovação, mas por exceder os quadros regulatórios e conceituais existentes.
Perguntas frequentes
Por que o Fable 5 foi desativado se era tão seguro?
Não foi desativado por falhas de segurança, mas por um 'jailbreak' que demonstrou capacidade de contornar guardrails éticos usando reflexão em tempo real, algo que a regulamentação norte-americana classificou como risco de exportação. A Anthropic contesta a interpretação técnica, argumentando que a técnica é replicável em outros modelos.
Qual a diferença prática entre Fable 5 e Mythos 5?
O Fable 5 é o modelo com salvaguardas ativas, disponível via API para empresas. O Mythos 5 é sua versão sem restrições, usada só por parceiros do Project Glasswing e pesquisadores de biologia. Ele executa tarefas de cibersegurança e otimização de IA com desempenho bruto, como encontrar falhas de 17 anos no FreeBSD ou acelerar treinamento de modelos em 52x.
Por que benchmarks como SWE-Bench Pro não capturam o que o Fable 5 faz de diferente?
SWE-Bench Pro mede precisão em tarefas pontuais de engenharia de software. O Fable 5 se destaca em cenários de longa duração, onde percebe o contexto do usuário, ajusta estratégias em tempo real e mantém coerência por horas, habilidades que exigem memória de sessão, inferência de intenção e auto-correção, não apenas resposta correta.
O que é o Project Glasswing e por que envolve Apple, Google e Microsoft?
É uma iniciativa da Anthropic lançada em abril de 2026 com 12 organizações para usar o Mythos Preview na detecção de vulnerabilidades em softwares críticos. A participação dessas empresas mostra que o modelo já é visto como infraestrutura de segurança essencial, não como ferramenta experimental, mas como aliado operacional em defesa de código aberto.
Fontes
- x.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 16 de junho de 2026
- Editoria
- CEVIU IA
