Anthropic reativa modelos Fable 5 e Mythos 5 do Claude com novas regras de acesso
Aprofundamento CEVIU
Aprofundamento
O behaviors não é um modelo, biblioteca ou repositório, é o nome técnico usado internamente pela Anthropic para designar o conjunto de respostas específicas que um modelo pode gerar sob determinadas condições de entrada, especialmente quando essas respostas cruzam fronteiras de segurança cibernética. No caso do Fable 5, os behaviors bloqueados incluem, por exemplo, a geração de código que demonstra *como explorar* uma vulnerabilidade identificada, mesmo que a identificação em si seja rotineira e segura. A nova classificação de segurança introduzida em 30 de junho atua justamente nesse nível: ela não proíbe a detecção de falhas (tarefa comum até em modelos mais fracos como Haiku 4.5), mas interrompe o comportamento específico de 'mostrar o exploit', mesmo que o prompt pareça inocente.
A distinção entre Fable 5 e Mythos 5 não está apenas na quantidade de salvaguardas, mas no *escopo dos behaviors permitidos*. Enquanto o Fable 5 foi treinado para recusar qualquer cadeia de raciocínio que leve a um exploit concreto, mesmo em contexto defensivo , , o Mythos 5 foi projetado para ativar exatamente esses behaviors, com restrições operacionais (acesso apenas via Glasswing, controle de usuários, auditoria contínua). Isso explica por que o governo liberou o Mythos 5 só para organizações de infraestrutura crítica nos EUA: não é uma questão de 'capacidade bruta', mas de *intenção funcional codificada no behavior*.
O que mudou
O que mudou entre 29 de junho e 2 de julho não foi o modelo em si, mas o regime de acesso e a granularidade da governança. Na cobertura CEVIU de 29/06 artigo original, o Mythos 5 estava autorizado apenas para 'organizações envolvidas na operação e defesa de infraestrutura nacional', uma lista fechada. Agora, a Anthropic confirma que o acesso será estendido a 'parceiros domésticos e internacionais do programa Glasswing', com apoio direto do governo norte-americano. Já o Fable 5 evoluiu de 'liberação condicional global' (1/7) para um sistema de créditos pós-7/7, uma mudança operacional que sinaliza que a empresa está testando a demanda real antes de escalar o uso gratuito. Nada disso era previsto nas notícias anteriores do CEVIU.
Por que isso importa
Isso importa porque mostra que a regulação de IA não está mais focada apenas em 'quem usa', mas em 'quais behaviors são ativados'. O Fable 5 não foi banido por ser perigoso, foi suspenso porque um behavior específico (gerar exploit) foi acidentalmente acessível via jailbreak, mesmo sendo um caso limítrofe. O fato de modelos como GPT-5.5 e Opus 4.8 reproduzirem o mesmo behavior indica que o problema não é exclusivo da Anthropic, mas sistêmico: todos os modelos avançados têm behaviors de exploração potencialmente ativos. A resposta da indústria, o framework de avaliação de jailbreaks em parceria com Amazon, Google e Microsoft, é a primeira tentativa concreta de padronizar não o que o modelo *é*, mas o que ele *faz* sob pressão. Isso muda o jogo para desenvolvedores: agora, o custo de operação passa a incluir o monitoramento contínuo de behaviors, não só de tokens ou latência.
Linha do tempo
Lançamento oficial dos modelos Claude Fable 5 e Mythos 5 pela Anthropic
Aplicação imediata de controles de exportação pelos EUA, suspendendo acesso global aos dois modelos
Aprovação governamental para restabelecer acesso ao Mythos 5 para organizações selecionadas nos EUA
Levantamento dos controles de exportação e anúncio da reativação do Fable 5 e Mythos 5
Reativação efetiva do Fable 5 com sistema de créditos e expansão do Mythos 5 para parceiros Glasswing
Perguntas frequentes
O que é exatamente 'behaviors' no contexto do Claude Fable 5?
Behaviors são respostas específicas que um modelo pode gerar sob certas entradas, como 'mostrar código para explorar uma vulnerabilidade'. Não é um recurso ou função, mas um padrão de saída que a Anthropic classifica como potencialmente perigoso, mesmo que o contexto pareça defensivo.
Por que o Fable 5 voltou ao público, mas o Mythos 5 permanece restrito?
Porque o Fable 5 tem salvaguardas que bloqueiam behaviors ofensivos por padrão; já o Mythos 5 foi projetado para ativar esses behaviors intencionalmente, e só é liberado para organizações com contratos de uso, auditoria e integração com programas governamentais como o Glasswing.
O novo framework de avaliação de jailbreaks vai mudar como os modelos são lançados?
Sim. Em vez de depender de julgamentos subjetivos, os desenvolvedores terão critérios objetivos, como 'alcance do behavior ativado' e 'facilidade de uso por atacantes', para decidir se um modelo precisa de ajustes, restrições ou até recuo antes do lançamento.
Por que modelos mais fracos, como Haiku 4.5, também conseguem gerar exploits?
Porque a capacidade de gerar código malicioso não depende só da inteligência do modelo, mas da combinação entre conhecimento de vulnerabilidades, sintaxe de linguagens e contexto de prompt. Modelos menores fazem isso com menos precisão, mas o behavior existe, e é isso que o novo framework busca medir, não comparar 'quem é mais capaz'.
Fontes
- anthropic.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 03 de julho de 2026
- Editoria
- CEVIU IA

