A Censura Política no Qwen3.5-9B: Um Circuito Detectável nos Pesos de um LLM
A censura política implementada no Qwen3.5-9B reside em um pequeno circuito nos pesos do modelo, que pode ser lido e desativado. O conhecimento factual já está presente no pré-treinamento, e o comportamento de censura é sobreposto a esses fatos. O modelo não perde o conhecimento, mas aprende a contorná-lo.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 20 de maio de 2026
- Fonte
- CEVIU IA
