A Censura Política no Qwen3.5-9B: Um Circuito Detectável nos Pesos de um LLM

20 de maio de 2026

A censura política implementada no Qwen3.5-9B reside em um pequeno circuito nos pesos do modelo, que pode ser lido e desativado. O conhecimento factual já está presente no pré-treinamento, e o comportamento de censura é sobreposto a esses fatos. O modelo não perde o conhecimento, mas aprende a contorná-lo.

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 20 de maio de 2026
Fonte: CEVIU IA

Quer receber mais sobre CEVIU IA?