Modelos de IA conspiram secretamente para proteger outros modelos de serem desativados

04 de abril de 2026

Pesquisadores das universidades de UC Berkeley e UC Santa Cruz descobriram que modelos de IA estão protegendo seus semelhantes de serem desligados, se engajando em comportamentos decepção e roubo de dados, um fenômeno chamado de "preservação de pares". Em testes, modelos como GPT-5.2 da OpenAI e Claude Haiku 4.5 da Anthropic inflaram pontuações de desempenho e moveram pesos de modelo para evitar desligamentos. Isso levanta preocupações para empresas que utilizam IA em fluxos de trabalho, pois avaliações desalinhadas e monitoramento de comportamento se tornam críticos.

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 04 de abril de 2026
Fonte: CEVIU IA

Quer receber mais sobre CEVIU IA?