A Impressão Digital do Bot: Detecção e Atribuição de Senhas Geradas por LLM

08 de maio de 2026

Resumo

Pesquisadores da GitGuardian desenvolveram cadeias de Markov, treinadas com 8.000 senhas de 40 LLMs de 11 provedores diferentes. Eles exploraram vieses estatísticos, como a taxa de 35% de unicidade do Claude Opus 4.6 e substrings recorrentes (por exemplo, Gx#8dL em 96% das saídas do Llama-3.3-70b), para identificar o modelo e o provedor com 55% e 65% de precisão, respectivamente. Aplicado a 34 milhões de senhas do GitHub entre novembro de 2025 e março de 2026, o classificador sinalizou 28.000 como geradas por LLM, a uma taxa de aproximadamente 1.500 por semana, com Anthropic, Qwen e Google respondendo por 63% delas. Além disso, 1.800 arquivos .env e configurações do Terraform foram encontrados com credenciais geradas por IA hardcoded. Para proteção, as empresas devem proibir LLMs como geradores de senhas em suas políticas, exigir a geração baseada em vaults e fazer o deploy de scanners de hook-event como ggshield contra saídas de agentes Claude e Cursor, visto que esses mesmos modelos de Markov permitem um cracking muito mais eficiente do que a força bruta.

Fontes

blog.gitguardian.comfonte original

Avalie este artigo:

Categoria: CEVIU Segurança da Informação
Publicado: 08 de maio de 2026
Editoria: CEVIU Segurança da Informação

Quer receber mais sobre CEVIU Segurança da Informação?