A Impressão Digital do Bot: Detecção e Atribuição de Senhas Geradas por LLM
Pesquisadores da GitGuardian desenvolveram cadeias de Markov, treinadas com 8.000 senhas de 40 LLMs de 11 provedores diferentes. Eles exploraram vieses estatísticos, como a taxa de 35% de unicidade do Claude Opus 4.6 e substrings recorrentes (por exemplo, Gx#8dL em 96% das saídas do Llama-3.3-70b), para identificar o modelo e o provedor com 55% e 65% de precisão, respectivamente. Aplicado a 34 milhões de senhas do GitHub entre novembro de 2025 e março de 2026, o classificador sinalizou 28.000 como geradas por LLM, a uma taxa de aproximadamente 1.500 por semana, com Anthropic, Qwen e Google respondendo por 63% delas. Além disso, 1.800 arquivos .env e configurações do Terraform foram encontrados com credenciais geradas por IA hardcoded. Para proteção, as empresas devem proibir LLMs como geradores de senhas em suas políticas, exigir a geração baseada em vaults e fazer o deploy de scanners de hook-event como ggshield contra saídas de agentes Claude e Cursor, visto que esses mesmos modelos de Markov permitem um cracking muito mais eficiente do que a força bruta.
- Categoria
- CEVIU Segurança da Informação
- Publicado
- 08 de maio de 2026
- Fonte
- CEVIU Segurança da Informação
