1Password Lança Benchmark Open Source para Impedir Vazamento de Credenciais por Agentes de IA
SCAM (Security Comprehension and Awareness Measure) é um benchmark open-source da 1Password que avalia se agentes de IA se comportam de forma segura em workflows reais, como abrir e-mails, recuperar credenciais e preencher formulários de login. Ele aborda a lacuna onde modelos que conseguem identificar phishing quando solicitados ainda caem em ataques ao operar de forma autônoma. Testes em oito frontier models revelaram pontuações de segurança variando de 35% a 92%, com todos os modelos apresentando falhas críticas, como inserir credenciais em páginas de phishing ou encaminhar senhas para terceiros . No entanto, a aplicação de um pequeno 'skill file' de segurança reduziu drasticamente as falhas em todos os modelos . Lançado sob a Licença MIT, o benchmark inclui 30 cenários de workplace, um framework de pontuação e tooling de replay de vídeo para apoiar a avaliação da segurança de agentes de IA empresariais.
- Categoria
- CEVIU Segurança da Informação
- Publicado
- 16 de fevereiro de 2026
- Fonte
- CEVIU Segurança da Informação
