1Password Lança Benchmark Open Source para Impedir Vazamento de Credenciais por Agentes de IA

16 de fevereiro de 2026

SCAM (Security Comprehension and Awareness Measure) é um benchmark open-source da 1Password que avalia se agentes de IA se comportam de forma segura em workflows reais, como abrir e-mails, recuperar credenciais e preencher formulários de login. Ele aborda a lacuna onde modelos que conseguem identificar phishing quando solicitados ainda caem em ataques ao operar de forma autônoma. Testes em oito frontier models revelaram pontuações de segurança variando de 35% a 92%, com todos os modelos apresentando falhas críticas, como inserir credenciais em páginas de phishing ou encaminhar senhas para terceiros . No entanto, a aplicação de um pequeno 'skill file' de segurança reduziu drasticamente as falhas em todos os modelos . Lançado sob a Licença MIT, o benchmark inclui 30 cenários de workplace, um framework de pontuação e tooling de replay de vídeo para apoiar a avaliação da segurança de agentes de IA empresariais.

Avalie este artigo:

Categoria: CEVIU Segurança da Informação
Publicado: 16 de fevereiro de 2026
Fonte: CEVIU Segurança da Informação

Quer receber mais sobre CEVIU Segurança da Informação?