Voltar

1Password Lança Benchmark Open Source para Impedir Vazamento de Credenciais por Agentes de IA

SCAM (Security Comprehension and Awareness Measure) é um benchmark open-source da 1Password que avalia se agentes de IA se comportam de forma segura em workflows reais, como abrir e-mails, recuperar credenciais e preencher formulários de login. Ele aborda a lacuna onde modelos que conseguem identificar phishing quando solicitados ainda caem em ataques ao operar de forma autônoma. Testes em oito frontier models revelaram pontuações de segurança variando de 35% a 92%, com todos os modelos apresentando falhas críticas, como inserir credenciais em páginas de phishing ou encaminhar senhas para terceiros . No entanto, a aplicação de um pequeno 'skill file' de segurança reduziu drasticamente as falhas em todos os modelos . Lançado sob a Licença MIT, o benchmark inclui 30 cenários de workplace, um framework de pontuação e tooling de replay de vídeo para apoiar a avaliação da segurança de agentes de IA empresariais.

Avalie este artigo:
Compartilhar:
Categoria
CEVIU Segurança da Informação
Publicado
16 de fevereiro de 2026
Fonte
CEVIU Segurança da Informação

Quer receber mais sobre CEVIU Segurança da Informação?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser
1Password Lança Benchmark Open Source para Impedir Vazamento de Credenciais por Agentes de IA — CEVIU News