Mythos para Segurança Ofensiva: Avaliação da XBOW
A Anthropic concedeu à XBOW early access ao Mythos Preview, que a XBOW submeteu a benchmarks internos de pentest, fluxos de trabalho ao vivo e cenários de auditoria de código-fonte para avaliar sua eficácia na descoberta real de vulnerabilidades. O Mythos Preview reduziu drasticamente os falsos negativos no benchmark de exploit web da XBOW e se mostrou particularmente forte na leitura e raciocínio sobre código-fonte, incluindo alvos nativos e engenharia reversa de firmware e componentes do Chromium. No entanto, ele apresenta mais dificuldades na validação em live-site, na segurança de comandos para casos de borda (edge-case command safety) e na eficiência de custos. Por isso, a XBOW o posiciona como um modelo forte entre vários, e não como um único motor padrão.
- Categoria
- CEVIU Segurança da Informação
- Publicado
- 20 de maio de 2026
- Fonte
- CEVIU Segurança da Informação
