Medindo a capacidade de LLMs no desenvolvimento de exploits
O Mythos Preview é capaz de transformar vulnerabilidades em primitivos de exploit e combinar esses primitivos em cadeias de ataque completas de ponta a ponta. O conhecimento e a expertise necessários para desenvolver exploits diminuirão significativamente à medida que as capacidades do modelo se tornarem mais amplamente disponíveis. Este artigo analisa o desempenho do modelo no ExploitBench e no ExploitGym, dois benchmarks acadêmicos mais novos e desafiadores. O Mythos Preview supera consistentemente todos os outros modelos avaliados nesses testes.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 25 de maio de 2026
- Fonte
- CEVIU IA
