Resultados de Generalização do Conjunto de Desenvolvimento APEX-Agents
AC-Small melhorou significativamente em benchmarks excluídos após o pós-treinamento no conjunto de desenvolvimento APEX-Agents, com aumentos de +5,7pp no APEX, +8,0pp no Toolathalon e +7,7pp no GDPval.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 04 de abril de 2026
- Fonte
- CEVIU IA
