Introduzindo KellyBench: Avaliando a Tomada de Decisão Sequencial de Modelos de IA em Apostas Esportivas
KellyBench, uma nova ferramenta de avaliação, simula a temporada 2023-24 da English Premier League para testar a tomada de decisão sequencial em apostas esportivas. Modelos como Claude Opus 4.6 e GPT-5.4 demonstraram dificuldades significativas no benchmark, não conseguindo gerar retornos positivos.
Este desempenho sublinha as limitações atuais desses modelos na adaptação a estratégias de longo prazo e na aprendizagem contínua em ambientes dinâmicos. A pesquisa ressalta a necessidade crítica de desenvolver cenários mais complexos que permitam aos agentes de IA aprender efetivamente com a experiência e lidar com a incerteza inerente a tais contextos.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 10 de abril de 2026
- Fonte
- CEVIU IA
