Avaliando Agentes de Descoberta Científica
O DiscoveryWorld da AI2 avalia se agentes de IA são capazes de realizar experimentos e conduzir pesquisas de forma autônoma. Os testes revelam grandes lacunas entre o progresso demonstrado em benchmarks e a verdadeira capacidade científica prática desses sistemas.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 14 de abril de 2026
- Fonte
- CEVIU IA
