Desafio Ramanujan: IA ainda luta para transformar fórmulas matemáticas em provas reais

03 de julho de 2026

Aprofundamento CEVIU

Aprofundamento

O Challenge é um projeto de avaliação técnico, não uma ferramenta ou modelo. Criado por Ido Kaminer (Technion) e divulgado por Gil Kalai, ele propõe dez problemas de nível de pesquisa em fórmulas explícitas para constantes matemáticas, como π ou ζ(3), cujas provas completas já são conhecidas pelos organizadores, mas mantidas em sigilo. A meta não é descobrir novas fórmulas, mas exigir que a IA produza derivações simbólicas válidas, com estrutura verificável: provas formais, saídas de CAS (como Mathematica ou SymPy), ou provas humanas com código reprodutível. Isso distingue o Challenge de iniciativas anteriores focadas em geração heurística ou busca numérica.

Ele serve diretamente a pesquisadores que trabalham com raciocínio verificado, agentes matemáticos autônomos e engenharia de provas, não como benchmark genérico, mas como teste de integridade lógica em cadeia: da conjectura à derivação passo a passo, sem saltos não justificados. O fato de exigir reprodutibilidade via código também o alinha com práticas reais de desenvolvimento científico assistido por IA, não só com ambientes formais isolados como Lean ou Coq.

O que mudou

A OpenAI já havia submetido provas ponta a ponta no desafio First Proof em fevereiro [[LINK:/newsletter/ceviu-ia/openai-detalha-suas-primeiras-submissoes-de-provas-matematicas|OpenAI detalha suas primeiras submissões de provas matemáticas]], mas o Challenge é diferente: não testa apenas se a IA 'resolve', mas se ela constrói um caminho lógico que humanos conseguem auditar, entender e reutilizar. Antes, o foco era completude funcional; agora, é transparência estrutural. Também há evolução prática: enquanto o First Proof usava problemas com soluções parcialmente acessíveis, o Challenge mantém todas as provas secretas até o encerramento, forçando a IA a operar sem 'dicas' ocultas ou treino em exemplos similares.

Por que isso importa

Matemáticos como Terence Tao observam que sistemas atuais geram provas válidas, mas infladas e ininteligíveis, centenas de linhas sem abstração, inúteis para avanço humano. O Challenge pressiona exatamente nisso: provar não é só chegar ao resultado certo, mas explicar *por que* ele segue logicamente. Isso afeta áreas críticas como verificação de software seguro, validação de algoritmos criptográficos e até regulamentação de IA em setores técnicos. Se uma IA não consegue formalizar um teorema simples de forma clara, sua confiabilidade em sistemas de missão crítica fica em xeque, e não há 'ajuste de prompt' que resolva isso.

Linha do tempo

2026-02-23
OpenAI divulga submissões de provas matemáticas no desafio First Proof
2026-04-14
CEVIU publica análise sobre limitações de agentes de descoberta científica
2026-07-03
Lançamento oficial do Challenge, com submissões abertas até 1º de agosto

Perguntas frequentes

O Challenge é um concurso aberto ao público?

Sim. Qualquer equipe ou indivíduo pode submeter soluções até 1º de agosto de 2026. As submissões aceitas incluem provas formais, derivações com sistemas de computação algébrica (CAS) ou provas legíveis por humanos com código reprodutível. Não há restrição de ferramentas ou linguagens.

Qual a diferença entre o Challenge e a Ramanujan Machine?

A Ramanujan Machine é um projeto anterior, também liderado por Kaminer, focado em *descobrir* novas fórmulas para constantes matemáticas por meio de algoritmos de busca. O Challenge não busca novas fórmulas: parte de fórmulas conhecidas e exige provas rigorosas, ou seja, troca descoberta por justificativa lógica.

Por que usar problemas com provas secretas?

Para evitar que modelos sejam treinados ou ajustados em cima de soluções conhecidas. Manter as provas em sigilo garante que o desafio avalie verdadeira capacidade de raciocínio dedutivo, não memorização ou ajuste fino em dados de treino derivados do próprio benchmark.

Esse desafio tem ligação com os esforços de IA autônoma em produção?

Tem sim. Como destacado na cobertura CEVIU sobre os 5 desafios para escalar IA autônoma [[LINK:/newsletter/ceviu-dados/5-desafios-para-escalonar-ia-autonoma-em-producao-ate-2026|5 Desafios para Escalonar IA Autônoma]], a falta de visibilidade no processo decisório, especialmente em cadeias lógicas longas, é um dos maiores obstáculos. O Challenge é um teste direto dessa lacuna.

Links relacionados

Fontes

gilkalai.wordpress.comfonte original

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 03 de julho de 2026
Editoria: CEVIU IA