Pesquisa autônoma com Claude: O poder da otimização restrita na prática

03 de julho de 2026

Aprofundamento CEVIU

Aprofundamento

O experimento de Elliot C. Smith com Claude não é só sobre compressão de arquivos. É um teste de estresse para a ideia de 'autoresearch': usar IA como pesquisador autônomo em software. Ele escolheu Rust por causa do sistema de tipos, não para escrever código mais rápido, mas para encaixar restrições que o modelo não pode burlar. O objetivo era claro: reduzir bytes comprimidos sem perder dados e sem ultrapassar 300 segundos por operação. O Claude Sonnet 4.6 (lançado em fevereiro de 2026) executou 10 iterações sozinho, partindo de uma função que copiava bytes até implementar LZSS e refiná-lo com lógica de entropia. Mas o mais revelador não foi o que ele fez, e sim o que evitou: nunca tentou otimizar velocidade ou memória, porque nenhuma dessas métricas estava na função objetivo. Isso mostra que Claude não 'entende' prioridades, ele segue instruções matemáticas, ponto final.

A diferença crítica em relação aos testes anteriores da CEVIU é que aqui não há interação humana no loop. Nada de correção de prompt, nada de aprovação manual de plano. O agente decide sozinho quando parar, e sempre escolhe 'pronto' após uma única mudança, mesmo que haja espaço para mais. Esse comportamento foi observado também no teste de depuração CSS com o Claude Fable 5 artigo original, mas agora em escala maior e com métrica objetiva. Não é falha do modelo: é consequência direta de como a tarefa foi estruturada, e isso é exatamente o que o autor queria medir.

O que mudou

Em março de 2026, a CEVIU já havia mostrado que a autopesquisa funciona bem em espaços de busca definidos [[LINK:/newsletter/ceviu/autopesquisa-eficiencia-com-limites-definidos|Eficiência com limites definidos]]. Agora, com este experimento, vemos a primeira aplicação prática dessa premissa em um projeto real de engenharia de software, não como conceito ou demonstração pontual, mas como fluxo iterativo sustentável por duas semanas. Também evoluiu desde o teste de física teórica com Claude em março [[LINK:/newsletter/ceviu-ia/fisica-com-vibes-o-estudante-de-graduacao-em-ia|Física com Vibes]], onde o modelo foi orientado passo a passo por um humano. Aqui, o humano define as regras e some, o agente opera sozinho dentro dos limites impostos.

Por que isso importa

Isso importa porque muitas equipes já estão usando Claude Code para refatorar serviços legados ou otimizar pipelines de dados. Se você acha que pode deixar a IA 'melhorar seu código' sem definir com precisão o que é 'melhor', esse experimento é um alerta prático. Um ganho de 5% em compressão pode vir com aumento de 200% no tempo de execução, e o Claude não vai te avisar se 'velocidade' não estiver na sua fórmula de sucesso. A lição não é que a IA é fraca, mas que ela é literal: só otimiza o que você consegue traduzir em número, limite e verificação automática. E, como mostra o teste de produtividade da CEVIU em fevereiro [[LINK:/newsletter/ceviu/produtividade-com-ia-as-evidencias-sao-mistas-mas-o-padrao-e-claro|Produtividade com IA]], essa literalidade é exatamente onde a IA brilha, e onde ela quebra.

Linha do tempo

2026-02-09
CEVIU testa Claude em depuração de React/Next.js com bugs reais
2026-02-26
CEVIU publica análise sobre produtividade mista da IA em tarefas complexas
2026-03-24
CEVIU destaca que autopesquisa funciona bem em espaços de busca definidos
2026-03-25
CEVIU relata uso de Claude em cálculo de física teórica supervisionado por professor
2026-05-29
CEVIU cobre lançamento de fluxos de trabalho dinâmicos no Claude Code
2026-06-15
CEVIU documenta autonomia agressiva do Claude Fable 5 em correção de CSS
2026-07-03
Experimento de autoresearch com Claude em compressão de arquivos é divulgado

Perguntas frequentes

Claude realmente criou um algoritmo novo de compressão?

Não. Na primeira iteração, ele implementou LZSS, um método clássico de compressão conhecido desde os anos 1980. Nas nove iterações seguintes, fez extensões locais: adição de verificações de entropia, ajustes em codificação de símbolos. Nada de invenção aberta, apenas refinamento guiado por métricas numéricas.

Por que usar Rust nesse experimento?

Porque o sistema de tipos do Rust impõe restrições fortes por padrão. Por exemplo, o modelo não pode mudar a assinatura da função 'compress' sem gerar erro de compilação. Isso força o agente a operar dentro de limites claros, exatamente o que o experimento exigia para testar otimização restrita.

O custo de $4 por iteração é viável em produção?

Depende do impacto. Para um microserviço crítico cuja otimização gera economia de $10 mil/mês em infraestrutura, sim. Mas para ajustes menores, não. O artigo menciona que 10 iterações custaram cerca de $40, valor baixo para pesquisa, mas inviável se aplicado a cada pull request de um time grande.

Esse tipo de autopesquisa substitui engenheiros?

Não substitui, mas amplifica. O autor fez todo o planejamento: escolheu o problema, montou a estrutura de testes, definiu as métricas e validou os resultados. O Claude executou apenas a parte repetitiva e numérica. Como mostrou o teste de depuração React da CEVIU em fevereiro, a IA resolve bugs simples, mas o engenheiro ainda define o que é 'resolvido'.

Fontes

elliotcsmith.comfonte original

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 03 de julho de 2026
Editoria: CEVIU IA