Escrevi um parser de SQL 70x mais rápido quase sem olhar o código

25 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

Reescrever um parser de SQL não é algo que se faz por diversão. Normalmente exige especialistas, meses de trabalho e testes exaustivos. Mas em maio de 2026, uma engenheira do PostHog conseguiu fazer isso em dias usando apenas Claude Opus 4.7, rodando sessões paralelas com um ciclo fechado de feedback baseado em property-based testing (PBT). O novo parser, escrito em Rust, substituiu um gerado por ANTLR em C++ e ficou até 454 vezes mais rápido em produção.

O segredo não foi só o uso de IA. Foi a combinação com técnicas avançadas de teste: ela criou uma ferramenta para gerar automaticamente casos de teste a partir da gramática .g4 original, usou Hypothesis para encontrar divergências entre os parsers e até ativou agentes secundários só para 'pensar em casos malucos'. Tudo isso rodava em loop, com o PBT alimentando falhas, o Claude corrigindo e o sistema revalidando, quase sem intervenção humana.

Por que isso importa

Isso vai além de performance. Mostra que a manutenção de componentes críticos como parsers pode sair do domínio dos especialistas e virar algo acessível via IA + teste automatizado. ANTLR e outras ferramentas de geração podem começar a perder espaço para abordagens híbridas onde a IA escreve código otimizado sob medida, validado contra um oráculo legado. Também redefine o que é 'código escrito à mão', aqui, foi tudo gerado, mas com arquitetura clara, recursivo-descendente com Pratt para expressões, look-ahead controlado e backtracking localizado, típico de parsers de alto desempenho.

Para equipes que lidam com linguagens internas, transpiladores ou análise de código, o caminho está aberto: use um parser existente como oráculo, gere massa de teste com cobertura guiada e solte agentes de IA em loop até convergir. Pode soar radical, mas funcionou com milhões de queries reais em produção.

Linha do tempo

2026-05
Claude Opus 4.7 gera parser de SQL em Rust para PostHog em sessões paralelas
2026-06-25
PostHog anuncia novo parser de SQL com até 454x mais velocidade em produção

Perguntas frequentes

Como o parser novo pode ser 454x mais rápido que o antigo?

O parser anterior era gerado por ANTLR, que usa um interpretador de grafo (ATN) e faz lookahead dinâmico, funcional, mas lento. O novo é recursivo-descendente escrito em Rust, com estruturas otimizadas como loop Pratt para expressões. Isso elimina camadas de abstração e permite decisões rápidas baseadas em lookahead limitado e backtracking pontual, típico de parsers manuais de alta performance.

O parser foi realmente 'escrito pela IA'?

Sim. Todo o código, cerca de 16 mil linhas, foi gerado pelo Claude Opus 4.7, em sessões longas e paralelas. A engenheira orientou o processo, projetou o ciclo de testes e definiu a arquitetura, mas não codificou manualmente. O resultado é tão sofisticado quanto um parser feito por especialista, com decisões técnicas precisas sobre predição e recuperação de erros.

Como garantiram que o novo parser não quebrasse consultas existentes?

Usaram o parser antigo como 'oráculo'. Qualquer diferença na AST gerada acionava um ciclo de correção. Ferramentas como Hypothesis geravam milhares de queries aleatórias baseadas na gramática, e o sistema também testou milhões de queries reais em shadow mode. Quando não houve divergência, migraram o tráfego com segurança.

Fontes

posthog.comfonte original

Avalie este artigo:

Categoria: CEVIU
Publicado: 25 de junho de 2026
Editoria: CEVIU