O que descobri sobre o estilo de código de LLMs e os custos de tokens

25 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

Modelos de linguagem grandes (LLMs) ainda operam como programadores juniores: recriam soluções do zero, mesmo quando o ambiente já oferece APIs nativas robustas. O grande custo não está no raciocínio inicial, mas na geração repetitiva de código que deveria ser desnecessário. Em runtimes como Deno ou Cloudflare Workers, funcionalidades como URLSearchParams, FormData e fetch já estão disponíveis por padrão, sem dependências, sem boilerplate. Mas os LLMs, treinados predominantemente em código Node.js antigo, ignoram isso e geram implementações manuais longas, inseguras e caras em tokens de saída.

A economia é dramática: trocar um parser manual de query string por URLSearchParams reduz cerca de 140 para 12 tokens. Substituir manipulação manual de formulários por FormData corta de 250 para 14 tokens. Em um handler completo, isso significa saltar de 600 para menos de 90 tokens, uma redução de mais de 85%. E não é só eficiência: cada linha omitida é um bug potencial evitado, desde vazamento de memória até falhas de acessibilidade.

Por que isso importa

Token de saída custa até 5 vezes mais que de entrada. Gerar centenas de linhas de código para resolver o que a plataforma já faz é um desperdício direto em custo operacional, especialmente em aplicações escaláveis. Além disso, reimplementar lógica básica aumenta riscos de segurança, como prototype pollution em parsers manuais, e compromete confiabilidade. A solução não exige novas ferramentas: basta orientar o LLM sobre o ambiente. Um simples "use as APIs nativas do Web Platform" no prompt muda radicalmente a saída. Isso transforma o LLM de um gerador de código redundante em um assistente realmente produtivo, mas o controle continua com o engenheiro humano.

Linha do tempo

2026-06-25
Publicação da análise sobre o custo de tokens e o uso ineficiente de APIs por LLMs, destacando ganhos com Web APIs nativas

Perguntas frequentes

Por que LLMs não usam APIs nativas automaticamente?

Seus conjuntos de treinamento são dominados por código Node.js antigo, onde bibliotecas como express, axios e querystring eram comuns. Mesmo em ambientes modernos como Deno, o modelo não sabe que APIs do navegador estão disponíveis no servidor, a menos que você diga explicitamente. Ele replica padrões estatisticamente frequentes, não melhores práticas atuais.

Quanto posso economizar ajustando o prompt?

Estimativas indicam redução de 85% a 92% no uso de tokens de saída para tarefas de infraestrutura. Em um handler médio, isso pode representar centenas de tokens por chamada. Em volume, isso se traduz em economia real em custos de API, além de código mais limpo e seguro.

Comentários realmente afetam o que o LLM gera?

Sim. Pesquisas mostram que modelos seguem o conteúdo dos comentários, mesmo quando contradizem o código. Comentários desatualizados pioram a compreensão do LLM, mais que ausência de comentário. Já comentários com intenção de design (como restrições ou invariantes) guiam bem a geração. Evite repetir o óbvio; foque no 'porquê'.

Fontes

jimmont.comfonte original

Avalie este artigo:

Categoria: CEVIU
Publicado: 25 de junho de 2026
Editoria: CEVIU