Estudo com 137 mil sites revela que quase nenhum llms.txt é lido por IA

16 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

O llms.txt virou um caso clássico de hype antecipado: adotado por 28% dos 137 mil sites analisados, mas lido por menos de 3% deles, e quase nunca pelas ferramentas que os webmasters imaginam. A maioria das requisições vem de bots de SEO, auditores (como o CairrotReadinessBot), scanners de prontidão para IA e até Slackbot. O que realmente acessa o arquivo são agentes de codificação (Claude Code lidera) e crawlers de treinamento (GPTBot é o maior), não buscadores como Perplexity ou ChatGPT, que juntos representam só 1,1% do tráfego real de IA.

Isso confirma o que já havíamos apontado em 4 de junho: o debate está no lugar errado. Não é uma questão de 'otimização para IA search', mas de infraestrutura para agentes que operam em contextos específicos, documentação técnica, integração com ferramentas de desenvolvimento, roteamento interno de B2A. Seu valor prático hoje está em reduzir tokens gastos por agentes ao lerem sua documentação, não em aparecer no AI Overview do Google ou nas respostas do Perplexity.

O que mudou

Em 4 de junho, a CEVIU já chamava atenção para o impacto quase nulo do llms.txt na visibilidade em buscas por IA. Agora, com dados reais de maio de 2026, a hipótese virou evidência: 97% dos arquivos não tiveram qualquer acesso, e a única leitura significativa veio de agentes de codificação, não de buscadores. Também mudou a postura pública do Google: em menos de uma semana, publicou um guia dizendo que o arquivo 'não é necessário' para IA search e, logo depois, incluiu verificação de llms.txt no Lighthouse, mas com foco explícito em 'agentes', não em busca. Isso transformou o llms.txt de especulação em um padrão funcional, mas limitado: útil para quem constrói ferramentas para devs, irrelevante para quem quer aparecer em respostas de chat.

Por que isso importa

Porque você está gastando tempo e recursos com um sinal que ninguém está lendo, exceto quem já tem acesso direto ao seu conteúdo (como agentes integrados à sua stack de dev). Se seu objetivo é conversão, autoridade ou tráfego orgânico, priorize estrutura semântica, markup rico, conteúdo com intenção clara e desbloqueio de crawlers, não um arquivo Markdown na raiz que 97% dos sites com ele nunca vêem ser acessado. Já se seu produto é uma API, SDK ou biblioteca, o llms.txt pode acelerar a adoção por agentes de código. Mas isso é marketing B2A, não SEO para IA.

Linha do tempo

09/04/2026
CEVIU publica análise mostrando que tráfego orientado por IA ainda gera menor receita por sessão em e-commerce
07/05/2026
CEVIU alerta que provedores de WordPress gerenciado podem bloquear silenciosamente bots de IA
13/05/2026
CEVIU mostra que visibilidade em IA é fragmentada: apenas 2, 2,5% das URLs aparecem em ChatGPT, Perplexity e Google AI Overviews simultaneamente
29/05/2026
CEVIU divulga relatório da Ahrefs sobre comportamento real de tráfego em buscas por IA
04/06/2026
CEVIU publica duas análises: uma sobre o equívoco estratégico do llms.txt e outra sobre falhas críticas em memória de agentes
16/06/2026
Estudo da Ahrefs com 137 mil sites confirma que 97% dos arquivos llms.txt não são acessados e que uso real é concentrado em agentes de codificação

Perguntas frequentes

Preciso criar um llms.txt para aparecer no ChatGPT ou Perplexity?

Não. Os dados mostram que esses sistemas praticamente não acessam o arquivo: juntos, respondem por apenas 1,1% das requisições de IA. Criar um llms.txt não melhora suas chances de citação ou ranking nessas plataformas.

Quem realmente usa o llms.txt hoje?

Principalmente agentes de codificação (como Claude Code), crawlers de treinamento (como GPTBot) e ferramentas de auditoria SEO/AEO. Também há uso por scanners de segurança que testam injeção de prompt, não por mecanismos de busca públicos.

Vale a pena implementar llms.txt se meu site é de e-commerce ou conteúdo editorial?

Não vale. Estudos mostram que a adoção é alta só em nichos técnicos: 67% em ferramentas de dev, 60% em SaaS. Em e-commerce, notícias ou blogs, a taxa cai para menos de 5%, e o tráfego de IA é estatisticamente zero. Invista em estrutura de página, schema.org e experiência de usuário.

O que acontece se eu publicar um llms.txt errado ou mal escrito?

Pode gerar risco de segurança: agentes de IA tendem a confiar nesse arquivo como fonte autoritária. Um estudo identificou um crawler chamado prompt-injection-survey/1.0 explorando exatamente essa vulnerabilidade. Erros podem distorcer como agentes entendem seu conteúdo, ou pior, serem explorados.

Links relacionados

🤖O debate sobre o llms.txt está no lugar errado

Fontes

ahrefs.comfonte original

Avalie este artigo:

Categoria: CEVIU Marketing
Publicado: 16 de junho de 2026
Editoria: CEVIU Marketing