Exa Agent lança API de pesquisa avançada que integra LLMs com busca web otimizada
Aprofundamento CEVIU
Aprofundamento
A Exa Agent não é só mais uma API de busca: é o primeiro agente de pesquisa web projetado desde o zero para rodar em modo multiagente nativo, com arquitetura baseada em LangGraph e orquestração via LangSmith. Enquanto a maioria das APIs ainda depende de chamadas sequenciais LLM → busca → pós-processamento, a Exa executa subagentes em paralelo, cada um focado em um domínio (finanças, tecnologia, mídia, GitHub), com fusão dinâmica de modelos: usa Gemini ou Claude para extração semântica crítica, mas troca para modelos menores (como o Grok-1.5 ou Phi-3) em tarefas de classificação ou validação de entidades. Isso explica a redução de 94% no uso de tokens: não é compressão, é substituição inteligente de camada.
O modelo de destaques eficiente em tokens não é só um encoder, ele gera snippets estruturados diretamente do HTML bruto, sem passar por LLMs intermediários. A infraestrutura roda sobre crawlers próprios que rastreiam 500 bilhões de URLs, com atualização contínua de embeddings especializados (não reutiliza modelos genéricos como BERT ou E5). Isso permite queries como 'lista de startups brasileiras que fecharam rodada série A entre abril e junho de 2026 com foco em infraestrutura de IA', com resposta estruturada em JSON em menos de 1,8s, mesmo com 12 colunas exigidas, como exige o benchmark WideSearch.
O que mudou
Em outubro de 2025, a Exa lançou a versão 2.0 da sua API de busca com melhoria na precisão de links técnicos, mas ainda exigia duas chamadas (busca + fetch) e não suportava saída estruturada. Em fevereiro de 2026, veio o Exa Instant, latência <200ms, mas só para queries simples. A Exa Agent, lançada agora em 18/06/2026, é a primeira versão que une os dois: velocidade do Instant + profundidade da 2.1 + orquestração multiagente nativa. Também é a primeira a oferecer 'auto effort' real: o sistema ajusta automaticamente número de subagentes, profundidade de crawl e modelo usado com base em métricas de confiança em tempo real, não é heurística pré-definida, mas decisão tomada por um pequeno LLM de controle treinado especificamente para alocação de recursos.
Por que isso importa
Desenvolvedores de agentes deixam de ter que construir pipelines de fallback, cache e normalização de resultados. Antes, integrar dados da web exigia 3, 5 serviços distintos (busca, parser, LLM de extração, validador de entidades, gerador de schema). Agora, com um único endpoint e `outputSchema`, você define o JSON esperado, e a Exa Agent entrega, já validado, com F1 medido contra WideSearch. Isso reduz o tempo de desenvolvimento de agentes de análise competitiva de semanas para horas. E, ao usar apenas 6% dos tokens de uma abordagem tradicional, o custo operacional cai drasticamente, especialmente relevante para equipes que já usam Bedrock AgentCore ou Grok Build 0.1, pois a Exa Agent atua como um 'módulo de conhecimento' plugável, sem duplicar inferência.
Linha do tempo
Lançamento do benchmark WideSearch pela Exa para avaliar agentes de pesquisa estruturada
Lançamento do Exa Instant, com latência inferior a 200ms para buscas simples
Rodada de financiamento Série C da Exa: US$ 250 milhões, avaliação de US$ 2,2 bilhões
AWS lança busca web no Amazon Bedrock AgentCore
Lançamento da Exa Agent, API de pesquisa multiagente com fusão de modelos e saída estruturada nativa
Perguntas frequentes
A Exa Agent substitui totalmente o Amazon Bedrock AgentCore com busca web?
Não substitui, complementa. O AgentCore é um framework de orquestração dentro da AWS; a Exa Agent é um provedor especializado de conhecimento. Você pode usar o AgentCore para chamar a Exa Agent como uma ferramenta externa, mantendo segurança e observabilidade do ambiente AWS. A diferença prática: o AgentCore faz busca com limitações de fontes (só sites indexados pela AWS), enquanto a Exa acessa 500 bilhões de URLs em tempo real.
Como a Exa Agent se compara à Fusion API da OpenRouter em termos de custo e desempenho?
A Fusion API otimiza custo usando painéis de modelos para tarefas genéricas. A Exa Agent otimiza custo com arquitetura: reduz tokens antes mesmo de envolver o LLM. Em tarefas de enriquecimento de entidades, a Exa chega a ser 3x mais barata que a Fusion para o mesmo F1 no WideSearch, porque evita chamadas redundantes de parsing e valida entidades diretamente no crawler, não no LLM.
Posso usar a Exa Agent com dados internos, como um banco de clientes?
Sim, via parâmetro `input.data`. Você envia uma lista de nomes de empresas, emails ou CNPJs, e a API enriquece cada item com dados públicos da web (financiamentos, contratações, eventos, GitHub). Não há upload de dados sensíveis: tudo é processado no lado do servidor da Exa com sandboxing rigoroso, e o histórico de consultas é apagado após 24h, conforme certificado ISO 27001 publicado em maio de 2026.
O benchmark WideSearch é confiável para comparar com outras APIs?
É um dos poucos benchmarks voltados especificamente para agentes de pesquisa, não para LLMs isolados. Ele exige que o agente identifique corretamente a entidade *e* preencha todas as colunas exigidas (ex: 'último round de financiamento', 'data', 'investidores') com base em múltiplas fontes. Muitas APIs falham ao associar dados de Reuters com commits do GitHub da mesma empresa. A Exa Agent atinge 82,3% de F1 nesse teste, contra 64,1% da Tavily e 57,8% da Nimble (dados oficiais de junho de 2026).
Fontes
- exa.aifonte original
- Categoria
- CEVIU Web Dev
- Publicado
- 18 de junho de 2026
- Editoria
- CEVIU Web Dev
