Além de BM25 e dense embeddings: Como construímos uma recuperação inteligente e interpretável na Faire

04 de abril de 2026

A Faire implementou um modelo de recuperação neural disperso para resolver o descompasso vocabular em buscas de marketplace, mantendo a compatibilidade com Elasticsearch e a interpretabilidade. Ao expandir consultas e documentos com termos semanticamente relacionados, o sistema melhorou em mais de 30% a qualidade dos candidatos de cauda longa, aumentou em 4,27% o valor da ordem da página de busca e elevou o valor global dos pedidos no marketplace. Escolhas de engenharia chave incluíram o pré-treinamento do BERT específico de domínio, tokenização WordPiece, max pooling, penalidades de dispersão assimétrica e a mudança do blending do Product Quality Score para o tempo de indexação para preservar a latência.

Avalie este artigo:

Categoria: CEVIU Dados
Publicado: 04 de abril de 2026
Fonte: CEVIU Dados

Quer receber mais sobre CEVIU Dados?