Além de BM25 e dense embeddings: Como construímos uma recuperação inteligente e interpretável na Faire
A Faire implementou um modelo de recuperação neural disperso para resolver o descompasso vocabular em buscas de marketplace, mantendo a compatibilidade com Elasticsearch e a interpretabilidade. Ao expandir consultas e documentos com termos semanticamente relacionados, o sistema melhorou em mais de 30% a qualidade dos candidatos de cauda longa, aumentou em 4,27% o valor da ordem da página de busca e elevou o valor global dos pedidos no marketplace. Escolhas de engenharia chave incluíram o pré-treinamento do BERT específico de domínio, tokenização WordPiece, max pooling, penalidades de dispersão assimétrica e a mudança do blending do Product Quality Score para o tempo de indexação para preservar a latência.
- Categoria
- CEVIU Dados
- Publicado
- 04 de abril de 2026
- Fonte
- CEVIU Dados
