Como o Spotify construiu o Vedder: um assistente de dados com camada de contexto curada por especialistas

15 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

O Vedder não é só mais um assistente de dados com RAG. É uma arquitetura de governança de contexto em tempo real, construída sobre a premissa de que, no Spotify, o problema não é falta de dados, é excesso: 70.000 datasets, 1.4 trilhão de pontos diários, e um histórico de consultas tão ruidoso que apenas 12,5% dos pares pergunta-SQL minerados automaticamente foram aprovados. A solução foi descentralizar a curadoria: cada um dos 177 clusters é mantido por especialistas de domínio (não por engenheiros de ML), que validam não só os dados, mas o significado deles, como 'audiência única' em podcasts versus 'ouvintes únicos' em música, ou como 'impressão' se comporta em publicidade versus recomendação.

Isso conecta diretamente com o Honk, o agente de codificação que já migrou 1.800 pipelines. Enquanto o Honk opera na camada de infraestrutura de dados (transformando código, validando dependências via Backstage + Fleet), o Vedder opera na camada de consumo, e ambos compartilham a mesma disciplina: contexto não é anexado, é construído. O Vedder usa a pontuação de saúde para acionar alertas automáticos quando um dataset começa a sofrer drift de cobertura ou quando a documentação de negócio fica desatualizada; o Honk, por sua vez, usa testes automatizados para garantir que cada pull request gerada por IA preserve a semântica do pipeline original. São dois lados da mesma moeda: confiança em IA não vem de modelos maiores, mas de ciclos fechados de verificação humana + automação.

O que mudou

Em abril, o CEVIU mostrou o Honk migrando pipelines, mas como um agente operacional, focado em infraestrutura. Em junho, o Vedder revela a evolução estratégica: o Spotify agora aplica a mesma lógica de agentes *com supervisão humana contínua* na camada analítica. Não é mais só 'automatizar tarefas', é 'redefinir quem pode acessar dados'. Antes, só engenheiros e analistas com SQL avançado podiam explorar 70.000 datasets. Agora, 25% dos usuários do Vedder nunca escreveram SQL, e estão fazendo perguntas em linguagem natural sobre finanças, audiolivros e ferramentas de criadores, com respostas auditáveis e reprodutíveis. Isso é uma mudança de acesso, não só de interface.

Por que isso importa

Para equipes de dados no Brasil, o Vedder é um case prático de como escalar self-service sem abrir mão de governança. Ele prova que 'curadoria por especialista' não é um custo, mas um multiplicador: ao priorizar qualidade de contexto sobre volume de dados, o Spotify reduz retrabalho de engenharia de dados e aumenta a velocidade de tomada de decisão em áreas que antes dependiam de relatórios estáticos. Mais ainda: mostra que a pontuação de saúde, que mede drift, cobertura e reprodutibilidade, pode ser um KPI operacional real, não só um conceito teórico de qualidade de dados. Equipes que ainda usam RAG genérico em ambientes complexos devem olhar para o Vedder como um alerta: sem camadas de verificação humana e métricas de contexto, a precisão cai rápido, e o custo de correção sobe mais ainda.

Linha do tempo

27/04/2026
Lançamento do Honk, agente de codificação que migra pipelines de dados com suporte em Backstage e Fleet Management
08/06/2026
Publicação da análise da Anthropic sobre governança de contexto como pré-requisito para analytics self-service com LLMs
15/06/2026
Lançamento público do Vedder, assistente de dados com clusters curados por especialistas e pontuação de saúde contínua

Perguntas frequentes

O Vedder substitui analistas de dados?

Não. Ele amplia o alcance deles: analistas agora definem os clusters, validam pares pergunta-SQL e interpretam resultados críticos. Os 2.100 usuários incluem profissionais de marketing, finanças e criação, que antes esperavam relatórios semanais e agora exploram dados em tempo real, com guardrails.

Como o Vedder lida com mudanças nos esquemas dos dados?

A pontuação de saúde detecta drift automaticamente. Quando um campo muda de tipo ou um dataset deixa de ser atualizado, o cluster entra em modo de alerta. O proprietário humano é notificado e deve revisar a documentação, atualizar os pares de exemplo ou revalidar o contexto, sem isso, o cluster é temporariamente desativado.

Por que o Spotify não usou RAG puro, como muitas empresas fazem?

Porque RAG puro falha em ambientes com alta heterogeneidade semântica. No Spotify, 'duração' pode significar tempo de reprodução, duração de sessão ou tempo de anúncio, e o mesmo nome aparece em 12 schemas diferentes. O Vedder resolve isso com curadoria contextual explícita, não com recuperação de trechos aleatórios.

O Vedder é baseado em Claude, como o Honk?

Não há confirmação pública de que use Claude. O Spotify não divulgou o modelo base, mas sim a arquitetura: o LLM é envolto por um orquestrador de clusters, um sistema de avaliação de saúde e um ciclo de feedback estruturado. O foco é no contexto, não no modelo, o que alinha com a visão da Anthropic citada no CEVIU em 8 de junho.

Links relacionados

🤖Como a Anthropic viabiliza analytics self-service com o Claude

Fontes

engineering.atspotify.comfonte original

Avalie este artigo:

Categoria: CEVIU Dados
Publicado: 15 de junho de 2026
Editoria: CEVIU Dados