Pare de Responder à Mesma Pergunta Duas Vezes: Caching com Consciência de Intervalo para Druid na Escala Netflix
A Netflix desenvolveu uma camada de caching para o Apache Druid a fim de evitar o reprocessamento das mesmas queries de séries temporais. A solução intercepta as queries no Druid Router, analisa sua estrutura e armazena os resultados em buckets de tempo granularizados, utilizando um cache persistido em Cassandra.
Para janelas de tempo sobrepostas, o sistema serve dados em cache para intervalos já consolidados e busca do Druid apenas a parte mais recente e faltante. Ele emprega TTLs exponenciais e uma estratégia de merge que considera "gaps" (lacunas) para equilibrar a atualização dos dados com as taxas de acerto do cache.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU Dados
- Publicado
- 09 de abril de 2026
- Fonte
- CEVIU Dados
