Voltar

Pare de Responder à Mesma Pergunta Duas Vezes: Caching com Consciência de Intervalo para Druid na Escala Netflix

A Netflix desenvolveu uma camada de caching para o Apache Druid a fim de evitar o reprocessamento das mesmas queries de séries temporais. A solução intercepta as queries no Druid Router, analisa sua estrutura e armazena os resultados em buckets de tempo granularizados, utilizando um cache persistido em Cassandra.

Para janelas de tempo sobrepostas, o sistema serve dados em cache para intervalos já consolidados e busca do Druid apenas a parte mais recente e faltante. Ele emprega TTLs exponenciais e uma estratégia de merge que considera "gaps" (lacunas) para equilibrar a atualização dos dados com as taxas de acerto do cache.

Avalie este artigo:
Compartilhar:
Categoria
CEVIU Dados
Publicado
09 de abril de 2026
Fonte
CEVIU Dados

Quer receber mais sobre CEVIU Dados?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser