CEVIU Logo
Voltar
Databricks lança Lakehouse//RT: data warehouse em tempo real diretamente no lakehouse

Databricks lança Lakehouse//RT: data warehouse em tempo real diretamente no lakehouse

Aprofundamento CEVIU

Aprofundamento

O Lakehouse//RT não é só mais um data warehouse: é a primeira implementação prática da arquitetura LTAP (Lake Transactional/Analytical Processing), unificando transacional e analítico em uma única cópia de dados abertos, sem trade-offs. Enquanto o Lakebase Postgres (lançado em abril) resolveu o lado transacional com branching instantâneo, o Lakehouse//RT fecha o ciclo com um motor analítico capaz de servir consultas complexas em milissegundos diretamente sobre Delta Lake e Iceberg v3, incluindo suas novas features como Deletion Vectors e Row Lineage. O motor Reyden não substitui o Photon ou o SQL Warehouse: ele opera em paralelo, especializado em alta concorrência e baixa latência, mas compartilhando o mesmo Unity Catalog, os mesmos metadados e a mesma camada de governança, o que torna o Lakehouse//RT tecnicamente distinto de qualquer 'real-time layer' anterior.

Isso muda o jogo para aplicações orientadas a agentes: o Databricks já roda mais de 100.000 agentes autônomos, processando 1 quatrilhão de tokens por ano. Agora, esses agentes podem executar joins complexos, window functions e travessias de grafos (como as viabilizadas pelo Neo4j Virtual Graph) diretamente no lakehouse, sem precisar de cache pré-carregado ou fallback para bancos especializados. E o autoscaling inteligente, que pode escalar até zero, elimina o custo ocioso típico de clusters dedicados de serving.

O que mudou

O que era rumor virou realidade: em abril, falávamos de 'LTAP como conceito emergente' e de 'motor de tempo real ainda não nomeado'. Hoje, o Lakehouse//RT é uma oferta concreta em Beta, com desconto introdutório até janeiro de 2027. A evolução é clara em três frentes: (1) o Lakebase Postgres (abril) trouxe branching para transações; o Lakehouse//RT (junho) traz execução em tempo real para análises, agora o ecossistema tem ambas as pontas; (2) o Iceberg v3 (abril) introduziu Deletion Vectors e Row Lineage; o Lakehouse//RT já os usa nativamente para atualizações rápidas e rastreamento de impacto em consultas reais; (3) o OpenSharing (12 de junho) conectava storage externo; o Lakehouse//RT agora serve dados desses endpoints *diretamente*, sem movimentação, fechando o ciclo do zero-copy anunciado há duas semanas.

Por que isso importa

Para engenheiros de dados, isso significa parar de manter três stacks distintas: um lakehouse para ETL/AI, um data warehouse para BI e um sistema de serving para apps/dashboards. Para equipes de analytics, significa que relatórios interativos com joins profundos em terabytes deixam de travar sob carga, e passam a responder em <100ms mesmo com milhares de usuários simultâneos. Para segurança e compliance, significa governança única: não há mais 'regra definida no Unity Catalog' vs 'regra duplicada no Redis ou no ClickHouse'. E para negócios regulados, como jogos (Bally’s) ou saúde (PointClickCare), significa reduzir superfície de ataque e auditoria com uma única cópia de dados, auditável, versionada e imutável.

Linha do tempo

  1. Lançamento em public preview do Apache Iceberg v3 com Row Lineage e Deletion Vectors

  2. Introdução do database branching no Lakebase Postgres com copy-on-write

  3. Lançamento do DuckLake v1.0, formato lakehouse nativo em SQL

  4. Expansão do branching de banco de dados no Lakebase para produção

  5. Anúncio do ecossistema Software-Defined Storage (SDS) e protocolo OpenSharing

  6. Lançamento oficial do Lakehouse//RT com motor Reyden e suporte a LTAP

Perguntas frequentes

O Lakehouse//RT substitui o SQL Warehouse ou o Photon?

Não. Ele é um novo tipo de compute, otimizado exclusivamente para cargas de trabalho de leitura em tempo real com alta concorrência. O SQL Warehouse e o Photon continuam sendo usados para ETL, ML e consultas ad hoc pesadas. O Lakehouse//RT complementa, não substitui, o stack existente.

Posso usar Lakehouse//RT com dados em Iceberg v3 ou apenas com Delta Lake?

Sim, suporta ambos. O motor Reyden foi projetado para ler diretamente formatos abertos, incluindo Iceberg v3 com Deletion Vectors e Row Lineage, recursos lançados em abril e já integrados à nova camada de serving.

Como o Lakehouse//RT se relaciona com o Neo4j Virtual Graph?

São complementares. O Neo4j Virtual Graph compila Cypher em SQL nativo para rodar em data warehouses. Com o Lakehouse//RT, esse SQL agora executa em milissegundos diretamente no lakehouse, sem exportar dados para um grafo separado ou para um banco relacional dedicado.

O que acontece com meus pipelines de sync para sistemas de serving (ex: Redis, Elasticsearch)?

Eles se tornam obsoletos para casos de uso de BI interativo, dashboards operacionais e aplicações que exigem frescor de dados em tempo real. A Databricks estima que 70% dos cenários atuais de 'real-time layer' podem ser migrados diretamente para o Lakehouse//RT sem perda de desempenho ou funcionalidade.

Fontes

Avalie este artigo:
Compartilhar:
Categoria
CEVIU Dados
Publicado
18 de junho de 2026
Editoria
CEVIU Dados

Quer receber mais sobre CEVIU Dados?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser