Databricks lança Lakehouse//RT: data warehouse em tempo real diretamente no lakehouse
Aprofundamento CEVIU
Aprofundamento
O Lakehouse//RT não é só mais um data warehouse: é a primeira implementação prática da arquitetura LTAP (Lake Transactional/Analytical Processing), unificando transacional e analítico em uma única cópia de dados abertos, sem trade-offs. Enquanto o Lakebase Postgres (lançado em abril) resolveu o lado transacional com branching instantâneo, o Lakehouse//RT fecha o ciclo com um motor analítico capaz de servir consultas complexas em milissegundos diretamente sobre Delta Lake e Iceberg v3, incluindo suas novas features como Deletion Vectors e Row Lineage. O motor Reyden não substitui o Photon ou o SQL Warehouse: ele opera em paralelo, especializado em alta concorrência e baixa latência, mas compartilhando o mesmo Unity Catalog, os mesmos metadados e a mesma camada de governança, o que torna o Lakehouse//RT tecnicamente distinto de qualquer 'real-time layer' anterior.
Isso muda o jogo para aplicações orientadas a agentes: o Databricks já roda mais de 100.000 agentes autônomos, processando 1 quatrilhão de tokens por ano. Agora, esses agentes podem executar joins complexos, window functions e travessias de grafos (como as viabilizadas pelo Neo4j Virtual Graph) diretamente no lakehouse, sem precisar de cache pré-carregado ou fallback para bancos especializados. E o autoscaling inteligente, que pode escalar até zero, elimina o custo ocioso típico de clusters dedicados de serving.
O que mudou
O que era rumor virou realidade: em abril, falávamos de 'LTAP como conceito emergente' e de 'motor de tempo real ainda não nomeado'. Hoje, o Lakehouse//RT é uma oferta concreta em Beta, com desconto introdutório até janeiro de 2027. A evolução é clara em três frentes: (1) o Lakebase Postgres (abril) trouxe branching para transações; o Lakehouse//RT (junho) traz execução em tempo real para análises, agora o ecossistema tem ambas as pontas; (2) o Iceberg v3 (abril) introduziu Deletion Vectors e Row Lineage; o Lakehouse//RT já os usa nativamente para atualizações rápidas e rastreamento de impacto em consultas reais; (3) o OpenSharing (12 de junho) conectava storage externo; o Lakehouse//RT agora serve dados desses endpoints *diretamente*, sem movimentação, fechando o ciclo do zero-copy anunciado há duas semanas.
Por que isso importa
Para engenheiros de dados, isso significa parar de manter três stacks distintas: um lakehouse para ETL/AI, um data warehouse para BI e um sistema de serving para apps/dashboards. Para equipes de analytics, significa que relatórios interativos com joins profundos em terabytes deixam de travar sob carga, e passam a responder em <100ms mesmo com milhares de usuários simultâneos. Para segurança e compliance, significa governança única: não há mais 'regra definida no Unity Catalog' vs 'regra duplicada no Redis ou no ClickHouse'. E para negócios regulados, como jogos (Bally’s) ou saúde (PointClickCare), significa reduzir superfície de ataque e auditoria com uma única cópia de dados, auditável, versionada e imutável.
Linha do tempo
Lançamento em public preview do Apache Iceberg v3 com Row Lineage e Deletion Vectors
Introdução do database branching no Lakebase Postgres com copy-on-write
Lançamento do DuckLake v1.0, formato lakehouse nativo em SQL
Expansão do branching de banco de dados no Lakebase para produção
Anúncio do ecossistema Software-Defined Storage (SDS) e protocolo OpenSharing
Lançamento oficial do Lakehouse//RT com motor Reyden e suporte a LTAP
Perguntas frequentes
O Lakehouse//RT substitui o SQL Warehouse ou o Photon?
Não. Ele é um novo tipo de compute, otimizado exclusivamente para cargas de trabalho de leitura em tempo real com alta concorrência. O SQL Warehouse e o Photon continuam sendo usados para ETL, ML e consultas ad hoc pesadas. O Lakehouse//RT complementa, não substitui, o stack existente.
Posso usar Lakehouse//RT com dados em Iceberg v3 ou apenas com Delta Lake?
Sim, suporta ambos. O motor Reyden foi projetado para ler diretamente formatos abertos, incluindo Iceberg v3 com Deletion Vectors e Row Lineage, recursos lançados em abril e já integrados à nova camada de serving.
Como o Lakehouse//RT se relaciona com o Neo4j Virtual Graph?
São complementares. O Neo4j Virtual Graph compila Cypher em SQL nativo para rodar em data warehouses. Com o Lakehouse//RT, esse SQL agora executa em milissegundos diretamente no lakehouse, sem exportar dados para um grafo separado ou para um banco relacional dedicado.
O que acontece com meus pipelines de sync para sistemas de serving (ex: Redis, Elasticsearch)?
Eles se tornam obsoletos para casos de uso de BI interativo, dashboards operacionais e aplicações que exigem frescor de dados em tempo real. A Databricks estima que 70% dos cenários atuais de 'real-time layer' podem ser migrados diretamente para o Lakehouse//RT sem perda de desempenho ou funcionalidade.
Links relacionados
- 🧊A Próxima Era do Open Lakehouse: Apache Iceberg™ v3 em Public Preview no Databricks
- 🌴Branching de Banco de Dados no Postgres: Workflows Estilo Git com Databricks Lakebase
- 🕸️Neo4j Virtual Graph: análise de grafos direto no seu data warehouse
- 📊Databricks anuncia ecossistema de armazenamento para governança de dados corporativos
Fontes
- databricks.comfonte original
- Categoria
- CEVIU Dados
- Publicado
- 18 de junho de 2026
- Editoria
- CEVIU Dados

