Databricks anuncia Lakehouse//RT e LTAP no Data + AI Summit 2026 para unificar dados em tempo real
Aprofundamento CEVIU
Aprofundamento
O Lakehouse//RT não é só mais um data warehouse rápido: é uma mudança de paradigma no modelo de execução. Ele roda sobre o motor Reyden, que adota um modelo totalmente assíncrono, diferente do Spark (síncrono por natureza) e dos motores OLAP tradicionais como ClickHouse ou Druid, que dependem de estruturas de dados em memória otimizadas para leitura. Isso permite escalabilidade horizontal real sob carga concorrente extrema, sem picos de latência. Já o LTAP não é HTAP disfarçado: ele separa rigorosamente os papéis, Lakebase lida com transações PostgreSQL 17 com branching instantâneo e scale-to-zero; Lakehouse//RT serve consultas analíticas em milissegundos; e o Unity Catalog governa tudo com linhagem unificada. A peça-chave que conecta os dois é o Lakehouse Sync, em Public Preview desde maio de 2026, que faz CDC contínuo e de baixa latência entre Lakebase e Delta, sem Kafka ou Airflow.
Essa arquitetura só se tornou viável graças a três pilares anteriores da Databricks já em produção: o Iceberg v3 (com Deletion Vectors e Row Lineage, lançado em abril), o OpenSharing (padronizado pela Linux Foundation em junho, permitindo acesso federado a dados e modelos sem movimentação), e o SDS (Software-Defined Storage), anunciado em 12 de junho, que elimina silos de armazenamento corporativo ao conectar diretamente servidores on-prem e endpoints de nuvem à plataforma.
O que mudou
Antes, em abril de 2026, a Databricks só oferecia suporte a Iceberg v3 em preview e o Lakebase ainda estava em beta para Azure. Agora, em junho de 2026, o Lakebase está em GA na AWS e em beta avançado na Azure, com todos os novos clusters sendo Autoscaling por padrão, incluindo scale-to-zero. O Lakehouse Sync, que antes era apenas conceito, agora está em Public Preview com integração real entre Lakebase e Delta via CDC nativo. E o Lakehouse//RT, que em 18 de junho era descrito como 'novo data warehouse em tempo real', foi oficialmente lançado em Beta em 16 de junho, com benchmarks reais (12k QPS, 10ms de latência) e integração confirmada com Power BI.
Por que isso importa
Isso muda o custo total de propriedade (TCO) de arquiteturas de dados. Um time que hoje opera Lakehouse + ClickHouse + PostgreSQL + Kafka + Airflow pode reduzir para três componentes: Lakebase (OLTP), Lakehouse//RT (serving analítico), Unity Catalog (governança). Sem cópias de dados, sem pipelines de sincronização, sem políticas duplicadas. Para agentes de IA, que já criam 80% dos bancos no Lakebase, essa unificação significa que cada novo agente pode provisionar, consultar, atualizar e apagar dados em segundos, não em horas. Não é só simplificação: é escala operacional para IA nativa.
Linha do tempo
Databricks lança suporte em public preview para Apache Iceberg v3 com Row Lineage e Deletion Vectors
UiPath integra-se com Databricks para automação de IA em tempo real
Databricks anuncia ecossistema Software-Defined Storage (SDS) e protocolo OpenSharing
Linux Foundation lança OpenSharing como projeto oficial, ampliando Delta Sharing
CEVIU News divulga lançamento do Lakehouse//RT com motor Reyden e performance em milissegundos
Databricks anuncia oficialmente Lakehouse//RT e LTAP no Data + AI Summit 2026
Perguntas frequentes
Lakehouse//RT substitui o Spark SQL?
Não. O Lakehouse//RT usa o motor Reyden, não o Spark. Ele complementa o Spark: o Spark continua ideal para ETL pesado, ML e processamento em lote. O Reyden é exclusivo para workloads interativos de alta concorrência e baixa latência, como dashboards e APIs.
LTAP exige migrar todos os sistemas OLTP para Lakebase?
Não. O LTAP é baseado em interoperabilidade: o Lakehouse Sync replica dados do Lakebase para Delta, mas também aceita fontes externas via OpenSharing e SDS. Você pode manter seu PostgreSQL existente e sincronizar apenas o necessário para analytics.
Unity Catalog é obrigatório para usar Lakehouse//RT ou LTAP?
Sim. Ambos exigem Unity Catalog ativado. A governança unificada, permissões, linhagem, auditoria, é o cerne da proposta. Sem ela, não há garantia de que a mesma cópia de dados esteja sendo usada por todas as camadas.
O que acontece com ferramentas como dbt ou Airflow nessa nova arquitetura?
dbt continua funcionando sobre Lakehouse//RT (via JDBC/ODBC), mas muitos pipelines de transformação em tempo real deixam de ser necessários. Airflow ainda é útil para orquestração complexa, mas tarefas de sincronização entre OLTP e OLAP são absorvidas pelo Lakehouse Sync nativo.
Links relacionados
- ⚡Databricks lança Lakehouse//RT: data warehouse em tempo real diretamente no lakehouse
- 🧊A Próxima Era do Open Lakehouse: Apache Iceberg™ v3 em Public Preview no Databricks
- 📊Databricks anuncia ecossistema de armazenamento para governança de dados corporativos
- 🚀Linux Foundation anuncia projeto OpenSharing para padronizar troca de dados e ativos de IA
Fontes
- dataengineeringcentral.substack.comfonte original
- Categoria
- CEVIU Dados
- Publicado
- 22 de junho de 2026
- Editoria
- CEVIU Dados

