MotherDuck lança Flights: pipeline nativo para agentes de IA com execução segura no DuckDB
Aprofundamento CEVIU
Aprofundamento
O Flights não é só mais um orquestrador: é uma camada de execução nativa para agentes de IA que roda dentro do DuckDB, aproveitando sua arquitetura in-process e zero-copy. Ele transforma o banco de dados em um ambiente de pipeline, com runtime Python seguro, suporte a dlt para ingestão incremental, logging estruturado e versionamento de pipelines via Git integrado. O diferencial está no MCP (MotherDuck Control Plane): um servidor compatível com agentes como Claude e ChatGPT que entende instruções em linguagem natural e as converte em operações SQL seguras, como SELECT flights.create(...) ou SELECT flights.run('pipeline_x'). Isso elimina a necessidade de wrappers externos, APIs REST ou infra de orquestração separada.
O runtime do Flights também permite chamar LLMs diretamente em transformações (ex: enriquecer dados de clientes com classificação de sentimento via API), exportar resultados para S3/GCS em Parquet com compressão ZSTD, e fazer Reverse ETL para ferramentas de CRM ou marketing. Tudo isso sem sair da sessão SQL, nem mesmo o dbt precisa rodar fora. A segurança é feita por injeção controlada de segredos e sandboxing do Python, mas a MotherDuck alerta: dados regulamentados ainda não devem entrar na prévia pública.
O que mudou
Antes, agentes precisavam de pontes frágeis: CLI da Hugging Face para acessar modelos, Airflow + Common AI Provider para tarefas LLM, ou Agent Bricks para governança corporativa. Agora, o Flights traz execução nativa, não apenas acionamento. Enquanto o Airflow 3.1 (11/05) trouxe agentes de troubleshooting e o MCP foi introduzido como recurso de orquestração, o Flights entrega o MCP como *runtime de dados*, com DuckDB como motor, não como destino. Também evolui o conceito do plugin Obsidian (08/06): lá, o agente lia e executava SQL localmente; agora, ele cria, versiona e opera pipelines inteiros na nuvem, com audit trail completo e controle de custo por Pulse.
Por que isso importa
Time-to-production de pipelines orientados por IA cai de dias para minutos. Time de dados não precisa mais escolher entre DuckDB (velocidade) e Airflow (orquestração), o Flights une os dois, mantendo a simplicidade de uma única query SQL. Para engenheiros de ML, isso significa pré-processamento em tempo real com acesso direto a modelos via Python, sem copiar dados para Spark ou Dask. Para analistas, é possível disparar um pipeline de atualização de dashboard com SELECT flights.run('sales_daily') direto no BI. E para empresas sob LGPD ou HIPAA, o versionamento Git + logging estruturado + auditoria por SQL oferece rastreabilidade que orquestradores genéricos não entregam de forma nativa.
Linha do tempo
Databricks lança Agent Bricks e Apache Airflow libera Common AI Provider com suporte nativo a LLMs
Managed Service for Apache Airflow adiciona servidor MCP e agentes de troubleshooting
Mistral disponibiliza Search Toolkit para pipelines de IA em produção
Hugging Face lança CLI otimizada para agentes acessarem o Hub
Plugin do Obsidian integra DuckDB e MotherDuck para execução SQL em notas
MotherDuck lança Flights: pipeline nativo para agentes de IA com execução segura no DuckDB
Perguntas frequentes
O Flights substitui o Apache Airflow?
Não. Ele complementa. O Flights lida com pipelines leves, centrados em dados e IA, executados dentro do DuckDB. O Airflow continua essencial para workflows complexos, dependências cruzadas, integração com sistemas legados e SLAs rigorosos. O Flights é para quando você quer rodar um pipeline de enriquecimento com LLM em menos de 2 segundos, não orquestrar 50 tarefas distribuídas.
Posso usar o Flights com meu dbt já existente?
Sim. O Flights aceita chamadas SQL nativas, então você pode invocá-lo de dentro de um modelo dbt usando SELECT flights.run('nome_pipeline'). Também suporta exportação para tabelas dbt via Parquet em storage, mantendo a camada de modelagem separada da camada de execução.
Quais são as limitações da prévia pública?
Dados regulamentados ou sensíveis não devem ser processados. O runtime Python tem restrições de memória e tempo de execução (timeout padrão de 5 minutos). Não há suporte a escalonamento horizontal ainda, cada Flight roda em uma instância Pulse isolada. O versionamento Git está limitado a repositórios GitHub públicos na prévia.
Como o Flights se compara ao Mistral Search Toolkit?
O Search Toolkit (02/06) é um framework open-source focado em retrieval, ingestão e avaliação de dados para RAG. O Flights é uma camada de execução nativa dentro de uma plataforma de dados, voltada para transformação, orquestração e integração com LLMs em produção. Um é biblioteca, o outro é runtime gerenciado, e ambos podem se conectar via APIs externas ou exportação de Parquet.
Links relacionados
Fontes
- motherduck.comfonte original
- Categoria
- CEVIU Dados
- Publicado
- 15 de junho de 2026
- Editoria
- CEVIU Dados
