CEVIU Logo
Voltar

MotherDuck lança Flights: pipeline nativo para agentes de IA com execução segura no DuckDB

Aprofundamento CEVIU

Aprofundamento

O Flights não é só mais um orquestrador: é uma camada de execução nativa para agentes de IA que roda dentro do DuckDB, aproveitando sua arquitetura in-process e zero-copy. Ele transforma o banco de dados em um ambiente de pipeline, com runtime Python seguro, suporte a dlt para ingestão incremental, logging estruturado e versionamento de pipelines via Git integrado. O diferencial está no MCP (MotherDuck Control Plane): um servidor compatível com agentes como Claude e ChatGPT que entende instruções em linguagem natural e as converte em operações SQL seguras, como SELECT flights.create(...) ou SELECT flights.run('pipeline_x'). Isso elimina a necessidade de wrappers externos, APIs REST ou infra de orquestração separada.

O runtime do Flights também permite chamar LLMs diretamente em transformações (ex: enriquecer dados de clientes com classificação de sentimento via API), exportar resultados para S3/GCS em Parquet com compressão ZSTD, e fazer Reverse ETL para ferramentas de CRM ou marketing. Tudo isso sem sair da sessão SQL, nem mesmo o dbt precisa rodar fora. A segurança é feita por injeção controlada de segredos e sandboxing do Python, mas a MotherDuck alerta: dados regulamentados ainda não devem entrar na prévia pública.

O que mudou

Antes, agentes precisavam de pontes frágeis: CLI da Hugging Face para acessar modelos, Airflow + Common AI Provider para tarefas LLM, ou Agent Bricks para governança corporativa. Agora, o Flights traz execução nativa, não apenas acionamento. Enquanto o Airflow 3.1 (11/05) trouxe agentes de troubleshooting e o MCP foi introduzido como recurso de orquestração, o Flights entrega o MCP como *runtime de dados*, com DuckDB como motor, não como destino. Também evolui o conceito do plugin Obsidian (08/06): lá, o agente lia e executava SQL localmente; agora, ele cria, versiona e opera pipelines inteiros na nuvem, com audit trail completo e controle de custo por Pulse.

Por que isso importa

Time-to-production de pipelines orientados por IA cai de dias para minutos. Time de dados não precisa mais escolher entre DuckDB (velocidade) e Airflow (orquestração), o Flights une os dois, mantendo a simplicidade de uma única query SQL. Para engenheiros de ML, isso significa pré-processamento em tempo real com acesso direto a modelos via Python, sem copiar dados para Spark ou Dask. Para analistas, é possível disparar um pipeline de atualização de dashboard com SELECT flights.run('sales_daily') direto no BI. E para empresas sob LGPD ou HIPAA, o versionamento Git + logging estruturado + auditoria por SQL oferece rastreabilidade que orquestradores genéricos não entregam de forma nativa.

Linha do tempo

  1. Databricks lança Agent Bricks e Apache Airflow libera Common AI Provider com suporte nativo a LLMs

  2. Managed Service for Apache Airflow adiciona servidor MCP e agentes de troubleshooting

  3. Mistral disponibiliza Search Toolkit para pipelines de IA em produção

  4. Hugging Face lança CLI otimizada para agentes acessarem o Hub

  5. Plugin do Obsidian integra DuckDB e MotherDuck para execução SQL em notas

  6. MotherDuck lança Flights: pipeline nativo para agentes de IA com execução segura no DuckDB

Perguntas frequentes

O Flights substitui o Apache Airflow?

Não. Ele complementa. O Flights lida com pipelines leves, centrados em dados e IA, executados dentro do DuckDB. O Airflow continua essencial para workflows complexos, dependências cruzadas, integração com sistemas legados e SLAs rigorosos. O Flights é para quando você quer rodar um pipeline de enriquecimento com LLM em menos de 2 segundos, não orquestrar 50 tarefas distribuídas.

Posso usar o Flights com meu dbt já existente?

Sim. O Flights aceita chamadas SQL nativas, então você pode invocá-lo de dentro de um modelo dbt usando SELECT flights.run('nome_pipeline'). Também suporta exportação para tabelas dbt via Parquet em storage, mantendo a camada de modelagem separada da camada de execução.

Quais são as limitações da prévia pública?

Dados regulamentados ou sensíveis não devem ser processados. O runtime Python tem restrições de memória e tempo de execução (timeout padrão de 5 minutos). Não há suporte a escalonamento horizontal ainda, cada Flight roda em uma instância Pulse isolada. O versionamento Git está limitado a repositórios GitHub públicos na prévia.

Como o Flights se compara ao Mistral Search Toolkit?

O Search Toolkit (02/06) é um framework open-source focado em retrieval, ingestão e avaliação de dados para RAG. O Flights é uma camada de execução nativa dentro de uma plataforma de dados, voltada para transformação, orquestração e integração com LLMs em produção. Um é biblioteca, o outro é runtime gerenciado, e ambos podem se conectar via APIs externas ou exportação de Parquet.

Fontes

Avalie este artigo:
Compartilhar:
Categoria
CEVIU Dados
Publicado
15 de junho de 2026
Editoria
CEVIU Dados

Quer receber mais sobre CEVIU Dados?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser