CEVIU Logo
Voltar

Linux Foundation lança OpenSharing para padronizar troca de dados e ativos de IA entre nuvens e plataformas

Aprofundamento CEVIU

Aprofundamento

O OpenSharing não é só uma nova camada de API: é a primeira tentativa séria de construir uma infraestrutura de mercado aberto para ativos de IA, com foco em governança e zero-copy. Ele herda a arquitetura REST baseada em credenciais temporárias do Delta Sharing, já usada por milhares de empresas desde 2021, mas agora estende o contrato de compartilhamento para três novos tipos: modelos de IA (em formatos ONNX, Safetensors, GGUF), habilidades de agentes (no padrão Agent Skills, lançado pela Anthropic em 2025) e dados não estruturados (via referência direta a objetos S3/GCS/NFS). Isso elimina a necessidade de exportar, converter ou hospedar cópias locais desses ativos.

A integração com Apache Iceberg/REST Catalogs é decisiva: ela permite que plataformas como Snowflake, BigQuery Omni e Dremio consumam ativos OpenSharing sem migrar para Delta Lake. Já o suporte a armazenamento on-premises (MinIO, Qumulo, Everpure) via plug-ins certificados significa que empresas reguladas podem publicar modelos ou dados sensíveis diretamente de seus data centers, mantendo controle total sobre localização e acesso, um avanço crítico para setores financeiro e de saúde.

O que mudou

Em 12 de junho, a Databricks anunciou o ecossistema SDS com OpenSharing como peça central, mas ainda como proposta interna, vinculada ao Lakebase e Unity Catalog. Em 15 de junho, a Linux Foundation lança o OpenSharing como projeto independente, com código aberto no GitHub, governança neutra e suporte explícito para Iceberg v3 (lançado em abril), File Federation (escalado pela Salesforce em 11 de junho) e Agent Skills (padrão adotado por Claude Code e GitHub Copilot). O que era uma iniciativa da Databricks virou um padrão multiplataforma com adoção imediata de LSEG, Stripe e Kythera Labs, e sem dependência de SDK proprietário.

Por que isso importa

Empresas não estão mais trocando apenas tabelas. Estão negociando modelos treinados em dados específicos, habilidades especializadas de agentes e conjuntos de dados não estruturados com contexto de negócios embutido. Sem um protocolo como o OpenSharing, isso exige marketplaces fechados, APIs customizadas e pipelines de movimentação de dados que quebram lineage, aumentam custo e violam políticas de governança. Com ele, um time de risco pode consumir um modelo de detecção de fraude da área de compliance diretamente do seu Iceberg catalog, com auditoria automática via Unity Catalog, sem copiar um byte sequer, e com pagamento processado via APP (Protocolo de Pagamentos para Agentes), anunciado pela OKX em abril.

Linha do tempo

  1. Lançamento do Apache Iceberg v3 com Row Lineage e Deletion Vectors, preparando o terreno para ativos de IA com lineage completo

  2. Databricks lança Agent Bricks, integrando modelos, contexto de negócios e governança para agentes de IA

  3. OKX publica o Protocolo de Pagamentos para Agentes (APP), estabelecendo padrão para comércio entre agentes

  4. Salesforce escala File Federation para 120 trilhões de linhas, validando arquitetura zero-copy para IA em dados distribuídos

  5. Databricks anuncia o ecossistema SDS com OpenSharing como componente central, ainda sob governança interna

  6. Linux Foundation lança oficialmente o OpenSharing como projeto aberto, com suporte a modelos, skills de agentes e Iceberg/REST Catalogs

Perguntas frequentes

OpenSharing substitui o Delta Sharing?

Não. É uma evolução compatível. Todos os sistemas que consomem Delta Sharing continuam funcionando. O OpenSharing adiciona novos tipos de ativo (modelos, skills, dados não estruturados) e novos clientes (Iceberg/REST Catalogs, storage on-prem), mantendo a mesma camada de autorização e descoberta.

Como funciona o 'zero-copy' com modelos de IA?

O OpenSharing não transfere o modelo inteiro. Ele publica um manifesto assinado com metadados, checksum, localização física (ex: s3://bucket/modelo.gguf) e política de acesso. O consumidor usa suas próprias credenciais para acessar diretamente o objeto, sem proxy, sem cópia intermediária, sem conversão.

Quais plataformas já suportam OpenSharing hoje?

A Databricks oferece suporte nativo via Unity Catalog e Agent Bricks. Snowflake, BigQuery Omni e Dremio já têm conectores oficiais. MinIO, Qumulo e Everpure fornecem plug-ins de storage certificados. Plataformas de agentes como Claude Code e GitHub Copilot já reconhecem o formato Agent Skills publicado via OpenSharing.

O que muda para equipes de governança de dados?

Elas ganham um único ponto de controle para publicação, descoberta e revogação de acesso a qualquer ativo, seja uma tabela, um modelo ou uma skill de agente. O lineage é preservado porque o OpenSharing não quebra a cadeia de origem: o consumo aparece como leitura direta no storage, não como ingestão em novo repositório.

Fontes

Avalie este artigo:
Compartilhar:
Categoria
CEVIU Dados
Publicado
15 de junho de 2026
Editoria
CEVIU Dados

Quer receber mais sobre CEVIU Dados?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser