Introdução ao Open Knowledge Format
Aprofundamento CEVIU
Aprofundamento
O Open Knowledge Format (OKF) não é um novo repositório de dados nem uma plataforma de conhecimento, é uma especificação de *forma*, não de função. Ele codifica, em Markdown + YAML, o que já acontece de forma espontânea nas equipes de IA: wikis manuais em Obsidian, arquivos AGENTS.md em repositórios, ou log.md gerados por LLMs que atualizam documentação sozinhos. A novidade está na padronização dessas práticas informais, e na decisão estratégica do Google Cloud de não construir mais um serviço fechado, mas sim um contrato técnico que qualquer agente, ferramenta ou humano possa ler sem SDK, sem API e sem conta.
A inspiração direta vem do gist de Andrej Karpathy, publicado em abril de 2026, que viralizou com 17 milhões de visualizações. Mas Karpathy propôs um padrão *conceitual*; o OKF v0.1 entrega a primeira versão *executável* desse conceito, com regras explícitas para cross-linking, conformance mínima e nomes reservados como index.md e log.md. O formato não impõe ontologia: você define o que é type: metric ou type: runbook, mas todos concordam que type existe e é obrigatório. Isso é interoperabilidade por convenção, não por imposição.
Por que isso importa
Agentes de IA não falham por falta de poder de raciocínio, falham por falta de contexto coerente e acessível. Hoje, esse contexto vive em silos: catálogos de metadados proprietários, comentários em código, PDFs no SharePoint, e memória humana. O OKF transfere essa camada de conhecimento para o ciclo de vida do software: versionável no Git, auditável, editável por humanos e consumível por agentes, tudo no mesmo arquivo. Isso muda a economia do desenvolvimento de agentes: em vez de cada time gastar meses integrando um catálogo específico ao seu framework, agora pode usar o mesmo diretório de Markdown como fonte de verdade compartilhada.
O OKF também cria uma nova camada de infraestrutura de IA: a de *conhecimento estático*. Enquanto o Model Context Protocol (MCP) lida com conexões dinâmicas a ferramentas em tempo real, o OKF cuida da base curada, durável e estruturada, como um sistema de arquivos para o raciocínio de agentes. E, diferentemente de formatos anteriores como JSON-LD ou RDF, ele prioriza legibilidade humana sem sacrificar máquina-legibilidade.
Linha do tempo
Andrej Karpathy publica o gist 'LLM Wiki', definindo o padrão conceitual que inspirou o OKF
Google Cloud lança oficialmente a especificação OKF v0.1
Divulgação pública do Open Knowledge Format como padrão aberto para conhecimento em IA
Perguntas frequentes
OKF é só mais um formato de documentação, ou ele realmente muda como agentes operam?
Muda. Agentes deixam de depender de buscas repetidas em documentos não estruturados. Com OKF, eles consultam um grafo de conceitos interligados via links Markdown, igual a navegar um site, mas com semântica explícita. Um agente pode descobrir sozinho que 'weekly active users' depende de 'event_stream' e 'user_session_timeout', porque esses conceitos estão ligados por links e têm metadados compatíveis.
Preciso migrar toda minha documentação para OKF de uma vez?
Não. OKF é incremental. Você pode começar com um único conceito, por exemplo, um arquivo datasets/sales_events.md com frontmatter YAML e links para metrics/weekly_active_users.md. Não exige mudança de stack, nem integração com nuvem. É um diretório que funciona localmente, no GitHub ou em qualquer filesystem.
O que impede que o OKF vire mais um padrão abandonado, como o Schema.org para IA?
Dois fatores: primeiro, sua simplicidade extrema, só Markdown, arquivos e YAML, reduz drasticamente a barreira de entrada. Segundo, o suporte prático imediato: o Google já integrou o OKF ao BigQuery e ao Knowledge Catalog, e há plugins em desenvolvimento para WordPress e ferramentas de data lineage. Não é teoria; já está rodando em produção.
Como o OKF se relaciona com RAG e retrieval augmentation?
OKF não substitui RAG, ele o aprimora. Em vez de recuperar trechos aleatórios de PDFs, um sistema RAG pode buscar diretamente por conceitos OKF com tipo, tags e timestamp. Isso transforma a recuperação de 'texto próximo' em 'conceito relevante', aumentando precisão e reduzindo ruído. É RAG com identidade semântica.
Fontes
- cloud.google.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 15 de junho de 2026
- Editoria
- CEVIU IA
