Engram quer escalar compute sobre o seu contexto

24 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

A Engram é uma startup de IA que saiu do modo furtivo em 23 de junho de 2026 com US$ 98 milhões em financiamento liderado por General Catalyst, Kleiner Perkins e Sequoia Capital. Fundada por pesquisadores de Stanford, Berkeley e Cornell, a empresa desenvolve uma 'camada de memória aprendida' para IA empresarial, não um novo LLM genérico, mas um sistema que constrói, de forma privada e contínua, uma representação compacta e atualizável do contexto único de cada organização: documentos internos, chats, código-fonte, bases de conhecimento e workflows específicos.

Essa memória não é estática: ela evolui com o uso, permitindo que os modelos se tornem mais precisos e eficientes ao longo do tempo. Segundo a própria Engram, seus modelos conseguem igualar ou superar modelos de ponta (como GPT-4 Turbo ou Claude Opus) usando entre 1% e 10% dos tokens, o que traduz em redução de custos operacionais de até 10x a 100x. Já há parcerias ativas com Microsoft (testes no Microsoft 365 e compromisso de capacidade GPU em Azure), Notion e Harvey.

Por que isso importa

Escalabilidade em IA hoje é limitada por dois gargalos: custo de tokens e perda de contexto entre sessões. A Engram ataca os dois ao substituir a leitura repetida de dados por uma memória condicional treinada antecipadamente e mantida em tempo real. Isso muda o modelo econômico: em vez de pagar por processamento redundante, as empresas pagam por uma memória especializada que se torna mais valiosa com o uso. Não é apenas 'mais rápido', é uma mudança estrutural na forma como a IA incorpora conhecimento organizacional, sem depender de RAG ou fine-tuning constante.

O conceito também ganhou eco técnico com a arquitetura DeepSeek Engram, lançada em janeiro de 2026. Diferente da startup, é uma inovação de modelagem: separa explicitamente 'memória condicional' (tabelas de embeddings N-gram otimizadas para busca O(1)) da 'computação' (camadas Transformer). Modelos como o Engram-27B mostraram ganhos mensuráveis em raciocínio, codificação e matemática, não por escalar parâmetros, mas por redistribuir inteligentemente o orçamento de parâmetros entre memória e processamento.

Impacto para desenvolvedores

Para desenvolvedores, isso significa menos engenharia de prompt, menos pipelines RAG complexos e menos dependência de embeddings recalculars em cada requisição. A camada de memória da Engram funciona como uma extensão transparente do contexto, integrável via SDK, que reduz latência e aumenta a coerência em aplicações corporativas reais: assistentes técnicos, análise de contratos, suporte interno baseado em documentação viva. Não exige mudanças na stack atual, mas altera a forma como se pensa em 'contexto persistente'.

Já a arquitetura DeepSeek Engram impacta diretamente quem treina ou adapta modelos: oferece um novo eixo de otimização (memória condicional vs. número de experts) e evidências de que 20%, 25% do orçamento esparso deve ir para memória, informação prática para ajuste de hiperparâmetros em MoE. Não é só teoria: resultados em BBH, HumanEval e MATH são públicos e replicáveis no Hugging Face.

Perguntas frequentes

O que é a Engram e como ela difere de RAG?

A Engram não é uma técnica de recuperação (RAG), mas uma camada de memória aprendida que é treinada previamente sobre o contexto privado de uma organização, documentos, chats, código, e atualizada continuamente. Ao contrário do RAG, que recupera e reprocessa dados a cada chamada, a Engram internaliza esse conhecimento de forma compacta, reduzindo drasticamente o uso de tokens e a necessidade de recálculo.

Qual é a diferença entre a startup Engram e a arquitetura DeepSeek Engram?

A startup Engram é uma empresa que oferece uma solução de IA empresarial baseada em memória condicional privada. A arquitetura DeepSeek Engram é uma inovação técnica de modelagem de LLMs, publicada pela DeepSeek AI em janeiro de 2026, que separa memória e computação dentro do modelo. São projetos independentes, com objetivos convergentes: escalar eficiência usando contexto memorizado.

Engram já está disponível para uso em produção?

Sim. A Engram saiu do modo furtivo em 23 de junho de 2026 e já tem parcerias ativas com Microsoft, Notion e Harvey. Seus modelos estão sendo testados em ambientes reais, incluindo integração com o Microsoft 365. Não há informações públicas sobre disponibilidade aberta ou API pública geral, mas o produto está em fase de implantação comercial com clientes estratégicos.

O que é a 'lei de escala em forma de U' citada na arquitetura DeepSeek Engram?

É uma descoberta mecanicista da DeepSeek que mostra como o desempenho de modelos com memória Engram varia conforme a proporção de parâmetros alocados à memória condicional. Ela indica que há um ponto ótimo, entre 20% e 25% do orçamento esparso, onde o ganho em tarefas como raciocínio e codificação é maximizado. Abaixo ou acima disso, o retorno diminui.

Fontes

x.comfonte original

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 24 de junho de 2026
Editoria: CEVIU IA