O Oráculo e a Firma: Abordagens de Contexto

15 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

A OpenAI não está apenas compactando contexto: ela está transformando a janela de 200 mil tokens do GPT-5.5-Codex em uma memória dinâmica com vida própria. Desde janeiro de 2026, a compactação nativa no lado do servidor permite que o modelo reescreva sua própria história em tempo real, removendo chamadas de ferramentas redundantes, resumindo trajetórias e mantendo apenas os detalhes que afetam decisões futuras. Isso explica por que o Codex lembra pequenos fatos aparentemente irrelevantes: ele não esquece, só descarta o ruído. Já a Anthropic não segmenta por economia, mas por especialização. O Claude Opus 4.8 (lançado em 28/05/2026) usa janelas de 1 milhão de tokens não como um espaço único, mas como um parque industrial onde cada agente (Haiku para resumo rápido, Sonnet para análise profunda) opera em sua própria fábrica, com protocolos próprios de entrada e saída.

O 'dreaming' da Anthropic, ativado em maio de 2026, é o primeiro passo real para fechar a lacuna de 'esquecimento': agentes agora revisam sessões antigas fora do fluxo ativo e atualizam uma memória compartilhada via arquivos locais, uma solução prática para o problema teórico de perda de informação entre subagentes. Enquanto isso, a OpenAI testa modelos como o GPT-5.1-Codex-Max com múltiplas janelas coordenadas, sinalizando que sua abordagem de 'Oráculo' está evoluindo para incluir divisão de trabalho, sem abandonar a coerência central.

Por que isso importa

Essa divergência não é só técnica: define quem controla o custo, a velocidade e a confiabilidade das aplicações reais. Um sistema baseado em compaction (OpenAI) tem latência previsível e baixo risco de contradição, mas pode travar em tarefas que exigem paralelismo bruto, como varrer milhares de arquivos de código simultaneamente. Um sistema multiagente (Anthropic) escala melhor nesses cenários, mas exige engenharia de orquestração extra para evitar que dois agentes façam a mesma busca ou ignorem dados cruciais uns dos outros. Para desenvolvedores, a escolha hoje já impacta diretamente o design de pipelines: você constrói um workflow linear com checkpoints de memória (OpenAI) ou uma rede de serviços com contratos explícitos de entrada/saída (Anthropic).

Perguntas frequentes

Qual modelo tem maior janela de contexto hoje?

O Claude Opus 4.8 e o Claude Sonnet 4.5 oferecem 1 milhão de tokens para clientes selecionados. O GPT-5.5-Codex opera com até 200 mil tokens nativamente, mas usa compactação contínua para manter eficácia em tarefas longas, não é uma janela fixa, mas uma memória adaptativa.

Por que a abordagem multiagente da Anthropic pode gerar 'esquecimento'?

Cada subagente decide sozinho quais informações são relevantes para devolver ao agente principal. Se um agente de pesquisa considera um dado secundário, como a data de criação de um arquivo, irrelevante para a tarefa, ele simplesmente não o reporta. Esse dado some do contexto global, mesmo que tenha sido processado.

O que é 'dreaming' na arquitetura da Anthropic?

É um processo agendado que ocorre fora do fluxo ativo de conversa. Agentes revisam sessões anteriores, identificam padrões recorrentes e atualizam uma memória compartilhada armazenada localmente. Não é mágica: é uma camada explícita de persistência para compensar as limitações da comunicação entre agentes.

A compactação do lado do servidor da OpenAI é visível para o desenvolvedor?

Não. Ela acontece invisivelmente na API Responses. O cliente envia e recebe mensagens normais; a OpenAI lida com a redução de tokens, cache K/V e roteamento para GPUs ideais. Isso permite atualizações rápidas sem quebra de compatibilidade, mas também remove o controle fino sobre o que é preservado ou descartado.

Fontes

calv.infofonte original

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 15 de junho de 2026
Editoria: CEVIU IA