GPT-6 em foco: OpenAI prepara sucessor do GPT-5.6 com memória de longo prazo, agentes autônomos e arquitetura MoE de dezenas de trilhões de parâmetros
Aprofundamento CEVIU
Aprofundamento
A OpenAI está, aos poucos, liberando o acesso a seus novos modelos da série GPT-5.6, divididos em Sol, Terra e Luna. Essa nova geração surge dois meses após o GPT-5.5, mas a distribuição ao público geral não será tão direta quanto em atualizações passadas de ChatGPT e Codex. O lançamento está sendo feito em etapas, começando com um grupo restrito de parceiros e organizações de confiança, uma decisão influenciada por questões de segurança e a pedido do governo dos Estados Unidos. A empresa busca, com isso, aprimorar as salvaguardas em áreas como cibersegurança, biologia e codificação, especialmente com o modelo Sol, que introduz modos de raciocínio 'max' e 'ultra' com uso de subagentes para trabalhos complexos.
A precificação dos modelos GPT-5.6 segue um modelo de tokens por 1 milhão de unidades. O Sol, modelo principal, custa US$ 5 (entrada) e US$ 30 (saída). Já o Terra, voltado para uso geral, sai por US$ 2,50 (entrada) e US$ 15 (saída). Para tarefas mais simples e rápidas, o Luna tem o custo de US$ 1 (entrada) e US$ 6 (saída). A nova geração também traz melhorias no cache de prompts, com tempos de vida mínimos de 30 minutos e cobrança de escrita de cache a 1.25x a taxa de entrada não cacheada, enquanto as leituras continuam com desconto de 90%.
O que mudou
A principal mudança introduzida com o GPT-5.6 é a divisão em três modelos distintos (Sol, Terra, Luna), cada um com faixas de preço e capacidades específicas, oferecendo aos usuários mais opções de custo-benefício. Além disso, o GPT-5.6 Sol apresenta modos de raciocínio 'max' e 'ultra', este último utilizando subagentes para otimizar tarefas complexas, um avanço em relação às capacidades de agente único. A precificação também foi ajustada, com modelos mais caros e rápidos para tarefas específicas e um modelo mais acessível para uso geral. A implementação de um cache de prompt mais robusto e com novas regras de cobrança é outro ponto de evolução.
Por que isso importa
O lançamento fragmentado do GPT-5.6, com foco inicial em segurança e sob supervisão governamental, demonstra a crescente preocupação regulatória e de segurança na área de IA. A diferenciação dos modelos por preço e performance (Sol, Terra, Luna) sugere uma estratégia da OpenAI para atender a um espectro mais amplo de usuários e aplicações, desde tarefas de alta complexidade até uso mais econômico. A introdução de modos de raciocínio avançados e a menção a aprimoramentos em cibersegurança indicam um movimento em direção a IAs mais especializadas e com maior controle de segurança, algo que impactará diretamente como desenvolvedores e empresas integrarão essas tecnologias em seus produtos e serviços. A política de preços e o novo sistema de cache também são fatores importantes para a adoção em larga escala.
Linha do tempo
Lançamento do GPT-5.5 ('Spud') com recursos de memória de longo prazo.
Anúncio e início do preview limitado dos modelos GPT-5.6 (Sol, Terra, Luna).
OpenAI prepara GPT-6 com foco em memória de longo prazo e arquitetura MoE.
Perguntas frequentes
Quais são os três modelos da série GPT-5.6 e suas diferenças?
A série GPT-5.6 é composta por Sol, Terra e Luna. Sol é o modelo principal, focado em raciocínio avançado e segurança robusta. Terra é um modelo equilibrado para trabalhos gerais do dia a dia, enquanto Luna é a opção mais rápida e acessível para tarefas simples.
Por que o lançamento do GPT-5.6 é limitado e atrasado?
O lançamento está sendo feito em etapas restritas a parceiros de confiança por motivos de segurança e a pedido do governo dos Estados Unidos. Isso permite à OpenAI refinar as salvaguardas, especialmente em áreas como cibersegurança, antes da disponibilização geral.
Como funciona a precificação e o cache no GPT-5.6?
Os modelos GPT-5.6 são cobrados por 1 milhão de tokens, com preços variando entre Sol (US$ 5/30), Terra (US$ 2,50/15) e Luna (US$ 1/6). Há um novo sistema de cache de prompts com tempo de vida mínimo de 30 minutos e cobranças específicas para escritas e leituras em cache.
O que são os modos 'max' e 'ultra' no GPT-5.6 Sol?
O modo 'max' concede mais tempo para o modelo Sol raciocinar profundamente. Já o modo 'ultra' aprimora o trabalho com múltiplos agentes (subagentes) para acelerar a resolução de tarefas complexas, superando as capacidades de um único agente.
Fontes
- 9to5mac.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 29 de junho de 2026
- Editoria
- CEVIU IA

