A nova funcionalidade Scratchpad da OpenAI para o Codex permite aos usuários acionar múltiplas tarefas do Codex em paralelo a partir de uma nova UI. A empresa está caminhando para consolidar sua linha de produtos em um único aplicativo unificado, construído sobre o Codex. Funcionários da OpenAI publicaram emojis de Snowflake nas redes sociais, possivelmente indicando que a OpenAI está desenvolvendo suporte para agentes gerenciados, processos autônomos que podem ser executados em segundo plano, verificar periodicamente e executar fluxos de trabalho de várias etapas sem intervenção do usuário. Além disso, funcionários da OpenAI têm postado emojis de floco de neve em mídias importantes, possivelmente indicando o lançamento de um modelo com codinome Glacier, que se acredita ser o GPT-5.5.

CEVIU News - CEVIU IA - 13 de abril de 2026
📝 CEVIU IA
Padrões de coordenação padronizados, como Generator-Verifier e Orchestrator-Subagent, resolvem problemas específicos de confiabilidade ao separar a execução de tarefas do controle de qualidade. Arquiteturas event-driven utilizam modelos Message Bus ou Shared State para gerenciar pipelines assíncronos e o gerenciamento colaborativo de estado em grandes frotas de agentes. Iniciar com um encadeamento mínimo evita complexidade desnecessária e reduz a latency em sistemas de produção.
A Anthropic está planejando uma reformulação completa da experiência de desktop do Claude Code. Além disso, a empresa está desenvolvendo um 'Coordinator Mode' que permitirá ao Claude atuar como um orquestrador, delegando tarefas de implementação a sub-agentes paralelos (agent Teams), enquanto se foca no planejamento e na síntese. Embora o Claude Code já suporte sub-agentes e equipes experimentais de agentes na CLI, este novo modo integrará essa capacidade ao aplicativo de desktop com uma interface mais estruturada.
A xAI está desenvolvendo um modelo de precificação baseado em créditos para o Grok Build, sua futura plataforma de codificação, que contará com interfaces locais CLI e web remotas. A inclusão do Model Arena, que emprega múltiplos agentes para comparação de tarefas, o diferencia das abordagens padrão de modelo único. O sistema de créditos ainda está em desenvolvimento, podendo atrasar o lançamento comercial completo, mas se alinha às tendências da indústria observadas em produtos como o Codex da OpenAI e o Claude Code da Anthropic.
Agentes únicos, eventualmente, enfrentam o desafio de se tornarem menos focados e confiáveis conforme operam por mais tempo e adquirem mais contexto. A maioria dos projetos reais é muito ampla e complexa para ser contida em uma única janela de contexto. Missions é um sistema que decompõe grandes trabalhos em unidades focadas, que são gerenciadas por agentes dedicados com objetivos de escopo restrito, estado compartilhado e validação explícita. Esta publicação explica a arquitetura por trás de Missions, detalhando como o contexto do agente molda cada decisão de design. Também aborda como a separação de responsabilidades e o desenvolvimento orientado a testes em dois níveis produzem trabalho autônomo e confiável que pode durar vários dias, e como o sistema opera na prática.
Os preços dos Doritos aumentaram quase 50% entre 2021 e o início de 2026, com alguns pacotes ultrapassando os $7, um valor considerável para um alimento processado. O Walmart solicitou à PepsiCo que reduzisse os preços, mas a PepsiCo tentou de tudo, menos isso. A estratégia não funcionou, e a receita tornou-se negativa pela primeira vez em mais de uma década. Consumidores e empresas estão avaliando as assinaturas de IA como se fossem um pacote de salgadinhos de $7, e muitos estão optando por não adquiri-las.
A Anthropic não liberará seu modelo mais novo e capaz, Claude Mythos, ao público até que seu software mais crítico esteja em um estado muito mais robusto. A empresa declara que as capacidades cibernéticas do modelo são perigosas demais para serem amplamente disponibilizadas. Por essa razão, ele foi liberado apenas para parceiros-chave de cibersegurança, que o utilizarão para corrigir o maior número possível de vulnerabilidades. Este movimento indica a entrada em uma nova era.
As empresas agora observam agentes superando o número de humanos em proporções de até 100:1. Essa mudança está forçando as empresas de SaaS e Teams a redesenhar seus produtos em torno de APIs, CLIs e saídas estruturadas, substituindo as interfaces gráficas (GUIs) tradicionais. Equipes líderes estão codificando expertise de domínio em "skill files" e expondo a funcionalidade completa via servidores MCP e ferramentas CLI, permitindo que agentes operem os produtos de forma programática. Ao combinar a orquestração de workflow com modelos verticais seletivos e roteamento multi-modelo, as empresas conseguem reduzir custos em até 80%, ao mesmo tempo em que melhoram a latência e o desempenho das tarefas.
Sistemas multiagentes são frequentemente ineficientes em termos de tokens. Muito raciocínio intermediário redundante pode surgir, especialmente à medida que a tarefa cresce, e isso faz com que o uso de tokens se Compound (acumule) rapidamente. Latent Briefing é uma abordagem para resolver esse problema que utiliza os attention patterns de um modelo para identificar quais partes do contexto são importantes e descarta o restante no nível de representação. Ele compartilha memória relevante entre os agentes, resultando em precisão aprimorada e economia de tokens.
Recursive-mode é um pacote de skills para desenvolvimento de software estruturado assistido por IA. Ele oferece aos agentes um workflow baseado em arquivos para requisitos, planejamento, implementação, testes, revisão, encerramento e memória. O recursive-mode resolve o problema de 'context rot' ao tornar documentos estáticos de repositório a fonte da verdade para cada fase. Os documentos são legíveis por humanos e máquinas, oferecendo ótima rastreabilidade.
Pesquisadores identificaram vulnerabilidades em routers de API de LLM, descobrindo que 1 router pago e 8 gratuitos injetavam código malicioso. Eles desenvolveram "Mine", um proxy que simula ataques, revelando riscos como injeção de payload e exfiltração de segredos.
Demis Hassabis, fundador da DeepMind e líder de IA no Google, é retratado em "The Infinity Machine" como uma figura reservada e com os pés no chão, em meio aos desafios éticos da IA e às rivalidades com líderes como Elon Musk e Sam Altman.
Alberto Romero compara a IA a uma lâmpada mágica, destacando que o desafio atual reside em definir o que realmente desejamos, em vez da execução em si. À medida que a IA assume cada vez mais o 'como', habilidades como julgamento, imaginação e agency tornam-se cruciais para decidir 'o quê' construir. Essa mudança ressalta a importância de designers, que se destacam em determinar resultados e abordar problemas, levando a soluções eficazes.
Um consórcio de modelos abertos, financiado por múltiplas empresas, é crucial para sustentar o desenvolvimento de IA de fronteira, dado que esforços individuais enfrentam desafios financeiros e estratégicos. O Nemotron da Nvidia e outros laboratórios estão testando tal colaboração, mas pressões econômicas frequentemente impulsionam as empresas para modelos fechados visando a rentabilidade. Os custos crescentes de desenvolvimento de frontier models levarão mais empresas a buscar recursos compartilhados e modelos abertos para garantir acesso e inovação futuros.
A ciência dos materiais é consideravelmente mais complexa em praticamente todas as dimensões. Mesmo que um modelo similar ao AlphaFold existisse para materiais, o pipeline do prompt ao produto seria muito mais complicado.
O Google planeja expandir a funcionalidade de Skills em sua linha de produtos de IA, incluindo Gemini e AI Studio, com o objetivo de padronizar os fluxos de trabalho de IA.
A CoreWeave utilizará sua infraestrutura de cloud para auxiliar na execução dos modelos de IA Claude da Anthropic, em uma implementação de infraestrutura faseada com potencial de expansão ao longo do tempo.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
