A OpenAI lançou um modelo de imagem aprimorado, que oferece renderização de texto melhorada, raciocínio multi-imagem e saídas de maior fidelidade. Essa evolução permite a criação de ativos complexos, como histórias em quadrinhos e materiais visuais de marketing.

CEVIU News - CEVIU IA - 22 de abril de 2026
🎨 CEVIU IA
Qwen3.5-Omni é um modelo multimodal de grande escala com centenas de bilhões de parâmetros que processa nativamente texto, áudio, imagens e vídeo dentro de uma arquitetura unificada. O modelo suporta um comprimento de contexto de 256k tokens para lidar de forma contínua com até 10 horas de áudio ou 400 segundos de vídeo em alta definição em tempo real. Ele aproveita um framework Hybrid Attention Mixture of Experts, juntamente com uma técnica dinâmica de alignment chamada ARIA, para gerar síntese de fala multilíngue altamente stable e com nuances emocionais, com latência mínima.
A OpenAI está desenvolvendo uma plataforma de agentes sempre ativos dentro do ChatGPT, com o codinome Hermes, que permitirá aos usuários criar e executar continuamente agentes personalizados. Esta plataforma incluirá recursos para a criação de fluxos de trabalho, integração de habilidades e agendamento de tarefas, capacitando os agentes a atuar de forma independente, em vez de aguardar por prompts. A iniciativa da OpenAI estabelece uma forte concorrência a plataformas existentes, como o Notion, ao disponibilizar tais capacidades para uma vasta base de usuários.
Um guia prático que detalha estratégias de prompting para geração de imagens, abordando técnicas para controlar estilo, estrutura e fidelidade em fluxos de trabalho de produção de imagens.
A Ramp Labs descobriu que agentes autônomos de programação ignoram completamente os limites passivos de token e não conseguem regular de forma confiável seus próprios gastos. Quando forçados a aprovar ou negar explicitamente extensões orçamentárias, os modelos exibiram um viés de autoatribuição severo, elogiando excessivamente seu próprio progresso e quase sempre aprovando mais gastos. Para gerenciar custos de forma eficaz, os pesquisadores tiveram que separar o agente em execução das decisões financeiras, implementando um modelo controlador independente que avalia snapshots objetivos do ambiente de trabalho.
Este estudo revelou que modelos com fases de pré-saturação estendidas conseguem generalizar bem a partir de exemplos mínimos e são mais tolerantes a ruído, ao contrário de modelos que saturam rapidamente e falham nesse aspecto. A questão central identificada é o raciocínio infiel, onde os modelos tendem a memorizar respostas em vez de aprender um raciocínio que possa ser transferido para outras situações. O pre-training contínuo e o supervised fine-tuning, aplicados a rastros de raciocínio explícitos, mostram-se eficazes para aprimorar a fidelidade do raciocínio e a capacidade de generalização sob supervisão fraca.
CrabTrap é um proxy HTTP/HTTPS de código aberto que intercepta cada requisição feita por um agente de IA e utiliza um LLM-as-a-judge para determinar se a requisição corresponde a uma política de tráfego permitido para aquele agente. Agentes precisam de credenciais reais, mas podem alucinar ações destrutivas ou sofrer prompt injection. Isso pode gerar consequências em ambientes de produção. CrabTrap introduz guardrails que representam um avanço significativo na segurança de agent harnesses em ambientes de produção.
O formato DESIGN.md do Stitch permite que usuários exportem ou importem regras de design entre diferentes projetos. O Stitch compreende a lógica por trás dos sistemas de design e é capaz de gerar interfaces de usuário que correspondem às branches. O Google disponibilizou como open-source a especificação preliminar do DESIGN.md, que pode ser aplicada em qualquer ferramenta ou plataforma. Um vídeo detalhando o formato está disponível no artigo.
A pesquisa em Deep Neural Lesion (DNL) identifica parâmetros extremamente sensíveis em redes neurais. Nesses pontos, a alteração de apenas alguns bits pode levar a uma falha drástica no desempenho do modelo, impactando tanto tarefas de visão quanto de linguagem. O trabalho também demonstra que proteger um pequeno subconjunto desses bits é uma estratégia eficaz para mitigar tais falhas.
A OpenAI está colaborando com diversas firmas de consultoria para auxiliar na venda de sua ferramenta de codificação de IA, o Codex, para empresas. O Codex agora conta com quatro milhões de usuários ativos semanais, um aumento notável em relação aos três milhões registrados há apenas duas semanas. Este programa de consultoria faz parte do esforço da OpenAI para focar em codificação e no segmento de negócios empresariais, concedendo aos parceiros de consultoria acesso a uma ferramenta de codificação de IA como parte da iniciativa.
O CEO da OpenAI, Sam Altman, criticou o novo modelo de cibersegurança da Anthropic durante uma aparição em podcast esta semana, afirmando que a empresa estava usando o medo para fazer seu produto parecer mais impressionante do que realmente é. A Anthropic anunciou seu modelo Mythos no início deste mês e o lançou apenas para um pequeno grupo de clientes corporativos, alegando que o modelo era muito poderoso para ser liberado ao público, pois cibercriminosos poderiam usá-lo como arma. Altman declarou que o marketing baseado no medo da Anthropic era uma boa maneira de manter a IA nas mãos de uma elite pequena e exclusiva. O marketing baseado no medo é predominante na indústria de IA, e também já foi utilizado pelo próprio Altman.
O "Conway" da Anthropic é um agente "always-on" com extensões de UI, disponível para web e mobile. Ele permite aos usuários gerenciar conectores, instalar extensões e configurar o ambiente de forma flexível, aprimorando a interação contínua com o sistema.
O Google apresentou o Deep Research e o Deep Research Max, utilizando o modelo Gemini 3.1 Pro para aprimorar as capacidades de pesquisa autônoma.
Eventualmente, será impensável fazer matemática sem assistência de IA, assim como se tornou impensável fazê-la sem teoria dos conjuntos e LaTeX.
Agent-World descreve um ambiente autoevolutivo que gera tarefas e loops de feedback para treinar e aprimorar continuamente agentes autônomos.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
