OpenAI e Broadcom apresentaram Jalapeño, o primeiro acelerador de uma família planejada de chips de inferência para LLMs, otimizada para desempenho por watt e implantação rápida. As empresas disseram que o processador foi projetado em nove meses com desenvolvimento assistido por IA e que a intenção é usá-lo em implantações de data centers na escala de gigawatts.

CEVIU News - CEVIU IA - 25 de junho de 2026
🌶️ CEVIU IA
Anthropic e Alibaba iniciaram um framework open-source colaborativo voltado a fazer distillation de inteligência de raciocínio avançada de frontier models para edge models hiper eficientes. A parceria combina as técnicas de safety-alignment da Anthropic com a grande infraestrutura de cloud da Alibaba para reduzir a pegada de compute sem uma perda severa de capacidade.
O Google lançou recursos nativos de computer use para o Gemini 3.5 Flash, permitindo que o modelo leve interaja diretamente com interfaces de desktop digitais. O sistema processa capturas de tela contínuas para executar ações de clique, rolagem e digitação de forma fluida em diferentes ambientes de software.
A Bloomberg informou que os pesquisadores Jonas Adler e Alexander Pritzel deixaram o Google para ir para a Anthropic, dando sequência a uma onda de saídas de talentos de alto perfil em IA. O movimento vem depois das recentes saídas de Noam Shazeer e do diretor da DeepMind John Jumper, em meio à competição crescente entre as principais empresas de IA.
A Amazon está processando a Perplexity por violar as Conditions of Use da Amazon Store, porque o navegador Comet da Perplexity contorna a exigência de se identificar claramente como um agent e, em vez disso, se identifica como Chrome. A ideia de que o client da Perplexity precise se comportar de uma determinada maneira vai contra os princípios básicos da Web aberta, que giram em torno do controle do usuário. Foi justamente essa maior autonomia do usuário na Web aberta que sempre a distinguiu de apps baixáveis. Os sites historicamente tentaram todo tipo de medida técnica para impedir que os usuários consumissem seu conteúdo nos próprios termos, mas, no fim, o site é renderizado no client; assim, em grande parte, os usuários têm a capacidade de baixar um client que renderize o site da forma que preferirem. A navegação agentic é apenas mais um recurso do browser que permite aos usuários interagir com a Web nos próprios termos.
O GLM-5.2 parecia uma atualização incremental, mas a pequena mudança nos benchmarks e no treinamento abriu espaço para uma gama mais ampla de novos casos de uso. Ele se encaixa bem em coding harnesses como um agente geral, e muitas pessoas da comunidade de IA elogiaram o modelo após testá-lo pessoalmente.
A NVIDIA lançou o NeMo AutoModel no Hugging Face para otimizar os pipelines de fine-tuning de arquiteturas Mixture-of-Experts (MoE) em grande escala, como Qwen3 e DeepSeek V3. O framework traz Expert Parallelism e kernels de comunicação DeepEP fused para distribuir dinamicamente os pesos especializados dos experts entre clusters de GPU. Nos benchmarks, a NVIDIA diz ter obtido até 3,7x mais throughput de treinamento e uma redução de 32% no uso máximo de memória de GPU em comparação com as bibliotecas nativas do Transformers v5.
O Google apresentou o FLAT, um método feedforward que decodifica triangle splats diretamente de latentes de video diffusion, com maior precisão geométrica do que abordagens baseadas em Gaussianas 3D.
A Amazon tem uma vantagem de incumbente na corrida dos hyperscalers para garantir mais eletricidade, depois de ter construído uma grande quantidade de data centers ao longo das últimas duas décadas. A empresa deve adicionar a maior capacidade de data centers e de energia nos EUA até 2030. Ainda assim, o Google deve ter reduzido bastante essa distância até lá.
O Claude Code v2.2.190 traz várias mudanças em strings que sugerem preparativos para o retorno do Fable 5.
A Mirendil levantou US$ 200 milhões em seed funding para criar e distribuir IA capaz de acelerar a pesquisa em IA para todos.
A OpenAI iniciou a liberação de uma versão aprimorada do GPT-5.5 Instant diretamente no ChatGPT, para as versões pagas e gratuitas.
A Perplexity lançou o Computer for Counsel, uma ferramenta de operações jurídicas orientada por IA para automatizar pesquisas administrativas, coleta de documentos e triagem de contratos.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
