CEVIU Logo
CEVIU News

CEVIU News - CEVIU IA - 25 de junho de 2026

13 notícias25 de junho de 2026CEVIU IA
Compartilhar:

🌶️ CEVIU IA

OpenAI e Broadcom apresentaram Jalapeño, o primeiro acelerador de uma família planejada de chips de inferência para LLMs, otimizada para desempenho por watt e implantação rápida. As empresas disseram que o processador foi projetado em nove meses com desenvolvimento assistido por IA e que a intenção é usá-lo em implantações de data centers na escala de gigawatts.

O Google lançou recursos nativos de computer use para o Gemini 3.5 Flash, permitindo que o modelo leve interaja diretamente com interfaces de desktop digitais. O sistema processa capturas de tela contínuas para executar ações de clique, rolagem e digitação de forma fluida em diferentes ambientes de software.

A Bloomberg informou que os pesquisadores Jonas Adler e Alexander Pritzel deixaram o Google para ir para a Anthropic, dando sequência a uma onda de saídas de talentos de alto perfil em IA. O movimento vem depois das recentes saídas de Noam Shazeer e do diretor da DeepMind John Jumper, em meio à competição crescente entre as principais empresas de IA.

A Amazon está processando a Perplexity por violar as Conditions of Use da Amazon Store, porque o navegador Comet da Perplexity contorna a exigência de se identificar claramente como um agent e, em vez disso, se identifica como Chrome. A ideia de que o client da Perplexity precise se comportar de uma determinada maneira vai contra os princípios básicos da Web aberta, que giram em torno do controle do usuário. Foi justamente essa maior autonomia do usuário na Web aberta que sempre a distinguiu de apps baixáveis. Os sites historicamente tentaram todo tipo de medida técnica para impedir que os usuários consumissem seu conteúdo nos próprios termos, mas, no fim, o site é renderizado no client; assim, em grande parte, os usuários têm a capacidade de baixar um client que renderize o site da forma que preferirem. A navegação agentic é apenas mais um recurso do browser que permite aos usuários interagir com a Web nos próprios termos.

O GLM-5.2 parecia uma atualização incremental, mas a pequena mudança nos benchmarks e no treinamento abriu espaço para uma gama mais ampla de novos casos de uso. Ele se encaixa bem em coding harnesses como um agente geral, e muitas pessoas da comunidade de IA elogiaram o modelo após testá-lo pessoalmente.

A NVIDIA lançou o NeMo AutoModel no Hugging Face para otimizar os pipelines de fine-tuning de arquiteturas Mixture-of-Experts (MoE) em grande escala, como Qwen3 e DeepSeek V3. O framework traz Expert Parallelism e kernels de comunicação DeepEP fused para distribuir dinamicamente os pesos especializados dos experts entre clusters de GPU. Nos benchmarks, a NVIDIA diz ter obtido até 3,7x mais throughput de treinamento e uma redução de 32% no uso máximo de memória de GPU em comparação com as bibliotecas nativas do Transformers v5.

A Amazon tem uma vantagem de incumbente na corrida dos hyperscalers para garantir mais eletricidade, depois de ter construído uma grande quantidade de data centers ao longo das últimas duas décadas. A empresa deve adicionar a maior capacidade de data centers e de energia nos EUA até 2030. Ainda assim, o Google deve ter reduzido bastante essa distância até lá.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser