Capturas de tela vazadas antecipam o aplicativo unificado Copilot que a Microsoft deve apresentar na conferência Build 2026. As imagens mostram uma aba do GitHub Copilot, uma aba Cowork e uma seção dedicada ao Scout — agente de IA sempre ativo. O objetivo é consolidar ferramentas dispersas em um único ambiente para aumentar a adoção. A integração com o Teams sugere que o Scout poderá rodar remotamente.

CEVIU News - CEVIU IA - 1 de junho de 2026
🤖 CEVIU IA
O MiniMax M3 é um modelo de pesos abertos que entrega performance de nível frontier em programação e operações agênticas. Suporta entradas de imagem e vídeo, opera desktops de forma autônoma e conta com uma nova arquitetura de atenção que permite janelas de contexto de até 1 milhão de tokens. Está disponível via MiniMax Code, Token Plan e API.
O NVIDIA MCG Toolkit chega para simplificar um dos processos mais negligenciados no ciclo de vida de modelos de IA: a documentação. A ferramenta automatiza a geração de model cards completos no formato Model Card++, reduzindo o tempo e esforço necessários para registrar informações técnicas, de desempenho e de uso responsável de cada modelo.
A Nvidia promete fazer da Computex 2026 seu maior evento do ano. A empresa deve revelar o chip N1X para notebooks — com 20 núcleos ARM e GPU equivalente à RTX 5070 — além da plataforma Vera Rubin para datacenters. O foco estará em Physical AI e Agentic AI, com avanços em robótica e máquinas autônomas. Gamers devem esperar pouco: os anúncios voltados para jogos devem ser escassos.
Apenas seis semanas após o lançamento do Claude Opus 4.7, a Anthropic trouxe o Opus 4.8 acompanhado de um denso system card de 244 páginas. As melhorias são incrementais, mas o documento oferece análises relevantes — especialmente porque o modelo ainda fica atrás do Mythos em capacidades. O post examina as diferenças entre as versões e o que esses dados indicam sobre o misterioso modelo Mythos.
No reinforcement learning com LLMs, garantir que o modelo opere exatamente sobre os tokens amostrados é essencial. A re-tokenização pode causar drift e instabilizar gradientes. A solução é simples, mas crítica: nunca re-codificar tokens decodificados — mantendo um buffer com os tokens originais amostrados para preservar a precisão no cálculo de perda.
A PrismML apresentou o Bonsai Image 4B, família de modelos compactos para geração de imagens com inferência de diffusion de alta qualidade em hardware local. A variante de 1-bit é ideal para cenários com restrições severas de memória e largura de banda, enquanto a versão ternária entrega melhor fidelidade visual aos prompts — ambas compactas o suficiente para rodar diretamente em um iPhone.
A xAI disponibilizou em beta público o modelo grok-build-0.1 via API, desenvolvido especificamente para tarefas de codificação agêntica, como desenvolvimento web e debugging. Com velocidade superior a 100 tokens por segundo, o modelo é precificado em US$ 1 por milhão de tokens de entrada e US$ 2 por saída, com integração nativa nas plataformas Grok Build, Cursor e OpenClaw.
Agentes de IA corporativos travam não por limitações dos modelos, mas por problemas de permissão. A Workday enfrenta isso usando seu sistema de registros como camada de governança, integrado ao Gemini do Google, priorizando precisão e garantindo que os agentes operem dentro das permissões definidas por usuário — essencial para setores regulados como RH e finanças.
Ido Pesok, da Cognition, compartilha aprendizados sobre testes end-to-end autônomos no Devin. Pela primeira vez, mais sessões são acionadas de forma assíncrona do que interativa — tornando a verificação pré-merge obrigatória, não mais um diferencial. O harness do Devin ganhou ferramentas de computer-use há cerca de seis meses, e o salto real veio quando engenheiros passaram a rodar de 10 a 20 instâncias em paralelo, cada uma com seu próprio servidor de desenvolvimento — algo inviável em um único laptop.
Ex-pesquisadores da DeepMind captam US$ 50 milhões para criar IA que prioriza perguntas científicas
A Inherent, laboratório de IA sediado em Londres fundado por ex-pesquisadores da DeepMind, levantou US$ 50 milhões em rodada seed para desenvolver o Faraday — uma plataforma de IA projetada para identificar quais questões científicas realmente valem a pena ser investigadas, ajudando pesquisadores a direcionar esforços com mais precisão e impacto.
A OpenAI está recrutando engenheiros especializados em hardware full-stack, operações, sistemas e ML para reforçar seu time de robótica. O movimento sinaliza a intenção da empresa de ampliar sua atuação na programação e fabricação de novos robôs.
O NotebookLM, ferramenta de IA do Google, está prestes a ganhar três recursos inéditos: Preferências Pessoais, Conectores e Canvas. As novidades prometem personalizar ainda mais a experiência do usuário, ampliar integrações com fontes externas e oferecer um novo espaço criativo para organização de ideias.
A OpenAI publicou, em 28 de maio, um guia abrangente para orientar a realização de avaliações independentes e confiáveis de modelos de IA de fronteira, como o GPT-5.5. O documento detalha boas práticas para que terceiros possam auditar esses sistemas com rigor e transparência.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
