A Cognition lançou o Devin Fusion, um sistema que combina diferentes modelos de inteligência artificial de ponta e alternativas mais econômicas. A abordagem reduziu os custos em 35% no benchmark FrontierCode, mantendo um nível de desempenho de primeira linha. O sistema utiliza uma arquitetura de agente duplo, composta por um agente principal e um assistente, que realiza o roteamento dinâmico de modelos para otimizar a execução de tarefas e evitar falhas de cache dispendiosas. A integração com o Fable 5 trouxe melhorias ainda mais expressivas em eficiência, alcançando uma redução de 41% nos custos de operação e indicando avanços promissores à medida que a tecnologia dos modelos continua evoluindo.

CEVIU News - CEVIU IA - 1 de julho de 2026
💻 CEVIU IA
O Google DeepMind anunciou a disponibilização de suas novas ferramentas para desenvolvedores, incentivando o início de projetos e integrações com os modelos Nano Banana 2 Lite e Gemini Omni Flash.
O Google UK divulgou seu mais recente Relatório de Impacto Econômico, destacando caminhos para permitir que mais pessoas aproveitem os benefícios das tecnologias baseadas em IA.
Uma análise sobre as razões pelas quais a especialização de modelos de IA se tornou um caminho inevitável para o desenvolvimento e a eficiência do setor.
Novos dados do OpenAI Signals mostram como a adoção do ChatGPT está crescendo globalmente, com os usuários aumentando a frequência de uso, explorando mais recursos e impulsionando o crescimento em diversas regiões e idiomas.
O ScarfBench surge como um novo benchmark projetado especificamente para avaliar o desempenho de agentes de IA na tarefa de migração de frameworks Java corporativos.
O DSpark é um sistema desenvolvido para acelerar as respostas de grandes modelos de linguagem sem alterar o conteúdo pretendido pelo modelo subjacente. Enquanto a maioria dos modelos de IA gera o texto em pequenos blocos sequenciais, o DSpark funciona como um batedor que avança alguns passos, prevê o caminho mais provável e permite que o modelo principal verifique rapidamente quais etapas são seguras. Quando as previsões são precisas, o modelo acelera o processo de geração. Por outro lado, se as suposições forem fracas, o DSpark busca evitar o desperdício de tempo na verificação dessas etapas.
O Hugging Face anunciou a integração dos resultados do projeto Every Eval Ever diretamente nas páginas de seus modelos, permitindo que a comunidade visualize testes e avaliações detalhadas de forma centralizada.
Os agentes de Vision IA estão se tornando uma alternativa prática para transformar dados de vídeo do mundo físico em inteligência operacional dentro de fábricas e outros ambientes industriais. Este artigo faz parte da série Into the Omniverse, focada em como desenvolvedores, profissionais de 3D e empresas podem transformar seus fluxos de trabalho utilizando os mais recentes avanços do OpenUSD e da plataforma NVIDIA Omniverse.
As ciências da vida entraram em uma era de escala computacional, e há mais de uma década a NVIDIA desenvolve uma stack completa de computação acelerada por GPU — que abrange hardware, frameworks, bibliotecas, modelos, microservices e ferramentas específicas do setor — para ajudar pesquisadores a executar fluxos de trabalho mais sofisticados e a iterar com maior rapidez. Recentemente, a Anthropic anunciou o Claude Science, um ambiente de trabalho de IA voltado para a ciência.
A IA está passando por uma transição de sistemas fechados e verticalmente integrados para um ecossistema modular, sustentado por interfaces padronizadas como a arquitetura Transformer e APIs de inference. Essa desagregação arquitetônica permite que modelos de pesos abertos concorram de forma eficaz com sistemas fechados, reduzindo custos significativamente enquanto acelera a inovação em toda a stack.
Geração de imagens personalizada com IA no Gemini agora é gratuita para usuários nos Estados Unidos
Todos os usuários qualificados nos Estados Unidos agora podem acessar gratuitamente o recurso de geração de imagens baseado no modelo Nano Banana diretamente no aplicativo Gemini. A funcionalidade consegue gerar imagens a partir da compreensão que a IA tem sobre os gostos e preferências de cada usuário, sem a necessidade de especificá-los no prompt. A inteligência pessoal é um recurso opcional, e os usuários podem decidir quais aplicativos o Gemini pode acessar. O Google planeja diversas atualizações para o aplicativo Gemini, incluindo um novo recurso de resumo diário, uma interface reformulada, acesso ao modelo de vídeo Gemini Omni e um agente de IA pessoal chamado Gemini Spark.
O Cursor para iOS, agora em beta público, permite que desenvolvedores gerenciem seus projetos de qualquer lugar utilizando agentes locais ou na nuvem. Pelo aplicativo móvel, é possível iniciar ou controlar agentes, acompanhar atualizações por meio de Live Activities e realizar o merge de pull requests diretamente do celular. O aplicativo foi desenhado para suportar fluxos de trabalho eficientes, como o tratamento de incidentes, resolução de problemas de clientes e respostas rápidas a feedbacks de usuários.
O aprendizado por reforço (RL) em áreas verificáveis está funcionando de forma clara, mas o próximo grande salto virá de abordagens que ajudem a levar esses mesmos resultados para domínios onde a verificação é mais difícil. Este artigo analisa por que a verificabilidade é uma limitação, quais técnicas estão funcionando atualmente e quais empresas estão enfrentando esse desafio.
O RoadmapBench avalia tarefas de codificação de longo prazo, abrangendo múltiplos arquivos e linguagens, com base em atualizações reais de versão em 17 repositórios. O benchmark testa 115 tarefas, exigindo que os agentes implementem funcionalidades com uma modificação mediana de 3.700 linhas em 51 arquivos.
O DiScoFormer propõe uma arquitetura unificada baseada em transformer capaz de modelar simultaneamente a densidade e o score em diferentes distribuições de dados.
O Google começará a oferecer modelos de IA especializados da SandboxAQ por meio do Google Cloud. Os grandes modelos quantitativos da SandboxAQ são treinados com equações científicas e dados laboratoriais. A adição desses modelos expandirá o acesso de empresas e pesquisadores a sistemas de IA voltados para a descoberta de medicamentos, ciência dos materiais e fabricação de semicondutores. Pesquisadores poderão combinar esses modelos com o Gemini, utilizando o modelo de linguagem para raciocínio e interface, enquanto o modelo quantitativo executa as análises científicas subjacentes.
A Salesforce gerou confusão entre seus próprios funcionários ao ajudar na promoção do Claude Tag durante seu lançamento. O descontentamento ocorre porque o Slack já conta com seu próprio Slackbot e com a plataforma Agentforce, que funciona com o modelo Claude, enquanto o Claude Tag oferece uma experiência paralela dentro do mesmo ambiente. Apesar da aparente sobreposição e da tensão competitiva interna, a Salesforce possui fortes incentivos financeiros para promover a ferramenta: a empresa detém uma participação de aproximadamente 1% na Anthropic e projeta gastar 300 milhões de dólares em tokens da startup neste ano.
O Mistral Workflows é uma plataforma de orquestração durável e tolerante a falhas, desenvolvida sob medida para executar e monitorar pipelines de IA baseados em múltiplos agentes.
O Fugu Ultra superou o Fable no benchmark LiveCodeBench, com preços a partir de US$ 5 por milhão de tokens de entrada.
Este artigo acompanha a jornada de execução de um kernel, desde o código até a divisão em warps na GPU, e o caminho de volta com o resultado.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
