CEVIU News

CEVIU News - CEVIU IA - 15 de abril de 2026

16 notícias15 de abril de 2026CEVIU IA
Compartilhar:

🛠️ CEVIU IA

As rotinas no Claude Code permitem que os usuários configurem uma rotina uma única vez e a executem em um cronograma, a partir de uma chamada de API ou em resposta a um evento. Essas rotinas possuem seu próprio endpoint de API, e as rotinas de webhook se inscrevem em eventos do GitHub. A funcionalidade está disponível em todos os planos pagos que possuem o Claude Code habilitado na web.

A OpenAI está expandindo seu programa Trusted Access for Cyber (TAC) para milhares de defensores individuais verificados e centenas de equipes responsáveis pela defesa de softwares críticos. A empresa lançou uma variante do GPT-5.4, treinada para ser "cyber-permissive", denominada GPT-5.4-Cyber. A OpenAI planeja tornar suas ferramentas o mais amplamente disponíveis possível, ao mesmo tempo em que previne o uso indevido, e irá implantar sua tecnologia com cautela à medida que continua a aprimorá-la. Empresas podem agora autenticar-se com a OpenAI como defensores de cibersegurança; aqueles nos níveis mais altos terão acesso ao GPT-5.4-Cyber.

O Google está expandindo o NotebookLM com funcionalidades de Canvas, permitindo a criação de experiências visuais e interativas a partir de fontes de notebook já existentes. A nova opção de Connectors sugere integração com outros serviços Google, visando posicionar o NotebookLM como uma camada central de pesquisa. Recursos de rotulagem e autocategorização podem otimizar a navegação para usuários que gerenciam grandes bibliotecas de fontes, simplificando a organização e o acesso ao conteúdo.

Daniel Kokotajlo, fundador do AI Futures Project, escreveu um ensaio intitulado 'What 2026 Looks Like' em agosto de 2021, antes do lançamento do ChatGPT. Suas previsões mostraram-se bastante precisas. Esta publicação apresenta uma entrevista com Kokotajlo, onde ele discute o que acertou, o que errou e como devemos considerar o ritmo da IA nos próximos anos. Recentemente, Kokotajlo lançou um relatório que prevê os próximos anos do desenvolvimento da IA, culminando na ascensão de agentes super-humanos capazes de assumir o controle da humanidade.

O Gemini Robotics-ER 1.6 aprimora o raciocínio incorporado de robôs, melhorando o raciocínio espacial e a compreensão multi-visão para uma autonomia superior. Ele aprimora a compreensão visual e espacial, o planejamento de tarefas, a detecção de sucesso, e introduz capacidades de leitura de instrumentos. Disponível agora através da Gemini API e do Google AI Studio, o modelo suporta integração com ferramentas como o Google Search e VLAs.

Agentes podem desenvolver software rapidamente, mas desenvolvedores ainda precisam dedicar esforço a ambientes e códigos seguros. A Cloudflare introduziu tokens escaneáveis para proteger credenciais, visibilidade OAuth para gerenciar entidades e RBAC com escopo de recurso para ajustar políticas. Isso garante que as credenciais dos usuários (tokens) não sejam vazadas, que as aplicações corretas tenham acesso via OAuth, e que as permissões sejam restritas usando RBAC granular. Clientes Cloudflare devem revisar seus API tokens, verificar as aplicações OAuth autorizadas e analisar as permissões de membros e API tokens.

Modelos de linguagem de diffusion (DLMs) oferecem a promessa de que a geração paralela de tokens poderia quebrar o gargalo sequencial da decodificação autoregressive (AR). No entanto, os DLMs consistentemente ficam atrás dos modelos AR em qualidade. Essa lacuna decorre de uma falha fundamental de consistência introspectiva: modelos AR concordam com o que geram, enquanto DLMs frequentemente não. O Introspective Diffusion Language Model (I-DLM) utiliza o introspective strided decoding (ISD) para verificar tokens gerados anteriormente enquanto avança novos no mesmo forward pass. Com gated LoRA, o ISD possibilita uma aceleração sem perdas bit-a-bit.

A Microsoft firmou um acordo para arrendar capacidade de computação de alta performance no data center da Nscale em Narvik, Noruega. O data center de 230 megawatts era originalmente destinado à iniciativa 'Stargate' da OpenAI, mas as negociações entre a OpenAI e a Nscale teriam sido concluídas sem um acordo. O negócio da Microsoft com a Nscale envolve o aluguel de 30.000 GPUs NVIDIA Vera Rubin. Esta expansão ajudará a garantir o acesso à capacidade escalável necessária para a próxima geração de workloads de IA para clientes europeus.

O caching de prompts do Claude permite que os usuários evitem reprocessar prompts já utilizados, resultando em economia de tokens. Existem caches com tempo de vida (TTL) de cinco minutos ou uma hora. Gravar no cache de cinco minutos implica um custo 25% maior em tokens, enquanto gravar no cache de uma hora custa 100% mais. A leitura do cache, por sua vez, custa cerca de 10% do preço base. Contudo, alguns usuários têm relatado problemas ao atingir seus limites de uso muito rapidamente, e há também indicações de uma queda no desempenho geral do Claude.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser