Um desenvolvedor perguntou ao seu agente de IA como ele queria se lembrar das coisas. O agente redesenhou seu próprio sistema de memória, realizou uma autoavaliação, diagnosticou seus pontos cegos e melhorou o recall de 60% para 93%, tudo isso por apenas US$ 2. O experimento demonstra o que acontece quando a IA é tratada como participante em sua própria arquitetura cognitiva.

CEVIU News - CEVIU IA - 17 de março de 2026
🧠 CEVIU IA
A NVIDIA delineou um vasto escopo na GTC 2026, abrangendo parcerias em modelos de fundação abertos, tooling para agentes, novos modelos de raciocínio e segurança, sistemas robóticos e IA para saúde focada em descoberta e simulação de medicamentos. Essa expansão demonstra um compromisso com a inovação em diversas frentes da IA, do desenvolvimento de modelos à aplicação prática em setores cruciais.
O Alibaba está estabelecendo uma unidade de negócios para consolidar seus serviços de IA e esforços de desenvolvimento sob uma única estrutura. O novo Alibaba Token Hub integrará a equipe de pesquisa responsável pelos modelos Qwen da empresa, sua divisão de aplicativos voltados para o consumidor e outros produtos chave relacionados à IA. Além disso, a unidade supervisionará o aplicativo DingTalk, similar ao Slack, e os dispositivos da marca Quark. Esta reestruturação visa acelerar a interação entre as diversas equipes envolvidas na iniciativa mais ampla de IA da Alibaba .
Sachin Katti ingressou na OpenAI em novembro para atuar como chefe de industrial compute ️, após mais de 15 anos como professor em Stanford e quatro na Intel. Sua função atual é crucial: encontrar capacidade adicional de data center e assegurar o fornecimento de componentes essenciais, como chips de IA e memória. Este desafio é complexo , com operadores de data centers enfrentando restrições na rede elétrica, escassez de chips de memória e crescente oposição das comunidades locais.
A OpenAI planeja redirecionar seus esforços para usuários de codificação e para o setor corporativo. Seus líderes estão ativamente buscando áreas para despriorizar. A estratégia da empresa de 'fazer tudo ao mesmo tempo' a ajudou a conquistar a reputação de pioneira da era da IA. No entanto, sob crescente pressão de rivais, a empresa agora necessita de uma direção estratégica mais clara para o futuro.
A OpenAI explicou que o Codex Security foi projetado para analisar repositórios diretamente, em vez de fazer a triagem de relatórios de static analysis. A abordagem se concentra na arquitetura do sistema, limites de confiança e validação de descobertas antes de apresentá-las a humanos. Este método visa especificamente falhas de segurança semânticas, onde as defesas parecem presentes, mas falham em realmente impor a proteção pretendida. ️
Este artigo traça paralelos entre o desenvolvimento de armas nucleares e a IA, argumentando que a IA apresenta riscos globais semelhantes. ️ A Anthropic, um player chave em IA, hesita em conceder acesso ao governo dos EUA, refletindo dilemas de controle privado semelhantes ao cenário hipotético da "McBombalds Corp". Isso levanta o debate sobre se entidades privadas deveriam controlar tecnologias com um impacto global tão imenso , ou se a supervisão governamental é mais apropriada.
O Mistral Small 4 integra as capacidades dos modelos Magistral, Pixtral e Devstral, oferecendo uma IA unificada multimodal e otimizada para raciocínio, com esforço de raciocínio configurável. Ele emprega uma arquitetura Mixture of Experts com 119 bilhões de parâmetros, suportando entradas de texto e imagem, e apresenta escalabilidade eficiente. O Mistral Small 4 alcança desempenho competitivo com comprimento de saída reduzido, é open-source e está disponível em plataformas como vLLM, llama.cpp e Transformers, facilitando sua adoção e uso pela comunidade de desenvolvedores.
A Apple planeja investir US$ 14 bilhões em IA este ano, um valor modesto se comparado aos US$ 700 bilhões que Amazon, Alphabet, Meta e Microsoft estão aportando. Aparentemente, a empresa crê que a construção de infraestrutura de IA não trará retornos proporcionais. Seu menor gasto se baseia na convicção de que os modelos de IA se tornarão commodities e mais compactos, que suas linhas de produtos existentes podem absorver as cargas de trabalho que o cloud foi projetado para atender, e que a vantagem duradoura pertence a quem detém o cliente. A Apple está apostando em seus dispositivos com capacidade de IA em vez de infraestrutura centralizada.
O padrão de subagents agora conta com amplo suporte em agentes de codificação. No OpenAI Codex, os subagents já estão geralmente disponíveis. O sistema inclui subagents padrão como 'explorer', 'worker' e 'default', embora as diferenças entre eles não sejam claras. Usuários também podem definir agentes customizados, utilizando instruções personalizadas e modelos específicos para suas necessidades.
O foco da Nvidia este ano em seu evento GTC mudou para inference, o tipo de computação necessário para executar modelos e permitir que respondam a consultas de usuários. A indústria de IA agora está menos preocupada com o treinamento de modelos de IA, para o qual as GPUs são mais adequadas, e mais focada em executá-los e gerar lucros para os usuários finais. Inference exige hardware diferente de chips otimizados para treinamento. A liderança da empresa na corrida por infraestrutura de IA dependerá em grande parte de quão eficazmente ela conseguirá adaptar seu roadmap de produtos do treinamento para inference.
NVIDIA Dynamo 1.0 acelera modelos de IA generativa e reasoning models em ambientes distribuídos de larga escala, ao entregar inference distribuída de baixa latência e alto throughput.
A negociação proposta pode proporcionar à OpenAI um caminho mais rápido para a adoção corporativa de suas soluções de IA. Paralelamente, a iniciativa oferece aos fundos de private equity uma potencial tábua de salvação para empresas em seus portfólios que estão vulneráveis à disrupção impulsionada pela IA.
Drew Bent, o líder de educação da Anthropic, compartilha suas reflexões e aprendizados após um ano na empresa.
Open-H-Embodiment é um dataset de robótica para saúde, desenvolvido pela comunidade, concebido para o treinamento e a avaliação da autonomia de IA e de modelos fundacionais de mundo para aplicações no setor da saúde. Este recurso é vital para avanços em IA física aplicada a robôs médicos.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
