CEVIU News

CEVIU News - CEVIU IA - 25 de março de 2026

30 notícias25 de março de 2026CEVIU IA

Compartilhar:

💡 CEVIU IA

25 de mar. de 2026

💡

Um Problema ao Estilo Ramsey em Hipergrafos

Este post detalha um problema que levaria um especialista humano de um a três meses para resolver. O problema foi eventualmente solucionado por duas pessoas usando o GPT-5.4 Pro. Um link para a transcrição completa da conversa com o GPT-5.4 Pro está disponível. Outros modelos que solucionaram o problema incluem o GPT 5.4 (xhigh), Gemini 3.1 Pro e Claude Opus 4.6 (max).

Ler mais Original

25 de mar. de 2026

🤖

Modo Automático do Claude em Prévia de Pesquisa

A Anthropic lançou o Auto Mode em prévia de pesquisa, permitindo que o Claude execute ações de forma autônoma com salvaguardas integradas que filtram comportamentos de risco e prompt injection.

Ler mais Original

25 de mar. de 2026

💾

OpenAI lança ChatGPT Library para armazenar seus arquivos pessoais

A nova função ChatGPT Library permite aos usuários armazenar arquivos pessoais ou imagens na nuvem da OpenAI. Disponível para assinantes Plus, Pro e Business, a função está sendo lançada globalmente, exceto no Espaço Econômico Europeu, Suíça e Reino Unido. O ChatGPT salvará automaticamente os arquivos enviados ou criados. Deletar um chat não apaga o arquivo da Library.

Ler mais Original

25 de mar. de 2026

🚀

ChatGPT Redireciona Foco para Descoberta de Produtos

A OpenAI abandonou o recurso de checkout dentro do chat devido à baixa adoção, priorizando agora a descoberta de produtos e fluxos de compra orientados por comerciantes.

Ler mais Original

25 de mar. de 2026

💰

OpenAI oferece retorno mínimo garantido de 17,5% a fundos de private equity

A OpenAI está em negociações com firmas de private equity para formar joint ventures que visam levantar capital e acelerar a adoção de produtos de IA para empresas. A empresa oferece a esses fundos um retorno mínimo garantido de 17,5%, consideravelmente acima dos instrumentos preferenciais usuais, e acesso antecipado aos seus novos modelos de IA. TPG e Advent são potenciais investidores.

Ler mais Original

25 de mar. de 2026

🤖

App Store | Era dos Agentes

A App Store foi a resposta centralizada para o problema de distribuição em uma nova plataforma computacional. Na era dos agentes, será necessária uma nova solução, pois os agentes precisam de APIs, não de lojas de aplicativos. A Apple garantiu sua receita obrigando que cada transação no aplicativo passasse pelo seu sistema de pagamento. A era dos agentes carece de mecânicas de bloqueio da Apple; assim, se uma plataforma decidir cobrar altas taxas de pagamento, os usuários simplesmente mudarão para um concorrente. Isso sugere que a camada de pagamento será competitiva e de baixa margem, em vez de monopolista. ️

Ler mais Original

25 de mar. de 2026

📂

Claude Code e Cowork agora podem acessar seu computador

Claude Code e Claude Cowork agora podem abrir arquivos, usar navegadores e executar ferramentas de desenvolvimento nos computadores dos usuários. O agente dará prioridade a conectores para serviços suportados, mas ainda pode executar tarefas na ausência deles, solicitando permissão antes de agir. Inicialmente, isso está disponível para assinantes Claude Pro e Claude Max no macOS. ️

Ler mais Original

25 de mar. de 2026

🤖

Claude 2026: Todos os Recursos e Como Utilizá-los

Em março, o Claude 4.6 traz uma janela de contexto de 1 milhão de tokens e quatro modos: Chat, Cowork, Code e Projects. A suíte Cowork automatiza workflows com Tarefas Agendadas e Conectores, e o ambiente Code utiliza hierarquia CLAUDE.md, protocolos MCP e Equipes de Agentes para desenvolvimento autônomo. Atualizações incluem pré-visualizações de pesquisa em Computer Use e Hooks deterministas para guardrails programáveis.

Ler mais Original

25 de mar. de 2026

🔬

Física com Vibes: O Estudante de Graduação em IA

Um professor de física orientou Claude, um modelo de IA, em um cálculo de pesquisa real, do início ao fim, sem nunca tocar em um arquivo, para ver se a IA poderia realizar física teórica. Isso resultou em um artigo tecnicamente rigoroso e impactante sobre física teórica de alta energia em duas semanas, em vez do ano usual. Embora Claude tenha demonstrado habilidades impressionantes, a expertise do domínio foi essencial para avaliar sua precisão. A IA ainda não consegue fazer ciência de ponta a ponta, mas o projeto comprovou que pode realizar ciência de fronteira com orientação.

Ler mais Original

25 de mar. de 2026

🛠

Design de Harness para Desenvolvimento de Aplicações de Longa Duração

Prithvi Rajasekaran, da Anthropic, desenvolveu uma arquitetura multi-agente para aprimorar o design de frontend orientado por IA e a codificação de aplicações full-stack. Inspirada por GANs, a abordagem utiliza agentes planejador, gerador e avaliador para decompor tarefas e garantir transições estruturadas, produzindo saídas complexas e de alta qualidade. Desafios persistem na gestão de contexto e ajuste do avaliador, indicando a necessidade de adaptar designs de harness à medida que os modelos de IA avançam.

Ler mais Original

25 de mar. de 2026

🔥

Rápido Ajuste de Embeddings Específicos de Domínio

A NVIDIA lançou um pipeline para realizar fine-tuning rápido de modelos de embeddings usando dados sintéticos, aprimorando o desempenho de retrieval para sistemas RAG específicos de domínio.

Ler mais Original

25 de mar. de 2026

🤖

Apresentando Ossature: Geração de Código Baseada em Especificações

O Ossature é um harness de código aberto para geração de código baseada em especificações. Os desenvolvedores escrevem especificações sobre o que o software deve fazer, e o Ossature as valida, utiliza um LLM para auditar ambiguidades e lacunas, produz um plano editável e, em seguida, gera código uma tarefa de cada vez, fornecendo apenas o contexto necessário para cada tarefa. Há verificação embutida no loop de construção. Se a verificação falhar, um agente solucionador tenta reparar o código a partir do erro reportado. ‍

Ler mais Original

25 de mar. de 2026

🚀

DeepMind introduz edição de vídeo sem necessidade de treinamento

DynaEdit apresenta um método que dispensa treinamento para editar vídeos com movimentos complexos e interações. Utilizando modelos de texto para vídeo pré-treinados, a solução aborda problemas como desalinhamento e tremulação.

Ler mais Original

25 de mar. de 2026

🤖

Impacto do RLVR no Desempenho de Raciocínio

Atualizações direcionais no RLVR mostraram-se eficazes em identificar tokens críticos para raciocínio, permitindo extrapolação durante teste e reponderação durante o treinamento para aumentar a precisão.

Ler mais Original

25 de mar. de 2026

🔍

Busca Rápida com Regex: Indexação de Texto para Ferramentas de Agentes

Fornecer índices de busca de texto para modelos rápidos cria uma diferença qualitativa para workflows agentic. O impacto é mais evidente em grandes repositórios corporativos, pois a latência do grep aumenta com o tamanho e a complexidade do código. Eliminar o tempo gasto na busca na base de código gera economia de tempo significativa e permite uma iteração mais eficaz, especialmente quando o agente está investigando um bug.

Ler mais Original

25 de mar. de 2026

🔍

Compressão Extrema de Vetores do Google

TurboQuant é um método de quantização que reduz a sobrecarga de memória de vetores, mantendo o desempenho. Isso melhora a eficiência do cache de chave-valor e acelera a busca de vetores.

Ler mais Original

25 de mar. de 2026

💡

Nota de pesquisa: Passamos 2 horas trabalhando no futuro

A velocidade dos lançamentos de novos modelos e o número de avaliações necessárias no próximo ano podem tornar a atualização permanente um desafio sem assistência eficaz de IA. É fundamental compreender agora os fluxos de trabalho aumentados por IA antes que se tornem indispensáveis. A METR realizou um exercício simulado para investigar que fluxos de trabalho surgem, quais são os gargalos e o quanto mais rápidos os pesquisadores realmente serão. Este post detalha as lições aprendidas no exercício.

Ler mais Original

25 de mar. de 2026

🚀

Ray Data LLM dobra o throughput em comparação com o vLLM em escala de produção

Muitas das cargas de trabalho modernas que usam LLMs priorizam o throughput em vez da latência por solicitação, algo que muitos sistemas e implantações de LLM otimizam atualmente. O Ray Data LLM é uma biblioteca desenvolvida para inferência em batch em larga escala para LLMs. Ele oferece execução escalonável, alto throughput e tolerância a falhas. Com uma arquitetura altamente otimizada para inferência em batch de LLM, os usuários podem alcançar o dobro de throughput em comparação com o motor síncrono de LLM do vLLM, aproveitando a resiliência em escala de produção.

Ler mais Original

25 de mar. de 2026

💡

Por que não estamos fazendo mais fine-tuning?

Um bom prompt pode realizar muito do que o fine-tuning faz, mas sem os custos associados. Os modelos chegaram a um nível em que o fine-tuning não é realmente necessário para obter bons resultados. O trabalho extra e os recursos necessários não compensam mais na maioria dos casos. No entanto, ainda é útil saber como realizar fine-tuning para situações específicas.

Ler mais Original

25 de mar. de 2026

🔍

Treinado em Tokens, Calibrado em Conceitos: A Emergência da Calibração Semântica em LLMs

A calibração semântica surge como um subproduto da previsão do próximo token. Modelos base estão surpreendentemente bem calibrados ao usar uma noção, baseada em amostragem, de calibração semântica. Eles conseguem avaliar de maneira significativa a confiança em tarefas de perguntas e respostas em domínios abertos, mesmo sem treinamento explícito para isso.

Ler mais Original

25 de mar. de 2026

📱

Executando modelo de 400 bilhões de parâmetros no iPhone

Um pequeno clipe mostra um iPhone 17 Pro rodando o Qwen3.5-397B-A17B, um modelo Mixture-of-Experts com 397 bilhões de parâmetros, a 0,6 tokens por segundo.

Ler mais Original

25 de mar. de 2026

🚀

Se DSPy é tão bom, por que ninguém o usa?

DSPy é um framework que promete resolver os maiores desafios na engenharia de IA, mas é difícil de usar.

Ler mais Original

25 de mar. de 2026

🚀

OpenAI levanta fundos adicionais, somando rodada recorde de US$ 120 bilhões, diz CFO a Cramer

OpenAI anunciou um novo compromisso de US$ 10 bilhões de a16z, DE Shaw Ventures, MGX, TPG e T Rowe Price. Este capital fresco eleva a arrecadação recorde da OpenAI para mais de US$ 120 bilhões. A empresa moderou seus planos de gastos e agora mira aproximadamente US$ 600 bilhões em gasto total de compute até 2030, priorizando iniciativas mais lucrativas antes de um IPO.

Ler mais Original

25 de mar. de 2026

💡

Restam apenas dois caminhos para o software

As empresas de software têm dois caminhos claros: acelerar o crescimento com produtos de IA ou alcançar margens operacionais verdadeiras acima de 40%.

Ler mais Original

25 de mar. de 2026

🛡

Databricks Lança Plataforma de Segurança com IA

Lakewatch é uma plataforma SIEM que utiliza agentes de IA para detecção de ameaças, junto a aquisições da Antimatter e SiftD.ai para suportar implantações seguras de agentes.

Ler mais Original

25 de mar. de 2026

💡

OpenAI Contrata Ex-executivo da Meta para Liderar Iniciativa de Publicidade

A OpenAI contratou Dave Dugan, ex-executivo de publicidade da Meta, como vice-presidente de soluções globais de anúncios. A empresa busca urgentemente novas fontes de receita para sustentar suas grandes necessidades de financiamento. Dugan é conhecido por seus relacionamentos próximos com as principais empresas de publicidade do mundo, o que pode influenciar onde as marcas alocam seus orçamentos de publicidade.

Ler mais Original

25 de mar. de 2026

🔄

Relatório do Índice Econômico Anthropic: Curvas de Aprendizado

O Índice Econômico Anthropic mostra que o uso de Claude se diversificou, com uma queda em tarefas de alto valor, mudando mais para consultas pessoais de baixo valor.

Ler mais Original

25 de mar. de 2026

💰

OpenAI destaca dependência da Microsoft como risco em documento para investidores antes de possível IPO

A OpenAI identificou que sua estreita relação com a Microsoft representa um risco potencial para seus negócios, já que a Microsoft é responsável por uma parte substancial do financiamento e do compute da OpenAI. Outros riscos incluem grandes despesas de capital, dependência de recursos computacionais, litígios em andamento com a xAI e sua estrutura incomum como uma corporação de benefício público. Os resultados operacionais da OpenAI dependerão de sua habilidade em desenvolver relações com outros parceiros. Apesar da parceria forte, OpenAI e Microsoft estão competindo cada vez mais no mercado de IA generativa. ️

Ler mais Original

25 de mar. de 2026

💼

Juíza diz que banimento da Anthropic pelo governo dos EUA parece punição

A juíza distrital dos EUA Rita F. Lin, do Distrito Norte da Califórnia, afirmou durante uma audiência que o governo dos EUA parecia estar punindo a Anthropic ao proibir a empresa. A audiência faz parte dos esforços da Anthropic para aliviar a proibição governamental sobre o uso dos modelos de IA da empresa. Lin ainda não decidiu sobre o caso, mas expressou sérias dúvidas sobre as ações do governo Trump em seus comentários iniciais. A ação governamental já custou à Anthropic centenas de milhões de dólares em contratos cancelados e acordos abortados.

Ler mais Original

25 de mar. de 2026

📉

Walmart: Checkout com ChatGPT converteu 3x menos que site

Isso sugere que o comércio baseado em agentes ainda não está pronto para substituir as compras tradicionais.

Ler mais Original

Compartilhar:

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Assinar newsletter

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser