Claude executará tarefas agendadas via infraestrutura em nuvem, eliminando a necessidade de manter o Claude Code rodando em máquinas locais. ️
CEVIU IA
Lançamentos, inovações e pesquisas para profissionais de IA, machine learning e ciência de dados
448 notícias
Empresas dependerão cada vez mais de agentes de IA, necessitando de world models para gerenciá-los eficientemente.
A Tencent lançou o ClawBot para integrar sua plataforma WeChat com o agente de IA OpenClaw, avançando no mercado chinês de agentes de IA. O ClawBot visa aprimorar os serviços de IA no WeChat, oferecendo aplicações para consumidores e negócios, o que pode aumentar o engajamento dos usuários. A iniciativa pode impactar as receitas da Tencent por meio de maior uso, pagamentos, publicidade e assinaturas, apesar dos desafios de concorrentes como Baidu e Alibaba.
Modelos de IA de código aberto estão rapidamente fechando a diferença de desempenho com modelos de frontier, tornando o processamento local de IA cada vez mais viável e atraente.
Startups de IA representaram 41% dos investimentos de venture capital na Carta no ano passado, com Anthropic, OpenAI e xAI captando financiamentos substanciais.
Perplexity está adicionando uma seção de Pesquisa de Mercado, impulsionada por seu sistema multi-modelo agentic, Perplexity Computer.
'Tokenmaxxing' é um novo jogo de status onde trabalhadores obcecados por IA gastam tokens para provar sua produtividade . Algumas empresas incentivam a competição com rankings internos que mostram quantos tokens cada funcionário consome. Há desenvolvedores gastando milhares de dólares por mês para automatizar ao máximo seu trabalho. Um único agente pode gastar 700 milhões de tokens por semana. No entanto, esses rankings não revelam se eles estão realmente sendo produtivos ou se tudo é apenas teatro de produtividade .
O CEO da OpenAI, Sam Altman, tomou medidas extremas para garantir capacidade de compute em 2025, firmando acordos de infraestrutura bilionários. Enquanto a empresa se prepara para um possível IPO no final do ano, está começando a moderar expectativas e delinear uma estratégia mais comedida. A OpenAI percebe que o mercado não valoriza necessariamente sua abordagem anterior de crescimento e gastos.
O Nemotron-Cascade 2 é um modelo de 30 bilhões de MoE com 3 bilhões de parâmetros ativos que alcançou desempenho em nível de Olimpíada, mantendo alta eficiência através de Cascade RL e destilação multi-domínio.
As ferramentas para construir fábricas de software já existem. Os Minions da Stripe demonstram que o modelo funciona em larga escala. O papel do engenheiro de software está se transformando para algo semelhante ao de um operador de fábrica. Agora, desenvolvedores podem criar fábricas autoaperfeiçoadas que usam agentes para analisar feedbacks de usuários, testes A/B e dados de produção, preenchendo o backlog sem necessidade de curadoria humana.
O gasto com tokens não importa se as tarefas não são concluídas. A quantidade total de tokens consumidos por tarefa varia entre modelos. Uma empresa que cobra o dobro por tokens pode ainda ser a opção mais barata se seus modelos retornarem a resposta correta em menos interações. Em vez de usar o gasto com tokens como KPI, as empresas devem medir o custo por tarefa concluída com sucesso.
Elon Musk anunciou o Terafab, uma empreitada de US$ 20 bilhões em parceria entre Tesla, SpaceX e xAI, destinada a construir a maior fábrica de chips do mundo, com o objetivo de gerar um terawatt de poder computacional anualmente. Localizada em Austin, Texas, a instalação produzirá chips para uso terrestre, como em carros autônomos, e no espaço, apoiando projetos como o proposto centro de dados orbital. Apesar das declarações ambiciosas de Musk, ele já não cumpriu totalmente em empreitadas passadas, como o Hyperloop e condução totalmente autônoma. ️
O MiniMax M2.7 entrega 90% da qualidade do Claude Opus 4.6 a apenas 7% do custo, destacando-se na detecção de bugs, mas menos eficiente nas correções. É superior em cálculos de ponto flutuante e se iguala ao Claude na detecção de vulnerabilidades, embora o Claude ofereça soluções mais completas. Com tarifas de $0,30/$1,20 por milhão de tokens contra $5/$25 do Claude, o MiniMax é uma ferramenta econômica que preenche a lacuna entre modelos open-weight e frontier.
A OpenAI está focada em desenvolver um pesquisador baseado em agentes totalmente autônomo capaz de resolver problemas complexos de forma independente. A empresa afirma que esse objetivo de pesquisa guiará suas ações nos próximos anos, com planos para desenvolver um estagiário de IA autônomo até setembro. Este será o precursor de um sistema de pesquisa multiagente totalmente automatizado previsto para ser lançado em 2028.
A OpenAI planeja expandir sua força de trabalho de 4.000 para 8.000 funcionários até o final do ano. As novas contratações abrangerão vários departamentos, incluindo desenvolvimento de produtos, engenharia, pesquisa e vendas. A empresa vai incluir especialista em embaixadores técnicos para ajudar empresas a utilizarem melhor suas ferramentas de IA. Atualmente, a OpenAI está em negociações avançadas com firmas de private equity para implantar suas ferramentas no portfólio de empresas das firmas.
Um usuário do X relatou que o novo modelo Composer 2 da Cursor parece ser baseado no Kimi 2.5 da Moonshot AI. Posteriormente, a Cursor confirmou que o modelo começou a partir de um modelo base aberto e foi treinado adicionalmente com aprendizado por reforço.
A OpenAI descreveu um sistema de monitoramento para agentes de codificação internos, projetado para detectar riscos de desalinhamento e estudar o comportamento de agentes no mundo real em ambientes ricos em ferramentas.
A Perplexity lançou o Perplexity Health nos EUA , marcando sua entrada no competitivo mercado de IA para saúde do consumidor. O serviço se diferencia por um hub personalizável e agentes de IA especializados, como assistentes de nutrição e sono. Sua estratégia espelha a de seu segmento financeiro, integrando dados reais de usuários e alavancando a IA para oferecer insights personalizados .
A Cursor lançou o Composer 2, um modelo de codificação que oferece desempenho de nível frontier com preços de tokens significativamente reduzidos.
Pesquisadores direcionaram o Claude Code para tarefas de autopesquisa e lhe concederam acesso a 16 GPUs em um cluster Kubernetes. Em 8 horas, o sistema submeteu cerca de 910 experimentos. O paralelismo alterou fundamentalmente a estratégia de busca do agente: enquanto com uma única GPU ele se limitava a uma abordagem de greedy hill-climbing, com 16 GPUs, o agente executou grades fatoriais de 10 a 13 experimentos por onda. Isso permitiu identificar efeitos de interação entre parâmetros que uma busca sequencial não seria capaz de detectar.
