A Anthropic concordou em pagar à SpaceX quase US$45 bilhões nos próximos três anos por recursos de compute. O pagamento será de US$1,25 bilhão por mês até maio de 2029, com a possibilidade de qualquer uma das partes encerrar o acordo com 90 dias de aviso prévio. As empresas já haviam fechado um acordo este mês para que a Anthropic tivesse acesso a 300 megawatts de capacidade computacional de um grande data center da SpaceX em Memphis, conhecido como Colossus 1. Esta parceria foi expandida para incluir capacidade em um segundo data center da SpaceX.

CEVIU News - CEVIU IA - 21 de maio de 2026
💰 CEVIU IA
A OpenAI estaria se preparando para uma possível oferta pública inicial (IPO) já em setembro, após a rejeição do processo judicial de Elon Musk que contestava a estrutura da empresa.
A Stability AI lançou uma nova família de modelos Stable Audio 3.0, incluindo versões open-weight capazes de gerar músicas e efeitos sonoros com mais de seis minutos de duração.
Um reasoning model da OpenAI refutou autonomamente uma importante conjectura ligada ao problema da distância unitária planar, uma questão em aberto na geometria combinatória que remonta a 1946. A prova introduziu técnicas da teoria algébrica dos números e foi verificada independentemente por matemáticos externos, marcando um dos primeiros casos em que um sistema de IA resolveu um proeminente problema matemático não solucionado.
Mishra desmistifica as abstrações dos frameworks TRL, Unsloth e PRIME-RL, revelando que todo sistema de treinamento de agentes se resume ao mesmo ciclo: prompt leva à ação do modelo, que interage com o ambiente, gera recompensa e, por fim, atualiza o gradiente. Ele demonstra isso construindo um agente simples de texto para diagrama, ao estilo tldraw, usando Python puro. Neste sistema, o modelo emite ações JSON, como criar formas e conectá-las, que são validadas por um "canvas". Uma função de recompensa avalia a validade do JSON, conformidade com o esquema, qualidade do layout e cobertura semântica das palavras-chave do prompt.
Novos estudos de escalonamento revelam que não usar filtragem de dados pode ser ideal para o pré-treinamento de modelos grandes em cenários de alto compute e escassez de dados. Modelos com muitos parâmetros não apenas toleram, mas se beneficiam da inclusão de dados de baixa qualidade e dados distratores. Ao contrário das crenças predominantes, filtrar dados de baixa qualidade pode não ser necessário quando há amplos recursos computacionais.
O Google Agent Executor é um padrão de runtime de código aberto para a execução eficiente e confiável de workflows de agentes de IA de longa duração. Recursos essenciais como execução durável, isolamento seguro e recuperação de conexão aprimoram o gerenciamento de workflows, enquanto a consistência de sessão e o branching de trajetória suportam ambientes de agentes distribuídos. Além disso, a iniciativa colabora com o Kubernetes Engine no Agent Substrate para otimizar a eficiência de compute em implantações massivas de agentes.
O LiteFrame propõe um encoder de vídeo leve, desenvolvido para melhorar a compreensão de vídeos de longa duração em Video LLMs, ao reduzir ineficiências tanto no processamento de vision transformers quanto de modelos de linguagem.
A receita da Anthropic deve mais que dobrar no segundo trimestre, atingindo a marca de 10,9 bilhões de dólares. As projeções, divulgadas aos investidores da Anthropic como parte de uma rodada de financiamento em andamento, demonstram a explosão de vendas da empresa desde o início do ano. Seu crescimento de receita trimestral agora supera o da Google e do Facebook no período que antecedeu suas ofertas públicas iniciais. No entanto, a empresa pode não permanecer lucrativa durante todo o ano, já que planeja aumentar os gastos devido à sua vasta necessidade de compute.
Os IPOs esperados da OpenAI e da Anthropic enfrentam desafios devido à redução dos custos da IA e ao aumento da concorrência. Laboratórios americanos e chineses estão produzindo modelos de IA mais baratos e eficientes, ameaçando a fatia de mercado e o poder de precificação dessas empresas. Empresas estão adotando cada vez mais medidas de redução de custos, como "advisor models", e buscando alternativas acessíveis, o que complica a avaliação para os IPOs antecipados.
O Google integrou uma verificação para o arquivo llms.txt nas auditorias do Lighthouse do Chrome, sob a categoria "Agentic Browsing". O objetivo é aprimorar a forma como sistemas de IA interagem com websites.
Os preços dos serviços de IA estão em ascensão, impulsionados pela escassez de capital e pela crescente necessidade de otimizar as margens de lucro.
A combinação de avaliações de LLMs com experimentos online cria um ciclo de feedback que aprimora tanto as avaliações quanto os experimentos ao longo do tempo.
O novo chip da Alibaba, o Zhenwu M890, é otimizado para lidar com as altas demandas de memória e comunicação características das cargas de trabalho de agentes de IA.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
