Os preços dos serviços de IA estão em ascensão, impulsionados pela escassez de capital e pela crescente necessidade de otimizar as margens de lucro.
CEVIU News
As melhores notícias de tecnologia, curadas diariamente para quem vive tech.
1078 notícias encontradas
A combinação de avaliações de LLMs com experimentos online cria um ciclo de feedback que aprimora tanto as avaliações quanto os experimentos ao longo do tempo.
O novo chip da Alibaba, o Zhenwu M890, é otimizado para lidar com as altas demandas de memória e comunicação características das cargas de trabalho de agentes de IA.
O Google integrou uma verificação para o arquivo llms.txt nas auditorias do Lighthouse do Chrome, sob a categoria "Agentic Browsing". O objetivo é aprimorar a forma como sistemas de IA interagem com websites.
Os IPOs esperados da OpenAI e da Anthropic enfrentam desafios devido à redução dos custos da IA e ao aumento da concorrência. Laboratórios americanos e chineses estão produzindo modelos de IA mais baratos e eficientes, ameaçando a fatia de mercado e o poder de precificação dessas empresas. Empresas estão adotando cada vez mais medidas de redução de custos, como "advisor models", e buscando alternativas acessíveis, o que complica a avaliação para os IPOs antecipados.
A Anthropic concordou em pagar à SpaceX quase US$45 bilhões nos próximos três anos por recursos de compute. O pagamento será de US$1,25 bilhão por mês até maio de 2029, com a possibilidade de qualquer uma das partes encerrar o acordo com 90 dias de aviso prévio. As empresas já haviam fechado um acordo este mês para que a Anthropic tivesse acesso a 300 megawatts de capacidade computacional de um grande data center da SpaceX em Memphis, conhecido como Colossus 1. Esta parceria foi expandida para incluir capacidade em um segundo data center da SpaceX.
Um reasoning model da OpenAI refutou autonomamente uma importante conjectura ligada ao problema da distância unitária planar, uma questão em aberto na geometria combinatória que remonta a 1946. A prova introduziu técnicas da teoria algébrica dos números e foi verificada independentemente por matemáticos externos, marcando um dos primeiros casos em que um sistema de IA resolveu um proeminente problema matemático não solucionado.
Novos estudos de escalonamento revelam que não usar filtragem de dados pode ser ideal para o pré-treinamento de modelos grandes em cenários de alto compute e escassez de dados. Modelos com muitos parâmetros não apenas toleram, mas se beneficiam da inclusão de dados de baixa qualidade e dados distratores. Ao contrário das crenças predominantes, filtrar dados de baixa qualidade pode não ser necessário quando há amplos recursos computacionais.
Mishra desmistifica as abstrações dos frameworks TRL, Unsloth e PRIME-RL, revelando que todo sistema de treinamento de agentes se resume ao mesmo ciclo: prompt leva à ação do modelo, que interage com o ambiente, gera recompensa e, por fim, atualiza o gradiente. Ele demonstra isso construindo um agente simples de texto para diagrama, ao estilo tldraw, usando Python puro. Neste sistema, o modelo emite ações JSON, como criar formas e conectá-las, que são validadas por um "canvas". Uma função de recompensa avalia a validade do JSON, conformidade com o esquema, qualidade do layout e cobertura semântica das palavras-chave do prompt.
O Google Agent Executor é um padrão de runtime de código aberto para a execução eficiente e confiável de workflows de agentes de IA de longa duração. Recursos essenciais como execução durável, isolamento seguro e recuperação de conexão aprimoram o gerenciamento de workflows, enquanto a consistência de sessão e o branching de trajetória suportam ambientes de agentes distribuídos. Além disso, a iniciativa colabora com o Kubernetes Engine no Agent Substrate para otimizar a eficiência de compute em implantações massivas de agentes.
A Stability AI lançou uma nova família de modelos Stable Audio 3.0, incluindo versões open-weight capazes de gerar músicas e efeitos sonoros com mais de seis minutos de duração.
O LiteFrame propõe um encoder de vídeo leve, desenvolvido para melhorar a compreensão de vídeos de longa duração em Video LLMs, ao reduzir ineficiências tanto no processamento de vision transformers quanto de modelos de linguagem.
A OpenAI estaria se preparando para uma possível oferta pública inicial (IPO) já em setembro, após a rejeição do processo judicial de Elon Musk que contestava a estrutura da empresa.
A receita da Anthropic deve mais que dobrar no segundo trimestre, atingindo a marca de 10,9 bilhões de dólares. As projeções, divulgadas aos investidores da Anthropic como parte de uma rodada de financiamento em andamento, demonstram a explosão de vendas da empresa desde o início do ano. Seu crescimento de receita trimestral agora supera o da Google e do Facebook no período que antecedeu suas ofertas públicas iniciais. No entanto, a empresa pode não permanecer lucrativa durante todo o ano, já que planeja aumentar os gastos devido à sua vasta necessidade de compute.
O Google lançou o Gemini 3.5 Flash, um novo modelo focado em workflows agentic, codificação e execução de tarefas de longo prazo. O lançamento também expandiu o acesso ao Gemini em diversas plataformas, incluindo Busca, ferramentas empresariais, Android Studio e as plataformas de desenvolvedores do Google.
A riqueza do HTML permite transmitir informações complexas de forma mais eficaz do que o Markdown, incluindo layouts, tabelas de dados e elementos interativos. Ele melhora a legibilidade ao organizar especificações em documentos bem estruturados e de fácil navegação, além de oferecer melhores capacidades de compartilhamento e interação. O Claude Code utiliza HTML para assimilar eficientemente o contexto de diversas fontes, auxiliando em especificações, prototipagem de design e na criação de interfaces de edição personalizadas com maior engajamento e clareza.
A nova família de modelos OlmoEarth v1.1 reduz os custos de compute em até 3X, mantendo o mesmo desempenho, tornando o mapeamento em escala planetária mais acessível. Os modelos processam dados de sensoriamento remoto de forma eficiente, otimizando os comprimentos das sequências de token, o que é crucial para diminuir os custos computacionais. As melhorias metodológicas permitem um desempenho similar ao da versão original com significativamente menos compute, beneficiando desenvolvedores e aprimorando a pesquisa científica em sensoriamento remoto.
A ideia de uma "meia-vida de modelo" — que os lançamentos de modelos de IA se tornariam cada vez mais rápidos, com o tempo de lançamento caindo pela metade a cada seis meses — não se sustenta sob análise. Embora o ritmo de lançamentos tenha de fato acelerado, essa taxa de redução não tem sido sustentada. Este artigo examina as datas de lançamento de vários dos modelos mais conhecidos e apresenta previsões para os próximos lançamentos, buscando um entendimento mais realista do ciclo de inovação.
A nova oferta de Capacidade Garantida da OpenAI permite que clientes assegurem acesso de longo prazo a compute para alimentar produtos de IA, agentes e workflows. Clientes podem escolher entre compromissos de um, dois e três anos, com descontos baseados na duração do compromisso. A empresa oferecerá a Capacidade Garantida até esgotar sua alocação atual e planeja oferecê-la novamente no futuro.
Andrej Karpathy anunciou sua entrada na Anthropic, afirmando que os próximos anos na "frontier" dos LLMs serão especialmente formativos para seu retorno à pesquisa e desenvolvimento. Karpathy destacou que continua apaixonado por educação e planeja retomar esse trabalho futuramente, sinalizando que a mudança é focada em pesquisa e não um afastamento permanente do ensino.
