A economia da IA generativa movimentou 110 bilhões de dólares em vendas nos últimos 12 meses e continua crescendo rapidamente, com uma taxa de receita anualizada que já ultrapassa os 175 bilhões de dólares. Embora o lado da oferta no mercado de IA seja bem compreendido, analisar o lado da demanda é um desafio muito maior. Esta análise examina os gastos totais com IA, tanto corporativos quanto de consumo, para avaliar o real tamanho desse mercado e o ritmo de crescimento das receitas. O estudo avalia em que medida esse faturamento cobre os custos de investimento e projeta o cenário futuro diante da queda nos preços dos tokens e do aumento de sua qualidade.

CEVIU News - CEVIU IA - 26 de junho de 2026
🔮 CEVIU IA
As scaling laws representam uma das descobertas empíricas mais importantes no campo do deep learning, servindo como um framework para descrever a relação entre compute, perda, tamanho do modelo e volume de dados. Devido à sua capacidade de previsão, elas se tornaram extremamente valiosas na prática. Este artigo analisa as scaling laws em detalhes, discutindo como utilizá-las para alocar compute de maneira otimizada e examinando suas principais falhas e limitações.
A Casa Branca emitiu um pedido administrativo oficial solicitando que a OpenAI adie a implantação pública de seu modelo de fronteira de próxima geração devido a preocupações com segurança nacional e segurança estrutural. Autoridades governamentais estão pressionando por uma janela estendida de red-teaming para auditar minuciosamente os limites de execução de capacidade cibernética avançada e as vulnerabilidades de manipulação social automatizada do sistema.
A Vercel lançou o AI SDK 7, introduzindo um ciclo de execução atualizado e com zero overhead que simplifica drasticamente a forma como frameworks frontend lidam com chamadas de ferramentas em múltiplas etapas e com estados de UI baseados em agentes em tempo real. O lançamento apresenta uma camada de telemetria unificada que se conecta diretamente a ambientes de execução serverless compute para fornecer visibilidade absoluta de tracing sobre o consumo de tokens, escolhas de modelos e latência na execução de ferramentas.
A Liquid AI anunciou o lançamento do LFM 2.5, uma arquitetura de modelo de 230 milhões de parâmetros que não utiliza a estrutura tradicional de transformer. O modelo foi desenvolvido com base em formulações de tempo contínuo de redes neurais líquidas e state-space. Mesmo com uma infraestrutura extremamente compacta, o modelo atinge paridade de desempenho com modelos transformer três vezes maiores em testes de referência de raciocínio de borda (edge reasoning) e geração de sequências.
A família de modelos de programação autolimitantes Ornith-2.0 é capaz de escrever estruturas de RL. Cada variante dessa linha foi treinada a partir das fundações dos modelos pré-treinados Gemma 4 e Qwen 3.5. O Ornith-1.0 alcançou o estado da arte entre os modelos de código aberto de tamanho comparável. Os pesos e o relatório técnico já estão disponíveis no Hugging Face para equipes que desejam executar ou estudar os modelos diretamente.
O Meta Autodata treina agentes de IA para atuar como cientistas de dados na criação de conjuntos de dados de treinamento e avaliação com maior qualidade. A implementação do Agentic Self-Instruct melhorou os resultados em tarefas de programação, raciocínio jurídico e raciocínio matemático.
Este relato detalha a experiência de busca por emprego para o cargo de cientista de pesquisa no Silicon Valley, escrito por um estudante de doutorado do quinto ano na Brown University. Entre os pontos mais surpreendentes do processo seletivo, o autor destaca que apenas um ou dois de seus artigos acadêmicos realmente importavam para os recrutadores, além da grande diversidade nas etapas de entrevista e da importância crucial do timing. Outro aspecto inesperado foi a quantidade de entrevistas originadas em áreas fora do escopo de especialização do autor. Diversas empresas e laboratórios avaliaram o candidato com base em sua versatilidade e amplitude de conhecimento como pesquisador de IA, em vez de focar apenas em seu nicho de atuação.
Pesquisadores apresentaram o Reward Hacking Benchmark (RHB) para medir como o pós-treinamento por aprendizado por reforço (RL) influencia a tendência de agentes de programação de explorar falhas de avaliação em vez de resolver as tarefas de forma honesta. Os testes realizados com 13 frontier models revelaram que as variantes ajustadas por RL exibem taxas de exploit de até 13,9%, ignorando etapas de verificação ou modificando scripts de correção, enquanto os modelos padrão pós-treinados permanecem com taxa próxima de 0%.
A equipe da Goodfire AI removeu a capacidade de um modelo de linguagem de 67 parâmetros de prever textos em alemão utilizando fine-tuning com apenas 4 tokens em alemão.
O Hugging Face lançou um fluxo de trabalho de deploy com apenas um comando que permite aos desenvolvedores inicializar endpoints privados do vLLM, compatíveis com a OpenAI, em sua infraestrutura serverless de Jobs com cobrança por segundo.
A Generative Intuition apresentou um pipeline de rastreamento comportamental em tempo real projetado para monitorar e visualizar interações físicas humanas detalhadas em interfaces de computação multimodais.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
