A OpenAI planeja adquirir a Ona para expandir o Codex com ambientes de cloud seguros e persistentes, permitindo a execução de agentes de IA de longa duração em fluxos de trabalho corporativos.

CEVIU News - CEVIU IA - 12 de junho de 2026
🤝 CEVIU IA
A Anthropic decidiu tornar visíveis as suas salvaguardas para o desenvolvimento de LLMs de fronteira após sofrer críticas de pesquisadores. Anteriormente, a empresa redirecionava discretamente solicitações para um modelo inferior quando este era requisitado para executar tarefas específicas. Pesquisadores descobriram que o Claude estava recusando ou degradando respostas para tarefas como o treinamento de modelos concorrentes, debugging de código de IA e otimização de arquitetura neural. O caso gerou preocupações sobre a falta de transparência da Anthropic e o desperdício de tokens e recursos computacionais em modelos que não entregavam o desempenho esperado.
O MiMo Code V0.1.0 é um assistente de codificação IA open source focado em terminal desenvolvido pela Xiaomi. A ferramenta supera o Claude Code em benchmarks de codificação agentic, apresentando desempenho superior especialmente em tarefas de longo horizonte com múltiplas etapas. O sistema inclui um mecanismo de memória entre sessões que utiliza um subagente independente para registrar decisões, problemas e o escopo do projeto ao longo da execução. O modelo já está disponível no GitHub sob licença MIT.
Modelos de IA frontier são geralmente treinados em sequências de números inteiros conhecidas como tokens. Cada token refere-se a uma sequência de bytes, que frequentemente corresponde a palavras comuns. Esta publicação apresenta um algoritmo capaz de computar um tokenizer ótimo em determinados cenários.
O cofundador da CoreWeave, Brannin McBee, argumentou recentemente que o compute não é fungível da maneira que uma commodity exige. Embora ele apresente um argumento válido, essa estruturação de não-commodity é a peça central do valor de sua empresa. Ao sugerir a ausência de um mercado, ele na verdade está precificando o setor e revelando onde as margens de lucro ainda estão ocultas.
Este artigo descreve como um desenvolvedor criou seu próprio LLM do zero. O relato detalha a construção dos scripts de base-training e fine-tuning, além dos pipelines de processamento de dados e do dataset personalizado. O custo total do projeto foi de aproximadamente 80 dólares, contando com o uso de um PC próprio para o processamento dos dados. O código e o modelo resultante estão disponíveis na publicação.
O artigo aborda o processo de profiling no PyTorch, detalhando a transição de um componente nn.Linear padrão para a implementação de um MLP com técnica de fusion.
O debugging de dados preditivo identifica comportamentos potenciais de um modelo antes do treinamento, por meio da análise de datasets de preferência. Essa técnica, integrada à plataforma Silico, permite que engenheiros reformulem datasets ou processos de treinamento para prevenir efeitos indesejados, aprimorando o desempenho e a segurança. Estudos de caso revelam problemas comuns, como guardrails de safety comprometidos, alucinação de links e sycophancy específica ao contexto, permitindo intervenções direcionadas para corrigir falhas antes do deployment.
A Oracle comunicou aos investidores a expectativa de um aumento de capital adicional de 20 bilhões de dólares e reportou um fluxo de caixa livre negativo para o ano. Embora a receita tenha crescido no quarto trimestre fiscal, a expansão da infraestrutura de IA elevou os gastos de capital em 162%, totalizando 55,7 bilhões de dólares. O mercado reagiu negativamente à magnitude desses investimentos, gerando incertezas sobre a capacidade da empresa em converter esses gastos em crescimento de lucro.
O desempenho dos modelos de IA tem melhorado continuamente sem sinais de estagnação. Atualmente, modelos com pesos abertos estão apenas alguns meses atrás dos frontier models em termos de benchmarks. Se a tendência atual persistir, é provável que, até o início de 2029, seja possível rodar um modelo aberto com capacidade equivalente ao Claude Fable 5 em dispositivos equipados com 16 GB de RAM.
O sistema automatizado de pesquisa em IA da Recursive alcançou resultados de estado da arte em treinamento de modelos de linguagem com orçamento fixo, velocidade de modelos pequenos e otimização de kernel de GPU.
As margens brutas de lucro em modelos de assinatura são significativamente inferiores às obtidas via API. Por conta disso, a tendência é que os laboratórios de IA comecem a restringir o acesso a novos recursos ou modelos em seus planos de assinatura.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
