CEVIU Logo
CEVIU News

CEVIU News - CEVIU IA - 12 de junho de 2026

12 notícias12 de junho de 2026CEVIU IA
Compartilhar:

🤝 CEVIU IA

A Anthropic decidiu tornar visíveis as suas salvaguardas para o desenvolvimento de LLMs de fronteira após sofrer críticas de pesquisadores. Anteriormente, a empresa redirecionava discretamente solicitações para um modelo inferior quando este era requisitado para executar tarefas específicas. Pesquisadores descobriram que o Claude estava recusando ou degradando respostas para tarefas como o treinamento de modelos concorrentes, debugging de código de IA e otimização de arquitetura neural. O caso gerou preocupações sobre a falta de transparência da Anthropic e o desperdício de tokens e recursos computacionais em modelos que não entregavam o desempenho esperado.

O MiMo Code V0.1.0 é um assistente de codificação IA open source focado em terminal desenvolvido pela Xiaomi. A ferramenta supera o Claude Code em benchmarks de codificação agentic, apresentando desempenho superior especialmente em tarefas de longo horizonte com múltiplas etapas. O sistema inclui um mecanismo de memória entre sessões que utiliza um subagente independente para registrar decisões, problemas e o escopo do projeto ao longo da execução. O modelo já está disponível no GitHub sob licença MIT.

Modelos de IA frontier são geralmente treinados em sequências de números inteiros conhecidas como tokens. Cada token refere-se a uma sequência de bytes, que frequentemente corresponde a palavras comuns. Esta publicação apresenta um algoritmo capaz de computar um tokenizer ótimo em determinados cenários.

O cofundador da CoreWeave, Brannin McBee, argumentou recentemente que o compute não é fungível da maneira que uma commodity exige. Embora ele apresente um argumento válido, essa estruturação de não-commodity é a peça central do valor de sua empresa. Ao sugerir a ausência de um mercado, ele na verdade está precificando o setor e revelando onde as margens de lucro ainda estão ocultas.

Este artigo descreve como um desenvolvedor criou seu próprio LLM do zero. O relato detalha a construção dos scripts de base-training e fine-tuning, além dos pipelines de processamento de dados e do dataset personalizado. O custo total do projeto foi de aproximadamente 80 dólares, contando com o uso de um PC próprio para o processamento dos dados. O código e o modelo resultante estão disponíveis na publicação.

O debugging de dados preditivo identifica comportamentos potenciais de um modelo antes do treinamento, por meio da análise de datasets de preferência. Essa técnica, integrada à plataforma Silico, permite que engenheiros reformulem datasets ou processos de treinamento para prevenir efeitos indesejados, aprimorando o desempenho e a segurança. Estudos de caso revelam problemas comuns, como guardrails de safety comprometidos, alucinação de links e sycophancy específica ao contexto, permitindo intervenções direcionadas para corrigir falhas antes do deployment.

A Oracle comunicou aos investidores a expectativa de um aumento de capital adicional de 20 bilhões de dólares e reportou um fluxo de caixa livre negativo para o ano. Embora a receita tenha crescido no quarto trimestre fiscal, a expansão da infraestrutura de IA elevou os gastos de capital em 162%, totalizando 55,7 bilhões de dólares. O mercado reagiu negativamente à magnitude desses investimentos, gerando incertezas sobre a capacidade da empresa em converter esses gastos em crescimento de lucro.

O desempenho dos modelos de IA tem melhorado continuamente sem sinais de estagnação. Atualmente, modelos com pesos abertos estão apenas alguns meses atrás dos frontier models em termos de benchmarks. Se a tendência atual persistir, é provável que, até o início de 2029, seja possível rodar um modelo aberto com capacidade equivalente ao Claude Fable 5 em dispositivos equipados com 16 GB de RAM.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser