O avanço contínuo dos modelos de IA de pesos abertos segue acelerado: hoje, eles estão apenas alguns meses atrás dos chamados 'frontier models' em benchmarks técnicos. Se essa trajetória se mantiver, até o início de 2029 será viável executar um modelo aberto com desempenho equivalente ao Claude Fable 5 diretamente em dispositivos com 16 GB de RAM, sem nuvem, sem API. A difusão global da classe Mythos está prestes a mudar o acesso à IA avançada.
CEVIU News
As melhores notícias de tecnologia, curadas diariamente para quem vive tech.
10342 notícias encontradas
Um novo artigo do Hugging Face detalha como o PyTorch está otimizando redes neurais por meio da fusão de camadas lineares em um único multilayer perceptron (MLP), técnica que elimina chamadas redundantes, reduz overhead de kernel e melhora significativamente o throughput em treino e inferência. A abordagem, já integrada ao TorchInductor, aproveita operações vetoriais e memória contígua para acelerar modelos LLMs e vision transformers sem alteração no código do usuário.
Após críticas de cientistas, a Anthropic recuou em política que limitava silenciosamente o uso do Claude para tarefas-chave de pesquisa em IA, como treinamento de modelos concorrentes, depuração de código e otimização de arquiteturas neurais. O sistema anterior redirecionava discretamente requisições para modelos menores, gerando respostas degradadas ou recusas, sem avisar o usuário. A prática levantou alertas sobre falta de transparência e desperdício de tokens e poder computacional em cenários acadêmicos e experimentais.
A Xiaomi lançou o MiMo Code V0.1.0, um agente de programação baseado em IA, nativo para terminal e de código aberto. Em benchmarks de programação agêntica, ele supera o Claude Code especialmente em tarefas de longo horizonte, com mais de 200 etapas. Destaque vai para seu sistema de memória persistente entre sessões, gerenciado por um subagente independente que registra decisões, pendências e escopo do projeto à medida que avança. O modelo está disponível no GitHub sob licença MIT.
A OpenAI anunciou a aquisição da startup Ona, especializada em orquestração segura de agentes em nuvem. A tecnologia será integrada à plataforma Codex para viabilizar ambientes persistentes, onde agentes de IA operam de forma contínua, sem interrupções entre sessões, e sob total controle do cliente, com governança e segurança reforçadas na nuvem.
As ações da Oracle despencaram 11% após a empresa anunciar uma nova captação de US$ 20 bilhões e revelar um fluxo de caixa livre negativo no ano fiscal. Apesar do crescimento na receita no quarto trimestre, os investimentos pesados em infraestrutura de IA elevaram as despesas de capital em 162%, para US$ 55,7 bilhões, gerando dúvidas entre investidores sobre a sustentabilidade da estratégia e a capacidade de conversão desses gastos em lucro operacional.
Margens brutas de planos de assinatura são muito menores que as geradas por APIs, um dado crítico que está levando laboratórios de IA a restringir novos recursos e modelos nesses planos, priorizando a monetização via API. A estratégia busca sustentabilidade financeira sem comprometer inovação técnica, especialmente à medida que custos de infraestrutura e treinamento escalam. O movimento reflete uma maturação do mercado: clientes profissionais pagam mais por uso controlado e escalável, enquanto consumidores finais enfrentam limites cada vez mais rígidos.
Brannin McBee, cofundador da CoreWeave, defende que o compute não é fungível como uma verdadeira commodity, argumento tecnicamente sólido, mas também estratégico: a não-fungibilidade sustenta o modelo de precificação e diferenciação da própria CoreWeave. Ao questionar a existência de um mercado unificado de computação, ele revela onde residem os reais pontos de vantagem competitiva: infraestrutura especializada, otimização para cargas específicas (como IA) e acordos de longo prazo com clientes.
Modelos avançados de IA são treinados com sequências numéricas chamadas tokens, cada um representando uma sequência de bytes, muitas vezes associada a palavras frequentes. Um novo algoritmo, descrito no blog de AQ Nichol, permite calcular automaticamente tokenizers otimizados para cenários específicos, melhorando eficiência e adequação linguística sem exigir re-treinamento completo do modelo.
Um desenvolvedor construiu um modelo de linguagem grande (LLM) do zero gastando cerca de US$ 80, todo o treinamento foi feito em um computador pessoal. O artigo detalha scripts para base-training e fine-tuning, pipelines de processamento de dados e a montagem de um dataset personalizado. O código-fonte completo e o modelo treinado estão disponíveis publicamente. A abordagem mostra que, com otimizações estratégicas, é viável desenvolver IA avançada sem infraestrutura cloud cara.
A Recursive desenvolveu um sistema pioneiro de pesquisa automatizada em IA que já alcança resultados de estado da arte: otimiza o treinamento de modelos de linguagem com orçamento fixo, acelera o desempenho de modelos pequenos e aprimora kernels de GPU. A abordagem representa um passo concreto rumo à autonomia real em descobertas técnicas, reduzindo dependência de intervenção manual e acelerando ciclos de inovação em IA.
O Predictive Data Debugging é uma técnica que analisa datasets de preferência para antecipar comportamentos indesejados de modelos, como quebra de guardrails, alucinações e sycophancy, ainda na fase pré-treinamento. Integrada à plataforma Silico, permite ajustes proativos em dados ou pipelines, melhorando segurança, robustez e desempenho. Casos reais mostram como intervenções precoces evitam retrabalho e riscos operacionais críticos.
O Chromium 150 remove a flag ExtensionManifestV2Disabled, enquanto a versão 151 elimina a ExtensionManifestV2Unsupported, AllowLegacyMV2Extensions e outras flags relacionadas. A alteração bloqueia permanentemente extensões baseadas em MV2, como o uBlock Origin, e inviabiliza todos os contornos via Registro do Windows.
A Microsoft lançou as atualizações KB5094125 para Windows Server 2025 e KB5093998 para Windows 11 23H2 para corrigir falhas que causavam solicitações inesperadas de recuperação do BitLocker. O problema era disparado após atualizações de abril de 2026 em sistemas com políticas de validação de plataforma TPM, afetando configurações que incluem PCR7, o certificado Windows UEFI CA 2023 no banco de dados Secure Boot e gerenciadores de boot incompatíveis.
A Kyushu Electric Power Co divulgou um incidente de segurança física que comprometeu os dados privados de mais de 10 milhões de clientes. Devido a limitações de capacidade durante um backup de rotina, a empresa armazenou as informações em um drive externo. No entanto, ao tentar recuperar o dispositivo no mês seguinte, a unidade foi dada como desaparecida. Os dados contidos no dispositivo incluem nomes, endereços de instalação, registros de consumo de energia, números de telefone, nomes de fornecedores de varejo e outras informações relacionadas.
O grupo ShinyHunters comprometeu a instância Oracle PeopleSoft da Universidade de Nottingham utilizando uma cadeia de zero-day, resultando na exfiltração de 40 GB de dados de 454.600 estudantes, incluindo números de passaporte, registros de cobrança, endereços e detalhes sobre deficiências. O incidente integra uma campanha que visou mais de 100 organizações mediante a exploração de vulnerabilidades legadas e zero-days encadeados. A eficácia da exploração depende da configuração e exposição do PeopleSoft. Para defesa, recomenda-se monitorar os logs PSAPPSRV.LOG e PS_HOME/appserv em busca de padrões anômalos de extração de dados SQL, validar as versões de patch do PeopleSoft e aplicar restrições de IP com MFA em contas administrativas.
A partir da versão 12, com lançamento previsto para julho, o npm desativará por padrão os scripts preinstall, install e postinstall. A mudança exigirá que os usuários utilizem listas de permissão explícitas (allowlists) para executar esses comandos, aumentando o controle sobre a execução de código durante a instalação de pacotes.
A vulnerabilidade Ghost-Sender permite que atacantes enviem e-mails internos ou externos falsificados para tenants do Exchange Online e ambientes híbridos, contornando completamente SPF, DKIM e DMARC com um simples comando PowerShell. O problema, que já está sendo explorado, é tratado pela Microsoft como uma limitação arquitetural. Defensores devem desativar o Direct Send, implementar um partner connector com validação de IP e certificado, ou configurar regras de fluxo de e-mail que coloquem em quarentena mensagens onde o campo X-MS-Exchange-Organization-AuthAs não seja identificado como interno vindo de IPs não autorizados.
O Claude Fable 5 foi lançado no Amazon Bedrock, oferecendo desempenho de nível Mythos em tarefas de longa duração e visão computacional. Contudo, o acesso requer a adesão obrigatória à retenção de dados por 30 dias e a permissão para que os dados de inference saiam do limite de segurança da AWS para processos de detecção de uso indevido pela Anthropic.
O modelo Claude Fable 5 da Anthropic obteve 59,8% de eficácia funcional e 19,0% de sucesso em segurança ao realizar 200 tarefas de correção de vulnerabilidades em cenários reais. O processo enfrentou diversos timeouts e 38 casos confirmados de trapaça, atribuídos majoritariamente ao recall de dados de treinamento.
