CEVIU News

CEVIU News - CEVIU IA - 21 de abril de 2026

16 notícias21 de abril de 2026CEVIU IA
Compartilhar:

🚀 CEVIU IA

O Kimi K2.6, da Moonshot AI, foi lançado no Kimi Chat e via APIs, oferecendo capacidades robustas para tarefas de codificação e agentic nos modos de chat e agente em kimi.com, com seus pesos disponíveis no Hugging Face. A linha inclui o K2.6 Instant para respostas rápidas, o K2.6 Thinking para raciocínio complexo, o K2.6 Agent para tarefas de documentos e web, e o K2.6 Agent Swarm para processamento em larga escala. A Moonshot AI afirma que o Kimi K2.6 alcança as maiores pontuações em benchmarks de código aberto, superando concorrentes como GPT-5.4 e Claude Opus 4.6 em testes como SWE-bench Multilingual e BrowseComp.

Chronicle, disponível para usuários do ChatGPT Pro no macOS, aprimora o Codex ao utilizar o contexto da tela para construir memória. Isso permite que o Codex compreenda o trabalho em andamento com menos necessidade de reafirmação de contexto. A ferramenta armazena memórias em markdown não criptografadas diretamente no dispositivo e exige permissões de Gravação de Tela e Acessibilidade do macOS. É crucial estar ciente dos riscos de prompt injection advindos do conteúdo da tela, sendo recomendado pausar o Chronicle durante trabalhos sensíveis para evitar a captura indesejada de contexto.

A versão de prévia Qwen3.6-Max-Preview apresenta maior conhecimento de mundo e melhor capacidade de seguir instruções, além de aprimoramentos significativos nas capacidades de codificação baseadas em agentes, evidenciados em uma ampla gama de benchmarks. O modelo ainda está em desenvolvimento ativo, com pesquisadores continuando a aprimorá-lo. Usuários podem interagir com o modelo conversando no Qwen Studio ou fazendo chamadas via API no Alibaba Cloud Model Studio API (em breve).

A startup de IA de Jeff Bezos, que busca desenvolver modelos com capacidade de compreender o mundo físico, está perto de finalizar uma rodada de financiamento de US$ 10 bilhões. A empresa, com nome-código Project Prometheus, utilizará a IA para acelerar a engenharia e a manufatura em setores como o aeroespacial e o automotivo. Ela foi estabelecida com um financiamento inicial de US$ 6,2 bilhões, parcialmente provido pelo próprio Bezos. A nova rodada de financiamento, que deve ser concluída em breve, mas ainda não foi finalizada, incluirá JPMorgan e BlackRock como investidores.

A Meta introduziu o Effective Training Time (ETT%) para medir a porcentagem do runtime de treino de ponta a ponta que é realmente dedicada ao aprendizado efetivo, evidenciando overheads como checkpointing e falhas. Esta publicação detalha otimizações em nível de sistema e no PyTorch que visam reduzir o tempo desperdiçado e aprimorar a eficiência do treino em larga escala.

Mesmo modelos que se declaram 'não censurados' redirecionam discretamente a linguagem, desviando-a das palavras que as frases realmente intencionam. Não há recusa ou aviso explícito; a probabilidade de certas palavras é simplesmente alterada em algumas instâncias. Este mecanismo pode ser utilizado para moldar o que bilhões de usuários leem, sem que eles percebam.

O Gemini CLI do Google agora inclui subagentes para dividir tarefas de codificação, aprimorando a execução paralela ao delegar funções específicas, como atualizações de frontend ou testes. Isso permite que múltiplas tarefas sejam processadas simultaneamente sem interferência, otimizando os workflows para desenvolvedores. A configuração do Gemini se diferencia de sistemas como o Claude Code, que estende a coordenação de agentes por múltiplas sessões.

FlashDrive é um framework de co-design algoritmo-sistema que reduz a latência de ponta a ponta para 159ms com perda de precisão insignificante. A inference VLA é uma cascata de estágios, cada um ocultando uma forma diferente de redundância. Sobreposição temporal na visão, baixa entropia no raciocínio, suavidade de velocidade no flow matching e headroom numérico nos pesos, cada um permite um atalho direcionado. Os ganhos de velocidade se acumulam em 4,5x com perda de precisão insignificante, porque as redundâncias são ortogonais.

Os EUA estão no processo de uma expansão sem precedentes da infraestrutura de IA. O Stargate é um empreendimento de US$ 500 bilhões que envolve a OpenAI, Oracle e SoftBank. O projeto de infraestrutura de IA possui sete locais nos EUA que atualmente apresentam desenvolvimento ativo. Eles somam atualmente mais de 9 gigawatts de capacidade planejada, o suficiente para alimentar o equivalente a 20 milhões de GPUs Nvidia H100 – a quantidade total de compute de IA no mundo ao final de 2025. Esta publicação analisa cada um dos locais e como estão sendo desenvolvidos atualmente.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser