O Kimi K2.6, da Moonshot AI, foi lançado no Kimi Chat e via APIs, oferecendo capacidades robustas para tarefas de codificação e agentic nos modos de chat e agente em kimi.com, com seus pesos disponíveis no Hugging Face. A linha inclui o K2.6 Instant para respostas rápidas, o K2.6 Thinking para raciocínio complexo, o K2.6 Agent para tarefas de documentos e web, e o K2.6 Agent Swarm para processamento em larga escala. A Moonshot AI afirma que o Kimi K2.6 alcança as maiores pontuações em benchmarks de código aberto, superando concorrentes como GPT-5.4 e Claude Opus 4.6 em testes como SWE-bench Multilingual e BrowseComp.

CEVIU News - CEVIU IA - 21 de abril de 2026
🚀 CEVIU IA
Chronicle, disponível para usuários do ChatGPT Pro no macOS, aprimora o Codex ao utilizar o contexto da tela para construir memória. Isso permite que o Codex compreenda o trabalho em andamento com menos necessidade de reafirmação de contexto. A ferramenta armazena memórias em markdown não criptografadas diretamente no dispositivo e exige permissões de Gravação de Tela e Acessibilidade do macOS. É crucial estar ciente dos riscos de prompt injection advindos do conteúdo da tela, sendo recomendado pausar o Chronicle durante trabalhos sensíveis para evitar a captura indesejada de contexto.
A versão de prévia Qwen3.6-Max-Preview apresenta maior conhecimento de mundo e melhor capacidade de seguir instruções, além de aprimoramentos significativos nas capacidades de codificação baseadas em agentes, evidenciados em uma ampla gama de benchmarks. O modelo ainda está em desenvolvimento ativo, com pesquisadores continuando a aprimorá-lo. Usuários podem interagir com o modelo conversando no Qwen Studio ou fazendo chamadas via API no Alibaba Cloud Model Studio API (em breve).
A startup de IA de Jeff Bezos, que busca desenvolver modelos com capacidade de compreender o mundo físico, está perto de finalizar uma rodada de financiamento de US$ 10 bilhões. A empresa, com nome-código Project Prometheus, utilizará a IA para acelerar a engenharia e a manufatura em setores como o aeroespacial e o automotivo. Ela foi estabelecida com um financiamento inicial de US$ 6,2 bilhões, parcialmente provido pelo próprio Bezos. A nova rodada de financiamento, que deve ser concluída em breve, mas ainda não foi finalizada, incluirá JPMorgan e BlackRock como investidores.
A AllenAI descreve uma abordagem de pós-treinamento que constrói especialistas de domínio independentes e os combina usando uma arquitetura Mixture-of-Experts. Esse método permite que os modelos adquiram novas capacidades sem a necessidade de retreino completo ou a degradação de habilidades já existentes.
A Meta introduziu o Effective Training Time (ETT%) para medir a porcentagem do runtime de treino de ponta a ponta que é realmente dedicada ao aprendizado efetivo, evidenciando overheads como checkpointing e falhas. Esta publicação detalha otimizações em nível de sistema e no PyTorch que visam reduzir o tempo desperdiçado e aprimorar a eficiência do treino em larga escala.
Mesmo modelos que se declaram 'não censurados' redirecionam discretamente a linguagem, desviando-a das palavras que as frases realmente intencionam. Não há recusa ou aviso explícito; a probabilidade de certas palavras é simplesmente alterada em algumas instâncias. Este mecanismo pode ser utilizado para moldar o que bilhões de usuários leem, sem que eles percebam.
O Gemini CLI do Google agora inclui subagentes para dividir tarefas de codificação, aprimorando a execução paralela ao delegar funções específicas, como atualizações de frontend ou testes. Isso permite que múltiplas tarefas sejam processadas simultaneamente sem interferência, otimizando os workflows para desenvolvedores. A configuração do Gemini se diferencia de sistemas como o Claude Code, que estende a coordenação de agentes por múltiplas sessões.
O Qwen3.5-Omni escala para centenas de bilhões de parâmetros utilizando uma arquitetura MoE híbrida. O modelo suporta entradas multimodais de longo contexto, processando informações em texto, áudio e vídeo.
O TIPSv2 aprimora o pré-treinamento de visão-linguagem combinando distillation, objetivos self-supervised aprimorados e dados de legendas mais ricos. Os modelos resultantes alcançam um desempenho robusto em tarefas multimodais, com ganhos notáveis em zero-shot segmentation.
FlashDrive é um framework de co-design algoritmo-sistema que reduz a latência de ponta a ponta para 159ms com perda de precisão insignificante. A inference VLA é uma cascata de estágios, cada um ocultando uma forma diferente de redundância. Sobreposição temporal na visão, baixa entropia no raciocínio, suavidade de velocidade no flow matching e headroom numérico nos pesos, cada um permite um atalho direcionado. Os ganhos de velocidade se acumulam em 4,5x com perda de precisão insignificante, porque as redundâncias são ortogonais.
Os EUA estão no processo de uma expansão sem precedentes da infraestrutura de IA. O Stargate é um empreendimento de US$ 500 bilhões que envolve a OpenAI, Oracle e SoftBank. O projeto de infraestrutura de IA possui sete locais nos EUA que atualmente apresentam desenvolvimento ativo. Eles somam atualmente mais de 9 gigawatts de capacidade planejada, o suficiente para alimentar o equivalente a 20 milhões de GPUs Nvidia H100 – a quantidade total de compute de IA no mundo ao final de 2025. Esta publicação analisa cada um dos locais e como estão sendo desenvolvidos atualmente.
A Microsoft planeja suspender temporariamente os novos registros de contas individuais no GitHub Copilot. O custo semanal de operação do serviço dobrou desde o início do ano. A Microsoft pretende apertar os limites de taxa para contas individuais e empresariais, além de remover o acesso a determinados modelos para assinaturas mais baratas.
Os live artifacts são dashboards e trackers conectados a aplicativos e arquivos com dados atuais.
Anthropic e Amazon expandiram sua colaboração para garantir até 5 gigawatts de capacidade computacional, suportando o treinamento e a implantação do Claude.
Esta é uma lista das nove melhores coisas que Demis Hassabis e Sebastian Mallaby disseram em sua apresentação em São Francisco.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
