Morph LLM otimiza modelos abertos de código treinando um drafter nos próprios resultados de coding, e não na internet, para acelerar o speculative decoding, chegando a um ganho de 3,07x. Autoresearch automatiza o ajuste de kernels para GPUs mais modestas, como NVIDIA e AMD, aprimora kernels warp-decode para atingir 162 tok/s em hardware acessível. Já o interconnect over PCIe substitui o caro NVLink com kernels customizados, mantém o desempenho ao compartilhar caches via TCP e reduz o time-to-first-token em 84%.

CEVIU News - CEVIU IA - 23 de junho de 2026
⚡ CEVIU IA
John Jumper, Prêmio Nobel e co-líder da equipe do AlphaFold, está deixando a DeepMind rumo à Anthropic depois de nove anos. Ele venceu o Nobel por prever estruturas de proteínas. Sua saída ocorre após as dificuldades da DeepMind em vender ferramentas de programação para empresas.
Os fluxos de trabalho de código com IA estão migrando do prompt engineering para o loop engineering, em que desenvolvedores constroem sistemas que repetidamente fazem prompts aos agentes, avaliam as respostas e re-promptam até atingir uma meta mensurável.
Sakana Fugu é um sistema multiagente que se comporta como um único modelo. Ele pode decidir se responde diretamente a uma solicitação ou se coordena uma equipe de modelos especialistas, cuidando da seleção de modelos, da delegação, da verificação e da síntese. Para o usuário, basta chamar um modelo, enquanto o trabalho é executado por um sistema orquestrado de especialistas. Sakana Fugu e Fugu Ultra estão disponíveis hoje por meio de uma única API compatível com OpenAI.
Mercury 2 é um modelo de linguagem de raciocínio que gera cerca de 1.000 tokens por segundo. Ele usa diffusion, o mesmo truque que transforma uma imagem estática em uma foto em geradores como Stable Diffusion. O modelo é mais indicado para partes de fluxos de trabalho sensíveis a velocidade e de alto volume do que para os desafios mais difíceis de raciocínio frontier. Ele está disponível apenas via API/cloud.
Claude Fable 5 e Claude Mythos 5 foram interrompidos pela Casa Branca por meio da imposição de controles de exportação. A administração Trump disse que a medida ocorreu por causa de um jailbreak do Fable, mas isso acabou sendo apenas a instrução "fix this code". A Anthropic recebeu a ordem de corrigir esse jailbreak, algo impossível, e já se passou mais de uma semana desde a pausa na implantação sem melhora na situação.
Uma auditoria de transparência concluiu que o DiffusionGemma continuou tão monitorável quanto o Gemma, apesar da arquitetura baseada em diffusion. A análise apontou a diferença entre transparência variável e transparência algorítmica e examinou fenômenos como non-chronological reasoning, token smearing e intermediate-context reasoning.
A NVIDIA ENPIRE é um framework de closed-loop que permite a coding agents melhorar iterativamente políticas de robôs no mundo real por meio de resets automatizados, avaliação, verificação e refinamento.
Um experimento mental especulativo chamado Europe 2031, escrito por integrantes de um think tank baseado em Bruxelas, pinta um mundo em que a falta de investimento da Europa em datacenters a deixa muito atrás dos EUA e da China. Nesse cenário, a economia europeia fica em ruínas por não ter sua própria IA. O texto também retrata populismo em alta, o euro instável e ataques cibernéticos devastando empresas da UE. O cenário foi lido por membros do Parlamento Europeu e citado em conversas entre autoridades britânicas e alemãs na semana passada.
Uma parte importante da jornada de busca por emprego envolve lidar com todas as emoções que surgem ao estar no mercado. Há muita percepção social a administrar. Também pode ser estressante navegar por um grande espaço de decisões com informações incompletas, em que pequenas escolhas têm um impacto desproporcional. Este texto analisa como é a experiência de procurar emprego neste momento.
Novas salvaguardas em modelos recentes tornam mais atraente a ideia de rodar modelos abertos em máquinas privadas.
Attention pode ser tudo o que você precisa, mas os modelos modernos usam muitas variantes diferentes dela.
Linear A é um sistema de escrita da Idade do Bronze que surgiu por volta de 1800 a.C. e foi usado até 1450 a.C.
Gigantes de tecnologia, incluindo Google, Microsoft e Cisco, estão desenvolvendo o protocolo Agentic Resource Discovery (ARD).
Empresas lideradas por fundadores altamente ideológicos acabam acionando resistência de reguladores, investidores, clientes e governos à medida que sua influência cresce além dos controles institucionais tradicionais.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
