CEVIU Logo
CEVIU News

CEVIU News - CEVIU IA - 23 de junho de 2026

15 notícias23 de junho de 2026CEVIU IA
Compartilhar:

CEVIU IA

Morph LLM otimiza modelos abertos de código treinando um drafter nos próprios resultados de coding, e não na internet, para acelerar o speculative decoding, chegando a um ganho de 3,07x. Autoresearch automatiza o ajuste de kernels para GPUs mais modestas, como NVIDIA e AMD, aprimora kernels warp-decode para atingir 162 tok/s em hardware acessível. Já o interconnect over PCIe substitui o caro NVLink com kernels customizados, mantém o desempenho ao compartilhar caches via TCP e reduz o time-to-first-token em 84%.

Os fluxos de trabalho de código com IA estão migrando do prompt engineering para o loop engineering, em que desenvolvedores constroem sistemas que repetidamente fazem prompts aos agentes, avaliam as respostas e re-promptam até atingir uma meta mensurável.

Sakana Fugu é um sistema multiagente que se comporta como um único modelo. Ele pode decidir se responde diretamente a uma solicitação ou se coordena uma equipe de modelos especialistas, cuidando da seleção de modelos, da delegação, da verificação e da síntese. Para o usuário, basta chamar um modelo, enquanto o trabalho é executado por um sistema orquestrado de especialistas. Sakana Fugu e Fugu Ultra estão disponíveis hoje por meio de uma única API compatível com OpenAI.

Mercury 2 é um modelo de linguagem de raciocínio que gera cerca de 1.000 tokens por segundo. Ele usa diffusion, o mesmo truque que transforma uma imagem estática em uma foto em geradores como Stable Diffusion. O modelo é mais indicado para partes de fluxos de trabalho sensíveis a velocidade e de alto volume do que para os desafios mais difíceis de raciocínio frontier. Ele está disponível apenas via API/cloud.

Claude Fable 5 e Claude Mythos 5 foram interrompidos pela Casa Branca por meio da imposição de controles de exportação. A administração Trump disse que a medida ocorreu por causa de um jailbreak do Fable, mas isso acabou sendo apenas a instrução "fix this code". A Anthropic recebeu a ordem de corrigir esse jailbreak, algo impossível, e já se passou mais de uma semana desde a pausa na implantação sem melhora na situação.

Uma auditoria de transparência concluiu que o DiffusionGemma continuou tão monitorável quanto o Gemma, apesar da arquitetura baseada em diffusion. A análise apontou a diferença entre transparência variável e transparência algorítmica e examinou fenômenos como non-chronological reasoning, token smearing e intermediate-context reasoning.

Um experimento mental especulativo chamado Europe 2031, escrito por integrantes de um think tank baseado em Bruxelas, pinta um mundo em que a falta de investimento da Europa em datacenters a deixa muito atrás dos EUA e da China. Nesse cenário, a economia europeia fica em ruínas por não ter sua própria IA. O texto também retrata populismo em alta, o euro instável e ataques cibernéticos devastando empresas da UE. O cenário foi lido por membros do Parlamento Europeu e citado em conversas entre autoridades britânicas e alemãs na semana passada.

Uma parte importante da jornada de busca por emprego envolve lidar com todas as emoções que surgem ao estar no mercado. Há muita percepção social a administrar. Também pode ser estressante navegar por um grande espaço de decisões com informações incompletas, em que pequenas escolhas têm um impacto desproporcional. Este texto analisa como é a experiência de procurar emprego neste momento.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser