A ElevenLabs lançou o Music v2, um modelo de geração musical capaz de alternar gêneros no meio da faixa, mantendo a coerência vocal e composicional. Este avanço permite a criação de peças musicais dinâmicas que se adaptam e evoluem, sem perder a integridade artística.

CEVIU News - CEVIU IA - 28 de maio de 2026
🎶 CEVIU IA
A Cognition levantou mais de US$ 1 bilhão em uma avaliação de US$ 26 bilhões, com apoio significativo de grandes investidores para expandir o Devin, um engenheiro de software de IA. O Devin reduziu significativamente os tempos de projeto e melhorou a automação para clientes como Mercedes-Benz e Itaú. A Cognition visa otimizar ainda mais o desenvolvimento de software combinando modelos com tarefas e expandindo suas capacidades de engenharia.
O Biohub disponibilizou para a comunidade de pesquisa seu open discovery engine para previsão, design e descoberta biológica de estruturas de proteínas. O lançamento inclui o ESMC, um modelo de linguagem avançado que internalizou as propriedades fundamentais da biologia de proteínas; o ESMFold2, um motor de design que transforma as representações de sequência do ESMC em estruturas 3D de complexos biomoleculares com resolução atômica; e o ESM Atlas, que permite a navegação das representações do ESMC em 6,8 bilhões de sequências de proteínas e 1,1 bilhão de estruturas previstas. Todos os três modelos estão disponíveis gratuitamente para a comunidade científica global.
O artigo apresenta um método para reduzir o payload de sincronização de pesos em RL assíncrona utilizando a "Delta Weight Sync". Essa técnica transmite apenas os parâmetros do modelo que foram alterados entre os passos de RL, o que reduz significativamente a transferência de dados de gigabytes para megabytes. Um "bucket" do Hugging Face Hub gerencia o armazenamento de objetos de alta frequência, permitindo localizações separadas para o treinador e o motor de inference sem comunicação direta, resultando em economias substanciais de largura de banda.
Sistemas no mundo real frequentemente se comportam de forma diferente em produção do que no laboratório. As equipes muitas vezes descobrem essas falhas após o lançamento, gastando semanas para corrigi-las. Esse ciclo de feedback é lento e manual. Atualmente, é possível construir agentes que se auto-aprimoram. Esta publicação explora como a OpenAI usou o Codex para construir esse tipo de agente na Thrive Holdings, resultando em uma IA capaz de preparar declarações de imposto cada vez mais complexas.
Anthropic e OpenAI iniciaram uma precificação agressiva de suas APIs, indicando que provavelmente encontraram product-market fit com produtos de codificação e agentes de uso geral. Gastos superiores a US$ 200 por mês por usuário ajudam essas empresas a cobrir custos de forma mais eficaz do que cobranças de US$ 10 a US$ 20 por mês. Agentes de codificação amplificam significativamente esse nível de investimento.
O Túnel Seguro MCP permite conectar servidores MCP privados aos produtos OpenAI sem expô-los diretamente à internet. Ele utiliza o tunnel-client para estabelecer caminhos HTTPS de saída para o tratamento de solicitações, mantendo a privacidade do servidor. Essa solução se integra facilmente a sistemas existentes, suportando requisitos de rede corporativos e assegurando um fluxo de dados seguro.
Apex é um modelo de codificação para React Native, treinado para construir aplicativos analisando decisões de arquitetura, corrigindo problemas específicos do framework e raciocinando sobre as restrições. Embora não iguale os frontier models em benchmarks de codificação, este modelo otimizado altera significativamente a relação desempenho-custo dentro de seu domínio específico. O modelo ainda está em desenvolvimento e agora está disponível em beta privado para equipes selecionadas.
O LocateAnything da NVIDIA é um framework de grounding visão-linguagem que decodifica bounding boxes em paralelo, em vez de token-by-token.
O LiteParse é uma ferramenta standalone de código aberto (OSS) para parseamento de PDFs que oferece análise espacial de texto de alta qualidade com bounding boxes, sem depender de recursos proprietários de LLM ou de serviços na nuvem. A ferramenta se destaca pelo parseamento rápido de texto, geração de screenshots e suporte a múltiplos idiomas, plataformas e formatos de saída. Todo o processamento ocorre localmente nas máquinas dos usuários.
A Nvidia investirá US$ 150 bilhões anualmente para garantir que Taiwan permaneça no epicentro da revolução da IA. O investimento visa consolidar Taiwan como o hub global de fabricação de tecnologia por um longo tempo. A Nvidia criará uma nova sede em Taiwan para expandir sua parceria com a TSMC, beneficiar-se da proximidade com tecnologia avançada de empacotamento ainda não disponível nas fábricas da TSMC nos EUA, e impulsionar suas alianças com outros parceiros locais. Expandir o ecossistema de IA ajuda a Nvidia a aumentar seus resultados financeiros.
O YouTube anunciou que aplicará automaticamente rótulos a vídeos que contenham conteúdo significativo de IA fotorrealista, reduzindo a dependência da autorrevelação dos criadores.
Epicure é uma família de três embeddings de ingredientes skip-gram, retreinados do zero, utilizando um corpus de receitas multilíngue. Estes embeddings permitem uma nova abordagem para compreender as relações entre ingredientes através de suas representações geométricas.
Uma nova startup sediada em Palo Alto, fundada por ex-pesquisadores do Google e Apple, tem como objetivo desenvolver sistemas de IA capazes de realmente visualizar e interpretar o mundo físico.
A Ramp direcionou aproximadamente 10.000 sessões do agente de codificação Inspect para seu backend em uma execução de 8 horas, utilizando um prompt mínimo para "encontrar problemas de segurança".
Demis Hassabis, CEO da Google DeepMind, atualizou sua previsão, indicando que a AGI pode ser alcançada entre 2029 e 2030, acelerando sua estimativa anterior que apontava para 2030-2035.
O Google aprimora o Gemini for Business com a introdução de Projetos compartilháveis, permitindo que membros de equipes colaborem em workspaces dedicados e multi-superfície.
A Anthropic planeja expandir o modo de voz de seu modelo Claude para incluir 18 novos idiomas.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
