O Thinking Machines Lab apresentou uma prévia de pesquisa dos modelos de interação para colaboração humano-IA em tempo real através de áudio, vídeo e texto. Os modelos são treinados do zero com design multi-stream para responsividade em tempo real, permitindo troca constante e eliminando as limitações tradicionais baseadas em turnos. Esta abordagem escalável promete maior interatividade e inteligência com aplicações práticas em diversos domínios.

CEVIU News - CEVIU IA - 13 de maio de 2026
🤖 CEVIU IA
O modelo de vídeo Gemini Omni do Google apareceu antes do I/O, integrando remix e edição de vídeo diretamente no chat. O feedback inicial destaca suas capacidades de edição robustas, como remoção de marca d'água e troca de objetos, embora fique atrás na qualidade cinematográfica bruta comparado a concorrentes como o Seedance 2 da ByteDance. O modelo pode ser lançado em versões escalonadas, possivelmente Flash e Pro, como parte de uma estratégia mais ampla para unificar modalidades sob o Gemini.
Elon Musk anunciou que a xAI será dissolvida e integrada à SpaceX como uma nova divisão chamada SpaceXAI. A SpaceXAI ficará responsável por projetos de IA como a plataforma X e o Grok, colocando-os sob a marca SpaceX. A mudança simplifica as operações, melhora a integração vertical e alinha os esforços de IA com os objetivos estratégicos da SpaceX.
A AWS detalhou como o scaling de foundation models evoluiu além do pré-treinamento para incluir pós-treinamento e test-time compute, junto com a infraestrutura distribuída necessária para suportar cada estágio de forma eficiente.
O IPO em alta da Cerebras sinaliza uma divisão entre "inference para respostas" otimizada para velocidade de tokens e "inference para agentes" otimizada para hierarquia de memória. O WSE-3 da Cerebras tem 44GB de SRAM on-chip a 21 PB/s, aproximadamente 6.000 vezes a largura de banda de memória de um H100, sendo perfeito para respostas de baixa latência voltadas ao usuário, incluindo voz e wearables de IA, mas inadequado quando caches KV e pesos do modelo excedem a capacidade on-chip.
O A²RD introduz um framework agentic de diffusion autoregressive para gerar vídeos longos e coerentes através de retrieval iterativo, síntese, refinamento e atualizações de memória.
Os Normalizing Trajectory Models substituem os passos padrão de denoising do diffusion por normalizing flows condicionais, permitindo geração de imagens em quatro passos enquanto mantêm treinamento de likelihood exato e suportam self-distillation.
Bedi executa um ciclo completo de desenvolvimento de agentes através de cinco prompts do Claude Code que estruturam, endurecem contra especificações, adicionam capacidades, corrigem falhas de avaliação e reconciliam divergências entre documentação, código e configuração em sua plataforma baseada em Agno. O loop Improve deriva 8-12 testes das instruções do agente, executa cada um contra o container ativo via cURL, julga PASS ou FAIL dos logs do container, então itera até cinco rodadas escolhendo alavancas como endurecer regras, trocar ferramentas ou aumentar num_history_runs até os testes passarem, enquanto Hill Climb executa a suíte de avaliação salva e corrige regressões no local.
Olivia Moore da a16z migrou seus workflows agentic do Claude Cowork e Claude no Chrome para o Codex da OpenAI, recomendando que a maioria dos trabalhadores do conhecimento não-técnicos faça o mesmo. Com o app desktop de fevereiro, Plugins e Automations, o Codex consolida a troca entre interfaces ChatGPT-Claude-Cowork em um só produto. O Codex oferece Skills instaláveis com um clique que ela espera que ancorem um marketplace interno e entre usuários, considerando que as taxas de tentativa de setup de Skills por não-programadores provavelmente ficam abaixo de 10% no Claude. Os Codex Pets fornecem atualizações de status de tarefas com baixo atrito para usuários que não vivem em um IDE.
A IA carece de criatividade semelhante à humana devido à ausência de impulsos intrínsecos e experiências subjetivas. Emular sentimentos poderia aprimorar as capacidades criativas da IA, mas levanta questões éticas. Projetar IA para genuinamente sentir e desejar pode levar a consequências não intencionais, similar à responsabilidade vista na parentalidade.
Ilya Sutskever, cofundador e ex-cientista-chefe da OpenAI, é um dos maiores acionistas individuais da startup de IA.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
