Voltar

Apresentando NVIDIA Nemotron 3 Nano Omni: Inteligência Multimodal de Contexto Longo para Agentes de Documentos, Áudio e Vídeo

O Nemotron 3 Nano Omni da NVIDIA é um novo modelo multimodal projetado para análise de documentos, áudio e vídeo, alcançando precisão de ponta em benchmarks como MMlongbench-Doc e VoiceBench. Sua arquitetura híbrida Mamba-Transformer é integrada com codificadores especializados para visão e áudio, permitindo o processamento eficiente em contextos multimodais extensos.

Este modelo aprimora significativamente o throughput e a velocidade de raciocínio para diversas aplicações práticas, incluindo análise de documentos, reconhecimento automático de fala e compreensão de vídeo.

Avalie este artigo:
Compartilhar:
Categoria
CEVIU IA
Publicado
30 de abril de 2026
Fonte
CEVIU IA

Quer receber mais sobre CEVIU IA?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser
Apresentando NVIDIA Nemotron 3 Nano Omni: Inteligência Multimodal de Contexto Longo para Agentes de Documentos, Áudio e Vídeo — CEVIU News