Apresentando NVIDIA Nemotron 3 Nano Omni: Inteligência Multimodal de Contexto Longo para Agentes de Documentos, Áudio e Vídeo
O Nemotron 3 Nano Omni da NVIDIA é um novo modelo multimodal projetado para análise de documentos, áudio e vídeo, alcançando precisão de ponta em benchmarks como MMlongbench-Doc e VoiceBench. Sua arquitetura híbrida Mamba-Transformer é integrada com codificadores especializados para visão e áudio, permitindo o processamento eficiente em contextos multimodais extensos.
Este modelo aprimora significativamente o throughput e a velocidade de raciocínio para diversas aplicações práticas, incluindo análise de documentos, reconhecimento automático de fala e compreensão de vídeo.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 30 de abril de 2026
- Fonte
- CEVIU IA
