Construindo um Modelo OCR Multilíngue Rápido com Dados Sintéticos
O NEMOTRON OCR V2, desenvolvido com dados sintéticos, é um modelo OCR multilíngue rápido e preciso que alcança melhorias significativas na acurácia, reduzindo as pontuações NED para quase zero em idiomas não-ingleses.
Utilizando um pipeline de dados sintéticos com texto mOSCAR e diversas fontes, o modelo é treinado com anotações pixel-perfect em diferentes idiomas, permitindo a generalização para documentos do mundo real. Sua arquitetura unificada reutiliza feature maps, atingindo velocidades de 34,7 páginas por segundo em uma única GPU A100 e superando modelos especializados em tarefas de OCR para idiomas diversos.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 20 de abril de 2026
- Fonte
- CEVIU IA
