Voltar

Construindo um Modelo OCR Multilíngue Rápido com Dados Sintéticos

O NEMOTRON OCR V2, desenvolvido com dados sintéticos, é um modelo OCR multilíngue rápido e preciso que alcança melhorias significativas na acurácia, reduzindo as pontuações NED para quase zero em idiomas não-ingleses.

Utilizando um pipeline de dados sintéticos com texto mOSCAR e diversas fontes, o modelo é treinado com anotações pixel-perfect em diferentes idiomas, permitindo a generalização para documentos do mundo real. Sua arquitetura unificada reutiliza feature maps, atingindo velocidades de 34,7 páginas por segundo em uma única GPU A100 e superando modelos especializados em tarefas de OCR para idiomas diversos.

Avalie este artigo:
Compartilhar:
Categoria
CEVIU IA
Publicado
20 de abril de 2026
Fonte
CEVIU IA

Quer receber mais sobre CEVIU IA?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser