Microsoft Lança Novos Modelos de IA de Voz e Imagem de Alta Velocidade
A Microsoft lançou três modelos de IA — MAI-Image-2, MAI-Transcribe-1 e MAI-Voice-1 — otimizados para geração de imagens, transcrição de fala e voz sintética, respectivamente.
O MAI-Image-2 produz imagens de até 1.024×1.024 pixels e funciona duas vezes mais rápido que seu antecessor. Já o MAI-Transcribe-1 transcreve fala 2,5 vezes mais rápido e alcançou uma taxa de erro de 3,9% em 25 idiomas. Todos os três modelos estão disponíveis via Microsoft Foundry e estão sendo implementados em produtos como Bing, PowerPoint e Copilot Audio Expressions.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU Design
- Publicado
- 07 de abril de 2026
- Fonte
- CEVIU Design
