Microsoft desenvolve Phi-4-reasoning-vision-15B para saber quando pensar — e quando pensar é perda de tempo
O Phi-4-reasoning-vision-15B é um modelo de IA multimodal open-weight e compacto que demonstra um desempenho igual ou superior ao de sistemas significativamente maiores. Com 15 bilhões de parâmetros, ele é capaz de processar tanto imagens quanto texto, raciocinar em problemas complexos de matemática e ciência, interpretar gráficos e documentos, além de navegar por interfaces gráficas (UIs). Este modelo, que foi treinado com aproximadamente 200 bilhões de tokens de dados multimodais – um volume bem menor que o de modelos concorrentes – já está disponível através do Microsoft Foundry, Hugging Face e GitHub, sob uma licença permissiva.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 05 de março de 2026
- Fonte
- CEVIU IA
