Microsoft leva os modelos Phi Silica para GPUs da Nvidia, além das NPUs do Windows

17 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

A Microsoft não está só abrindo o Phi Silica para GPUs da Nvidia, está testando uma mudança de filosofia no coração da sua estratégia de IA local. Enquanto os Copilot+ PCs de 2024 foram lançados com um requisito rígido de NPU (40 TOPS mínimos), a nova rota via GPU é uma espécie de 'porta dos fundos' técnica: exige SDK experimental, canal Insider e drivers atualizados, mas permite que um RTX 3060 (6GB VRAM) ou superior execute o mesmo modelo que roda nativamente em um Surface Laptop 7. Isso não é mera compatibilidade, é uma tentativa de desacoplar a experiência de IA do Windows de um único tipo de silício, sem abandonar o ecossistema NPU.

O Phi Silica é um SLM derivado do Phi-3, mas com ajustes críticos: menor footprint (menos de 3 bilhões de parâmetros), otimizações para inferência em tempo real em hardware limitado e suporte nativo às APIs Windows AI. A diferença prática entre NPU e GPU aqui não é só de velocidade, mas de arquitetura: as NPUs dos Copilot+ PCs aplicam compressão de prompt em hardware, reduzindo o tráfego de dados entre memória e núcleo; já nas GPUs, essa etapa ainda roda em software, consumindo mais largura de banda e energia. É por isso que a Microsoft mantém o recurso de decodificação especulativa como exclusivo de NPU, ele depende de múltiplos núcleos pequenos executando em paralelo, algo que as GPUs fazem de forma diferente.

O que mudou

Em abril de 2026, o Phi Silica era um modelo restrito à biblioteca Windows Copilot, acessível apenas em dispositivos com NPU certificada. Agora, em junho de 2026, ele passa a ser o primeiro modelo nativo da Microsoft a ter suporte explícito e documentado para execução em GPUs da Nvidia, não como fallback genérico, mas como uma nova 'rota de inferência' com API própria. O que era rumor em maio (sobre testes internos) virou realidade operacional com SDK 2.2.2-experimental9, e o que era promessa de 'suporte multiplataforma' agora tem requisitos concretos: RTX 30-series+, 6GB VRAM, Modo Desenvolvedor ativado. Isso marca a primeira vez que um modelo da linha Copilot Library foge do sandbox exclusivo da NPU.

Por que isso importa

Isso importa porque define quem entra na próxima onda de aplicações locais. Um dev pode agora integrar o Phi Silica em um app Windows usando a mesma API que usa em um Copilot+ PC, mas rodando em máquinas já existentes, sem precisar esperar pelo ciclo de renovação de hardware. Não é sobre substituir NPUs, mas sobre evitar que a IA local fique presa a um único roadmap de silício. Enquanto a Nvidia prepara seus próprios PCs para agentes de IA (com 30 modelos em desenvolvimento) e lança chips N1 para Windows on Arm, a Microsoft está construindo uma camada de compatibilidade que torna o Windows 11 menos dependente de um fornecedor específico de acelerador.

Linha do tempo

20/05/2024
Microsoft lança os PCs Copilot+ com requisito mínimo de NPU de 40 TOPS e inclui o Phi Silica na Windows Copilot Library
01/06/2026
Nvidia e Microsoft anunciam parceria para chips N1 em PCs com Windows on Arm
07/06/2026
Nemotron 3 Ultra, fruto da parceria Microsoft-Nvidia, é disponibilizado no AI Gateway da Vercel
17/06/2026
Microsoft anuncia testes oficiais do Phi Silica em GPUs da Nvidia, com SDK experimental e requisitos técnicos definidos

Perguntas frequentes

Posso rodar o Phi Silica no meu RTX 4070 hoje?

Sim, se seu PC tiver Windows 11 versão 24H2, estiver no Canal Experimental do Windows Insider, tiver o Modo Desenvolvedor ativado, instalar o Windows App SDK 2.2.2-experimental9 e usar drivers Nvidia atualizados. Mas atenção: não é um 'download e roda'. É um ambiente de desenvolvimento controlado, não um recurso para usuários finais.

O Phi Silica na GPU tem o mesmo desempenho que na NPU?

Não. Ele perde recursos exclusivos da NPU, como compressão de prompt em hardware e decodificação especulativa. Isso afeta diretamente a latência em prompts longos e a velocidade de geração em contextos complexos. A NPU ainda é mais eficiente em consumo de energia, especialmente em laptops.

E os modelos da família Gemma ou Nemotron? Eles também rodam assim?

Não da mesma forma. O Nemotron 3 Ultra está disponível via API na nuvem (Vercel AI Gateway), e o DiffusionGemma foi otimizado pela Nvidia para RTX, mas ambos usam frameworks genéricos como ONNX Runtime. O Phi Silica é o primeiro modelo da Microsoft a ter suporte nativo e documentado nas APIs Windows AI, o que significa integração profunda com o sistema operacional, não apenas aceleração de inferência.

AMD vai entrar nisso logo?

A Microsoft confirmou suporte para AMD 'em data posterior', mas sem cronograma. Enquanto isso, a Nvidia já tem drivers e ferramentas maduras para Windows AI (como o DirectML atualizado), o que explica por que ela foi a primeira escolhida para esse teste, não por exclusividade, mas por prontidão técnica.

Links relacionados

Fontes

winbuzzer.comfonte original

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 17 de junho de 2026
Editoria: CEVIU IA