Modelos DeepSeek já estão disponíveis via Azure no AI Gateway
Aprofundamento CEVIU
Aprofundamento
Os modelos DeepSeek já estão disponíveis no Azure AI Foundry (anteriormente chamado de AI Gateway), com suporte nativo para implantação em escala empresarial via Microsoft Azure. A integração começou oficialmente com o DeepSeek R1, disponibilizado no catálogo da Azure AI Foundry e GitHub em 29 de janeiro de 2025, seguido pelo DeepSeek V3 em 6 de março de 2025 — um modelo Mixture-of-Experts (MoE) com 671 bilhões de parâmetros totais e 37 bilhões ativados por token, treinado em 2.000 GPUs Nvidia H800 por 55 dias ao custo de US$ 5,58 milhões. Em abril de 2026, a DeepSeek lançou a prévia da série DeepSeek V4, incluindo os modelos DeepSeek-V4-Pro (1,6 trilhão de parâmetros totais, 49 bilhões ativados por token) e DeepSeek-V4-Flash (284 bilhões totais, 13 bilhões ativados), ambos com janela de contexto de até 1 milhão de tokens e pré-treinamento em mais de 32 trilhões de tokens.
A DeepSeek adota uma política de pesos abertos (open-weight) sob licença MIT desde o V3, diferenciando-se de modelos fechados como GPT-5.5, Claude Opus 4 ou Gemini 3. Seus preços de API são até 10× menores: o DeepSeek V4 Pro custa US$ 0,0036 por 1 milhão de tokens de entrada e US$ 0,87 por saída, contra US$ 5 e US$ 30 do GPT-5.5. Essa vantagem de custo impulsionou sua adoção global — o app DeepSeek tornou-se o mais baixado gratuitamente na App Store dos EUA em janeiro de 2025, superando o ChatGPT, com base estimada de 5–6 milhões de usuários.
Por que isso importa
Essa integração é estratégica porque coloca os modelos DeepSeek V3, DeepSeek V4-Pro e DeepSeek V4-Flash ao lado de gigantes como GPT-5.5, Claude Opus 4 e Gemini 3 no mesmo ecossistema de nuvem usado por empresas brasileiras e globais. Para desenvolvedores e arquitetos de IA no Brasil, isso significa acesso imediato a modelos de ponta com alta eficiência de custo, baixa latência e suporte a contextos ultra-largos (até 1 milhão de tokens), fundamentais para aplicações em finanças, saúde e atendimento jurídico. Além disso, a licença MIT permite uso comercial irrestrito, fine-tuning e adaptação local — algo que modelos proprietários como GPT-6 (ainda não confirmado) ou Claude Opus 4 não oferecem. A presença no Azure também garante conformidade com LGPD, SLA robusto e integração com ferramentas como Azure Monitor e Key Vault.
Impacto para desenvolvedores
Para desenvolvedores brasileiros, a disponibilidade dos modelos DeepSeek V4-Pro e DeepSeek V4-Flash no Azure AI Foundry reduz drasticamente barreiras técnicas e financeiras para implantação de LLMs em produção. É possível chamar esses modelos via REST API ou SDK Python diretamente do Azure, com faturamento por token, sem necessidade de infraestrutura própria. A arquitetura MoE permite inferência rápida mesmo em cargas complexas — ideal para agentes que exigem raciocínio passo a passo, como em análise de contratos ou diagnóstico técnico. A compatibilidade com Hugging Face Transformers e ONNX Runtime facilita o deployment em ambientes híbridos. Importante: a Microsoft permite alternar dinamicamente entre DeepSeek V4-Pro, GPT-5.5 e Gemini 3 dentro do mesmo pipeline, permitindo testes A/B rigorosos de desempenho e custo — recurso crítico para equipes de engenharia de IA buscando otimizar ROI em projetos reais.
Perguntas frequentes
Quando o DeepSeek V4 foi lançado?
A prévia da série DeepSeek V4 foi lançada oficialmente em 24 de abril de 2026, com os modelos DeepSeek-V4-Pro e DeepSeek-V4-Flash. Ambos suportam janela de contexto de até 1 milhão de tokens e foram pré-treinados em mais de 32 trilhões de tokens.
O que é o DeepSeek V4-Pro e como ele se compara ao GPT-5.5?
O DeepSeek V4-Pro é um modelo Mixture-of-Experts com 1,6 trilhão de parâmetros totais (49 bilhões ativados por token), licenciado sob MIT. Em comparação com o GPT-5.5, oferece custo de API até 10× menor (US$ 0,0036 vs US$ 5 por 1M tokens de entrada) e maior transparência técnica, embora o GPT-5.5 ainda tenha vantagens em integração com ecossistemas Apple e Microsoft 365.
DeepSeek V3 está disponível no Azure?
Sim, o DeepSeek V3 foi integrado ao Azure AI Foundry em 6 de março de 2025. Ele é um modelo MoE com 671 bilhões de parâmetros totais, 37 bilhões ativados por token, suporte a 128K tokens de contexto e faturamento por token com experiência gratuita no GitHub Models.
Qual é a licença dos modelos DeepSeek V4 e V3?
Desde o DeepSeek V3, todos os modelos principais da DeepSeek são lançados sob licença MIT — uma licença verdadeiramente open-weight que permite uso comercial, modificação, fine-tuning e redistribuição. Isso contrasta com modelos fechados como Claude Opus 4, Gemini 3 ou GPT-5.5, cujas licenças restringem fortemente o uso e a adaptação.
Links relacionados
- Categoria
- CEVIU IA
- Publicado
- 11 de junho de 2026
- Fonte
- CEVIU IA
