DeepSeek entra na briga por volume de tokens enquanto Anthropic domina gastos

Q: O que é o DeepSeek V4 Pro e como ele se compara ao GPT-5.5 e ao Claude Opus 4.7?

O DeepSeek V4 Pro é um modelo de linguagem lançado em abril de 2026, com 1,6 trilhão de parâmetros e janela de contexto de 1 milhão de tokens. Em maio de 2026, sua precificação foi fixada em US$ 0,435/milhão de tokens de entrada e US$ 0,87/milhão de saída, cerca de 1/10 do GPT-5.5 e 1/11 do Claude Opus 4.7 para tarefas equivalentes. Ele usa arquitetura otimizada (DSA + Lightning Indexer), exigindo 27% dos FLOPs do DeepSeek-V3.2 e 10% da memória KV.

Q: Quando o Claude Sonnet 3.5 foi lançado e por que ele domina codificação empresarial?

O Claude Sonnet 3.5 foi lançado em meados de 2025 e liderou rankings de codificação (HumanEval, MBPP) por 18 meses consecutivos até abril de 2026. Sua especialização em tarefas de engenharia de software, combinada com o Claude Code , ferramenta integrada à IDE, impulsionou a Anthropic a 54% de participação no mercado empresarial de codificação, mais que o dobro da OpenAI (21%).

Q: Por que a DeepSeek tem 17% do volume de tokens mas só ~1% dos gastos?

Isso ocorre porque a DeepSeek V4 Pro e seus modelos são extremamente baratos: custam até 75% menos que concorrentes como GPT-5.5 e Claude Opus 4.7. Empresas usam a DeepSeek para tarefas de alto volume e baixo custo (ex.: processamento de logs, resumos em lote), gerando muitos tokens, mas sem impactar significativamente o orçamento, ao contrário de modelos premium usados em aplicações críticas, que geram menos tokens, mas com custo unitário muito maior.

Q: A Anthropic ainda é líder em gastos corporativos em 2026?

Sim. Em 2025, a Anthropic detinha 40% dos gastos corporativos globais em LLMs, quase triplicando desde 2023. Embora tenha enfrentado críticas por custos elevados, como declarações de Mustafa Suleyman (Microsoft AI) e cancelamentos pontuais de Claude Code , sua participação em gastos de consumidores dos EUA subiu para 26% em abril de 2026, e sua receita projetada para o trimestre é de US$ 10,9 bilhões, com margem bruta de ~44%.

10 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

A DeepSeek intensificou sua ofensiva no mercado global de IA em 2026 com o lançamento da família DeepSeek V4, incluindo os modelos V4 Pro (1,6 trilhão de parâmetros, 49 bilhões ativos por token) e V4 Flash (284 bilhões de parâmetros, 13 bilhões ativos por token), ambos com janela de contexto de 1 milhão de tokens. Em maio de 2026, a empresa tornou permanente um corte de preço de 75% no V4 Pro, reduzindo seu custo para US$ 0,435/milhão de tokens de entrada e US$ 0,87/milhão de tokens de saída, cerca de 1/10 do GPT-5.5 e 1/11 do Claude Opus 4.7 em tarefas equivalentes. Essa estratégia fez a participação da DeepSeek em volume de tokens no AI Gateway subir de <1% para 17% em um mês, enquanto sua fatia nos gastos totais permaneceu em ~1%, evidenciando sua posição como provedora de alta eficiência operacional, não de alto valor agregado corporativo.

Já a Anthropic consolidou liderança em gastos: detém 40% dos gastos corporativos em LLMs em 2025, 54% do mercado empresarial de codificação (mais que o dobro da OpenAI) e alcançou 26% dos gastos de consumidores norte-americanos em IA em abril de 2026. Seu modelo Claude Sonnet 3.5 liderou rankings de codificação por 18 meses consecutivos. Apesar de sua avaliação de US$ 965 bilhões e levantamento de US$ 65 bilhões em maio de 2026, críticas crescentes surgiram em junho: Mustafa Suleyman (Microsoft AI) classificou a Anthropic como "extremamente cara", e a Microsoft iniciou o cancelamento de assinaturas do Claude Code para engenheiros. A Palantir também alertou sobre a ineficiência de contratar diretamente empresas de IA como a Anthropic devido aos altos custos de tokens.

Por que isso importa

Esse cenário revela uma divisão estrutural no mercado de IA: de um lado, modelos como DeepSeek V4 Pro, GPT-5.5, Claude Opus 4.7 e Claude Sonnet 3.5 competem por diferentes dimensões, volume, custo, confiabilidade, especialização, e não apenas por desempenho bruto. A disparidade entre volume de tokens (17% da DeepSeek) e gastos (~1%) mostra que empresas estão migrando para modelos mais baratos para tarefas escaláveis (ex.: processamento em lote, agentes de IA com long context), enquanto mantêm investimentos em modelos premium como Claude Opus 4.7 ou GPT-5.5 para aplicações críticas (ex.: compliance, engenharia de software). Isso impacta decisões estratégicas de arquitetura de IA: escolher entre DeepSeek V4 Pro (custo-benefício) ou Claude Sonnet 3.5 (codificação robusta) define não só orçamento, mas também escala operacional e capacidade de inovação.

Impacto para desenvolvedores

Para desenvolvedores e equipes de engenharia, a queda agressiva de preços da DeepSeek V4 Pro, com 7x menos custo de entrada e 17x menos de saída que Claude Sonnet ou GPT-5.5-Med, viabiliza novos padrões de uso: inferência em larga escala com janelas de contexto de 1 milhão de tokens, implantação de agentes autônomos com memória condicional (Engram Conditional Memory) e otimização extrema de cache KV (10% da memória usada vs. V3.2). Já a dependência de Claude Code ou Claude Opus 4.7 passa a exigir justificativa técnica clara, pois alternativas como DeepSeek V4 Pro oferecem desempenho competitivo em benchmarks de programação (ex.: HumanEval, MBPP) a fração do custo. O aumento de 180% nos gastos corporativos em IA em 2025 (para média de US$ 7M/empresa) torna essa análise de trade-off entre GPT-5.5, Claude Opus 4.7, Claude Sonnet 3.5 e DeepSeek V4 Pro essencial para sustentabilidade financeira e técnica.

Perguntas frequentes

O que é o DeepSeek V4 Pro e como ele se compara ao GPT-5.5 e ao Claude Opus 4.7?

O DeepSeek V4 Pro é um modelo de linguagem lançado em abril de 2026, com 1,6 trilhão de parâmetros e janela de contexto de 1 milhão de tokens. Em maio de 2026, sua precificação foi fixada em US$ 0,435/milhão de tokens de entrada e US$ 0,87/milhão de saída, cerca de 1/10 do GPT-5.5 e 1/11 do Claude Opus 4.7 para tarefas equivalentes. Ele usa arquitetura otimizada (DSA + Lightning Indexer), exigindo 27% dos FLOPs do DeepSeek-V3.2 e 10% da memória KV.

Quando o Claude Sonnet 3.5 foi lançado e por que ele domina codificação empresarial?

O Claude Sonnet 3.5 foi lançado em meados de 2025 e liderou rankings de codificação (HumanEval, MBPP) por 18 meses consecutivos até abril de 2026. Sua especialização em tarefas de engenharia de software, combinada com o Claude Code, ferramenta integrada à IDE, impulsionou a Anthropic a 54% de participação no mercado empresarial de codificação, mais que o dobro da OpenAI (21%).

Por que a DeepSeek tem 17% do volume de tokens mas só ~1% dos gastos?

Isso ocorre porque a DeepSeek V4 Pro e seus modelos são extremamente baratos: custam até 75% menos que concorrentes como GPT-5.5 e Claude Opus 4.7. Empresas usam a DeepSeek para tarefas de alto volume e baixo custo (ex.: processamento de logs, resumos em lote), gerando muitos tokens, mas sem impactar significativamente o orçamento, ao contrário de modelos premium usados em aplicações críticas, que geram menos tokens, mas com custo unitário muito maior.

A Anthropic ainda é líder em gastos corporativos em 2026?

Sim. Em 2025, a Anthropic detinha 40% dos gastos corporativos globais em LLMs, quase triplicando desde 2023. Embora tenha enfrentado críticas por custos elevados, como declarações de Mustafa Suleyman (Microsoft AI) e cancelamentos pontuais de Claude Code, sua participação em gastos de consumidores dos EUA subiu para 26% em abril de 2026, e sua receita projetada para o trimestre é de US$ 10,9 bilhões, com margem bruta de ~44%.

Links relacionados

Fontes

x.comfonte original

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 10 de junho de 2026
Editoria: CEVIU IA