DeepSeek se torna a startup de IA mais valiosa da China após captar US$ 7,4 bi
Aprofundamento CEVIU
Aprofundamento
A DeepSeek não é só mais uma startup de IA chinesa: é um caso raro de empresa que construiu infraestrutura própria antes de ter investidores externos, com clusters como o Fire-Flyer (2019) e Fire-Flyer 2 (2021), usando 10.000 A100s comprados antes das sanções norte-americanas. Seus modelos open-weight, como o V4-Pro com 1,6 trilhão de parâmetros e janela de 1 milhão de tokens, são otimizados para chips Huawei Ascend 950, não para GPUs da Nvidia. Isso explica por que o lançamento do V4 em abril de 2026 desencadeou uma corrida por hardware doméstico entre ByteDance, Tencent e Alibaba, e não por licenças da Nvidia.
O financiamento de US$ 7,4 bilhões não é só o maior da história chinesa, mas também uma operação de engenharia de controle: 90% da empresa ainda está nas mãos de Liang Wenfeng, que estruturou os aportes como cotas em uma sociedade em comandita sem direito de voto para quase todos os investidores. Só o fundo governamental tem direitos de voto e pode vender suas ações imediatamente, um sinal claro de que Pequim quer influência direta, não apenas capital.
O que mudou
Em 24 de abril, a CEVIU noticiou que a DeepSeek buscava US$ 20 bilhões com resistência à participação majoritária da Tencent. Em 4 de junho, já era 'US$ 7 bilhões', e agora, em 17 de junho, o valor confirmado é US$ 7,4 bilhões, com Tencent efetivamente entrando com US$ 1,4 bilhão (não 20%). O que era rumor de rodada gigante virou realidade, mas menor, mais concentrada e com estrutura de controle reforçada. Também mudou o foco: de 'busca por apoio estratégico' para 'consolidação de soberania tecnológica', com o V4-Pro já em produção e impulsionando a adoção dos chips Ascend.
Por que isso importa
A DeepSeek prova que é possível competir no topo global de LLMs sem depender de hardware ocidental nem de modelos fechados. Seu custo de treinamento do V3 (US$ 6 milhões vs US$ 100 milhões do GPT-4) e sua precificação 35x mais barata que o GPT-5.5 na saída não são curiosidades, são alavancas comerciais reais. Enquanto a OpenAI levanta US$ 122 bilhões para escalar infraestrutura, a DeepSeek usa menos compute, mais otimização e código aberto para atingir performance comparável. Isso muda as regras do jogo para startups em mercados com restrições de exportação, e pressiona fabricantes globais a repensar seu modelo de precificação e licenciamento.
Linha do tempo
OpenAI levanta US$ 122 bilhões com avaliação de US$ 852 bilhões
DeepSeek negocia rodada de US$ 20 bilhões com Tencent e Alibaba
Negociações com o Fundo Nacional de IA da China para avaliação de US$ 50 bilhões
DeepSeek divulga meta de US$ 10 trilhões para ecossistema de hardware chinês
Confirmação de rodada de US$ 7 bilhões com aporte majoritário do fundador
Rodada concluída com US$ 7,4 bilhões e avaliação acima de US$ 50 bilhões
Perguntas frequentes
Por que a DeepSeek mantém quase 90% do controle mesmo após levantar US$ 7,4 bi?
O fundador Liang Wenfeng estruturou a maioria dos aportes como cotas em uma sociedade em comandita sem direito de voto. Só o fundo governamental recebeu direitos de voto e liquidez imediata. Isso preserva o controle técnico e estratégico, evitando interferência de investidores com interesses divergentes.
O que significa 'open-weight' e por que isso é estratégico para a DeepSeek?
Open-weight significa que os pesos (parâmetros) dos modelos são publicados abertamente, geralmente sob licença MIT. Isso atrai desenvolvedores, acelera a adoção e permite customização local, mas os dados de treinamento permanecem fechados. É uma posição intermediária entre totalmente fechado (como a OpenAI) e totalmente aberto (como alguns projetos da Hugging Face).
Como a DeepSeek consegue treinar modelos tão grandes com tão pouco custo?
A empresa combina três fatores: hardware comprado antecipadamente (A100s pré-sanção), otimização extrema de código e arquitetura (ex: V4-Pro roda eficientemente em chips Huawei Ascend), e uso intensivo de técnicas como quantização, pruning e treinamento em etapas. Resultado: V3 treinado por US$ 6 milhões, contra US$ 100 milhões estimados para o GPT-4.
Qual é a relação entre o financiamento e o ecossistema de hardware chinês?
O dinheiro vai direto para expandir infraestrutura computacional, mas com foco em chips locais. O lançamento do V4-Pro, otimizado para Ascend 950, já gerou demanda explosiva por esses chips. A rodada de US$ 7,4 bi financia essa transição estrutural: menos dependência de Nvidia, mais escala para fabricantes nacionais como Huawei e Moore Threads.
Links relacionados
Fontes
- wsj.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 17 de junho de 2026
- Editoria
- CEVIU IA
