Amazon quer vender chips de IA próprios para concorrer diretamente com Nvidia
Aprofundamento CEVIU
Aprofundamento
A Amazon não está só entrando no mercado de chips de IA: ela está tentando redefinir as regras da disputa. O Trainium 3, fabricado em 3 nm na TSMC, já entrega quatro vezes mais desempenho e eficiência que sua geração anterior, e mesmo assim, a capacidade está esgotada. A mudança para vendas externas não é um ajuste tático, mas uma resposta direta à pressão geopolítica (como exigências europeias por infraestrutura localizada) e ao aperto de oferta global: a TSMC agora prioriza a Nvidia, que superou a Apple como seu maior cliente. Enquanto isso, a AWS já fatura US$ 20 bilhões/ano com silício próprio, e o plano de US$ 50 bilhões/ano mencionado por Jassy pressupõe escala que ainda não existe.
O timing é crítico. A OpenAI já comprometeu 2 GW de Trainium a partir de 2027. A Anthropic firmou US$ 225 bilhões em acordos com a AWS, mas também negocia chips Maia com a Microsoft. Isso mostra que os clientes não estão trocando fornecedores, e sim multiplicando contratos para garantir acesso a qualquer hardware que funcione. A Amazon está vendendo confiança, não apenas chips.
O que mudou
Em abril, Jassy falava em possibilidade. Em junho, a AWS está em negociações avançadas, e já tem demanda concreta: OpenAI e Anthropic já reservaram centenas de megawatts. Antes, a venda externa era teórica, ligada a uma hipótese de 'se fosse um negócio separado'. Agora, é uma operação em construção, com impacto real no planejamento de produção e no equilíbrio entre oferta interna e externa. O Trainium 4, que ainda não existe fisicamente, já tem fila de espera, algo inédito na história dos chips da AWS.
Por que isso importa
Isso não é só sobre mais um concorrente para a Nvidia. É sobre quem controla o custo do treinamento de modelos em larga escala. O Trainium oferece até 50% de economia frente a instâncias EC2 comparáveis, e se essa economia for replicável em data centers de terceiros, muda a matemática de ROI para startups e bancos que hoje dependem de GPUs caríssimos. Também acelera a fragmentação do ecossistema: em vez de um padrão unificado (CUDA), surgem stacks fechados (Trainium + Inferentia + Graviton), cada um com suas APIs, ferramentas e trade-offs de portabilidade.
Linha do tempo
Andy Jassy menciona pela primeira vez, na carta anual a acionistas, a possibilidade de vender chips Trainium para terceiros, citando potencial de US$ 50 bilhões/ano
Google anuncia intenção de vender TPUs de 8ª geração para clientes selecionados, sinalizando movimento setorial semelhante
Microsoft e Anthropic avançam em negociações para uso dos chips Maia, mostrando que a diversificação de fornecedores já é prática consolidada
AWS confirma negociações avançadas para vender Trainium externamente, com foco em data centers de terceiros e demanda internacional
Perguntas frequentes
A Amazon vai parar de usar seus próprios chips na nuvem para vender para fora?
Não. A prioridade continua sendo atender a demanda interna, que já esgota a produção. A venda externa só acontecerá se houver excedente, o que depende de aumento de capacidade na TSMC ou de novos parceiros de fabricação. Até lá, clientes externos podem enfrentar filas longas.
O Trainium é compatível com software que roda na Nvidia?
Não nativamente. A AWS usa seu próprio stack de compilação e otimização (AWS Neuron). Modelos treinados em CUDA precisam ser adaptados, embora a AWS tenha investido em ferramentas de migração. Isso cria barreiras de entrada, mas também reduz dependência de licenças da Nvidia.
Por que empresas como Anthropic assinam com múltiplos fornecedores de chips?
Por segurança de supply chain. A escassez de chips de IA é real e prolongada. Ter contratos com AWS, Microsoft e Google garante acesso contínuo a compute, mesmo que isso signifique manter múltiplas pilhas de infraestrutura e suporte técnico.
Qual é o risco principal dessa estratégia da Amazon?
Ficar presa entre dois mundos: sem escalar produção o suficiente para atender terceiros, mas tampouco conseguindo absorver toda a demanda interna. O resultado seria insatisfação dupla, clientes da nuvem na fila e clientes externos frustrados com falta de disponibilidade.
Fontes
- techcrunch.comfonte original
- Categoria
- CEVIU
- Publicado
- 19 de junho de 2026
- Editoria
- CEVIU

