OpenAI e Broadcom apresentam chip de inferência otimizado para LLMs
Aprofundamento CEVIU
Aprofundamento
O Jalapeño é o primeiro ASIC (Application-Specific Integrated Circuit) projetado exclusivamente para inferência de LLMs pela OpenAI, em parceria com a Broadcom. Diferentemente de GPUs genéricas como as da linha Blackwell da Nvidia ou TPUs do Google, o chip foi concebido do zero com base nos padrões reais de uso da OpenAI, kernels de inferência, movimentação de memória, latência tolerável e tráfego de rede em produção diária no ChatGPT, API e sistemas agênticos. Amostras de engenharia já executam cargas de trabalho reais, incluindo o modelo GPT-5.3-Codex-Spark, na frequência e potência alvo de produção. O desenvolvimento levou apenas nove meses, um dos ciclos mais rápidos já registrados para um ASIC de alto desempenho, acelerado pelo uso de modelos próprios da OpenAI no processo de design.
A fabricação será feita pela TSMC em Taiwan, com integração de placas e racks pela Celestica. A arquitetura prioriza redução de movimentação de dados e equilíbrio entre computação, memória e rede, buscando utilização próxima ao pico teórico. Testes iniciais confirmam ganhos substanciais em performance por watt frente aos chips de ponta atuais, mas métricas detalhadas só serão divulgadas em relatório técnico nos próximos meses.
Por que isso importa
O Jalapeño não é só mais um chip: é o primeiro marco concreto da estratégia de verticalização completa da OpenAI. Ao controlar desde os modelos (GPT-5.3-Codex-Spark), passando pelos sistemas de serving e agora até o silício, a empresa busca quebrar gargalos de eficiência que limitam escala, custo e latência. Isso impacta diretamente usuários finais, respostas mais rápidas no ChatGPT, menor custo por requisição para desenvolvedores via API, e empresas que dependem de infraestrutura de IA confiável. A meta declarada é implantar data centers em escala de gigawatts com parceiros como a Microsoft a partir do final de 2026, tornando a inteligência artificial mais abundante, acessível e econômica.
Impacto para desenvolvedores
Para desenvolvedores, o Jalapeño não é um produto consumível diretamente, não há SDK público nem acesso à placa ainda. Mas seu lançamento sinaliza uma mudança estrutural: a OpenAI está migrando para uma infraestrutura proprietária otimizada para seus próprios modelos, o que pode afetar a compatibilidade futura de APIs, tempos de resposta e custos operacionais em ambientes como o Assistants API ou o modelo GPT-5.3-Codex-Spark. A longo prazo, isso pode pressionar outras empresas a adotarem estratégias semelhantes de co-design hardware-software, especialmente quem opera LLMs em larga escala. Ainda não há suporte para modelos de terceiros ou frameworks como PyTorch ou vLLM no Jalapeño, ele é dedicado à stack interna da OpenAI.
Perguntas frequentes
O que é o Jalapeño e qual sua relação com o GPT-5.3-Codex-Spark?
O Jalapeño é o primeiro chip de inferência personalizado da OpenAI, projetado especificamente para executar modelos de linguagem grande como o GPT-5.3-Codex-Spark. Amostras de engenharia do chip já rodam esse modelo em laboratório, na frequência e potência alvo de produção. Ele não é um novo modelo, mas sim a infraestrutura de hardware criada para servir modelos como esse com maior eficiência.
Quando o Jalapeño vai entrar em produção?
A implantação inicial do Jalapeño em data centers com parceiros como a Microsoft está prevista para o final de 2026. Não há data fixa de disponibilidade pública nem lançamento comercial aberto. O chip ainda está em fase de testes iniciais, com relatório técnico detalhado esperado nos próximos meses.
O Jalapeño substitui as GPUs da Nvidia?
Não imediatamente. O Jalapeño é um ASIC dedicado à inferência de LLMs da OpenAI, não um substituto genérico para GPUs. Ele complementa, e não substitui, a infraestrutura atual. A OpenAI continuará usando GPUs da Nvidia para treinamento e outras cargas, enquanto o Jalapeño é voltado exclusivamente para execução de modelos já treinados, como o GPT-5.3-Codex-Spark.
Qual é a diferença entre Jalapeño e chips como Blackwell ou TPU?
Blackwell (Nvidia) e TPUs (Google) são aceleradores generalistas, projetados para treinamento e inferência de diversos tipos de IA. O Jalapeño é um ASIC especializado, otimizado apenas para inferência de LLMs, com arquitetura ajustada aos padrões reais de uso da OpenAI, como kernels específicos, movimentação de memória e latência exigida pelo ChatGPT. Isso permite maior eficiência energética e utilização de recursos, mas sem flexibilidade para outras cargas.
Fontes
- openai.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 29 de junho de 2026
- Editoria
- CEVIU IA

