O bottleneck HBM da NVIDIA - por que os embarques de Blackwell dependem de três fabs coreanas

A receita do Q4 FY2026 da NVIDIA bateu por US$5B. O guide do ano inteiro implicou outros US$200B-plus pela frente. O order book está cheio até 2027. A restrição em se essa receita de fato imprime não é demanda e não é a capacidade da $TSM de fabbar o die GB200. É se Samsung, SK Hynix, e $MU conseguem bondar stacks HBM3E suficientes rápido o suficiente para limpar a fila.

Todo GPU Blackwell B200 precisa de 8 stacks de HBM3E. Todo superchip GB200 precisa de 16. Todo B300 precisa de 12 stacks de HBM3E ou HBM4. O die do chip é silício da TSMC. O HBM é silício de três outras empresas completamente, empilhado verticalmente, bondado through-silicon-via, e integrado no mesmo interposer que o die GPU na linha de packaging CoWoS da TSMC. Cada passo nessa cadeia tem um fornecedor diferente e um teto de capacidade diferente. A restrição binding atual é HBM.

Este artigo é a anatomia de cadeia de supply da restrição, por que o moat CUDA não conserta, e o que de fato a afrouxaria.

O TL;DR. Dos três fornecedores HBM da NVIDIA, SK Hynix é o maior e mais quality-qualified (~50% do HBM3E da NVIDIA), Samsung é a second source (ainda trabalhando na qualificação HBM3E para os produtos high-end), e Micron é o terceiro entrante (capacidade limitada mas qualificado para HBM3E e seletivamente HBM3E-12H). O output total HBM3E entre os três para 2026 é a restrição binding no ramp de receita da NVIDIA, não o order book e não a TSMC.

O que HBM realmente é

HBM (High Bandwidth Memory) não é apenas "RAM rápida". É um package fundamentalmente diferente: 8 ou 12 dies DRAM empilhados verticalmente, conectados por through-silicon vias (TSVs), com a stack inteira sentando no mesmo interposer de silício que o die GPU. A banda vem de duas fontes:

Bus largo. Uma stack HBM3E típica tem uma interface de 1024-bit (vs 256-512 bits para memória GDDR ou DDR tradicional).
Distância curta. A stack senta milímetros do die GPU no mesmo interposer, então integridade de sinal permite taxas de clock extremamente altas sem queimar power em traces longos.

Uma stack HBM3E de geração atual entrega ~1,2 TB/s de banda de memória. Um Blackwell B200 com 8 stacks tem ~9,6 TB/s de banda total de memória. Esse número é mais ou menos 5-10× o que um AMD MI300X entrega e 30× o que uma GPU consumer top-tier oferece. Para workloads de training de IA que são memory-bandwidth-bound (que a maioria deles são no inner loop), HBM é o jogo todo.

O problema: fazer HBM é difícil. O yield numa stack 12-Hi é materialmente pior do que num único die DDR. O passo de bonding TSV é caro e lento. O gerenciamento térmico não é trivial. A qualified-supplier list (QVL) para HBM3E rodando nas placas HGX da NVIDIA é curta - três nomes - e um deles (Samsung) ainda está trabalhando na qualificação high-end.

Os três fornecedores, ranqueados

1. SK Hynix (KRX 000660) - o líder.

SK Hynix embarcou o primeiro HBM3E comercial (24Gb) em 2024 e rampeou 36Gb em 2025. Eles estimam ~50% do volume HBM3E da NVIDIA até 2025 e estão guidando para manter liderança até 2026. A vantagem de processo da SK Hynix veio de ser a primeira a comprometer capex para wafer starts HBM-specific em 2022-2023 quando o resto da indústria estava hesitante sobre TAM. O ramp 2024-2025 validou a aposta e SK Hynix está colhendo a margem - HBM é agora ~40% da receita DRAM deles em margens brutas significativamente maiores que DRAM commodity.

2. Samsung Electronics (KRX 005930) - a second source.

Samsung tem sido o dominante DRAM por volume por duas décadas mas atrasou na qualificação HBM3E. O 8-Hi HBM3E deles qualificou na NVIDIA em meados de 2024 para produtos de lower-tier; a qualificação 12-Hi para produtos B200 / GB200 demorou mais e ainda está rampando. O mercado leu isso como Samsung "perdendo" HBM, o que é meia-verdade - eles estão atrás da SK Hynix nas peças de mais alta-spec mas estão alcançando, e em HBM4 (a próxima geração, esperada 2026-2027) o roadmap da Samsung é competitivo. O bull case na Samsung é que a geração HBM4 reseta o relógio de qualificação e a vantagem de escala de processo da Samsung se reafirma.

3. Micron Technology (NASDAQ: MU) - a entrante US.

Micron qualificou HBM3E em 2024 - depois da SK Hynix, antes da Samsung no tier 12-Hi - e é o único fornecedor qualificado não-coreano. Capacidade é a menor dos três; o negócio HBM da Micron está crescendo 100%+ ano-a-ano de uma base pequena. O valor estratégico da Micron não é volume; é geopolítico. Se o governo dos EUA quer garantir que a cadeia de supply de IA da NVIDIA tenha um fallback não-coreano no evento de um evento geopolítico em Taiwan ou na Coreia, Micron é a resposta. Dinheiro do CHIPS Act fluiu para a expansão HBM doméstica da Micron de acordo.

Não na lista: CXMT, Yangtze Memory, qualquer um na China. O design-win CXMT na Corsair foi DDR5 commodity - não HBM. CXMT anunciou desenvolvimento HBM2 mas não tem HBM3 ou HBM3E qualificado em produção comercial. O gap chinês em HBM é multi-ano e crescendo, não fechando.

Por que essa é a restrição binding

O ramp Blackwell da NVIDIA de 2024 até 2027 é estruturado em torno de três restrições. Em ordem aproximada de quão apertada cada binda:

Restrição 1 (mais apertada): wafer starts HBM3E nos três fornecedores qualificados. SK Hynix está sold out até 2026 e substancialmente até 2027. Samsung está vendendo tudo que consegue qualificar. Micron está vendendo seu ramp (menor). O output total da indústria de HBM3E é o gate em quantos GPUs Blackwell podem ser montados em 2026, ponto.

Restrição 2: capacidade de packaging CoWoS da TSMC. Cada GPU Blackwell senta num interposer de silício fabbed na linha de packaging CoWoS (Chip-on-Wafer-on-Substrate) da TSMC. TSMC tem expandido agressivamente capacidade CoWoS desde 2023 e está no caminho para mais ou menos dobrar em 2026. CoWoS foi a restrição binding em 2024 - agora é a segunda-binding atrás de HBM.

Restrição 3: fabricação do die GB200. O nó N4P da TSMC (o processo que Blackwell usa) tem capacidade abundante de wafer. Esse não é o bottleneck.

A implicação: o ramp de receita da NVIDIA não é gateado por orders (o order book está cheio e crescendo) ou pelo fab de die GPU (TSMC pode fabbar o die). É gateado por wafer starts HBM3E em três empresas, duas das quais concentradas numa única região (Coreia), e uma das quais (Micron) é pequena.

É por isso que a narrativa de investidor da NVIDIA progressivamente mudou de "demanda excede supply" (2023) para "estamos trabalhando com nossos parceiros de memória na capacidade" (2024-2025). A restrição se moveu upstream.

O que o moat CUDA não conserta

A peça companheira neste site argumenta que o moat de software da NVIDIA (CUDA + bibliotecas + lock-in de framework) é a defesa estrutural contra AMD e contra ASICs custom comendo o lado demanda do mercado. O moat CUDA é real e a coisa errada de shortar contra.

A restrição HBM é a situação oposta: é um problema do lado supply sem defesa de software. NVIDIA não fabrica HBM. NVIDIA não pode verticalmente integrar em HBM em nenhum horizonte prático (fabricação DRAM requer capacidade de fab, IP, e expertise de yield nenhum dos quais a NVIDIA tem). A restrição é estrutural e externa. O bull case em NVDA precisa precificar o ramp HBM; o bear case pode shortar caps HBM diretamente.

A versão trade-relevante:

Long $NVDA no moat CUDA = long os próximos 3-5 anos
Long o oligopólio HBM (SK Hynix, Samsung, MU) na restrição de supply = o mesmo trade expressado diferentemente, mas com upside mais limpo numa extensão de tightness
Short $NVDA em AMD alcançando = trade errado (CUDA explica por quê)
Short $NVDA em caps de supply HBM = o short certo se você precisar shortar, porque é externo e estrutural

O que de fato afrouxaria a restrição

Três coisas são observáveis como indicadores líderes do tightness HBM aliviando (o que afrouxaria o gate de supply NVDA mas também comprimiria o pricing power do oligopólio HBM):

1. Qualificação Samsung HBM4 na NVIDIA. Se a Samsung qualificar na geração HBM4 (esperado final de 2026 / início de 2027) no mesmo tier que a SK Hynix, capacidade fica maior e o price-floor sob HBM3E enfraquece conforme supply rampa no ciclo. Observe menções da NVIDIA de "broadened HBM supplier base" em earnings calls.

2. Conclusão do capex HBM da Micron. A expansão HBM funded pelo CHIPS Act da Micron em Boise e exterior aterrissa capacidade ao longo de 2026-2027. O ramp faseado é publicado - observe o progresso trimestral. Uma expansão 2× do share HBM da Micron mudaria significativamente a curva de supply global.

3. Embarques HBM2 ou HBM3 CXMT em escala. Atualmente zero. Se a China anunciar embarques HBM3 críveis para Huawei Ascend ou Cambricon, a história de share estrutural para o oligopólio de três nomes enfraquece e sinaliza que o regime de controle de exportação Ocidental sobre memória IA está vazando. Nenhum aconteceu. O design-win CXMT na Corsair foi DDR5 commodity, o que não muda a foto HBM.

Nenhum desses triggers disparou na janela de tempo relevante. O tightness HBM persiste.

Por que este artigo importa para a tese NVDA. Se você está long NVDA está implicitamente long o ramp de supply HBM no oligopólio de três nomes. Os dois trades estão joined at the hip. Se você está tentando expressar o buildout de IA mais limpo, long $MU + SK Hynix (KRX 000660) + Samsung (KRX 005930) - veja por que routamos a perna coreana via IBKR - te dá o rent do lado supply diretamente sem o risco de concentração-de-clientes que mora no order book da NVDA.

Bottom line

O ramp de receita da NVIDIA de Blackwell até Rubin (2024-2028) é gateado pela alocação de wafer HBM3E e HBM4 em três empresas. SK Hynix domina, Samsung é a second source ainda rampando as peças de mais alta-spec, Micron é a pequena entrante US-policy-protected. A restrição é estrutural, externa à NVIDIA, e o moat CUDA não a endereça.

Para um trader expressando a tese de compute IA, o frame certo é que NVDA e o oligopólio HBM são dois lados do mesmo trade de bottleneck. A restrição se move pela cadeia de supply; o rent é coletado onde quer que a restrição binda. Agora a restrição binda em HBM. Conforme o supply HBM4 expande em 2027 pode migrar para packaging CoWoS de novo. Onde quer que sente, os nomes que possuem aquele passo capturam a margem.

Dashboard NVDA no QuantAbundancia - painel de tese com marcas atuais.

O moat CUDA - por que o software defende NVDA muito depois da AMD alcançar - a peça companheira no moat do lado demanda.

O dashboard da bolha memory - o oligopólio HBM de três nomes que gateia o ramp NVDA.

CXMT entra no DDR5 Corsair - por que os ganhos da China em DRAM commodity não ameaçam o tier HBM.

O bottleneck HBM da NVIDIA - por que os embarques de Blackwell dependem de três fabs coreanas

O que HBM realmente é

Os três fornecedores, ranqueados

Por que essa é a restrição binding

O que o moat CUDA não conserta

O que de fato afrouxaria a restrição

Bottom line

Related bubbles

Related research

Go deeper

Get the daily digest.