Hyperscalers: a bolha IA que falhou (e por que publicamos as falhas)
MSFT, GOOGL, AMZN, META, ORCL parecem um bloco de capex de IA. Os dados dizem não. Correlação bruta 0,65 desaba para ~0,05 sob residualização. SPY fantasiado.
Pensávamos que "AI-Capex Hyperscalers" seria uma das bolhas mais fortes em nossa taxonomia. A tese é avassaladora: $MSFT, $GOOGL, $AMZN, $META, $ORCL estão comprometendo a maior parte dos gastos de infraestrutura IA de centenas de bilhões de dólares em 2026. Eles são o lado da demanda do buildout IA. Certamente negociam como um bloco.
Medimos. Eles não negociam.
Este artigo é a peça metodologia-honestidade. Caminha através do porquê a "bolha IA" mais óbvia na intuição de varejo falha no teste empírico — e por que publicamos esse resultado na plataforma em vez de cobri-lo.
O setup: como o grupo editorial parece
Os cinco nomes por compromissos de capex 2026:
- $MSFT — ~120 G$ em capex 2026 projetado, principalmente Azure / compute OpenAI
- $GOOGL — ~185 G$, Google Cloud + buildout TPU
- $AMZN — ~200 G$, infraestrutura AWS + acordos Anthropic
- $META — ~130 G$, infraestrutura de treinamento de IA + serving Llama
- $ORCL — ~50 G$, OCI correndo atrás
Combinado: ~685 G$ de gasto de infraestrutura IA em um único ano. Dinheiro real, sinal de demanda real, tema econômico real. De uma lente de fundamentos, eles compartilham uma exposição: cada dólar de capex IA passa por essas empresas ou bate nelas como uma restrição.
A primeira medição — correlação bruta parece convincente
Rode uma matriz de correlação por pares de 252 dias nos retornos brutos diários dos cinco nomes. Os números clusterizam em torno de 0,55-0,70. Correlação média por pares: ~0,65.
Em dashboards voltados ao varejo, é aqui que a análise para. "Estas ações todas correlacionam em 0,65 — bloco forte." O slide de marketing de qualquer ETF temático usa esse mesmo número. A história se vende sozinha.
Se parássemos aqui, publicaríamos uma página Hyperscalers bubble declarando-a validada, lançaríamos um widget de tracking de cesta diário, e cobraríamos por um alerta de correlação de bolha. É o que a maioria dos dashboards temáticos faz.
Nós não paramos aqui.
A etapa de residualização — e o colapso
Residualização, em 90 segundos: cada retorno diário de uma ação se decompõe em "o que o mercado fez" + "o que foi específico desta ação". A correlação bruta confunde os dois. A correlação residualizada (correlação entre os resíduos após regredir cada ação em $SPY) mede apenas o componente idiossincrático — a parte que diz "estas ações estão respondendo a algo específico que o mercado não está".
Para Hyperscalers, a correlação residualizada é aproximadamente 0,05.
Efetivamente zero.
A correlação bruta de 0,65 era inteiramente dirigida por essas ações serem mega-caps com betas similares. Quando o S&P se move, elas se movem juntas porque estão todas no S&P, não porque estão respondendo a notícias de capex IA. Remova a exposição de mercado e essencialmente não há co-movimento idiossincrático entre os cinco.
Uma correlação residualizada de 0,05 é o que você obteria se escolhesse aleatoriamente cinco ações mega-cap de qualquer setor. Não há sinal temático de IA neste bloco. É SPY fantasiado.
Por que isso acontece — o problema de diluição
A razão estrutural pela qual Hyperscalers falham no teste: IA é uma fração pequena demais da receita de cada empresa para a tese de IA dominar os movimentos idiossincráticos da ação.
Decomposição aproximada pelo mix de receita 2026:
- $MSFT: receita atribuível à IA ~10-15% do total. Office, enterprise legacy, gaming, etc. dominam.
- $GOOGL: ~10% atribuível à IA. Anúncios de Search ainda ~75% da receita.
- $AMZN: AWS relacionado à IA ~5-8% da receita consolidada. Varejo, AWS-não-IA, publicidade dominam.
- $META: A maior parte do investimento "IA" é interno (sistemas de recomendação, targeting de anúncios). Receita IA monetizada externamente é ~mínima.
- $ORCL: OCI está crescendo rápido mas o core business de banco de dados ainda é a maioria.
Quando a narrativa de IA muda, a reação de cada ação é filtrada através de 80-90% de receita que não tem nada a ver com IA. A razão sinal-ruído é ruim. Os retornos idiossincráticos são dominados por fatores específicos da empresa (ciclo de renovação enterprise da Microsoft, pricing de anúncios do Google, margens de varejo da Amazon) em vez da exposição IA compartilhada.
Compare com nossa bolha Quantum que mantém 0,76 de correlação residualizada: aquelas são empresas pré-receita cuja ação inteira é a tese IA. Exposição pura → clustering residualizado apertado. Hyperscalers são exposição diluída → ruído.
Onde realmente expressar capex de IA
O ponto mais profundo não é que o capex de IA não é real — obviamente é. É que Hyperscalers são o veículo errado para expressá-lo.
Se você quer exposição pura ao capex IA, olhe para onde o capex está realmente fluindo:
-
Semi Equipment (residualizado 0,82) — $ASML, $AMAT, $LRCX, $KLAC. A expressão única mais limpa. O capex IA flui através de buildouts de capacidade chip-fab, e estes são os picks-and-shovels.
-
Memory / HBM (residualizado ~0,71) — $MU + SK Hynix + Samsung. Memória é a restrição de cadência no compute IA; o bloco captura exposição pura a "volume de compute IA × ASP HBM".
-
Datacenter Power (residualizado ~0,55) — $VST, $CEG, $NRG, etc. A restrição da próxima camada. IA come eletricidade e as utilities fornecendo campi de IA têm exposição pequena mas pura ao sinal de demanda.
Cada um desses blocos tem clustering residualizado mais apertado que Hyperscalers porque a tese IA não é diluída por 80-90% de receita não relacionada.
Por que publicamos a falha
A lição metodológica se generaliza além de Hyperscalers. Taxonomias editoriais que agrupam por história ("empresas investindo em IA") falham quando as exposições de receita subjacentes não coerentem. A história pode ser verdadeira no nível macro — existe uma bolha de capex de IA — sem que a história seja expressível no nível equity através dos nomes que alocam o capex.
A disciplina que mantemos: construir bolhas editoriais, testar empiricamente, publicar qualquer resposta que os dados deem.
Se publicássemos apenas as bolhas que se validam, a plataforma seria um dashboard de investimento temático que sempre confirma qualquer narrativa que esteja na moda. Isso é uma ferramenta de marketing, não pesquisa.
Se publicamos as falhas junto com os sucessos, a plataforma é metodologicamente honesta. Quando dizemos que uma bolha é real (Quantum, Semi Equipment, Memory), a afirmação tem peso porque não temos medo de dizer quais bolhas não são.
A página Hyperscalers na plataforma permanece pública com o resultado de validação falhada intacto. Idem para AI Software (~0,10 residualizado) e Robótica (~0,20 residualizado). Um honesto "medimos isso e não funciona" é mais credível que um acolchoado "esta narrativa temática é real porque [convenção de analista]".
Recibos > narrativas. O trabalho da plataforma é fazer emergir a verdade empírica sobre fluxos temáticos, não validar cada história que por acaso soe certa. Metade das bolhas IA editoriais não são blocos reais. Dizemos isso.
Conclusões práticas
Para traders tentando expressar uma tese de IA:
1. Não compre Hyperscalers como uma cesta e chame isso de exposição IA. Você está efetivamente comprando um SPY de beta alto. Qualquer tese IA que você tenha está sendo diluída por 85%+ da receita dessas empresas que não tem nada a ver com IA. Se você quer exposição SPY, compre SPY com taxas menores.
2. Se você quer um dos nomes individualmente, tudo bem — mas é uma aposta idiossincrática. Uma posição long em $MSFT é uma aposta na execução enterprise da Microsoft + crescimento Azure IA + adoção Office Copilot. Compre-a por esses méritos. Não finja que é um play de "bloco".
3. Os blocos reais de capex de IA estão upstream. Pedidos $ASML são o sinal único mais limpo de que o capex IA é real e está acelerando. O backlog $VRT é o sinal mais limpo de que está chegando na fase de implantação de rack. Preços de ações de hyperscalers não estão nesta categoria.
Navegue pelas 12 bolhas classificadas por realidade empírica para a taxonomia completa. Ou leia a peça metodológica sobre correlação residualizada para a técnica que produziu o resultado Hyperscalers acima.
A página Hyperscalers bubble ao vivo mostra as correlações brutas e residualizadas atualizadas diariamente para os cinco nomes, com o flag de validação falhada intacto. Atualizada toda noite após o fechamento US.
Related bubbles
Get the daily digest.
One email a day · alerts + bubble shifts + new research. Free during beta.
No spam. One email per day max. Telegram alerts coming with the paid tier.