O que é correlação residualizada? (E por que a maioria dos ETFs temáticos mente)
O beta de mercado escondido nas 'bolhas de IA' torna matrizes de correlação inúteis até você removê-lo. Exemplo trabalhado: por que Hyperscalers falham no teste e Quantum passa.
Quando você lê que as "ações de IA" se moveram todas juntas esta manhã — $NVDA +2%, $MSFT +1,8%, $GOOGL +2,1%, $AMZN +1,7% — seu primeiro instinto é chamar isso de movimento temático. Compartilham uma exposição. São um bloco. A "bolha IA" é real.
Esse instinto está quase sempre errado.
A razão pela qual esses nomes se moveram juntos esta manhã não é porque compartilham uma exposição temática de IA. É porque o mercado subiu 1,6% e são todos nomes de 1 T$+ de capitalização com beta alto. Remova o movimento de mercado e você vai encontrar que o co-movimento residual — o que sobra após subtrair "o que o mercado fez hoje" — é essencialmente zero. O bloco é uma fantasia.
Este é o insight metodológico mais importante em investimento temático, e quase ninguém publica os dados residualizados. Então a maioria dos gráficos de "bolha IA" é enganosa por construção.
Duas partes de cada retorno de ação
Cada retorno diário de uma ação pode ser decomposto em duas partes:
- Beta de mercado — o que o mercado amplo fez hoje, escalado por quanto essa ação tipicamente se move com o mercado.
- Idiossincrático — o que é específico desta ação, após subtrair o movimento de mercado.
Quando o S&P sobe 1%, uma ação com beta 1,5 é "esperada" a subir 1,5% só por causa da gravidade do mercado. Se ela realmente subiu 1,5%, o retorno idiossincrático do dia é zero — nada aconteceu especificamente para esta ação. O que ela fez foi 100% explicado pelo mercado.
Agora escale isso para uma cesta de ações. Se você computar a correlação por pares usando retornos brutos — as variações de preço diárias reais — você vai encontrar que cada ação mega-cap correlaciona com cada outra ação mega-cap em 0,5-0,8. Não é porque compartilham um tema. É porque todas se movem com o mercado, e todas estão no mercado.
O procedimento de residualização
A correção é direta e bem compreendida em finanças acadêmicas, mas raramente exibida em dashboards voltados ao varejo:
- Para cada ação, regrida seus retornos diários nos retornos diários do mercado (usamos $SPY) na mesma janela.
- Salve os resíduos — o que sobra após a regressão. Estes são os retornos diários que o mercado não conseguiu explicar.
- Compute a correlação entre os resíduos através das ações em vez de entre os retornos brutos.
O que você obtém é a correlação que reflete apenas o componente idiossincrático. Se duas ações ainda clusterizam após isso, compartilham uma exposição real além do beta de mercado. Isso é um bloco temático. Isso é o que queremos dizer com "bolha" na taxonomia QuantAbundancia.
O teste principal: correlação residualizada remove o beta de mercado e mantém o fluxo temático. Se o número residualizado permanece alto, o bloco é real. Se desaba para perto de zero, o co-movimento aparente era só todo mundo subindo junto porque a maré subiu.
Exemplo trabalhado #1 — Hyperscalers (a bolha falhada)
Pegue o agrupamento editorial natural para "hyperscalers do capex IA": $MSFT, $GOOGL, $AMZN, $META, $ORCL. São as cinco empresas comprometendo a maior parte das centenas de bilhões de dólares em gastos com infraestrutura IA em 2026. Certamente compartilham uma tese.
Rode a matriz de correlação em retornos brutos de 252 dias e a foto parece convincente — correlações por pares clusterizam em torno de 0,55-0,70. Se você parar aqui, vai concluir que isso é um bloco coerente, construir uma cesta, e chamar isso de seu trade capex de IA.
Depois residualize. Remova o beta $SPY de cada membro. Refaça a matriz de correlação nos resíduos.
Os números desabam para perto de zero.
O que estava acontecendo: estes são cinco dos maiores nomes de market-cap na bolsa. Têm betas similares. Quando o S&P se move, eles se movem juntos — mas por razões S&P, não por razões IA. A correlação bruta estava sendo inteiramente dirigida por sua exposição compartilhada ao mercado, que é uma propriedade de ser mega-cap, não uma propriedade de estar exposto à IA.
A leitura honesta: se você "joga capex IA comprando hyperscalers", está efetivamente comprando $SPY com passos extras. Qualquer tese de IA que você tenha está sendo diluída pelos 80-90% da receita dessas empresas que não tem nada a ver com gastos em infraestrutura IA.
É por isso que publicamos a página Hyperscalers com o resultado de validação falhada em vez de cobri-lo. Recibos batem narrativas.
Exemplo trabalhado #2 — Quantum (a bolha validada mais forte)
Agora rode o mesmo procedimento em Quantum: $QBTS, $RGTI, $IONQ, $ARQQ, $QUBT.
Correlação bruta de 252 dias é alta — em torno de 0,78. Já um ponto de partida interessante.
Residualize: 0,76.
Quase nenhuma queda.
Estas ações compartilham algo que o mercado não consegue explicar. Co-movem em notícias que não têm nada a ver com sentimento de mercado amplo. O sinal é: quando um nome de quantum-computing reporta um benchmark, os outros disparam. Quando o financiamento governamental de quantum é cortado, o bloco inteiro tanka. A exposição compartilhada é específica da história temática, não do beta de mercado.
Isso é como uma bolha real se parece em nosso framework. Os Hyperscalers tiveram uma queda 0,65 → ~0,05 sob residualização. Quantum mantém 0,78 → 0,76. Um é um bloco negociável; o outro é um rótulo de marketing.
Por que isso importa na prática
A maioria dos ETFs temáticos é vendida usando matrizes de correlação brutas em seus decks de marketing. Isso não é necessariamente desonesto — apenas reflete o padrão da indústria para "veja, estas ações se movem juntas". Mas para um trader tentando expressar uma tese específica, a matriz bruta é sistematicamente enganosa.
Três consequências concretas:
-
Sizing de posição — Um bloco com 0,76 de correlação residualizada significa que você não pode realmente "diversificar" dentro dele; se um cair 20% em notícia temática negativa, todos caem. Então seu tamanho de posição em qualquer nome único deveria ser dirigido pelo seu orçamento de tese para o bloco, não o nome. Um bloco que desaparece sob residualização (Hyperscalers) significa tratar cada nome como uma aposta idiossincrática separada.
-
Hedging — Você pode hedgear exposição temática com o ETF primário do bloco se a correlação residualizada for alta. Você não pode hedgear um bloco fantasma.
-
Resposta a catalisadores — Quando uma nova peça de notícia temática surge, um bloco real se move uniformemente. Um bloco falso se move heterogeneamente, com dominantes idiossincráticos (tipicamente o nome maior) absorvendo a maior parte do movimento enquanto nomes menores ficam para trás.
A metodologia por trás da plataforma
Esta não é uma computação pontual que rodamos para uma thread única. A plataforma QuantAbundancia recomputa correlações residualizadas diariamente, através das 12 bolhas editoriais, com uma janela móvel de 252 dias. Cada página de bolha no site mostra tanto o número bruto quanto o residualizado lado a lado. Quando o número residualizado desaba, dizemos publicamente. Páginas de bolhas falhadas permanecem publicadas.
O ponto mais profundo é metodológico: preferimos matar uma bolha editorial que gostamos do que manter um número que não se reproduz. A plataforma existe para publicar essa distinção transparentemente — não para validar cada história temática que por acaso soe certa.
Esse é o teste. É por isso que usamos 252 dias. É por isso que cada gráfico no site mostra a linha residualizada.
A narrativa diz "bolha IA". Os dados dizem: cerca de metade são reais.
Quer os dados ao vivo? Cada página de bolha na plataforma mostra a correlação residualizada mais recente, decomposição das ações membros, e contexto de fluxo diário. Grátis, atualizado toda noite após o fechamento US.
Related bubbles
Get the daily digest.
One email a day · alerts + bubble shifts + new research. Free during beta.
No spam. One email per day max. Telegram alerts coming with the paid tier.