Por que correlação > narrativa em investimento temático
Taxonomias editoriais dizem quais ações DEVERIAM negociar juntas. Correlação diz quais ações REALMENTE negociam juntas. Na maior parte do tempo, são listas diferentes.
Taxonomias editoriais dizem quais ações deveriam negociar juntas. Correlação diz quais ações realmente negociam juntas. Na maior parte do tempo, são listas diferentes. A lacuna é o alpha.
Cada narrativa temática — "ações de IA", "o trade de energia verde", "plays de infraestrutura", "a bolha dos remédios anti-obesidade" — é uma história. Histórias são como a mídia financeira fala. Histórias são como o marketing de ETFs funciona. Histórias são como o varejo decide o que comprar.
A mecânica é diferente. A mecânica é como o dinheiro realmente flui. Quando um ETF setorial recebe um bilhão em fluxos numa terça, os constituintes mecanicamente compram em proporção ao seu peso, independentemente de compartilharem uma história. Quando um hyperscaler sinaliza uma revisão de capex, a cadeia de demanda upstream responde, independentemente do rótulo editorial.
Histórias e mecânica se sobrepõem às vezes. Frequentemente, não. Os traders que sobrevivem aos ciclos temáticos são os que medem a mecânica em vez de confiar nas histórias.
O que "ações de IA" realmente contém
Escolha cinco "ações de IA" bem conhecidas: $NVDA, $AMD, $MSFT, $ASML, $PLTR.
A narrativa diz: todas se beneficiam do superciclo da IA. Compre-as como uma cesta e você expressou sua tese de IA.
Os dados dizem: são cinco ações respondendo a cinco fatores primários diferentes.
- $NVDA se move em sua própria história idiossincrática (expansão de margem, dinâmica competitiva MI300 vs Blackwell, embarques do Blackwell).
- $AMD se move com a NVDA secundariamente mas tem sua própria dinâmica data-center vs mix de PC.
- $MSFT se move com o fator software mais amplo — sua receita de IA é 10-15% do total; o resto é Office, gaming, enterprise legacy. A maior parte do movimento idiossincrático diário da MSFT não tem nada a ver com IA.
- $ASML se move com o bloco semi-equipment ($AMAT, $LRCX, $KLAC) — mesmo comprador, mesmo sinal de demanda. Bloco diferente da NVDA.
- $PLTR é um bicho à parte — risco político + contratos governamentais dominam. A associação com IA é em grande parte incidental.
Rode uma matriz de correlação residualizada nestas cinco. As correlações por pares entre elas são em sua maioria baixas. A estrutura que emerge é: NVDA + AMD clusterizam entre si (bloco Compute / GPU), ASML clusteriza com o bloco Semi Equipment (que não inclui NVDA ou AMD apertados), MSFT clusteriza com o fator software mais amplo (mais próxima de $CRM que da NVDA), e PLTR não clusteriza com ninguém.
Cinco "ações de IA". Cinco blocos diferentes. O rótulo editorial não está fazendo nenhum trabalho analítico.
O mercado negocia por exposição, não por tema
A razão pela qual isso acontece não é que a taxonomia editorial está "errada" — é que a taxonomia editorial agrupa por história (estas empresas todas se beneficiam da IA) enquanto o mercado negocia por exposição (cada ação responde a seu driver de receita dominante, que pode ou não estar relacionado à IA).
Quando o $SOXX recebe um bilhão em fluxos, cada constituinte se move na mesma hora porque o ETF mecanicamente compra em proporção ao peso. Isso é dirigido por exposição. NVDA pode ou não se mover com esse fluxo de ETF — está no índice mas seu fator idiossincrático frequentemente domina.
Quando um ETF temático como $BOTZ ("robótica") recebe fluxos, os constituintes respondem a esse fluxo mas os constituintes como grupo não co-movem em notícias da narrativa robótica. Eles respondem ao fluxo, depois respondem a seus próprios fatores.
É por isso que Semi Equipment é o bloco empiricamente validado mais forte em nossa taxonomia (0,82 de correlação residualizada): os quatro membros compartilham uma única exposição dominante (capex do mesmo punhado de foundries) e quase nada mais. História e mecânica se alinham.
Também é por isso que Hyperscalers é o bloco falhado canônico (~0,05 residualizado): os cinco membros nominalmente compartilham uma história de capex de IA, mas suas exposições de receita dominantes são selvagemente diferentes (Office, anúncios, varejo, etc.). História e mecânica divergem.
Exemplo trabalhado: a cesta "robótica" ARKQ
Um caso concreto útil. O $ARKQ é o ETF "Autonomous Technology & Robotics". A narrativa de marketing: possua um ticker, obtenha exposição ao tema robótica.
Olhe as correlações residualizadas dos constituintes e você encontra uma cesta de ações amarradas a aproximadamente cinco fatores distintos:
- $TSLA domina o peso da cesta e se move em notícias FSD + demanda VE. O ângulo "robótica" (Optimus humanoide) é uma pequena fração dos movimentos idiossincráticos da ação.
- ABB, Fanuc negociam com o ciclo de automação de fábricas asiáticas.
- $SYM se move com a guidance de capex trimestral do Walmart (seu maior cliente único).
- $NDSN se move com o ciclo industrial de precisão-automação.
- Nomes menores negociam idiossincraticamente.
A correlação residualizada através da cesta é aproximadamente 0,20. Tradução: não há um bloco robótica que possua uma fatia coerente dos movimentos idiossincráticos dessas ações. Comprar ARKQ pensando estar long de um tema robótica é comprar uma cesta de apostas não relacionadas que acontecem de estar no mesmo ETF.
Não significa que ARKQ seja um ETF ruim — pode ser uma cesta razoável com retornos ajustados ao risco aceitáveis. Apenas significa: não é uma expressão temática de robótica em nenhum sentido empírico significativo. O rótulo temático é um rótulo de marketing.
Por que isso importa para sizing
Três consequências concretas para construção de trades:
1. Sizing de posição é diferente para blocos reais vs. blocos falsos.
Para um bloco real (Semi Equipment, Quantum), o risco de constituinte é altamente substituível — seu orçamento de sizing é para a bolha, não o nome. Você pode escolher nomes dentro do bloco pela liquidez ou preferência de beta sem mudar muito sua exposição à tese. Uma posição de 3% no bloco distribuída em 4-5 nomes é uma única aposta de tese dimensionada a 3%.
Para um bloco falso (Hyperscalers, AI Software, Robótica), cada constituinte é sua própria aposta idiossincrática. Uma posição de 3% em $MSFT não é "1/5 de uma posição em Hyperscalers" — é uma aposta de tese completa em Microsoft. A implicação: não dimensione como se estivesse diversificando dentro de uma cesta temática, porque você não está.
2. Hedging funciona para blocos reais.
Se você está long no bloco Semi Equipment, pode hedgear com $SOXX (que é ~60% do bloco por peso). A correlação residualizada é alta o suficiente para que o hedge acompanhe a posição.
Você não pode hedgear significativamente um bloco falso. Long Hyperscalers não pode ser hedgeado com nada mais apertado que o próprio SPY, porque o "bloco" é essencialmente exposição SPY desde o início.
3. Catalisadores movem blocos de forma diferente.
Quando um grande catalisador temático atinge — digamos, um hyperscaler anuncia uma revisão de capex — um bloco upstream real se move uniformemente (Semi Equipment disparam todos juntos, com magnitudes similares). Um bloco falso se move heterogeneamente, com dominantes idiossincráticos (o maior nome) absorvendo a maior parte do movimento e os menores ficando para trás.
A implicação para trade: blocos reais permitem expressar visões sobre catalisadores temáticos com confiança na resposta no nível do bloco. Blocos falsos exigem prever qual constituinte absorverá mais do movimento, que é um problema de previsão muito mais difícil.
Nossa disciplina
A abordagem QuantAbundancia:
- Construir bolhas editoriais — começar pela narrativa (a história que estamos testando).
- Computar correlações residualizadas por pares — medir se a história se expressa no nível equity.
- Publicar qualquer resposta que os dados dão — incluindo, especialmente, as falhas.
Publicamos 12 bolhas editoriais. Cerca de metade passa no teste de validação limpamente. O resto permanece publicado com seus flags de validação falhada intactos. As páginas não são retiradas porque o resultado de que a bolha não negocia como um bloco é em si informação — acionável para qualquer trader que de outra forma teria construído uma cesta no rótulo editorial.
O ponto mais profundo não é "use correlação, não narrativa". Ambos têm valor. Narrativa diz qual história está sendo contada e onde os dólares de marketing fluem. Correlação diz se a história realmente se expressa no nível equity. Use ambos — mas não deixe nenhum substituir o outro.
Se você quer ver essa disciplina em ação, cada página de bolha na plataforma mostra correlação bruta + residualizada lado a lado. A lacuna é a lição.
Leia O que é correlação residualizada? para a metodologia, ou As 12 bolhas de IA, classificadas para a taxonomia completa com veredictos.
Related bubbles
Get the daily digest.
One email a day · alerts + bubble shifts + new research. Free during beta.
No spam. One email per day max. Telegram alerts coming with the paid tier.