Pourquoi corrélation > narratif en investissement thématique
Les taxonomies éditoriales vous disent quelles actions DEVRAIENT trader ensemble. La corrélation vous dit quelles actions tradent VRAIMENT ensemble. La plupart du temps, ce sont des listes différentes.
Les taxonomies éditoriales vous disent quelles actions devraient trader ensemble. La corrélation vous dit quelles actions tradent vraiment ensemble. La plupart du temps, ce sont des listes différentes. L'écart, c'est l'alpha.
Chaque narratif thématique — « les actions IA », « le trade énergie verte », « les plays infrastructure », « la bulle des médicaments anti-obésité » — est une histoire. Les histoires c'est comment les médias financiers parlent. Les histoires c'est comment le marketing d'ETF fonctionne. Les histoires c'est comment le retail décide quoi acheter.
La mécanique est différente. La mécanique c'est comment l'argent coule vraiment. Quand un ETF sectoriel reçoit un milliard de flux un mardi, les constituants achètent mécaniquement en proportion de leur poids, peu importe s'ils partagent une histoire. Quand un hyperscaler signale une révision de capex, la chaîne de demande en amont répond, peu importe le label éditorial.
Histoires et mécanique se chevauchent parfois. Souvent, non. Les traders qui survivent aux cycles thématiques sont ceux qui mesurent la mécanique au lieu de faire confiance aux histoires.
Ce que « actions IA » contient vraiment
Choisissez cinq « actions IA » bien connues : $NVDA, $AMD, $MSFT, $ASML, $PLTR.
Le narratif dit : elles bénéficient toutes du supercycle IA. Achetez-les comme un panier et vous avez exprimé votre thèse IA.
La donnée dit : ce sont cinq actions répondant à cinq facteurs primaires différents.
- $NVDA bouge sur sa propre histoire idiosyncratique (extension de marge, dynamique concurrentielle MI300 vs Blackwell, livraisons Blackwell).
- $AMD bouge avec NVDA en secondaire mais a sa propre dynamique data-center vs mix PC.
- $MSFT bouge avec le facteur software plus large — son revenu IA est 10-15 % du total ; le reste c'est Office, gaming, enterprise legacy. La plupart du mouvement idiosyncratique quotidien de MSFT n'a rien à voir avec l'IA.
- $ASML bouge avec le bloc semi-equipment ($AMAT, $LRCX, $KLAC) — même acheteur, même signal de demande. Bloc différent de NVDA.
- $PLTR est son propre animal — risque politique + contrats gouvernementaux dominent. L'association IA est largement incidente.
Faites tourner une matrice de corrélation résidualisée sur ces cinq. Les corrélations par paires entre elles sont majoritairement basses. La structure qui émerge c'est : NVDA + AMD se clusterisent ensemble (bloc Compute / GPU), ASML se clusterise avec le bloc Semi Equipment (qui n'inclut pas NVDA ou AMD serrés), MSFT se clusterise avec le facteur software plus large (plus proche de $CRM que de NVDA), et PLTR ne se clusterise avec personne.
Cinq « actions IA ». Cinq blocs différents. Le label éditorial ne fait aucun travail analytique.
Le marché trade par exposition, pas par thème
La raison pour laquelle ça arrive ce n'est pas que la taxonomie éditoriale est « fausse » — c'est qu'elle regroupe par histoire (ces entreprises bénéficient toutes de l'IA) pendant que le marché trade par exposition (chaque action répond à son driver de revenu dominant, qui peut être lié à l'IA ou pas).
Quand $SOXX reçoit un milliard en flux, chaque constituant bouge la même heure parce que l'ETF achète mécaniquement en proportion du poids. C'est piloté par l'exposition. NVDA peut bouger ou non avec ce flux ETF — elle est dans l'index mais son facteur idiosyncratique domine souvent.
Quand un ETF thématique comme $BOTZ (« robotique ») reçoit des flux, les constituants répondent à ce flux mais les constituants en tant que groupe ne co-bougent pas sur des news de narratif robotique. Ils répondent au flux, puis ils répondent à leurs propres facteurs.
C'est pour ça que Semi Equipment est le bloc empiriquement le plus fortement validé de notre taxonomie (0,82 de corrélation résidualisée) : les quatre membres partagent une exposition dominante unique (capex de la même poignée de foundries) et presque rien d'autre. Histoire et mécanique s'alignent.
C'est aussi pour ça que Hyperscalers est le bloc échoué canonique (~0,05 résidualisé) : les cinq membres partagent nominalement une histoire de capex IA, mais leurs expositions de revenus dominantes sont sauvagement différentes (Office, pubs, retail, etc.). Histoire et mécanique divergent.
Exemple traité : le panier « robotique » ARKQ
Un cas concret utile. $ARKQ est l'ETF « Autonomous Technology & Robotics ». Le narratif marketing : possédez un seul ticker, obtenez l'exposition au thème robotique.
Regardez les corrélations résidualisées des constituants et vous trouvez un panier d'actions liées à environ cinq facteurs distincts :
- $TSLA domine le poids du panier et bouge sur des news FSD + demande VE. L'angle « robotique » (Optimus humanoïde) est une petite fraction des mouvements idiosyncratiques de l'action.
- ABB, Fanuc tradent avec le cycle d'automation des usines asiatiques.
- $SYM bouge avec la guidance capex trimestrielle de Walmart (son plus gros client unique).
- $NDSN bouge avec le cycle industriel de précision-automation.
- Les noms plus petits tradent idiosyncratiquement.
La corrélation résidualisée à travers le panier est approximativement 0,20. Traduction : il n'y a pas de bloc robotique qui possède une part cohérente des mouvements idiosyncratiques de ces actions. Acheter ARKQ en pensant être long d'un thème robotique c'est acheter un panier de paris non liés qui se trouvent être dans le même ETF.
Ça ne veut pas dire qu'ARKQ est un mauvais ETF — c'est peut-être un panier correct avec des rendements ajustés du risque raisonnables. Ça veut juste dire : ce n'est pas une expression thématique de la robotique dans aucun sens empirique significatif. Le label thématique est un label marketing.
Pourquoi ça compte pour le sizing
Trois conséquences concrètes pour la construction de trades :
1. Le sizing de position est différent pour les vrais blocs vs. les faux blocs.
Pour un vrai bloc (Semi Equipment, Quantum), le risque constituant est hautement substituable — votre budget de sizing est pour la bulle, pas le nom. Vous pouvez choisir les noms dans le bloc sur la liquidité ou la préférence de bêta sans changer beaucoup votre exposition à la thèse. Une position de 3 % dans le bloc répartie sur 4-5 noms est un seul pari de thèse dimensionné à 3 %.
Pour un faux bloc (Hyperscalers, AI Software, Robotique), chaque constituant est son propre pari idiosyncratique. Une position de 3 % dans $MSFT n'est pas « 1/5 d'une position Hyperscalers » — c'est un pari thèse complet sur Microsoft. L'implication : ne dimensionnez pas comme si vous diversifiez dans un panier thématique, parce que vous ne le faites pas.
2. Le hedging fonctionne pour les vrais blocs.
Si vous êtes long le bloc Semi Equipment, vous pouvez hedger avec $SOXX (qui est ~60 % du bloc par poids). La corrélation résidualisée est suffisamment haute pour que le hedge suive la position.
Vous ne pouvez pas hedger significativement un faux bloc. Long Hyperscalers ne peut pas être hedgé avec quoi que ce soit de plus serré que SPY lui-même, parce que le « bloc » est essentiellement de l'exposition SPY pour commencer.
3. Les catalyseurs bougent les blocs différemment.
Quand un catalyseur thématique majeur tombe — disons, un hyperscaler annonce une révision de capex — un vrai bloc upstream bouge uniformément (Semi Equipment ripent tous ensemble, avec des magnitudes similaires). Un faux bloc bouge de manière hétérogène, avec des dominants idiosyncratiques (le plus gros nom) absorbant la majeure partie du mouvement et les noms plus petits traînant.
L'implication trade : les vrais blocs vous laissent exprimer des vues sur catalyseurs thématiques avec confiance dans la réponse au niveau bloc. Les faux blocs nécessitent de prédire quel constituant absorbera le plus du mouvement, ce qui est un problème de prévision beaucoup plus difficile.
Notre discipline
L'approche QuantAbundancia :
- Construire des bulles éditoriales — commencer par le narratif (l'histoire que nous testons).
- Calculer les corrélations résidualisées par paires — mesurer si l'histoire s'exprime au niveau equity.
- Publier la réponse que la donnée donne — y compris, surtout, les échecs.
Nous avons publié 12 bulles éditoriales. Environ la moitié passent le test de validation proprement. Le reste reste publié avec leurs flags de validation échouée intacts. Les pages ne sont pas retirées parce que le résultat que la bulle ne trade pas comme un bloc est lui-même de l'information — actionable pour tout trader qui aurait sinon construit un panier sur le label éditorial.
Le point plus profond n'est pas « utilisez la corrélation, pas le narratif ». Les deux ont de la valeur. Le narratif vous dit quelle histoire est racontée et où les dollars marketing coulent. La corrélation vous dit si l'histoire s'exprime vraiment au niveau equity. Utilisez les deux — mais ne laissez pas l'un se substituer à l'autre.
Si vous voulez voir cette discipline en action, chaque page de bulle sur la plateforme montre la corrélation brute + résidualisée côte à côte. L'écart c'est la leçon.
Lisez Qu'est-ce que la corrélation résidualisée ? pour la méthodologie, ou Les 12 bulles IA, classées pour la taxonomie complète avec les verdicts.
Related bubbles
Get the daily digest.
One email a day · alerts + bubble shifts + new research. Free during beta.
No spam. One email per day max. Telegram alerts coming with the paid tier.