Qu'est-ce que la corrélation résidualisée ? (Et pourquoi la plupart des ETF thématiques mentent)
Le bêta de marché caché dans les « bulles IA » rend les matrices de corrélation inutiles tant qu'on ne le retire pas. Exemple traité : pourquoi les Hyperscalers échouent au test et Quantum réussit.
Quand vous lisez que les « actions IA » ont toutes bougé ensemble ce matin — $NVDA +2 %, $MSFT +1,8 %, $GOOGL +2,1 %, $AMZN +1,7 % — votre premier réflexe est d'appeler ça un mouvement thématique. Elles partagent une exposition. C'est un bloc. La « bulle IA » est réelle.
Ce réflexe a presque toujours tort.
La raison pour laquelle ces noms ont bougé ensemble ce matin, ce n'est pas parce qu'ils partagent une exposition thématique IA. C'est parce que le marché était à +1,6 % et que ce sont tous des noms à 1 000 G$+ de capitalisation avec un bêta élevé. Retirez le mouvement de marché et vous trouverez que le co-mouvement résiduel — ce qui reste après avoir soustrait « ce que le marché a fait aujourd'hui » — est essentiellement zéro. Le bloc est un costume.
C'est l'insight méthodologique le plus important en investissement thématique, et presque personne ne publie la donnée résidualisée. Donc la plupart des graphiques de « bulle IA » sont trompeurs par construction.
Deux parties de chaque rendement d'action
Chaque rendement quotidien d'une action peut être décomposé en deux parties :
- Bêta de marché — ce que le marché large a fait aujourd'hui, scalé par à quel point cette action bouge typiquement avec le marché.
- Idiosyncratique — ce qui est spécifique à cette action, après avoir soustrait le mouvement de marché.
Quand le S&P est à +1 %, une action avec un bêta de 1,5 est « attendue » à +1,5 % juste à cause de la gravité du marché. Si elle est effectivement à +1,5 %, le rendement idiosyncratique du jour est zéro — rien n'est arrivé spécifiquement à cette action. Tout ce qu'elle a fait était 100 % expliqué par le marché.
Maintenant scalez ça à un panier d'actions. Si vous calculez leur corrélation par paires en utilisant des rendements bruts — les variations de prix quotidiennes réelles — vous trouverez que chaque action mega-cap corrèle avec chaque autre action mega-cap à 0,5-0,8. Ce n'est pas parce qu'elles partagent un thème. C'est parce qu'elles bougent toutes avec le marché, et qu'elles sont toutes dans le marché.
La procédure de résidualisation
Le correctif est direct et bien compris en finance académique, mais rarement remonté dans les dashboards grand public :
- Pour chaque action, régressez ses rendements quotidiens sur les rendements quotidiens du marché (nous utilisons $SPY) sur la même fenêtre.
- Sauvegardez les résidus — ce qui reste après la régression. Ce sont les rendements quotidiens que le marché n'a pas pu expliquer.
- Calculez la corrélation entre les résidus à travers les actions au lieu d'entre les rendements bruts.
Ce que vous obtenez c'est la corrélation qui reflète uniquement la composante idiosyncratique. Si deux actions se clusterisent encore après ça, elles partagent une vraie exposition au-delà du bêta de marché. C'est un bloc thématique. C'est ce que nous voulons dire par « bulle » dans la taxonomie QuantAbundancia.
Le test phare : la corrélation résidualisée retire le bêta de marché et garde le flux thématique. Si le nombre résidualisé reste haut, le bloc est réel. S'il s'effondre près de zéro, le co-mouvement apparent n'était que tout le monde qui monte ensemble parce que la marée est montée.
Exemple traité #1 — Hyperscalers (la bulle échouée)
Prenez le regroupement éditorial naturel pour « les hyperscalers du capex IA » : $MSFT, $GOOGL, $AMZN, $META, $ORCL. Ce sont les cinq entreprises qui engagent la majeure partie des centaines de milliards de dollars de dépenses d'infrastructure IA en 2026. Elles doivent sûrement partager une thèse.
Faites tourner la matrice de corrélation sur 252 jours de rendements bruts et l'image paraît convaincante — les corrélations par paires se clusterisent autour de 0,55-0,70. Si vous vous arrêtez là, vous conclurez que c'est un bloc cohérent, construirez un panier, et appellerez ça votre trade capex IA.
Puis résidualisez. Retirez le bêta $SPY de chaque membre. Refaites tourner la matrice de corrélation sur les résidus.
Les nombres s'effondrent près de zéro.
Ce qui se passait : ce sont cinq des plus grosses capitalisations boursières de la cote. Elles ont des bêtas similaires. Quand le S&P bouge, elles bougent ensemble — mais pour des raisons S&P, pas pour des raisons IA. La corrélation brute était entièrement portée par leur exposition de marché partagée, qui est une propriété d'être mega-cap, pas une propriété d'être exposé à l'IA.
La lecture honnête : si vous « jouez le capex IA en achetant des hyperscalers », vous achetez effectivement $SPY avec des étapes supplémentaires. Toute thèse IA que vous avez est diluée par les 80-90 % de revenus de ces entreprises qui n'ont rien à voir avec les dépenses d'infrastructure IA.
C'est pour ça que nous publions la page Hyperscalers avec le résultat de validation échouée plutôt que de le maquiller. Les reçus battent les récits.
Exemple traité #2 — Quantum (la plus forte bulle validée)
Faites maintenant tourner la même procédure sur Quantum : $QBTS, $RGTI, $IONQ, $ARQQ, $QUBT.
La corrélation brute sur 252 jours est haute — autour de 0,78. Déjà un point de départ intéressant.
Résidualisez : 0,76.
Presque pas de chute.
Ces actions partagent quelque chose que le marché ne peut pas expliquer. Elles co-bougent sur des news qui n'ont rien à voir avec le sentiment de marché large. Le signal c'est : quand un nom de quantum-computing reporte un benchmark, les autres rip. Quand le financement gouvernemental quantum est coupé, le bloc entier tanke. L'exposition partagée est spécifique à l'histoire thématique, pas au bêta de marché.
C'est à quoi ressemble une vraie bulle dans notre cadre. Les Hyperscalers avaient une chute 0,65 → ~0,05 sous résidualisation. Quantum tient à 0,78 → 0,76. L'un est un bloc tradable ; l'autre est un label marketing.
Pourquoi c'est important en pratique
La plupart des ETF thématiques sont vendus en utilisant des matrices de corrélation brutes dans leurs decks marketing. Ce n'est pas nécessairement malhonnête — ça reflète juste le standard industrie pour « regardez, ces actions bougent ensemble ». Mais pour un trader essayant d'exprimer une thèse spécifique, la matrice brute est systématiquement trompeuse.
Trois conséquences concrètes :
-
Sizing de position — Un bloc avec 0,76 de corrélation résidualisée signifie que vous ne pouvez pas vraiment « diversifier » à l'intérieur ; si l'un tombe de 20 % sur une news thématique négative, ils tombent tous. Donc votre taille de position sur n'importe quel nom unique devrait être pilotée par votre budget thèse pour le bloc, pas le nom. Un bloc qui disparaît sous résidualisation (Hyperscalers) signifie traiter chaque nom comme un pari idiosyncratique séparé.
-
Hedging — Vous pouvez hedger l'exposition thématique avec l'ETF principal du bloc si la corrélation résidualisée est haute. Vous ne pouvez pas hedger un bloc fantôme.
-
Réponse aux catalyseurs — Quand une nouvelle pièce de news thématique tombe, un vrai bloc bouge uniformément. Un faux bloc bouge de manière hétérogène, avec des dominants idiosyncratiques (typiquement le plus gros nom) absorbant la majeure partie du mouvement pendant que les plus petits noms traînent.
La méthodologie derrière la plateforme
Ce n'est pas un calcul one-off que nous avons fait pour un seul thread. La plateforme QuantAbundancia recalcule les corrélations résidualisées quotidiennement, à travers les 12 bulles éditoriales, avec une fenêtre glissante de 252 jours. Chaque page de bulle sur le site montre à la fois le nombre brut et le nombre résidualisé côte à côte. Quand le nombre résidualisé s'effondre, nous le disons publiquement. Les pages de bulles échouées restent publiées.
Le point plus profond est méthodologique : nous préférons tuer une bulle éditoriale que nous aimons plutôt que de garder un nombre qui ne se reproduit pas. La plateforme existe pour publier cette distinction transparemment — pas pour valider chaque histoire thématique qui sonne bien.
C'est le test. C'est pour ça que nous utilisons 252 jours. C'est pour ça que chaque graphique sur le site montre la ligne résidualisée.
Le récit dit « bulle IA ». La donnée dit : environ la moitié sont réelles.
Vous voulez la donnée live ? Chaque page de bulle sur la plateforme montre la dernière corrélation résidualisée, la décomposition des actions membres, et le contexte de flux quotidien. Gratuit, rafraîchi chaque nuit après la clôture US.
Related bubbles
Get the daily digest.
One email a day · alerts + bubble shifts + new research. Free during beta.
No spam. One email per day max. Telegram alerts coming with the paid tier.