L’approche APT

Le système APT est une application complète, authentique, et sans raccourcis de la Théorie des Prix d’Arbitrage. Bien que le théorème APT (Ross, 1976) soit centré sur les anticipations de prix des actifs dans un marché arbitré, l’une de ses conséquences les plus importantes concerne les fluctuations de prix entre tous ces actifs, en d’autres termes leur risque.

Un Mot au sujet du Risque d’un Portefeuille

Avant que nous explorions la théorie, il convient de rappeler quelques principaux points quant au risque d’un portefeuille:

Le rendement d’un portefeuille est simplement la moyenne pondérée des rendements des différents actifs du portefeuille, les pondérations étant les poids des actifs dans le portefeuille.

Le risque d’un portefeuille est un peu plus complexe. C’est la somme pondérée des variances et des covariances des actifs dans le portefeuille, les pondérations retenues étant le carré des poids des actifs dans le portefeuille. Pour faciliter l’interprétation, il est plus simple d’utiliser les unités de rendement originales plutôt que les rendements au carré qui entrent dans le calcul de la variance, de telle sorte que le risque est couramment exprimé comme la racine carrée de la variance, "la volatilité" (c’est à dire l’écart type) des rendements du portefeuille. Le risque par rapport à un benchmark est alors la volatilité du portefeuille "couvert", c’est à dire la combinaison algébrique du portefeuille d’origine et le benchmark.

En résumé, pour calculer le risque d’un portefeuille, il suffit d’effectuer les calculs suivants:

  • Rassembler variances et covariances des rendements des actifs dans une seule table - la "matrice de covariance"
  • Noter les poids des actifs dans le portefeuille
  • Appliquer la formule du risque du portefeuille, une fonction dite quadratique

Pourquoi rappeler ce qui est connu depuis plus de 40 ans?

Pour une raison fort simple: quelque soit la méthode que nous utilisions pour analyser le risque du portefeuille, on doit toujours finalement utiliser une méthode qui soit cohérente avec cette matrice. Jusqu’à ce que ce fait soit redécouvert par les architectes de la "Value-at-Risk" (VaR) en 1994, il paraissait avoir été oublié par tous les systèmes d’analyse de risque.

Estimation de la Matrice de Covariance

Pour faire une prédiction et estimer le risque prospectif d’un portefeuille, il nous faut des estimations des variances et des covariances des actifs, donc de la matrice de covariance.

Comment l’obtenir?

Une méthode possible serait de traiter chaque actif indépendamment et d’utiliser un estimateur simple de volatilité ou différentes combinaisons de tels estimateurs par exemple Garman-Klass 1980, ou même estimateur de type GARCH (Engle, 1982; Bollerslev, 1986). Pour les actifs où il existe des marchés de volatilité, c’est à dire des marchés d’options, on pourrait même prendre les prédictions du marché implicites dans les prix des options, ce qu’on appelle la volatilité impliquée ou implicite. Quelque soit notre choix, chaque actif est traité séparément. Les seules données qui sont utilisées dans l’estimation sont l’historique de cet actif, et de ce seul actif.

De même pour la covariance. Pour tout couple d’actions, on pourrait utiliser la covariance classique entre deux actifs, par exemple entre Microsoft et IBM, en ignorant toutes les autres actions. Dans ce cas, les seules données qui sont utilisées, sont les données relatives à ces deux actions, et aucune autre. Chaque couple est traité de façon isolée.

En d’autres termes, il s’agit là de méthodes locales.

Ce sont des méthodes "myopes" qui cachent de l’information et imprécises de surcroît. Mais leur plus grande lacune est qu’elles ne reposent sur aucune théorie. Ce sont des méthodes qui sont essentiellement basées sur les données et rien d’autre. Et en effet leurs limitations apparaissent très clairement. Les matrices de covariance qui sont construites de cette façon sont particulièrement instables et souvent induire en erreur.

Une autre méthode serait connaître les "dessous" de la volatilité, les variables "motrices" en quelque sorte Si nous choisissons quelques variables et nous spécifions la relation qui existe entre ces variables "motrices" et chaque titre, on peut estimer la contribution de ces variables motrices à partir de données historiques. Examinons par exemple l’action Microsoft et supposons que nous la considérions comme une action de "croissance", on peut bien émettre une définition hypothétique des actions de "croissance", et ensuite mesurer la contribution de la variable "croissance" qui expliquerait en partie la performance de Microsoft.

Cependant une telle approche soulève de très gros problèmes économétriques que l’on ne saurait ignorer: pour être fiable l’estimation doit supposer que le modèle est correctement spécifié. Pour parler en bon français, si on utilise la variable X alors que l’on devrait utiliser la variable Y, les estimations ne sont pas meilleures que si nous avions simplement deviné au hasard la solution. Et en effet si l'on prend d'autres observations dans l'échantillon, les résultats changeront, quelquefois de façon très notable. Ceci signifie que le risque changera également. Ce type d'erreur, qui est le talon d'Achille de l'économétrie, a un nom. Cela s'appelle l'erreur de spécification. On ne peut pas y remédier en utilisant simplement plus de données. Ce ne sont pas les données qui sont à l'on blâmer, c’est la carence théorique –l’absence totale de théorie. La seule façon de s'en sortir, c'est d'avoir une théorie, c'est à dire un modèle qui explique les prix relatifs des actifs. L'analyse statistique dans un vide théorique n'est pas simplement sans valeur, elle est dangereuse. Elle suggère une information là où il n’y a qu’ajustements de données. Une leçon cinglante des 20 dernières années d’économétrie, c’est l’échec total spectaculaire des grands modèles macro économétriques.

Notons également que même si nous connaissions la spécification correcte à partir d’une théorie, il faudrait encore pouvoir mesurer les variables motrices correctement. Sinon les estimations sont également fausses.

Mais le pire des problèmes de cette méthode, un coup mortel, c’est qu’elle ignore totalement la matrice de covariance. Quelques soient les variables conductrices, nous mesurons la contribution à chaque action "dans le vide", pour ainsi dire, c’est à dire de façon totalement indépendante de la matrice de covariance avec toutes les autres actions. En fait, la matrice de covariance n’entre jamais dans le propos. Elle a littéralement disparu.

Et pourtant on ne peut pas contourner les mathématiques: le risque du portefeuille est une fonction explicite de la matrice de covariance. Mesurer le risque du portefeuille en ignorant la matrice de covariance est une folie. Ignorer ce qui définit le risque du portefeuille, c’est se garantir une grande déception dans les estimations à venir.

Il est vrai que pour parler honnêtement, la plupart des modèles de risque bien connus qui utilisent cette approche furent construits avant la découverte du théorème d’APT par Ross en 1976. Mais l’erreur fondamentale reste dans toutes les variations ultérieures de ce type de modèle. Aujourd’hui on peut éviter cette erreur.

Le Théorème d’APT et le Risque

Nous ne sommes plus maintenant dans une situation où nous n’avons aucune théorie. Depuis la découverte de Ross, il existe en effet une théorie très puissante et tout à fait remarquable, une théorie basée sur le modèle des prix des actifs le plus fondamental, à savoir les prix d’arbitrage. C’est le même type d'arbitrage qui a permis la croissance des modèles financiers dans les domaines des dérivées depuis 25 ans.

Le théorème d’arbitrage de APT établit une relation de prix d’équilibre entre chaque actif et son rendement espéré et tous les autres. La relation est comprise dans la matrice de covariance. En d’autres termes, c’est la structure même de la matrice de covariance qui force l’arbitrage entre les actifs. Plus précisément, le théorème démontre que les rendements espérés de chaque actif au-delà de ce qu’on peut attendre du rendement de l’actif sans risque, seront simplement la somme des sensibilités communes à tous les actifs, pondérée par le prix que le marché assigne à ces risques, à savoir les primes de risque.

Ce qui définit un risque dans l’équation, ce n’est pas simplement une variable spécifique du monde réel, mais le fait qu'elle est partagée. A différents moments au cours du temps, les investisseurs se focaliseront sur différents types de risque. Ils seront souvent en désaccord sur ce qui crée le risque ou ce qu’il ne crée pas. Ils changeront leur centre d’intérêt, et ils changeront d’avis de temps en temps. Les marchés des capitaux naissent et vivent de cette discorde. Différents thèmes, des thèmes anciens et des thèmes nouveaux, apparaîtront et disparaîtront au cours du temps. Ceci signifie que nous ne pourrons jamais directement observer ces traits communs.

En fait il ne faut même pas essayer.

A ce niveau, lorsque nous voulons estimer le risque de façon précise et non l’attribuer, on doit donc se focaliser sur le risque. Le théorème ne dit rien sur ce que sont les variables motrices du risque. C’est un résultat mathématique direct qui relie la performance de chaque action à des portefeuilles d’action non corrélés, chaque portefeuille faisant essentiellement la "mimique" des contributions indépendantes de ces variables communes.

Sans nous étendre sur des arguments mathématiques complexes, tout ce que le théorème dit, c’est qu’en moyenne les rendements obéiront à cette relation de prix. C’est en fait un énoncé du rôle profond de la structure de la matrice de covariance.

De façon plus formelle, il dit qu’au-delà d’être simplement une matrice carrée symétrique, cette matrice aura en fait un rang effectif beaucoup plus petit que le nombre d’actifs qui sont dans le marché. En termes plus techniques, elle sera, dans un sous-espace de l'espace des actifs.

La représentation des matrices dans des sous-espaces différents et des bases de coordonnées différentes est un domaine qui a une longue histoire en mathématiques. Voir par exemple l'analyse des espaces engendrés par les vecteurs propres, décomposition spectrale, (Eckart et Young, 1936.) Donc en principe extraire cette structure semble assez facile. Mais en pratique quand les données sont des observations d’un échantillon qui sont engendrées par un processus stochastique, il s’agit en fait d’un très gros problème statistique (Blin, 1997, Blin et Bender 1995).

Une chose est certaine cependant. Si nous réussissons à le faire, nous n’aurons aucune erreur de spécification et ceci par construction puisque nous appliquerons simplement le théorème. Et de plus, nous serons totalement cohérents avec la matrice de covariance, et ceci également par construction puisque nous partirons de la matrice de covariance.

Au sujet de l’estimation

L’approche standard est d’essayer d’appliquer la matrice dans un espace de valeurs propres, par exemple dans l’espace engendré par une ’analyse en composantes principales (PCA). Et en effet, 10 ans avant la découverte du théorème de APT, King (1966) avait appliqué l’analyse en composantes principales à l’univers de l’indice Dow Jones. Bien que le but de l’exercice ait été simplement d’essayer de découvrir différents facteurs statistiques communs plutôt que de mesurer le risque d’un portefeuille d’actions basé sur l’univers Dow Jones, cet exercice illustra bien le comportement commun sous-jacent à la performance des actions.

Une chose cependant qui n’avait pas été remarquée fut le fait qu’il y avait beaucoup moins d’actions dans cet échantillon (30) qu’il n’y avait d’observations des rendements. En général, c’est la situation inverse qui se présente. Puisque nous devons utiliser tous les actifs (actions, obligations, matières premières, devises, etc) pour créer la matrice et puisque la fréquence des rendements est limitée par la non synchronicité des prix, il y aura toujours beaucoup plus d’actifs qu’il y aura de périodes pour observer les rendements. Le "ratio de concentration", c’est à dire le nombre d’actifs divisé par le nombre d’observations dans le temps, est tout à fait distendu.

Sans aller dans des développements mathématiques a ce stade, il suffit de remarquer que le résultat de la matrice sera alors extrêmement biaisé. Donc pour factoriser cette matrice, par exemple par une analyse en composantes principales, on se trouvera devant des résultats qui seront en fait faux. Bien que ce soit peu connu en dehors de la littérature mathématique, ce problème fut le problème principal qui a entaché les efforts originaux de Ross et Roll en 1980 pour appliquer le théorème de APT à l’univers des actions US.

Nous utilisons un algorithme robuste, efficace et précis pour factoriser de très grosses matrices d’actifs, tout en évitant le problème du ratio de concentration. En partant de trois ans et demie de rendement hebdomadaire sur toutes les actions américaines (plus de 10.000 pour le modèle américain) et pour toutes les actions du monde (plus de 40.000 pour le modèle mondial), nous produisons des estimateurs non biaisés de la matrice de covariance.

Nous factorisons cette matrice entre 20 et 25 composantes (selon le marché). Ces composantes forment une base orthonormale, c’est à dire un système de coordonnées à angle droit mesuré en unités d’écart-type. En appliquant ces rendements des actions dans cet espace par des méthodes de régression robuste, on produit:

  • la partie du risque de la variance de l’action qui est "systématique", c’est à dire partagée avec les autres actions, et
  • la partie qui est "spécifique", c’est à dire qui est tout à fait unique à la caractéristique de cette action.

Le profil de risque APT de chaque valeur mobilière, ce qu’on appelle sa "carte-risque», est simplement un vecteur de 20 a 50 chiffres représentant les coordonnées de cette valeur mobilière sur chaque axe. Le dernier élément de ce vecteur représente la partie spécifique de cette action qui existe à l’extérieur de cet espace.

Pour mesurer le risque total de toute valeur mobilière, on prend simplement la racine carrée de la somme des carrés de ces coefficients. Le risque systématique est cette portion qui existe dans cet espace. Le risque spécifique est cette portion qui existe dans le complément de cet espace.

Qu’est ce que nous avons donc créé ainsi?

A ce niveau, nous avons en effet accompli la tâche que nous nous étions fixée.

Quelque soit le portefeuille de valeurs mobilières à étudier, nous pouvons maintenant mesurer son risque total et ces composantes:

  • Le risque systématique partagé par toutes les valeurs mobilières à différents degrés, c'est à dire le risque non diversifiable, ce risque que les gérants cherchent à éviter, essayant ainsi d'aligner ce risque systématique dans leur portefeuille avec celui du benchmark.
  • Le risque spécifique à la société. C’est le risque qui vient de stratégies spécifiques, telles que celles basées sur les surprises dans les annonces de résultat, des complications légales chez la société ou d’autres évènements spécifiques à cette société et inconnus chez ses concurrents.

Le risque du portefeuille découle tout naturellement. Tout d’abord nous prenons la somme pondérée des risques et des profils de risque APT en utilisant les poids de ces positions dans le portefeuille pour les pondérations, obtenant ainsi le profil du portefeuille APT. Ensuite en traitant ce profil comme s’il était une valeur mobilière synthétique, on applique la même formule: racine carrée de la somme des carrés, comme si c’était n’importe quelle valeur mobilière.

Avec cette information, le modèle APT peut calculer la tracking error de tout portefeuille par rapport à tout indice. Des simulations historiques nombreuses et des simulations en dehors de la période d’échantillonnage de l’estimation ont montré que la tracking error de APT est la plus précise qui soit..

Mesure de Risque et Attribution de Risque

Bien que nous ayons atteint notre but original de mesurer le risque d’un portefeuille et de le décomposer entre portions spécifiques et portions systématiques, il s’agit là purement d’un résultat statistique. On appelle souvent ceux-ci des "facteurs statistiques", car ils naisssent d’une factorisation de la matrice de covariance. Ce qu’ils "signifient" est qu’ils génèrent le plus fidèlement possible la matrice de covariance pour un espace de dimension donnée. En d’autres termes, ils reflètent la vraie covariance entre les actions, quelques soient les variables du monde réel qui puissent avoir conduit à cette covariance à un certain moment du temps. Du point de vue du théorème APT, c'est tout ce dont on a besoin. Et c’est ce qui garantit des résultats précis et cohérents.

Mais du point de vue de tests pour savoir si le portefeuille a une exposition à des changements aux taux longs ou des déplacements de la courbe des taux, une réduction du crédit, une chute du dollar, une renaissance des valeurs de type "value", etc, on doit aller plus loin, faire un pas de plus. Nous devons maintenant "appliquer" n’importe quelle de ces variables ou même des variables qui ont été crées par l’usager, sur le même espace que l’espace APT pour analyser leur variance et la relier à la variance du portefeuille. En d’autres termes, nous avons besoin d’un lien pour estimer la variable d’intérêt du gérant.

Pour ce faire, APT a développé une technique d’attribution du risque unique qui décompose le risque d’un portefeuille et sa tracking error dans des facteurs basés sur des variables du monde réel, donc observables.

Un point important à noter dans cet exercice: nous ne cherchons pas à changer nos estimations de risque d’origine. Elles sont robustes, cohérentes avec la covariance et basées sur une théorie et donc précises. Nous cherchons simplement à trouver quelle portion de ces estimations peut être exprimée par des variables, des "facteurs" comme on dit, que nous choisissons. Cette distinction est essentielle. Les modèles de risque populaires mélangent la mesure de risque et l’attribution de risque. Comme nous l'avons montré et comme l'algèbre simple le montre, la mesure de risque vient dans un premier temps et est totalement indépendante de l’attribution de risque. Quand on mélange les deux problèmes ou même quand on suit l’ordre inverse, on produit de mauvaises attributions de risque et de mauvaises mesures de risque.

En créant un système ouvert donnant aux utilisateurs une grande latitude pour choisir l’ensemble des facteurs de risque qu’ils pensent être les plus appropriés pour un objectif donné, nous leur permettons d’explorer différentes décompositions factorielles de leur portefeuille, sans pour autant subir des effets de changement de risque qui découleraient normalement du changement de spécification. Et de fait, nous montrons le fossé existant entre une spécification donnée et le vrai risque du portefeuille, mesurant effectivement ainsi l’erreur de spécification.

Contactez APT pour une présentation, démonstration et un exemple de rapport de risque pour votre fonds ou vos positions.

top