En probabilités et statistiques, une copule est une fonction qui capture la structure de dépendance entre plusieurs variables aléatoires, indépendamment de leurs distributions marginales. Pour des variables aléatoires X1, X2, …, Xn, leurs distributions marginales décrivent leur comportement individuel. Toutefois, en finance, les relations entre ces variables peuvent être complexes et non linéaires. Les copules permettent de modéliser ces relations.
Le théorème de Sklar affirme que, pour une distribution conjointe F(X1, …, Xn) de variables aléatoires X1, …, Xn, il existe une copule C telle que :
F(X1, …, Xn) = C(F1(X1), …, Fn(Xn))
où F1, …, Fn sont les fonctions de distribution cumulée (CDFs) marginales de X1, …, Xn. La copule C lie donc les CDFs marginales pour former la distribution conjointe, capturant ainsi la dépendance entre les variables.
Considérons un exemple pour mieux comprendre et prenons les temps de course (en minutes) d'Alice et Bob sur cinq courses :
Course Tps d’Alice (X1) Tps de Bob (X2)
1 25 26
2 23 24
3 22 22
4 27 28
5 26 25
On observe une dépendance apparente : quand l'un court plus vite, l'autre aussi.
Pour utiliser une copule, on transforme les temps de course de chaque coureur en variables uniformes via leurs fonctions de distribution cumulée (CDFs) empiriques. Les CDFs pour Alice (F1) et Bob (F2) sont les suivantes :
Temps (xi) F1(xi) pr Alice F2(xi) pr Bob
22 0,2 0,2
23 0,4 0,4
24 - 0,6
25 0,6 0,8
26 0,8 -
27 1,0 -
28 - 1,0
Ces CDFs transforment les temps en variables uniformes U1 et U2. Par exemple, lors de la course 3, où Alice et Bob ont couru en 22 minutes, leurs valeurs uniformes respectives sont U1 = F1(22) = 0,2 et U2 = F2(22) = 0,2.
La copule de Clayton, une copule de type archimédien (*) , capture la dépendance asymétrique, en particulier dans la queue inférieure (lorsque les deux variables prennent des valeurs faibles simultanément). Sa formule est :
C(u1, u2) = (u1^{-θ} + u2^{-θ} - 1)^{-1/θ}
où u1 et u2 sont des valeurs comprises entre 0 et 1, et θ (thêta) contrôle la force de la dépendance.
Dans notre exemple, supposons θ = 2. Pour la course 3 (U1 = 0,2, U2 = 0,2), la valeur de la copule est calculée comme suit :
1. u1^{-θ} = 0,2^{-2} = 25 ,
2. u2^{-θ} = 0,2^{-2} = 25,
3. u1^{-θ} + u2^{-θ} - 1 = 25 + 25 - 1 = 49.
Donc, C(0,2, 0,2) = 49^{-1/2} = 1/7 ≈ 0,1429.
Cette valeur représente la probabilité conjointe que les deux coureurs réalisent des performances inférieures à leur 20e percentile, indiquant une forte dépendance lorsqu'ils courent bien.
La corrélation linéaire mesure la dépendance linéaire, mais ne capture pas les relations non linéaires ou les dépendances dans les queues de distribution.
Par exemple, si Alice et Bob courent tous deux soit très vite, soit très lentement ensemble, une forte dépendance dans les queues ne serait pas complètement capturée par la corrélation linéaire.
(*) Le terme "archimédien" reflète comment ces copules utilisent une fonction génératrice simple pour saisir des dépendances complexes.
À propos de l'auteur
Florian Campuzan, diplômé de Sciences Po Paris (section économique et financière) et titulaire d'une licence en économie (monnaie et finance), est également détenteur de la certification CFA et agréé AMF. Il a débuté sa carrière dans le capital-risque en tant que responsable d’investissement avant de se tourner vers la finance de marché en tant que trader compte propre. Au début des années 2010, il a fondé Finance Tutoring, une société spécialisée dans la formation et le conseil en finance de marché et finance d’entreprise.
Depuis plus de 12 ans, Florian anime des formations en finance, conseille des institutions financières et des groupes industriels sur la gestion des risques, et prépare les candidats à la certification AMF ainsi qu’à l’examen CFA. Passionné par l’application des mathématiques à la finance, il s’efforce de rendre les concepts complexes accessibles.
Écrire commentaire