Définition de la corrélation inverse

Qu’est-ce qu’une corrélation inverse ?

Une corrélation inverse, également appelée corrélation négative, est une relation contraire entre deux variables telle que lorsque la valeur d’une variable est élevée, la valeur de l’autre variable est probablement faible. Par exemple, avec les variables A et B, comme A a une valeur élevée, B a une valeur faible, et comme A a une valeur faible, B a une valeur élevée. Dans la terminologie statistique, une corrélation inverse est souvent désignée par le coefficient de corrélation « r » ayant une valeur comprise entre -1 et 0, avec r = -1 indiquant une corrélation inverse parfaite.

Points clés à retenir

  • On parle de corrélation inverse (ou négative) lorsque deux variables d’un ensemble de données sont liées de telle sorte que lorsque l’une est élevée, l’autre est faible.
  • Même si deux variables peuvent avoir une forte corrélation négative, cela n’implique pas nécessairement que le comportement de l’une ait une quelconque influence causale sur l’autre.
  • La relation entre deux variables peut changer au fil du temps et peut également avoir des périodes de corrélation positive.

Graphique de la corrélation inverse

Deux ensembles de points de données peuvent être tracés sur un graphique sur un axe x et y pour vérifier la corrélation. C’est ce qu’on appelle un diagramme de dispersion, et il représente un moyen visuel de vérifier une corrélation positive ou négative. Le graphique ci-dessous illustre une forte corrélation inverse entre deux ensembles de points de données tracés sur le graphique.

Scatter Plot diagram

Exemple de calcul de la corrélation inverse

La corrélation peut être calculée entre les variables d’un ensemble de données pour obtenir un résultat numérique, dont le plus courant est connu sous le nom de r de Pearson. Lorsque r est inférieur à 0, cela indique une corrélation inverse. Voici un exemple de calcul arithmétique du r de Pearson, avec un résultat qui montre une corrélation inverse entre deux variables.

Supposons qu’un analyste ait besoin de calculer le degré de corrélation entre X et Y dans l’ensemble de données suivant avec sept observations sur les deux variables :

  • X : 55, 37, 100, 40, 23, 66, 88
  • Y : 91, 60, 70, 83, 75, 76, 30

La recherche de la corrélation se fait en trois étapes. Tout d’abord, on additionne toutes les valeurs X pour trouver SUM(X), on additionne toutes les valeurs Y pour trouver SUM(Y) et on multiplie chaque valeur X par sa valeur Y correspondante et on les additionne pour trouver SUM(X,Y) :

SUM(X

)

=55+37+100+40+23+66+88 =409begin{aligned}text{SUM}(X) &= 55 + 37 + 100 + 40 + 23 + 66 + 88 &= 409 end{aligned}

SUM(X) =55+37+100+40+23+66+88 =409

SUM(Y

)=91+60+70+83+75+76+30 =485begin{aligned}text{SUM}(Y) &= 91 + 60 + 70 + 83 + 75 + 76 + 30 &= 485 end{aligned}

SUM(Y) =91+60+70+83+75+76+30 =485

SUM(X,Y)=

(55×91)+

(37×60)++(88×30) =26,926begin{aligned}

text{SUM}(X,Y) &= (55 fois 91) + (37 fois 60) + dotso + (88 fois 30) &= 26 926 end{aligned}

SUM(X,Y) =(55×91)+(37×60)+...+(88×30) =26926

L’étape suivante consiste à prendre chaque valeur X, à l’élever au carré et à additionner toutes ces valeurs pour trouver SUM(x2). La même chose doit être faite pour les valeurs Y :

SUM

(X2)=

(552

)

+

(372

)

+

(1002

)

+

+

(882

)

=28,623text{SUM}(X^2) = (55^2) + (37^2) + (100^2) + dotso + (88^2) = 28,623

SUM(X2)=(552)+(372)+(1002)+...+(882)=28,623

SUM(Y2)=

(912

)

+

(

602

)

+

(702

)

+

+

(302

)=35,971text{SUM}(Y^2) = (91^2) + (60^2) + (70^2) + dotso + (30^2) = 35,971

SUM(Y2)=(912)+(602)+(702)+...+(302)=35,971

En notant qu’il y a sept observations, n, la formule suivante peut être utilisée pour trouver le coefficient de corrélation, r:

r=[(SUM

(X,Y

)

(

SUM

(

X

(

SUM

(

Y)

)][

(n×SUM

(X2)-

SUM

(

X

)2

[

n×SUM

(Y2

)

-SUM

(Y

)2)]r = frac{[n fois (texte{SUM}(X,Y) – (texte{SUM}(X) fois ( texte{SUM}(Y) ) ]} {sqrt{[(n fois texte{SUM}(X^2) – texte{SUM}(X)^2 ] fois [n fois texte{SUM}(Y^2) – texte{SUM}(Y)^2)]}}

r= [(n×SUM(X2)-SUM(X)2[n×SUM(Y2)-SUM(Y)2)] [(SUM(X,Y)(SUM(X(SUM(Y))]

Dans cet exemple, la corrélation est la suivante :

  • 
    r=(7×26,926(49×485))((7×28,623492)×(7×35,9714852))r = frac{(7 fois 26,926 – (409 fois 485))} {sqrt{((7 fois 28,623 – 409^2) fois (7 fois 35,971 – 485^2))}}}

    r=(7×28,623492)×(7×35,9714852))(7×26,926(49×485))


  • r=9

    ,883÷23,414r= 9

    ,

    883 div 23

    ,414r=9,883÷23,414


  • r=-0.42r= -0

    .42r=-0.42

Les deux ensembles de données ont une corrélation de -0,42, que l’on appelle une corrélation inverse car il s’agit d’un nombre négatif.

Qu’est-ce que la corrélation inverse vous dit ?

La corrélation inverse vous indique que lorsqu’une variable est élevée, l’autre a tendance à être faible. L’analyse de corrélation peut révéler des informations utiles sur la relation entre deux variables, comme la façon dont les marchés des actions et des obligations évoluent souvent dans des directions opposées.

Le coefficient de corrélation est souvent utilisé de manière prédictive pour estimer des paramètres tels que les avantages de la diversification du portefeuille en termes de réduction des risques et d’autres données importantes. Si les rendements de deux actifs différents sont négativement corrélés, ils peuvent s’équilibrer s’ils sont inclus dans le même portefeuille.

Sur les marchés financiers, un exemple bien connu de corrélation inverse est probablement celui entre le dollar américain et l’or. Lorsque le dollar américain se déprécie par rapport aux principales devises, on observe généralement une hausse du prix de l’or en dollars et, lorsque le dollar américain s’apprécie, le prix de l’or diminue. 

Limites de l’utilisation de la corrélation inverse

Deux points doivent être gardés à l’esprit en ce qui concerne une corrélation négative. Premièrement, l’existence d’une corrélation négative, ou positive d’ailleurs, n’implique pas nécessairement une relation de cause à effet. Même si deux variables ont une corrélation inverse très forte, ce résultat en soi ne démontre pas une relation de cause à effet entre les deux.

Deuxièmement, lorsqu’il s’agit de données de séries chronologiques, comme la plupart des données financières, la relation entre deux variables n’est pas statique et peut évoluer dans le temps. Cela signifie que les variables peuvent présenter une corrélation inverse à certaines périodes et une corrélation positive à d’autres. C’est pourquoi l’utilisation des résultats d’une analyse de corrélation pour extrapoler la même conclusion à des données futures comporte un degré de risque élevé.

Retour haut de page