Bibm@th

Forum de mathématiques - Bibm@th.net

Bienvenue dans les forums du site BibM@th, des forums où on dit Bonjour (Bonsoir), Merci, S'il vous plaît...

Vous n'êtes pas identifié(e).

#1 14-01-2021 21:56:53

tyup
Invité

Coefficient de corrélation linéaire

Bonjour,
J'essaie de comprendre les formules de stats à deux variables.
L'idée était de se ramener à un produit scalaire pour comprendre ces formules.

Je suis parti de l'espace des séries de taille n centrées pour que la covariance soit un produit scalaire.

A partir de là, je comprends que si X et Y sont des séries statistiques, $\frac{cov(X,Y)}{\sqrt{var(X)}}$ est le réel qui
minimise la quantité $var(Y-aX)$.

Et pour finir le coefficient de corrélation linéaire r appartient à [-1;1] par Cauchy-Shwartz.

Les cas r= 1,  r=-1  et r=0 je comprends ce qui se passe.

J'arrive à ma question: Il y a t-il un lien simple entre r et $var(Y-aX)$ avec $a=\frac{cov(X,Y)}{\sqrt{var(X)}}$?
C'est pour comprendre les cas ou r appartient à ]0;1[. Le fait que plus r est proche des bornes et plus le nuage de points ressemble à son approximation linéaire en X.

Merci d'avance et bonne soirée.

#2 15-01-2021 08:09:40

Fred
Administrateur
Inscription : 26-09-2005
Messages : 5 866

Re : Coefficient de corrélation linéaire

Bonjour,

  Je ne suis pas sûr de comprendre ta question... On a $r=\frac{cov(X,Y)}{\sqrt{var(X)}\sqrt{var(Y)}}=\frac{a}{\sqrt{var(Y)}}.$

Le fait que $r\in [-1,1]$ est une conséquence de l'inégalité de Cauchy-Schwarz : on a toujours
$$|cov(X,Y)|\leq \sqrt{var(X)}\sqrt{var(Y)}.$$

Si $r=1$ ou $r=-1$, cela signifie qu'on a égalité dans l'inégalité de Cauchy-Schwarz. En étudiant les cas d'égalité de cette inégalité, ceci nous donne exactement que $Y$ dépend affinement de $X$.

F.

Hors ligne

#3 15-01-2021 09:30:59

tyup
Invité

Re : Coefficient de corrélation linéaire

Bonjour et merci pour ta réponse.
Ce que tu expliques, c'est la partie que j'ai comprise.
Ce que j'aimerais, c'est comprendre les autres cas: par exemple: r=0,5   
On est dans un cas ou le nuage est "moins aligné", mais j'aimerais le quantifier autrement que par r. Par exemple quel impact ça a sur
$var(Y-aX)$  où $a=\frac{cov(X,Y)}{Var(X)}$.

J'imagine qu'avec un argument de continuité du produit scalaire, on peut dire que si r est proche de 1 Le nuage est presque aligné, ou si r est proche de 0 l'approximation linéaire de Y en X n'est pas adaptée. Mais ça n'est pas satisfaisant.

J'espère avoir été plus clair.
Bonne journée et merci encore.
Tyup

#4 15-01-2021 09:49:31

Fred
Administrateur
Inscription : 26-09-2005
Messages : 5 866

Re : Coefficient de corrélation linéaire

Je pense qu'il faut interpréter ce coefficient de corrélation linéaire comme le cosinus de l'angle entre deux vecteurs.
Si le cos vaut $\pm 1$, les vecteurs sont colinéaires.
Si le cos vaus $0$, les vecteurs sont orthogonaux.
Si le cos est entre les deux, les vecteurs indiquent plus ou moins la même direction....

F.

Hors ligne

#5 15-01-2021 11:58:57

tyup
Invité

Re : Coefficient de corrélation linéaire

Merci pour ce retour.
C'est je trouve un peu la limite de l'interprétation géométrique. Effectivement r est le cosinus de l'angle entre les deux séries statistiques,
et on sent que ça se passe comme on voudrait, mais j'avais envie de creuser un peu plus.
Je n'ai pas trouvé de démonstration simple.

Merci en tous cas et bonne journée.
Tyup

#6 15-01-2021 15:08:29

tyup
Invité

Re : Coefficient de corrélation linéaire

J'ai a peu près en tête ce que je veux montrer. Ce qui m’intéresse c'est la tangente $\frac{\sigma_{aX-Y}}{\sigma_{aX}} $
Comparer l'erreur qu'on commet à l'approximation de Y. On doit pouvoir montrer que si r tend vers 1 ce rapport tend vers 0 et si r tend vers 0 ce rapport tend vers $+\infty$.

Tyup

#7 15-01-2021 16:59:53

tyup
Invité

Re : Coefficient de corrélation linéaire

Voici la question mieux formulée. J'ai un peu peur de dire une bêtise avec les angles:
Si on imagine le triangle rectangle formé par les vecteurs Y et aX, notre mesure étant l'écart type, on obtient un triangle dont l’hypoténuse mesure $\sigma_Y$  et les deux autres côtés $\sigma_{aX}$  et $\sigma_{Y-aX}$.
Est ce que la relation suivante est correcte?

$\frac{\sigma_{Y-aX}}{\sigma{aX}}=tan(arcos(r))$

Merci d'avance.
Tyup

#8 16-01-2021 07:48:32

tyup
Invité

Re : Coefficient de corrélation linéaire

Bonjour,
Je pense m'en être sorti et le sujet peut être pour ma part clôturé:

Je me suis replacé dans le cas général d'un produit scalaire et d'un espace Euclidien quelconque et ma question revient à savoir si

$tan(\theta)=\frac{||Y-aX||}{||aX||}$  ? avec a le coefficient de la projection orthogonale de Y sur aX.
Pour avoir $\theta$ j'ai posé $(\frac{Y}{||Y||},\frac{X}{||X||}=cos(\theta)$     (Définition possible par Cauchy Shwartz par exemple).
Ca me permet de définir le sin par la formule $sin(\theta)^2=1-cos(\theta)^2$ puis de définir $tan(\theta)$ par le rapport sin/cos.

Pour finir par des calculs un peu pénibles j'ai pu vérifier l'égalité de départ.

Bonne journée.
Tyup

#9 16-01-2021 08:28:04

tyup
Invité

Re : Coefficient de corrélation linéaire

J'ai mis les problèmes de signes de côté donc les formules sont valables en valeurs absolue.

Pied de page des forums