Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Chapitre 14 - Liaison entre deux variables continues : notion de corrélation

 

14.3 - Un indicateur de covariation : le coefficient de corrélation

 

Cherchons alors à quantifier un phénomène de covariation, c’est-à-dire un phénomène de variation couplée entre X et Y.

On impose naturellement à l’indicateur recherché une invariance par translation : les phénomènes productifs de X et Y demeurent fondamentalement inaltérés s’ils produisent  X + a, Y + b. Ainsi l’indicateur se fondera-t-il sur les valeurs Image graphique555538.trsp.gif et Image graphique556539.trsp.gif. Par ailleurs, on souhaite que l’indicateur ne dépende pas des unités exprimant X et Y ; alors on travaillera sur

Image graphique557540.trsp.gif

Maintenant si Y et Y présentent un caractère de covariation, c’est que de façon fréquente, sinon systématique

  • soit les variables varient dans le même sens, c’est-à-dire lorsque  xi est grand (i.e. xri positif par exemple), yi l’est également le plus souvent (i.e. yri positif), que lorsque xi est petit (xri < 0) yi l’est également (yri < 0) ; dans ce cas, le produit xriyri est fréquemment positif.
  • soit les variables varient en sens contraire : lorsque  xi est grand, yi est petit, lorsque xi est petit, yi est grand ; dans ce cas le produit xri yri est fréquemment négatif.

Compte tenu de l’analyse précédente, on choisit pour indicateur de la covariation ou corrélation le nombre :

Image graphique558541.trsp.gif

Ainsi

  • si r est grand, c’est le signe d’une covariation dans le même sens de  X et Y ;
  • si r est petit (c’est-à-dire grand en valeur absolue et négatif), c’est le signe d’une covariation de X et Y en sens contraire ;
  • si r est voisin de zéro, c’est le signe d’une absence de covariation.

Retenons, exprimé sur la base des valeurs observées :

Image graphique559542.trsp.gif

Le numérateur de cette expression est appelé la covariance observée des deux variables  X et Y, notée cov0(XY), dont on montre qu’elle s’exprime aussi sous la forme

Image graphique560543.trsp.gif

Les figures ci-dessous présentent diverses situations relativement au coefficient de corrélation observé.

Image graphique561544.trsp.gif  Image graphique562545.trsp.gif 
r>0, grand r<0, |r| grand
Image graphique563546.trsp.gif 
r voisin de zéro

Propriétés numériques fondamentales de r :

  • r a toujours une valeur comprise entre -1 et 1 ;
  • r prend la valeur -1 (respectivement 1) si et seulement si il existe des valeurs  a et b telles qu’on ait pour tout i yi = axi + b avec a négatif (respectivement a > 0).

Remarques :

  • plus r est grand en valeur absolue, plus les variables sont dites corrélées,
  • la valeur absolue de r décroît,
    • lorsque s’estompe le caractère rectiligne du « nuage » des valeurs observées,
    • lorsque s’épaissit ledit nuage,
  • une valeur absolue très faible du coefficient de corrélation ne permet pas de conclure à l’indépendance de deux variables. Deux variables indépendantes présenteront en revanche un coefficient de corrélation observé très faible en valeur absolue.

Quelques exemples sont présentés ci-dessous pour fixer les idées.

Image graphique564547.trsp.gif  Image graphique565548.trsp.gif 
r ≈ 0,9 r ≈ 0,7
Image graphique566549.trsp.gif  Image graphique567550.trsp.gif 
r ≈ 0,7 r ≈ 0,6
Image graphique568551.trsp.gif  Image graphique569552.trsp.gif 
r ≈ 0,5 r ≈ 0,5
Image graphique570553.trsp.gif  Image graphique571554.trsp.gif 
r ≈ 0 r ≈ 0

Remarque complémentaire :

Le coefficient de corrélation linéaire est, au même titre que toute statistique, soumis aux fluctuations d’échantillonnage. La question se pose alors de savoir que faire de cet indicateur en termes d’inférences. Par exemple, avant de conclure que les deux variables sont corrélées, peut-on se garantir du risque de l’observation d’un coefficient de corrélation nul sur une plus grande série d’observations ? On se retrouve dans le contexte des tests d’hypothèses avec ici une difficulté supplémentaire qui tient au fait que l’on n’a pas quitté le niveau expérimental, le niveau intuitif. Il convient de trouver une contrepartie « vraie » à ce coefficient de corrélation observé  r.

     Page précédentePage suivanteSommaireVersion imprimable
   
 
14.1 - Introduction
14.2 - Abord du problème
14.3 - Un indicateur de covariation : le coefficient de corrélation
14.4 - Le coefficient de corrélation « vrai »
14.5 - Test d’égalité du coefficient de corrélation « vrai » ρ à 0
Résumé du chapitre