Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Chapitre 14 - Liaison entre deux variables continues : notion de corrélation

 

14.2 - Abord du problème

 

Considérons deux variables aléatoires continues  X (créatininémie) et Y (bilirubinémie). Imaginons que nous ayons réalisé une expérience consistant en l’observation conjointe du niveau de ces deux variables sur un ensemble (échantillon) de n sujets. On dispose ainsi d’un ensemble de couples de valeurs xi, yi. La représentation naturelle - sinon la meilleure - de ces résultats est donnée dans la figure ci-dessous ; chaque couple de valeurs obtenu chez chaque individu est représenté par un point de coordonnées (créatininémie-bilirubinémie).

On lit sur un tel dessin, au moins grossièrement, le domaine des valeurs possibles de  X, le domaine des valeurs possibles de Y.

Intéressons nous à un nouvel individu ; ne mesurons chez lui que la valeur de la créatininémie,  x0. Que peut-on dire alors, sur la base de cette connaissance et sur la base de l’expérience ci-dessus concernant le domaine des valeurs possibles de Y pour ce même individu ? On peut proposer la réponse géométrique ou visuelle indiquée sur la figure ci-dessous.

Image graphique549532.trsp.gif

Image graphique550533.trsp.gif

Le nouveau domaine possible - sachant x0 - est très voisin du domaine initial ; ceci se reproduit pour toute valeur de x0. Il est alors clair que dans cet exemple, la connaissance de  X n’apporte pas d’information sur celle de Y. On a ici une situation visuelle d’un cas où les deux variables  X et Y sont indépendantes. On pourrait renverser le rôle de X et Y, la conclusion serait la même.

Considérons maintenant le cas où les résultats expérimentaux produisent la représentation de la figure ci-dessous.

Dans ce cas, au contraire, on voit clairement que la connaissance de  x0 (respectivement y1) modifie le domaine des valeurs possibles, donc attendues de Y (respectivement X) ; les deux variables X et Y sont liées.

Image graphique551534.trsp.gif

Image graphique552535.trsp.gif

La modification ici concerne aussi bien l’amplitude du domaine que sa localisation en termes de valeurs.

L’appréciation visuelle de la dépendance correspond à l’appréciation de « l’épaisseur » de l’ensemble des points. Plus les points expérimentaux ont tendance à se répartir sur une courbe - non horizontale ni verticale - plutôt qu’à remplir une partie du plan, plus les variables sont liées.

Peut-on trouver un indicateur numérique de la force d’une telle liaison ? Au sens strict, la réponse est non.

Quelques situations de dépendance - c’est-à-dire de liaison - sont représentées sur les figures ci-dessous.

Image graphique553536.trsp.gif

On ne sait pas, en toute généralité, résumer en un seul nombre exprimant la liaison entre deux variables continues les résultats d’une expérience.

On ne connaît qu’un indicateur général prenant en compte non pas le degré de proximité à une courbe quelconque mais le degré de proximité à une droite : c’est le coefficient de corrélation [linéaire].

Il faut voir cependant que dans la plupart des situations réelles au cours desquelles on s’intéresse à l’examen de la liaison entre deux variables, la possibilité d’interprétation des résultats est largement fonction du caractère monotone, sinon rectiligne, de la dépendance ; que dire en termes d’interprétation d’une dépendance figurée schématiquement sur la figure ci-dessous ?

Image graphique554537.trsp.gif

     Page précédentePage suivanteSommaireVersion imprimable
   
 
14.1 - Introduction
14.2 - Abord du problème
14.3 - Un indicateur de covariation : le coefficient de corrélation
14.4 - Le coefficient de corrélation « vrai »
14.5 - Test d’égalité du coefficient de corrélation « vrai » ρ à 0
Résumé du chapitre