Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Chapitre 11 - Les tests d’hypothèses. Principes

 

 

Les tests d’hypothèses sont fondés sur les intervalles de pari.

11.1 Un exemple concret (emprunté à Schwartz)

Une variété de souris présente des cancers spontanés avec un taux (une fréquence ou proportion dans la population) constant bien connu, φ = 20 %. On se demande si un traitement donné modifie ce taux (en plus ou en moins), c’est-à-dire est actif. Pour répondre à cette question on procède à une expérience sur 100 souris ; il s’agira, au vu du pourcentage observé  p d’animaux cancéreux, de dire si le traitement est actif. Il n’est pas possible de répondre au sens strict à cette question.

Supposons que le traitement soit sans effet ; alors chaque souris traitée aura toujours 20 chances sur 100 de devenir cancéreuse. Mais le pourcentage de souris cancéreuses, calculé sur un échantillon de 100 souris sera soumis aux fluctuations d’échantillonnage que l’on a étudiées. Le pourcentage observé (moyenne observée) pourra prendre a priori, c’est-à-dire avant expérience, plusieurs valeurs, même si les valeurs voisines de 0,2 sont les plus probables. Des valeurs de 0 ou 100 % pourraient même être observées. Ainsi même si le pourcentage observé est très différent de 20 %, il est possible que le traitement soit sans effet.

Supposons maintenant que le traitement soit actif ; la probabilité de cancer pour chaque souris (ou la proportion « vraie » de souris cancéreuses dans une population fictive de souris traitées) est  φ1, différente de 0,2. Encore à cause des fluctuations d’échantillonnage, on pourra très bien, peut être de façon peu probable, obtenir une fréquence observée égale à 20 %. Ainsi même si le pourcentage observé est 20 %, il est possible que le traitement soit actif.

On ne peut donc répondre avec certitude à la question posée.

Pourtant ne pas répondre serait renoncer à considérer tous les problèmes liés à la variabilité, c’est-à-dire à « tous » les problèmes biologiques. Alors on répondra, mais en acceptant un risque d’erreur. Répondre correspond à la démarche que chacun adopterait ; par exemple, déclarer le traitement actif si le taux observé de cancers après traitement s’écarte « nettement » de 20 %. C’est le sens que l’on peut donner à ce « nettement » qui est le fondement du principe des tests.

Dans le cas étudié, on aurait tendance à s’y prendre de la façon suivante. Deux hypothèses sont en présence :

  • le traitement est inactif,
  • le traitement est actif.

La première hypothèse est plus « fine » que la seconde car elle porte en elle une interprétation numérique : le pourcentage « vrai » de souris cancéreuses parmi les souris traitées est 0,2 - l’autre hypothèse indiquant seulement que ce pourcentage est différent de 0,2 ; ce qui est plus vague. Supposons alors vraie l’hypothèse la plus fine. Il devient possible de faire des déductions : sachant ce qui se passe au niveau de la population des souris traitées on peut en déduire ce qui se passera au niveau d’un échantillon. En particulier, on sait construire les intervalles de pari centrés de niveau 1 - α pour la fréquence observée.

Par exemple, prenant α = 0,05 et n = 100 souris, on obtient IP0,95 = [0,12 ; 0,28]

Cela signifie, rappelons-le, que si φ = 0,2 (fréquence supposé « vraie »), 95 % des valeurs des moyennes observées calculées sur 100 individus appartiendront à l’intervalle [0,12 ; 0,28].

On adopte alors la stratégie suivante : si la valeur observée de la fréquence de souris cancéreuses parmi les 100 traitées appartient à cet intervalle, on considère que cette valeur est compatible avec les fluctuations d’échantillonnage et l’activité du traitement n’est pas prouvée. Si la valeur observée n’appartient pas à cet intervalle, le traitement sera considéré comme actif. Dans ce dernier cas le raisonnement est le suivant. Cet événement (la fréquence observée est à l’extérieur de l’intervalle de pari) avait moins de 5 chances sur 100 de se produire et pourtant il s’est produit ; donc je ne crois plus à l’hypothèse qui m’a permis de déduire ces 5 % de chances.

Remarque : reformulation des calculs

Notons p la proportion observée de souris traitées développant un cancer, sur les  n souris traitées.

Le résultat du test sera de conclure ou non à l’activité du traitement selon que  Image graphique436423.trsp.gif c’est-à-dire :

Image graphique437424.trsp.gif 

où φ0 est la proportion hypothétique (0,2 dans l’exemple) et uα la borne de l’intervalle de pari au risque α de p.

On suppose ici que les conditions du théorème central limite sont satisfaites. On conclut donc selon que

Image graphique438425.trsp.gif 

ou encore selon que

Image graphique439426.trsp.gif 

On reconnaît dans la dernière expression l’intervalle de pari Image graphique440427.trsp.gif d’une variable aléatoire N(0, 1), intervalle indépendant de l’expérience projetée.

C’est comme cela que l’on abordera généralement les tests ; on cherchera à construire une variable aléatoire dont on connaisse, si l’hypothèse fine est vraie, la distribution, pour pouvoir construire un intervalle de pari ; ici il s’agirait de la variable aléatoire  Z déduite de la variable aléatoire moyenne arithmétique selon :

Image graphique441428.trsp.gif 

avec φ0 = 0,2 (transcription de l’hypothèse).

Une telle variable aléatoire s’appelle usuellement « paramètre » du test et est notée conventionnellement Z. Ici on sait que Z ~ N(0, 1) et l’on construit l’intervalle de pari de niveau 1 - α pour Z. Par exemple avec α = 0,05 , IP0,95= [-1,96 ; 1,96].

Puis on réalise l’expérience ce qui permet d’obtenir p, valeur observée de Pn, donc une valeur observée de Z, notée u :

Image graphique442429.trsp.gif

On pourrait alors s’exprimer comme ceci (une terminologie plus précise sera indiquée plus loin) :

  • si Image graphique443430.trsp.gif on ne peut pas dire que le traitement est actif
  • si Image graphique444431.trsp.gif le traitement est actif.

Nous allons, à la lumière de cet exemple, énumérer les étapes de mise en œuvre d’un test et revenir sur différents aspects (sens de α par exemple) avant de donner d’autres exemples de tests usuels

     Page précédentePage suivanteSommaireVersion imprimable
   
 
11.1 - Un exemple concret (emprunté à Schwartz)
11.2 - Principe général des tests d’hypothèses
11.3 - Rappels et précisions
Résumé du chapitre