Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Chapitre 12 - Quelques tests usuels

 

12.1 - Tests concernant des variables de Bernoulli

12.1.2 - Test d’égalité de deux proportions « vraies » (ou test de comparaison de deux proportions observées)

 

12.1.2.1 Mise en place du test

Reprenons l’exemple des souris mais en supposant maintenant que l’on ne connaît plus la fréquence « vraie » de cancer chez les souris non traitées (le 0,2 d’alors). On se pose toujours la même question relative à l’activité du traitement. On est amené à reformuler légèrement le problème et identifier l’absence d’activité du traitement à l’égalité des proportions « vraies » de souris cancéreuses dans deux populations, l’une traitée l’autre non traitée, et l’activité à une différence entre ces deux pourcentages. On notera A et B les deux populations, φA et φB les fréquences « vraies » de souris cancéreuses dans ces deux populations, nA et nB les tailles des échantillons sur lesquels on calculera  pA et pB, les fréquences observées correspondantes. Mettons en place le test.

  1. Les hypothèses en présence

    H0 hypothèse nulle : les fréquences « vraies » sont égales φA = φB
    H1 hypothèse alternative : les fréquences « vraies » sont différentes φA ≠ φB
  2. Construction d’un paramètre dont on connaisse la loi sous l’hypothèse nulle (i.e. si H0 est vraie)

    C’est une étape un peu délicate (le lecteur peu curieux peut passer rapidement sur ces développements). Essayons de nous ramener à un cas connu : comparaison d’un pourcentage observé à une valeur donnée, problème associé aux hypothèses suivantes :
    H0 : φ = φ0
    H1 : φ ≠ φ0
    On y parvient en reformulant les hypothèses
    H0 : φA - φB = 0
    H1 : φA - φB ≠ 0
    Il s’agit donc de comparer à 0 la différence φA - φB.

    Auparavant on formait le paramètre Image graphique470455.trsp.gif



    qui peut s’interpréter comme Image graphique471456.trsp.gif

    Alors on va former Image graphique472457.trsp.gif


    soit Image graphique473458.trsp.gif

    La difficulté est de former l’expression de l’écart type des différences des % expérimentaux.
    Remarquons d’abord que les variables aléatoires PnA et PnB sont indépendantes ; cette indépendance résulte du fait que ce n’est pas parce que l’on a trouvé une souris cancéreuse dans la population des souris traitées que l’on a plus ou moins de chances de trouver une souris cancéreuse ou non dans la population non traitée.
    Alors : var(PnA - PnB) = var(PnA) + var(-PnB) = var(PnA) + var(PnB) (voir chapitre 6)
    Par ailleurs, sous l’hypothèse nulle, les moyennes « vraies » φA de  PnA et φB de PnB sont identiques, et leur valeur commune, inconnue, est notée Π. D’où :

    Image graphique474459.trsp.gif

    si nA et nB sont les tailles des échantillons sur lesquels PnA et PnB sont calculées.

    Donc : Image graphique475460.trsp.gif

    Maintenant, Π reste inconnu ; il s’agit de la valeur « vraie » commune des pourcentages. Le mieux pour l’estimer est de mélanger les deux populations - elles contiennent sous H0 le même pourcentage de souris cancéreuses - et dire :

    Image graphique476461.trsp.gif

    soit : Image graphique477462.trsp.gif

    Finalement on adopte le paramètre suivant :

    Image graphique478463.trsp.gif



    avec Image graphique479464.trsp.gif

    Sous l’hypothèse nulle Z est à peu près distribuée selon N(0, 1).
    Conditions de validité :

    Image graphique480465.trsp.gif

  3. Choix d’un seuil de signification α (α = 0,05).

    Construction de l’intervalle de pari Image graphique481466.trsp.gif lu dans une table.
    ex. : IP0,95 = [-1,96 ; 1,96]
  4. Mise en place de la procédure de décision

    Si z, dont on connaîtra la valeur une fois l’expérience réalisée
    IP0,95 on ne conclut pas
    IP0,95 on rejette H0 : une proportion est alors plus grande que l’autre.
  5. Réalisation de l’expérience, calcul de Image graphique482467.trsp.gif, conclusion.

12.1.2.2 Nombre de sujets nécessaires

Pour obtenir une puissance 1 - β (β < 0,5) sur la base de 2 échantillons de même taille n, la valeur minimale de n est donnée par la formule approchée suivante

Image graphique483468.trsp.gif

Conditions de validité : nφA ≥ 5, n(1 − φA) ≥ 5, nφB ≥ 5 et n(1 − φB) ≥ 5

     Page précédentePage suivanteSommaireVersion imprimable
   
 
12.1 - Tests concernant des variables de Bernoulli
12.2 - Tests concernant des variables quantitatives
Résumé du chapitre
12.1.1 - Test d’égalité d’une proportion « vraie » à une valeur donnée (ou test de comparaison d’une proportion observée à une valeur donnée)
12.1.2 - Test d’égalité de deux proportions « vraies » (ou test de comparaison de deux proportions observées)
12.1.2.1 - Mise en place du test
12.1.2.2 - Nombre de sujets nécessaires