Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Chapitre 10 - Estimation - Intervalle de confiance

 

10.3 - Estimation par intervalle - Intervalle de confiance

10.3.4 - Applications

 

L’intervalle de confiance exprime fondamentalement, comme son nom l’indique, la confiance que l’on peut attribuer à un résultat expérimental.

IDEALEMENT TOUT PROBLEME D’ESTIMATION DEVRAIT ETRE PRODUCTIF D’UN INTERVALLE DE CONFIANCE. Ne donner qu’une estimation ponctuelle masque l’incertitude qui accompagne tout résultat.

Exemple : supposons qu’étudiant la fréquence d’un événement, on ait obtenu une fréquence observée p égale à 0,12.

Supposons que cette valeur ait été obtenue sur la base de 8 individus (l’événement étudié s’est donc réalisé une fois). On peut lire dans une table spécialisée que l’intervalle de confiance de la fréquence « vraie » est, au risque 0,05 [0,003 ; 0,527]. Cela signifie que cette valeur observée de 12 % sur si peu d’individus ne fait qu’indiquer ceci : la fréquence « vraie » se situe dans le domaine 3 ‰, 52,7 %.

Supposons que cette même valeur 12 % ait été obtenue sur la base de 100 individus (l’événement étudié s’est réalisé 12 fois au cours des 100 essais). L’intervalle de confiance associé est alors proche de [0,06 ; 0,18]. Sur la base de cette valeur 12 %, on est maintenant en mesure d’affirmer, acceptant toujours un risque d’erreur de 5 pour cent, que la fréquence « vraie » se situe dans le domaine 6 %, 18 %, domaine beaucoup plus étroit que le précédent.

De façon générale, la longueur de l’intervalle de confiance indique la précision obtenue. Les deux exemples qui suivent montrent l’usage que l’on peut en faire.

10.3.4.1 Précision d’un sondage

Supposons que l’on s’apprête à réaliser un sondage pour estimer la prévalence d’une maladie, c’est-à-dire la proportion de la population atteinte par cette maladie à la date du sondage. On souhaite un résultat précis, c’est-à-dire que l’on souhaite par exemple que l’intervalle de confiance résultant ait une longueur au plus égale à 0,04, avec un risque d’erreur de 5 %.

On remarque que la longueur de l’intervalle de confiance ne dépend que d’une seule grandeur contrôlable, le nombre d’individus. La question est donc : combien d’individus faut-il inclure dans le sondage ?

Ce problème est simple, puisque la longueur de l’intervalle de confiance s’établit à :

Image graphique429416.trsp.gif qu’on arrondit ici à Image graphique430417.trsp.gif

L’effectif de l’échantillon devra donc être au moins 10000 p(1 - p).

Toutefois, cet effectif dépend de p, inconnu avant l’expérience. L’usage de ces calculs supposera donc que l’on ait une idée du résultat attendu, grâce à un sondage exploratoire par exemple ou grâce à une connaissance préalable du phénomène étudié.

De façon générale, si l’on souhaite obtenir un intervalle de confiance d’une proportion de longueur 2i, il est nécessaire d’inclure un nombre d’individus au moins égal à :

Image graphique431418.trsp.gif au risque 0,05 (ou Image graphique432419.trsp.gif au risque α)

REMARQUE

Lorsque le sondage est réalisé, un intervalle de confiance lui est associé. Dans le langage courant, les instituts de sondage nomment ces intervalles de confiance des FOURCHETTES.

10.3.4.2 Précision d’une moyenne

Dans le cas où l’on s’intéresse à la moyenne « vraie » d’une variable quantitative, on peut effectuer le même type de calcul. Pour obtenir un intervalle de confiance de longueur 2i, il faut inclure un nombre d’individus au moins égal à :

Image graphique433420.trsp.gif

L’exploitation de ce calcul nécessite ici une connaissance, même approximative, de la variance de la variable étudiée pour se donner a priori s2- ou mieux σ2.

Exemple très important : les problèmes de dosage.

Soit à doser la glycémie ; on a devant soi un échantillon de sang. Quelle est la concentration en glucose ? Si on fait plusieurs dosages, on va obtenir plusieurs résultats. Cela est dû, non à la variabilité de la glycémie, mais aux erreurs analytiques. On assimile la glycémie « vraie » à la moyenne « vraie » de la variable aléatoire « résultat du dosage ». Supposons que l’on connaisse la variance des résultats, car on connaît bien la technique analytique. Par exemple, σ = 10 mg.l-1. Supposons en outre que les résultats expérimentaux soient distribués normalement.

Si on effectue un dosage donnant 90 mg.l-1, on a pour intervalle de confiance approché (σ étant connu) :

IC0,95 = [90 - 2σ ; 90 + 2σ] = [70 ; 110] soit un intervalle de longueur 40.

Si on effectue deux dosages donnant 90 et 96 mg.l-1, on a

Image graphique434421.trsp.gif

soit un intervalle d’amplitude 28,2.

Si l’on effectue trois dosages donnant 90, 96 et 93 mg.l-1 on a

Image graphique435422.trsp.gif

soit un intervalle d’amplitude 23,0.

Ces calculs objectivent le fait bien connu selon lequel la répétition des dosages permet d’atténuer les conséquences des erreurs expérimentales. Certains dosages - certaines mesures (tension artérielle) - sont répétés avant qu’une valeur soit indiquée.

     Page précédentePage suivanteSommaireVersion imprimable
   
 
10.1 - Introduction
10.2 - Estimation ponctuelle
10.3 - Estimation par intervalle - Intervalle de confiance
10.3.1 - Exemple d’une proportion
10.3.2 - Intervalle de confiance approché d’une proportion « vraie »
10.3.3 - Intervalle de confiance approché d’une moyenne « vraie » (variable continue)
10.3.4 - Applications
10.3.4.1 - Précision d’un sondage
10.3.4.2 - Précision d’une moyenne