Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Chapitre 10 - Estimation - Intervalle de confiance

 

10.3 - Estimation par intervalle - Intervalle de confiance

 

Bien que des intervalles de confiance soient définissables pour toute quantité estimée, leur détermination est le plus souvent difficile. Nous nous limiterons donc dans ce cours à la définition des intervalles de confiance des moyennes (et proportions) « vraies ».

10.3.1 Exemple d’une proportion

L’idée directrice est la suivante : on souhaite associer à une valeur observée  p un intervalle appelé INTERVALLE DE CONFIANCE qui ait « de bonnes chances » de contenir la valeur « vraie » Π de la proportion. Que signifie de « bonnes chances » ? Si l’on effectue un grand nombre de fois l’expérience - chaque expérience produisant un pourcentage observé  p - on construit autant d’intervalles de confiance. On voudrait qu’un grand nombre de ces intervalles contienne la valeur « vraie » Π. Par exemple que 95 % des intervalles en gros contiennent Π. On parlera alors d’intervalle de confiance DE NIVEAU 0,95 ou d’intervalle de confiance AU RISQUE 0,05. On considérera généralement des intervalles de confiance de niveau 1-α. La valeur α sera alors le risque - ou la probabilité - pour qu’un intervalle de confiance ne contienne pas la proportion « vraie » Π.

DE FACON GENERALE, L’INTERVALLE DE CONFIANCE AU RISQUE α D’UNE VALEUR QUE L’ON CHERCHE A ESTIMER EST UN INTERVALLE QUI CONTIENT AVEC UNE PROBABILITE 1 - α LA VALEUR CHERCHEE ; IL S’AGIT D’UN INTERVALLE QUE L’ON DEVRA ETRE EN MESURE DE CONSTRUIRE A L’ISSUE D’UNE EXPERIENCE PORTANT SUR UN ECHANTILLON.

Comment construire de tels intervalles ? C’est facile graphiquement.

Image ipestim.trsp.gif
Figure 9  

Image icestim.trsp.gif
Figure 10  

Considérons la figure 9. On a porté en abscisses une échelle 0-1 de mesure de proportions « vraies », en ordonnées une échelle de mesure de proportions observées. Donnons nous une valeur de proportion « vraie » ; on sait associer à cette valeur un intervalle de pari de niveau 0,95 de la proportion observée que l’on est susceptible d’obtenir au cours d’une expérimentation conduite sur  n individus. Cet intervalle de pari peut être représenté sur l’échelle verticale. Si l’on opère cette représentation pour toutes les valeurs possibles d’une proportion « vraie », on obtient un domaine limité par les deux courbes représentées sur la figure.

Considérons alors un problème mettant en jeu une proportion « vraie », Π. Supposons que nous fassions un ensemble d’expériences, chaque expérience portant sur  n individus étant productive d’une valeur de proportion observée  p. On peut associer à chacune de ces expériences un point de coordonnées (Π, p) sur la figure 9. Compte tenu de la construction précédente, on peut affirmer que ces points appartiendront 95 fois sur cent (c’est-à-dire dans 95 % des expériences) au domaine limité par les deux courbes, et ceci quelle que soit la valeur de Π.

Maintenant supposons qu’une expérience unique ait été réalisée, produisant une valeur de proportion, p. Le problème est, sur la base de cette valeur, de définir un intervalle ayant de bonnes chances de contenir la valeur inconnue de la proportion « vraie ». La solution, immédiate, est fournie par la figure 10. Il suffit de trancher le domaine limité par les deux courbes DANS L’AUTRE SENS. Cet intervalle contiendra 95 fois sur cent la véritable valeur de la proportion.

Ainsi, si on adopte cette stratégie de construction, on aura pour chaque valeur observée  p un intervalle qui contiendra Π avec la probabilité 0,95.

Le problème est résolu. Maintenant, ce qui est simple sur un dessin est compliqué en termes de calcul et il existe des tables d’intervalles de confiance et des formules toutes faites permettant de former des intervalles de confiance approchés.

10.3.2 Intervalle de confiance approché d’une proportion « vraie »

On montre qu’une bonne approximation de l’intervalle de confiance de niveau 1 - α de Π, fondé sur la valeur observée p, p étant calculée sur n individus, est donnée par l’intervalle ci-dessous :

Image graphique424411.trsp.gif

Notons Πmin et Πmax les bornes de cet intervalle.

Cette approximation n’est jugée satisfaisante que sous les CONDITIONS DE VALIDITE suivantes : nΠmin ≥ 5, n(1-Πmax) ≥ 5

LORSQUE LES CONDITIONS DE VALIDITE NE SONT PAS REMPLIES, IL FAUT AVOIR RECOURS A DES TABLES (hors programme).

Exemple : n = 100, α = 0,05, p = 0,12

Image graphique425412.trsp.gif

conditions de validité

100 × 0,06 = 6 ≥ 5.

100 × (1 - 0,18) = 82 ≥ 5.

10.3.3 Intervalle de confiance approché d’une moyenne « vraie » (variable continue)

De même, il existe une expression approchée pour l’intervalle de confiance de niveau 1 - α d’une moyenne « vraie » μ, intervalle fondé sur la valeur observée m obtenue après une expérience portant sur n individus. Le calcul de cet intervalle suppose en outre le calcul de la variance observée s2. L’expression est la suivante :

Image graphique426413.trsp.gif

L’approximation ci-dessus n’est jugée satisfaisante que sous la

CONDITION DE VALIDITE : n ≥ 30.

Lorsque cette condition n’est pas remplie, on ne sait plus former d’intervalle de confiance sauf si l’on peut supposer que la variable primitive X d’intérêt est normale.

Si la variable étudiée est NORMALE, alors, et sans autre condition de validité, un intervalle de confiance de niveau 1 - α a pour expression :

Image graphique427414.trsp.gif

tα est associé à une nouvelle distribution, dite de Student, à (n-1) degrés de liberté (voir section 7.2.3). La notation tα s’apparente à la notation uα et est explicitée table A.6.

Remarque (pour une variable normale encore)

Si la variance « vraie » de la variable étudiée, σ2, est connue, l’intervalle de confiance a la forme suivante :

Image graphique428415.trsp.gif

     Page précédentePage suivanteSommaireVersion imprimable
   
 
10.1 - Introduction
10.2 - Estimation ponctuelle
10.3 - Estimation par intervalle - Intervalle de confiance
10.3.1 - Exemple d’une proportion
10.3.2 - Intervalle de confiance approché d’une proportion « vraie »
10.3.3 - Intervalle de confiance approché d’une moyenne « vraie » (variable continue)
10.3.4 - Applications