Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Chapitre 8 - Statistiques descriptives

 

 

Les statistiques descriptives visent à représenter des données dont on veut connaître les principales caractéristiques quantifiant leur variabilité.

8.1 Rappels et compléments

On suppose que l’on s’intéresse à une caractéristique particulière observable chez des individus issus d’une population ; cette caractéristique sera appelée variable ; si cette caractéristique peut varier entre les individus, sans pouvoir l’anticiper, on l’appellera variable aléatoire. Le dispositif permettant d’obtenir une valeur de la variable est l’expérience aléatoire. Cette définition imagée est compatible avec la définition du chapitre 6.

Rappel
Il existe deux grands groupes de variables :
  1. Les variables quantitatives qui sont des variables ordonnées, productives de nombres. Exemples : nombre d’enfants dans une famille, glycémie, taille d’un individu, nombre de colonies bactériennes dans un milieu de culture.
    Parmi ces variables quantitatives, certaines prennent un continuum de valeurs (entre deux valeurs possibles, il existe toujours une troisième valeur possible) ; ces variables sont dites continues. D’autres ne prennent que des valeurs discontinues ; elles sont dites discrètes, finies ou non.
  2. Les variables qualitatives qui produisent des valeurs non numériques. Exemples : sexe, couleur des cheveux, appartenance au groupe des fumeurs ou des non fumeurs, présence ou absence d’une maladie.
    Les valeurs peuvent être ordonnées ; on parle alors de variable qualitative ordinale. Exemple : intensité d’une douleur (faible, moyenne, forte).
    Si les valeurs ne peuvent pas être ordonnées, il s’agit d’une variable catégorielle (ou nominale).
Remarque
L’individu évoqué ci-dessus, sur lequel on observe les caractéristiques d’intérêt, la variable, n’est pas nécessairement un individu physique. C’est l’entité sur laquelle s’opère l’observation de la variable d’intérêt. Exemples : famille, colonies bactériennes.
Définition
L’entité sur laquelle peut s’observer la variable aléatoire s’appelle l’unité statistique.
Connaître le phénomène mettant en jeu cette variable, ou connaître cette variable, c’est connaître la probabilité pour qu’un individu tiré au hasard dans la population présente telle valeur de la variable. On peut apprécier la probabilité d’un événement aléatoire grâce à l’interprétation suivante de la notion de probabilité. Cette interprétation est cohérente avec les cours précédents.
On interprétera la probabilité d’un événement aléatoire comme la valeur limite de la fréquence avec laquelle l’événement se réalise au cours d’un nombre  croissant de répétitions de l’expérience. Autrement dit comme la valeur limite du rapport du nombre de fois où l’événement s’est réalisé et du nombre de répétitions de l’expérience.
Remarques
  • Ce qui précède peut être vu comme une interprétation de la notion de probabilité (voire comme une définition).
  • En dépit de cette interprétation, la probabilité d’un événement aléatoire reste
    • une fiction
    • du domaine théorique.

    Mais cette interprétation a deux conséquences :
    • pour approcher une probabilité on est amené à répéter une expérience,
    • les fréquences se substituent aux probabilités ; elles seront les contreparties des probabilités.

    On va donc répéter une expérience un nombre fini de fois, noté n ; on aura donc observé une sous-population appelée échantillon. Chaque expérience aléatoire produit un résultat xi ; on disposera donc de x1, ..., xn, ensemble appelé échantillon de valeurs de la variable étudiée X.
  • De façon plus formelle, on définit un échantillon d’une variable aléatoire de la manière suivante :
    Un échantillon de taille n d’une variable aléatoire X est un ensemble X1, X2, ..., Xn de n variables aléatoires, indépendantes entre elles, et ayant chacune la même distribution que X. On peut donc dire qu’un échantillon de valeurs de X est une réalisation de l’échantillon de la variable X tel qu’il vient d’être défini.

     Page précédentePage suivanteSommaireVersion imprimable
   
 
8.1 - Rappels et compléments
8.2 - Représentation complète d’une série d’expériences
8.3 - Représentation simplifiée d’une série d’expériences
8.4 - Reformulation de la moyenne et de la variance observées
8.5 - Cas particulier d’une variable à deux modalités - Proportion
8.6 - Conclusion : la variable aléatoire moyenne arithmétique
Résumé du chapitre