Site FMPMC
     Page précédentePage suivanteSommaireVersion imprimable
   
 

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l’intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d’hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - Méthodologie des études épidémiologiques

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.8
V. Morice


Introduction

 

 

La statistique constitue, en médecine, l’outil permettant de répondre à de nombreuses questions qui se posent en permanence au médecin :

  1. Quelle est la valeur normale d’une grandeur biologique, taille, poids, glycémie ?
  2. Quelle est la fiabilité d’un examen complémentaire ?
  3. Quel est le risque de complication d’un état pathologique, et quel est le risque d’un traitement ?
  4. Le traitement A est-il plus efficace que le traitement B ?

1 La variabilité et l’incertain

Toutes ces questions, proprement médicales, reflètent une propriété fondamentale des systèmes biologiques qui est leur variabilité. Cette variabilité est la somme d’une variabilité expérimentale (liée au protocole de mesure) et d’une variabilité proprement biologique. On peut ainsi décomposer la variabilité d’une grandeur mesurée en deux grandes composantes :

  variabilité totale = variabilité biologique + variabilité métrologique    

  • La variabilité biologique peut être elle-même décomposée en deux termes : d’une part la variabilité intra-individuelle, qui fait que la même grandeur mesurée chez un sujet donné peut être soumise à des variations aléatoires ; et d’autre part la variabilité inter-individuelle qui fait que cette même grandeur varie d’un individu à l’autre.

      variabilité biologique = variabilité intra-individuelle + variabilité inter-individuelle        

    La variabilité intra-individuelle peut être observée lors de la mesure de la performance d’un athlète qui n’est pas capable des mêmes performances à chaque essai, mais qui se différencie des autres athlètes (variabilité inter-individuelle). En général, la variabilité intra est moindre que la variabilité inter.
  • La variabilité métrologique peut être elle aussi décomposée en deux termes : d’une part les conditions expérimentales dont les variations entraînent un facteur d’aléas ; et d’autre part les erreurs induites par l’appareil de mesure utilisé.

      variabilité métrologique = variabilité expérimentale + variabilité appareil de mesure        

    La mesure de la pression artérielle peut grandement varier sur un individu donné suivant les conditions de cette mesure ; il est ainsi recommandé de la mesurer après un repos d’au moins 15 minutes, allongé, en mettant le patient dans des conditions de calme maximal. Cette recommandation vise à minimiser la variabilité due aux conditions expérimentales. La précision de l’appareil de mesure est une donnée intrinsèque de l’appareil, et est fournie par le constructeur.

2 La mesure d’une grandeur

2.1 Unités et équations aux dimensions

Les grandeurs mesurées possèdent la plupart du temps une unité. La distance entre Paris et Marseille se mesurera par exemple en kilomètres, l’épaisseur d’un cheveu en microns, le poids d’une orange en grammes. Dans quelle mesure ces grandeurs peuvent-elles être comparées ? La distance entre Paris et Marseille, et l’épaisseur d’un cheveu sont deux longueurs ; leur comparaison est possible si on les mesure avec une unité commune, par exemple le mètre. En revanche, le poids de l’orange n’est pas comparable aux longueurs précédentes.

Deux grandeurs qui peuvent être comparées sont dites posséder la même dimension. Elles peuvent être caractérisées par leur dimension : on parlera par exemple de longueur. Les dimensions de toutes les grandeurs physiques peuvent s’exprimer en fonction de sept dimensions de base : la longueur notée L, la masse M, le temps T, l’intensité électrique I, la température Θ, l’intensité lumineuse J, et la quantité de matière N.

Par exemple une vitesse est une longueur divisée par un temps. On dira que sa dimension est LT-1.

Plus précisément, de l’équation donnant la vitesse v en fonction de la distance d parcourue pendant le temps t, v=d/t, on déduit la relation entre les dimensions (notées entre crochets) des deux membres de l’équation [v] = [d]/[t] = LT-1. Cette relation est appelée équation aux dimensions.

Une équation aux dimensions permet donc d’exprimer la dimension de n’importe quelle grandeur en fonction des dimensions élémentaires, à condition de connaître les relations entre elles. Elle permet aussi une première validation d’une relation entre grandeurs physiques : les dimensions de la partie gauche et de la partie droite de la relation doivent être identiques.

Déterminons par exemple la dimension d’une énergie ou d’un travail, à partir de la formule w = f.l (un travail est le produit d’une force par une longueur). Une force est le produit d’une masse par une accélération (f = m.γ) et une accélération est une longueur divisée par le carré d’un temps. Donc [w] = [f][l] = [m][l]t-2][l] = ML2T-2.

Un autre intérêt des équations aux dimensions concerne les unités des grandeurs mesurées. On définit un système d’unités en imposant des unités aux 7 dimensions de base, les autres unités de définissant à l’aide des équations aux dimensions. Le système d’unités le plus utilisé est le Système International, ou SI, dans lequel une longueur est mesurée en mètres (m), une masse en kilogrammes (kg), un temps en secondes (s), une intensité électrique en ampères (A), une température en degrés Kelvin (K), une intensité lumineuse en candelas (cd), et une quantité de matière en moles (mol).

Dans le système international, certaines unités dérivées sont évidentes : une surface s’exprime en mètres carrés. D’autres le sont moins. Citons l’hertz pour une fréquence, le pascal pour une pression, le joule pour une énergie ou un travail, le watt pour une puissance, le newton pour une force, le coulomb pour une charge électrique, le volt pour une différence de potentiel, l’ohm pour une résistance, etc.

Il existe des grandeurs sans dimension, calculées comme le rapport de deux grandeurs de même dimension, mais qui possèdent pourtant une unité. Un angle est une grandeur sans dimension mesurée en radians dans le système international.

2.2 Erreurs de mesure

La mesure d’une grandeur ne peut conduire à une valeur exacte. En premier lieu, l’instrument de mesure possède nécessairement une précision limitée : une règle graduée millimètre par millimètre ne peut donner une meilleure précision qu’un demi millimètre. En second lieu, la grandeur à mesurer peut être source de variabilité intra-individuelle : la répétition de la mesure avec le même instrument et dans des conditions identiques conduit alors à des résultats différents. Enfin, l’instrument de mesure peut être mal étalonné ou mal adapté et conduire à un biais de mesure systématique : les valeurs mesurées seront systématiquement trop élevées, ou systématiquement trop basses.

Pour une grandeur X à mesurer, on note ΔX l’erreur de mesure. Cette erreur est généralement facilement connue si elle n’est due qu’à un problème de précision. S’il existe une variabilité intra-individuelle (raisonnablement faible), on fera intervenir l’écart-type des mesures (voir chapitre 10 « Estimation - Intervalle de confiance »). Si x est la valeur mesurée, la vraie valeur est donc comprise entre xX et xX.

Si une grandeur G n’est pas mesurée, mais déduite d’autres grandeurs X, Y, Z à l’aide d’une formule, l’erreur ΔG sur G doit se déduire des erreurs ΔX, ΔY, ΔZ sur X, Y, Z.

Le plus souvent, on utilise un calcul basé sur la différentielle totale exacte de la formule. Si G = f(XYZ), la différentielle totale exacte1 est :

Image graphique11.trsp.gif

L’erreur de mesure est alors donnée par :

Image graphique22.trsp.gif

Supposons par exemple devoir calculer une résistance R en mesurant l’intensité I du courant qui y circule et la différence de potentiel U à ses bornes. La formule liant ces grandeurs est R = U/I. On mesure U = 1000 volts à 1 volt près et I = 1 ampère à 10-3 ampère près.

La formule donne R = 1000 ohms et l’erreur se calcule par Image graphique33.trsp.gif

Le calcul basé sur la différentielle totale exacte n’est cependant qu’une approximation (on confond une courbe et sa tangente). Lorsque des calculs plus exacts sont possibles, ils sont préférables. Ainsi, supposons avoir trouvé 100 avec une précision de 1 pour la mesure d’une grandeur X et nous intéresser à la grandeur Y = 1/X.

La formule de la différentielle totale exacte donne Image graphique44.trsp.gif, donc une valeur de Y comprise entre 0,0099 et 0,0101.

Mais puisque la vraie valeur de X est comprise entre 99 et 101, la vraie valeur de Y est en réalité comprise entre 1/101 et 1/99, soit entre 0,009901 et 0,010101.

3 La décision dans l’incertain

Pour prendre une décision diagnostique ou thérapeutique le médecin doit avoir des éléments lui permettant de prendre en compte cette variabilité naturelle, pour distinguer ce qui est normal de ce qui est pathologique (décision à propos d’un patient) et pour évaluer la qualité d’un nouvel examen, ou d’une nouvelle thérapeutique (décision thérapeutique). La compréhension des méthodes statistiques, de leur puissance et de leurs limites, est essentielle pour un médecin de nos jours. Tout résultat de recherche médicale résulte d’une expérimentation (clinique ou biologique) qui s’appuie sur une méthodologie statistique rigoureuse, et dont les résultats sont analysés en termes statistiques.

De même la démarche statistique permet d’évaluer les risques (ou les bénéfices) d’une prescription, de déterminer dans une situation donnée l’examen qui apportera la meilleure information diagnostique.

Nous voyons donc l’importance de la maîtrise de l’outil et de la démarche statistique :

  • Pour permettre les progrès de la connaissance médicale : c’est le domaine de la recherche clinique qui ne peut s’accomplir convenablement (définition de la question, mise en place du protocole expérimental, analyse des résultats) qu’en suivant une méthodologie statistique rigoureuse.
  • Pour mieux connaître l’état de santé d’une population, la fréquence et la gravité d’une épidémie (penser au SIDA), etc. Cette connaissance se fera à partir d’échantillons convenablement choisis et de calculs basés sur les outils de la statistique. Il sera alors possible de rechercher les stratégies de prévention les mieux adaptées, d’en évaluer leur impact. Il s’agit là des applications relevant de l’épidémiologie et de la santé publique.
  • Pour améliorer la pratique médicale dans ses aspects décisionnels, à savoir choisir le meilleur examen (clinique ou para-clinique) pour aboutir le plus rapidement et le plus sûrement au diagnostic. Pour optimiser la thérapeutique, choisir le traitement le mieux adapté à un patient donné (choix du médicament, posologie, etc).

L’objectif de ce cours est de vous fournir les bases indispensables permettant de comprendre les méthodes utilisées, d’interpréter correctement les résultats de nouvelles recherches, et d’adopter un mode de raisonnement qui soit à même d’aider à la décision dans l’exercice de la médecine.

Plus précisément nous étudierons successivement :

  1. Les bases de calcul de probabilités, qui sont indispensables à la compréhension et à l’utilisation des méthodes statistiques.
  2. La statistique descriptive qui permet de représenter et de quantifier la variabilité d’une ou plusieurs grandeurs observées.
  3. La statistique inductive qui inclura les tests statistiques permettant de retenir une hypothèse A plutôt qu’une hypothèse B à partir de données expérimentales (comme dans le cas de la comparaison de deux traitements, où l’hypothèse A est que les deux traitements sont équivalents et l’hypothèse B est qu’ils sont différents).
  4. Les applications des méthodes statistiques à l’épidémiologie, à l’aide à la décision thérapeutique et diagnostique, et les applications aux essais thérapeutiques.



1. Rappel : calculer la dérivée partielle d’une fonction par rapport à l’une des variables consiste à dériver en assimilant les autres variables à des constantes.

 

     Page précédentePage suivanteSommaireVersion imprimable
   
 
1 - La variabilité et l’incertain
2 - La mesure d’une grandeur
3 - La décision dans l’incertain
2.1 - Unités et équations aux dimensions
2.2 - Erreurs de mesure