Page précédentePage suivanteSommaireVersion imprimable  

Page d'accueil

Biostatistique

Sommaire

Avant-propos

Introduction

1 - Statistique(s) et Probabilité(s)

2 - Rappels mathématiques

3 - Eléments de calcul des Probabilités

4 - Probabilité Conditionnelle ; Indépendance et Théorème de Bayes

5 - Evaluation de l'intérêt diagnostique des informations médicales

6 - Variables aléatoires

7 - Exemples de distributions

8 - Statistiques descriptives

9 - Etude de la variable aléatoire moyenne expérimentale

10 - Estimation - Intervalle de confiance

11 - Les tests d'hypothèses. Principes

12 - Quelques tests usuels

13 - Tests concernant des variables qualitatives

14 - Liaison entre deux variables continues : notion de corrélation

15 - A propos des tests d'hypothèses

16 - Analyse des durées de survie ou Analyse des délais de survenue d'un événement

A - Tables statistiques


Tous droits de reproduction réservés aux auteurs


traduction HTML V2.6
V. Morice


webmaster

 

Chapitre 16 - Analyse des durées de survie ou Analyse des délais de survenue d'un événement

 

16.3 - Estimation d'une fonction de survie à partir d'observations

 

 

16.3.1 Quelques points de terminologie

L'étude qui est envisagée et qui fournira les observations utiles à l'estimation débutera à une certaine date et se terminera (on cessera de recueillir les informations) à une certaine date. On appelle date de point la date à laquelle se termine l'étude.

L'instant de référence surviendra probablement à des dates absolues (dates calendaires comme le 8 juillet 2006) variées selon les patients ; on peut penser par exemple à la date à laquelle l'intervention chirurgicale est réalisée chez le patient pour instant de référence. Cet instant de référence, variable selon les sujets, s'appelle date d'origine. C'est la date à laquelle le sujet peut être considéré comme entrant dans l'étude et à partir de laquelle on comptera les délais le concernant. A cette date le suivi du sujet débute. Ce suivi aura une fin, motivée par l'une des trois raisons suivantes :

  • on arrive à la date de point et le sujet n'a pas encore présenté l'événement ; la date de fin de suivi (pour l'étude) sera la date de point
  • on n'a plus de nouvelles du sujet et, la dernière fois que l'on en a eues, il n'avait pas encore présenté l'événement
  • le sujet présente l'événement d'intérêt à une certaine date et il n'est plus nécessaire de le suivre.

Dans les deux premiers cas on ne connaîtra jamais la date à laquelle le sujet présentera l'événement ; c'est la raison pour laquelle on parle d'information censurée.

Le délai entre la date d'origine d'un sujet et la date des dernières nouvelles du sujet s'appelle temps (au sens durée) de participation du sujet.

Enfin le délai entre la date d'origine d'un sujet et la date de point s'appelle recul pour le sujet correspondant.

16.3.2 Forme générale des informations expérimentales

On réalise, pour estimer une fonction de survie, une étude clinique consistant à inclure des sujets au cours du temps et à les suivre pour observation de l'événement d'intérêt. Chacun des n sujets participant à l'étude clinique fera l'objet d'un recueil de toutes les dates et événements évoqués ci-dessus. A partir de ces informations on pourra calculer ou noter pour chaque sujet :

  • le temps de participation, parfois appelé durée de suivi dans l'étude
  • à la date des dernières nouvelles (qui peut être la date de point), s'il avait ou non présenté l'événement d'intérêt.

Ces deux informations sont suffisantes pour estimer la fonction de survie. Deux méthodes d'estimation ont été proposées.

Dans tout ce qui suit, l'instant de référence (variable d'un sujet à l'autre) est implicitement pris pour origine des temps.

16.3.3 Estimation d'une fonction de survie par la méthode actuarielle

Cette méthode est utilisée dans des études de grande taille, impliquant des effectifs importants. On peut penser par exemple à l'étude des délais de survenue du premier accident automobile après obtention du permis de conduire chez des clients d'une compagnie d'assurances.

Le principe de la méthode est d'estimer la fonction de survie en des temps (des délais donc) définis à l'avance, par exemple tous les mois. On note 0, b1, b2, ...br, les différents temps retenus.

Pour cela on utilise l'équation 6 qui permet de calculer S de proche en proche selon :

S(bj) = S(bj-1) × S(bj / bj-1)

On sait que S(0)=1. Le seul problème devient celui de l'estimation des S(bj / bj-1), c'est-à-dire de la probabilité de survivre au temps bj sachant que l'on est survivant au temps bj-1, qui est 1 moins la probabilité de décéder dans l'intervalle ]bj-1 bj] sachant que l'on est vivant au temps bj-1. Cette dernière probabilité (1 - S(bj / bj-1) donc) peut s'estimer à partir des sujets de l'échantillon que l'on sait vivants au temps bj-1, des sujets décédant dans l'intervalle ]bj-1 bj] et des sujets censurés dans cet intervalle, c'est-à-dire des sujets dont le suivi s'arrête dans cet intervalle pour d'autres raisons que le décès.

L'estimation proposée de S(bj / bj-1) est :

Image graphique581562.trsp.gif

où :

  • Nj est le nombre de sujets que l'on sait vivants au temps bj-1
  • Dj est le nombre de sujets décédant dans l'intervalle ]bj-1 bj]
  • Cj est le nombre de sujets censurés dans l'intervalle ]bj-1 bj]

Remarques

On a la relation : Nj+1= Nj - Dj - Cj

Cet estimateur a des propriétés intéressantes ; on peut toutefois le considérer comme « intuitif » en se disant que sur l'intervalle ]bj-1 bj], le dénominateur (Nj - Cj/2) représente le nombre « moyen » de sujets à risque de décéder, c'est-à-dire le nombre moyen de sujets dont on enregistrera le décès s'il survient.

Finalement :

S(bj / bj-1) est estimé par Image graphique582563.trsp.gif

et les estimés de S(bj) (notées Image graphique583564.trsp.gif) sont calculés de proche en proche aux différents temps d'intérêt. Les valeurs de la fonction de survie à d'autres temps, et jusqu'au dernier temps br, s'obtiennent par interpolation linéaire. D'où l'allure de la courbe de survie estimée par méthode actuarielle (figure ci-dessous). Par ailleurs on peut estimer la médiane de survie comme le temps auquel la fonction de survie estimée vaut 0,5 (voir figure ci-dessous).

Image survactu.gif

Exemple (on sait qu'à b0=0, S vaut 1) :

Instants bj Connus vivants à bj-1 (Nj) Censurés dans ]bj-1 bj] (Cj) Décédés dans ]bj-1 bj] (Dj) Image graphique585565.trsp.gif  Image graphique586566.trsp.gif 
0 Non défini Non défini Non défini Non défini 1
3 210 0 0 1 1
9 210 10 40 0,805 0,805
12 160 30 10 0,931 0,749
18 120 10 20 0,826 0,619
21 90 20 0 1 0,619
23 70 0 20 0,714 0,442
27 50 18 3 0,927 0,410
36 29 8 2 0,920 0,377

Les valeurs en gras sont choisies (pour les bj) ou calculées selon les principes ci-dessus ; les autres constituent les données directement issues de l'étude. La figure précédente est compatible avec les données.

16.3.4 Estimation d'une fonction de survie par la méthode de Kaplan-Meïer

Cette méthode, qui peut être utilisée en toute circonstance, est néanmoins plus souvent employée dans le cadre d'études mettant en jeu de faibles effectifs. Elle repose sur des principes analogues à la méthode actuarielle, avec deux différences importantes :

  • la fonction de survie est supposée constante entre deux instants de décès observés
  • la fonction de survie est estimée à chaque instant de décès observé

On rappelle que pour chaque sujet i on dispose de son temps de participation, que l'on note ti, et de l'information selon laquelle il a, ou non, présenté l'événement (le décès) au temps ti. L'habitude est de noter ti le temps de participation d'un sujet qui décède à ti, et ti* le temps de participation ti d'un sujet censuré au temps ti (sujet perdu de vue ou sujet connu vivant à la date de point). On renumérote les sujets de sorte que les ti et/ou ti* se trouvent rangés par ordre croissant. On estime là encore de proche en proche les S(ti) (la fonction de survie est estimée aux seuls temps de décès observés, les ti) en utilisant l'équation 6, soit :

S(ti) = S(ti-1S(ti / ti-1)

L'estimation proposée pour S(ti / ti-1) est :

Image graphique587567.trsp.gif

où :

  • Di est le nombre de décès observés au temps ti
  • Ci est le nombre de sujets censurés au plus tôt à ti-1, et strictement avant ti
  • Ni est le nombre de sujets connus vivants juste après ti-1

On peut noter l'apparentement avec l'estimation par méthode actuarielle. On peut également remarquer, et utiliser cette remarque pour faire les calculs, que Ni-Ci représente le nombre de sujets dont on sait qu'ils peuvent décéder au temps ti ; c'est le nombre de sujets dits « à risque » dont nous avons déjà parlé ; on notera qu'un sujet censuré au temps ti est à risque au temps ti. Finalement :

Image graphique588568.trsp.gif
Equation 7  

L'estimation se calcule alors de proche en proche comme précédemment.

Exemple

On dispose des valeurs des ti et ti* suivantes :

6; 6; 6; 6,1*; 7; 9*; 10; 10,1*; 11*; 13; 16; 17*; 19*; 20*; 22; 23; 25*; 32*; 32*; 34*; 35*

La fonction de survie est donc à estimer aux instants : 6; 7; 10; 13; 16; 22; 23

ti Ni Ci Nombre à risque à ti Di Image graphique589569.trsp.gif  Image graphique590570.trsp.gif 
6 21 0 21 3 0,857 0,857
7 18 1 17 1 0,941 0,807
10 16 1 15 1 0,933 0,753
13 14 2 12 1 0,917 0,690
16 11 0 11 1 0,909 0,627
22 10 3 7 1 0,857 0,537
23 6 0 6 1 0,833 0,448

Courbe résultante :

Image survkapme.gif

Remarques

  • La courbe de survie estimée se termine différemment selon que le ou les événements correspondant au temps de participation maximum observé sont des décès ou des censures. Si le dernier temps observé correspond à un ou plusieurs décès sans censure à ce temps, la fonction de survie est estimée à 0 à cette date et ultérieurement. Si au temps de participation maximum observé se trouve une censure, la fonction de survie ne peut être estimée au-delà de cette date.
  • L'estimation de la médiane de survie est comme précédemment définie comme le temps auquel l'estimation de la fonction de survie égale 0,5.

 

Page précédentePage suivanteSommaireVersion imprimable  

 

16.1 - Contexte
16.2 - Comprendre une fonction de survie
16.3 - Estimation d'une fonction de survie à partir d'observations
16.4 - Comparaison de (deux) fonctions de survie estimées à partir d'observations
16.3.1 - Quelques points de terminologie
16.3.2 - Forme générale des informations expérimentales
16.3.3 - Estimation d'une fonction de survie par la méthode actuarielle
16.3.4 - Estimation d'une fonction de survie par la méthode de Kaplan-Meïer