12 ANALYSER DES DONNEES DE SURVIE Merci à Nadine Bossard et à Pascal Roy pour la rédaction de la partie statistique de ce chapitre. Introduction aux méthodes d analyse de la survie Nous allons nous intéresser à la survenue d un évènement (par exemple le décès) dans un groupe de sujets (ou collectif) défini par une caractéristique commune (eg diagnostic d une affection grave) survenant à une date particulière : la date d origine (DO). I ev II ev III IV ev V VI pv (A) (B) 0 1 2 3 4 5 6 7 8 9 temps calendaire Figure 1. Données fictives représentant la survie de 6 patients Le collectif de sujets (patients) est suivi dans le temps. En fonction de la date à laquelle est effectuée l analyse, deux situations sont rencontrées : -1- situation B : toutes les observations sont complètes : tous les patients sont décédés. -2- situation A (cas le plus fréquent) : une partie des observation est complète (certains patients sont décédés), une autre partie incomplètes (des patients sont encore vivants). Le jour J choisi pour faire le bilan de l étude est appelé la date de point (DP). A cette date, il est nécessaire de disposer de l état vivant ou décédé de chaque sujet du collectif. Un suivi actif est nécessaire pour que cette information soit disponible pour tous les sujets le jour J. La dernière date à laquelle des nouvelles d un sujet sont disponibles est la date de dernières nouvelles (DDN). Celle-ci peut être la date de dernière consultation pour les sujets encore vivants, et la date de décès pour les autres. A cette date de dernières nouvelles, est associé l état aux dernières nouvelles (vivant/décédé). Lorsque le suivi du collectif est bien mené, soit le patient est décédé avant la date de point, soit sa date de dernières nouvelles est postérieure ou égale à la date de point. Si sa date de dernière nouvelle est antérieure à la date de point et qu il est vivant aux dernières nouvelles, le sujet est perdu de vue à sa date de dernières nouvelles (cas du sujet N VI). L idéal est de ne pas avoir de perdus de vue, qui risquent de fausser les résultats de l analyse et obligent à faire sur eux des hypothèses fortes. Premiers pas dans SPSS ; Louis AYZAC 91
A partir de ces différentes dates, se définissent deux délais importants : Date d origine Date des Dernières nouvelles Date de point (1) (1) temps de participation (2) recul (2) Figure 2. Temps de participation et recul Recul : délai écoulé entre la date d origine et la date de point, Temps de participation : -si la date des dernières nouvelles est antérieure à la date de point, le temps de participation se calcule entre la date d origine de dernières nouvelles (DDN - DO) -si la date de dernières nouvelles est postérieure à la date de point, le temps de participation se calcule entre la date d origine et la date de point (DP - DO). L information survenant après la date de point n est pas prise en compte : le sujet vivant à la date de point est exclu vivant à la date de point I II ev III IV V ev ev VI pv 0 1 2 3 4 5 6 7 8 temps de participation Figure 3. Représentation des temps de participation L échelle de temps utilisée de la figure est celle des temps de participation. L origine de cette échelle est la date d origine de tous les sujets. Sont représentés les 2 sujets décédés avant la date de point, les 3 sujets exclusvivants à la date de point, et le sujet perdu de vue. Premiers pas dans SPSS ; Louis AYZAC 92
La figure 4 est la même, mais les temps de participation des 6 sujets sont présentés en ordre croissant. En cas d égalité des temps de participation, les sont représentés avant les ev. III II Ev V IV ev VI pv I ev 0 1 2 3 4 5 6 7 8 temps de participation Figure 4. Représentation des temps de participation (bis) Méthode de Kaplan et Meier La méthode Kaplan et Meier s appuie sur le calcul des probabilités conditionnelles P(A / B) = P(A B) P(B) # 0 P(B) La méthode de Kaplan et Meier est une méthode non paramétrique d estimation de la survie, prenant en compte les différents temps de participation se terminant par les 3 évènements présentés plus haut (, ev, pv). Soit T i un de ces instants. La probabilité de décès à l'instant T i sachant que le patient a survécu jusque là s'écrit : P(décès au temps T i / survie jusqu'à T i-1 au moins) = P(décès au temps T i et survie jusqu'à T i-1 au moins) P(survie jusqu'à T i-1 au moins) Désignons par N i le nombre de patients ayant survécu jusqu'à T i au moins et par D i le nombre de décès à l'instant T i. Alors il est possible d'écrire P(décès au temps T i / survie jusqu'à T i-1 au moins) = D i / N i La probabilité instantanée s i de survivre au delà de T i sachant que l'on a survécu jusqu'en T i au moins s'écrit donc comme le complément de la probabilité calculée ci-dessus s i = 1 - D i / N i Premiers pas dans SPSS ; Louis AYZAC 93
Courbe de survie : La probabilité de survivre au delà de T i s'écrit P(survivre au delà de T i ) = P(survivre au delà de T i / survie jusqu'à T i-1 au moins). P(survie au delà de T i-1 ) S i = S i-1. s i Disposition pratique repérer tous les instants ou un événement s'est produit T i N i pv ev D i s i S i 0 6 0 0 0 1 1 1 6 0 0 1 5/6 5/6 1 5 0 1 0 1 5/6 3 4 0 0 1 3/4 15/24 4 3 1 1 0 1 15/24 5 1 0 1 0 1 15/24 Le taux de survie doit être complété par son écart-type dont le calcul n'est pas du ressort de cette introduction. En cas d'ex-aequo, toujours admettre que le pv ou le ev se placent après le décès. Voici la courbe de survie et le «listing» correspondant fournis par le logiciel SPSS. Survie globale 1.0 Méthode de Kaplan et Meier (N = 6).9.8 Su rvi e cu m ul ée.7.6.5.4.3.2.1 0.0 0 1 2 3 4 5 6 temps (jours, semaines, mois, année...) Survival Analysis for TEMPS Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 1.00 1.00.8333.1521 1 5 1.00.00 1 4 3.00 1.00.6250.2135 2 3 4.00.00 2 2 4.00 2.00 2 1 5.00.00 2 0 Premiers pas dans SPSS ; Louis AYZAC 94
Number of Cases: 6 Censored: 4 ( 66.67%) Events: 2 Méthode actuarielle La méthode diffère de celle de Kaplan et Meier : dans la méthode de Kaplan Meier, seuls les temps de participation des sujets décédés apportent de l'information. Dans la méthode actuarielle, les intervalles de temps sont définis a priori, la survie étant constante par intervalle. Les ev ne sont pas traités de la même façon dans les deux méthodes. Test du logrank Il est construit sous l'hypothèse nulle Ho suivante : les probabilités instantanées de décès sont les mêmes entre les deux groupes (pour tout T i pour lequel un décès est observé, la proportion de décès attendus est la même dans 2 groupes). Ce test n'est pas adéquat en cas d'interaction du facteur étudié avec le temps. Références utilisées Estève J., Benhamou H., Raymond L. Méthodes statistiques en épidémiologie descriptive. Les Editions INSERM, PARIS, 1993 Laplanche A., Com-Cougué C., Flamant R. Méthodes statistiques appliquées à la recherche clinique. Collection Statistiques en biologie et en Médecine. Flammarion Médecine-Sciences, 1987, PARIS. Premiers pas dans SPSS ; Louis AYZAC 95
APPLICATIONS Le fichier de travail renferme des informations sur des ampoules électriques pour lesquelles on voudrait analyser leur durée de vie. debut ddn etat machine 1 01.03.95 02.03.95 2.00 2.00 2 01.02.95 03-02.95 2.00 3.00 3 01.03.95 15.03.95 2.00 3.00 4 01.02.95 01.03.95 2.00 3.00 5 01.02.95 06.04.95 2.00 2.00 6 01.03.95 12.05.95 2.00 2.00 7 01.01.95 15.03.95 2.00 2.00 8 01.03.95 26.06.95 1.00 1.00 9 01.03.95 26,06.95 1.00 1.00 10 01.03.95 26.06.95 1.00 3.00 11 01.03.95 26.06.95 1.00 4.00 12 01.02.95 15-05,95 1.00 3.00 13 01.02.95 16-05.95 2.00 1.00 14 01.01.95 2l.04.95 2.00 1.00 15 01.02.95 26.06.95 1.00 2.00 16 01.02.95 26.06.95 1.00 4.00 17 01.01.95 26.06.95 1.00 2.00 18 01.01.95 26.06.95 1.00 2.00 19 01.01.95 02.06.95 1.00 1.00 20 01.01.95 30.05.95 2.00 1.00 21 01.01.95 26.06.95 1.00 4.00 1 étape : Fixez une date de point qui permette de perdre le moins d informations, en sachant que l état 1 correspond à une ampoule fonctionnant à la date de dernières nouvelles (ddn) et l etat 2 à une ampoule mise hors service à la date ddn. A partir du fichier de données "tab7.sav", calculez les nouvelles variables ddp (date de point), durée (durée de survie), détat (état à la date de point), pdv (perdu de vue). Comment calculer de nouvelles variables? A partir du menu, choisissez Transformer Calculer.. Premiers pas dans SPSS ; Louis AYZAC 96
Variable destination. Nom de la variable qui reçoit la valeur calculée. Expression numérique. Expression utilisée pour calculer la valeur de la variable destination. Pour la date de point, utilisez la fonction "Date.DMY (d, m, y)". Vous pouvez utiliser des expressions conditionnelles pour appliquer certains codages aux sous-ensembles d'observations sélectionnés. Pour spécifier une expression conditionnelle, cliquez sur Si... Vous avez le choix entre les options suivantes Inclure toutes les observations. Les valeurs sont calculées pour toutes les observations. Inclure si l'observation remplit la condition. Entrez l'expression conditionnelle dans la zone de texte. Remarque : Pour travailler plus rapidement, utilisez la fenêtre de syntaxe et entrez toutes les instructions nécessaires au calcul des trois variables!! 2 étape : Déterminez la table de survie de Kaplan-Meier basée sur toutes les observations de notre fichier. Comment obtenir une analyse de survie de Kaplan-Meier? A partir du menu, choisissez Analyse Survie Kaplan-Meier... Durée. Sélectionnez une variable numérique indiquant combien de temps chaque individu a survécu (données non censurées) ou a été observé (données censurées). Cette variable peut être mesurée dans n'importe quelle unité de temps. SPSS exclut de l'analyse les individus auxquels est associée une durée négative. Premiers pas dans SPSS ; Louis AYZAC 97
Etat. Sélectionnez une variable numérique ou chaîne courte dont une ou plusieurs valeurs indiquent si l'événement s'est produit. Vous devez alors spécifier les codes qui identifient les données non censurées. Critère. Par défaut, l'analyse traite tous les individus du fichier courant. Pour sortir des courbes de survie par sous-groupes, il faut sélectionner une variable numérique ou chaîne courte dont les valeurs définissent deux ou plusieurs sous-groupes. Définir l'événement pour la variable d'état Pour spécifier quelle(s) valeur(s) de la variable d'état identifie(nt) l'événement, cliquez sur: Définir l'événement... Une ou plusieurs valeurs peuvent indiquer que l'événement s'est produit. Les individus dont la valeur de la variable d'état n'est pas manquante sont traitées. Valeur unique. Entrez une seule valeur d'identification. Intervalle de valeurs. Il faut que la variable soit numérique. Entrez la plus petite et la plus grande valeur de l'intervalle. Liste de valeurs. Sélectionnez des valeurs en les ajoutant au fur et à mesure. 3 étape : Enregistrez dans votre fichier de données les probabilités de survie cumulées,les écarts type associés et donnez une représentation graphique des groupes de survie. Comment sauver de nouvelles variables? Pour sauvegarder des variables de survie, cliquez sur Enregistrer... Vous pouvez sauver une ou plusieurs variables suivantes Survie. Estimateur de la probabilité de survie cumulée. Ecart type de survie. Ecart type de l'estimateur cumulé de survie. Hasard. Estimateur de la fonction cumulée de hasard. Fréquence cumulée. Fréquence cumulée quand les individus sortent de leur temps de survie. Premiers pas dans SPSS ; Louis AYZAC 98
Options Pour obtenir d'autres statistiques et des graphes, cliquez sur Options... Statistiques. Les statistiques sont calculées pour chaque combinaison de niveaux de facteur et de strates. Vous pouvez choisir une ou plusieurs st,-e'.@;tiques. Graphes. Si vous avez une variable de stratification, un graphe sera produit pour chaque strate. Pour obtei'n'r les courbes de survie des différents niveaux de facteur, choisissez Survie. 4 étape : Comparez les fonctions de survie des ampoules des quatre groupes de machines. Comment comparer des niveaux de facteurs? Si vous avez une variable correspondant à un critère, vous pouvez obtenir des tests de comparaison des fonctions de survie pour différents niveaux du facteur. Cliquez sur: Comparer les niveaux.. Tests statistiques. Vous pouvez choisir un ou plusieurs tests d'égalité des fonctions de survie pour les niveaux d'un facteur. Mantel-Cox. Test de Mantel-Cox (Log rank). Ce test donne un poids égal à toutes les observations. Breslow. Test de Breslow (Gehan). Ce test donne un poids en ti (temps de décès) correspondant au nombre total de sujets exposés au risque en ti. Ainsi les décès précoces ont un poids plus élevé que les décès tardifs dans la comparaison. Tarone-Ware. Test de Tarone-Ware. Ce test donne un poids en ti correspondant à la racine carrée du nombre total de sujets exposés au risque en ti. Premiers pas dans SPSS ; Louis AYZAC 99
Pour des tests de comparaisons par niveaux de facteur, vous pouvez choisir de comparer tous les niveaux simultanément ou par paires. Vous pouvez obtenir des résultats sur l'ensemble des strates ou bien des tests séparés pour chaque strate. Sur l'ensemble des strates. Comparaison des niveaux de facteur sur un simple test. Pour chaque strate. Tests de comparaison des différents niveaux de facteurs pour chaque strate. Appariés sur les strates. Comparaison de chaque paire distincte de niveaux de facteur. Appariés pour chaque strate. Comparaison de chaque paire distincte de niveaux de facteur pour chaque strate. Premiers pas dans SPSS ; Louis AYZAC 100