2 e cycle EM2 & 3 LCA Complément de statistique. Compléments de statistiques Analyse de données de survie Analyse univariée D. Neveu compléments statistiques EM2 EM3 : 2006-2007 2 Objectifs pédagogiques Reconnaître des données longitudinales dans des exemples concrets Définir les termes : date d origine, date des dernières nouvelles, date de point, censure Interpréter une courbe de Kaplan Meier, estimer la médiane de survie Préciser le principe du test du Logrank (formulation des hypothèses), ses conditions de validité et interpréter le degré de signification 3 Survie: introduction Évaluation de traitement Essai thérapeutique contrôlé randomisé population échantillon global CJP : décès Randomisation du traitement Groupe Groupe 2 Efficacité Tolérance 4
2 e cycle EM2 & 3 LCA Complément de statistique. Survie: introduction Étude pronostique : cohorte Exposés (E+) Non exposés (E-) Survie introduction Données de survie survenue d un événement (décès, IdM, rechute, insuffisance rénale terminale, doublement de la créatinine) recherche événement: D (+) Non D (-) RR = recherche événement: D (+) P( P( Non D (D-) + / E + ) + / E ) 5 Analyse des données de survie étudier l événement (décès, IdM..), au cours du en tenant compte de la durée de surveillance individuelle du moment de l événement des données incomplètes ( tous les sujets n ont pas présenté l événement lors de l analyse) 6 Survie - Introduction Exemple : Souris Injection de cellules tumorales 0 20 j Durée de survie : estimation de la moyenne, médiane, variance Taux de survie à 20 jours (proba d être encore vivant à 20j): 3/7=43% 7 Cas rarement rencontré en pratique Survie - Introduction Exemple 2 : Essai thérapeutique évaluant 2 stratégies de prise en charge du cancer bronchique critère de jugement principal: survenue de décès Date d inclusion Date de fin d étude Date d inclusion Perdu de vue vivant Durée de survie? Taux de survie à 4 ans? Date de fin d étude 8
2 e cycle EM2 & 3 LCA Complément de statistique. Survie - Introduction Exemple 2 : Essai thérapeutique évaluant 2 stratégies de prise en charge du cancer bronchique critère de jugement principal: survenue de décès Date d inclusion Date de fin d étude Date d inclusion Censure Date de fin d étude Durée de survie? Taux de survie à 4 ans? Données censurées sont caractéristiques des données de Survie - Introduction Analyse des données de survie: Utilité Descriptif pour échantillon étudié Prédiction de la «survie» pour population dont échantillon représentatif en fonction de facteurs (études pronostiques) Comparaison entre groupes : évaluation de traitement Informations nécessaires? survie 9 0 date d origine (DO) = date de début de la surveillance 0 pour chaque sujet date du diagnostic dans une étude pronostique date du traitement ou du TAS dans un essai thérapeutique Dates peuvent être étalées dans le (selon la durée de la période d inclusion) Date des dernières nouvelles (DDN) date la + récente où on a recueilli des info concernant le statut du sujet (vivant ou D (ou récidive ou non récidive) ) si un sujet est D, DDN= date du décès si un sujet a récidivé, DDN=date de la récidive même si on a eu de ses nouvelles après Durée de surveillance délai entre DO et DDN 2
2 e cycle EM2 & 3 LCA Complément de statistique. Date de point (DP) Date du bilan : au delà de laquelle on ne tient pas compte des infos (même si sujet D) date à laquelle on essaie d avoir l info sur le statut de chaque sujet Pourquoi une date de point? Éviter les biais Exemple : pronostic à long terme du cancer du sein» femmes dont on n a pas de nouvelles récentes probablement pas représentatives de l ensemble des femmes suivies» + volontiers des femmes en rémission prolongée Survie - Définitions Temps de participation (TP) si DDN DP TP = DDN - DO * si sujet non D, il est dit perdu de vue si DDN > DP TP = DP - DO Recul : délai écoulé ente DO et DP = délai maximum d observation du sujet 3 4 Date d origine (DO) DDN* Temps de participation Temps de participation 2 Date de Point (DP) DDN 2 État du sujet: statut du sujet à DP DO DO D: (Non censuré)?: Perdu de vue (censure) Perdu de vue DDN () DP DP recul DDN : Date des dernières nouvelles 5 VV: Exclu vivant DO (censure) DP DDN (VV) 6
2 e cycle EM2 & 3 LCA Complément de statistique. Temps de participation, Survie et Censures Événement avant DP de participation = survie PDV et Exclus vivants de participation < survie PDV et Exclus vivants sont tous deux censurés à droite 7 Estimations de la fonction de survie Méthodes paramétriques (non traitées) exponentiel weibul log normal Méthodes non paramétriques Kaplan-Meier (la + utilisée) Actuarielle (de en utilisée) 8 Fonction de Survie S(t) Définition probabilité de survivre au-delà de t // courbe de survie // Survie en t S(t) = Prob ( T t) Avec T «durée de vie» = Date de décès Date d origine Propriétés de S(t) fonction monotone décroissante et continue * S(0) = lim S( t) = 0 t Probabilité de décéder entre 0 et t: F(t) F(t) = S(t) Exemple: fonction de survie S(t) Albumine <28 0 fonction monotone croissante et continue * 9 0 30 60 90 20 Jours 80 20 240 Probabilite de survie.75.5.25 décès
2 e cycle EM2 & 3 LCA Complément de statistique. Exemple: F(t) essai irbesartan D après Lewis et al NEJM 200 2 Méthode non paramétrique de Kaplan Meier En termes probabilistes survivre un an = survivre 365 j <=> avoir survécu 364 j et survivre au 365 e j sachant qu on était vivant jusque là => probabilités conditionnelles Expression de S(t) S 365 = S 364 * S 365/364 = S * S 2/ * S 3/2 *..* S 365/364 S = prob de survivre le premier j de l entrée dans l étude S 2/ = prob de survivre le 2 e j sachant qu on a survécu le premier Jours où aucun : proba conditionnelle = On s intéresse aux jours avec (événements) => découpé en intervalles de définis par (événements) 22 Méthode non paramétrique de Kaplan Meier Méthode non paramétrique de Kaplan Meier Albumine <28 Médiane de survie : c est le auquel la probabilité d être encore en vie pour un sujet donné est de 50% inf S0,5( t) = [ S( t) t 0,5] Probabilite de survie.75.5.25 0 S = 0.44 8 décès sur 9 sujets un décès à chaque marche d escalier donnée censurée à23 jours 23 0 30 60 90 20 80 240 Jours 24 Médiane = 56 jours
2 e cycle EM2 & 3 LCA Complément de statistique. Courbes de Survie: Albumine en 3 classes Selon Albumine Comparaison de plusieurs courbes de survie Probabilite de survie.75.5.25 0 <28mg/l 28-32 % 9% >32mg/l 63% Décès/N >32: 3/0 28-32: 7/ <28: 8/9 0 500 000 500 Jours 25?? Comparaison taux de survie à 500 jours? 000j? Comparaison de courbes de survie entières 26 Comparaison de plusieurs courbes de survie: test du logrank Hypothèses cas de k groupes Hypothèse nulle : égalité des fonctions de survie entre les k groupes Hypothèse alternative : la fonction de survie d au moins un groupe est différente des autres Statistique du logrank suit loi du chi2 à k- ddl 27 Comparaison de plusieurs courbes de survie: test du logrank Conditions de validité conditions du chi2 : effectifs théoriques >= 5 les courbes ne doivent pas se chevaucher c est-à-dire que les entre les probabilités de survie dans les 2 groupes sont de même signe Exemple : 2 chimio dont l est + toxique (+ de en phase initiale) mais meilleure survie à long terme que l autre Remarque : test du logrank: même poids accordé aux événements et censures précoces qu aux événements et censures tardifs 28
2 e cycle EM2 & 3 LCA Complément de statistique. Courbes de Survie : Albumine en 3 classes Pièges à éviter dans l interprétation des courbes de survie Probabilite de survie.75.5.25 0 Selon Albumine <28mg/l >32mg/l 28-32 % 9% 63% 0 500 000 500 Jours Test du logrank : p < 0-6 Décès/N >32 : 3/0 28-32 : 7/ <28 : 8/9 Interprétation : au moins la survie d un des groupes diffère de celle divergence avant durée de survie moyenne pas toujours due à un effet du traitement augmentant au cours du Rapprochement : Après durée de survie moyenne Avant durée de survie moyenne : effet délétère tardif des deux autres 29 30 Problèmes liés aux censures Type de censure Exclus vivants (censures non liées à pathologie) Perdus de vue (censures au hasard) Perdus de vue (censures non au hasard) Conséquences Regroupées en fin de courbe Ne faussent pas partie de courbe sans censure Ne soustraient pas d information sur partie de courbe à estimer Perte d information : perte de puissance Ne faussent pas estimation de courbe Perte d information : perte de puissance Faussent estimation de courbe : biais Faussent comparaison de courbes : biais 3