12 ANALYSER DES DONNEES DE SURVIE. Introduction aux méthodes d analyse de la survie



Documents pareils
La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Principe d un test statistique

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Analyse et interprétation des données

Analyse des durées de vie avec le logiciel R

Application des courbes ROC à l analyse des facteurs pronostiques binaires

MODELES DE DUREE DE VIE

Probabilités (méthodes et objectifs)

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Logiciel XLSTAT version rue Damrémont PARIS

1. Introduction Création d'une requête...2

Manuel Cartes ristournes

Statistique : Résumé de cours et méthodes

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Le quizz des stats. Xavier Paoletti. Sce de biostatistiques / Inserm U900 Institut Curie

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Seules les personnes intelligentes consultent le manuel.

Exercices sur le chapitre «Probabilités»

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Valeur cible et solveur. Les calculs effectués habituellement avec Excel utilisent des valeurs numériques qui constituent les données d'un problème.

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

1. Vocabulaire : Introduction au tableau élémentaire

23. Interprétation clinique des mesures de l effet traitement

Asset Management Software Client Module. Manuel d utilisation

Manuel d utilisation de la plate-forme de gestion de parc UCOPIA. La mobilité à la hauteur des exigences professionnelles

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Statistiques Descriptives à une dimension

Analyse Combinatoire

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Bio-Rad Laboratories CONTRÔLE DE QUALITÉ. Le logiciel de Bio-Rad pour une gestion experte du contrôle de qualité

Raisonnement par récurrence Suites numériques

Norme comptable internationale 33 Résultat par action

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

1- Enregistrer le nouveau planning

1. Création d'un état Création d'un état Instantané Colonnes Création d'un état Instantané Tableau... 4

Probabilités conditionnelles Loi binomiale

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

Peut-on réduire l incidence de la gastroentérite et ses conséquences dans les écoles primaires à l aide de solution hydro-alcoolique?

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

I. Ensemble de définition d'une fonction

Estimation et tests statistiques, TD 5. Solutions

Evolution de la fréquence des sinistres en assurance RC automobile

Qu est-ce qu une probabilité?

Sauvegarder sa messagerie Outlook 2010

Que faire lorsqu on considère plusieurs variables en même temps?

VI. Tests non paramétriques sur un échantillon

Evolution de la fréquence des sinistres en assurance RC automobile

1. Introduction Création d'une macro autonome Exécuter la macro pas à pas Modifier une macro... 5

Evaluation générale de la qualité des données par âge et sexe

Les débats sur l évolution des

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Utilisez Toucan portable pour vos sauvegardes

BONNE NOUVELLE, À PARTIR DE DEMAIN 15 AOÛT 2014, l inscription en ligne sera disponible à partir du site de l ARO.

Rappels sur les suites - Algorithme

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

LimeSurvey. Pour obtenir un compte sur le LimeSurvey de l Université de Genève, remplissez le formulaire de demande en ligne.

IBM SPSS Regression 21

Algorithmique avec Algobox

LE PROBLEME DU PLUS COURT CHEMIN

MODE D EMPLOI DU LOGICIEL LIGNES DE TEMPS A partir du film La Mort aux trousses d Alfred Hitchcock

Statistiques 0,14 0,11

- Le Diagramme de Gantt. - Le Diagramme de Pert - La Méthode QQCQCCP - La Méthode MOSI - Cahier des charges fonctionnel

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Lecture critique et pratique de la médecine

La magie de SVN. Découverte & usage du logiciel

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

Surveillance des toxi-infections alimentaires collectives

Introduction à Business Objects. J. Akoka I. Wattiau

Découverte du tableur CellSheet

PREINSCRIPTION EN LIGNE

Travaux pratiques avec RapidMiner

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Régression linéaire. Nicolas Turenne INRA

Traitement des données avec Microsoft EXCEL 2010

Modélisation aléatoire en fiabilité des logiciels

NOTIONS DE PROBABILITÉS

PROBABILITÉS CONDITIONNELLES

Aide-mémoire de statistique appliquée à la biologie

Table des matières: Guidelines Fonds de Pensions

ITIL V2. La gestion des incidents

Guide de l'utilisateur : Surveillance MédiaSource Analytique

Protocoles DHCP et DNS

POKER ET PROBABILITÉ

Probabilités sur un univers fini

Instructions relatives à l'adaptation de la messagerie électronique

Les usagers de drogues âgés de 40 ans et plus pris en charge dans les structures de soins pour leurs problèmes d addiction

Annexe commune aux séries ES, L et S : boîtes et quantiles

La Gestion de fichiers Supports réalisés avec OpenOffice.org 2.3 Writer. La Gestion de fichiers. Niveau : Débutant Auteur : Antonio da Silva

Les tableaux croisés dynamiques

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

I. Une nouvelle loi anti-discrimination

Transcription:

12 ANALYSER DES DONNEES DE SURVIE Merci à Nadine Bossard et à Pascal Roy pour la rédaction de la partie statistique de ce chapitre. Introduction aux méthodes d analyse de la survie Nous allons nous intéresser à la survenue d un évènement (par exemple le décès) dans un groupe de sujets (ou collectif) défini par une caractéristique commune (eg diagnostic d une affection grave) survenant à une date particulière : la date d origine (DO). I ev II ev III IV ev V VI pv (A) (B) 0 1 2 3 4 5 6 7 8 9 temps calendaire Figure 1. Données fictives représentant la survie de 6 patients Le collectif de sujets (patients) est suivi dans le temps. En fonction de la date à laquelle est effectuée l analyse, deux situations sont rencontrées : -1- situation B : toutes les observations sont complètes : tous les patients sont décédés. -2- situation A (cas le plus fréquent) : une partie des observation est complète (certains patients sont décédés), une autre partie incomplètes (des patients sont encore vivants). Le jour J choisi pour faire le bilan de l étude est appelé la date de point (DP). A cette date, il est nécessaire de disposer de l état vivant ou décédé de chaque sujet du collectif. Un suivi actif est nécessaire pour que cette information soit disponible pour tous les sujets le jour J. La dernière date à laquelle des nouvelles d un sujet sont disponibles est la date de dernières nouvelles (DDN). Celle-ci peut être la date de dernière consultation pour les sujets encore vivants, et la date de décès pour les autres. A cette date de dernières nouvelles, est associé l état aux dernières nouvelles (vivant/décédé). Lorsque le suivi du collectif est bien mené, soit le patient est décédé avant la date de point, soit sa date de dernières nouvelles est postérieure ou égale à la date de point. Si sa date de dernière nouvelle est antérieure à la date de point et qu il est vivant aux dernières nouvelles, le sujet est perdu de vue à sa date de dernières nouvelles (cas du sujet N VI). L idéal est de ne pas avoir de perdus de vue, qui risquent de fausser les résultats de l analyse et obligent à faire sur eux des hypothèses fortes. Premiers pas dans SPSS ; Louis AYZAC 91

A partir de ces différentes dates, se définissent deux délais importants : Date d origine Date des Dernières nouvelles Date de point (1) (1) temps de participation (2) recul (2) Figure 2. Temps de participation et recul Recul : délai écoulé entre la date d origine et la date de point, Temps de participation : -si la date des dernières nouvelles est antérieure à la date de point, le temps de participation se calcule entre la date d origine de dernières nouvelles (DDN - DO) -si la date de dernières nouvelles est postérieure à la date de point, le temps de participation se calcule entre la date d origine et la date de point (DP - DO). L information survenant après la date de point n est pas prise en compte : le sujet vivant à la date de point est exclu vivant à la date de point I II ev III IV V ev ev VI pv 0 1 2 3 4 5 6 7 8 temps de participation Figure 3. Représentation des temps de participation L échelle de temps utilisée de la figure est celle des temps de participation. L origine de cette échelle est la date d origine de tous les sujets. Sont représentés les 2 sujets décédés avant la date de point, les 3 sujets exclusvivants à la date de point, et le sujet perdu de vue. Premiers pas dans SPSS ; Louis AYZAC 92

La figure 4 est la même, mais les temps de participation des 6 sujets sont présentés en ordre croissant. En cas d égalité des temps de participation, les sont représentés avant les ev. III II Ev V IV ev VI pv I ev 0 1 2 3 4 5 6 7 8 temps de participation Figure 4. Représentation des temps de participation (bis) Méthode de Kaplan et Meier La méthode Kaplan et Meier s appuie sur le calcul des probabilités conditionnelles P(A / B) = P(A B) P(B) # 0 P(B) La méthode de Kaplan et Meier est une méthode non paramétrique d estimation de la survie, prenant en compte les différents temps de participation se terminant par les 3 évènements présentés plus haut (, ev, pv). Soit T i un de ces instants. La probabilité de décès à l'instant T i sachant que le patient a survécu jusque là s'écrit : P(décès au temps T i / survie jusqu'à T i-1 au moins) = P(décès au temps T i et survie jusqu'à T i-1 au moins) P(survie jusqu'à T i-1 au moins) Désignons par N i le nombre de patients ayant survécu jusqu'à T i au moins et par D i le nombre de décès à l'instant T i. Alors il est possible d'écrire P(décès au temps T i / survie jusqu'à T i-1 au moins) = D i / N i La probabilité instantanée s i de survivre au delà de T i sachant que l'on a survécu jusqu'en T i au moins s'écrit donc comme le complément de la probabilité calculée ci-dessus s i = 1 - D i / N i Premiers pas dans SPSS ; Louis AYZAC 93

Courbe de survie : La probabilité de survivre au delà de T i s'écrit P(survivre au delà de T i ) = P(survivre au delà de T i / survie jusqu'à T i-1 au moins). P(survie au delà de T i-1 ) S i = S i-1. s i Disposition pratique repérer tous les instants ou un événement s'est produit T i N i pv ev D i s i S i 0 6 0 0 0 1 1 1 6 0 0 1 5/6 5/6 1 5 0 1 0 1 5/6 3 4 0 0 1 3/4 15/24 4 3 1 1 0 1 15/24 5 1 0 1 0 1 15/24 Le taux de survie doit être complété par son écart-type dont le calcul n'est pas du ressort de cette introduction. En cas d'ex-aequo, toujours admettre que le pv ou le ev se placent après le décès. Voici la courbe de survie et le «listing» correspondant fournis par le logiciel SPSS. Survie globale 1.0 Méthode de Kaplan et Meier (N = 6).9.8 Su rvi e cu m ul ée.7.6.5.4.3.2.1 0.0 0 1 2 3 4 5 6 temps (jours, semaines, mois, année...) Survival Analysis for TEMPS Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 1.00 1.00.8333.1521 1 5 1.00.00 1 4 3.00 1.00.6250.2135 2 3 4.00.00 2 2 4.00 2.00 2 1 5.00.00 2 0 Premiers pas dans SPSS ; Louis AYZAC 94

Number of Cases: 6 Censored: 4 ( 66.67%) Events: 2 Méthode actuarielle La méthode diffère de celle de Kaplan et Meier : dans la méthode de Kaplan Meier, seuls les temps de participation des sujets décédés apportent de l'information. Dans la méthode actuarielle, les intervalles de temps sont définis a priori, la survie étant constante par intervalle. Les ev ne sont pas traités de la même façon dans les deux méthodes. Test du logrank Il est construit sous l'hypothèse nulle Ho suivante : les probabilités instantanées de décès sont les mêmes entre les deux groupes (pour tout T i pour lequel un décès est observé, la proportion de décès attendus est la même dans 2 groupes). Ce test n'est pas adéquat en cas d'interaction du facteur étudié avec le temps. Références utilisées Estève J., Benhamou H., Raymond L. Méthodes statistiques en épidémiologie descriptive. Les Editions INSERM, PARIS, 1993 Laplanche A., Com-Cougué C., Flamant R. Méthodes statistiques appliquées à la recherche clinique. Collection Statistiques en biologie et en Médecine. Flammarion Médecine-Sciences, 1987, PARIS. Premiers pas dans SPSS ; Louis AYZAC 95

APPLICATIONS Le fichier de travail renferme des informations sur des ampoules électriques pour lesquelles on voudrait analyser leur durée de vie. debut ddn etat machine 1 01.03.95 02.03.95 2.00 2.00 2 01.02.95 03-02.95 2.00 3.00 3 01.03.95 15.03.95 2.00 3.00 4 01.02.95 01.03.95 2.00 3.00 5 01.02.95 06.04.95 2.00 2.00 6 01.03.95 12.05.95 2.00 2.00 7 01.01.95 15.03.95 2.00 2.00 8 01.03.95 26.06.95 1.00 1.00 9 01.03.95 26,06.95 1.00 1.00 10 01.03.95 26.06.95 1.00 3.00 11 01.03.95 26.06.95 1.00 4.00 12 01.02.95 15-05,95 1.00 3.00 13 01.02.95 16-05.95 2.00 1.00 14 01.01.95 2l.04.95 2.00 1.00 15 01.02.95 26.06.95 1.00 2.00 16 01.02.95 26.06.95 1.00 4.00 17 01.01.95 26.06.95 1.00 2.00 18 01.01.95 26.06.95 1.00 2.00 19 01.01.95 02.06.95 1.00 1.00 20 01.01.95 30.05.95 2.00 1.00 21 01.01.95 26.06.95 1.00 4.00 1 étape : Fixez une date de point qui permette de perdre le moins d informations, en sachant que l état 1 correspond à une ampoule fonctionnant à la date de dernières nouvelles (ddn) et l etat 2 à une ampoule mise hors service à la date ddn. A partir du fichier de données "tab7.sav", calculez les nouvelles variables ddp (date de point), durée (durée de survie), détat (état à la date de point), pdv (perdu de vue). Comment calculer de nouvelles variables? A partir du menu, choisissez Transformer Calculer.. Premiers pas dans SPSS ; Louis AYZAC 96

Variable destination. Nom de la variable qui reçoit la valeur calculée. Expression numérique. Expression utilisée pour calculer la valeur de la variable destination. Pour la date de point, utilisez la fonction "Date.DMY (d, m, y)". Vous pouvez utiliser des expressions conditionnelles pour appliquer certains codages aux sous-ensembles d'observations sélectionnés. Pour spécifier une expression conditionnelle, cliquez sur Si... Vous avez le choix entre les options suivantes Inclure toutes les observations. Les valeurs sont calculées pour toutes les observations. Inclure si l'observation remplit la condition. Entrez l'expression conditionnelle dans la zone de texte. Remarque : Pour travailler plus rapidement, utilisez la fenêtre de syntaxe et entrez toutes les instructions nécessaires au calcul des trois variables!! 2 étape : Déterminez la table de survie de Kaplan-Meier basée sur toutes les observations de notre fichier. Comment obtenir une analyse de survie de Kaplan-Meier? A partir du menu, choisissez Analyse Survie Kaplan-Meier... Durée. Sélectionnez une variable numérique indiquant combien de temps chaque individu a survécu (données non censurées) ou a été observé (données censurées). Cette variable peut être mesurée dans n'importe quelle unité de temps. SPSS exclut de l'analyse les individus auxquels est associée une durée négative. Premiers pas dans SPSS ; Louis AYZAC 97

Etat. Sélectionnez une variable numérique ou chaîne courte dont une ou plusieurs valeurs indiquent si l'événement s'est produit. Vous devez alors spécifier les codes qui identifient les données non censurées. Critère. Par défaut, l'analyse traite tous les individus du fichier courant. Pour sortir des courbes de survie par sous-groupes, il faut sélectionner une variable numérique ou chaîne courte dont les valeurs définissent deux ou plusieurs sous-groupes. Définir l'événement pour la variable d'état Pour spécifier quelle(s) valeur(s) de la variable d'état identifie(nt) l'événement, cliquez sur: Définir l'événement... Une ou plusieurs valeurs peuvent indiquer que l'événement s'est produit. Les individus dont la valeur de la variable d'état n'est pas manquante sont traitées. Valeur unique. Entrez une seule valeur d'identification. Intervalle de valeurs. Il faut que la variable soit numérique. Entrez la plus petite et la plus grande valeur de l'intervalle. Liste de valeurs. Sélectionnez des valeurs en les ajoutant au fur et à mesure. 3 étape : Enregistrez dans votre fichier de données les probabilités de survie cumulées,les écarts type associés et donnez une représentation graphique des groupes de survie. Comment sauver de nouvelles variables? Pour sauvegarder des variables de survie, cliquez sur Enregistrer... Vous pouvez sauver une ou plusieurs variables suivantes Survie. Estimateur de la probabilité de survie cumulée. Ecart type de survie. Ecart type de l'estimateur cumulé de survie. Hasard. Estimateur de la fonction cumulée de hasard. Fréquence cumulée. Fréquence cumulée quand les individus sortent de leur temps de survie. Premiers pas dans SPSS ; Louis AYZAC 98

Options Pour obtenir d'autres statistiques et des graphes, cliquez sur Options... Statistiques. Les statistiques sont calculées pour chaque combinaison de niveaux de facteur et de strates. Vous pouvez choisir une ou plusieurs st,-e'.@;tiques. Graphes. Si vous avez une variable de stratification, un graphe sera produit pour chaque strate. Pour obtei'n'r les courbes de survie des différents niveaux de facteur, choisissez Survie. 4 étape : Comparez les fonctions de survie des ampoules des quatre groupes de machines. Comment comparer des niveaux de facteurs? Si vous avez une variable correspondant à un critère, vous pouvez obtenir des tests de comparaison des fonctions de survie pour différents niveaux du facteur. Cliquez sur: Comparer les niveaux.. Tests statistiques. Vous pouvez choisir un ou plusieurs tests d'égalité des fonctions de survie pour les niveaux d'un facteur. Mantel-Cox. Test de Mantel-Cox (Log rank). Ce test donne un poids égal à toutes les observations. Breslow. Test de Breslow (Gehan). Ce test donne un poids en ti (temps de décès) correspondant au nombre total de sujets exposés au risque en ti. Ainsi les décès précoces ont un poids plus élevé que les décès tardifs dans la comparaison. Tarone-Ware. Test de Tarone-Ware. Ce test donne un poids en ti correspondant à la racine carrée du nombre total de sujets exposés au risque en ti. Premiers pas dans SPSS ; Louis AYZAC 99

Pour des tests de comparaisons par niveaux de facteur, vous pouvez choisir de comparer tous les niveaux simultanément ou par paires. Vous pouvez obtenir des résultats sur l'ensemble des strates ou bien des tests séparés pour chaque strate. Sur l'ensemble des strates. Comparaison des niveaux de facteur sur un simple test. Pour chaque strate. Tests de comparaison des différents niveaux de facteurs pour chaque strate. Appariés sur les strates. Comparaison de chaque paire distincte de niveaux de facteur. Appariés pour chaque strate. Comparaison de chaque paire distincte de niveaux de facteur pour chaque strate. Premiers pas dans SPSS ; Louis AYZAC 100