Les limites des tests usuels dans les analyses diagnostiques

Documents pareils
Principe d un test statistique

Evalua&on tests diagnos&ques. Arnaud Fontanet

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Analyse de la variance Comparaison de plusieurs moyennes

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Détection et prise en charge de la résistance aux antirétroviraux

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

DASES Réseau tuberculose 10 janvier 2006

Diagnostic des Hépatites virales B et C. P. Trimoulet Laboratoire de Virologie, CHU de Bordeaux

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Cas clinique Enquête autour d un cas IDR vs IGRA Pr Emmanuel Bergot

«Cours Statistique et logiciel R»

Estimation et tests statistiques, TD 5. Solutions

EVALUATION DES TESTS DE DIAGNOSTIC. Vray M Institut Pasteur 1

Quantification de l AgHBs Pouquoi? Quand?

Biostatistiques : Petits effectifs

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Résolution d équations non linéaires

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Cours de Tests paramétriques

Probabilités conditionnelles Loi binomiale

TESTS D'HYPOTHESES Etude d'un exemple

Calculabilité Cours 3 : Problèmes non-calculables.

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Infiltrats pulmonaires chez l immunodéprimé. Stanislas FAGUER DESC Réanimation médicale septembre 2009

Transmission d informations sur le réseau électrique

Probabilités III Introduction à l évaluation d options

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Comparaison de fonctions Développements limités. Chapitre 10

MONITORING PÉRI-OPÉRATOIRE DE L'ISCHÉMIE CARDIAQUE. Dary Croft 9 mai 2013

CONTROVERSE : IDR OU QUANTIFERON LORS D'UN CONTAGE EN EHPAD?

Mulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2),

INF6304 Interfaces Intelligentes

choisir H 1 quand H 0 est vraie - fausse alarme

Lecture critique et pratique de la médecine

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Correction du baccalauréat STMG Polynésie 17 juin 2014

Interprétation et signification d un test IGRA en pratique quotidienne

Construction d un cercle tangent à deux cercles donnés.

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Evaluation des coûts de dépistage d Entérocoques Résistants aux Glycopeptides : Résultats préliminaires

23. Interprétation clinique des mesures de l effet traitement

CLINIMIX AVIS DE LA COMMISSION DE LA TRANSPARENCE

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Dérivation : Résumé de cours et méthodes

La classification automatique de données quantitatives

Compliance (syn. Adhérence - Observance) IFMT-MS-Sémin.Médict.Nov.05 1

Équivalence et Non-infériorité

Biométrie foetale. Comité éditorial pédagogique de l'uvmaf. Date de création du document 01/ Support de Cours (Version PDF) -

Introduction au Data-Mining

UNIVERSITE DE TOULON UFR FACULTE DE DROIT REGLEMENT D EXAMEN ANNEE 2012/2017 LICENCE DROIT MENTION DROIT GENERAL

Sida : «Avant d arrêter le préservatif, faites le test»

Calculs de probabilités conditionelles

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Nouveaux anticoagulants oraux (NOAC)

Ordonnance collective

Apport de la biologie moléculaire au diagnostic des parasitoses

HENDRICH FALL RISK MODEL (HFRM)

DÉFINITION ET INSCRIPTION DE LA PRATIQUE AVANCÉE DANS LE PAYSAGE SUISSE DES SOINS INFIRMIERS

Probabilités sur un univers fini

Continuité et dérivabilité d une fonction

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

Introduction à la Statistique Inférentielle

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

Ordonnance du DFI sur les prestations dans l assurance obligatoire des soins en cas de maladie

Votre Réseau est-il prêt?

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Correction du baccalauréat ES/L Métropole 20 juin 2014

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

La simulation probabiliste avec Excel

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Présentation BAI -CITC

Actualités IRM dans la SEP Thomas Tourdias 1, 2

Calcul fonctionnel holomorphe dans les algèbres de Banach

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Polyarthrite rhumatoïde et biologie

Un code-barre sur la tête?

Simulation de variables aléatoires

Traitement de l insuffisance rénale chronique terminale: Place de la greffe de donneur vivant

Relation entre deux variables : estimation de la corrélation linéaire

ROYAUME DU MAROC. Ministère de l Eductaion Nationale, de l Enseignement Supérieur de la Formation des Cadres et de la Recherche Scientifique

«Les lombalgies chroniques communes à la consultation de rhumatologie du CHU de Fès»

Lois de probabilité. Anita Burgun

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Transplantation pulmonaire et mucoviscidose. Optimiser la prise en charge médicale

Limites finies en un point

Introduction au Data Mining et à l apprentissage statistique

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Cours de méthodes de scoring

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Algorithmes d'apprentissage

Transcription:

Les limites des tests usuels dans les analyses diagnostiques Yohann.Foucher@univ-nantes.fr Equipe d Accueil 4275 "Biostatistique, recherche clinique et mesures subjectives en santé", Université de Nantes Odontologie - Cours #8 1 / 34

Plan 1. 2. 3. 4. 5. 2 / 34

Plan 1. 2. 3. 4. 5. 3 / 34

Evaluer si un test binaire X = {0; 1} permet de discriminer 2 groupes Réflexe : test du χ 2 - comparaison de proportions. X A : v.a. binaire dans la population P A de proportion π A. On observe un échantillon de taille N A {x A,1,..., x A,NA }. X B : v.a. binaire dans la population P B de proportion π B. On observe un échantillon de taille N B {x B,1,..., x B,NB }. Choix des hypothèses : H 0 : π A = π B H 1 : π A π B Statistique de test : χ 2 exp = i (c i o i ) 2 c i χ 2 1 ddl 4 / 34

Evaluer si un marqueur continu X permet de discriminer 2 groupes Réflexe : test de Student - comparaison des moyennes. X A : v.a. continue dans la population P A de moyenne µ A. On observe un échantillon de taille N A {x A,1,..., x A,NA }. X B : v.a. continue dans la population P B de moyenne µ B. On observe un échantillon de taille N B {x B,1,..., x B,NB }. Choix des hypothèses : H 0 : µ A = µ B H 1 : µ A µ B Statistique de test : U = X A X B N (0, 1) σa 2/N A + σb 2/N B 5 / 34

Interprétations Si la probabilité critique est petite : la probabilité que la différence observée entre les deux échantillons soit due au hasard (fluctuation d échantillonnage) est faible. Si la probabilité critique est grande : la probabilité que la différence observée entre les deux échantillons soit due au hasard est grande. Cela ne signifie pas que X est bon marqueur diagnostique 6 / 34

Plan 1. 2. 3. 4. 5. 7 / 34

Probabilité conditionnelle Notion très courante en médecine : ex : Probabilité d une maladie en fonction d un signe clinique. Notion très courante en bioinformatique : ex : Probabilité d un certain phénotype en fonction de l expression d un marqueur. Pr(A B) : Probabilité de l événement A conditionnellement à la réalisation de l événement B Proportion de la caractéristique A parmi tous les individus ayant la caractéristique B. ex : Proportion de malades parmi tous les sujets ayant ce signe clinique. Définition de la probabilité conditionnelle : Pr(A et B) = Pr(A B)Pr(B) ex : La probabilité d être malade et de présenter le signe clinique est égale à la probabilité d être malade sachant que le signe est présent multipliée par la probabilité que le signe soit présent. 8 / 34

Indépendance Si A ne dépend pas de B, alors : Pr(A B) = Pr(A B) = Pr(A) ex : Si être malade ne dépend pas du signe clinique, la probabilité d être malade sachant que le signe est présent est égale à la probabilité d être malade sachant que le signe clinique est absent. Ces sont simplement égales à la probabilité d être malade. 9 / 34

Théorème des totales Pr(A) = Pr(A et B) + Pr(A et B) ex : La proportion d individus malades est égale à la proportion d individus malades avec un signe clinique plus la proportion d individus malades sans signe clinique. 10 / 34

Les erreurs Soit N sujets répartis de la manière suivante : Test diagnostique T + T Total Statut M + a b a + b de référence M c d c + d Total a + c b + d N Le statut de référence est défini par le gold standard. Deux types d erreurs : b faux négatifs : sujets ayant un test négatif alors qu ils sont malades. c faux positifs : sujets ayant un test positif alors qu ils sont sains. Prévalence de la maladie : Pr(M + ) = (a + b)/n 11 / 34

Les tests de dépistage Dépister une maladie non apparente cliniquement dans une population où la prévalence est généralement faible. Priorité : Eviter de laisser repartir un individu alors qu il est malade. Réduire le nombre de faux négatifs, même si plus de faux positifs. Possibilité de refaire des examens pour confirmer/infirmer les tests positifs. 12 / 34

Les tests Diagnostiquer une maladie suspectée avec une prévalence assez élevée. Priorité : Eviter de traiter un individu alors qu il est sain. Réduire le nombre de faux positifs, même si plus de faux négatifs. Possibilité de refaire des examens pour confirmer/infirmer les tests négatifs. 13 / 34

Plan 1. 2. 3. 4. 5. 14 / 34

Notions de sensibilité Test diagnostique T + T Total Statut M + a b a + b de référence M c d c + d Total a + c b + d N Capacité du test à bien détecter les malades Probabilité d un test positif sachant que le sujet est malade Proportion de tests positifs chez les malades Se = Pr(T + M + ) = a/(a + b) Se diminue avec l augmentation de b, le nombre de faux négatifs Se parfaite et égale à 100% si b = 0. 15 / 34

Notions de spécificité Test diagnostique T + T Total Statut M + a b a + b de référence M c d c + d Total a + c b + d N Capacité du test à bien détecter les non-malades Probabilité d un test négatif sachant que le sujet est sain Proportion de tests négatifs chez les non-malades Sp = Pr(T M ) = d/(c + d) Sp diminue avec l augmentation de c, le nombre de faux positifs Sp parfaite et égale à 100% si c = 0. 16 / 34

Exemple Une clinique londonienne a comparé les performances de OraQuick R (test oral non-invasif) à celles du test de référence (gold standard) sur 820 sujets présentant un risque élevé d infection à VIH/sida. Les résultats ont été les suivants : OraQuick T + T Total Statut VIH + 44 3 47 de référence VIH 1 772 773 Total 45 775 820 Prévalence observée : P(VIH + ) = 47/820 = 5, 7% Contexte d un test diagnostique. An evaluation of the performance of OraQuick ADVANCE Rapid HIV-1/2 Test in a high-risk population attending genitourinary medicine clinics in East London, UK ; J Zelin, et al. ; International Journal of STD & AIDS. 2008 ; 19 :665-667. 17 / 34

Application OraQuick T + T Total Statut VIH + 44 3 47 de référence VIH 1 772 773 Total 45 775 820 Se = 44/47 = 93, 6% ; Sp = 772/773 = 99, 9% Très bon test diagnostique (à relativiser selon le contexte). Parmi les sujets malades, 93, 6% ont un test positif Parmi les sujets non-malades, 99, 9% ont un test négatif Problème En pratique, la présence ou l absence de la maladie n est pas connue. La prise de décision dépend du résultat du test. Quelles sont les d erreurs en fonction du résultat du test? 18 / 34

Valeur prédictive positive Test diagnostique T + T Total Statut M + a b a + b de référence M c d c + d Total a + c b + d N Probabilité qu un sujet soit malade sachant que le test est positif Proportion de vrais malades parmi les sujets ayant un test positif VPP = Pr(M + T + ) = a/(a + c) VPP diminue avec l augmentation de c, le nombre de faux positifs VPP parfaite et égale à 100% si c = 0. 19 / 34

Valeur prédictive négative Test diagnostique T + T Total Statut M + a b a + b de référence M c d c + d Total a + c b + d N Probabilité qu un sujet ne soit pas malade sachant que le test est négatif Proportion de vrais sains parmi les sujets ayant un test négatif VPN = Pr(M T ) = d/(b + d) VPN diminue avec l augmentation de b, le nombre de faux négatifs VPN parfaite et égale à 100% si b = 0. 20 / 34

Application OraQuick T + T Total Statut VIH + 44 3 47 de référence VIH 1 772 773 Total 45 775 820 VPP = 44/45 = 97, 8% ; VPN = 772/775 = 99, 6% Dans cette population : 97, 8% des sujets ayant un test positif sont réellement malades. 99, 6% des sujets ayant un test négatif sont réellement sains. Problème Les valeurs prédictives dépendent de la prévalence de la maladie dans la population d étude : Pr(M + ). 21 / 34

Relation entre la VPP et la prévalence VPP = Pr(M + T + ) / = Pr(M + et T + ) Pr(T + ) / = Pr(T + M + )Pr(M + ) {Pr(T + et M + ) + Pr(T + et M )} = Pr(T + M + )Pr(M + ) / {Pr(T + M + )Pr(M + ) + Pr(T + M )Pr(M )} (Théorème de Bayes) d où / VPP = Se Pr(M + ) {Se Pr(M + ) + (1 Sp) (1 Pr(M + ))} 22 / 34

Relation entre la VPN et la prévalence VPN = Pr(M T ) / = Pr(M et T ) Pr(T ) / = Pr(T M )Pr(M ) {Pr(T et M + ) + Pr(T et M )} = Pr(T M )Pr(M ) / {Pr(T M + )Pr(M + ) + Pr(T M )Pr(M )} (Théorème de Bayes) d où / VPN = Sp (1 Pr(M + )) {(1 Se) Pr(M + ) + Sp (1 Pr(M + ))} 23 / 34

Application Dans l étude londonienne, la prévalence était de 5, 7%. Doit-on conseiller ce test pour une stratégie de dépistage de masse en France? (On suppose une prévalence égale à 5 pour 10000 français). VPP = 0, 936 0, 0005/{0, 936 0, 0005+(1 0, 999) (1 0, 0005)} = 26, 6% VPN = 0, 999 (1 0, 0005)/{(1 0, 936) 0, 0005 + 0, 999 (1 0, 0005)} 100% Etude Londonnienne Dépistage en France Se 93,6% 93,6% Sp 99,9% 99,9% Pr(M + ) 0,057 0,0005 VPP 97,8% 26,6% VPN 99,6% 100% Si le test est négatif, on a la quasi-certitude de l absence de maladie. Si le test est positif, des examens complémentaires sont nécessaires. OraQuick semble constituer un bon test de dépistage. 24 / 34

Plan 1. 2. 3. 4. 5. 25 / 34

Courbes ROC Soit X la valeur du marqueur et G le groupe à diagnostiquer ex : G = 1 si malade et G = 0 sinon Les patients sont à risque si X est supérieur à un seuil c. Sensibilité : SE = P(X > c G = 1). ex : Proportion de tests positifs chez les patients malades. Les patients ne sont pas à risque si X est inférieur à c. Spécificité : SP = P(X c D = 0). ex : Proportion de tests négatifs chez les patients non-malades. Il éxiste un test diagnostique parfait si il éxiste une valeur de c pour laquelle on a SE = SP = 1. Courbes ROC : pour tous les seuils c possibles, on calcul 1 SP et SP. 26 / 34

Courbes ROC 27 / 34

Courbes ROC Sensibilité 0.0 0.2 0.4 0.6 0.8 1.0 0.5 < AUC < 1.0 AUC = 0.5 AUC =1.0 0.0 0.2 0.4 0.6 0.8 1.0 1 Specificité 28 / 34

Grille d évaluation (relative) Si AUC = 0,5 : Aucune discrimination Si 0,7 AUC < 0,8 : Discrimination acceptable Si 0,8 AUC < 0,9 : Discrimination excellente Si AUC 0,9 : Discrimination hors du commun 29 / 34

Application : Tbet en transplantation rénale Objectif : Evaluer si Tbet est un marqueur discriminant de patients transplantés rénaux stables et de patients diagnostiqués avec un rejet chronique humorale actif. L échantillon est composé de 176 patients 20 patients CAMR 156 stables Les valeurs observées sont comprises entre 0,07 et 9,64. La moyenne sur tout l échantillon est de 1,69 1,08 chez les patients CAMR 1,77 chez les stables La distribution de Tbet semble différente entre les patients CAMR et les stables (p=0,0116, test de Mann-Withney). Conclure que Tbet est un marqueur du rejet serait une erreur.. J. Asthon-Chess, et al. Projet Genhomme. PHRC 2003. 30 / 34

Application : Tbet en transplantation rénale True Positive Fraction (sensitivity) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 False Positive Fraction (1 specificity) 31 / 34

Application : Tbet en transplantation rénale L AUC est égal à 0,67 (mauvaise discrimination). L intervalle de confiance de bootstrap à 95% de l AUC est compris entre 0,55 et 0,79. 32 / 34

Plan 1. 2. 3. 4. 5. 33 / 34

La probabilité critique représente uniquement la probabilité de se tromper lorsqu on conclu à une différence (rejet de H 0 ). Ne pas sur-interpréter cette quantité On parle généralement de "corrélation", "lien", "association", etc. Méthodes spécifiques pour les analyses diagnostiques Marqueur binaire : SE, SP, VPP, VPN. Marqueur continu : courbes ROC. Nécessité d échantillons ou d algorithmes de validation lorsque le marqueur/test est construit à partir des données. 34 / 34