Cours n 4 Marqueur diagnostique

Documents pareils
Evalua&on tests diagnos&ques. Arnaud Fontanet

EVALUATION DES TESTS DE DIAGNOSTIC. Vray M Institut Pasteur 1

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

La classification automatique de données quantitatives

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Biométrie foetale. Comité éditorial pédagogique de l'uvmaf. Date de création du document 01/ Support de Cours (Version PDF) -

Chapitre 3. Les distributions à deux variables

I- Définitions des signaux.

PROGRAMME (Susceptible de modifications)

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

LISTE DES ACTES ET PRESTATIONS - AFFECTION DE LONGUE DURÉE HÉPATITE CHRONIQUE B

Compte rendu d hospitalisation hépatite C. À partir de la IIème année MG, IIIème années MD et Pharmacie

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

2.4 Représentation graphique, tableau de Karnaugh

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

INF6304 Interfaces Intelligentes

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Guide du parcours de soins Titre ACTES ET PRESTATIONS AFFECTION DE LONGUE DURÉE. Hépatite chronique B

BERTHIER E, CHRISTIANO M, PHILIPPE M O, IEHL J, TATARU N, DECAVEL P, VUILLIER F, ELISEEF A, MOULIN T. Introduction (1). Contexte de l étude

Sujets présentés par le Professeur Olivier CUSSENOT

ÉTAT DES LIEUX. Niveau de preuve et gradation des recommandations de bonne pratique

Les soins infirmiers en oncologie : une carrière faite pour vous! Nom de la Présentatrice et section de l'acio

Les petis signes de T21 : comment ça marche et à quoi ça sert? Christophe Vayssière (Toulouse) DIU d echographie 2011

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Complément d information concernant la fiche de concordance

Fonctions homographiques

Algèbre binaire et Circuits logiques ( )

Un nouveau test sanguin performant pour le diagnostic non-invasif de steatohépatite non alcoolique chez les patients avec une NAFLD

Bases de données Outils de gestion

STRICTEMENT CONFIDENTIEL

Bonne lecture!! et si vous souhaitez consulter le document de l AFEF dans son intégralité, c est ici

IBM SPSS Direct Marketing 21

Cours d Analyse. Fonctions de plusieurs variables

ELEC2753 Electrotechnique examen du 11/06/2012

I - CLASSIFICATION DU DIABETE SUCRE

ECOLE SUPERIEURE DE L EDUCATION NATIONALE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Le dépistage du cancer de la prostate. une décision qui VOUS appartient!

Cancer bronchique primitif: données épidémiologiques récentes

Faut-il encore modifier nos pratiques en 2013?

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

LIGNES DIRECTRICES CLINIQUES TOUT AU LONG DU CONTINUUM DE SOINS : Objectif de ce chapitre. 6.1 Introduction 86

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Bases de données documentaires et distribuées Cours NFE04

Exemples d utilisation de G2D à l oral de Centrale

LA MESURE DE PRESSION PRINCIPE DE BASE

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Quantification de l AgHBs Pouquoi? Quand?

Relation entre deux variables : estimation de la corrélation linéaire

T500 DUAlTACH. JAQUET T500 DualTach Instrument de mesure et de surveillance équipé de 2 entrées fréquence TACHYMETRE 2 CANAUX

Résolution d équations non linéaires

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal

Les tests génétiques à des fins médicales

Y a-t-il une place pour un vaccin thérapeutique contre l hépatite B? H. Fontaine, Unité d Hépatologie Médicale, Hôpital Cochin

Probabilités sur un univers fini

FORMULAIRE DE STATISTIQUES

Chapitre 2/ La fonction de consommation et la fonction d épargne

L obésité et le diabète de type 2 en France : un défi pour la prochaine décennie. DANIEL RIGAUD CHU de Dijon

QUELLES SONT LES OPTIONS DU TRAITEMENT DE LA LMC?

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Qu est-ce qu une probabilité?

GUIDE DE LECTURE CRITIQUE D'UN ARTICLE MEDICAL ORIGINAL (LCA)

Exercice : la frontière des portefeuilles optimaux sans actif certain

Le don de moelle osseuse :

Application des courbes ROC à l analyse des facteurs pronostiques binaires

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Insuffisance cardiaque

Veille Opérationnelle Chapitre 5 Mesure de l efficacité des moyens de communication

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

DIPLÔME INTERUNIVERSITAIRE D ECHOGRAPHIE. Examen du Tronc Commun sous forme de QCM. Janvier h à 16 h

Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5

Dossier projet isn 2015 par Victor Gregoire

Cours de méthodes de scoring

L hépatite C pas compliqué! Véronique Lussier, M.D., F.R.C.P.C. Gastroentérologue Hôpital Honoré-Mercier 16 avril 2015

SYSTEMES LINEAIRES DU PREMIER ORDRE

Chapitre 5. Équilibre concurrentiel et bien-être

F.Benabadji Alger

Le contenu en CO2 du kwh électrique : Avantages comparés du contenu marginal et du contenu par usages sur la base de l historique.

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

GHUPC Projet de transformation du site Hôtel Dieu. Pr S CHAUSSADE, Dr I. FERRAND

1. Les types d enquêtes

CONTROVERSE : IDR OU QUANTIFERON LORS D'UN CONTAGE EN EHPAD?

La politique européenne de la Mutualité Française en matière de dispositifs médicaux

Mesure du surendettement en Europe

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Recherche documentaire et autoformation. Lecture critique d un article médical. Recommandations pour la pratique. Les maladies orphelines

Conversion d un entier. Méthode par soustraction

WARRANTS TURBOS CERTIFICATS. Les Warrants. Découvrir et apprendre à maîtriser l effet de levier

Compte-rendu d examen anatomo-pathologique - hépatite chronique

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

Transcription:

UE11 Biomédecine Quantitative Jeudi 20 Février 2014 de 13h30 à 15h30 Pr Lambert Ronéotypeur : Mathilde Berti Ronéolecteur : Elsa Manzi Cours n 4 Marqueur diagnostique Introduction La reproductibilité La concordance La statistique kappa Coefficient de corrélation intra-classe Le diagramme de Bland et Altman Les différentes mesures de performance d un test diagnostic Sensibilité et spécificité : mesures de validité intrinsèque Valeurs prédictives

Lien avec la prévalence Lien entre mesures de validité intrinsèques et valeurs prédictives Rapport de vraisemblance : «Likelihood ratio» Cas des marqueurs diagnostic continus Notion de seuil de valeur La courbe ROC L aire sous la courbe AUC Spectrum effect Impact thérapeutique Introduction Le but de ce cours sera de comprendre comment on peut évaluer un marqueur diagnostique. Les différentes propriétés des marqueurs sont : Reproductibilité : est-ce qu un test réalisé plusieurs fois donne le même résultat? Précision diagnostique : à quel point se trompe-t-on dans le résultat? Impact diagnostique : les conséquences de la positivité du test, ou se situe le test dans la chaine du diagnostic? Impact thérapeutique du test : qu est-ce que le résultat du test change sur le traitement? Exemples : test de grossesse, PSA dans l adénocarcinome prostatique, des scores cliniques, marqueurs de biologie moléculaire dans les leucémies (anomalies dans le caryotype des GB). Mais aussi des marqueurs structurels (échographie, scanner). Il y a différentes manières d évaluer un test diagnostic : Etude transversale pour l étude de la reproductibilité

Etude de cohorte Etude cas témoin Essai contrôlé randomisé pour l impact thérapeutique d un test La reproductibilité La reproductibilité nous permet de savoir si un test réalisé à deux instants différents nous donnera le même résultat. Il existe plusieurs éléments de reproductibilité : Intra observateur : un lecteur lisant la même radio à 2 moments différents a-t-il la même interprétation? Inter observateur : plusieurs lecteurs lisant la même radio ont-ils la même interprétation? Ne préjuge pas de la vérité. Un test reproductible n est pas forcément un bon test. Les différentes mesures pour évaluer de la reproductibilité sont : La concordance Le coefficient kappa Le coefficient de corrélation intra-classe Le diagramme de Bland et Altman La concordance La concordance est un résultat diagnostic binaire concordant entre deux examinateurs. Ex. 100 radios ont été réalisées à 100 patients et l on demande à 2 radiologues de les interpréter (ex. présence d adénopathies ou non, ) afin de savoir si leur interprétation est reproductible. Plusieurs questions se posent alors : Relation entre la réponse faite par le radiologue A et celle faite par le radiologue B? Est-ce que les radiologues détectent la même proportion de signes? Est-ce que les radiologues donnent quelque chose de concordant? Test du Chi2 Test de Mac Nemar (données appariés) Proportion d agrément c est-à-dire sur les 100 radios vues combien de fois les radiologues sont d accord entre eux. La méthode la plus appropriée pour définir la concordance. Il existe cependant un problème à cette méthode : il peut y avoir de la concordance due au hasard. La proportion d agrément explicable par le seul hasard est de 50%. Donc pour interpréter la concordance il faut tenir compte de cela. Ce qui nous intéresse est le pourcentage de concordance qui existe en plus du pourcentage de concordance dû au hasard. On utilise pour cela la statistique kappa. La statistique kappa C'est la proportion d'agrément corrigée du hasard rapporté au maximum observable

La statistique kappa varie de -1 à 1 : Accord Kappa Excellent 0,81 Bon 0,80-0,61 Modéré 0,60-0,41 Médiocre 0,40-0,21 Mauvais 0,20-0,0 Très mauvais < 0,0 1 : accord parfait 0 : hasard -1 : désaccord parfait Résumé statistique kappa : Statistique corrigée de l effet dû au hasard Statistique applicable indépendamment du nombre de niveaux de l échelle Possibilité de prendre en compte le degré de désaccord Extension au cas où le nombre de cotateur est supérieur à 2 Extension au cas où les cotateurs ne sont pas les même d un sujet à l autre Extension au cas où le nombre de cotateurs varie d un sujet à l autre Le paradoxe du kappa : La statistique du kappa n est pas juste liée à la concordance. Le niveau du kappa ne peut être interprété sans connaitre les distributions marginales. Coefficient de corrélation intra-classe Ce coefficient est utilisé pour des données continues. Le coefficient de corrélation intra-classe varie entre 0 et 1 Plus la variabilité intra-sujet est faible par rapport à la variabilité entre sujets, plus la corrélation intra-classe est élevée.

Le test à zéro est sans le moindre intérêt Son estimation avec intervalle de confiance peut être obtenue par analyse de variance ou maximum de vraisemblance Applicable à plus de deux mesures On fait un modèle de régression linéaire pour prédire que vaut la mesure obtenue sur le sujet i par le cotateur j. On cherche un effet cotateur proche de 0. Le diagramme de Bland et Altman Ce diagramme représente la moyenne des 2 appareils en fonction de la différence des 2 appareils. Ce diagramme nous permet de voir : Si les mesures sont très reproductibles les points seront autour de 0, absence de différence entre les 2 mesures. Les limites d agrément : ou se trouve plus de 95% des points, et l on regarde si ces limites sont acceptables. Comment la différence évolue en fonction de la valeur moyenne : en fonction de la forme de la dispersion des points. Les différentes mesures de performance d un test diagnostic Il y a différentes mesures de performance des tests : Sensibilité, Spécificité

VPP et VPN Rapport de vraisemblance positif et négatif Courbe ROC et AUC Taux de bien classés est une moyenne de sensibilité et de spécificité pondérée par la prévalence Lorsqu on trouve un nouveau marqueur, on va évaluer sa performance grâce à un examen de référence, le Gold Standard ainsi que le nouveau test de référence. On définit les : Malade Sain Test + VP FP Test - FN VN Vrais positifs (VP): personnes malades pour un test positif Faux positifs (FP): personnes saines pour un test positif Vrais négatifs (VN): personnes saines pour un test négatif Faux négatifs (FN) : personnes malades pour un test négatif Sensibilité et spécificité : mesures de validité intrinsèque Les premières mesures de capacité des tests sont la sensibilité et la spécificité. Ces mesures sont indépendantes de la prévalence de la maladie mais dépendante de la population d étude. Sensibilité (Se): Capacité du test à identifier correctement les individus malades ou probabilité que le test soit positif sachant qu on est malade Spécificité (Sp): Capacité du test à identifier correctement les individus sains ou probabilité que le test soit négatif sachant qu on est sain Valeurs prédictives Ces valeurs sont plus intéressantes que la sensibilité et la spécificité pour le médecin, mais ces valeurs ne sont pas intrinsèques au test. Valeur prédictive positive (VPP): probabilité qu un individu diagnostiqué malade le soit réellement. «Sachant que le test est positif, quelle est la probabilité d être malade?» Valeur prédictive négative (VPN): probabilité qu un individu diagnostiqué sain le soit réellement. «sachant que le test est négatif, quelle est la probabilité d être sain?»

Intérêt: correspond à ce qu apporte le test en pratique. Inconvénient : dépend de la prévalence de la maladie et varie donc en fonction de l expérience. Lien avec la prévalence Pour calculer le lien avec la prévalence : Sensibilité = A / (A+C) se calcule dans la colonne des malades Spécificité = D / (D+B) se calcule dans la colonne des sains A l inverse, la VPP et VPN se calcule chez les malades et les sains. VPP = A / (A+B) VPN = D / (C+D) Malade Sain Test+ 2A B Test- 2C D Si la prévalence de la maladie change, VPP et VPN sont modifiées. p(m) augmente VPP augmente et VPN diminue p(m) diminue VPP diminue et VPN augmente VPP = 2A / 2A + B VPN = D / 2C + D Exemple : un test diagnostic de l appendicite qui serait positif pour tous les patients. La Se=100% (tous les malades sont diagnostiqués malades) et la Sp=0% (tous les non malades sont diagnostiqués malades), alors la VPP est égale à la prévalence.

Lien entre mesures de validité intrinsèques et valeurs prédictives Selon le théorème de Bayes, On va utiliser ce théorème pour écrire la VPP en fonction de la prévalence p(t+/m) est la sensibilité p(m) est la prévalence de la maladie On aura donc : Rapport de vraisemblance : «Likelihood ratio» Ce rapport compare la probabilité du résultat d un test chez les malades et non malades. Rapport de vraisemblance positif : C est le rapport entre la probabilité de présenter un test positif quand la personne est malade et la probabilité de présenter un test positif quand la personne n'est pas malade. Un test positif est obtenu (RV+) fois plus souvent chez les malades que chez les sains. Rapport de vraisemblance négatif : C est le rapport entre la probabilité de présenter un test négatif quand la personne est malade et la probabilité de présenter un test négatif quand la personne n'est pas malade. Un test négatif est obtenu (RV-) fois plus souvent chez les sains que chez les malades. Les avantages de ce test sont : Il ne dépend pas de la prévalence mais de la sensibilité et de la spécificité Il peut s interpréter en pratique clinique. Comment on va passer d une probabilité pré-test à une probabilité post-test?

Le raisonnement bayésien : les probabilités qu on mesure sont des résultats de ce qu on pense à priori avant de faire le test (probabilité pré-test) combinées aux résultats obtenus grâce au marqueur diagnostic. La combinaison de la probabilité pré-test et des résultats du marqueur donnera la probabilité post test. Donc, Probabilité pré-test: connaissances à priori sur le diagnostic de la maladie sur des arguments indépendants du marqueur diagnostic (cliniques, biologiques hors test considéré ). Probabilité post-test: après la prise en compte du résultat du test et des arguments à priori. LE NOMOGRAMME : Le médecin note la valeur qu il pense être la probabilité pré-test au vue de tous les arguments cliniques et de l histoire de la maladie. Il trace une droite rejoignant la valeur de la probabilité pré test et la valeur du rapport de vraisemblance dont l intersection avec la droite «post test probability» fournit la valeur de la probabilité post test. Meilleur est le test, plus le rapport de vraisemblance positif est elevé. Plus le rapport de vraisemblance négatif est proche de 0, plus le test est performant. Cas des marqueurs diagnostic continus Notion de seuil de valeur Ce qu on a vu là était applicable dans le cas de tests binaires. Cependant, la majorité des tests donne un résultat continu (ex= glycémie, TA). Le choix d un seuil (c) permet de passer d une variable quantitative à une variable qualitative. Si le résultat X > c alors le test est positif. Si le resultat X c alors le test est négatif.

Le choix du seuil est important. Situation idéale: La courbe à gauche : distribution de la variable parmi les non malades. Courbe à droite: distribution de la variable parmi les malades. Mais ce type de courbe n existe pas dans la réalité: les deux courbes se recouvrent. Plus les courbes se recouvrent, moins le test est utile. Plus les courbes s éloignent, plus le test est performant. La courbe ROC La courbe ROC: représente la sensibilité et la spécificité sur une seule courbe. En abscisses on a 1-Sp, et en ordonnées la Se. Plus la courbe est convexe, meilleur est le test.

Il y a 2 méthodes de choix de la valeur seuil du test : une approche assez «naïve» : On veut maximiser la sensibilité et la spécificité --> on prend le point le plus convexe de la courbe contextuel: en lien avec l objectif du marqueur diagnostic, on fait un compromis: Si on fait un dépistage (duquel on confirmera par la suite le diagnostic), alors on attendra une Se > Sp Si c est un test de confirmation de diagnostic alors on attendra une Sp > Se L aire sous la courbe AUC La surface sous la courbe ROC est l AUC. L aire maximale sous la courbe vaut 1: les malades ont tous des valeurs plus élevées que les non malades. L aire minimale sous la courbe vaut 0,5 (sur la diagonale): le malade a une chance sur deux d avoir une valeur plus élevée que les non malades. Dans ce cas, on «tire à pile ou face entre malades et non malades», le test n a donc pas d intérêt. Si l aire sous la courbe est inférieure à 0.5, il suffit d inverser le test (ce ne sont pas des valeurs trop élevées du marqueur testé qui signent une maladie mais des valeurs trop basses). Les courbes ROC permettent notamment de comparer deux tests : le meilleur est celui qui a l AUC la plus élevée. Spectrum effect La sensibilité et la spécificité sont des valeurs intrinsèques du test, dépendantes de la composition de la population et indépendantes de la prévalence de la maladie. La sensibilité et la spécificité sont dépendantes du spectre de la maladie c est-à-dire le stade de développement de la maladie. Exemple des tests non-invasifs de fibrose hépatique : Gold standard : PBH 5 stades de fibrose de F0 (pas de fibrose) à F5 (cirrhose) Souvent regroupé en fibrose significative ( F2) vs pas de fibrose significative (<F2)

Impact thérapeutique La prise en compte du biomarqueur dans la stratégie thérapeutique/diagnostique va-t-elle modifier le devenir du patient? On réalise des essais randomisés comparant les prises en charge avec et sans biomarqueur. FICHE UE11 COURS 4 - MARQUEUR DIAGNOSTIQUE Les différentes propriétés des marqueurs sont : Reproductibilité Précision diagnostique Impact diagnostique Impact thérapeutique du test La reproductibilité

Les différentes mesures pour évaluer de la reproductibilité sont : La concordance Le coefficient kappa Le coefficient de corrélation intra-classe Le diagramme de Bland et Altman La concordance La concordance est un résultat diagnostic binaire concordant entre deux examinateurs. Pour définir la concordance on utilise : la proportion d agrément. Ce qui nous intéresse est le pourcentage de concordance qui existe en plus du pourcentage de concordance dû au hasard. On utilise pour cela la statistique kappa. La statistique kappa C est l excès d agrément observé par rapport à l agrément dû au hasard rapporté à l excès d agrément maximum observé. Résumé statistique kappa : Statistique corrigée de l effet dû au hasard Statistique applicable indépendamment du nombre de niveaux de l échelle Possibilité de prendre en compte le degré de désaccord Extension au cas où le nombre de cotateur est supérieur à 2 Extension au cas où les cotateurs ne sont pas les même d un sujet à l autre Extension au cas où le nombre de cotateurs varie d un sujet à l autre Le paradoxe du kappa : La statistique du kappa n est pas juste liée à la concordance. Le niveau du kappa ne peut être interprété sans connaitre les distributions marginales Coefficient de corrélation intra-classe Il varie entre 0 et 1 Plus la variabilité intra-sujet est faible par rapport à la variabilité entre sujets, plus la corrélation intra-classe est élevée. Le test à zéro est sans le moindre intérêt Son estimation avec intervalle de confiance peut être obtenue par analyse de variance ou maximum de vraisemblance Applicable à plus de deux mesures Le diagramme de Bland et Altman Ce diagramme nous permet de voir : Le biais moyen Les limites d agrément La forme de la dispersion des points. Les différentes mesures de performance d un test diagnostic

Specifité et sensibilité Ces mesures sont indépendantes de la prévalence de la maladie mais dépendante de la population. Sensibilité : Capacité du test à identifier correctement les individus malades Spécificité : Capacité du test à identifier correctement les individus sains Valeurs prédictives Valeur prédictive positive (VPP): probabilité qu un individu diagnostiqué malade le soit réellement. Valeur prédictive négative (VPN): probabilité qu un individu diagnostiqué sain le soit réellement Lien avec la prévalence La sensibilité et la spécificité sont indépendantes de la prévalence. Quand la prévalence de la maladie augmente, la VPP augmente et la VPN diminue. Inversement, quand la prévalence diminue, la VPP diminue et la VPN augmente. VPP est égale à la prévalence. Lien entre mesures de validité intrinsèques et valeurs prédictives Rapport de vraisemblance : «Likelihood ratio» Ce rapport compare la probabilité du résultat d un test chez les malades et non malades. Rapport de vraisemblance positif : Rapport de vraisemblance négatif : Les avantages de ce test sont : Il ne dépend pas de la prévalence mais de la sensibilité et de la spécificité Il peut s interpréter en pratique clinique. Comment on va passer d une probabilité pré-test à une probabilité post-test? Le raisonnement bayésien : Probabilité pré-test: connaissances à priori du diagnostic + résultat du marqueur diagnostic = probabilité post-test LE NOMOGRAMME : Meilleur est le test, plus le rapport de vraisemblance positif est elevé.

Plus le rapport de vraisemblance négatif est proche de 0, plus le test est performant. Cas des marqueurs diagnostic continus Notion de seuil de valeur Le choix d un seuil (c) permet de passer d une variable quantitative à une variable qualitative. La courbe ROC La courbe ROC: représente la sensibilité et la spécificité sur une seule courbe. Plus la courbe est convexe, meilleur est le test. L aire sous la courbe AUC La surface sous la courbe ROC est l AUC. AUC=1: les malades ont tous des valeurs plus élevées que les non malades. AUC=0,5 (sur la diagonale): le malade a une chance sur deux d avoir une valeur plus élevée que les non malades. Les courbes ROC permettent notamment de comparer deux tests : le meilleur est celui qui a l AUC la plus élevée. Spectrum effect La sensibilité et la spécificité sont dépendantes du spectre de la maladie c est-à-dire le stade de développement de la maladie.