Les tests diagnostiques : ce dont on parle.

Documents pareils
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Evalua&on tests diagnos&ques. Arnaud Fontanet

TRANSPORT ET LOGISTIQUE :

Cours 9 : Plans à plusieurs facteurs

Associations Dossiers pratiques

Résolution d équations non linéaires

LES RÉFÉRENTIELS RELATIFS AUX ÉDUCATEURS SPÉCIALISÉS

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Probabilités sur un univers fini

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Chp. 4. Minimisation d une fonction d une variable

Chapitre 2 Le problème de l unicité des solutions

Cours d Analyse. Fonctions de plusieurs variables

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Limites finies en un point

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal

Fonctions homographiques

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Probabilités sur un univers fini

Le produit semi-direct

LA RESPONSABILITÉ DU RADIOLOGUE Point de vue de l avocat

1 Première section: La construction générale

Analyse financière détaillée

Réaliser la fiche de lecture du document distribué en suivant les différentes étapes de la méthodologie (consulter le support du TD!

Fonctions de plusieurs variables

Poker. A rendre pour le 25 avril

Le ROI du marketing digital

Comparaison de fonctions Développements limités. Chapitre 10

Lecture critique et pratique de la médecine

Chapitre 2/ La fonction de consommation et la fonction d épargne

Statistique Descriptive Élémentaire

INF6304 Interfaces Intelligentes

Algèbre binaire et Circuits logiques ( )

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

AVIS N 118 DU 13 FEVRIER 2009 DU BUREAU DU CONSEIL DE L EGALITE DES CHANCES ENTRE HOMMES ET FEMMES, RELATIF A LA PROPOSITION DE DIRECTIVE PORTANT

Date d acquisition ou d établissement de la police. Traitement fiscal

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Continuité et dérivabilité d une fonction

Notes techniques relatives aux dépôts des taux d assurance-automobile et des systèmes de classification des risques

UN NOUVEAU MODÈLE ÉCONOMIQUE. pour développer et pérenniser les centres de santé

Note d orientation : La simulation de crise Établissements de catégorie 2. Novembre This document is also available in English.

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Culture scientifique et technologique

Variations du modèle de base

Chapitre 2. Eléments pour comprendre un énoncé

Statistique : Résumé de cours et méthodes

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Conseil économique et social

Programmation Linéaire - Cours 1

Actions Propres et Consolidation

Révision des descriptions génériques Comment monter un dossier?

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Exercices sur le chapitre «Probabilités»

Quantification de l AgHBs Pouquoi? Quand?

Troubles de la vigilance au travail. Tests d aide à la décision d aptitude et structures de dépistage du syndrome d apnées du sommeil à Grenoble

TESTS D'HYPOTHESES Etude d'un exemple

Interprétation IFRIC 12 Accords de concession de services

TRACER LE GRAPHE D'UNE FONCTION

Chapitre 5 : Flot maximal dans un graphe

RESPONSABLE DU DEVELOPPEMENT COMMERCIAL IMPORT EXPORT

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Avis n sur la méthodologie relative aux comptes combinés METHODOLOGIE RELATIVE AUX COMPTES COMBINES

WHITEPAPER. Quatre indices pour identifier une intégration ERP inefficace

Contradicting Beliefs and Communication. J.-M. Tallon, J.-C. Vergnaud, & S. Zamir CNRS-EUREQua

«Cours Statistique et logiciel R»

Erreurs les plus classiques en Bourse. TradMaker.com Tous droits réservés Tel: CS@TRADMAKER.COM

Organisation de dispositifs pour tous les apprenants : la question de l'évaluation inclusive

Biométrie foetale. Comité éditorial pédagogique de l'uvmaf. Date de création du document 01/ Support de Cours (Version PDF) -

Réponse concernant le financement de l assurance-emploi et les récentes mesures connexes. Ottawa, Canada 9 octobre

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

REFERENTIEL PROFESSIONNEL DES ASSISTANTS DE SERVICE SOCIAL

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Des solutions adaptées à vos besoins. l agroalimentaire

Les petis signes de T21 : comment ça marche et à quoi ça sert? Christophe Vayssière (Toulouse) DIU d echographie 2011

Épreuve collaborative

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Intact Corporation financière annonce ses résultats du deuxième trimestre

Cours Fonctions de deux variables

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

PROGRAMME DE MANAGEMENT DES ORGANISATIONS

REFERENTIEL QUALITÉ ASSURANCE QUALITE DE DISPOSITIFS DE FORMATIONS SUPERIEURES PROFESSIONNELLES. Juin 2006

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Good practice: réduction individuelle des primes d assurance-maladie

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

La mobilité professionnelle revêt

Données Réparties. Thibault BERNARD.

LES REPRESENTATIONS DES NOMBRES

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Principe d un test statistique

Transcription:

Les tests diagnostiques : ce dont on parle. Claudine Schwartz Le dépistage de nombreuses pathologies repose en partie, mais en partie seulement, sur les résultats d un ou plusieurs tests. Dans un monde parfait, un test dirait à coup sûr si on est malade, ou si on ne l est pas. La réalité est évidemment autre, et différents paramètres doivent être introduits pour pouvoir interpréter un test diagnostique. A quoi servent ces paramètres? Nous proposons d en délimiter le sens et les usages, en distinguant deux points de vue. Celui de la «santé publique» qui porte son regard sur toute la population et celui d un individu qui cherche à savoir s il est ou non malade. I- Le point de vue de la santé publique On dispose d un test dépistage d une certaine maladie M. On aimerait savoir au minimum quel pourcentage de cas seront repérés par ce test. Lorsqu un fabriquant livre un test, il fournit en général deux caractéristiques techniques : La sensibilité C est la probabilité d avoir un test positif sachant qu on a la pathologie M ; nous la noterons P M (T + ). On souhaite que la sensibilité soit proche de. Avec une sensibilité 0,8, environ 80% des malades auront un test positif (ce sont les «vrais positifs») et seront ainsi repérés ; 0% auront un test négatif (ce sont les «faux négatifs») et sont susceptibles de ne pas recevoir les soins appropriés. Ces résultats portent sur l ensemble de la population ciblée par le test et est donc d intérêt pour les institutions de santé publique. Ils ne sont pas interprétables pour un usager individuel du test qui ignore s il est malade et qui utilise le test pour le savoir (voir la partie II : le point de vue de l individu). La spécificité Un test toujours positif aurait une sensibilité égale à, et n aurait pourtant aucun intérêt : on ne peut pas se contenter, pour juger de l efficacité d un test, de sa seule sensibilité. Une mesure de la spécificité du test vis à vis de M doit être connue. Cette mesure est ici la probabilité d avoir un test négatif sachant qu on n a pas la pathologie M ; nous la noterons

P M (T - ). On souhaite que la spécificité soit proche de. Si un test a une spécificité 0,9, environ 90% de ceux qui ne sont pas atteints par M auront un test négatif (ce sont les «vrais négatifs») ; 0% auront un test positifs (ce sont les «faux positifs») et seront inquiétés à tort par le fait d avoir subi le test. De nombreux tests reposent sur la valeur de certaines variables (marqueurs spécifiques, etc.). Si X est une telle variable, avec une tendance à être plus élevée chez les malades, on fixe un seuil a : le test sera dit positif pour X>a (ou X a) et négatif sinon. Dans cette situation, si on élève le seuil a, la sensibilité diminue, mais la spécificité augmente et si on abaisse a, c est l inverse : il y a donc un choix à optimiser qui peut être soutenu par une représentation graphique (voir courbes ROC http://pagesperso-orange.fr/jpq/proba/roc/index.html). Pour éviter de manipuler deux paramètres, on caractérise souvent un test par son rapport de vraisemblance, noté LR d après la terminologie anglaise (Likelihood Ratio) : Sensibilit é PM ( LR= Spécificit é P ( Ainsi, un test qui a une sensibilité 0,8 et une spécificité 0,9 a un rapport de vraisemblance LR=0,8/0,=8. Cela signifie qu un individu malade a 8 fois plus de chances d avoir un test positif qu un individu non atteint par M. On notera que le rapport de vraisemblance ne dépend pas de la probabilité M) (appelée prévalence de la pathologie) d être malade dans la population ciblée par le test, au moment ou celui-ci sera utilisé (une telle prévalence est en effet susceptible d évoluer au cours du temps). Le rapport de vraisemblance est un paramètre technique propre au test. Remarques : Le test étant utilisé dans le processus de diagnostic de la pathologie M, une exigence minimale est que le rapport de vraisemblance soit supérieur à. Il en découle que la probabilité d avoir un test positif est plus élevée chez les malades que dans la population ciblée, quelque soit la prévalence M) de la pathologie. P (T + ) = P M (T + ) P (M) + P M (T + ) (-P (M)) < P M (T + ) Combinaisons de tests Considérons deux tests T et T relatifs à la même maladie M. Savoir que l un des deux est positif (resp. négatif) rend plus probable la probabilité d avoir (ou de ne pas avoir) M et donc que le second test soit positif. Autrement dit, les résultats des tests ne sont pas indépendants. Par contre, il arrive fréquemment que les résultats des tests soient indépendants conditionnellement au fait d avoir ou non la maladie M, soit : P M ( T et P M ( T et M = P M ( P M ( = P M ( P M ( Supposons qu il en soit ainsi. Un test T construit en disant qu il est positif si et seulement si les deux tests T et T le sont admet alors pour rapport de vraisemblance le produit des rapports des deux tests :

PM ( Ti ) LR=LR LR où LR i P ( Ti ) M Si on combine de même plusieurs tests ayant entre eux cette propriété d indépendance conditionnelle, le rapport de vraisemblance final est le produit des rapports de chacun d eux. Remarques : -L hypothèse d indépendance conditionnelle est néanmoins assez forte : pour combiner des résultats de tests et inclure des facteurs de risques (tels l âge) pour aider au diagnostic, d autres techniques sont souvent plus pertinente (la régression logistique notamment). -La sensibilité et la spécificité sont intrinsèques au test et s appliquent sur toute population sous réserve que celle-ci ne soit pas définie à partir d un critère en interaction avec les résultats de ce test. En effet, imaginons que T et T n aient pas la propriété d indépendance conditionnelle énoncée ci-dessus et que lorsqu un individu est malade un seul des deux tests puisse être positif, l autre étant alors forcément négatif. Si on se restreint à la population des individus pour lesquels le premier test est positif, la sensibilité dans cette population du deuxième test est alors nulle. II- Le point de vue d un usager Abordons maintenant le point de vue du médecin et de son patient : on connaît le résultat du test, on cherche à inférer la probabilité que l individu soit ou non atteint par la pathologie M. - Si le test est positif, on s intéresse à la probabilité d avoir effectivement la pathologie ; cette probabilité, appelée la valeur prédictive positive s écrit aussi : ( P T M ) P M ( VPP = P T (M)= = M) D après la remarque ci-dessus, ( P ( >, la valeur prédictive est toujours supérieure à la P M prévalence p=m) de la pathologie dans la population cible du test (soit : VPP>p). On peut exprimer ce paramètre en fonction des caractéristiques du test, et en particulier de sa vraisemblance : p LR VPP= p ( LR ) Cette écriture fait bien apparaître la dépendance de la VPP par rapport à p : il n est pas intuitif a priori que la performance d un test, en termes de diagnostic individuel, dépend de la prévalence de la pathologie dans la population à laquelle appartient l individu. Mais on peut le comprendre avec un exemple : Soit un test ayant une sensibilité 0,8 et une spécificité 0,9 et dix mille résultats de ce test. Supposons que la pathologie ait une faible prévalence, disons p=/00, ce qui correspond à environ 00 malades pour les 0 000 individus testés ; le nombre de vrais positifs est de l ordre de 0,8 00=80 ; le nombre de faux positifs est de l ordre de 0, 9 900=990 ; il y a ainsi environ 990+80= 070 tests positifs, dont 80 seulement correspondant à des malades : les faux positifs sont beaucoup plus nombreux que les vrais positifs. On a : VPP=80/070= 0,075 3

(7,5%) : c est faible ; néanmoins l information apportée par le résultat positif du test a multiplié par 7,5 la probabilité d être malade. Par contre si la pathologie est fréquente, le test devient un bon prédicteur de M : comme on peut le voir sur le graphique ci-dessous, si p=0,3,vpp 0,78 et si p=0,5, VPP 0,9 (on a ici LR=8) Remarque : Imaginons qu on fasse passer deux tests T et T indépendants conditionnellement au fait d avoir ou non la maladie. Si le premier test est positif, l individu se trouve avoir une probabilité p d être malade qui est la VPP de ce test. Si le second test est positif, la probabilité p d être malade est donnée par la VPP du second test, calculée pour une population où la prévalence de M est p. On trouve alors : p = p LR p LR LR p LR LR p ( LR ) p ( LR ) p LR ( LR ) p ( LR LR ) On retrouve, fort heureusement, que p est la VPP du test combiné T et T, dont nous avons vu que la vraisemblance était le produit des vraisemblances de chaque test. - Si le test est négatif, on s intéresse à la probabilité de ne pas avoir la pathologie ; cette probabilité, appelée la valeur prédictive négative est : ( P T M ) P ( VPN = P T ( M )= = M ) M Un raisonnement analogue à celui qui a été fait précédemment montre que ( P ( >. La valeur prédictive négative est toujours supérieure à la probabilité -p de ne pas avoir la pathologie dans la population cible du test, autrement dit le résultat négatif du test apporte lui aussi de l information vis-à-vis de l absence de M. On peut exprimer ce paramètre en fonction des caractéristiques du test : ( p) sp VPN= p ( se) ( p) sp Comme la VPP, la VPN dépend de la prévalence. Pour symétriser au niveau des calculs la situation entre VPP et VPN, on pourrait introduire une rapport de vraisemblance négative (LR*=sp/(-se)) pour avoir une formule analogue à celle de la VPP, soit ici VPN= q LR*/ (+q (LR*-)), avec q=-p) mais ce n est pas l usage. P M 4

Reprenons l exemple précédent. Soit un test ayant une sensibilité 0,8 et une spécificité 0,9 et dix mille résultats de ce test. Supposons que la pathologie ait une faible prévalence, disons p=/00, ce qui correspond à environ 00 malades pour les 0 000 individus testés ; le nombre de vrais négatifs serait de l ordre de 0,9 9900=890 ; le nombre de faux négatifs serait de l ordre de 0, 00=0 ; il y aura ainsi 890+0=8930 tests négatifs, dont 890 correspondant à des malades : les vrais négatifs sont beaucoup plus nombreux que les faux négatifs et on aura : VPN=890/8930= 0,998 (99,8%) ; l information apportée par le résultat négatif du test permet de passer d une probabilité 0,99 à une probabilité 0,998 de ne pas être atteint de la pathologie M. Le résultat constitue ainsi un argument fort en faveur de l absence de pathologie. Dans le cadre de dépistage automatique, ce test peut servir à éliminer de individus jugés indemnes de M, les autres (ceux qui ont un test positif) subissant de nouvelles procédures de diagnostic. De même qu on a synthétisé la spécificité et la sensibilité avec un seul paramètre, le rapport de vraisemblance, on peut synthétiser les deux paramètres VPP et VPN en un seul qui est appelé risque relatif dans le champ d étude des facteurs de risques. RR(T + VVP PT ( M ) )= VPN P ( M ) Un risque relatif de 8 indique qu on a 8 fois plus de chances d être atteint de M si on a un test positif que si on a un test négatif. T En conclusion, quatre paramètres sont utilisés lorsqu on parle de test diagnostique en médecine : -la sensibilité se et la spécificité sp. Ce sont des paramètres techniques intrinsèques au test et qui permettent d évaluer sa qualité au niveau d une population. Le rapport de vraisemblance combine ces deux paramètres. -les valeurs prédictives positive et négative VPP et VPN qui renseignent l individu sur ses chances d être malade ou non, calculées à partir de l information apportée par le résultat de son test. Ces paramètres dépendent à la fois des caractéristiques du test et de la prévalence de la pathologie dans la population. La VPP et la VPN sont d autant meilleures que la sensibilité et la spécificité sont élevées, mais plus la pathologie est rare, meilleure est la VPN et moins bonne est la VPP. Le rapport VPP/(-VPN), appelé risque relatif est le rapport de la probabilité d être malade dans les populations test positif et à test négatif. Au temps des oracles on n avait pas à réfléchir, toutes ces considérations étaient hors propos.mais l espérance de vie était courte. Avoir un test positif peut en effet être assimilé à un «facteur de risque» d avoir la maladie M, facteur à prendre en compte dans un processus de diagnostic. 5