Les tests diagnostiques : ce dont on parle. Claudine Schwartz Le dépistage de nombreuses pathologies repose en partie, mais en partie seulement, sur les résultats d un ou plusieurs tests. Dans un monde parfait, un test dirait à coup sûr si on est malade, ou si on ne l est pas. La réalité est évidemment autre, et différents paramètres doivent être introduits pour pouvoir interpréter un test diagnostique. A quoi servent ces paramètres? Nous proposons d en délimiter le sens et les usages, en distinguant deux points de vue. Celui de la «santé publique» qui porte son regard sur toute la population et celui d un individu qui cherche à savoir s il est ou non malade. I- Le point de vue de la santé publique On dispose d un test dépistage d une certaine maladie M. On aimerait savoir au minimum quel pourcentage de cas seront repérés par ce test. Lorsqu un fabriquant livre un test, il fournit en général deux caractéristiques techniques : La sensibilité C est la probabilité d avoir un test positif sachant qu on a la pathologie M ; nous la noterons P M (T + ). On souhaite que la sensibilité soit proche de. Avec une sensibilité 0,8, environ 80% des malades auront un test positif (ce sont les «vrais positifs») et seront ainsi repérés ; 0% auront un test négatif (ce sont les «faux négatifs») et sont susceptibles de ne pas recevoir les soins appropriés. Ces résultats portent sur l ensemble de la population ciblée par le test et est donc d intérêt pour les institutions de santé publique. Ils ne sont pas interprétables pour un usager individuel du test qui ignore s il est malade et qui utilise le test pour le savoir (voir la partie II : le point de vue de l individu). La spécificité Un test toujours positif aurait une sensibilité égale à, et n aurait pourtant aucun intérêt : on ne peut pas se contenter, pour juger de l efficacité d un test, de sa seule sensibilité. Une mesure de la spécificité du test vis à vis de M doit être connue. Cette mesure est ici la probabilité d avoir un test négatif sachant qu on n a pas la pathologie M ; nous la noterons
P M (T - ). On souhaite que la spécificité soit proche de. Si un test a une spécificité 0,9, environ 90% de ceux qui ne sont pas atteints par M auront un test négatif (ce sont les «vrais négatifs») ; 0% auront un test positifs (ce sont les «faux positifs») et seront inquiétés à tort par le fait d avoir subi le test. De nombreux tests reposent sur la valeur de certaines variables (marqueurs spécifiques, etc.). Si X est une telle variable, avec une tendance à être plus élevée chez les malades, on fixe un seuil a : le test sera dit positif pour X>a (ou X a) et négatif sinon. Dans cette situation, si on élève le seuil a, la sensibilité diminue, mais la spécificité augmente et si on abaisse a, c est l inverse : il y a donc un choix à optimiser qui peut être soutenu par une représentation graphique (voir courbes ROC http://pagesperso-orange.fr/jpq/proba/roc/index.html). Pour éviter de manipuler deux paramètres, on caractérise souvent un test par son rapport de vraisemblance, noté LR d après la terminologie anglaise (Likelihood Ratio) : Sensibilit é PM ( LR= Spécificit é P ( Ainsi, un test qui a une sensibilité 0,8 et une spécificité 0,9 a un rapport de vraisemblance LR=0,8/0,=8. Cela signifie qu un individu malade a 8 fois plus de chances d avoir un test positif qu un individu non atteint par M. On notera que le rapport de vraisemblance ne dépend pas de la probabilité M) (appelée prévalence de la pathologie) d être malade dans la population ciblée par le test, au moment ou celui-ci sera utilisé (une telle prévalence est en effet susceptible d évoluer au cours du temps). Le rapport de vraisemblance est un paramètre technique propre au test. Remarques : Le test étant utilisé dans le processus de diagnostic de la pathologie M, une exigence minimale est que le rapport de vraisemblance soit supérieur à. Il en découle que la probabilité d avoir un test positif est plus élevée chez les malades que dans la population ciblée, quelque soit la prévalence M) de la pathologie. P (T + ) = P M (T + ) P (M) + P M (T + ) (-P (M)) < P M (T + ) Combinaisons de tests Considérons deux tests T et T relatifs à la même maladie M. Savoir que l un des deux est positif (resp. négatif) rend plus probable la probabilité d avoir (ou de ne pas avoir) M et donc que le second test soit positif. Autrement dit, les résultats des tests ne sont pas indépendants. Par contre, il arrive fréquemment que les résultats des tests soient indépendants conditionnellement au fait d avoir ou non la maladie M, soit : P M ( T et P M ( T et M = P M ( P M ( = P M ( P M ( Supposons qu il en soit ainsi. Un test T construit en disant qu il est positif si et seulement si les deux tests T et T le sont admet alors pour rapport de vraisemblance le produit des rapports des deux tests :
PM ( Ti ) LR=LR LR où LR i P ( Ti ) M Si on combine de même plusieurs tests ayant entre eux cette propriété d indépendance conditionnelle, le rapport de vraisemblance final est le produit des rapports de chacun d eux. Remarques : -L hypothèse d indépendance conditionnelle est néanmoins assez forte : pour combiner des résultats de tests et inclure des facteurs de risques (tels l âge) pour aider au diagnostic, d autres techniques sont souvent plus pertinente (la régression logistique notamment). -La sensibilité et la spécificité sont intrinsèques au test et s appliquent sur toute population sous réserve que celle-ci ne soit pas définie à partir d un critère en interaction avec les résultats de ce test. En effet, imaginons que T et T n aient pas la propriété d indépendance conditionnelle énoncée ci-dessus et que lorsqu un individu est malade un seul des deux tests puisse être positif, l autre étant alors forcément négatif. Si on se restreint à la population des individus pour lesquels le premier test est positif, la sensibilité dans cette population du deuxième test est alors nulle. II- Le point de vue d un usager Abordons maintenant le point de vue du médecin et de son patient : on connaît le résultat du test, on cherche à inférer la probabilité que l individu soit ou non atteint par la pathologie M. - Si le test est positif, on s intéresse à la probabilité d avoir effectivement la pathologie ; cette probabilité, appelée la valeur prédictive positive s écrit aussi : ( P T M ) P M ( VPP = P T (M)= = M) D après la remarque ci-dessus, ( P ( >, la valeur prédictive est toujours supérieure à la P M prévalence p=m) de la pathologie dans la population cible du test (soit : VPP>p). On peut exprimer ce paramètre en fonction des caractéristiques du test, et en particulier de sa vraisemblance : p LR VPP= p ( LR ) Cette écriture fait bien apparaître la dépendance de la VPP par rapport à p : il n est pas intuitif a priori que la performance d un test, en termes de diagnostic individuel, dépend de la prévalence de la pathologie dans la population à laquelle appartient l individu. Mais on peut le comprendre avec un exemple : Soit un test ayant une sensibilité 0,8 et une spécificité 0,9 et dix mille résultats de ce test. Supposons que la pathologie ait une faible prévalence, disons p=/00, ce qui correspond à environ 00 malades pour les 0 000 individus testés ; le nombre de vrais positifs est de l ordre de 0,8 00=80 ; le nombre de faux positifs est de l ordre de 0, 9 900=990 ; il y a ainsi environ 990+80= 070 tests positifs, dont 80 seulement correspondant à des malades : les faux positifs sont beaucoup plus nombreux que les vrais positifs. On a : VPP=80/070= 0,075 3
(7,5%) : c est faible ; néanmoins l information apportée par le résultat positif du test a multiplié par 7,5 la probabilité d être malade. Par contre si la pathologie est fréquente, le test devient un bon prédicteur de M : comme on peut le voir sur le graphique ci-dessous, si p=0,3,vpp 0,78 et si p=0,5, VPP 0,9 (on a ici LR=8) Remarque : Imaginons qu on fasse passer deux tests T et T indépendants conditionnellement au fait d avoir ou non la maladie. Si le premier test est positif, l individu se trouve avoir une probabilité p d être malade qui est la VPP de ce test. Si le second test est positif, la probabilité p d être malade est donnée par la VPP du second test, calculée pour une population où la prévalence de M est p. On trouve alors : p = p LR p LR LR p LR LR p ( LR ) p ( LR ) p LR ( LR ) p ( LR LR ) On retrouve, fort heureusement, que p est la VPP du test combiné T et T, dont nous avons vu que la vraisemblance était le produit des vraisemblances de chaque test. - Si le test est négatif, on s intéresse à la probabilité de ne pas avoir la pathologie ; cette probabilité, appelée la valeur prédictive négative est : ( P T M ) P ( VPN = P T ( M )= = M ) M Un raisonnement analogue à celui qui a été fait précédemment montre que ( P ( >. La valeur prédictive négative est toujours supérieure à la probabilité -p de ne pas avoir la pathologie dans la population cible du test, autrement dit le résultat négatif du test apporte lui aussi de l information vis-à-vis de l absence de M. On peut exprimer ce paramètre en fonction des caractéristiques du test : ( p) sp VPN= p ( se) ( p) sp Comme la VPP, la VPN dépend de la prévalence. Pour symétriser au niveau des calculs la situation entre VPP et VPN, on pourrait introduire une rapport de vraisemblance négative (LR*=sp/(-se)) pour avoir une formule analogue à celle de la VPP, soit ici VPN= q LR*/ (+q (LR*-)), avec q=-p) mais ce n est pas l usage. P M 4
Reprenons l exemple précédent. Soit un test ayant une sensibilité 0,8 et une spécificité 0,9 et dix mille résultats de ce test. Supposons que la pathologie ait une faible prévalence, disons p=/00, ce qui correspond à environ 00 malades pour les 0 000 individus testés ; le nombre de vrais négatifs serait de l ordre de 0,9 9900=890 ; le nombre de faux négatifs serait de l ordre de 0, 00=0 ; il y aura ainsi 890+0=8930 tests négatifs, dont 890 correspondant à des malades : les vrais négatifs sont beaucoup plus nombreux que les faux négatifs et on aura : VPN=890/8930= 0,998 (99,8%) ; l information apportée par le résultat négatif du test permet de passer d une probabilité 0,99 à une probabilité 0,998 de ne pas être atteint de la pathologie M. Le résultat constitue ainsi un argument fort en faveur de l absence de pathologie. Dans le cadre de dépistage automatique, ce test peut servir à éliminer de individus jugés indemnes de M, les autres (ceux qui ont un test positif) subissant de nouvelles procédures de diagnostic. De même qu on a synthétisé la spécificité et la sensibilité avec un seul paramètre, le rapport de vraisemblance, on peut synthétiser les deux paramètres VPP et VPN en un seul qui est appelé risque relatif dans le champ d étude des facteurs de risques. RR(T + VVP PT ( M ) )= VPN P ( M ) Un risque relatif de 8 indique qu on a 8 fois plus de chances d être atteint de M si on a un test positif que si on a un test négatif. T En conclusion, quatre paramètres sont utilisés lorsqu on parle de test diagnostique en médecine : -la sensibilité se et la spécificité sp. Ce sont des paramètres techniques intrinsèques au test et qui permettent d évaluer sa qualité au niveau d une population. Le rapport de vraisemblance combine ces deux paramètres. -les valeurs prédictives positive et négative VPP et VPN qui renseignent l individu sur ses chances d être malade ou non, calculées à partir de l information apportée par le résultat de son test. Ces paramètres dépendent à la fois des caractéristiques du test et de la prévalence de la pathologie dans la population. La VPP et la VPN sont d autant meilleures que la sensibilité et la spécificité sont élevées, mais plus la pathologie est rare, meilleure est la VPN et moins bonne est la VPP. Le rapport VPP/(-VPN), appelé risque relatif est le rapport de la probabilité d être malade dans les populations test positif et à test négatif. Au temps des oracles on n avait pas à réfléchir, toutes ces considérations étaient hors propos.mais l espérance de vie était courte. Avoir un test positif peut en effet être assimilé à un «facteur de risque» d avoir la maladie M, facteur à prendre en compte dans un processus de diagnostic. 5