Fiabilité des tests cliniques et précision du diagnostic.

Documents pareils
HENDRICH FALL RISK MODEL (HFRM)

Lecture critique et pratique de la médecine

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

Supplément du BDK 24 : Aide à la recherche bibliographique

2. Rechercher les études

«Quelle information aux patients en recherche biomédicale? Quels enseignements en retirer pour la pratique quotidienne?»

Essais cliniques de phase 0 : état de la littérature

COMMISSION DE LA TRANSPARENCE

LD-P PRINCIPE ECHANTILLON. Coffret référence REVISION ANNUELLE Date. Date APPLICATION

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Éditeur Elsevier Langue(s) Multilingue

Coût total de possession des solutions CRM : frais, abonnements et coûts cachés

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Présentation: Aline Mendes

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Méthodologie Actuelle des Recommandations Formalisées d Experts SFAR/SRLF

e-santé du transplanté rénal : la télémédecine au service du greffé

Une échelle d évaluation semistructurée. B. Gravier

Evaluation de la variabilité d'un système de mesure

La recherche clinique au cœur du progrès thérapeutique

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Présenté par Mélanie Dessureault, inf. clin. et Caroline Fortin, AIC radio-oncologie

Hospital Anxiety and Depression Scale (HADS)

Parcours du patient cardiaque

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

Algèbre binaire et Circuits logiques ( )

Estelle Marcault 06/02/2015 URC PARIS NORD 1

La Menace du Stéréotype

Baccalauréat technologique

23. Interprétation clinique des mesures de l effet traitement

L hôpital de jour ( HDJ ) en Hôpital général Intérêt d une structure polyvalente? Dr O.Ille Centre hospitalier Mantes la Jolie, Yvelines

Différenciation de fonction

Diagnostic et Monitoring de la pathologie respiratoire du sommeil en Peut-on faire plus simple?

Statistiques Descriptives à une dimension

Échelle d'évaluation globale du fonctionnement et durée du traitement médicopsychiatrique

Du plaisir à la dépendance Lorsque l alcool devient un problème

Procédure normalisée de fonctionnement du RCBT Demande d informations additionnelles Version

Introduction. Pourquoice livre?... Comment utiliser ce livre?... Que contient ce manuel?... Chapitre 1

modélisation solide et dessin technique

Guide de configuration d'une classe

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

3 Les premiers résultats des plans d'actions

L analyse documentaire : Comment faire des recherches, évaluer, synthétiser et présenter les preuves

Équivalence et Non-infériorité

Evalua&on tests diagnos&ques. Arnaud Fontanet

Assurance Crédit-Invalidité Trousse «Demande De Règlement»

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Quantification de l AgHBs Pouquoi? Quand?

Qui sont les infirmières et infirmiers cliniciens spécialisés?

9. Les registres d essais cliniques

REFERENTIEL D AUTO-EVALUATION DES PRATIQUES EN ODONTOLOGIE

ÉVALUATION ET AMÉLIORATION DES PRATIQUES. Développement professionnel continu. Simulation en santé. Fiche technique méthode

- un jeu de K cartes représentées par des nombres C 1, C 2 à C K avec K entier strictement

CODIFICATION ADMINISTRATIVE DE L ARRANGEMENT EN VUE DE LA RECONNAISSANCE MUTUELLE DES QUALIFICATIONS PROFESSIONNELLES ENTRE POUR LE QUÉBEC :

La politique européenne de la Mutualité Française en matière de dispositifs médicaux

Artéfact en queue de comète à l échographie hépatique: un signe de maladie des voies biliaires intra-hépatiques

PROGRAMME (Susceptible de modifications)

SANTÉ ET SERVICES SOCIAUX - PROFESSIONNELS

Qu avez-vous appris pendant cet exposé?

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

ASPECT ECHOGRAPHIQUE NORMAL DE LA CAVITE UTERINE APRES IVG. Dr D. Tasias Département de gynécologie, d'obstétrique et de stérilité

Le taux d'actualisation en assurance

Format de l avis d efficience

Mulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2),

Que représentent les Spondyloarthrites Axiales Non Radiographiques? Pascal Claudepierre CHU Mondor - Créteil

Théories de la Business Intelligence

Le dropéridol n est pas un traitement à considérer pour le traitement de la migraine à l urgence

Ratios sectoriels. Dossier exemple. Dossier exemple-caroline. Références du dossier : Date : 24/09/2012 Auteur : Caroline

ALTO : des outils d information sur les pathologies thromboemboliques veineuses ou artérielles et leur traitement

Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5

Utiliser CHAMILO pour le travail collaboratif

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

La classification automatique de données quantitatives

Les formes cliniques. Maxime Breban

MANAGEMENT ET TECHNIQUES D ACHATS. 1. Sensibiliser à la dimension stratégique de l Achats à travers des exemples concrets d entreprises industrielles

La CCM vous remercie de lui offrir la possibilité de donner son avis sur la révision partielle de la LA Mal.

Mieux dans ses bronches, mieux dans sa tête. mieux dans sa vie!

Information sur le sujet. Tests-assignés

QUALITÉ EN KINÉSITHÉRAPIE QUALITY IN PHYSICAL THERAPY

Revue des données probantes l utilité et les limites des différentes approches

Examen d une épaule en relation avec le travail. Docteur Virginie Fraselle Médecin Physique et Réadaptateur Cliniques Universitaires Saint-Luc

COMMISSION DE LA TRANSPARENCE AVIS. 19 octobre 2011

L animation de la performance d une Supply Chain

Un nouveau test sanguin performant pour le diagnostic non-invasif de steatohépatite non alcoolique chez les patients avec une NAFLD

PEUT ON PRESCRIRE HORS AMM? LE POINT DE VUE DU CLINICIEN

Enregistrement et transformation du son. S. Natkin Novembre 2001

Utilisation des médicaments au niveau des soins primaires dans les pays en développement et en transition

La clé USB nomade - La mobilité logicielle

SIG ET ANALYSE EXPLORATOIRE

Résultats. 1 Quelle est votre tranche d âge?

Avis 29 mai XYZALL 5 mg, comprimé B/14 (CIP : ) B/28 (CIP : ) Laboratoire UCB PHARMA SA.

COMMISSION DE LA TRANSPARENCE. Avis. 23 mai 2007

Application des courbes ROC à l analyse des facteurs pronostiques binaires

AGRES Hugues IADE RD LA ROCHE / YON

Systèmes de transport public guidés urbains de personnes

Objet : Guide d'installation et de maintenance pour "My IC Phone 8082" connecté à un OmniPCX Office R810

ÉVALUATION DE LA PERSONNE ATTEINTE D HYPERTENSION ARTÉRIELLE

Méthodologie documentaire spécifique au repérage d actions de terrain

Transcription:

Evaluation en Physiothérapie (N1) ------------------------------------------------- Fiabilité des tests cliniques et précision du diagnostic. ------------------------------------------------- L'examen clinique de l'appareil musculo-squelettique, qu'il soit analytique ou fonctionnel, repose sur de très nombreux tests. Ces évaluations cliniques sont plus ou moins bien validées, et donc plus ou moins fiables, et pourtant nécessaires à l'établissement du Bilan Diagnostic Kinésithérapique. Partant d'une volonté de "pratique basée sur des preuves" (1), la SPB souhaite proposer une synthèse des tests les mieux validés par la littérature internationale. Pour ce faire, nous établirons plusieurs fiches de synthèse, par région, par fonction ou par système, afin de rendre lisible les tests à utiliser de manière préférentielle lors du bilan diagnostic. Afin de mieux comprendre les arguments permettant de donner plus ou moins de poids à la validité d'un test, nous proposons un préambule dont l'objectif est d'acquérir les bases statistiques nécessaires à la lecture des fiches de synthèse. NB : Il n'est pas nécessaire de comprendre les formules mathématiques des indices proposés ci-dessous pour les utiliser. Cependant, leur lecture permet de constater qu'il est toujours question de dispersion (écart-type ou variance) autour de la moyenne. Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 1

Fiabilité d'un test clinique Les mesures cliniques, guidées par la main du thérapeute et les mouvements (passifs ou actifs) du patient, sont affectés par des erreurs. La quantification de la fiabilité permet de mesurer la proportion de ce qui représente la réalité et de ce qui représente les erreurs dues au hasard, à l'imprécision de l'outil utilisé (la main le plus souvent) ou du thérapeute évaluateur (2). Deux types de fiabilité doivent être envisagées, la fiabilité inter-examinateur (capacité d'un unique évaluateur à obtenir le même résultat plusieurs fois sur un même patient) et la fiabilité intra-examinateur (capacité de deux ou plusieurs évaluateurs à obtenir le même résultat sur un même patient). Pour mesurer cette fiabilité, le choix de l'outil statistique doit être fait en fonction du type de variable considéré. Variables qualitatives : Coefficient Kappa Très utilisé, ce coefficient permet de mesurer la proportion d'accord ou de rejet des résultats par deux juges (inter-examinateur), ou par le même juge à deux reprises (intra-examinateur) (3;4). La variable étudiée est qualitative, le plus souvent binaire (= dichotomique : Oui / Non) mais parfois ordinale à plusieurs classes (souple, très souple, raide, très raide, pour un exemple à 4 classes). Voici le mode de calcul du coefficient de Kappa à l'aide d'un exemple (chaque chiffre du tableau de contingence représente un effectif de patients) : Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 2

Exemple : Calcul du coefficient de Kappa pour mesurer la fiabilité inter-examinateur d un test clinique Résultat du juge A Réponses OUI NON Total Résultat OUI 72 16 88 du juge B NON 25 87 112 Total 97 103 200 Pour 16 patients, le juge A a obtenu un test négatif alors que le juge B a obtenu un test positif K = (Po Pthéo) / (1 Pthéo) Po = Concordance observée = (72 + 87) / 200 = 0.795 Pthéo = (Produits des réponses positives des 2 juges + Produits des réponses négatives des 2 juges) / Carré de l effectif total = ((88 x 97) + (112 x 103)) / 200 2 = 0.501 K = (0.795 0.501) / (1 0.501) = 0.589 Interprétation (3): le Kappa est: - Faible en dessous de 0,5 - Modéré entre 0,5 et 0,75 - Fort au dessus de 0,75 Dans notre exemple, la fiabilité inter-examinateur est donc Modérée. NB : Le Kappa peut également être utilisé pour mesurer la force d'un lien entre deux variables qualitatives: comme l'association entre deux symptômes. Variables quantitatives : Coefficient de corrélation intraclasse ou coefficient de corrélation de Pearson (5) Ces deux coefficients peuvent être utilisés dans des cas similaires, mais d'un point de vue statistique, il est préférable d'utiliser le CCI (coefficient de Corrélation Intra- Classe) pour mesurer la variation entre deux mesures (intra-examinateur et interexaminateur) et le Pearson pour mesurer la force d'un lien entre deux variables quantitatives. Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 3

Le calcul du Coefficient de corrélation de Pearson, ou r P (proche du CCI) est basé sur l'analyse de la variance (dispersion autour de la moyenne) calculée dans les deux variables à corréler. Exemples de Corrélation : fiabilité interexaminateur (A) et intra-examinateur (B)(C) Son interprétation est la même que pour le coefficient de Kappa : - Faible en dessous de 0,5 - Modéré entre 0,5 et 0,75 - Fort au dessus de 0,75 Dans notre exemple, tous le "r" sont supérieur à 0,75. L'échelle testée semble donc (fortement) fiable. Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 4

NB : Attention, une corrélation avec un seul point à une extrémité de la droite n'a que peu de valeur statistique (exemple C ci-dessus, pas assez de patients avec des scores moyens ou forts à la BDS) Précision du diagnostic La précision du diagnostic est la capacité d'un test clinique à plus ou moins bien confirmer ou infirmer la présence d'un trouble spécifique (6). Pour cela, il est nécessaire de comparer les résultats obtenus au test clinique avec une référence standard (ou gold standard). Cette précision est exprimée en terme de Valeurs Prédictives Positives ou Négatives (VPP et VPN), de Sensibilité et de Spécificité, ou encore de Ratio de Vraisemblance (RV). Pour comprendre ces éléments il suffit de schématiser un tableau d'éventualité : Test clinique Résultat + Test clinique Résultats - Référence standard Résultats + Référence standard Résultats - VRAIS POSITIFS a FAUX POSITIFS b VPP = a/(a+b) FAUX NEGATIFS c VRAIS NEGATIFS d VPN = d/(c+d) Sensibilité = a/(a+c) Spécificité = d/(b+d) Les Valeurs Prédictive Positive (VPP) ou Négative (VPN) expriment donc la vraisemblance d'avoir réellement, ou non, la déficience mis en évidence par le test. La Sensibilité est révélatrice de la capacité du test à bien diagnostiquer les patients porteurs de la déficience. Une bonne sensibilité permet de ne pas passer à côté de cette déficience. La Spécificité est révélatrice de la capacité du test à exclure les patients non porteurs de la déficience. En pratique clinique, nous avons besoin de ces deux derniers aspects. Il est donc préférable d'avoir une bonne sensibilité ET une bonne spécificité. Ces deux grandeurs sont interprétées comme les coefficients précédents : - Faible en dessous de 0,5 - Modéré entre 0,5 et 0,75 - Fort au dessus de 0,75 Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 5

Le ratio de vraisemblance (RV) est un calcul "probabilistique" exprimant à la fois la capacité sensible et spécifique d'un test. Les RV positifs (RV+) et les RV négatifs (RV-) sont interprétés selon 4 catégories : Exemple de Précision du diagnostic : Test de Thessaly pour une lésion méniscale Sensibilité = 0.90 / Spécificité = 0.98 RV+ = 39,3 / RV- = 0,09 = Bonne précision du diagnostic pour ce test (le meilleur pour cette lésion) Intervalle de confiance L'Intervalle de Confiance (IC) permet d'estimer la précision d'une estimation, en donnant une borne inférieure et une borne supérieure. Les IC sont le plus souvent calculés à partir d'un échantillon à un niveau de 95%. Cela signifie que si l'on prend 100 nouveaux échantillons dans la population, 95 seront contenus dans les bornes de l'intervalle de confiance calculée. L'IC se calcule avec la moyenne et l'écart-type (dispersion) : Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 6

Exemple : Temps en secondes pour courir un 100m pour 15 individus Temps (s) Individus Les IC permettent donc de mesurer la dispersion autour d'une moyenne. Cela est important pour tout résultat, en particulier lorsque l'on mesure la fiabilité d'un test clinique. Exemple d'ic autour d'une mesure de fiabilité: Pour un test clinique A, le coefficient de Kappa est de 0,55. Pour le Test B le Kappa est à 0,54. A première vue, nous pouvons faire une confiance modérée à ces deux tests, les deux semblent aussi fiables l'un que l'autre. Mais si l'auteur nous donne l'ic: Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 7

Test A : K = 0,55 [0,21 ; 0,67] Test B : K = 0,54 [0,46 ; 0,59] Pour le test A, 95% des valeurs seront comprises entre 0,21 et 0,67. Pour le test B, 95% des valeurs seront comprises entre 0,46 et 0,59. On constate que la dispersion est moins importante pour le test B : le résultat est donc moins variable d'un échantillon à l'autre, on peut accorder plus de confiance à ce test qu'au test A. Bibliographie (1) Regnaux JP, Guay V, Marsal C. Evidence based practice ou la pratique basée sur les preuves en rééducation. Kinesither Rev 2009;(94):55-61 (2) Clealand J. Orthopaedic Clinical examination : an Evidence-based approach for physical therapists. Copyright 2005 Elsevier Saunders. (3) Portney LG, Watkins MP. Foundations of Clinical Research: Applications to practice. 2nd Ed. Upper Saddle River, NJ : Prentice Hall Health ; 2000. (4) Domholdt E. Physical Therapy Research. Ed. Philadelphia, Pa: WB Saunders; 2000. (5) Shrout PE, Fleiss JL. Intraclass correlations : uses in assessing rater reliability. Psych Bull. 1979 ; 86 : 420-428. (6) Bossuyt PMM, Reitsma JB, Bruns DE, et al. Towards complete and accurate reporting of studies od diagnosic accuracy ; explanation and elaboration. Clin Chem. 2003 ; 49 : 7-18. Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 8

BREF - La kinésithérapie à compris depuis plusieurs années la nécessité d'orienter le traitement à partir d'un bilan précis (BDK) - Problème : De très nombreux tests utilisés ne sont pas fiables, ou manquent de précision (Le test d'apley, pour rester sur l'exemple de la lésion méniscale, à une sensibilité de 0,22 = ce test ne diagnostique pas une lésion méniscale sur 78% des patients porteurs d'une lésion méniscale) - Solution : Quelques bases statistiques permettent de sélectionner les tests les plus fiables et précis, permettant ainsi de mieux communiquer entre professionnels et d'éviter les erreurs de diagnostic conduisant à des traitements inadaptés Evaluation en Physiothérapie - Numéro 1 - Société de Physiothérapie de Bourgogne - A. Kubicki 9