Les approches statistiques de l incertitude : tout ce que vous avez toujours voulu savoir sur les valeurs de p et les intervalles de confiance

Documents pareils
23. Interprétation clinique des mesures de l effet traitement

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Item 169 : Évaluation thérapeutique et niveau de preuve

L analyse documentaire : Comment faire des recherches, évaluer, synthétiser et présenter les preuves

Evidence-based medicine en français

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

LECTURE CRITIQUE 1 ER PAS

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

2. Rechercher les études

Principe d un test statistique

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

ÉTAT DES LIEUX. Niveau de preuve et gradation des recommandations de bonne pratique

COMPTE-RENDU D ACCREDITATION DE LA CLINIQUE LA LIRONDE. Saint-Clément-de-Rivière Saint-Gély-du-Fesc

PROGRAMME (Susceptible de modifications)

Méthodologie documentaire spécifique au repérage d actions de terrain

Format de l avis d efficience

Guide d utilisation de BMJ Journals. journals.bmj.com

Estimation et tests statistiques, TD 5. Solutions

Bilan de Santé financière Mango. La gestion financière de votre ONG est-elle saine?

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Jour 1 : Les concepts Les forces du système de santé québécois Comparaisons internationales. 22 octobre Pause réseautage et visite des exposants

Lignes directrices de la soumission publique pour la mise à jour

Études épidémiologiques analytiques et biais

Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5

Document d orientation sur les allégations issues d essais de non-infériorité

Révision des descriptions génériques Comment monter un dossier?

Chapitre 2. Eléments pour comprendre un énoncé

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

La recherche clinique au cœur du progrès thérapeutique

Transgene accorde une option de licence exclusive pour le développement et la commercialisation de son produit d immunothérapie TG4010

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

REPONSE AUX QUESTIONS PORTANT SUR LA MISE EN CONCURRENCE DES CONTRATS ACS. Document du 20 janvier I. Candidature

Analyse de la variance Comparaison de plusieurs moyennes

Recherche documentaire et autoformation. Lecture critique d un article médical. Recommandations pour la pratique. Les maladies orphelines

Équivalence et Non-infériorité

First Line and Maintenance in Nonsquamous NSCLC: What Do the Data Tell Us?

L assurance soins de santé en Belgique : une introduction. Thomas Rousseau 12 juin 2014

Supplément du BDK 24 : Aide à la recherche bibliographique

CE QU IL FAUT SAVOIR PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT

Estelle Marcault 06/02/2015 URC PARIS NORD 1

e-santé du transplanté rénal : la télémédecine au service du greffé

WHO. Fridge-tag 2 Surveillance du stockage avec port USB. qualifié. (World Health Organization)

La certification dans le domaine des prestations de santé. Recommandations de l Académie Suisse des Sciences Médicales

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

Réseau sur. Médicaments. l Innocuité et l Efficacité des. Document d orientation pour la présentation de requêtes au RIEM

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

CODES DE BONNE CONDUITE : QUAND LES SOCIETES JOUENT A L APPRENTI LEGISLATEUR

First do no harm Hippocrates ( BC)

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Cours 9 : Plans à plusieurs facteurs

Estelle Marcault. 20/01/2012 URC Paris Nord 1

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Établissement des taux d actualisation fondés sur la meilleure estimation aux fins des évaluations de provisionnement sur base de continuité

Choix méthodologiques pour l évaluation économique à la HAS

Tests de détection de l interféron γ et dépistage des infections tuberculeuses chez les personnels de santé

HABITAT INDIGNE, SOUFFRANCE PSYCHIQUE. ET DEFENSES DELIRANTES DANS LES EXCLUSIONS (internes et externes) Lyon, 2014

PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT CE QU IL FAUT SAVOIR

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

Brock. Rapport supérieur

PROBABILITES ET STATISTIQUE I&II

Faut-il encore modifier nos pratiques en 2013?

Services de conciliation en assurance Cadre de collaboration et de surveillance. Approuvé par le CCRRA en juin 2015

La recherche documentaire

RECOMMANDATION FINALE DU CCEM

Journal de la migraine

Validation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS Lyon

La valeur présente (ou actuelle) d une annuité, si elle est constante, est donc aussi calculable par cette fonction : VA = A [(1-1/(1+k) T )/k]

Sélection et Évaluation Quantitative des Médicaments pour la Prise en Charge du VIH/SIDA. Sophie Logez, OMS/PSM Addis Abeba, Ethiopie, Février 2005

ELABORATION DU PLAN DE MONITORING ADAPTE POUR UNE RECHERCHE BIOMEDICALE A PROMOTION INSTITUTIONNELLE

7. Recherche des essais

MARCHÉ DE L ÉLECTRI- CITÉ : CONCURRENCE ET DÉSENCHEVÊTREMENT DU «SWISS GRID»

La formation interprofessionnelle pour les professions de la santé: L avenir C est dès maintenant!

Bases de données documentaires et distribuées Cours NFE04

INTRODUCTION EN BOURSE EVALUATION D ENTREPRISE

Ambassade de France au Royaume-Uni Service Science et Technologie. Octobre Télescope Lovell - Copyright : Jodrell Bank, University of Manchester

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

N o t e m é t h o d o l o g i q u e. Art. 60 du règlement n 1083/2006 et art. 13 du règlement n 1828/ voir annexe n 1.

Lecture critique et pratique de la médecine

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

OUVERTURE ET MISE EN PLACE

Suites numériques 3. 1 Convergence et limite d une suite

Rapport final sur les priorités en matière de surveillance de la médecine

Une échelle d évaluation semistructurée. B. Gravier

CAS CLINIQUES. Technologie

Définition, finalités et organisation

Évaluations aléatoires : Comment tirer au sort?

Docteur José LABARERE

Réussir l ouverture d un commerce de restauration rapide

Introduction aux Statistiques et à l utilisation du logiciel R

Evaluation de critères res de substitution de la survie globale dans les cancers bronchiques localement avancés

Journée technique ARRA Gestion quantitative de la ressource en eau

4. L assurance maladie

- MANIP 2 - APPLICATION À LA MESURE DE LA VITESSE DE LA LUMIÈRE

BERTHIER E, CHRISTIANO M, PHILIPPE M O, IEHL J, TATARU N, DECAVEL P, VUILLIER F, ELISEEF A, MOULIN T. Introduction (1). Contexte de l étude

PEUT ON PRESCRIRE HORS AMM? LE POINT DE VUE DU CLINICIEN

Effets sur la pression artérielle rielle des traitements non-médicamenteux

Transcription:

Les approches statistiques de l incertitude : tout ce que vous avez toujours voulu savoir sur les valeurs de p et les intervalles de confiance Nous avons déjà défini, dans un précédent Bloc-Notes statistique, différents termes tels que risque d événements dans le groupe expérimental (REE), risque d événements dans le groupe témoin (RET), réduction absolue du risque (RAR) et nombre de sujets à traiter (NST) [1]. Cependant, les estimations telles que la RAR et le NST ne décrivent pas, à eux seuls, l incertitude qui entoure les résultats. La valeur de p et l IC fournissent des informations supplémentaires, permettant de savoir si les résultats sont cliniquement et statistiquement significatifs (Tableau I). La RAR (différence de risque) est estimée à 19,6%, avec un IC à 95% qui va de 5,7% à 33,6%. La valeur de p (0,006) signifie qu une RAR de 19,6% ou davantage ne serait observée que dans 6 essais sur 1 000 si la streptomycine avait la même efficacité que le repos au lit. La valeur de p étant inférieure à 0,05, les résultats sont statistique- ment significatifs (c est-à-dire qu il est peu vraisemblable que la streptomycine soit inefficace en termes de prévention des décès). L IC à 95% suggère que le bénéfice réel probable dû à la streptomycine peut n être que de 5,7% ou atteindre 33,6%, mais qu il est peu vraisemblable qu il soit = 0%. Notre meilleure estimation de la RAR est de 19,6%, et le NST est donc de 6 (IC à 95% : 3 à 18). Cela signifie que pour prévenir 1 décès supplémentaire par tuberculose nous pourrions avoir à traiter par streptomycine plutôt que par le seul repos au lit 18 patients au maximum ou 3 au minimum. Tableau I. Résultats de l ECR ayant comparé la streptomycine au seul repos au lit dans le traitement de la tuberculose Intervention Survie Décès Risque de décès RAR IC à 95% Valeur de p Streptomycine (n=55) 51 4 4/55=7,3% (REE) 25,9% - 7,3%=19,6% 5,7% à 33,6% 0,006 Repos au lit (n=52) 38 14 14/52=25,9% (RET) Bloc-Notes publié dans Evidence-Based Medicine 2005;10(5):133-4. 1

INTRODUCTION Qu est-ce que l incertitude diagnostique? L incertitude statistique est l incertitude (présente même dans un échantillon représentatif) liée à l extrapolation de données observées dans un échantillon à une population plus vaste. Pourquoi faut-il mesurer l incertitude? Il n est généralement pas possible d inclure tous les sujets d une population cible dans une seule étude. Par exemple, il n est pas possible d inclure tous les sujets hypertendus dans un essai comparatif randomisé (ECR) concernant un nouveau traitement de l hypertension artérielle. L alternative est d assigner un échantillon (un petit sous-ensemble de cette population) à recevoir soit le nouveau traitement, soit le traitement standard. Quelles sont les mesures de l incertitude? Le degré d incertitude présent dans une étude peut être quantifié en testant une hypothèse (par le calcul de ka valeur de p) ou à l aide de l intervalle de confiance (IC), mais la préférence est généralement accordée à l IC. POURQUOI LA VALEUR DE 5% (p < 0,05) EST-ELLE UTILISÉE POUR INDIQUER LA SIGNIFICATIVITÉ STATISTIQUE? C est par convention qu une valeur de p < 0,05 indique la significativité statistique. Cependant, il s agit là d un minimum arbitraire, et la valeur de p devrait être beaucoup plus petite, comme dans l étude présentée ci-dessus (p = 0,006), avant que l on puisse considérer qu elle fournit une preuve solide à l encontre de l hypothèse nulle. Il est donc plus utile de rapporter la valeur exacte de p (par exemple, p = 0,027) que de se contenter du constat que le résultat est significatif à 5% (ou à 1% comme dans le cas cidessus). SI UN EFFET EST STATISTIQUEMENT SIGNIFICATIF, CELA SIGNIFIE-T-IL QU IL EST AUSSI CLINIQUEMENT SIGNIFICATIF? Une différence statistiquement significative n est pas nécessairement cliniquement significative (ou cliniquement importante). Dans l exemple ci-dessus, l effet statistiquement significatif (p = 0,006) est aussi cliniquement significatif, car une amélioration même modeste de la survie est importante. Cependant, pour de nombreux effets, il faut que le bénéfice soit Bloc-Notes publié dans Evidence-Based Medicine 2005;10(5):133-4. 2

nettement supérieur à zéro pour être cliniquement significatif (c est-à-dire pour qu il soit suffisant pour justifier l effort thérapeutique). Dans la Figure 1, alors que les deux études (a) et (c) ont un résultat statistiquement significatif, car les IC ne chevauchent pas la valeur correspondant à l «absence de différence», seule l étude (a) a un résultat correspondant pour le moins (en termes d IC) à une différence minimale cliniquement importante (DMCI). Les études (b) et (d) ne sont pas statistiquement significatives, leur IC recouvrant les valeurs qui correspondent à l absence de différence. EXISTE-T-IL UN RAPPORT ENTRE VALEURS DE p ET INTERVALLES DE CONFIANCE? Alors que les deux approches qui permettent de résoudre le problème de l incertitude sont quelque peu différentes, les valeurs de p et les IC donnent généralement des résultats concordants. Si l effet est statistiquement significatif (au seuil de 5%), l IC à 95% n inclura pas la valeur correspondant à «l absence de différence», et vice versa. Si les IC sont préférables aux valeurs de p pour résumer les résultats d une étude, les deux approches sont couramment utilisées. Bloc-Notes publié dans Evidence-Based Medicine 2005;10(5):133-4. 3

Comparaison de l utilisation des valeurs de p et des intervalles de confiance dans l inférence statistique POURQUOI FAUT-IL PRENDRE EN COMPTE LA TAILLE DE L ÉCHANTILLON LORSQUE L ON INTERPRÈTE LA VALEUR DE p ET LA LARGEUR DE L IC? Plus l échantillon est important, plus l incertitude est faible, plus l IC est étroit et, par conséquent, plus l effet observé pouvant être déclaré statistiquement significatif (p < 0,05) est petit. Donc, si un échantillon est très important, une différence même minime (qui peut n avoir aucune pertinence clinique) peut être statistiquement significative (cf. l essai (c) dans Bloc-Notes publié dans Evidence-Based Medicine 2005;10(5):133-4. 4

la Figure 1). La taille de l échantillon, ainsi que son ET, affectent la largeur de l IC. L estimation est d autant plus précise, et de ce fait l IC d autant plus étroit, que l échantillon est plus important (et plus petite sa variance). Un IC large peut donc témoigner soit de la taille limitée de l échantillon, soit de son importante variabilité (cf. essai (b) dans la Figure 1). Tableau II. Erreurs de type I et II Réalité Décision statistique L hypothèse nulle est vraie L hypothèse nulle est fausse Rejet de l hypothèse nulle Erreur de type I Correct (puissance) Non-rejet de l hypothèse nulle Correct Erreur de type II LES CONCLUSIONS DU TEST D UNE HYPOTHESE PEUVENT-ELLES ÊTRE ERRONEES? Le test d une hypothèse étant basé sur des estimations de probabilité, leurs conclusions peuvent être sujettes à erreur. Il existe 2 types d erreur : rejet de l hypothèse nulle alors qu elle est exacte (erreur de type I ; la probabilité de cette erreur est de 5% si le niveau de significativité est fixé à 5%), et non-rejet de l hypothèse nulle alors qu elle est fausse (erreur de type II ; la probabilité de cette erreur est 1 Puissance) (Tableau II). Puissance et taille de l échantillon seront étudiées de façon plus détaillée dans un prochain Bloc-Notes statistique. HELEN DOLL Department of Public Health, University of Oxford, Oxford, Royaume-Uni STUART CARNEY Department of Psychiatry, University of Oxford, Oxford, Royaume-Uni Bloc-Notes publié dans Evidence-Based Medicine 2005;10(5):133-4. Bloc-Notes publié dans Evidence-Based Medicine 2005;10(5):133-4. 5