Principe d un test statistique

Documents pareils

Principe d un test statistique

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Docteur José LABARERE

Dérivées et différentielles des fonctions de plusieurs variables

Fonction réciproque. Christelle MELODELIMA. Chapitre 2 :

Analyse de la variance Comparaison de plusieurs moyennes

Professeur Patrice FRANCOIS

La pompe cardiaque, le débit cardiaque et son contrôle

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Interactions des rayonnements avec la matière

TESTS D'HYPOTHESES Etude d'un exemple

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

23. Interprétation clinique des mesures de l effet traitement

Cours de Tests paramétriques

Estimation et tests statistiques, TD 5. Solutions

LOGICIELS DE GESTION. Cabinet dentaire AGATHA JULIE GESDENT LOGOS MACDENT POM DADENT TROPHY GESTION VISIODENT ET LES AUTRES

Professeur Diane GODIN-RIBUOT

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Les responsabilités des professionnels de santé

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Document d orientation sur les allégations issues d essais de non-infériorité

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Evolution de la fréquence des sinistres en assurance RC automobile

Grossesse et HTA. J Potin. Service de Gynécologie-Obstétrique B Centre Olympe de Gouges CHU de Tours

Evolution de la fréquence des sinistres en assurance RC automobile

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Compte rendu de LA37 B, TP numéro 1. Evolution de la température et du degrée d'hydratation

Contraception après 40 ans

Item 169 : Évaluation thérapeutique et niveau de preuve

Évaluation du risque cardiovasculaire dans le contexte de l hypertension artérielle et de son traitement

Chapitre 7 : Structure de la cellule Le noyau cellulaire

T de Student Khi-deux Corrélation

Transport des gaz dans le sang

Analyse et interprétation des données

Statistiques Descriptives à une dimension

Relation entre deux variables : estimation de la corrélation linéaire

Base de données bibliographiques Pubmed-Medline

Transport des gaz dans le sang

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Annexe commune aux séries ES, L et S : boîtes et quantiles

THEME 2 : CORPS HUMAIN ET SANTE : L EXERCICE PHYSIQUE

Équivalence et Non-infériorité

Le RIVAROXABAN (XARELTO ) dans l embolie pulmonaire

Validation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS Lyon

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

MESURER SA PRESSION ARTÉRIELLE À DOMICILE. La société québécoise D HYPERTENSION ARTÉRIELLE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Rôle de l ARCl. V Grimaud - UE recherche clinique - 18 mars Définitions

Introduction à l approche bootstrap

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

PROGRAMME (Susceptible de modifications)

QUEL PROTOCOLE DE REENTRAINEMENT PROPOSER AUX PATIENTS INSUFFISANTS CARDIAQUES?

Télé-expertise et surveillance médicale à domicile au service de la médecine générale :

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Compliance (syn. Adhérence - Observance) IFMT-MS-Sémin.Médict.Nov.05 1

STACCINI Pascal UFR Médecine Nice Université Nice-Sophia Antipolis

La filtration glomérulaire et sa régulation

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Essais thérapeutiques d équivalence et de non infériorité

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Qu est-ce qu une probabilité?

Intérêt diagnostic du dosage de la CRP et de la leucocyte-estérase dans le liquide articulaire d une prothèse de genou infectée

Contrôle difficile non prévu des voies aériennes: photographie des pratiques

Pierre Marchand Consultant

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

VI. Tests non paramétriques sur un échantillon

Résumé des communications des Intervenants

La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de

LES FACTEURS DE RISQUE

1. Vocabulaire : Introduction au tableau élémentaire

admission directe du patient en UNV ou en USINV

EVALUATION DES TECHNOLOGIES DE SANTÉ ANALYSE MÉDICO-ÉCONOMIQUE. Efficacité et efficience des hypolipémiants Une analyse centrée sur les statines

Evaluation des stages hospitaliers par les étudiants en médecine

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Chapitre 2 Le problème de l unicité des solutions

Prise en charge de l embolie pulmonaire

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

SYNOPSIS INFORMATIONS GÉNÉRALES

1. Référence : Pièce B-4, HQD-2, document 1, page 9, tableau R-2.1.

Jean-Marie RENARD Université Lille2 - octobre 2007

Apprentissage par renforcement (1a/3)

Qu est-ce-qu un Warrant?

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Don d organes. Notre pays a une nouvelle loi sur la transplantation depuis juillet 2007.

Suppression de la taxe professionnelle et création de la Contribution Economique Territoriale (CET)

Ischémie myocardique silencieuse (IMS) et Diabète.

CONDITIONS GENERALES DE VENTE EN LIGNE

Informations détaillées pour l emploi du calculateur TCF sur le 2 e pilier

Evaluer le risque fracturaire: l outil FRAX (Fracture Risk Assessment Tool)

Les personnes âgées et le système de santé : quelles sont les répercussions des multiples affections chroniques?

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

Transcription:

Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2008/2009 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre le principe général d un test d hypothèse Comprendre les règles de bon usage des tests statistiques Connaître les notions de Risque de première espèce Risque de deuxième espèce Puissance d un test Calcul du nombre de sujets

Objectifs des statistiques Estimer les paramètres d une population inconnue De tendance centrale De dispersion Comparer des paramètres observés sur plusieurs échantillons (populations) Échantillon vs population Plusieurs échantillons Etablir des modèles prédictifs Généralités sur les statistiques 2 possibilités pour décrire / comparer des populations: Tester des populations entières mais c est exceptionnel Tester des échantillons et extrapoler à leurs populations source une statistique = paramètres de l échantillon (moyenne, écart-type, ) inférence statistique = porter une conclusion sur l ensemble de la population source Les tests statistiques sur échantillons n ont d intérêt que rapportés à leur population source Les tests statistiques paramétriques sont liés à des lois de probabilités associer une probabilité de survenue à tout événement

Les tests statistiques en pratique Quelques questions: dans une usine de produits chimiques, le Volume Globulaire Moyen de 30 ouvriers a été testé (92,5µm 3 ) et comparé à celui de 30 employés de bureau (94,7µm 3 ) Avec un traitement A on observe 77% de guérison. Avec un traitement B 68 % Ces différences sont-elles réelles ou dues au hasard? Les tests statistiques substituent à une solution empirique un risque d erreur alpha est le risque qu on accepte de prendre de dire que la différence n est pas due au hasard alors qu elle est due au hasard choix, a priori d un risque «raisonnable» alpha = 5% Les statistiques en pratique Autre mode de résolution pour savoir si deux paramètres différent réellement : l approche par intervalles de confiance (IC) Calcul de précision d une statistique «si je multipliais les expériences donc les échantillons, 95 fois sur 100 le paramètre mesuré serait compris entre X et entre Y C est l intervalle de confiance à 95% (IC95%) du paramètre mesuré (moyenne, pourcentage, risque relatif, odds ratio.)

Les statistiques en pratique Pour savoir si deux paramètres différent réellement on peut utiliser l approche par intervalles de confiance. Exemple : Proportion de guérison avec le traitement A 40% Intervalle de confiance à 95 % IC95% = [30;50] Proportion de guérison avec le TTT B 15% IC95% [6;21] Dans le meilleur des cas B guéris 21 % des patients estimation la plus haute de l intervalle de confiance Dans le pire des cas A guéris 30 % des patients estimation la plus basse de l intervalle de confiance A semble meilleur que B risque alpha = 5% puisque les IC sont estimés à 95 % Rappel IC variable quantitative Pour la moyenne on peut donner la précision de l estimation de la moyenne par l intervalle de confiance de la moyenne moyenne + 1,96 *((écarts type) / Racine(n)) n étant le nombre de cas C est l intervalle de confiance à 95 % de la moyenne si l on retirait au sort 100 fois un échantillon de même taille 95 moyennes estimées sur 100 seraient comprises dans cet intervalle Ex : la moyenne des patients suspects d embolie pulmonaire peut être estimée à 63 ans ± 1 an Ce n est pas la dispersion des valeurs individuelles mais la précision de la mesure

Estimation IC 95% m 1 m 2 m 3 m 4 m i µ. Attention! µ reste constant C'est l'intervalle de confiance qui varie autour de µ pour chaque échantillon. Si l on l a choisi un risque de 5%, en moyenne, l estimation l obtenue dans 1 échantillon sur 20 ne contiendra pas la vraie valeur µ. Intervalle de confiance d'une proportion Un médecin observe 20 cas de guérison parmi 50 cas de cancer. Quel est l'intervalle de confiance qui a 95 chances sur 100 de contenir la vraie valeur du pourcentage de guérison? π : [ 0.40 ± 1.96 π: [ 0.40 ± 1.96 0.07 ] 0.40 0.60 50 où 1.96 est la valeur de la variable N(0,1) correspondant au risque choisi : 5 % Estimation ponctuelle sur 50 cas : 40 % (pourcentage observé) Intervalle de confiance : 26 % à 54 %

Résumé IMPORTANT intervalle de confiance Intervalle de confiance Construit autour de la moyenne observée sur l échantillon Construit en utilisant la variance observée Définit l intervalle «raisonnable» dans lequel la moyenne vraie (théorique) peut se situer au risque 1- α Si 2 IC95% sont disjoints alors le test statistique correspond est significatif au seuil 5% Principe d un test statistique Pour comparer deux paramètres (deux moyennes par exemple) on va se ramener à une valeur qui suit une loi de distribution connue Ex : N (0,1) pour la différence de deux moyennes On va ensuite regarder sur une table de cette loi de distribution, si la valeur observée est une valeur «étonnante» ie peu probable pour cette loi de distribution «banale»

Objectif d un test statistique Un test permet de porter une affirmation en contrôlant le risque d erreur Il donne une réponse à la question : La différence observée entre mes deux paramètres peut-elle être due aux fluctuations d échantillonnage? Les deux paramètres sont-ils deux estimations d une même population théorique? Etapes d un test statistique Poser les hypothèses Hypothèse nulle H0 : les moyennes sont égales Hypothèse alternative H1 : les moyennes sont différentes Chercher à rejetter l hypothèse nulle pour accepter avec un risque d erreur connu l hypothèse alternative Si H0 est vrai alors ma statistique de test suit une loi de distribution connue Définir le risque d erreur acceptable c est le risque alpha de première espèce C est le risque de rejetter H0 alors que H0 est vrai (conclure à tort à une différence) Calculer la p-valeur observée (table de la loi normale par exemple) Comparer la p-valeur observée au risque alpha choisi (0,05) Si p-valeur observée est inférieur au risque alpha on conclu à l existence d une différence statistiquement significative

la p value observée C est un calcul précis ex : p = 0,0275 que l on va comparer au seuil usuel de 0,05 Cela ne reflète pas directement l importance de l effet clinique Delta important cliniquement mais peu de sujets p>>0,05 et pourtant Delta sans signification clinique mais beaucoup de sujets p<<0,001 et pourtant C est un calcul a posteriori Ex : jeu de cartes et pari C est une variable aléatoire la p value observée C est une variable fragile choix du test conditions d applications tests multiples, on ne contrôle plus le risque d erreur ex : taille, poids et périmètre crânien des nouveaux nés On a en fait une probabilité de : 1 (1- α n ) d avoir au moins un test significatif n = nb de tests au seuil α = 0,05 soit ici 15% Ref : DATA TORTURING NEJM

Interpréter un test significatif Si la p-valeur calculée est inférieure au seuil alpha choisi alors On rejette H0 hypothèse d égalité des paramètres On accepte H1 donc on conclu à l existence d une différence significative avec un risque de se tromper inférieur à alpha Donc un test significatif permet de porter une conclusion et de commencer l interprétation causale Interpréter un test non significatif Si la p-valeur calculée est supérieur au seuil alpha choisi alors On ne rejette pas H0 hypothèse d égalité des paramètres Ne pas rejeter H0 c est ne pas rejeter un modèle Modèle d égalité des paramètres C est un des modèles compatibles avec les données Rejeter H0 c est rejeter ce modèle Donc un test non significatif ne permet pas de conclure formellement Ni à l existence d une différence puisque le test est non significatif Ni à la preuve d une absence de différence bien que cette hypothèse fasse partie des possibles

Différence non significative Résultat non non significatif Impossible de conclure Ne prouve pas qu'il n'y a pas d'effet Il n y a peut être pas d effet l effet est trop petit pour être décelable Absence réelle d'effet? Manque de de puissance ou les conditions de mesure de l expérience ne permette pas de conclure (variance trop grande) En pratique dans statview Question : les patients avec une embolie pulmonaire sont-ils en moyenne plus âgés que les patients sans embolie pulmonaire

Hypothèses H0 : la moyenne des patients avec EP = la moyenne des patients sans EP H1 : ces deux moyennes sont différentes Si je rejette H0 alors je conclus à l existence d une différence Résultats staview 1 Nb et moyennes 2 Conditions validité? Info. du groupe pour age Variable groupe : EP nombre Moy. Variance Dév Std Erreur Std NEGATIF 926 61,3 346,4 18,6 0,6 POSITIF 241 69,2 306,7 17,5 1,1 3 Interprétation test Test-t séries non appariées pour age Variable groupe : EP Ecart théorique = 0 Ecart moyen DDL t p NEGATIF, POSITIF -7,9 1165-5,9 <0,0001

Présentation des résultats La dimension clinique prime sur la p valeur Les patients avec EP sont en moyenne plus âgés 61 ans ± 18 ans Que les patients sans EP 69 ans ± 17 ans Cette différence est statistiquement significative p < 0,01 En pratique dans R2web Question : les patients avec un ATCD de MTE ont-ils plus souvent une embolie pulmonaire?

Hypothèses H0 : le pourcentage d embolie pulmonaire chez les patients AVEC ATCD de MTE = le pourcentage d embolie pulmonaire chez les patients SANS ATCD de MTE H1 : ces deux fréquences sont différentes Si je rejette H0 alors je conclus à l existence d une différence Test bilatéral 1 tableau de contingence Résultats R2Web 2 Conditions validité? 34 % des patients avec ATCD ont une EP 18% des patients sans ATCD ont une EP 3 Interprétation test Chi-deux = 25, P valeur observée <0,01

Présentation des résultats La dimension clinique prime sur la p valeur Le pourcentage d EP est plus élevé en cas d ATCD de MTE 64 ep sur 185 patients (34 %) Que sans ATCD de MTE 177 ep sur 982 patients (18 %) Cette différence est statistiquement significative p < 0,01 2.1.1. Test statistique : interprétation Différence observée Test P 5% p > 5% Il est peu probable que la différence observée soit due au hasard Différence significative la probabilité que la différence observée soit due au hasard est forte Différence non significative

Calcul du nombre de sujets nécessaire C est le nombre de sujet nécessaire pour que la différence entre les 2 paramètres soit significative significative au risque alpha choisi (5%) si cette différence existe vraiment 2 moyennes de tension artérielles selon TTT A ou B 2 pourcentages d une pathologie selon FDR présent ou absent (équivalent à RR ou OR = 1) Calcul du nombre de sujets nécessaire Il dépend du delta entre les deux paramètres Il diminue si ce delta est grand Il augmente si delta est petit Il dépend de la variance estimée pour un paramètre continu Il diminue si la variance est faible Il augmente si la variance est grande Il dépend du risque alpha et de la puissance souhaitée pour l expérience Il augmente avec la puissance Il augmente avec un risque alpha plus petit

Nombre de sujets nécessaire Exercice Allez sur le site http://www.u707.jussieu.fr/biostatgv/ Rubrique calcul du nombre de sujets nécessaire Comparer deux moyennes / deux groupes Simuler un essai TTT (puissance 80 % = 0.8, alpha 0.05) avec M1 = 135 mm de hg de tension artérielle systolique dans le groupe A M2 = 145 mm de hg dans le groupe B Combien de sujets - si la variance est faible écart type = 20 (mesure par holter sur 24 H) - si la variance est forte écart type = 60 (brassard à tension) Refaites les calculs avec une puissance de 0.9 puis 0.95 Un mauvaise usage des test : la répétition des tests Conclusion basée non pas sur un seul test mais sur plusieurs Conclusion à un effet à partir du moment où il existe au moins un test significatif parmi n tests Le risque α de la conclusion est bien supérieure à5% Inflation du risque alpha

Comparaisons multiples Aux dés, la probabilité d obtenir un six est plus forte avec 3 dés qu avec un seul Test 1 Test 2 Test 3 Test 4 Risque de conclure à tort à une différence = 5% Risque de conclure à tort à une différence = 5% Risque de conclure à tort à une différence = 5% Risque de conclure à tort à une différence = 5% n risque global 2 0.10 3 0.13 5 0.23 10 0.40 Globalement, le risque de conclure à tort à une différence lors de ces 4 comparaisons est bien plus important que 5%. Inflation du risque alpha Avoir un critère de jugement principal limite le nombre de tests statistiques Décès de toute cause Décès cardiovasculaire Mort subite Infarctus Accident vasculaire cérébraux Chirurgie Pas de définition de critère principal 7 tests statistiques Risque Risque de de conclure conclure à tort tort à l l efficacité efficacitédu du traitement traitement = 30% 30% Critère principal Décès de toute cause Critères secondaires Décès cardiovasculaire Mort subite Infarctus Accident vasculaire cérébraux Chirurgie Définition a priori d un critère principal Un seul test statistique Risque Risque de de conclure conclure à tort tort à l l efficacité efficacitédu du traitement traitement = 5% 5%

Mauvais usage des tests : les analyses en sous-groupes a posteriori Essai non significatif entre 2 TTT A et B p=0.92 NS I) J essaye par tranche d âge 1 Age<75 0.92 NS 2 Age>75 0.95 NS II) J essaye selon le sexe 3 Hommes 0.92 NS 4 Femmes 0.99 NS III) Selon les ATCD 5 Antécédents d'infarctus 0.87 NS 6 Pas d'antécédents d'infarctus 1.03 NS IV) Selon la prise d aspirine 7 Prise d'aspirine 0.03 p<0.05 8 Pas d'aspirine 1.09 NS Mauvais usage des tests : les analyses en sous-groupes a posteriori CA MARCHE!!!! A et mieux que B si on prend de l aspirine en fait on a fait 8 tests avec chacun un risque d erreur de 5% Au total le risque d erreur est >>> 5% Il est de l ordre de 50 % En multipliant les tests on perd le bénéfice des tests : conclure avec un risque d erreur faible et connu

Analyses en sous groupes a posteriori Sont de nature exploratoire Ne donnent pas de démonstration Suggèrent des variations d'efficacité donc des idées de protocoles futurs Biais de publication Les essais statistiquement significatifs sont plus facilement publiés que les négatifs Différence significative Différence non-significative Publication

Biais de publication Un essai peut être positif à tort (risque alpha) Exemple d'un traitement sans efficacité On fait 100 simulations Risque alpha = 5% Essais réalisés Essais publiés E. positifs 5 5 E. négatifs 95 0 Méta-analyse Sur les 100 Sera négative Méta-analyse des 5 publiés Sera positive! Conclusion Un test statistique permet de porter une conclusion avec un risque d erreur connu et contrôlé Le risque alpha de première espèce usuel est 0,05 Pour contrôler le risque d erreur de conclure à tort il faut Choisir le bon test Respecter les conditions de validités des tests Peu de tests, définis à l avance dans un protocole La puissance d un test augmente avec Le nombre de sujets Le contrôle des sources de variabilité (diminution de la variance)

Mentions légales L'ensemble de ce document relève des législations française et internationale sur le droit d'auteur et la propriété intellectuelle. Tous les droits de reproduction de tout ou partie sont réservés pour les textes ainsi que pour l'ensemble des documents iconographiques, photographiques, vidéos et sonores. Ce document est interdit à la vente ou à la location. Sa diffusion, duplication, mise à disposition du public (sous quelque forme ou support que ce soit), mise en réseau, partielles ou totales, sont strictement réservées à l université Joseph Fourier de Grenoble. L utilisation de ce document est strictement réservée à l usage privé des étudiants inscrits à l UFR de médecine de l Université Joseph Fourier de Grenoble, et non destinée à une utilisation collective, gratuite ou payante.