Les principes des tests d hypothèse

Remarqe La valer de α doit être choisie a priori, jamais en fonction des données observées. 6 2 Le risqe de dexième espèce Le rejet de l hypothèse H 0 se fait a bénéfice d ne atre hypothèse, dite hypothèse alternative, qe nos noterons H 1. Comme sos H 0, la statistiqe étdiée sit sos H 1 ne distribtion théoriqe, centrée sr ne valer δ et dont les caractéristiqes pevent être étdiées. Une fois les données observées, ne atre errer pet être commise si le résltat de la statistiqe d test de comparaison appartient à la zone d acceptation de H 0 alors qe H 0 est fasse (H 1 est vraie). Ce risqe, noté β, est représenté par la srface en gris foncé sr la figre.13. Le risqe de dexième espèce β (o errer de dexième espèce o risqe d errer β) est la probabilité de ne pas rejeter H 0 qand H 0 est fasse : β = P (U < V s /H 1 vraie) sos H 0 sos H 1 Figre.12 Distribtion de la statistiqe étdiée U sos H 1. V s 0 +V s résltat de la statistiqe résltat de la statistiqe A total, ne décision d acceptation o de rejet d ne hypothèse est tojors prise avec incertitde (la réalité n est pas conne). Ces différentes sitations décisionnelles sont représentées dans le tablea ci-dessos. sos H 1 Figre.13 Types d errers possibles dans n test. réalité (inconne) résltat de la statistiqe H 0 vraie H 0 fasse décision retene a v d résltat de la statistiqe H 0 crédible non rejet de H 0 pas d errer risqe β H 0 non crédible rejet de H 0 risqe α pas d errer Biostatistiqe 1

modifier dédire. conclsion 2. sitation interpréter sos H 0 sos H 0 1. hypothèse 4. confrontation V s 0 +V s + V s 0 + +V s 3. observations Figre.14 Distribtion normale centrée rédite sos H 0. Les zones de rejet de H 0 correspondant a risqe de première espèce α sont repérées en gris clair. Le degré de signification p est repéré en gris foncé (sitation où p α). Figre.1 Distribtion normale centrée rédite sos H 0. Le degré de signification p est repéré en gris foncé (sitation où p > α). 7 Interprétation et conclsion Le résltat d n test statistiqe s interprète donc en fonction de la valer seil V s choisie. Premier cas : V s On a : p α ; on rejette H 0 a risqe α de le faire à tort ; il existe ne différence statistiqement significative entre l échantillon et la poplation de référence ; il est sovent écrit : «le test est significatif». Le résltat de la procédre de rejet s exprime avec n risqe d errer α fixé a priori. Le degré de signification p permet de qantifier l incompatibilité de l observation avec l hypothèse nlle. Second cas : < V s On a : p > α ; on ne rejette pas H 0 a risqe β de le faire à tort ; on ne met pas en évidence de différence statistiqement significative entre la poplation d où est iss l échantillon et la poplation de référence ; il est sovent écrit : «le test n est pas significatif». Dans l exemple d paragraphe., nos avons calclé, à l aide de l échantillon de 30 sjets, z = 9,86. La valer seil por α = % est V s = 1,96. Alors : x µ ; on rejette H 0 a risqe α = % de le faire à tort ; il existe ne différence statistiqement significative entre l échantillon et la poplation de référence (c est-à-dire le tor de taille moyen de la poplation française en 2006 est différent de la valer de référence 84,6 cm) ; cette différence est dans le sens d n tor de taille moyen pls grand en 2006 q il ne l était en 1997. 16 Biostatistiqe

Remarqes Attention, n test statistiqe rejette (o ne rejette pas) niqement l hypothèse nlle spécifiée. Il fadra donc tojors expliciter H 0 avant de faire le test et s y reporter por interpréter le résltat d test. De pls, nos avons dit q à ne hypothèse nlle donnée étaient associées n certain nombre de sppositions en fonction d test statistiqe choisi, o conditions d application (qi seront spécifiées lors de la présentation de chaqe test statistiqe). En effet, dans notre exemple, nos avons spposé qe la distribtion d tor de taille moyen était normale, ce qi nos a permis d tiliser le test Z (o test de l écart rédit). Une atre condition nécessaire por ce test est l indépendance des sjets. Par la site, et por chaqe test statistiqe, il fadra vérifier les conditions d application. Il existe sovent des errers d interprétation d degré de signification p. L errer la pls corante est d oblier qe p est calclée si H 0 est vraie. Il s agit donc d ne probabilité conditionnelle. Une atre errer fréqente consiste à confondre signification statistiqe et signification biologiqe. En effet, n résltat statistiqe significatif doit être cohérent avec les connaissances biologiqes sr le sjet. De pls, l importance de la signification statistiqe ne doit pas être confonde avec l importance de l effet étdié : p représente la force de conviction qe l observation soit incompatible avec l hypothèse nlle ; il ne préjge pas de l importance de l effet étdié. Par exemple, n tor de taille moyen observé de 84,6 cm pet être (fortement) significativement différent (p = 0,0001) de la valer de référence 84,6 cm, bien qe cet écart en cm soit très faible (0,0 cm). Inversement, n tor de taille moyen observé de 90 cm, par rapport à la même valer de référence, ne préjge pas d degré de signification. Il se pet assi qe p soit petit par hasard et même par errer de première espèce. Enfin, il est également fréqent de conclre à tort qe l hypothèse nlle est vraie lorsqe le test n est pas significatif. Cela dépend, entre atre, de la pissance d test. Les assertions sivantes sont donc fasses : p est la probabilité qe H 0 soit vraie ; 1 p est la probabilité qe H 1 soit vraie ; p est la probabilité qe les résltats sont ds a sel hasard ; si p > %, alors H 0 est vraie ; pls p est petit, pls l effet d facter étdié est important. Il ne fat pas oblier qe, por des mécanismes complexes liés a vivant, de nombrex facters conns o non entrent en je. Une grande part de ces mécanismes restant inconne, il est sovent nécessaire de faire des sppositions, qe l on ne pet pas tojors vérifier. Il ne sffit donc pas d appliqer des formles mathématiqes, il fat assi qe les conclsions qe l on en tire soient réellement en cohérence avec l ensemble des connaissances scientifiqes. Paragraphe.11 Paragraphe.8 Biostatistiqe 17

sos H 0 V s 0 +V s Figre.16 Pissance d n test. 8 Notion de pissance Lorsqe la conclsion d n test d hypothèse revient à ne pas rejeter H 0, il est cotme de dire qe, par exemple dans le cadre de l étde de l efficacité d n traitement, «l activité d traitement n a pas été démontrée», o qe «l effet favorable d traitement n a pas été mis en évidence». D ne manière assez implicite, cette conclsion s interprète compte ten de l expérience qi a été effectée. Elle n a de sens qe si nos povons envisager q ne atre expérience sos H 1 résltat de la statistiqe 1 : pissance résltat de la statistiqe arait p mettre en évidence ne différence si elle existe, c est-à-dire qe le test arait rejeté H 0 alors q elle est fasse. La probabilité de rejeter H 0 qand H 0 est fasse (H 1 vraie) s appelle la pissance d n test : 1 β = P (U V s /H 1 vraie) La pissance d n test se définit sos H 1. C est la valer complémentaire à 1 d risqe de dexième espèce : pissance = 1 β (c est la srface en gris foncé sr la figre.16). 9 Les variations de la pissance d n test statistiqe Exprimée simplement, la pissance d n test d hypothèses est la «probabilité de discerner ne différence lorsq elle existe». Nos povons alors facilement concevoir q n chercher sohaite entreprendre son étde dans les meilleres conditions, c est-à-dire avec ne pissance a priori maximale. Cependant, le calcl de la pissance d n test d hypothèse est relativement complexe car il fait intervenir différents paramètres statistiqes. Nos allons présenter les variations de la pissance en fonction de certains de ces paramètres statistiqes. 9 1 La variation de la pissance en fonction de α Spposons qe le même test d hypothèse soit réalisé, d ne part, a risqe α 1 et, d atre part, a risqe α 2, avec α 2 < α 1. Alors V s1 est la valer seil déterminée avec le risqe α 1 et V s2 est la valer seil déterminée avec le risqe α 2 et V s2 > V s1. 18 Biostatistiqe

Par exemple, si la loi de la statistiqe étdiée est la loi normale rédite, α 1 = % donne V s1 = 1,96 et α 2 = 1% donne V s2 = 2,8. Totes choses égales par aillers, la dimintion d risqe α agmente la valer seil, entraînant de ce fait ne dimintion de la pissance d test (1 β). (a) avec 1 sos H 0 sos H 1 1 1 1 0 V s1 (b) avec 2 1 sos H 0 sos H 1 0 2 V s2 1 2 Figre.17 Variation de la pissance en fonction de α. Totes choses égales par aillers, la pissance et α varient dans le même sens. 9 2 La variation de la pissance en fonction de la taille de l échantillon Chapitre 4 La précision d ne estimation agmente avec la taille de l échantillon (la variabilité dimine lorsqe la taille de l échantillon agmente). D ne manière graphiqe, cela se tradit par n resserrement de la corbe de distribtion ator de la valer estimée. Ainsi, sos H 0, la corbe de la distribtion théoriqe d n échantillon de taille n 2 > n 1 se resserre ator de son paramètre central et, por conserver n risqe α = %, la valer seil d test dimine. La corbe de la distribtion sos H 1 se resserrant également d fait de l agmentation de n, il s ensit ne agmentation de la pissance (dimintion de β). (a) avec n 1 sos H 0 sos H 1 (b) avec n 2 n 1 Figre.18 Variation de la pissance en fonction de la taille de l échantillon. sos H 0 sos H 1 1 2 1 1 Biostatistiqe 19

Totes choses égales par aillers, la pissance et n varient dans le même sens. 9 3 La variation de la pissance en fonction de l écart des paramètres sos H 0 et sos H 1 Pls n test est pissant, et pls petit pet être l écart entre le paramètre sos H 0 et celi sos H 1. (a) avec 1 sos H 0 sos H 1 1 1 1 (b) avec 2 1 sos H 0 sos H 1 1 2 2 Figre.19 Variation de la pissance en fonction de l écart des paramètres sos H 0 et sos H 1. Totes choses égales par aillers, la pissance et l écart entre H 0 et H 1 varient dans le même sens. 9 4 La variation de la pissance en fonction de la variance Enfin, la pissance d n test varie également en fonction de la variance de la poplation (ce qi est pls difficile à représenter sos la forme de schéma). En effet, si la variance est petite, il est pls facile d attriber n écart entre H 0 et H 1 à n effet réel pltôt q à ne errer d échantillonnage. Pls la variabilité (et donc la variance) sera grande, et pls la pissance sera faible. Remarqe Bien qe cela pisse être difficile o parfois pe pertinent en pratiqe, la variabilité pet être rédite en limitant l étde à ne sos-poplation (par exemple, étde limitée à n échantillon d hommes afin de spprimer la variabilité de a sexe). Totes choses égales par aillers, la pissance et la variabilité (et donc la variance) varient en sens inverse. 160 Biostatistiqe

10 Test nilatéral et test bilatéral En débt de ce chapitre, nos avons donné différents exemples concernant la formlation de l hypothèse nlle H 0. Cependant, por ne même hypothèse H 0, il est possible de considérer dex sitations permettant de définir n type d hypothèse alternative H 1. Exemple On s intéresse, d ne part à la drée moyenne vraie de séjor en réanimation après ne chirrgie abdominale µ 1 et, d atre part à la drée moyenne vraie de séjor en réanimation après ne chirrgie vasclaire µ 2. On a prélevé a hasard, parmi les dossiers d n service de réanimation, n 1 = 300 dossiers de malades réanimés après ne chirrgie abdominale et n 2 = 300 dossiers de malades réanimés après ne chirrgie vasclaire. La qestion qe l on se pose est de savoir si la différence m 1 m 2 observée sr les dex échantillons pris a hasard est significative. Dépend-elle des flctations d échantillonnage o d ne atre case? L hypothèse H 0 est µ 1 = µ 2 (o D = µ 1 µ 2 = 0), ax flctations aléatoires près. Si nos pensons qe la drée moyenne vraie de séjor en réanimation après ne chirrgie abdominale est spériere à celle après chirrgie vasclaire, alors H 1 est µ 1 > µ 2 (o D = µ 1 µ 2 > 0), ax flctations aléatoires près. Dans cette sitation, l hypothèse H 1 est formlée de manière nilatérale. Il fat donc avoir des raisons de penser qe la drée moyenne vraie de séjor en réanimation après ne chirrgie abdominale est spériere à celle faisant site à ne chirrgie vasclaire. Nos avons affaire à n test d hypothèses nilatéral. En revanche, si nos pensons qe les drées moyennes vraie de séjor sont différentes, mais sans présmer d sens de cette différence (µ 1 > µ 2 o µ 2 > µ 1 ), alors H 1 est µ 1 > µ 2 o µ 1 < µ 2 (D = µ 1 µ 2 > 0 o D = µ 1 µ 2 < 0), ax flctations aléatoires près. Dans cette sitation, l hypothèse H 1 est formlée de manière bilatérale. Nos avons affaire à n test d hypothèses bilatéral. 10 1 Le test bilatéral Cette sitation se reconnaît par des affirmations symétriqes comme «différent de», «change en miex», «change en pire», etc. On vet savoir si les dex paramètres d intérêt sont statistiqement différents o non, sans s occper de savoir leqel est spérier à l atre (H 1 : µ 1 > µ 2 o µ 1 < µ 2 ). Dans cette sitation, sos H 0, le risqe errer α doit être réparti de part et d atre de 0 afin de tenir compte d signe de la différence (H 1 : D = µ 1 µ 2 > 0 o D = µ 1 µ 2 < 0). test bilatéral sos H 0 : 1 = 2 = 2, % = 2, % rejet de H 0 a profit de H 1 : 1 2 Figre.20 Test bilatéral. V s 0 +V s résltat de la statistiqe rejet de H 0 a profit de H 1 : 1 2 Biostatistiqe 161