Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Chapitre 7 Tests d hypothèse Sommaire. Itroductio.. 3. Pricipe des tests......3.. Choix de l hypothèse à tester.4... Hypothèse ulle et hypothèse alterative....4... Test uilatéral et bilatéral..4.. Choix d u test statistique.5.3. Choix de la régio critique et règle de décisio.6.4. Risques d erreur, puissace et robustesse d u test......7.4.. Risque d erreur de première espèce ou risque α...7.4.. Risque d erreur de deuxième espèce ou risque β..8.4.3. La puissace ( - β) et robustesse d u test...8 3. Tests de coformité..... 0 3.. Comparaiso d ue moyee observée et ue moyee théorique..0 3... Pricipe du test.....0 3... Variace de la populatio coue... 0 3..3. Variace de la populatio icoue... 3.. Comparaiso d ue fréquece observée et ue fréquece théorique.3 3... Pricipe du test.... 3 3... Statistique du test.. 4 3..3. Applicatio et décisio..4 - -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) 4. Tests d homogééité......4 4.. Comparaiso de deux variaces......5 4... Pricipe du test.... 5 4... Statistique du test.... 5 4..3. Applicatio et décisio... 6 4.. Comparaiso de deux moyees.. 6 4... Pricipe du test..... 6 4... Les variaces des populatios sot coues 7 4..3. Les variaces des populatios sot icoues et égales.9 4..4. Les variaces des populatios sot icoues et iégales.0 4.3. Comparaiso de deux fréqueces.. 4.3.. Pricipe du test.... 4.3.. Statistique du test ε...... 4.3.3. Applicatio et décisio.. 3 - -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Itroductio U test d hypothèse est u procédé d iférece permettat de cotrôler (accepter ou rejeter) à partir de l'étude d'u ou plusieurs échatillos aléatoires, la validité d hypothèses relatives à ue ou plusieurs populatios. Les méthodes de l iférece statistique ous permettet de détermier, avec ue probabilité doée, si les différeces costatées au iveau des échatillos peuvet être imputables au hasard ou si elles sot suffisammet importates pour sigifier que les échatillos provieet de populatios vraisemblablemet différetes. Les tests d hypothèses fot appel à u certai ombre d hypothèses cocerat la ature de la populatio dot proviet l échatillo étudié (ormalité de la variable, égalité des variaces, etc). E foctio de l hypothèse testée, plusieurs types de tests peuvet être réalisés : Les tests destiés à vérifier si u échatillo peut être cosidéré comme extrait d ue populatio doée, vis-à-vis d'u paramètre comme la moyee ou la fréquece observée (tests de coformité) ou par rapport à sa distributio observée (tests d ajustemet). Das ce cas la loi théorique du paramètre est coue au iveau de la populatio. Est-ce que le taux de glucose moye mesuré das u échatillo d idividus traités est coforme au taux de glucose moye cou das la populatio? (test de coformité) Estce que la distributio des fréqueces géotypiques observées pour u locus doé est coforme à celle attedue sous l'hypothèse du modèle de Hardy-Weiberg? (test d ajustemet). Les tests destiés à comparer plusieurs populatios à l aide d u ombre équivalet d échatillos (tests d égalité ou d homogééité) sot les plus courammet utilisés. Das ce cas la loi théorique du paramètre est icoue au iveau des populatios. O peut ajouter à cette catégorie le test d idépedace qui cherche à tester l idépedace etre deux caractères, gééralemet qualitatifs. Y a-t-il ue différece etre le taux de glucose moye mesuré pour deux échatillos d idividus ayat reçu des traitemets différets? (tests d égalité ou d homogééité). Est-ce que la distributio des fréqueces géotypiques observées pour u locus doé est idépedate du sexe des idividus? (test d idépedace). Pricipe des tests Le pricipe des tests d hypothèse est de poser ue hypothèse de travail et de prédire les coséqueces de cette hypothèse pour la populatio ou l échatillo. O compare ces prédictios avec les observatios et l o coclut e acceptat ou e rejetat l hypothèse de travail à partir de règles de décisios objectives. Défiir les hypothèses de travail, costitue u élémet essetiel des tests d'hypothèses de même que vérifier les coditios d'applicatio de ces derières (ormalité de la variable, égalité des variaces ou homoscédasticité, etc). - 3 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Différetes étapes doivet être suivies pour tester ue hypothèse : () défiir l hypothèse ulle (otée H 0 ) à cotrôler, () choisir u test statistique ou ue statistique pour cotrôler H 0, (3) défiir la distributio de la statistique sous l hypothèse «H 0 est réalisée», (4) défiir le iveau de sigificatio du test ou régio critique otée α, (5) calculer, à partir des doées fouries par l échatillo, la valeur de la statistique (6) predre ue décisio cocerat l hypothèse posée et faire ue iterprétatio biologique. Choix de l hypothèse à tester.. Hypothèse ulle et hypothèse alterative L hypothèse ulle otée H 0 est l hypothèse que l o désire cotrôler : elle cosiste à dire qu il existe pas de différece etre les paramètres comparés ou que la différece observée est pas sigificative et est due aux fluctuatios d échatilloage. Cette hypothèse est formulée das le but d être rejetée. L hypothèse alterative otée H est la égatio de H 0, elle est équivalete à dire «H 0 est fausse». La décisio de rejeter H 0 sigifie que H est réalisée ou H est vraie. Remarque : Il existe ue dissymétrie importate das les coclusios des tests. E effet, la décisio d accepter H 0 est pas équivalete à «H 0 est vraie et H est fausse». Cela traduit seulemet l opiio selo laquelle, il y a pas d évidece ette pour que H 0 soit fausse. U test coduit à rejeter ou à e pas rejeter ue hypothèse ulle jamais à l accepter d emblée... Test uilatéral ou bilatéral La ature de H 0 détermie la faço de formuler H et par coséquece la ature uilatérale ou bilatérale du test. Test bilatéral Si H 0 cosiste à dire que la populatio estudiatie avec ue fréquece de fumeurs «p» est représetative de la populatio avec ue fréquece de fumeurs «p 0», o pose alors : H 0 : p = p 0 et H : p p 0-4 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) H 0 : p = p 0 et H : p p 0 Le test sera bilatéral car o cosidère que la fréquece p peut être supérieure ou iférieure à la fréquece p 0. La régio critique α e vert correspod à ue α probabilité de part et d autre de la courbe. Test uilatéral Si l o fait l hypothèse que la fréquece de fumeurs das la populatio estudiatie p est supérieure à la fréquece de fumeurs das la populatio p 0, o pose alors H 0 : p = p 0 et H : p > p 0 : H 0 : p = p 0 et H : p > p 0 Le test sera uilatéral car o cosidère que la fréquece p e peut être que supérieure à la fréquece p 0. La régio critique α e vert correspod à ue probabilité α. Le raisoemet iverse peut être formulé avec l hypothèse suivate : H 0 : p = p 0 et H : p < p 0 Remarque : Seuls les tests bilatéraux serot développés das le cours. Les tests uilatéraux serot traités au iveau des exemples.. Choix d u test statistique Ce choix déped de la ature des doées, du type d hypothèse que l o désire cotrôler, des affirmatios que l o peut admettre cocerat la ature des populatios étudiées (ormalité, égalité des variaces) et d autres critères que ous préciseros. - 5 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) U test statistique ou ue statistique est ue foctio des variables aléatoires représetat l échatillo dot la valeur umérique obteue pour l échatillo cosidéré permet de distiguer etre H 0 vraie et H 0 fausse. Das la mesure où la loi de probabilité suivie par le paramètre p 0 au iveau de la populatio e gééral est coue, o peut aisi établir la loi de probabilité de la statistique S telle que : S = p p 0 (voir itervalle de cofiace d ue fréquece).3 Choix de la régio critique et règle de décisio Coaissat la loi de probabilité suivie par la statistique S sous l hypothèse H 0, il est possible d établir ue valeur seuil, S seuil de la statistique pour ue probabilité doée appelée le iveau de sigificatio du test : α. La régio critique correspod à l esemble des valeurs telles que S > S seuil et le iveau de sigificatio est telle que : P(S > S seuil ) = α avec P(S S seuil ) = - α Selo la ature uilatérale ou bilatérale du test, la défiitio de la régio critique varie. Test uilatéral H 0 : p = p 0 Test bilatéral H 0 : p = p 0 Hypothèse alterative Valeur de S sous H S = p p 0 Niveau de sigificatio α H : p > p 0 H : p < p 0 H : p p 0 S > 0 S < 0 S 0 P(S > S seuil ) = α P(S < S seuil ) = α P( S > S seuil ) = α Il existe deux stratégies pour predre ue décisio e ce qui cocere u test d hypothèse : la première stratégie fixe a priori la valeur du seuil de sigificatio α et la secode établit la valeur de la probabilité critique α obs a posteriori. - 6 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Règles de décisio : Sous l hypothèse «H 0 est vraie» et pour u seuil de sigificatio α fixé si la valeur de la statistique S calculée (S obs. ) est supérieure à la valeur seuil S seuil S obs > S seuil alors l hypothèse H 0 est rejetée au risque d erreur α et l hypothèse H est acceptée. si la valeur de la statistique S calculée (S obs. ) est iférieure à la valeur seuil S seuil S obs S seuil alors l hypothèse H 0 e peut être rejetée. Remarque : Le choix du risque α est lié aux coséqueces pratiques de la décisio : si les coséqueces sot graves, o choisira α = % ou, mais si le débat est plutôt académique, le traditioel α = 5 % fera le plus souvet l affaire. Règles de décisio : La probabilité critique α telle que P(S S obs. ) = α obs est évaluée si α obs 0,05 l hypothèse H 0 est acceptée car le risque d erreur de rejeter H 0 alors qu elle est vrai est trop importat. si α obs < 0,05 l hypothèse H 0 est rejetée car le risque d erreur de rejeter H 0 alors qu elle est vrai est très faible..4 Risques d erreur, puissace et robustesse d u test.4. Risque d erreur de première espèce α Le risque d erreur α est la probabilité que la valeur expérimetale ou calculée de la statistique S appartiee à la régio critique si H 0 est vrai. Das ce cas H 0 est rejetée et H est cosidérée comme vraie. Le risque α de première espèce est celui de rejeter H 0 alors qu'elle est vraie α = P( rejeter H 0 / H 0 vraie) ou accepter H alors qu elle est fausse α = P( accepter H / H fausse) La valeur du risque α doit être fixée a priori par l expérimetateur et jamais e foctio des doées. C est u compromis etre le risque de coclure à tort et la faculté de coclure. Remarque : Toutes choses état égales par ailleurs, la régio critique dimiue lorsque α décroît (voir itervalle de cofiace) et doc o rejette mois fréquemmet H 0. A vouloir commettre mois d erreurs, o coclut plus raremet. Exemple : - 7 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Si l o cherche à tester l hypothèse qu ue pièce de moaie est pas «truquée», ous allos adopter la régle de décisio suivate : (mettre image d ue pièce) H 0 : la pièce est pas truquée est acceptée si X [40,60] rejetée si X [40,60] doc soit X < 40 ou X > 60 avec X «ombre de faces» obteus e laçat 00 fois la pièce. Quel est le risque d erreur de première espèce α das ce cas? Répose..4. Risque d erreur de deuxième espèce β Le risque d erreur β est la probabilité que la valeur expérimetale ou calculée de la statistique appartiee pas à la régio critique si H est vrai. Das ce cas H 0 est acceptée et H est cosidérée comme fausse. Le risque β de deuxième espèce est celui d accepter H 0 alors qu'elle est fausse β = P( accepter H 0 / H 0 fausse) ou P( accepter H 0 / H vraie) ou rejeter H alors qu elle est vraie β = P( rejeter H / H vraie) Remarque : Pour quatifier le risque β, il faut coaître la loi de probabilité de la statistique S sous l hypothèse H. Exemple : Si l o repred l exemple précédet de la pièce de moaie, la probabilité p d obteir face est de 0,6 pour ue pièce truquée. Si l o adopte toujours la même régle de décisio : H0 : la pièce est pas truquée est acceptée si X [40,60] rejetée si X [40,60] doc soit X < 40 ou X > 60 avec X «ombre de faces» obteues e laçat 00 fois la pièce. Quel est le risque d erreur de secod espèce β das ce cas? Répose..4.3 La puissace et la robustesse d u test ( - β) Les tests e sot pas faits pour «démotrer» H 0 mais pour «rejeter» H 0. L aptitude d u test à rejeter H 0 alors qu elle est fausse costitue la puissace du test. La puissace d u test est : - β = P( rejeter H 0 / H 0 fausse) = P(accepter H /H vraie) La relatio etre les deux risques d erreur figure sur le graphe ci-dessous. - 8 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) - α - β β α 4 0 4 6 8 0 s La puissace d u test est foctio de la ature de H, u test uilatéral est plus puissat qu'u test bilatéral. La puissace d u test augmete avec taille de l'échatillo N étudié à valeur de α costat. La puissace d u test dimiue lorsque α dimiue. Exemple : Si l o repred l exemple précédet de la pièce de moaie, calculez la puissace du test lorsque la probabilité d obteir face est respectivemet 0,3-0,4-0,6-0,7-0,8 pour ue pièce truquée. Que costatez-vous? Répose. Les différetes situatios que l o peut recotrer das le cadre des tests d hypothèse sot résumées das le tableau suivat : Réalité Décisio H 0 vraie H 0 fausse No-rejet de H 0 correct Maque de puissace risque de secod espèce β Rejet de H 0 Rejet à tort risque de première espèce α Puissace du test - β La robustesse d ue techique statistique représete sa sesibilité à des écarts aux hypothèses faites. Exemple : Toute chose état égale par ailleurs, que se passe-t-il si l hypothèse de ormalité est pas satistfaite? - 9 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) 3 Tests de coformité Les tests de coformité sot destiés à vérifier si u échatillo peut être cosidéré comme extrait d ue populatio doée ou représetatif de cette populatio, vis-à-vis d'u paramètre comme la moyee, la variace ou la fréquece observée. Ceci implique que la loi théorique du paramètre est coue au iveau de la populatio. 3. Comparaiso d ue moyee observée et d ue moyee théorique 3.. Pricipe du test Soit X, ue variable aléatoire observée sur ue populatio, suivat ue loi ormale et u échatillo extrait de cette populatio. Populatio icoue Populatio coue X N(µ,) X N(µ 0, 0 ) Echatilloage aléatoire simple Echatillo, x w, s Hypothèses H 0 : µ = µ 0 H : µ µ 0 Le but est de savoir si u échatillo de moyee x, estimateur de µ, appartiet à ue populatio de référece coue d espérace µ 0 (H 0 vraie) et e diffère de µ 0 que par des fluctuatios d échatilloage ou bie appartiet à ue autre populatio icoue d espérace µ (H vraie). Pour tester cette hypothèse, il existe deux statistiques : la variace 0 de la populatio de référece est coue (test ε) ou cette variace est icoue et il faut l estimer (test T). 3.. Variace de la populatio coue 3... Statistique du test Soit X w la distributio d échatilloage de la moyee das la populatio icoue suit ). ue loi ormale telle que : X w N (µ, La statistique étudiée est l écart : S = X - µ 0 dot la distributio de probabilité est la suivate - 0 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) S N (0, ) avec sous H0, E(S) = 0 et V(S) = (voir démostratio) Nous pouvos établir grâce au théorème cetral limite la variable Z cetrée réduite telle que S E( S) X µ 0 Z = = V( S) Sous H 0 : µ = µ 0 X µ 0 Z = avec coue suit ue loi ormale cetrée réduite N(0,). 3... Applicatio et Décisio L hypothèse testée est la suivate : H 0 : µ = µ 0 cotre H : µ µ 0 Ue valeur z de la variable aléatoire Z est calculée : w x µ 0 z = otée aussi ε obs ε calculée (ε obs ) est comparée avec la valeur ε seuil lue sur la table de la loi ormale cetrée réduite pour u risque d erreur α fixé (Règle de décisio ). si ε obs > ε seuil l hypothèse H 0 est rejetée au risque d erreur α : l échatillo appartiet à ue populatio d espérace µ et est pas représetatif de la populatio de référace d espérace µ 0. si ε obs ε seuil l hypothèse H 0 est acceptée: l échatillo est représetatif de la populatio de référece d espérace µ 0. Exemple : La glycémie d ue populatio suit ue loi ormale d espérace µ 0 = g/l et d écart-type 0 = 0, g/l. O relève les glycémies chez 9 patiets. O trouve x =,g/l. Cet échatillo est-il représetatif de la populatio? Répose. - -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) 3..3 Variace de la populatio icoue 3..3. Statistique du test La démarche est la même que pour le test ε mais la variace de la populatio état pas coue, elle est estimée par : ˆ = s (voir estimatio poctuelle) La statistique étudiée est l écart : S = X - µ 0 dot la distributio de probabilité est la suivate ˆ ˆ S N (0, ) avec E(S) = 0 et V(S) = (voir démostratio) Nous pouvos établir grâce au théorème cetral limite la variable T cetrée réduite telle que S E( S) X µ 0 T = = V( S) ˆ Sous H 0 : µ = µ 0 X µ 0 T = ˆ avec icoue suit ue ue loi de Studet à - degrés de liberté.. 3..3. Applicatio et Décisio L hypothèse testée est la suivate : H 0 : µ = µ 0 cotre H : µ µ 0 Ue valeur t de la variable aléatoire T est calculée : x µ 0 x µ 0 t = = ˆ s t calculée (t obs ) est comparée avec la valeur t seuil lue das la table de Studet pour u risque d erreur α fixé et ( - ) degrés de liberté. si t obs > t seuil l hypothèse H 0 est rejetée au risque d erreur α : l échatillo appartiet à ue populatio d espérace µ et est pas représetatif de la populatio de référece d espérace µ 0. si t obs t seuil l hypothèse H 0 est acceptée: l échatillo est représetatif de la populatio de référece d espérace µ 0. - -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Remarque : Si < 30, la variable aléatoire X étudiée doit impérativemet suivre ue loi ormale N(µ,). Pour 30, la variable de studet t coverge vers ue loi ormale cetrée réduite ε. Exemple : Pour étudier u lot de fabricatio de comprimés, o prélève au hasard 0 comprimés parmis les 30 000 produits et o les pèse. O observe les valeurs de poids e grammes : 0,8 0,84 0,83 0,80 0,85 0,86 0,85 0,83 0,84 0,80 Le poids moye observé est-il compatible avec la valeur 0,83g, moyee de la productio au seuil 98%? Répose. 3. Comparaiso d ue fréquece observée et d ue fréquece théorique 3.. Pricipe du test Soit X ue variable qualitative preat deux modalités (succès X=, échec X=0) observée sur ue populatio et u échatillo extrait de cette populatio. Populatio icoue Populatio coue X B(,p) X B(,p 0 ) Echatilloage aléatoire simple Echatillo k k,, f= Hypothèses H 0 : p = p 0 H : p p 0 Le but est de savoir si u échatillo de fréquece observée K, estimateur de p, appartiet à ue populatio de référece coue de fréquece p 0 (H 0 vraie) ou à ue autre populatio icoue de fréquece p (H vraie). - 3 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) 3.. Statistique du test La distributio d échatilloage de la fréquece de succès das la populatio icoue, K suit ue loi ormale telle que : K p0q0 suit N (p, ), les variaces état supposées égales das la populatio de référece et la populatio d où est extrait l échatillo. La statistique étudiée est l écart : S = K p 0 dot la distributio de probabilité est la p0q0 suivate S N (0, démostratio) p q ) avec sous H 0 E(S) = 0 et V(S) = 0 0 (voir Nous pouvos établir grâce au théorème cetral limite la variable Z cetrée réduite telle que K p S E( S) 0 Z = = mais seulemet si p 0 et q 0 0 V( S) p0q0 Sous H 0 : p = p 0 K p Z = p0q0. 0 suit ue loi ormale cetrée réduite N(0,) 3..3 Applicatio et décisio L hypothèse testée est la suivate : H 0 : p = p 0 cotre H : p p 0 Ue valeur z de la variable aléatoire Z est calculée : z = k p0 p0q0 otée aussi ε obs ε calculée (ε obs ) est comparée avec la valeur ε seuil lue sur la table de la loi ormale cetrée réduite pour u risque d erreur α fixé (Règles de décisio ). si ε obs > ε seuil l hypothèse H 0 est rejetée au risque d erreur α : l échatillo appartiet à ue populatio de fréquece p et est pas représetatif de la populatio de référece de fréquece p 0. si ε obs ε seuil l hypothèse H 0 est acceptée: l échatillo est représetatif de la populatio de référece de fréquece p 0. - 4 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Exemple : Ue aomalie géétique touche e Frace /000 des idividus. O a costaté das ue régio doée : 57 persoes atteites sur 50 000 aissaces. Cette régio est-elle représetative de la Frace etière? Répose. 4 Tests d homogééité Les tests d homogééité destiés à comparer deux populatios à l aide d u ombre équivalet d échatillos (tests d égalité ou d homogééité) sot les plus courammet utilisés. Das ce cas la loi théorique du paramètre étudié (par exemple p, µ, ) est icoue au iveau des populatios étudiées. 4. Comparaiso de deux variaces 4.. Pricipe du test Soit X, ue variable aléatoire observée sur populatios suivat ue loi ormale et deux échatillos idépedats extraits de ces deux populatios. Populatio Populatio X N(µ, ) X N(µ, ) Echatilloage aléatoire simple Echatillo Echatillo, x w, s, x w, s Hypothèses H 0 : = H : O fait l hypothèse que les deux échatillos provieet de populatios dot les variaces sot égales. Le test de comparaiso de variace est écessaire lors de la comparaiso de deux moyees lorsque les variaces des populatios et e sot pas coues. C est égalemet la statistique associée à l aalyse de variace. - 5 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) 4.. Statistique du test La statistique associée au test de comparaiso de deux variaces correspod au rapport des deux variaces estimées. Sous H 0 : ˆ = = F obs. ˆ avec ˆ > = s suit ue loi de Fisher-Sedecor à ( -, -) degrés de liberté s car le rapport des variaces doit être supérieur à. ˆ Remarque : Il existe d autres statistiques que celle de Fisher Sédecor pour comparer deux variaces, otammet le test de Hartley qui impose l égalité de la taille des échatillos comparés = mais que ous e développeros pas das ce cours. 4..3 Applicatio et décisio La valeur de la statistique F calculée (F obs ) est comparée avec la valeur F seuil lue das la table de la loi de Fisher-Sedecor pour u risque d erreur α fixé et ( -, -) degrés de liberté. si F obs F seuil l hypothèse H 0 est rejetée au risque d erreur α : les deux échatillos sot extraits de deux populatios ayat des variaces statistiquemet différetes et. si F obs F seuil l hypothèse H 0 est acceptée: les deux échatillos sot extraits de deux populatios ayat même variace. Remarque : Pour l applicatio de ce test, il est impératif que X N(µ,) et que les deux échatillos soiet idépedats. Exemple : U biologiste effectue des dosages par ue méthode de mesure de radioactivité et e dispose doc que d u ombre très limité de valeurs. Les cocetratios C et C mesurées sur deux prélèvemets ot doé les valeurs suivates : C : 3,9 3,8 4, 3,6 C : 3,9,8 3, 3,7 4, La variabilité des valeurs obteues pour les deux prélèvemets est-elle similaire? Répose. - 6 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) 4. Comparaiso de deux moyees 4.. Pricipe du test Soit X u caractère quatitatif cotiu observé sur populatios suivat ue loi ormale et deux échatillos idépedats extraits de ces deux populatios. Populatio Populatio X N(µ, ) X N(µ, ) Echatilloage aléatoire simple Echatillo Echatillo, x w, s, x w, s Hypothèses H 0 : µ = µ H : µ µ O fait l hypothèse que les deux échatillos provieet de populatios dot les espéraces sot égales. Il existe plusieurs statistiques associées à la comparaiso de deux moyees e foctio de la ature des doées. Les variaces des populatios et sot Coues Icoues - 7 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Egales Différetes et 30 et < 30 Test ε Test T Test ε Test o paramétrique 4.. Les variaces des populatios sot coues 4... Statistique du test Soit X w la distributio d échatilloage de la moyee das la populatio suit ue ) et de même pour X w N (µ, ) loi ormale telle que : X w N (µ, X w et X w état deux variables aléatoires idépedates, ous pouvos établir la loi de w w probabilité de la variable aléatoire à étudier X X w w E( X X ) = E( X w ) - E( X w ) = µ - µ (Propriété de l espérace) w w V( X X ) = V( X w ) - V( X w ) = + (Propriété de la variace) w w Sachat que X X suit ue loi ormale N(µ - µ, + ), ous pouvos établir grâce au théorème cetral limite la variable Z cetrée réduite telle que w w w w w w ( X X) ( E( X X) ( X X) ( µ µ ) Z = w w = V( X X) + Sous H 0 : µ = µ avec et coues w w ( X X ) Z = suit ue loi ormale cetrée réduite N(0,) +. 4... Applicatio et décisio L hypothèse testée est la suivate : - 8 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) H 0 : µ = µ cotre H : µ µ Ue valeur z de la variable aléatoire Z est calculée : w w x x z = otée aussi ε obs + ε calculée (ε obs ) est comparée avec la valeur ε seuil lue sur la table de la loi ormale cetrée réduite pour u risque d erreur α fixé. si ε obs ε seuil l hypothèse H 0 est rejetée au risque d erreur α : les deux échatillos sot extraits de deux populatios ayat des espéraces respectivemet µ et µ. si ε obs ε seuil l hypothèse H 0 est acceptée: les deux échatillos sot extraits de deux populatios ayat même espérace µ. Remarque : Pour l applicatio de ce test, il est impératif que X N(µ,) pour les échatillos de taille < 30 et que les deux échatillos soiet idépedats. Exemple : O a effectué ue étude, e milieu urbai et e milieu rural, sur le rythme cardiaque humai : Milieu urbai Milieu rural Effectif de l échatillo 300 40 Moyee de l échatillo 80 77 Variace de la populatio 50 0 Peut-o affirmer qu il existe ue différece sigificative etre les rythmes cardiaques moyes des deux populatios? Répose. 4..3 Les variaces des populatios sot icoues et égales 4..3. Statistique du test Les variaces des populatios état pas coues, o fait l hypothèse que les deux populatios présetet la même variace. H 0 : = = (voir test de comparaiso des variaces) L égalité des variaces w des w deux populatios ou homoscédasticité permet alors d établir la loi de probabilité de X X avec X w N (µ, ) et X w N (µ, ) - 9 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) w w Sachat que X X suit ue loi ormale N(µ - µ, +, ous pouvos établir grâce au théorème cetral limite la variable T telle que w w w w w w ( X X) ( E( X X) ( X X) ( µ µ ) T = w w = V( X X) + Sous H 0 : µ = µ w w ( X X) T = + avec = = suit ue loi de Studet à ( + -) degrés de liberté 4..3. Applicatio et décisio L hypothèse testée est la suivate : H 0 : µ = µ cotre H : µ µ Les variaces des populatios état pas coues, l égalité des variaces doit être vérifiée H 0 : = = cotre H : test de Fisher-Sedecor. Ue valeur t de la variable aléatoire T est calculée : w w x x s + s t = avec ˆ = estimatio de la variace commue + ˆ + t calculée (t obs ) est comparée avec la valeur t seuil lue das la table de Studet pour u risque d erreur α fixé et ( + ) degrés de liberté. si t obs > t seuil l hypothèse H 0 est rejetée au risque d erreur α : les deux échatillos sot extraits de deux populatios ayat des espéraces respectivemet µ et µ. si t obs t seuil l hypothèse H 0 est acceptée: les deux échatillos sot extraits de deux populatios ayat même espérace µ. Remarque : Pour l applicatio de ce test, il est impératif que X N(µ,) pour les échatillos de taille < 30, que les deux échatillos soiet idépedats et que les deux variaces estimées soiet égales. Exemple : - 0 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Das le but d étudier l ifluece du type d atmosphère d élevage sur la durée de développemet des drosophiles femelles, ces derières ot été élevées à 4 C sous atmosphère ormale (N) ou erichie e C0 (C0). Les résultats suivats ot été obteus : N 864, 768, 9, 804, 94, 984, 888, 86, 840, 936, 79, 876 C0 840, 948, 936, 03, 9, 948, 00, 936, 056, 876, 03, 98 Que peut-o coclure? Répose. 4..4 Les variaces des populatios sot icoues et iégales Si les variaces des populatios e sot pas coues et si leurs estimatios à partir des échatillos sot sigificativemet différetes ( test de comparaiso des variaces), il faut cosidérer deux cas de figure selo la taille des échatillos comparés : les grads échatillos avec et supérieurs à 30. les petits échatillos avec et/ou iférieurs à 30. Cas où et > 30 La statistique utilisée est la même que pour le cas où les variaces sot coues. Sous H 0 : µ = µ w w ( X X ) Z = +. suit ue loi ormale cetrée réduite N(0,) Comme les variaces sot icoues et sigificativemet différetes, o remplace les variaces des populatios par leurs estimatios poctuelles calculées à partir des échatillos, ˆ = s et ˆ = s L hypothèse testée est la suivate : H 0 : µ = µ cotre H : µ µ Ue valeur z de la variable aléatoire Z est calculée : w w w w x x x x z = = ˆ ˆ s s + + = ε obs. ε calculée (ε obs ) est comparée avec la valeur ε seuil lue sur la table de la loi ormale cetrée réduite pour u risque d erreur α fixé. - -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) si ε obs > ε seuil l hypothèse H 0 est rejetée au risque d erreur α : les deux échatillos sot extraits de deux populatios ayat des espéraces respectivemet µ et µ. si ε obs ε seuil l hypothèse H 0 est acceptée: les deux échatillos sot extraits de deux populatios ayat même espérace µ. Remarque : Pour l applicatio de ce test, il est impératif que X N(µ,) et que les deux échatillos soiet idépedats. Exemple : Das le but d étudier l ifluece évetuelle de la lumière sur la croissace du poisso Lebistes Reticulus, o a élevé deux lots de ce poisso das des coditios d éclairage différetes. Au 95 ème jour, o a mesuré e mm les logueurs x i des poissos. O a obteu les résultats suivats : Lot (80 idividus) : éclairage à 400 lux x i = 3 780 Lot (90 idividus) : éclairage à 3 000 lux. x i = 043 Que peut-o coclure? Répose. Cas où et/ou < 30 x i = 84 884 x i = 46 586 Lorsque les w variaces w sot iégales et les échatillos de petites tailles, la loi de probabilité suivie par X X est pas coue. O a recours alors au statistique o paramétrique. 4.3 Comparaiso de deux fréqueces 4.3. Pricipe du test Soit X ue variable qualitative preat deux modalités (succès X=, échec X=0) observée sur populatios et deux échatillos idépedats extraits de ces deux populatios. O fait l hypothèse que les deux échatillos provieet de populatios dot les probabilités de succès sot idetiques. Populatio Populatio X B(,p ) X B(,p ) Echatilloage aléatoire simple Echatillo Echatillo k k, k, f =, k, f = - -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) Hypothèses H 0 : p = p H : p p Le problème est de savoir si la différece etre les deux fréqueces observées est réelle ou explicable par les fluctuatios d échatilloage. Pour résoudre ce problème, deux tests de comparaiso de fréqueces sot possibles : Test ε ou test de la variable cetrée réduite et test du Khi-deux χ 4.3. Statistique du test ε K La distributio d échatilloage de la fréquece de succès das la populatio, suit ue loi ormale telle que : K suit N (p pq, ) et de même pour K suit N (p pq, ) si et seulemet si p, q, p, q 0 K et K état deux variables aléatoires idépedates, ous pouvos établir la loi de K K probabilité de la variable aléatoire à étudier K K K E( ) = E( ) - E( K ) = p - p (Propriété de l espérace) K K K V( ) = V( ) + V( K ) = pq pq + (Propriété de la variace) K K p Sachat que suit ue loi ormale N(p - p q pq, + ), ous pouvos établir grâce au théorème cetral limite la variable Z cetrée réduite telle que K K ( p p) Z = pq pq + p+ p Sous H 0 : p = p avec p= + Z = K K pq( + ) suit ue loi ormale cetrée réduite N(0,) - 3 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) 4.3.3 Applicatio et décisio La valeur p, probabilité du succès commue aux deux populatios est e réalité pas coue. O l estime à partir des résultats observés sur les deux échatillos : k+ k pˆ = où k et k représetet le ombre de succès observés + respectivemet pour l échatillo et pour l échatillo. L hypothèse testée est la suivate : H 0 : p = p cotre H : p p Ue valeur z de la variable aléatoire Z est calculée : k k k+ k z = avec pˆ = + pq ˆˆ + z ou ε calculée (ε obs ) est comparée avec la valeur ε seuil lue sur la table de la loi ormale cetrée réduite pour u risque d erreur α fixé. si ε obs > ε seuil l hypothèse H 0 est rejetée au risque d erreur α : les deux échatillos sot extraits de deux populatios ayat des probabilités de succès respectivemet p et p. si ε obs ε seuil l hypothèse H 0 est acceptée: les deux échatillos sot extraits de deux populatios ayat même probabilité de succès p. Exemple : O veut tester l impact des travaux dirigés das la réussite à l exame de statistique. Groupe Groupe Nbre d heures de TD 0 h 30 h Nbre d étudiats 80 50 Nbre d étudiats ayat réussi à l exame 6 9 Qu e cocluez-vous? Répose. - 4 -
Mathématiques : Outils pour la Biologie Deug SV UCBL D. Mouchiroud (8/0/003) - 5 -