Chaptre 8 Tests du χ Sommare 1. Itroducto... Prcpe des tests du χ.....1. La statstque du χ..... Les codtos d applcato..3.3. Les degrés de lberté.....3 3. Test du χ d'ajustemet.......4 3.1. Prcpe du test.....4 3.. Applcato et décso.....4 3.3. Ajustemets à dfféretes los de probablté coues...6 3.3.1. Ajustemet à ue lo bomale....6 3.3.. Ajustemet à ue lo de posso.....6 3.3.3. Ajustemet à ue lo ormale....7 4. Test du χ d'égalté des dstrbutos....8 4.1. Prcpe du test.....8 4.. Applcato et décso....10 4.3. Cas partculer de la comparaso de deux fréqueces..11 5. Test du χ d'dépedace.........1 5.1. Prcpe du test.....1-1 -
5.. Applcato et décso.....14 1 Itroducto Karl Pearso est u mathématce brtaque qu a établt la théore géérale de la corrélato et veta la statstque du Kh-deux. Les dfférets tests qu relèvet de la statstque du Kh-deux ou Ch-deux χ ot pour objectf de détermer das quelle mesure les effectfs relatfs à u ou pluseurs caractères qualtatfs (ou caractères quattatfs regroupés e classe) observés sur u ou pluseurs échatllos sot coformes aux effectfs attedus sous l hypothèse ulle, sot d égalté des dstrbutos observées (test d homogéété), Est-ce que la dstrbuto des groupes sagus présete ue répartto géographque e comparat pluseurs populatos géographquemet dstctes? sot d dépedace etre deux caractères qualtatfs (test d dépedace) Est-ce qu l y a dépedace etre la couleur des yeux et la couleur des cheveux? sot de coformté à ue lo de probablté coue (test d ajustemet). Est-ce que la dstrbuto des géotypes observés pour u locus doé das u échatllo est coforme à la dstrbuto attedue sous le modèle de Hardy-Weberg? Quelques sot le test du χ réalsé, l objectf est de détermer s les écarts etre la dstrbuto des effectfs observés et la dstrbuto des effectfs théorques est sgfcatve ou mputable uquemet aux fluctuatos d échatlloage. Prcpe des tests du χ.1 La statstque du χ La statstque du Kh-deux χ cosste à mesurer l écart qu exste etre la dstrbuto des effectfs théorques t et la dstrbuto des effectfs observés et à tester s cet écart est suffsammet fable pour être mputable aux fluctuatos d échatlloage. Par exemple das le cas d u test de χ d ajustemet, où l o veut comparer pour u caractère qualtatf à modaltés ou u caractère quattatf groupé e classes, ue dstrbuto observée et ue dstrbuto théorque, la statstque du χ est la suvate : χ = 1 ( t ) = sut ue lo de Pearso ou χ t L établssemet des dstrbutos des probabltés p va dépedre de la ature du test du χ (hypothèse H 0 ) mas l estmato des effectfs théorques t sera detque à tous les tests. - -
s est l effectf total étudé, l effectf théorque attedu, t pour la modalté de la varable aléatore X est : t = * p (lo des grads ombres e probablté) Quelque sot l hypothèse ulle testée, la stratége est la même pour tous les tests du χ. La statstque du χ calculée (χ ) est comparée avec la valeur seul, χ seul lue sur la table du χ pour -c ddl (degrés de lberté) et pour u rsque d erreur α fxé. s χ χ seul, l hypothèse H 0 e peut être rejetée : dstrbutos des effectfs théorques et observés e sot pas sgfcatvemet dfféretes s χ > χ seul, l hypothèse H 0 est rejetée au seul de sgfcato α et l hypothèse H 1 est acceptée.. Les codtos d applcato Quelque sot le test du χ, la talle de la dstrbuto des effectfs théorques est strctemet detque à celle des effectfs observés c est à dre effectf total. L échatllo étudé dot être de grade talle 50 Le test χ est fodé sur l approxmato, à des los ormales, d ue lo multomale. Pour que cette approxmato sot très boe et be que le test du χ s avère robuste, l est cosellé que les produts t = *p, c est à dre les effectfs théorques t, soet égaux ou supéreurs à 5 et de regrouper les classes adjacetes lorsque ce mmum est recotré...3 Les degrés de lberté Le ombre de degrés de lberté (ddl) est égal au ombre de composates dépedates de la statstque du χ. Le ombre de composates dépedates d ue dstrbuto théorque ayat modaltés (effectfs théorques supéreurs ou égaux à 5) correspod au ombre de termes de la statstque du χ. Mas comme o mpose que la talle de la dstrbuto des effectfs théorques sot detque à la talle de la dstrbuto des effectfs observés, le ème effectf théorque est cotrat d où Le ombre de degrés de lberté maxmum est doc -1. avec le ombre de termes du χ (effectfs théorques 5) - 3 -
Toutes les relatos supplémetares mposées pour le calcul des effectfs théorques coduset à rédure d ue uté le ombre de degrés de lberté. Le ombre de composates o dépedates ou cotrates dépedra de la ature du test du χ ( état ue de ces cotrates, commue à tous les tests du χ ). Le ombre de degrés de lberté est doc -c avec le ombre de termes du χ (effectfs théorques 5) et c le ombre de cotrates etre les dstrbutos comparées. 3 Test du χ d ajustemet Le test du χ d ajustemet correspod à la comparaso d ue dstrbuto de fréqueces observées et d ue dstrbuto de fréqueces théorques. Ce test est fréquemmet utlsé e géétque, où l o cofrote les résultats expérmetaux de crosemets pour u caractère doé à ceux résultat d ue trasmsso medélee de ce caractère. Le champ d applcato de ces méthodes e se lmte pas à la géétque. E effet l utlsato des tests d hypothèse tels que ous les avos défs, mplque la réalsato de certaes hypothèses comme par exemple la ormalté de la varable étudée. Il est doc écessare de comparer la dstrbuto observée des valeurs à celle attedue das le cas d ue dstrbuto ormale de celles-c. 3.1 Prcpe du test Le prcpe du test du χ d'ajustemet est d estmer à partr d ue lo de probablté coue ou férée, les effectfs théorques pour les dfféretes modaltés du caractère étudé (caractère qualtatf ou quattatf regroupé e classe) et les comparer aux effectfs observés das u échatllo. Deux cas peuvet se préseter : sot la lo de probablté est spécfée a pror car elle résulte par exemple d u modèle détermste tel que la dstrbuto medélee des caractères, l évoluto de la talle d ue populato, etc. sot la lo de probablté théorque est pas coue a pror et elle est dédute des caractérstques statstques mesurées sur l échatllo (dstrbuto des fréqueces, moyee et varace)(statstques descrptves). 3. Applcato et décso - 4 -
L établssemet des dstrbutos théorques de probablté se réfèret aux los de probablté. A chaque modalté ou valeur de la varable aléatore X, les probabltés assocées à la lo de probablté sot calculées as que les effectfs théorques attedues sous cette lo : Modalté du caractère A A 1 A... A.. A Effectf observé 1.... = = 1 p p 1 p...p... p = 1 Effectf théorque t = * p t 1 t.. t.. t p = 1 = t = 1 Remarque : S le caractère A e présete que deux modaltés A = succès et A = échec, le test du χ d'ajustemet revet à la comparaso d ue fréquece observée et d ue fréquece théorque (test de coformté). χ La statstque du Kh deux cosste à mesurer l écart qu exste etre la dstrbuto théorque et la dstrbuto observée et à tester s cet écart est suffsammet fable pour être mputable aux fluctuatos d échatlloage. L hypothèse testée est la suvate : H 0 : la dstrbuto observée est coforme à la dstrbuto théorque. H 1 : la dstrbuto observée e s ajuste pas à la dstrbuto théorque. χ ( t ) = modaltés du caractère étudé = 1 t avec l effectf observé et t l effectf théorque attedu sous H 0 χ est comparée avec la valeur seul, χ seul lue sur la table du χ pour -c ddl (degrés de lberté) et pour u rsque d erreur α fxé. Remarque : Il est mpératf que les codtos d applcato soet vérfées : talle de l échatllo 50 et les p 5. Exemple : Sot le locus ballélque codat pour la glucose 6 phosphate déhydrogéase (G6PDH), ezyme partcpat au métabolsme éergétque (dégradato des sucres), l aalyse électrophorétque des géotypes chez l aophèle, vecteur de la malara, doe la répartto suvate - 5 -
FF = 44, FS = 11, SS = 105. La répartto des géotypes est-elle coforme au modèle de Hardy-Weberg? Répose. 3.3 Ajustemets à dfféretes los de probablté coues 3.3.1 Ajustemet à ue lo bomale Applcato Est-ce que la dstrbuto du ombre de flles observées das 30 fratres de 5 efats sut ue lo bomale de paramètre B(5, 0,5)? Répose. X : bre de flles () 0 1 3 4 5 bre de fratres observées ( ) 18 56 110 88 40 8 La dstrbuto théorque sut ue lo bomale B(, p) p = P(X = ) = C p q avec :bre d épreuves p : probablté du succès : bre de valeurs prses X Le ombre de degrés de lberté est : ombre de termes du χ ( ) mos le ombre de cotrates c c = 1 () s p est coue = 1 c = ( et ˆp ) s p est coue avec ˆp = = 1 x ombre de succès = ombre d ' observato Exemple : Refare le test du χ d ajustemet e utlsat pour p, la fréquece du ombre de flles das les fratres de 5 efats, so estmato fate à partr des doées de l échatllo. Répose. 3.3. Ajustemet à ue lo de posso Applcato Est-ce que le ombre de cas graves tratés chaque jour par u vétérare sur ue pérode de 00 jours sut ue lo de posso? Répose. - 6 -
X : bre de cas graves () 0 1 3 4 5 et plus bre de jours ( ) 50 74 50 1 4 1 La dstrbuto théorque sut ue lo de posso P(λ) λ p = P(X = ) = e λ! : ombre de valeurs prses X Le ombre de degrés de lberté est : ombre de terme du χ ( ) mos le ombre de cotrates c c = 1 () s λ est cou c = ( et ˆλ ) s λ est cou avec ˆλ = x Remarque : La dstrbuto de posso état pas borée lorsque X +, l est écessare de borer la dstrbuto e estmat la probablté de la derère classe par dfférece avec la somme des probabltés qu est de 1. Exemple : E repreat les doées relatves à la cécdomye du hêtre, peut-o affrmer que la répartto du ombre de galles par feulle sut ue lo de posso? Répose. 3.3.3 Ajustemet à ue lo ormale Applcato Le caractère «talle» mesuré sur 1000 dvdus peut-l être cosdéré comme suvat ue lo ormale? Répose. X : talle e cm (x ) < 155 [ 155-165 ] [ 165-175 ] [ 175-185 ] >185 bre d dvdus ( ) 1 70 500 379 50-7 -
La dstrbuto théorque sut ue lo ormale (µ,σ) P(a X b) = P(z a Z z b ) = π(b) - π(a) (vor probabltés) avec la varable cetrée rédute X µ Z = et σ : ombre de classes de la varable X Le ombre de degrés de lberté est : ombre de terme du χ ( ) mos le ombre de cotrates c c = 1 () s µ et σ coues c = (, ˆµ ) s µ coue avec ˆµ = x (même chose s σ coue ) c = 3 (, ˆµ, ˆ σ ) s µ et σ coues avec ˆµ = x et ˆ σ = s 1 Remarque : La lo ormale état pas borée aux deux extrémtés de la dstrbuto, lorsque X ±, l est écessare de borer la dstrbuto e estmat la probablté des deux classes extrèmes par dfférece avec 0 et 1. S < 50, le test o paramétrque de Lllefors permet de tester la ormalté d ue varable das le cas de fables effectfs. Exemple : E repreat les doées relatves à la logueur de la rectrce de la gélotte hupée, peut-o affrmer que cette mesure sut ue lo ormale? Répose. 4 Test du χ d égalté de dstrbutos Comme pour le test du χ d ajustemet, o cosdère u caractère (quattatf groupé e classe ou qualtatf) présetat pluseurs modaltés (p modaltés) mas défs sur pluseurs échatllos dépedats (q échatllos).l hypothèse H 0 testée est «l égalté des q dstrbutos observées du caractère étudé «. Ce test s apparete aux tests d homogéété. 4.1 Prcpe du test La statstque du Kh deux χ va permettre de mesurer l écart qu exste etre les q dstrbutos des effectfs observés pour la varable qualtatve X sous l hypothèse d égalté des dstrbutos das les q populatos comparées. O teste s cet écart est suffsammet fable pour être mputable aux fluctuatos d échatlloage. Les doées sot structurées sous forme d u tableau des effectfs observés ou table de cotgece. - 8 -
Caractère A modalté 1 modalté modalté p Total Echatllo 1 11 1 p1.1 Echatllo j 1j j pj.j Echatllo q Total 1q q pq.q 1.. p... = La omeclature commue aux tables de cotgece est basée sur deux dces et j : l effectf j est celu de la coloe et de la lge j avec 1 p et 1 j q l effectf. est la somme des effectfs de la coloe l effectf.j est la somme des effectfs de la lge j l effectf.. est l effectf total de la table de cotgece Le tableau des effectfs attedus sous l hypothèse H 0 : les q échatllos proveet de q populatos où la dstrbuto e fréquece du caractère étudé est detque : Caractère A Echatllo 1 modalté 1 modalté modalté p Total 1.. 1. p.. 1. 1.1 Echatllo j 1.. p.. j. j. j.j Echatllo q Total 1.. p.. q. q. q 1.. p... =.q Sous H 0, l effectf attedu t j correspodat à la modalté du caractère A (A ) pour l échatllo j peut être obteu de la faço suvate : P(A échatllo j) = P(A ) x P(échatllo j) (deux évèemets dépedats) - 9 -
d où P j =.. j j = t avec t j effectf attedu.. j d où t j = * P j as t j = Tous les effectfs attedus sot obteus par le rapport du produt des dstrbutos margales sur l effectf total de la table de cotgece.. j t j =. As, le ombre de degrés de lberté correspodat au ombre d effectfs estmés dépedats est (p - 1)(q - 1). Les effectfs assocés à la coloe p peuvet être obteus par dfférece avec la dstrbuto margale des lges (p-1) et versemet pour les effectfs assocés à la lge q (q-1) (cases dépedates grsées das la table de cotgece). 4. Applcato et décso L hypothèse testée est la suvate : H 0 : la dstrbuto de fréquece du caractère étudé est detque pour les dfféretes populatos comparées. H 1 : la dstrbuto de fréquece du caractère étudé dffère etre les dfféretes populatos comparées. χ p q ( ) j tj = p : ombre de coloes, q : ombre de lges t = 1 j= 1 j avec j l effectf observé et t j l effectf théorque attedu sous H 0 χ est comparée avec la valeur seul, χ seul lue sur la table du χ pour (p-1)(q-1)ddl (degrés de lberté) et pour u rsque d erreur α fxé. s χ > χ seul l hypothèse H 0 est rejetée au rsque d erreur α : les dfférets échatllos sot extrats de populatos ayat des dstrbutos dfféretes du caractère étudé. s χ χ seul l hypothèse H 0 est acceptée: les dfférets échatllos sot extrats de populatos ayat la même dstrbuto du caractère étudé. Remarque : La statstque du Kh-deux χ e peut être calculée que s les effectfs théorques t j sot supéreurs à 5. Das ce cas, l faut regrouper à la fos toute la lge et toute la coloe correspod à la case possédat ue valeur t j féreur à 5. Exemple : - 10 -
Les groupes sagus A,B,AB et O ot été détermés das tros échatllos (E 1 : Frace, E : Roumae, E 3 : Proche-Oret) d hommes adultes. La répartto des groupes sagus dépedelle d u facteur géographque? Répose. A B AB O E1 54 14 6 51 E 45 14 8 31 E3 33 34 1 33 4.3 Cas partculer de la comparaso de deux fréqueces Le test χ de comparaso de deux fréqueces est u cas partculer du test de comparaso de pluseurs dstrbutos. Das ce cas le caractère étudé présete deux modaltés (A = succès, A = échec) et est étudé sur deux échatllos dépedats extrats de deux populatos. O fat l hypothèse que les deux échatllos proveet de populatos dot les probabltés de succès sot detques : H 0 : p 1 = p. Table de cotgece des effectfs observés (vor omeclature A et B) Table A Table B Succès Echecs Effectfs Succès Echecs Total Echatllo 1 1 1-1 1 11 1.1 Echatllo - ou 1. Total 1 + ( 1 + )-( 1 + ) 1 + 1.... = Table de cotgece des effectfs attedus sous H 0 : p 1 = p Succès Echecs Total Echatllo 1 Echatllo 1.. 1..1 1.....1. Total 1.... = - 11 -
L hypothèse testée est la suvate : H 0 : p 1 = p cotre H 1 : p 1 p χ ( ) j tj = t = 1 j= 1 j sut ue lo du Kh-deux χ avec j l effectf observé et t j l effectf théorque attedu sous H 0 χ est comparée avec la valeur seul, χ seul lue sur la table du χ pour 1 ddl (degrés de lberté) et pour u rsque d erreur α fxé. s χ > χ seul l hypothèse H 0 est rejetée au rsque d erreur α : les deux échatllos sot extrats de deux populatos ayat des probabltés de succès respectvemet p 1 et p. s χ χ seul l hypothèse H 0 est acceptée: les deux échatllos sot extrats de deux populatos ayat même probablté de succès p. Remarque : La statstque du Kh-deux χ e peut être calculée que s les effectfs théorques t j sot supéreurs à 5. Das ce cas, l faut regrouper à la fos toute la lge et toute la coloe correspod à la case possédat ue valeur t j féreur à 5. La statstque du Kh-deux χ d ue table de cotgece x avec 1 ddl correspod au carré d ue varable ormale cetrée rédute ε (démostrato). Exemple : Repredre l exemple de l mpact des travaux drgés das la réusste à l exame de statstque avec le test du Kh-deuxχ. Répose. 5 Test du χ d dépedace 5.1 Prcpe du test Le test du χ d dépedace costtue ue autre formulato du test de comparaso de pluseurs dstrbutos. Das ce cas ce sot les dstrbutos relatves à deux caractères (quattatfs groupés e classe ou qualtatfs) présetat pluseurs modaltés et défs sur ue même populato qu sot comparées. O fat l hypothèse qu l y a dépedace etre les deux caractères das la populato : H 0 : les deux caractères sot dépedats. H 1 : les deux caractères e sot pas dépedats. - 1 -
Les doées sot structurées sous forme d u tableau des effectfs observés pour les deux caractères comparés ou table de cotgece. Caractère A modalté Modalté modalté total 1 p modalté 1 11 1 p1.1 Caractère B modalté j 1j j pj.j modalté q 1q q pq.q Total 1.. p... = avec l effectf j correspod au ombre d dvdus ayat la modalté du caractère A et la modalté j du caractère B avec 1 p et 1 j q l effectf. est la somme des effectfs de la coloe l effectf.j est la somme des effectfs de la lge j l effectf.. est l effectf total de la table de cotgece Le tableau des effectfs attedus sous l hypothèse H 0 : dépedace etre le caractère A et le caractère B. Caractère A modalté 1 modalté modalté p Total modalté 1 1.. 1. p.. 1. 1.1 Caractère B modalté j. p.. j. j. j.j modalté q 1.. q.. q p.. q.q Total 1.. p... = Sous H 0, l effectf attedu t j correspodat à la modalté du caractère A (A ) et à la modalté j du caractère B (B j ) peut être obteu de la faço suvate : - 13 -
P(A B j ) = P j = P(A ) x P(B j ) sous H 0 : dépedace etre les deux caractères d où.. P j = = t j j avec t j effectf attedu d où t j = * P j as. j t j =. 5. Applcato et décso L hypothèse testée est la suvate : H 0 : Idépedace etre le caractère A et le caractère B H 1 : o dépedace etre le caractère A et le caractère B χ p q ( ) j tj = p : ombre de coloes, q : ombre de lges t = 1 j= 1 j avec j l effectf observé et t j l effectf théorque attedu sous H 0 χ est comparée avec la valeur seul, χ seul lue sur la table du χ pour (p-1)(q-1)ddl (degrés de lberté) et pour u rsque d erreur α fxé. s χ > χ seul l hypothèse H 0 est rejetée au rsque d erreur α : l y a pas dépedace statstque etre les deux caractères étudés das la populato. s χ χ seul l hypothèse H 0 est acceptée: les deux caractères étudés das la populato sot statstquemet dépedats. Remarque : La statstque du Kh-deux χ e peut être calculée que s les effectfs théorques t j sot supéreurs ou égaux à 5. Das ce cas, l faut regrouper à la fos toute la lge et toute la coloe correspod à la case possédat ue valeur t j féreur à 5. Exemple : Sur u échatllo de la populato fraçase, o a oté pour chaque persoe, la couleur des yeux et celle des cheveux (aturelle). Peut-o coclure à l dépedace de ces deux caractères qualtatfs? Répose. Yeux Cheveux ors Brus Blods Roux Marros 15 47 83 11 Vert-grs 73 114 37 8 Bleus 36 10 17 10-14 -