7- Tests d austement, d indépendance et de coélation - Chapite 7 : Tests d austements, d indépendance et de coélation 7. Test d austement du Khi-deux... 7. Test d austement de Kolmogoov-Sminov... 7.. Test de Kolmogoov-Sminov pou deux populations...3 7.3 Test d indépendance ente deux vaiables (test du Khi-deux)...4 7.4 Test su le coefficient de coélation simple ente deux vaiables quantitatives suivant une distibution binomale...5 7.5 Test su le coefficient de coélation de ang (Speaman) ente deux vaiables quantitatives...5 Souvent, nous chechons à auste une distibution à nos données. Une fois la distibution connue, il est possible de calcule toute pobabilité d intéêt. 7. Test d austement du Khi-deux Soit H : La population suit la distibution «x» H : la population ne suit pas la distibution «x» L idée est de découpe le domaine de la distibution en intevalles. Dans chaque intevalle, on calcule à pati de la loi spécifiée sous H la féquence théoique attendue. On compte ensuite combien d obsevations l on etouve dans chaque intevalle. Il suffit alos de compae les féquences obsevées aux féquences théoiques. Supposons que l on divise la distibution en «k» intevalles. Soit un intevalle «i» donné. La féquence théoique attendue pou l intevalle «i» est E i =np i. La statistique = k ( Oi Ei ) Q χ k p i= Ei où «p» epésente le nombe de paamètes estimés de la loi de distibution testée sous H. Note : On ecommande généalement de choisi les intevalles de sote que 5 i. E i Note : Pou un même eu de données, il est couant que plusieus distibutions ne puissent ête eetées pa ce test. Exemple : On a 5 données dont la épatition est la suivante : Intevalle [,,5[ [,5,[ [,,5[ [,5,[ [,,5[ [,5 3,[ [3,, [ Nombe obsevé 3 7 4 Les moyenne et écat-type de l échantillon sont : x =,68 et s=,59 Les féquences théoiques pou une loi nomale de moyenne,68 et de vaiance,59 sont : Intevalle < [,,5[ [,5,[ [,,5[ [,5,[ [,,5[ [,5 3,[ [3, [ Nombe théoique (E i ), 5,5,94 6,3,38 3,38,559,5
7- Tests d austement, d indépendance et de coélation - On egoupe les classes pou avoi E i >5 Intevalle -,,5[ [,5,[ [,,5[ [,5 Nombe théoique (E i ) 6,45,94 6,3 4,37 Nombe obsevé (O i ) 3 7 8 On calcule : Q= 3,75 à compae à une χ. Au niveau α =5%, on lit χ 3, 84. On eette H : la 4,. 5 = distibution suit une loi nomale. (Incidemment, les données de cet exemple ont été généées suivant une loi lognomale de paamètes logaithmiques (,,5)). 7. Test d austement de Kolmogoov-Sminov L idée du test est de compae la fonction de distibution expéimentale à la fonction de épatition théoique. On mesue la difféence maximale ente ces deux fonctions (en valeu absolue). La fonction de épatition expéimentale s obtient facilement en classant les valeus pa ode coissant, x, x < x x,...x n, puis en notant : Fe ( x) = i / n xi x < xi+. x xn On calcule la difféence maximale pa : D = max F ( x) F ( x), le maximum se touvant nécessaiement à un des x i dû à la fome en max ( ) t e escalie de la fonction F e (x). F t (x) est la distibution théoique de la distibution entièement spécifiée sous H. Les valeus citiques de D max ont été tabulées pa dives auteus. n α =. α =.5 α =. 5.5.56.67.37.4.49 5.3.34.4.6.9.35 5.4.6.3 3..4.9 4.9..5 n>4./ n.36/ n.63/ n Le test K-S pemet de teste n impote quelle distibution. Il est nomalement plus puissant que le test du Khi-deux (i.e. il pemet de eete plus facilement H ) et il a l avantage de ne pas equéi de sépae abitaiement le domaine en intevalles. Note : Losque les paamètes spécifiant la distibution sont estimés des mêmes données que celles utilisées dans le test, il s ensuit un austement aux données que les valeus citiques devaient efléte (ces valeus citiques devaient ête evues à la baisse). Des tables «évisées» existent Lindgen, 96. Statistical Theoy. MacMillan, New Yok
7- Tests d austement, d indépendance et de coélation - 3 pou cetaines distibutions paticulièes. Dans la patique, losque «n» est gand, on peut utilise la table pécédente comme test (tès) appoximatif (i.e. si on eette H on auait eeté aussi avec la bonne valeu citique; si on ne eette pas H on ne peut pas conclue). Exemple : Mêmes données que pécédemment : x=.7.68.78.9.96.5.6.6.47.9 On obtient :.45.68.8.9.96.8.8.8.49..5.69.84.93.98.9..33.56.3.6.69.85.94.99..3.34.69 3.33.65.69.9.96..4.5.44.7 3.37.8.6 D max =.657 Nomale(.7,.59 ) Expéimentale.4..5.5.5 3 3.5 4 Ici n=5, de la table on tie D table =,36/5.5 =,9. D max <D table ici, on aive à la conclusion contaie à celle obtenue avec le test Khi-deux, i.e. on ne peut pas eete l hypothèse que la distibution soit nomale. Pa conte, Si l on fait le test apès coection pou l estimation des paamètes de la loi nomale, on eette H. 7.. Test de Kolmogoov-Sminov pou deux populations Si l on a deux échantillons difféents et que l on veut teste si les deux échantillons peuvent poveni de la même population, on peut utilise le test K-S avec les mêmes valeus citiques que pécédemment. Il suffit de constuie les deux fonctions de distibution expéimentales, de calcule l écat maximal ente les deux distibutions (nécessaiement à une des valeus obsevées) et de compae l écat à la valeu citique nn coespondante avec cette fois n =. n + n Si l on adapte les valeus citiques pou teni compte que les paamètes de la loi nomale ont été estimés, on devait utilise la valeu L table =,886/5,5 =,5. Dans ce cas, on eetteait H. La modification à la statistique calculée dans le cas spécifique de la loi nomale a été obtenue pa Lilliefos pa simulation.
7- Tests d austement, d indépendance et de coélation - 4 7.3 Test d indépendance ente deux vaiables (test du Khi-deux) Un tableau de contingence est un tableau coisant les valeus de deux vaiables (qualitatives ou quantitatives, discètes ou continues. L on note la féquence d obsevation des difféentes valeus des deux vaiables. Pou une vaiable continue, celle-ci est découpée en intevalles. Il s agit en quelque sote de la généalisation à deux vaiables du concept d histogamme. Exemple : Vaiable Valeu (ou intevalle) Vaiable Valeu (ou intevalle) Valeu (ou intevalle) 3 Valeu (ou intevalle) n n n 3 n. Valeu (ou intevalle) n n n 3 n. n. n. n.3 n.. Sous hypothèse d indépendance, la distibution conointe est simplement le poduit des distibutions ni. n. maginales, i.e. f i = f i f. Si l on estime f i pa n i /n.. et f i pa n i. /n, on devait donc avoi ni. n.. L idée est de calcule l écat ente les deux temes, le n i obsevé (noté O i ) et le n i pédit ou théoique (noté E i ), si cet écat devient top impotant, on deva eete l hypothèse que les vaiables sont indépendantes. On calcule : c ( ) c ni ni. n. / n.. ( Oi Ei ) Q = = n n / n E i= = i.... i= = La statistique Q est distibuée appoximativement suivant une nombe de valeus ou intevalles des deux vaiables. χ i ( )( c ) où et «c» désignent le Note : Comme pou le test d austement, il faut que la féquence théoique E i 5 i, pou que le test soit valide. Exemple : Une flotte d autobus est équipée de 4 types de pneus (A, B, C,D). On mesue le kilométage pacouu avant usue du pneu. On constuit 3 classes de kilométage (en millies) <, [,3], >3. On a obtenu les ésultats suivants : Obsevé A B C D Total < 6 3 5 3 96 [,3] 8 93 6 448 >3 56 84 69 47 56 Total 8 Les deux vaiables sont-elles indépendantes? On calcule le tableau des féquences théoiques : Théoique A B C D Total < 4 4 4 4 96 [,3] 448 >3 64 64 64 64 56 Total 8
7- Tests d austement, d indépendance et de coélation - 5 et Q=(6-4) /4+(3-4) /4+...+(69-64) /64+(47-64) /64=,8. On compae à une χ = χ, 59. Q>,59, donc on eette l hypothèse que le kilométage ( 4 )(3 ),.5 6,.5 = obtenu soit indépendant de la maque de pneus. 7.4 Test su le coefficient de coélation simple ente deux vaiables quantitatives suivant une distibution binomale Soit l hypothèse H : ρ =. Sous cette hypothèse, on a : ( n ) ~ F, n De façon équivalente, on a aussi : n ~ t n Cette denièe statistique pemettant un test unilatéal ou bilatéal. Le test découle diectement. Note : Si H est plutôt du type ρ = ρ alos il faut ecoui à un aute test. On utilise alos le fait que : + / ln + ρ N / ln ρ, pou constuie le test. n 3 Exemple : Dix échantillons de sols ont été pélevés pou lesquels on a mesué la poosité (n) et la conductivité hydaulique (K) en laboatoie. On a obtenu une coélation de,6 ente log(k) et n. Cette coélation est-elle significative au niveau α =, 5? Ici, on pouvait pévoi que la coélation seait positive, il semble donc plus indiqué d effectue un test n,6 8 unilatéal. on calcule = =,. Comme t 8,.5 =,86, on eette H, i.e. la coélation,6 obsevée est significative. 7.5 Test su le coefficient de coélation de ang (Speaman) ente deux vaiables quantitatives Le coefficient de coélation de ang n est ien d aute que le coefficient de coélation usuel calculé su les angs plutôt que les données butes. L avantage est que ce coefficient n exige pas une elation linéaie ente les deux vaiables (il faut néanmoins que les deux vaiables soient eliées de façon monotone). Les tests pécédents s appliquent à ce coefficient pou founi un test appoximatif. Les cas d égalité sont taités de difféentes façons dans la littéatue, une de celles-ci consistant à octoye le ang moyen aux valeus égales.