UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Aée uiversitaire 2014 2015 L2 Écoomie Cours de B. Desgraupes Méthodes Statistiques Séace 11: Tests d adéquatio II Table des matières 1 Test de Kolmogorov-Smirov 1 1.1 Foctio de répartitio empirique.................. 1 1.2 Procédure............................... 4 2 Exemples 5 3 Table de Kolmogorov-Smirov 7 1 Test de Kolmogorov-Smirov Le test de Kolmogorov-Smirov est u test d ajustemet. La différece avec le test du χ 2 est qu il est fodé sur les foctios de répartitio plutôt que sur les desités. L hypothèse ulle est: H 0 : la loi P a la même foctio de répartitio F qu ue loi cotiue doée. L idée est que, si l hypothèse ulle H 0 est vraie, la foctio de répartitio empirique F de l échatillo doit être proche (e u ses qui va être précisé) de F. 1.1 Foctio de répartitio empirique O cherche à obteir ue estimatio de la foctio de répartitio à partir de l échatillo observé afi de la comparer esuite à la foctio de répartitio de la loi théorique. 1
Pour cela, o commece par trier par ordre croissat les valeurs X i de l échatillo. O les appelle traditioellemet des statistiques d ordre. La foctio de répartitio empirique est défiie par: F (x) = 0 pour x < X 1 i pour X i x < X i+1 1 pour x X O estime doc F (x) = P (X x) au moye de la proportio F (x) d élémets de l échatillo qui sot iférieurs ou égaux à x. Exemple Cosidéros la séquece de ombres suivate : 0.06 0.11 0.29 0.63 0.94 1.15 1.69 2.66 3.45 O peut la visualiser comme ceci : x 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 2
Foctio de répartitio empirique 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 Il faut doer maiteat u ses à la distace etre la foctio de répartitio empirique et la foctio de répartitio de la loi théorique. O mesure l adéquatio de la foctio F à la foctio F au moye d ue distace particulière dite de Kolmogorov-Smirov, qui est la distace de la orme uiforme etre foctios de répartitio. Graphiquemet, c est le plus grad écart vertical e valeur absolue etre la valeur empirique et la valeur théorique. Pour obteir cette distace, o calcule la différece etre F et F aux poits X i et o cherche le maximum selo la formule: D KS (F, F ) = max i=1,..., { F (Xi ) i, F (X i ) i 1 } Sur le graphique suivat, la courbe cotiue représete ue hypothétique foctio de répartitio, croissat de 0 à 1. 3
Distace de Kolmogorov Smirov 0.0 0.2 0.4 0.6 0.8 1.0 x i 0 1 2 3 4 Sous l hypothèse H 0, la loi de la variable de décisio D KS (F, F ) e déped pas de F. O compare la valeur obteue à ue valeur critique D α () fourie par les tables de Kolmogorov-Smirov (voir à la fi de ce documet). Le test est uilatéral. Si D KS > D α (), o rejette l hypothèse H 0 avec u risque α de se tromper. 1.2 Procédure Voici ue descriptio détaillée de la procédure d exécutio du test de Kolmogorov- Smirov 1. classer les valeurs observées par ordre croissat ; 2. calculer les ombres i, c est-à-dire les valeurs supérieures de la distributio empirique ; 3. calculer les valeurs absolues des écarts F (X i ) i etre F et les valeurs précédetes ; 4. calculer les ombres i 1, c est-à-dire les valeurs iférieures de la distributio empirique ; 5. calculer les valeurs absolues des écarts F (X i ) i 1 etre F et les valeurs précédetes ; 6. la distace de Kolmogorov-Smirov est le plus grad de tous ces écarts ; 4
7. o coclut le test e acceptat l hypothèse H 0 si la distace calculée est iférieure à la valeur critique doée das la table et e la rejetat sio. 2 Exemples Exercice 1 O a testé u échatillo de 5 appareils et oté leurs durées de vie e heures : Appareil 1 2 3 4 5 Durée de vie 133 169 8 122 58 O voudrait savoir si la durée de vie suit ue loi de probabilité expoetielle. O dispose de = 5 observatios. O estime le paramètre λ de la loi expoetielle par la moyee empirique X de l échatillo car X est u estimateur de E(X) = 1 λ. O trouve X = 98 et doc o fera les calculs avec λ = 1/98. La foctio de répartitio de la loi expoetielle est doée par la formule : F (x) = 1 e λ x Voici commet il faut disposer les calculs : i 1 2 3 4 5 X i 8 58 122 133 169 F (X i ) 0.078 0.447 0.712 0.743 0.822 i 0.2 0.4 0.6 0.8 1.0 F (X i ) i 0.122 0.047 0.112 0.057 0.178 i 1 0.0 0.2 0.4 0.6 0.8 F (X i ) i 1 0.078 0.247 0.312 0.143 0.022 La distace de Kolmogorov-Smirov est le plus grad des écarts e valeur absolue. O trouve ici D KS = 0.312. La table de Kolmogorov-Smirov pour = 5 au seuil α = 0.05 doe la valeur critique 0,565. Puisque 0.312 < 0, 565, o accepte l hypothèse H 0. Voici la sortie du logiciel R pour le test précédet : Oe-sample Kolmogorov-Smirov test 5
data: duree D = 0.312, p-value = 0.6165 alterative hypothesis: two-sided O retrouve bie la valeur de la distace D = 0.312. La p-valeur 0.6165 est ettemet supérieure à 0.05, doc o accepte effectivemet l hypothèse H 0. Exercice 2 U calculateur a simulé u échatillo de = 10 valeurs distribuées selo ue loi ormale. Les valeurs X i produites sot ragées par ordre croissat : X 10.8 10.9 11.9 13.5 15.9 16.6 17.4 17.9 18.7 23.0 O va chercher à vérifier si cet échatillo est correct. a) Doer ue estimatio de la moyee et l écart-type de l échatillo. O trouve : X = 15.66 et s(x) = 3.90 b) Calculer, au moye d ue table de la loi ormale, les valeurs de la foctio de répartitio F pour l échatillo. Il faut calculer les quatités F (X i ) pour la loi ormale N (15.66, 3.90). O doit doc cetrer et réduire les observatios e calculat Z i = X i 15.66 : 3.90 Z i -1.25-1.22-0.96-0.55 0.06 0.24 0.45 0.57 0.78 1.88 F 0.106 0.111 0.167 0.290 0.525 0.595 0.672 0.717 0.782 0.970 c) Exécuter u test de Kolmogorov-Smirov au seuil de 5% pour décider si la distributio de l échatillo est e adéquatio avec la loi ormale. Voici le détail des calculs : i 1 2 3 4 5 6 7 8 9 10 X i 10.8 10.9 11.9 13.5 15.9 16.6 17.4 17.9 18.7 23.0 F (X i) 0.106 0.111 0.167 0.290 0.525 0.595 0.672 0.717 0.782 0.970 i 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 F (X i) i 0.007 0.089 0.132 0.110 0.025 0.005 0.028 0.083 0.118 0.030 i 1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 F (X i) i 1 0.107 0.011 0.032 0.010 0.125 0.095 0.072 0.017 0.018 0.070 La distace de Kolmogorov-Smirov est le plus grad des écarts e valeur absolue. O trouve ici D KS = 0, 132. 6
La table de Kolmogorov-Smirov pour = 10 au seuil α = 0.05 doe la valeur critique 0,410. Puisque 0, 132 < 0, 410, o accepte l hypothèse H 0. Voici la sortie du logiciel R pour le test précédet : Oe-sample Kolmogorov-Smirov test data: obs D = 0.1322, p-value = 0.9851 alterative hypothesis: two-sided O retrouve bie la valeur de la distace D = 0.1322. La p-valeur 0.6165 est ettemet supérieure à 0.05, doc o accepte effectivemet l hypothèse H 0. 3 Table de Kolmogorov-Smirov Seuils critiques D α () α = 0.20 α = 0.15 α = 0.10 α = 0.05 α = 0.01 1 0.900 0.925 0.950 0.975 0.995 2 0.684 0.726 0.776 0.842 0.929 3 0.565 0.597 0.642 0.708 0.828 4 0.494 0.525 0.564 0.624 0.733 5 0.446 0.474 0.510 0.565 0.669 6 0.410 0.436 0.470 0.521 0.618 7 0.381 0.405 0.438 0.486 0.577 8 0.358 0.381 0.411 0.457 0.543 9 0.339 0.360 0.388 0.432 0.514 10 0.322 0.342 0.368 0.410 0.490 11 0.307 0.326 0.352 0.391 0.468 12 0.295 0.313 0.338 0.375 0.450 13 0.284 0.302 0.325 0.361 0.433 14 0.274 0.292 0.314 0.349 0.418 15 0.266 0.283 0.304 0.338 0.404 7
Seuils critiques D α () α = 0.20 α = 0.15 α = 0.10 α = 0.05 α = 0.01 16 0.258 0.274 0.295 0.328 0.392 17 0.250 0.266 0.286 0.318 0.381 18 0.244 0.259 0.278 0.309 0.371 19 0.237 0.252 0.272 0.301 0.363 20 0.231 0.246 0.264 0.294 0.356 25 0.210 0.220 0.240 0.270 0.320 30 0.190 0.200 0.220 0.240 0.290 35 0.180 0.190 0.210 0.230 0.270 > 35 1.07/ 1.14/ 1.22/ 1.36/ 1.63/ 8