o 465 Ajustemet de doées expérmetales 545 Ajustemet de doées expérmetales à ue lo équréparte () Mchel Hery Itroducto Les programmes de termale S et de termale ES e vgueur à la retrée 00 comportet u paragraphe, detque das les deux flères, ttulé Smulato et formulé comme sut : «Étude d u exemple tratat de l adéquato de doées expérmetales à ue lo équréparte» Le commetare est le suvat : «L élève devra être capable de poser le problème de l adéquato à ue lo équréparte et de se reporter à des résultats de smulato qu o lu fourt Le vocabulare des tests (test d hypothèses, hypothèse ulle, rsque de premère espèce) est hors programme» C est be etedu aux tests du Kh-deux (appelés as car ls fot terver la lo d ue varable stadard otée χ ) qu l est fat alluso L troducto de cette oto avat le baccalauréat est ue ouveauté, dot o e peut cotester l térêt : tester la valdté d u modèle est ue démarche essetelle das toute actvté scetfque que beaucoup de os élèves (y comprs ceux qu se drgerot vers les sceces humaes) aurot à pratquer Mas elle est délcate à mettre e œuvre, car elle suppose de la part des esegats ue vso clare autat de la théore sous-jacete que de ses ejeux ddactques Or beaucoup de collègues sot mal à l ase avec la statstque féretelle, ayat pas eu das leur cursus la formato adéquate Objet de la statstque féretelle ou statstque mathématque Statstque féretelle = étude d ue populato statstque et prse de décsos à partr de l observato d u échatllo Notammet : Estmatos de paramètres (proportos, moyees, écarts-types), exemple des sodages Cotrôles d hypothèses (comparasos de moyees, ajustemets à des los probablstes), exemple des tests d adéquato Lorsque les échatllos observés sot aléatores, la théore probablste permet de cotrôler les rsques de predre de mauvases décsos () Pour cet ateler, je me sus largemet spré de l artcle Tests d adéquato à ue lo de probablté du Kh-deux, publé avec Lous-Mare Boeval pour la brochure APMEP 56 Statstque au Lycée, édtée e octobre 005 par la Commsso Iter-IREM Statstque et probabltés
546 Ateler Sm APMEP o 465 Prcpe d u test d hypothèse Par prcpe, u test statstque cosste à cosdérer ue hypothèse (au ses de cojecture) dte ulle, otée H 0, et à regarder s l échatllo prélevé réalse u évéemet E qu, s l hypothèse H 0 état vrae, serat de probablté P H0 (E) relatvemet pette, féreure à u seul doé α Das le cas où l échatllo observé réalse E, o refuse de cosdérer que cet évéemet est seulemet dû aux fluctuatos d échatlloage et o préfère coclure que H 0 est pas acceptable (o dt qu o rejette cette hypothèse, au proft d ue hypothèse alteratve H ) Ce fasat, o pred u rsque de rejeter H 0 alors que seules les fluctuatos d échatlloage sot resposables de la réalsato de l évéemet E, be qu l sot peu probable Test d adéquato à ue lo de probablté Les valeurs observées d u caractère C déf sur ue populato statstque P sot souvet répartes etre modaltés M qu costtuet ue partto du domae de varatos de ce caractère C est drectemet le cas quad C est u caractère qualtatf Il e est de même quad C est quattatf dscret ou cotu, l étude de la répartto de ses valeurs possbles se lmte alors à leur dstrbuto etre u ombre f de classes M dot l explctato costtue le modèle gééral das lequel se stuera l étude À partr d u échatllo de talle prélevé das la populato P, le prcpe d u test d adéquato cosste à comparer la dstrbuto des fréqueces observées (f ), otée (f), des dfféretes modaltés M du caractère C, avec ue lo de probablté théorque (p ), otée (p) par la sute Cette lo de probablté costtue u sous-modèle probablste cesé représeter les varatos du caractère C das la populato etre les dfféretes modaltés M Cadre probablste du test O se place das l hypothèse où p serat la probablté qu u élémet prs au hasard das la populato P sot de modalté M Teat compte des fluctuatos d échatlloage, les fréqueces observées f sot cosdérées comme les valeurs prses sur l échatllo observé par ue famlle de varables aléatores F, otée (F) par la sute, défes sur l esemble des échatllos aléatores de talle que l o peut prélever das la populato P Le test appréce la proxmté des deux famlles (f) et (p), et, le cas échéat, permet de coclure à l adéquato de la dstrbuto des fréqueces observées (f) à la lo théorque doée (p) Pour pouvor applquer des résultats probablstes pussats, o cosdère doc que l échatlloage est aléatore (observato de élémets prs au hasard das la populato, sas que leur prélèvemet modfe sesblemet les probabltés des dfféretes modaltés) O suppose auss que les élémets prélevés le sot dépedammet les us des autres
o 465 Ajustemet de doées expérmetales 547 D u échatllo à l autre, les fréqueces observées fluctuet, reflétat les aléas des prélèvemets Elles respectet cepedat la cotrate f = O dt que la = dstrbuto de fréqueces (f) a degrés de lberté O suppose doc que p est effectvemet la probablté de la modalté M O sat d expérece que quad la talle de l échatllo augmete, les fréqueces observées f tedet à se stablser vers les probabltés p Les los des F peuvet d alleurs être précsées E effet, le ombre N = F d élémets de l échatllo qu sot de modalté M sut ue lo bomale B(, p ), d espérace p et de varace p ( p ) L espérace mathématque de p( p) doc p et so écart-type est Le théorème de Beroull (lo fable des grads ombres) formalse ce phéomèe de stablsato sous la forme : ε > 0, P( F p > ε) 0 quad Das u test d adéquato, o teste l hypothèse : H 0 : «les probabltés des modaltés M sot valablemet modélsées par la lo de probablté (p)» cotre l hypothèse H : «l écart observé etre la dstrbuto de fréqueces (f) des modaltés M das l échatllo et la lo (p) est pas dû au hasard du prélèvemet de cet échatllo» As, sous l hypothèse H 0, les p sot les valeurs moyees autour desquelles les fréqueces F fluctuet Mse e œuvre d u test d adéquato Ue lo modèle est doc doée par ue famlle fe de probabltés (p) où l o suppose que p est la probablté que le caractère d u élémet prs au hasard das la populato sot de modalté M Les M peuvet être les dfféretes qualtés possbles du caractère C ou les dfféretes classes etre lesquelles o a regroupé les valeurs possbles de C, quad ce caractère est quattatf U test d adéquato cosste alors à regarder s, ue dstace d das l espace R état chose, la dstace d((f), (p)) de la lo (p) à la dstrbuto de fréqueces (f) observée das u échatllo de talle, est féreure ou supéreure à ue certae valeur crtque d c Cela revet à défr la valeur crtque d c par la codto que, sous l hypothèse H 0, la varable aléatore D = d((f), (p)), focto des varables F, e devrat dépasser d c qu avec ue probablté féreure ou égale à u seul de sgfcato α O vot que le calcul de cette probablté de cotrôle écesste la coassace, au mos approxmatvemet, de la lo de D sous cette hypothèse H 0 C est le cas F N = est
548 Ateler Sm APMEP o 465 (asymptotquemet () ) de la dstace des tests du Kh-deux (d autres tests utlset d autres dstaces, comme celu de Kolmogorov-Smrov) Dstace du Kh-deux Comme dstace d das R, l peut sembler aturel de cosdérer la dstace eucldee dot le carré est, ce serat effectvemet ue mesure de la dsperso des F autour de leurs moyees p Or, pour les tests du Kh-deux, l s avère plus téressat de cosdérer la quatté d (( f),( p)) = où = f est l effectf de la modalté M das l échatllo Cette focto d peut jouer le rôle d ue dstace pusqu elle est postve et d autat plus pette que les f sot proches des p Mas le fat de podérer les termes de cette somme par les a pour effet de la ormer, e ce ses que pour assez grad, la lo de la varable dute e déped pratquemet plus de et des p, mas seulemet de C est d alleurs exactemet le cas de sa moyee, car pour tout o a : (F p ) Var(F ) E(D ) = E p = p( p) = = = = p = p Ue autre raso est que l o coaît cette lo, c est asymptotquemet ue lo du Kh-deux Cette proprété fat l objet du Théorème du Kh-deux, dû à Karl Pearso (900), coséquece d u grad théorème probablste, le théorème-lmte cetral Théorème du Kh-deux S, das u échatllo aléatore de talle, F désge la fréquece de la modalté M, et s p est la probablté qu u élémet prs au hasard das la (F p) populato sot de modalté M, la sute des varables aléatores D = = p coverge e lo vers la lo du Kh-deux à degrés de lberté, lo d ue varable otée χ Pratquemet, cela sgfe que pour assez grad, et pour tout Q > 0, les probabltés P D > Q sot assez proches des P χ > Q Ue table du Kh-deux ( ) p = D = ( f p ) ( f p) ( p) = p p = = ( ) = p () Quad la talle de l échatllo ted vers l f, la lo de D coverge vers ue lo de χ (e La sute des foctos de répartto des varables aléatores D coverge smplemet vers la focto de répartto de ce χ )
o 465 Ajustemet de doées expérmetales 549 (ou la focto KHIDEUXINVERSE d Excel) doe le quatle Q pour u seul α fxé, vérfat P( χ > Q )= α O admet e gééral que assez grad veut dre : pour tout de à, p ( p ) 5 (o trouve auss > 30 et p 5), codtos qu, s elles e sot pas vérfées, mplquet de regrouper des modaltés pour pouvor applquer ce théorème La lo de χ ν est be coue des probablstes, elle est présetée das les mauels uverstares de statstque O a E( χ ν )= ν et Var( χ ν )= ν D alleurs, d après le calcul c-dessus, pour tout, o a : ED ( )= Pratque d u test du Kh-deux Das la pratque, pour fare u test du Kh-deux, ue lo modèle cojecturée (p) état doée, l faut : ) Vérfer que pour tous les de à, o a p ( p ) 5 (évetuellemet regrouper des modaltés) ) U seul α état doé, trouver das la table du à degrés de lberté la valeur χ telle que P ( χ > χ c ( α) c( α) )= α 3) Explcter la dstrbuto (f) des fréqueces présetées par l échatllo observé 4) Calculer la dstace du Kh-deux : d 5) S d >χc( α), coclure que la lo (p) est pas u modèle suffsammet adéquat pour représeter la dstrbuto de fréqueces (f), e preat u rsque (de premère espèce) de se tromper P( p) ( D > χc( α) )= α féreur à α Adéquato à ue lo équréparte O veut savor s o peut représeter la dstrbuto de fréqueces (f) etre les modaltés M par u modèle d équprobablté : das l hypothèse H 0, les p sot doc supposées égales à L expresso de la dstace du Kh-deux devet : d ( f p) ( p) = = = p p p = = f = = = = = = Ue remarque peut alors smplfer la pratque de ce test et doer leu u éocé smple, accessble e termale χ =
550 Ateler Sm APMEP o 465 Avec α = 0,05, valeur courate, o peut vor das la table du Kh-deux que pour tout, la valeur crtque χ c ( α) est comprse etre et Cette smplfcato, relatvemet grossère, a l avatage d évter d utlser cette table du Kh-deux Le test cosste alors à comparer la dstace d à, ce qu mmse le rsque de se tromper, car PH ( D P D ( ) 0 > )< H ( 0 > χc α ) E smplfat par, cela doe la décso pratque : S f, alors d >χc( α) et o rejette l hypothèse > = d équrépartto du caractère etre ses modaltés, avec u rsque de se tromper PH 0 ( D > ) féreur à 0,05 Avec les effectfs observés das les classes M, = f, cette codto de rejet de l équrépartto s écrt auss : Exemples U dé ppé? Tester s u dé est réguler p = /6, p ( p ) 5 36, (0,05) = ; (0,0) = 5 Tester s ue table de chffres au hasard est coveable p = /0, p ( p ) 5 56, χ c (0,05) = 7 ; χ c (0,0) =,7 ; χ c (0,) = 4,7 3 Tester u géérateur aléatore de chffres Smuler u géérateur ppé, avec dfférets seuls et talles d échatllos Élémets de bblographe = > = = Commsso Iter-IREM Statstque et probabltés : Statstque au Lycée, brochure APMEP o 56, octobre 005 Commsso Iter-IREM Statstque et probabltés : Autour de la modélsato e probabltés, Presses uverstares de Frache-Comté, 00 Dress, F : Probabltés, Statstque, rappels de cours, questos de réflexo, exercces d etraîemet, Duod, Pars, 997 Dutarte P : Pour ue éducato à l férece statstque au lycée, Repères-IREM o 60, jullet 005 Dutarte P : L ducto statstque au lycée llustrée par le tableur, Dder, 005 Dutarte P, Pedor J-L : Eseger la statstque au lycée : des ejeux aux méthodes, Commsso ter-irem Lycées techques, brochure o, 00 χ c χ c
o 465 Ajustemet de doées expérmetales 55 Groupe Probabltés & statstque de l IREM de Besaço : Los cotues, tests d adéquato, ue approche pour o spécalstes, Presses uverstares de Frache-Comté, 005 Saporta, G : Probabltés, Aalyse des doées et Statstque, Techp, Pars, 990 Tratemet de l exercce 3 sur Excel