Dael Abécasss. Aée uverstare 200/20 Prépa- L. Cours de bo-statstques. Chaptre I : Seres statstques à ue varable. I.. Objectfs. Pour défr le sujet que ous allos trater, je me permets de me référer au mathématce fraças Lauret Schwartz : La statstque est u mode de pesée permettat de recuellr, de trater et d terpréter les doées qu o recotre das dvers domaes et tout partculèremet das les sceces de la ve, du fat que ces doées présetet ue caractérstque essetelle : la varablté. Il est de ce pot de vue clar qu l exste u le tme etre la oto de statstque et celle des probablté : la théore des probablté modélse des phéomèes où le «hasard» tervet. O peut cocevor tros les essetels etre ces deux otos :. Les doées observées sot très souvet etachées d erreurs : Les los des probabltés permettet de représeter les varatos etres valeurs expérmetales et valeurs théorques. 2. La répartto statstque d ue varable est souvet proche de modèles mathématques. 3. Les échatllos d dvdus observés sot la plupart du temps trés au hasard, cec pour assurer leur représetatvté. S le trage est fat de faço équprobable ( je revedra sur la sgfcato de ce terme ), chaque dvdu de la populato a ue probablté costate et be défe d apparter à l échatllo. E preat l exemple évdet d ue molécule médcameteuse que l o met sur le marché modal, o peut compredre le le etre les doées statstques et les probabltés : Celles-c permet de trouver ue modélsato sur ue populato modale. I.2. La démarche statstque. O dstgue deux grads aspect. L aspect exploratore : la statstque descrptve. Celle-c a pour objectf de sythétser, de résumer, de structurer l formato coteue das les doées cocerat u phéomèe étudé. O utlse des représetatos graphques ou des tableaux et o calcule quelques dcateurs. 2. L aspect décsoel : la statstque féretelle. E gééral, les esembles d observato correspodet à des échatllos présetat u caractère aléatore. O essae de modélser le phéomèe à l ade de modèles probablstes. Cela permet so des prévsos, tout du mos des présomptos qu sot préceuses das l étude de certas fats ( socaux, écoomques ou dustrels ). Cette étude permet alors la gééralsato les proprétés d u échatllo représetatf d u esemble plus vaste.
Cec état, o compred que la statstque descrptve précède la statstque féretelle das ue démarche de tratemet de doées. Ces deux aspects se complètet et e s opposet pas. I.3. Déftos fodametales.. populato. Ue populato est u esemble d dvdus sur lesquels o étude u caractère ou ue varable ( qu predra pluseurs valeurs ou modaltés ). Ue statstque porte as sur u esemble dt populato dot les élémets sot appelés dvdus. 2. Echatllos. Lots. U échatllo est ue parte de la populato cosdérée. O étude u échatllo d ue populato lorsque celle-c est mpossble à étuder das so esemble. O cosdère qu u échatllo est représetatf d ue populato das so esemble s celu-c est suffsammet mportat. 3. Caractère : Varable Le caractère est u trat détermé C préset chez tous les dvdus d ue populato sur laquelle o effectue ue statstque. C est la proprété que l o chose d observer et d étuder das la populato ou sur l échatllo cosdéré.
E toute gééralté, o dstgue deux types de varables : A. Les varables qualtatves. U caractère est dt qualtatf s l est repérable sas être mesurable. A ce ttre, les varables qualtatves produset des valeurs o umérques. Preos pour exemples évdets : -La couleur des yeux das ue populato ; -La tete de verres de luettes. -Le sexe et la stuato matrmoale des salarés d ue etreprse. B. Les varables quattatves. U caractère est dt quattatf s l est mesurable. Ce sot des varables ordoées, productves de ombres. Preos les exemples évdets : -La pussace fscale d ue automoble. -Le chffre d affares d ue etreprse. -L âge des salarés d ue etreprse. 4. Les probablstes. Par défto, o peut terpréter la probablté d u évèemet aléatore comme la valeur lmte de la fréquece avec laquelle cet évèemet se réalse au cours d u ombre crossat de répétto de l expérece. O peut répéter ue expérece u ombre f de fos, oté. O aura alors observé ue sous populato appelée échatllo. Chaque expérece aléatore produt u résultat x. O dsposera alors de valeurs : x, x2,..., x esemble appelé échatllo de valeurs de la varable aléatore X, I.4. Déftos et otatos. Effectf et effectf total. O ote gééralemet X le caractère ( varable ) étudé et x la valeur ( ou modalté ) du caractère. O remarquera que das le cas d u caractère cotu O otera : x = c, le cetre de la classe. - l effectf total : Ce sera le ombre total d dvdus qu composet la populato. - l effectf d ue valeur ou d ue classe ( e d u tervalle ). Ce sera l effectf d ue valeur x e le ombre d dvdus assocés à cette valeur. L effectf d ue classe est le ombre d élémets de cette classe. Classe x x 2 Effectfs 2 x x k k = k = est l effectf total.
2. Fréquece. A. Fréquece d ue varable. C est le rapport etre l effectf de cette valeur et l effectf total. f = B. Fréquece d ue classe : Elle est la proporto d dvdus de la populato apparteat à cette classe. O peut l exprmer e terme de pourcetage. f = c Remarque : Il est clar que k = f = avec : k 3. effectf cumulé. L effectf cumulé crossat d ue valeur est égal à la somme des effectfs des valeurs féreures ou égale. N = j j= L effectf cumulé décrossat d ue valeur est égal à la somme des effectfs des valeurs supéreures ou égal 4. Fréquece cumulé La fréquece cumulée crossate est la somme des fréqueces des valeurs féreures ou égale. F = f j= j La fréquece cumulée décrossate est la somme des fréqueces des valeurs supéreures ou égale. I.5. Représetatos des doées et représetatos graphques.. Tableau Nous avos vu qu ue sére statstque à ue varable peut se représeter par u tableau dot les caractérstques sot présetées e lge ou e coloe. Il peut être utle das la plupart des cas de compléter le tableau par les fréqueces cumulées crossate e terme de pourcetage. Doos l exemple sgfcatf suvat :
Remarque : Pour ue varable quattatve, les modaltés sot mesurables. Ce sot : les valeurs umérques poctuelles lorsque la varable est dscrète. Des tervalles lorsque la varable est cotue ou lorsque la varable est dscrète et qu elle comporte beaucoup de modaltés. 2. Graphque. La représetato graphque des doées relatves à u caractère uque repose sur la proportoalté des logueurs ou des ares des graphques, aux effectfs ou aux fréqueces, des dfféretes modaltés du caractère. O peut mettre e évdece : Les «camemberts» utlset la oto d agle et de mesure d agle. Malheureusemet, ces mesures e sot pas toujours acquses Les hstogrammes et les graphques e barres ou e bâtos utlset ue échelle vertcale sur laquelle o porte les effectfs ou les fréqueces. Des courbes de varatos. A. Cas d ue varable qualtatve. Das ce cas, la seule représetato téressate est celle des effectfs ou des fréqueces. O met e évdece : * les tuyaux ou dagrammes e barres ou à bades. * les dagrammes à secteurs ou crculares ( ou camemberts)
Das ce cas, l effectf total est représeté par u dsque. Chaque modalté est représetée par u secteur crculare dot la surface ( agle au cetre ) est proportoelle à l effectf correspodat. L exemple suvat est sgfcatf à ce ttre : les dagrammes e bâtos. O porte e abscsse les modaltés de faço arbtrare. L axe des ordoées met e évdece des segmets dot la logueur est proportoelle aux effectfs ou aux fréqueces de chaque modalté. O appelle alors polygoe statstque la lge obteue e jogat les sommets des bâtos. * Exemple : E 982, les recettes du budget de l état se représetaet de la faço suvate : Taxes sur la valeur ajoutée 348 Impôt sur le reveu 63 Impôts sur les socétés 7 Taxe sur les produts pétrolers 54 Autres mpôts 6 Recettes o fscales 4 TOTAL 838
B. Cas d ue varable quattatve dscrète. Das ce cas, la varable est la mesure du caractère.. Celle-c peut être dscrète ou cotue. O rappelle, à ce propos, qu ue varable est dte dscrète lorsqu elle est pas cotue. Nous e pouvos avor alors des tervalles. Il exste deux types de représetatos graphques : Dagramme dfféretel ; Il correspod à ue représetato des effectfs ou des fréqueces qu met e évdece les dfféreces d effectfs ( ou de fréqueces ) etre les dfféretes modaltés ou classes. La dfférece avec les varables qualtatves cosste e ce que les abscsses sot les valeurs umérques de la varable statstque. Les valeurs dscrètes x prses par les varables sot placées sur l axe des abscsses et les effectfs ou les fréqueces sot placées sur l axe des ordoées. La hauteur du bâto est proportoelle à l effectf. O peut égalemet utlser u dagramme à secteurs s o souhate comparer la parte au tout. Preos pour exemple la sére suvate :
C. Cas d ue varable quattatve cotue. C. Dagramme dfféretel. O utlse u hstogramme. Celu-c est costtué de rectagles cotgus ayat pour base chacue des classes et ue are proportoelle à l effectf ou à la fréquece de la classe correspodate. C 2. Dagramme cumulatf. Cela cosste à mettre e évdece ue courbe cumulatve des effectves et des fréqueces
I.6. Modélsato mathématque- Paramètres de posto et de dsperso.. Le mode. A. Paramètres de posto. O appelle mode ( ou classe modale ) d ue sére l élémet d ue populato correspodat au plus grad effectf. C est la valeur observée d effectf maxmal. Pour ue varable dscrète : Il faut classer les doées par ordre crossat Pour ue varable cotue : La classe modale correspod à la classe ayat l effectf maxmal. Il est fortemet cosellé d utlser u hstogramme pour détermer le mode. La melleure des méthodes expérmetales est de ter compte des classes adjacetes : 2. La moyee. O appelle moyee arthmétque de ombres la valeur suvate : x = x Remarque : S l o a affare à des classes ( e tervalles ) l est écessare de cosdérer le mleu de chaque classe, as, o obtet : x = c Théorème : l est asé de mettre e évdece le caractère léare de la moyee : ax + b = ax + b 3. La médae. Pour ue sére ordoée quelcoque, o appelle la médae Me la valeur qu sépare l esemble de la populato e deux parte de même effectf. :
*Pour des varables dscrètes : La détermato de Me peut s obter à partr du tableau statstque e recherchat la valeur de la varable correspodat à ue focto cumulée égale à ( pour les effectfs cumulés ) ou à = 50% ( 2 2 pour les fréqueces cumulées ). Il est toutefos écessare de fare atteto à la parté de l eter : - S est mpar : =2k+, o a : - S est par : =2k, o a : Das le cas d ue détermato graphque, cela est ecore plus asé * Pour les varables cotues O déterme tout d abord la classe médae e se servat des fréqueces cumulées crossates. La classe médae correspod à l tervalle qu cotet la valeur 50% des fréqueces cumulées. O affe la détermato de Me e cosdérat le théorème de Thalès :
L 4. 4. L étedue. L étedue d ue sére est la dfférece etre la plus grade valeur et la plus pette valeur de la varable. 5. L écart moye O appelle écart moye le ombre e déf par la relato : e = ( x x) 6. La varace : Nous avos déjà recotré cette oto e termale. Elle cocere la varable aléatore X. O rappelle que l o a les relatos suvates : Ou ecore : V = [ x 2 ] x 2 V = [ c 2 ] x 2 7. L écart type. Cette oto est égalemet celle mse e évdece e classe de Termale : σ = V O rappelle toutefos que cette oto est drectemet lée à la oto de dsperso etre toutes les valeurs de la varable et la valeur moyee de celle-c. A ce ttre, la sématque «dsperso» est très sgfcatve. Nous mettros e évdece das les prochas cours cocerat les los de probabltés que 95% de la populato est comprse das l tervalle [ x 2σ ; x + 2σ ]
8. Quartles et décles. Ces otos sot relatves aux caractérstques de posto. E effet, ous avos vu que la médae partage la populato e deux partes égales. O peut mager de partager la populato e quatre partes égales. Les quartles Q, Q2, etq3 séparet les doées observées e quatre partes detques. Il e est de même pour ce que l o omme les décles : Il exste 9 décles ( D ) 9 séparat les doées observées e 0 groupes d effectfs égaux. La détermato des quartles et des décles s opèret de faço detque à celle de la valeur de la médae, e cosdérat le théorème de Thalès. O appelle l tervalle terquartle la dfférece etre le trosème et le premer quartle :