Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr CHAPITRE 1 : Dstrbuton statstque à une dmenson Secton 1 : Vocabulare élémentare de la statstque descrtve 1. Poulaton et ndvdu Dénton On aelle oulaton statstque, tout ensemble d'untés statstques consttuant les untés observées. On aelle ndvdu (ou unté statstque), tout élément de la oulaton étudée. Remarque La détermnaton avec récson de la oulaton et des ndvdus qu la comosent condtonne l'homogénété des untés observée et la ablté des résultats. 2. Varable statstque 2.1. Dénton On aelle varable statstque (ou caractère), une alcaton (relaton) qu assoce à chaque ndvdu de la oulaton, une observaton artculère. 2.2. Tye d'une varable statstque a) Varable qualtatve Une varable est qualtatve s elle est lée à un ensemble d'observatons non mesurables. Exemle : La oulaton actve tunsenne eut être caractérsée ar : - Le sexe (masculn ou émnn) - La catégore roessonnelle (cadres, emloyés, ouvrers, etc...) La nature qualtatve d'une varable s'exrme donc ar l'aartenance à une catégore ou rubrque d'un ensemble n. b) Varable quanttatve Une varable est quanttatve s l'ensemble des observatons est un ensemble de nombres. Ces observatons exrment donc des valeurs numérques (quanttat = mesurable). Exemle : La Catégore Hôtelère, La Caacté en lts, Les varables quanttatves euvent être dscrètes ou contnues : Une varable quanttatve est dte dscrète lorsqu'elle rend un nombre n ou dénombrable de valeurs (La Catégore Hôtelère). La varable «nombre d'enants ar ménage» est une varable quanttatve dscrète. Cours Statstque descrtve 3
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr Une varable quanttatve est dte contnue, lorsqu'elle rend toutes les valeurs d'un ntervalle réel. La varable «La Caacté en lts» eut être envsage comme une varable quanttatve contnue. Ses valeurs sont le lus souvent regrouées ar ntervalle. 3. Eects Dénton On aelle eect d'une valeur (ou rubrque) donnée x le nombre de os ou cette valeur (ou rubrque), aarat dans la oulaton statstque étudée. Ce nombre est note n. L'eect est aros aelé réquence absolue. On aelle eect total de la oulaton étudée, noté n, la somme des eects artculers n corresondant à chacune des valeurs (ou rubrques), sot : n 1 n = n1+n2 +.+n = Le symbole (lu «somme») ermet une écrture synthétque de la somme des eects n 1, n 2... n. On lt alors «n = somme des n (our varant de 1 à )». 4. Fréquences On aelle réquence de la valeur (ou modalté) x, notée, le raort de l'eect n corresondant a la valeur x et de l'eect n de la oulaton observée. Ce raort est égal au ourcentage d'ndvdus résentant la valeur (ou modalté) x ar raort à l'ensemble de la oulaton observée. est toujours comrse entre 0 et 1. Pour une sére statstque résentant valeurs (ou modaltés), on a : n n 1 1 2... 1 Remarque : Paros on eut rencontrer le terme de réquence relatve our les réquences. L emlo des réquences ou réquences relatves s avère utle our comarer deux dstrbutons de réquences étables à artr d échantllons de talle dérente. On aelle réquences cumulées ou réquences relatves cumulées en x, le nombre cum tel que F j cum 1 Cours Statstque descrtve 4
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr Secton 2 : Rerésentaton des données Il exste luseurs nveaux de descrton statstque : la résentaton brute des données, des résentatons ar tableaux numérques, des rerésentatons grahques et des résumés numérques ourns ar un ett nombre de aramètres caractérstques. 1. Séres statstques Une sére statstque corresond aux dérentes modaltés d un caractère sur un échantllon d ndvdus aartenant à une oulaton donnée. Le nombre d ndvdus qu consttuent l échantllon étudé s aelle la talle de l échantllon. 2. Tableaux statstques Le tableau de dstrbuton de réquences est un mode synthétque de résentaton des données. Sa consttuton est mmédate dans le cas d un caractère dscret mas nécesste en revanche une transormaton des données dans le cas d un caractère contnu. 2.1 Caractère qualtat Modalté Numéro 1 2.. On a les relatons suvantes: n Eect n n 1 n 2. n n 1 n n 1 Fréquence 1 2 Remarque : les réquences euvent être exrmées dans le tableau en ourcentage, dans ce cas : 100 1 1 2.2 Caractère quanttat a) Caractère quanttat dscret Valeurs observées x x 1 x 2. xp Eects n n 1 n 2.. np Fréquences 1 2. P Fréquences cumulées crossantes F F 1 F 2 FP Cours Statstque descrtve 5
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr b) Caractère quanttat contnu Classes numéro [b ; b+1[ [b 1 ; b 2 [ [b 2 ; b 3 [.. [bp ; bp+1[ Centres c c 1 c 2 cp Eects n n 1 n 2. np Fréquences 1 2 P Fréquences cumulées crossantes F F 1 F 2 FP Remarque : - Une classe est un ntervalle ermé à gauche et ouvert à drote, du tye [b ; b +1 [. - Le centre d'une classe est c b b 1 - L'amltude d'une classe est a b 1 b 3. Rerésentatons grahques 3.1 Caractères qualtats a) Dagrammes à bandes 2 On aelle dagramme à bandes un grahque qu, à chaque modalté de la varable qualtatve assoce un rectangle de base constante dont la hauteur est roortonnelle à l'eect. Fgure 1-1 : Dagramme à bandes (vertcales) : nombre d arrvée aux rontères des scandnaves ar natonalté our l'année 2005 40 000 35 000 30 000 25 000 20 000 15 000 10 000 5 000 Natonaltés 0 Suédos Danos Norvégens Fnlandas b) Dagrammes à secteurs On aelle dagramme à secteurs un grahque qu dvse un dsque en secteurs angulares dont les angles au centre sont roortonnels aux eects de chaque modalté. Cours Statstque descrtve 6
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr Pour une modalté donnée M, d'eect n, l'angle au centre α, corresondant est donné (en n degré) ar : 360 360 n Fgure 1-2 : Dagramme à secteurs : nombre d arrvée aux rontères des scandnaves ar natonalté our l'année 2005 Suédos Danos Norvégens Fnlandas 3.2 Caractères quanttats 3.2.1 Caractère quanttat Dscret a) Dagramme en bâtons On aelle dagramme en bâtons un grahque qu assoce à chaque valeur de la varable un segment (bâton) dont la hauteur est roortonnelle à l'eect. Remarque On suose les valeurs observées de la varable quanttatve dscrète, ordonnées ar ordre crossant. Fgure 1-3 : Dagramme en bâtons : Nombre de nutées des non résdants ar nombre d étole en 2005 Cours Statstque descrtve 7
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr b) Dagrammes cumulats On aelle dagramme cumulat, la courbe rerésentatve de la oncton de réartton. On aelle oncton de réartton d'un caractère X, l'alcaton notée F, dont l'ensemble de déart est R et l'ensemble d'arrvée, l'ntervalle [0,1]. F : R [0,1] X F(x) = P(X<x) F(x) = roorton des ndvdus dont la valeur du caractère est strctement nereure à x. F x réquence X x ( ) de ( ) 1 2... Remarque Le lus souvent, le dagramme cumulat est obtenu à artr des réquences cumulées crossantes. Dans le cas d'une varable dscrète, la courbe cumulatve se résente comme une courbe en escaler (La oncton F est dans le cas dscret, une oncton constante ar ntervalle) Chaque segment de cette courbe en escaler est ouvert à gauche et erme drote (sau le derner). S on dént la oncton de réartton ar F(x) = P(X x), alors les segments devennent ermés à gauche et ouverts à drot (sau le remer). Fgure 1-4 : Courbe en escaler du Nombre de nutées des non résdants ar nombre d étole en 2005 3.2.2 Caractères quanttats contnus a) Hstogrammes On aelle hstogramme un dagramme comaré d'un ensemble de rectangles contgus (adjacents), chaque rectangle, assocé à chaque classe, ayant une surace roortonnelle à l'eect (ou à la réquence) de cette classe. Deux cas euvent se résenter : Cours Statstque descrtve 8
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr Classes d'amltudes égales : Lorsque les classes sont d'amltudes égales (a = a) Fgure 1-5 : Hstogramme (amltude égales) : Caacté Hôtelère en lts our la régon de Nabeul-Hammamet 0,30 0,25 Fréquences 0,20 0,15 0,10 0,05 0,00 101 201 301 401 501 caa cté hôtelère en lts Classes d'amltudes négales : Lorsqu'au mons deux classes ont des amltudes dérentes, la hauteur roortonnelle à l'eect ne ermet lus de construre un hstogramme. En eet, la surace de chaque rectangle n'est lus roortonnelle à l'eect (conormément à la dénton). D où la nécessté de corrgé les réquences (ou les eects). c ou a c n n a Avec: c : réquence corrgé ; c n : eect corrgé Fgure 1-6: Hstogramme (amltude négales) : Chômeurs ar groue d'âges Cours Statstque descrtve 9
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr b) Polygone des réquences On obtent un olygone de réquences en jognant les mleux des segments suéreurs de chaque rectangle de l hstogramme (l are du olygone des réquences est l are de la surace ar la lgne olygonale et l axe des abscsses). Fgure 1-7 : Polygone des réquences (amltude égales) : Caacté Hôtelère en lts our la régon de Nabeul-Hammamet c) Courbe des réquences cumulées crossantes Dénton On aelle courbe des réquences cumulées crossantes la rerésentaton grahque de la oncton de réartton de la varable x. Les données étant grouées en classes, la réquence cumulée crossante F assocée à la classe n : rerésente la roorton d'ndvdus de la oulaton our lequel la varable rend une valeur nereure (strctement) à la lmte suéreure b de la classe n :. En ratque, la courbe des réquences cumulées crossantes est obtenue en jognant, dans un système d'axes orthogonaux, les onts d'abscsse b (extrémté de la classe n : ) et d'ordonnée F (réquence cumulée crossante corresondante) [Remarque : Jondre les onts de coordonnées (b, F ) ar des segments revent à are l hyothèse d une réartton unorme des ndvdus à l ntéreur des classes]. Cours Statstque descrtve 10
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr Fgure 1-8 : Courbe des réquences cumulées crossantes : Caacté Hôtelère en lts our la régon de Sousse-Karouan Courbe des réquences cumulées crossantes réquences cumulées crossantes en % 100,00 80,00 60,00 40,00 20,00 0,00 101 201 301 401 501 601 Caacté Hôtelère en lts 3.3 Grahques sécalses a) Pyramde des âges Exemle : Pyramde des âges en Tunse en 1994 : La yramde est une verson artculère de l'hstogramme, ut ls ée o ur re art r un e o ulat on en on ct on de l âge (va rabl e quant ta tv e con tn ue) et du sex e des nd v dus (va ra ble qual tat ve secondare). Le grahque se résente comme un hstogramme double, les valeurs de la va r ab le r n c a le ( l âg e) ét an t o rt ée s su r l' ax e ve rt c al. F gu re 1-9 : Py ra m de de s âg es (e n% ) 19 94 Cours Statstque descrtve 11
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr b) Dagramme cartograhque (ou cartogramme) Lorsqu'une étud e statstque concerne des données géog rahques, les ndvdus ou les modalt és de la varabl e étudée sont des untés satal es (des régons ar exemle). On ett alors utl ser une carte our vsua lse r les valeu rs assocées a un caractère et a une unté satale. La oulaton étudée est «l'ensemble des gouvernorats de la Tunse». La varable étudée est «l'écart global en taux (L'écart global en taux, rerésente c le dérentel de crossance de l'emlo un gouvernorat donn é et la naton tout e entèr e sur la érode 1984-1989. Un écart global ost (négat), sgne que le taux de crossance de l emlo du gouvernor at consdéré est suéreur (nereur), au taux do crossance moyen au nveau natona l)». Elle est quanttatve con tn ue. Une déc om oston des val eur s de la varab le en 5 classe s d négale amltude condut à la gure su vante : Fg ure 1-10 : Da gra mme Cartog ra hque Eca rt glo bal en tau x (Tr ) ar gou vernor at (1984-198 9) Cours Statstque descrtve 12
Chatre1 : Dstrbuton Statstque à une dmenson I.H.E.T de Sd Dhr c) Dagramme olare Ce dagramme (gure 1-10) est utlse lorsqu'on cherche à comarer, our une varable donnée, des observatons relatves à luseurs sous oulatons (d'une même oulaton). On suose que la varable (qualtatve ou quanttatve) étudée résente modaltés. Le lan est dvsé en secteurs délmtés ar des axes assoces aux dérentes modaltés de la varable. On reorte sur chaque axe la valeur corresondant à la modalté concernée ; la dstance du ont à l'orgne est roortonnelle à la valeur corresondante. Les onts corresondants à une même sous oulaton euvent être jonts (gure 1-10). Les données du tableau récsent le nombre de chômeurs selon la durée du chômage (en mos) et le nveau d'nstructon enregstres en 1997(Source : enquête natonal sur l'emlo, 1999). Tableau: Nombre de chômeurs en Tunse, enregstrés en 1997 Durée de chômage néant rmare secondare suéreur total (en mos) [0,1[ 1880 5089 2453 138 9560 [1,3[ 12616 39895 16193 731 69435 [3,6[ 12108 43318 16346 1072 72844 [6,9[ 4002 19797 13263 1657 38719 [9,12[ 2112 8419 8582 1816 20929 [12,24[ 16224 93402 83346 11708 204680 Fgure 1-10 : Dagramme Polare Cours Statstque descrtve 13