Module statstque et probabltés_ parte 2 Zahra ROYER B _ Etude des dstrbutons d un caractère quanttatf : Sans perte de généralté : à la place de varable statstque, on va utlser le terme courant chez les utlsateurs : «Sére statstque», qu peut décrre toute la populaton, ou smplement un échantllon, et qu désgne à la fos : L ensemble des modaltés ou des classes des modaltés de X L effectf correspondant à chaque modalté ou à chaque classe de modalté PHASE de CALCUL : les graphques permettent d avor une dée synthétque à compléter par des calculs dans dvers objectfs : nterpréter décrre explquer prédre Les mesures fondamentales et usuelles qu résument les données des tableaux et des graphques, peuvent être classées en tros grandes famlles : paramètres de la tendance centrale ou de poston ; paramètres de la dsperson ; paramètres de la forme, paramètres de la concentraton. B-1- Mesures de tendance centrale B-1-1 Le Mode ou la classe modale B-1-2 La Médane B-1-3 Les Quantles B-1-4 La Moyenne arthmétque Z.Royer 1
B-1-1 Le Mode ou la classe modale : C est la (ou les) valeur la plus fréquente de la sére Lorsque la varable est contnue, on défnt alors la classe modale comme la classe ayant la plus forte densté. Une varable est dte est plurmodale s elle admet pluseurs modes. Remarques : Le mode est très faclement détermné souvent par vsualsaton graphque, sa sgnfcaton est smple. On note en général le mode : M 0 B-1-2 La Médane Défnton : La médane, notée M e, est la valeur qu sépare une sére d'observatons ordonnées en ordre crossant ou décrossant, en deux partes comportant le même nombre d'observatons C est la valeur unque du caractère qu partage l ensemble de ses valeurs en deux sous-ensembles d'effectfs égaux. Autrement dt c est la valeur qu lasse la moté des valeurs avant elle et l autre moté après elle ou encore : On a autant d'observatons nféreures à la médane que d'observatons supéreures à la médane. Mathématquement c est la valeur qu correspond à une fréquence cumulée égale à 50%. M e Calcul de la médane : S la varable est dscrète : on dstngue 2 cas de fgure L'effectf total N est mpar : N = 2k + 1 la médane est la valeur de rang k. S le nombre d'observatons est par, on défnt un ntervalle médan dans lequel se trouve la médane. Dans le cas d'une sére contnue : vor l exemple de synthèse c-dessous On commence par repérer la classe médane à partr de fréquences cumulées crossantes On cherche 0.5 dans la colonne des fréquences cumulées, On repère la classe autour du 0.5 On dédut la médane par nterpolaton lnéare. Z.Royer 2
Les valeurs étant rangées par ordre crossant, c'est la valeur de la varable qu sépare les observatons en deux groupes d'effectfs égaux. Varable dscrète: la détermnaton peut s'obtenr à partr du tableau statstque en recherchant la valeur de la varable correspondant à une foncton cumulée égale à n/2 (effectf cumulé) ou ½ (fréquence cumulée). Il est encore plus facle de lre sur les graphques cumulatfs les abscsses des ponts d'ordonnée n/2 (effectf cumulé) ou ½ (fréquence cumulée). S tout un ntervalle a pour mage n/2 ( ½ pour la fréquence), on parlera d'ntervalle médan (on peut prendre le mleu de l'ntervalle comme médane) Varable classée: l'abscsse du pont d'ordonnée n/2 ( ½ pour la fréquence)se stue en général à l'ntéreur d'une classe. Pour obtenr une valeur plus précse de la médane, on procède à une nterpolaton lnéare. La valeur de la médane peut être lue sur le graphque ou calculée analytquement. d'où la valeur de la médane. De manère générale, s a et b sont les bornes de la classe contenant la médane, F(a) et F(b) les valeurs de la fréquence cumulée crossante en a et b, alors Fablesses et qualtés de la médane : S elle respecte les 5 premères condtons de Yule, elle n obét pas au derner à savor elle ne s apprête pas aux opératons algébrques : la Z.Royer 3
médane de la somme de 2 varables n a aucune rason d être égale à la sommes des médanes, ce qu fat que l on lu préfère la moyenne arthmétque. Elle n'est pas affectée par les valeurs extrêmes Les Quantles En généralsant la défnton de la médane, on défnt des valeurs qu partagent la sére en pluseurs sous-ensembles d'effectfs égaux. Les quantles les plus utlsés sont : les quartles qu partagent la sére en 4 sous-ensembles égaux. Ils sont donc au nombre de 3, notés Q 1, Q2, Q3. Les ntervalles qu'ls défnssent contennent chacun 25% des observatons. Q 1 est assocé à 25% dans la colonne des fréquences cumulées. Q2 est assocé à 50% de ces mêmes fréquences, par conséquent Q2 = M e Q 3 est assocé à 75% de ces fréquences cumulées. Les décles qu partagent la sére en 10 sous-ensembles égaux. Ils sont donc au nombre de 9, notés D1 D2... D9. Les ntervalles qu'ls défnssent contennent chacun 10% des observatons. Les décles sont faclement détermnés grâce aux fréquences cumulées. Tout comme la médane, dans le cas d'une sére contnue les quantles, les décles sont détermnés, s nécessare, par nterpolaton lnéare. Calcul de la moyenne arthmétque La moyenne arthmétque d'une varable statstque non pondérée est égale au rapport de la somme des valeurs observées par le nombre d'observaton (N). On note la moyennex, avec : x = N x Lorsque les valeurs de la varable sont affectées d un pods, on dt que la sére est pondérée et on calcule la moyenne arthmétque pondérée par : 1 x = n x = f x N. Vor l exemple de synthèse à la fn de ce paragraphe. Grandeurs et msères de la moyenne arthmétque : Z.Royer 4
La moyenne est la valeur de tendance centrale la plus connue. Elle satsfat ben aux condtons de YULE, en partculer elle se prête asément aux calculs algébrques, mas elle présente un défaut mportant. o Elle est très sensble aux valeurs extrêmes o A ce ttre on lu préfère la médane. Néanmons la moyenne satsfat les tros proprétés fondamentales : - La somme des écarts des valeurs à leur moyenne est nulle : n ( x x ) = 0 - La somme 2 n ( x a ) attent son mnmum pour : a = x - la moyenne d'une populaton fne P, composée de n sous-populatons P k, chacune d effectf nk de moyenne arthmétque x k, s'obtent en foncton des moyennes des sous-populatons : D autres moyennes : MOYENNE GEOMETRIQUE x = n = = 1 = n S x sont les observatons d'une varable quanttatve, la moyenne géométrque est égale à n = 1 n x Ce type de moyenne est surtout utlsé pour calculer des pourcentages moyens. r étant un taux d'accrossement, 1+r est appelé coeffcent multplcateur; et le coeffcent multplcateur moyen est alors égal à la moyenne géométrque des coeffcents multplcateurs. MOYENNE HARMONIQUE S x sont les observatons d'une varable quanttatve, la moyenne harmonque est égale à Z.Royer 5
Il n'est pas évdent d'utlser ce type de moyenne. Elle ntervent lorsqu'on demande une moyenne de valeurs se présentant sous forme de quotent de deux varables x/y (km/h, km/ltre,...). Attenton, l faut cependant ben décortquer le problème car l peut auss s'agr d'une moyenne arthmétque. MOYENNE QUADRATIQUE S x sont les observatons d'une varable quanttatve, la moyenne harmonque est égale à Remarque : a) Il exste d'autres moyennes qu ne sont pas des caractérstques de tendance centrale, la moyenne géométrque (utlsée par exemple pour détermner un taux de crossance moyen), la moyenne quadratque, la moyenne harmonque. b) Pour des séres statstques relatvement peu asymétrques, et unmodales, K. PEARSON propose une relaton emprque entre la moyenne x, la médane M e et le mode M 0 : x M 3( x ) 0 M e. c) Il faut être prudent quant à l'utlsaton de la moyenne arthmétque pour effectuer des comparasons de séres statstques. d) La moyenne d'une sére contnue = l'abscsse du centre de gravté de la surface représentée par l'hstogramme. Complément sur la moyenne arthmétque : Z.Royer 6
Elle peu sgnfcatve : prendre une répartton dans une PME, on peut calculer le salare moyen en prenant en compte tous les salares, ou en lassant de côté le salare du patron qu est 10 fos le salare médan Pour les calculs de taux d nflaton ou de crossance moyen, la moyenne arthmétque ne convent pas et donne des résultats faux. Sur la fgure c-dessous la moyenne arthmétque de la sére A est plus grande que la moyenne arthmétque de B sur la fgure c-dessous la dstrbuton A et la dstrbuton B ont la même moyenne, mas que la dstrbuton B possède une dsperson plus grande que celle de A Z.Royer 7
Deux dstrbutons peuvent avor exactement la même moyenne, sans pour autant être dentques. Elles peuvent dfférer, par exemple, au plan de l'éparpllement (dsperson) des valeurs autour de la moyenne. Par exemple on peut trouver sur le marché fnancer deux actons ayant le même rendement moyen sur une pérode donnée, mas avec des rsques complètement dfférents, les fnancers dront qu l faudra opter pour celu dont l écart-type dsperson est le plus pett, à rendement égal on chost l acton la mons rsquée ou celle dont l écart type dsperson est le plus fable. Exemple : dans un cabnet d experts comptables, on a collecté l nformaton concernant des montants de chèques mpayés sur une année, Il faut lre 20 chèques de valeur comprse entre 1900 et 2000. Les chèques Impayés Fréquences : f Fréq, cum, crossantes F moyenne varance X = Montant n=effectfs centres-classes 1900 2000 20 1950 0,01 0,01 19,5 5048,1025 2100 30 2050 0,015 0,025 30,75 5590,65375 2250 90 2175 0,045 0,07 97,875 10606,9613 2400 210 2325 0,105 0,175 244,125 11818,8263 2500 210 2450 0,105 0,28 257,25 4652,57625 2650 380 2575 0,19 0,47 489,25 1388,9475 2750 360 2700 0,18 0,65 486 280,845 2850 200 2800 0,1 0,75 280 1946,025 2950 180 2900 0,09 0,84 261 5162,4225 3050 160 3000 0,08 0,92 240 9220,82 3200 100 3125 0,05 0,97 156,25 10788,0125 Z.Royer 8
3300 40 3250 0,02 0,99 65 6950,205 3400 20 3350 0,01 1 33,5 4754,1025 Moyenne 2660,5 78208,5 effectf N 2000 écart-type 279,657827 médane 2666,66667 Classe Modale [2650 ;2750 [ Ic la classe médane est [ a, b[, avec a= 2650, et b = 2750 de fréquence la médane est par défnton : M e = a + ( b a )* 0.5 F( a ) F( b ) F( a ) Exercce : le tableau c-dessous résume les pertes sèches d une trentane de sous-tratants avec les ADP pendant la pérode du nuage Volcan Islandas. X= Perte sèche de la premère journée en K Nombre de sous-tratants Effectf 40 et mons de 50 4 50 et mons de 60 6 60 et mons de 70 10 70 et mons de 80 4 80 et mons de 90 4 90 et mons de 100 2 30 Z.Royer 9