CHAPITRE 8 Séries statistiques : étude et comparaison. Tableur-grapheur. (Voir : 5 ème, chapitre 11 ; 4 ème, chapitre 13.) I) Une nouvelle caractéristique de position La valeur médiane d une série statistique partage ses valeurs en deux groupes de même effectif : Les valeurs inférieures ou égales à la valeur médiane Les valeurs supérieures ou égales à la valeur médiane. Les valeurs d une série statistique étant rangées par ordre croissant, la médiane est un nombre tel que : Au moins la moitié de la série ordonnée sont inférieures ou égales à ce nombre Au moins la moitié de la série ordonnée sont supérieures ou égales à ce nombre. Série statistique n 1 : Liste de notes (ordonnées dans l ordre croissant) d un effectif impair d élèves 7 8 8 9 10 10 10 11 11 12 12 13 14 15 15 15 notes Il y a autant de notes inférieures ou égales à 11 que de notes supérieures ou égales à 11. La 8 ème note 11 est donc la note médiane. (8 = 15 + 1.) 16 Série statistique n 2 : Liste de notes d un effectif pair d élèves 2 3 4 5 5 12 12 13 13 14 15 18 19 19 14 notes Toute note comprise entre la 7 ème et la 8 ème (7 ème et 8 ème incluses) est une note médiane. On prend en général la valeur centrale (moyenne de la 7 ème note «12» et de la 8 ème note «13») soit 12,5. Série statistique n 3 : Tableau de notes d élèves Notes 2 8 9 10 11 12 13 14 19 Effectifs 1 1 2 4 1 3 3 1 1 Effectifs cumulés 1 2 4 8 9 12 15 16 17 8 notes 1 = 8 notes + 1 note + 8 notes La médiane occupe le 9 ème rang ; c est la 9 ème note, c est-à-dire 11. 2008-2009 easymaths.free.fr Page 1 sur 5
Série statistique n 4 : Représentation graphique de notes d élèves Une valeur approchée de la médiane peut être obtenue à l aide de la courbe polygonale des effectifs cumulés (ou des fréquences cumulées) en lisant la valeur correspondant à la moitié de l effectif total (ou à une fréquence cumulée égale à 50%). Notes d'élèves Effectif cumulé 20 15 10 5 0 18 15 16 11 7 8 4 5 1 5 8 9 10 11 12 14 15 17 Note On calcule la moitié de l effectif total, soit 18 2 = 9. On lit sur le graphique l abscisse du point d ordonnée 9. La médiane est donc 11,5. Remarque : La courbe des effectifs cumulés est obtenue en joignant par des segments les points dont l abscisse est une valeur prise de la série et dont l ordonnée est l effectif cumulé correspondant à cette valeur. La médiane n est pas sensible aux valeurs extrêmes. On parle de classe médiane lorsque les valeurs du caractère sont données sous forme d intervalle. Deux séries peuvent avoir la même moyenne et deux médianes différentes. Deux séries peuvent avoir la même médiane et deux moyennes différentes. La moyenne et la médiane sont appelées caractéristiques de position : ce sont des valeurs «centrales» autour desquelles se répartissent les valeurs du caractère. (Paramètres de tendance centrale.) II) Une caractéristique de dispersion L étendue d une série statistique est la différence entre la plus grande et la plus petite de ses valeurs. Elle mesure la «dispersion» de la série. Série statistique n 1 : L étendue (écart entre les deux notes extrêmes) est de : 15 7 = 8 Série statistique n 2 : L étendue est de : 19 2 = 17 Série statistique n 3 : L étendue est de : 19 2 = 17 2008-2009 easymaths.free.fr Page 2 sur 5
Les caractéristiques de dispersion indiquent de quelle façon les valeurs du caractère sont groupées (plus ou moins resserrées) autour «centrales» : l étendue est le plus simple de ses caractères. Une série est dispersée si les valeurs du caractère de cette série ne sont pas regroupées autour de la moyenne. En général, lorsque l étendue est élevée, la dispersion est grande. On est parfois amené à ne pas tenir compte extrêmes lorsqu elles sont trop isolées pour évaluer la dispersion d une série. On dit alors que l on a élagué la série. III) Comparaison Méthode : Pour comparer deux séries statistiques où figurent de nombreuses données, on résume chacune d elles par ses caractéristiques de position (moyenne, médiane) et de dispersion (en particulier l étendue). Remarque : Médiane et moyenne ne sont pas toujours de bonnes caractéristiques pour comparer deux séries. Elles laissent échapper une part importante de l information contenue dans une série. L étendue d une série permet de comparer des séries ayant la même moyenne : elle indique si une série est plus ou moins «dispersée» par rapport aux autres. Exemple : Série Moyenne Médiane Etendue 1 11 11 8 2 11 12,5 17 3 11 11 17 Les trois séries ont la même moyenne ; leurs valeurs sont réparties différemment. Les valeurs de la série n 1 sont plus resserrées autour de la médiane (et de la moyenne) que celles de la série n 2 et donc n 1 est moins dispersée que n 2. Les séries n 2 et n 3 ont la même moyenne et la même étendue, mais elles ne se ressemblent pas du tout. Dans la série n 3, si on ne tient pas compte des deux notes extrêmes : 2 et 19, qui sont très isolées et dont les effectifs sont très faibles (donc non significatives), on obtient une série restreinte d étendue faible : 14 8 = 6, bien groupée autour de sa médiane. IV) Une autre caractéristique de position Les quartiles d une série statistique sont les données qui la partagent en quatre parties à peu près de même effectif. Les valeurs d une série statistique étant rangées par ordre croissant : Le premier quartile Q 1 est la plus petite valeur de la série ordonnée telle qu au moins un quart (25%) de la série sont inférieures ou égales à Q 1 2008-2009 easymaths.free.fr Page 3 sur 5
Le troisième quartile Q 3 est la plus petite valeur de la série ordonnée telle qu au moins les trois-quarts (75%) de la série sont inférieures ou égales à Q 3. Méthode : Pour déterminer Q 1, on calcule le quart de l effectif. Si le résultat est entier, alors on prend la valeur correspondante. Sinon, on prend la valeur suivante. Série statistique n 1 : (effectif total non divisible par 4) 15/4 = 3,75 Au moins 1/4 doivent être inférieures à Q 1 donc Q 1 est la 4 ème valeur de la série d où Q 1 = 9. 3 15/4 = 10,5 Au moins 3/4 doivent être inférieures à Q 3 donc Q 3 est la 11 ème valeur de la série d où Q 3 = 12. Propriété : Environ 50% d une série ordonnée sont comprises entre les quartiles Q 1 et Q 3. Le deuxième quartile Q 2 est la médiane de la série. Les premier et troisième quartiles correspondent aux médianes des deux demiséries déterminées par la médiane. La différence Q 3 Q 1 s appelle écart interquartile. Les quantiles sont les valeurs qui partagent une série en parties égales : Les quartiles, en 4 parties égales ; Les déciles, en 10 parties égales ; Les centiles, en 100 parties égales. V) Résumé Au moins 25% Au moins 50% Au moins 25% Plus petite valeur Q1 Médiane m Q3 Plus grande valeur Au moins 50% Au moins 50 % Etendue VI) Tableur-grapheur L utilisation d un tableur-grapheur facilite les calculs et les représentations statistiques. 2008-2009 easymaths.free.fr Page 4 sur 5
Moyenne : =MOYENNE(A1:A11) ou =SOMMEPROD(A1:A11;B2:B12)/SOMME(B2:B12) Médiane : =MEDIANE(A1:A11) Étendue : =MAX(A1:A11) MIN(A1:A11) Quartile : =QUARTILE(A1:A11;1) 2008-2009 easymaths.free.fr Page 5 sur 5