CHAPITRE 14 COURS : STATISTIQUES Extrait du programme de la classe de Troisième : Statistique CONTENU COMPÉTTENCES EXIGIBLES COMMENTAIRES Il s agit essentiellement, d une part de faire acquérir aux élèves les premiers outils de comparaison de séries statistiques, d autre part de les habituer à avoir une attitude de lecteurs responsables face aux informations de nature statistique. Caractéristiques de position d une série statistique Approche de caractéristiques de dispersion d une série statistique Initiation à l utilisation de tableursgrapheurs en statistique Une série statistique étant donnée (sous forme de liste ou de tableau, ou par une représentation graphique), proposer une valeur médiane de cette série et en donner la signification. Une série statistique étant donnée, déterminer son étendue ou celle d une partie donnée de cette série. On repère, en utilisant effectifs ou fréquences cumulées, à partir de quelle valeur du caractère on peut être assuré que la moitié de l effectif est englobée. Les exemples ne devront soulever aucune difficulté au sujet de la détermination de la valeur de la médiane. L étude de séries statistiques ayant même moyenne permettra l approche de la notion de dispersion avant toute introduction d indice de dispersion. On introduira l étendue de la série ou de la partie de la partie de la série obtenue après élimination des valeurs extrêmes. On pourra ainsi aborder la comparaison de deux séries en calculant quelques caractéristiques de position et de dispersion, ou en interprétant des représentations graphiques données. Les tableurs que l on peut utiliser sur tous les types d ordinateurs permettent, notamment en liaison avec l enseignement de la technologie, d appliquer de manière rapide à des données statistiques les traitements étudiés. 3 ème Page 1/7 Cours Stats
1 Définitions et vocabulaire des statistiques Faire une étude statistique, c est recueillir, organiser, synthétiser, représenter et exploiter des données, numériques ou non, dans un but de comparaison, de prévision, de constat... Les plus gros "consommateurs" de statistiques sont les assureurs (risques d accidents, de maladie des assurés), les médecins (épidémiologie), les démographes (qui étudient les populations et leur dynamique) et sociologues (qui étudient les phénomènes sociaux humains), les économistes (emploi, conjoncture économique), les météorologues... La population est l ensemble des individus sur lesquels portent l étude statistique. Le caractère (ou variable statistique) d une série statistique est une propriété étudiée sur chaque individu. Lorsque le caractère ne prend que des valeurs (ou modalités) numériques, on dit qu il est quantitatif. Sinon, on dit qu il est qualitatif : les valeurs de la série ne sont pas des nombres. Effectifs, effectifs cumulés, fréquences : A chaque valeur (ou classe) est associée un effectif n : c est le nombre d individus associés à cette valeur. De même à chaque valeur (ou classe) est associée une fréquence f : c est la proportion d individus associés à cette valeur. f est un nombre compris entre 0 et 1, que l on peut écrire sous forme de pourcentage. Si N est l effectif total (l effectif de la population entière) alors on a f = n N (ou f = n 100 si on N l exprime sous forme de pourcentage). Effectifs et fréquences cumulées : Lorsque les valeurs sont rangées dans l ordre croissant, on obtient l effectif cumulé croissant d une valeur en additionnant son effectif à ceux qui le précèdent (on additionne à partir de la gauche du tableau). De la même manière, les fréquences cumulées croissantes s obtiennent en divisant l effectif cumulé croissant par l effectif total. Pour obtenir les effectifs ou les fréquences cumulés décroissants, on additionne à partir de la droite du tableau. Remarque : les effectifs cumulés croissants indiquent quel est l effectif de la série dont la valeur est inférieure à une valeur donnée. Exemple : Voici le relevé, par tranche d âge, de la population en France métropolitaine pour l année 2002 : Tranche d âge 0-19 ans 20-39 ans 40-59 ans 60-74 ans + 75 ans Total Effectifs (en milliers) 14 988 16 371 15 758 7 727 4 499 59 343 Fréquences 25,3 % 27,5 % 26,6 % 13 % 7,6 % 100 % Effectifs cumulés croissants 14 988 31 359 47 117 54 844 59 343 59 343 Fréq. cumulées croissantes 25,3 % 52,8 % 79,4 % 92,4 % 100 % 100 % Par exemple, on peut lire dans ce tableau que 16 371 individus ont entre 20 et 49 ans, que 31 359 individus ont 39 ans ou moins, que 26,6 % des individus ont entre 40 et 59 ans, ou encore que 79,4 % des individus ont 59 ans ou moins. 3 ème Page 2/7 Cours Stats
2 Représentation graphique d une série statistique 2.1 Diagramme en bâtons Lorsque le caractère étudié est quantitatif et discret, on peut représenter la série statistique étudiée par un diagramme en bâtons : la hauteur de chaque bâton est proportionnelle à l effectif (ou à la fréquence) associé à chaque valeur. Par exemple, voici le diagramme en bâtons représentant la série des notes obtenues par une classe à un contrôle : Fréquence % 4 8 4 8 8 12 16 24 8 4 4 100 6 Effectif 5 4 3 2 1 0 Notes 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2.2 Histogramme Lorsque le caractère étudié est quantitatif et continu, et lorsque les modalités sont regroupées en classes, on peut représenter la série par un histogramme : l aire de chaque rectangle est proportionnelle à l effectif (ou à la fréquence) associée à chaque classe Lorsque les classes ont la même amplitude, c est la hauteur de chaque rectangle qui est proportionnelle à l effectif. Par exemple, voici un histogramme représentant la répartition des salaires dans une entreprise : Salaires 1000 S< 1200 1200 S < 1400 1400 S < 1600 1600 S < 1800 1800 S < 2000 Total Effectif 36 44 64 40 16 200 Fréquence 0, 18 0, 22 0, 32 0, 2 0, 08 1 3 ème Page 3/7 Cours Stats
1 salarié 1000 1200 1400 1600 1800 2000 2.3 Diagramme circulaire Enfin, lorsque le caractère est qualitatif, on représente la série par un diagramme circulaire ou semicirculaire ("camemberts") : la mesure de chaque secteur angulaire est proportionnelle à l effectif (ou à la fréquence) associé. Par exemple, voici un diagramme circulaire représentant la répartition des adhérents à un club sportif : Sport Tennis Football Handball Rugby Autres Total Effectif 4 19 7 15 5 50 Fréquence % 8 38 14 30 10 100 Mesure de l angle en degrés 28, 8 136, 8 50, 4 108 36 360 Football Tennis Handball Autres Rugby 3 ème Page 4/7 Cours Stats
3 Mesures de tendance centrale : moyenne, médiane 3.1 Moyenne d une série statistique Si la série est donnée sous la forme d une liste Par exemple, voici les notes obtenues à un contrôle par les 21 élèves d une classe : 8 3 14 17 5 12 11 9 10 15 8 19 4 11 6 9 9 10 10 9 14 Pour calculer la moyenne de cette série de notes, on additionne toutes les notes, et on divise par le nombre total de notes : m= 8+3+14+17+5+12+11+9+10+15+8+19+4+11+6+9+9+10+10+9+14 21 Si les valeurs de la série sont regroupées dans un tableau avec effectifs associés Par exemple, voici les notes obtenues à un autre contrôle par les 25 élèves d une autre classe : = 213 21 10,14 La moyenne est alors dite pondérée par les effectifs. Pour calculer cette moyenne, on commence par effectuer les produits des notes par les effectifs associés, puis on additionne tous ces produits, et on divise la somme obtenue par le nombre total de notes : m= 2+42+6+72+82+93+104+116+122+14+17 25 Si les valeurs de la série sont regroupées par classes Par exemple, voici la répartition des salaires de 200 salariés d une entreprise : = 234 25 = 9,36 Salaires 1000 S< 1200 1200 S < 1400 1400 S < 1600 1600 S < 1800 1800 S < 2000 Total Centre 1100 1300 1500 1700 1900 1 Effectif 36 44 64 40 16 200 On considère alors qu une classe donnée sera représentée, dans le calcul, par son centre, et on utilise le centre de la classe pour calculer la moyenne pondérée par les effectifs : m= 110036+130044+150064+170040+190016 = 291200 = 1456 200 200 On obtient une valeur approchée du salaire moyen réel. 3.2 Médiane d une série statistique Reprenons l exemple des notes obtenues à un contrôle par les 25 élèves d une classe : 3 ème Page 5/7 Cours Stats
Nous avons calculé, dans le paragraphe précédent, que la moyenne de la classe valait 9,34. D après le tableau qui présente la série, 11 élèves ont eu une note inférieure à la moyenne du contrôle, alors que 14 élèves ont eu une note supérieure à la moyenne du contrôle. on observe que la moyenne d une série statistique dont les éléments sont rangés par ordre croissant ne sépare pas ceux-ci - en tous cas, pas toujours - en deux parties de même effectif Définition : La médiane M d une série statistique est la valeur qui partage la population étudiée en deux sousgroupes de même effectif, chacun tels que : tous les éléments du premier groupe on des valeurs inférieures ou égales à M ; tous les éléments du deuxième groupe ont des valeurs supérieures ou égales à M. Détermination de la médiane d une série statistique A partir d un tableau d effectifs cumulés ou de fréquences cumulées Exemple : Reprenons l exemple des notes obtenues à un contrôle par les 25 élèves d une classe : E.C.C. 1 3 4 6 8 11 15 21 23 24 25 25 : Effectifs cumulés croissants Les notes étant rangées dans l ordre croissant, la case grisée indique que, de la 12 ème à la 15 ème, les notes sont égales à 10. Or 25=12+1+12 donc la médiane est la 13 ème note c est-à-dire 10. Rang : 1 r e 2 e... 11 e 12 e 13 e 14 e... 25 e Notes : 2 4... {{ 9 10 10 10... {{ 17 12 élèves 12 élèves On rappelle que la moyenne de la classe à ce contrôle était de 9,34, donc la médiane et la moyenne sont (en général) différentes. À partir d une représentation graphique Une valeur approchée de la médiane peut être obtenue à l aide de la courbe polygonale des effectifs cumulés croissants (ou des fréquences cumulées) en lisant la valeur correspondant à la moitié de l effectif total (ou à une fréquence cumulée égale à 50 %) : À la question "Quelle quantité d eau buvez-vous par jour?", les cinquante personnes interrogées ont donné des réponses qui ont permis de compléter le tableau suivant : Quantité d eau (en L) [0 ;0,5[ [0,5 ;1[ [1 ;1,5[ [1,5 ;2[ [2 ;2,5[ [2,5 ;3[ Fréquences % 24 42 18 10 4 2 F.C.C. % 24 66 84 94 98 100 : Fréquences cumulées croissantes La courbe polygonale des effectifs cumulés est obtenue en joignant par des segments les points dont l abscisse est une valeur de la série (ou l extrémité d une classe) et dont l ordonnée est l effectif cumulé correspondant à cette valeur : 3 ème Page 6/7 Cours Stats
100 % 98 % 94 % 84 % 66 % 50 % 24 % Fréquence cumulée La médiane M est environ égale à 0,8 L ; en effet, la moitié des personnes interrogées consomme moins de 0,8 L par jour (ou, ce qui revient au même, la moitié des personnes interrogées consomme plus de 0,8 L par jour). Quantité d eau (en L) 0,5 0,8 1 1,5 2 2,5 3 4 Mesure de dispersion Comparons les notes obtenues à un contrôle par deux classe différentes : Classe n 1 : Notes 2 3 6 7 8 9 10 11 13 14 15 17 Total Effectif 1 1 1 2 2 3 3 6 2 2 1 1 25 La moyenne de cette classe à ce contrôle est égale à : m 1 = 2+3+6+72+82+93+103+116+132+142+15+17 25 La médiane de cette classe à ce contrôle est égale à : la 13 ème note (car 25=12+1+12), c est-à-dire que M 1 = 10 = 250 25 = 10 Classe n 2 : Notes 5 7 8 9 10 11 12 13 Total Effectif 2 1 2 2 5 6 2 3 23 La moyenne de cette classe à ce contrôle est égale à : m 2 = 52+7+82+92+105+116+122+133 23 La médiane de cette classe à ce contrôle est égale à : la 11 ème note (car 23=11+1+11), c est-à-dire que M 2 = 10 = 230 23 = 10 Ces deux séries ne sont pas différenciables par les mesures de tendance centrale ; pourtant, on ne peut pas dire la même chose des deux classes : elles n ont pas le même profil! Définition : On appelle étendue d une série statistique la différence entre la plus grande valeur de la série et la plus petite. L étendue est une mesure de dispersion des valeurs : plus l étendue est grande, plus les valeurs sont dispersées. Ici, l étendue de la série de notes de la classe n 1 vaut : 17 2=15 points. L étendue de la série de notes de la classe n 2 vaut, elle : 13 5=8 points. On pourrait dire que la classe n 2 a eu des résultats plus homogènes que la classe n 1. 3 ème Page 7/7 Cours Stats