Statistiques Christophe ROSSIGNOL Année scolaire 2013/2014 Table des matières 1 Vocabulaire 2 1.1 Population, caractère, effectif, fréquence............................ 2 1.2 Représentations graphiques................................... 3 2 Paramètres d une série statistique 4 2.1 Mode et classe modale...................................... 4 2.2 Moyenne et étendue....................................... 4 2.3 Médiane.............................................. 5 Table des figures 1 Diverses représentations graphiques............................... 3 2 Diagramme des effectifs cumulés croissants........................... 3 Liste des tableaux 1 Valeurs d un caractère et effectifs................................ 2 Ce cours est placé sous licence Creative Commons BY-SA http://creativecommons.org/licenses/by-sa/2.0/fr/ 1
1 VOCABULAIRE En préliminaire au cours : Activité : Activité (fp) : Autour de la moyenne et de la médiane 1 Vocabulaire 1.1 Population, caractère, effectif, fréquence Définition : Une enquête statistique porte sur un ensemble de personnes ou d objets : Cet ensemble est appelé population. Le nombre de personnes (ou d objets) de cet ensemble est appelé effectif total. Chacun des éléments de l ensemble est un individu. On étudie une (ou plusieurs) particularité de la population. Cette particularité est appelée caractère, ou variable ; dont on étudie les valeurs ou modalités. Exemple : La population étudiée est la classe de Seconde 6. L effectif total est 35. On peut étudier les caractères suivant : Couleur des yeux : ce caractère est qualitatif Nombre de frères et sœurs : ce caractère est quantitatif discret Taille : ce caractère est quantitatif continu Remarque : Lorsque les valeurs du caractère quantitatif étudié sont en très grand nombre (par exemple, la taille des individus), on peut les regrouper dans des intervalles de la forme [a ; b[ appelés classes. Définition : L effectif d une valeur du caractère est le nombre d individus de la population correspondant à cette valeur. La fréquence d une valeur du caractère est le quotient de l effectif de cette valeur par l effectif total. On a donc : effectif de la valeur fréquence = effectif total Remarques : 1. Les valeurs du caractère étudié sont généralement notées x 1, x 2,..., x p. Les effectifs correspondants sont notés n 1, n 2,..., n p. On représente souvent les données sous la forme d un tableau (voir tableau 1) valeur du caractère x 1 x 2 x 3 x p effectif n 1 n 2 n 3 n p Table 1: Valeurs d un caractère et effectifs 2. On note N l effectif total. On a donc : N = n 1 + n 2 + n 3 +... + n p. 3. Les fréquences sont généralement notées f 1, f 2,..., f p. On a donc : f i = n i N 4. On a 0 f i 1 et f 1 + f 2 + + f p = 1. Définition : L effectif cumulé croissant en x i (respectivement fréquence cumulée croissante) est égal à la somme des effectifs (respectivement fréquences) des valeurs inférieures ou égales à x i. 2
1 VOCABULAIRE 1.2 Représentations graphiques 1.2 Représentations graphiques Diagramme en bâtons (ou en barres ) : (voir figure 1a) On représente sur l axe des abscisses les différentes valeurs du caractère et sur l axe des ordonnées les effectifs. La hauteur des barres est proportionnelle à l effectif. Cette représentation est utilisée pour les caractères quantitatifs discrets. Histogramme : (voir figure 1b) La largeur de chaque rectangle correspond à l amplitude de chaque classe.lorsque les classes sont de même amplitude, la hauteur de chaque rectangle est proportionnelle à l effectif. Cette représentation est utilisée pour les caractères quantitatifs continus. Diagramme à secteurs circulaires : (voir figure 1c) L angle d ouverture de chaque secteur est proportionnel à l effectif. On a donc : angle du secteur = effectif de la valeur effectif total 360 = fréquence de la valeur 360 Cette représentation est utilisée pour les caractères qualitatifs ou quantitatifs discrets. (a) Diagramme en bâtons (b) Histogramme (c) Diagrammes à secteurs circulaires Figure 1: Diverses représentations graphiques Diagramme cumulatif : Lorsque la série est regroupée en classe, le diagramme des effectifs cumulés croissants est formé des segments reliant les points ayant pour abscisse l extrémité de chaque classe et pour ordonnée l effectif cumulé croissant correspondant. Exemple : La série statistique suivante est issue de l activité 1. Notes [2 ; 4[ [4 ; 6[ [6 ; 8[ [8 ; 10[ [10 ; 12[ [12 ; 14[ Effectif 1 7 6 4 5 3 Effectifs cumulés croissants 1 8 14 18 23 26 Le diagramme des effectifs cumulés croissants est représenté sur la figure. Figure 2: Diagramme des effectifs cumulés croissants 3
2 PARAMÈTRES D UNE SÉRIE STATISTIQUE Exercices : 24 page 124 1 25 page 124 2 28 page 29 3 12, 13, 14 page 119 4 20 page 121 5 42 page 128 6 51 page 130 7 [TransMath] 2 Paramètres d une série statistique 2.1 Mode et classe modale Définition : On appelle mode d une série statistique une valeur du caractère qui correspond au plus grand effectif. Remarque : Si la série est regroupée en classes, on parle alors de classe modale. Exemples : On reprend les séries statistiques de l activité (fp). Le mode de la classe de la seconde A est 10. La classe modale de la seconde B est [4 ; 6[. 2.2 Moyenne et étendue Définition : On considère la série statistique suivante : valeur du caractère x 1 x 2 x 3 x p effectif n 1 n 2 n 3 n p L effectif total est : N = n 1 + n 2 + n 3 +... + n p. La moyenne de la série est : Remarques : x = n 1x 1 + n 2 x 2 +... + n p x p N 1. On peut aussi calculer la moyenne à partir des fréquences : x = f 1 x 1 + f 2 x 2 + + f p x p 2. Pour une série statistique simple (non regroupée suivant les effectifs) x 1, x 2,...,x n la formule de la moyenne est plus simplement : x = x1+x2+...+xn n. 3. Pour une série dont les valeurs sont regroupées en classes, on utilise le centre de chaque classe comme valeur de x i dans le calcul de la moyenne. 4. La moyenne est très sensible aux valeurs extrêmes. Exemples : On reprend les séries statistiques de l activité (fp). La moyenne de la classe de la seconde A est : x = 7 3 + 8 2 + 9 3 + 10 5 + 11 3 + 12 2 + 13 3 + 17 2 + 18 2 25 La moyenne de la seconde B est : x = 1 3 + 7 5 + 6 7 + 4 9 + 5 11 + 3 13 26 8, 08 11, 2 Définition : L étendue d une série statistique est la différence entre la plus grande valeur et la plus petite valeur. 1. Diagramme à secteurs circulaires. 2. Fréquences - diagrammes en bâtons 3. Diagramme à barres empilés. 4. diagramme des fréquences cumulés croissantes, décroissantes. 5. Histogramme à pas inégaux. 6. Plusieurs représentations d une même série. 7. Interpolation linéaire. 4
2 PARAMÈTRES D UNE SÉRIE STATISTIQUE 2.3 Médiane Exemple : On reprend les séries statistiques de l activité (fp). L étendue de la classe de seconde A est : 18 7 = 11 Remarque : L étendue est une mesure de la dispersion de la série statistique autour de la moyenne. Exercices : 1, 2, 3, 4 page 115 et 31, 32 et 34 page 126 8 22 page 121 et 53 page 130 9 23 page 122 ; 35, 36 page 126 et 38 page 127 10 [TransMath] 2.3 Médiane Définition : On considère une série statistique dont les valeurs du caractère étudié ont été rangés dans l ordre croissant : x 1 x 2 x 3 x n On appelle médiane la valeur centrale de cette série, c est-à-dire celle qui la sépare en deux parties de même effectif. On la note : Me. Remarques : 1. Si l effectif total est impair, la médiane correspond à la valeur centrale. Si l effectif total est pair, la médiane correspond à la demi-somme des deux valeurs centrales. 2. Au moins 50 % des valeurs de la série sont inférieures (ou égales) à la médiane et au moins 50 % des valeurs de la série lui sont supérieures (ou égales). 3. La médiane est beaucoup moins sensible aux valeurs extrêmes que la moyenne. Exemples : On reprend les séries statistiques de l activité (fp). La seconde A a un effectif total de 25. La médiane correspond donc à la 13 e valeur, c est-à-dire Me=10. La seconde B a un effectif total de 26. La médiane est donc situé «entre» la 13 e et la 14 e valeur. Or, ces deux valeurs correspondent à la classe [6 ; 8[. La classe médiane est donc [6 ; 8[. Exercices : 6 page 116 et 8 page 117 11 [TransMath] Définition : On considère une série statistique dont les valeurs du caractère étudié ont été rangés dans l ordre croissant : x 1 x 2 x 3 x n 1. Le premier quartile est la plus petite valeur Q 1 de la liste telle qu au moins un quart des valeurs de la liste sont inférieures ou égales à Q 1. 2. Le troisième quartile est la plus petite valeur Q 3 de la liste telle qu au moins les trois quart des valeurs de la liste sont inférieures ou égales à Q 3. Exemple : On reprend les séries statistiques de l activité 1 (fp). L effectif total est N = 25. N 4 = 25 4 = 6, 25. Comme au moins un quart des valeurs doit être inférieure à Q 1, Q 1 est donc la 7 e valeur (classée dans l ordre croissant...). On a donc Q 1 = 9. 3N 4 = 75 4 = 18, 755. Comme au moins les trois quart des valeurs doit être inférieure à Q 3, Q 3 est donc la 19 e valeur (classée dans l ordre croissant...). On a donc Q 3 = 13. Remarque : On a donc partagé la série en quatre parties de même effectif, comme indiqué sur le schéma suivant : x min Q 1 Me 25 %de l effectif 25 %de l effectif 25 %de l effectif 8. Calcul de moyennes. 9. Effet de structure. 10. Utilisation de la calculatrice. 11. Utilisation de la médiane. Q 3 50 %de l effectif 25 %de l effectif x max 5
RÉFÉRENCES RÉFÉRENCES 25 % de l effectif a une valeur du caractère comprise entre x 1 et Q 1 ; 50 % de l effectif a une valeur du caractère comprise entre Q 1 et Q 3 ; 25 % de l effectif a une valeur du caractère comprise entre Q 3 et x n. Définition : On appelle intervalle interquartile l intervalle [Q 1 ; Q 3 ]. On appelle écart interquartile la quantité : (Q 3 Q 1 ). Remarque : L intervalle interquartile contient donc les 50 % de l effectif dont les valeurs sont «les plus proches» de la médiane. L écart interquartile, qui est une mesure de la longueur de cet intervalle, est donc une mesure de la dispersion des données autour de la médiane : plus il est grand, plus les données sont dispersées autour de la médiane ; plus il est petit, plus les données sont proches de la médiane. Exercices : 7 page 116 ; 10, 11 page 117 12 44 page 128 et 45 page 129 13 [TransMath] Références [TransMath] Transmath Seconde, Nathan (édition 2010). 4, 5, 6 12. Médianes, quartiles. 13. Comparaison de séries. 6