2nde Chapitre 3 - Statistiques descriptives 2012-2013 Chapitre 3 - Statistiques descriptives I Effectifs, fréquences et représentations statistiques TD1 : Choisir et interpréter un graphique Les graphiques 1 à 3 ci-dessous donnent la répartition des foyers fiscaux en France, par tranche de revenus annuels nets déclarés en 2004. (Sources gouvernementales.) 1. (a) Parmi les graphiques 1, 2 ou 3, sur le(s)quel(s) peut-on lire le mieux : les intervalles correspondant aux huit «tranches» de revenus étudiées? les fréquences de ces tranches (en pourcentages)? Recueillir ces données dans un tableau statistique. (b) Rappeler sur quel principe de proportionnalité est basée la construction de chacun de ces trois graphiques. (c) Qu indique l histogramme que ne «montre» pas le diagramme en barres? 2. Le graphique 4 indique comment se répartit le total des revenus annuels déclarés entre les huit tranches précédentes. -1-
Préciser quel pourcentage de ces revenus se partage la classe ayant le plus grand effectif? Et celle ayant le plus petit effectif? Comparer ces résultats. TD2 : Cumuler les effectifs A. Des effectifs cumulés dans un tableau Eurostat fournit le taux de chômage des femmes de moins de 25 ans, dans les 27 pays de l Union Européenne (UE), au 1 er trimestre 2009. On représente ces données dans un tableau, reproduit partiellement ci-dessous : Taux de chômage (%) en ordre croissant 5,4 7,5 8,5 9... 19,5 21,4... 31,8 33,7 Nombre de pays (effectif) 1 1 1 1... 1 2... 1 1 Effectifs cumulés 1 2 3 a... 16 b... c d 1. Que signifie l effectif cumulé 16 associé à la valeur 19,5? Faire une phrase. 2. Donner les effectifs cumulés à placer à la place de a, b, c et d. B. Des effectifs cumulés sur un graphique Pour distinguer, dans le chômage des moins de 25 ans, celui des femmes et celui des hommes, on donne ci-dessous les courbes des effectifs cumulés de leurs taux de chômage, dans les 27 pays de l UE, au 1 er trimestre 2009. (Source Eurostat.) -2-
1. Dans combien de pays de l UE, le taux de chômage des femmes de moins de 25 ans est-il inférieur ou égal à 18%? Et pour les hommes? 2. Que traduisent les point de même ordonnée (17; 14) et (19, 7; 14)? 3. Dans combien de pays de l UE le taux de chômage des femmes de moins de 25 ans dépasse-t-il 25%? Et pour les hommes de moins de 25 ans? I.1 Effectifs et fréquences Définition 1 Dans une série statistique, l effectif d une valeur est le nombre de données correspondant à cette valeur ; effectif de la valeur la fréquence d une valeur est f =. effectif total Exemple En lançant dix fois un dé, on obtient : 2 ; 4 ; 6 ; 6 ; 3 ; 4 ; 4 ; 5 ; 3 ; 6. L effectif total est 10. La valeur 6 apparaît 3 fois : son effectif est 3, sa fréquence est 3 = 0, 3. 10 Valeur x i 2 3 4 5 6 Effectif n i 1 2 3 1 3 Fréquence f i 0,1 0,2 0,3 0,1 0,3 Quand on cherche le nombre de valeurs de la série inférieures ou égales à une valeur donnée, on est amené à ajouter (cumuler) les effectifs : Valeur x i 2 3 4 5 6 Effectif n i 1 2 3 1 3 Effectifs cumulés 1 1+2=3 1+2+3=6 1+2+3+1=7 1+2+3+1+3=10 Il y a 6 valeurs de la série inférieures ou égales à 4. En pratique, on cumule pas à pas les effectifs. On peut cumuler de la même façon les fréquences. -3-
I.2 Graphiques Le choix d un graphique dépend du type de série et de ce que l on veut montrer : un diagramme en bâtons (pour des valeurs discrètes ou qualitatives) et un histogramme (pour des valeurs numériques regroupées en classes) représentent les effectifs ou fréquences pour chaque valeur ou classe ; un diagramme circulaire montre la part relative de chaque valeur ou classe. On utilisera aussi les graphiques suivants (relatifs à l exemple précédent). Nuage de points Courbe d effectifs (ou fréquences) cumulé(e)s On peut aussi relier les points par des segments. Un nuage de points peut être utilisé pour montrer l évolution d une série. Les valeurs de la série sont en abscisse, les effectifs (ou fréquences) cumulé(e)s en ordonnée. On relie les points par des segments. II Indicateurs de position TD3 : Jouer à «moyenne-médiane» Voici une série de notes entières de moyenne 12 : 10 ; 6 ; 5 ; 15 ; 17 ; 7 ; 14 ; 9 ; 15 ; 13 ; 15 ; 17 ; 13. Les questions suivantes portent sur cette série initiale. A. Agir sur la moyenne... 1. Modifier deux notes sans changer la moyenne. 2. Modifier trois notes sans changer la moyenne. 3. Supprimer une note pour que la moyenne augmente le plus possible. 4. Supprimer une note pour que la moyenne diminue mais le moins possible. 5. Modifier une note pour que la moyenne augmente de 1. B. Agir sur la médiane... 1. Peut-on augmenter la médiane de 1 en modifiant une seule note? 2. Peut-on diminuer la médiane de 1 en modifiant une seule note? C. Agir sur la moyenne et la médiane 1. En modifiant deux notes, peut-on garder la même moyenne et augmenter la médiane de 1? 2. En modifiant une note peut-on garder la même médiane et diminuer la moyenne de 1? -4-
Définition 2 Soit la série statistique : Valeur x 1 x 2... Effectif n 1 n 2... Fréquence f 1 f 2... La moyenne, notée x, de cette série statistique est x = somme des n i x i somme des n i = somme des f i x i. La moyenne est le nombre qui, substitué à chaque valeur de la série, redonne la même somme. Définition 3 La médiane Me d une série statistique de n valeurs ordonnées est : la valeur «du milieu» si n est impair ; la demi-somme des deux valeurs situées «au milieu» si n est pair. Moyenne et médiane renseignent sur la «tendance centrale» d une série. Contrairement à la moyenne, la médiane, qui ne dépend que de l ordre des valeurs, est peu sensible aux valeurs extrêmes. On préférera donc la médiane pour des séries fortement «asymétriques». La moyenne possède en revanche des propriétés de calcul que n a pas la médiane. III Indicateurs de dispersion TD4 : Faire parler les indicateurs Le tableau fournit les températures moyennes mensuelles à Brest et à Moscou. Mois J F M A M J J A S O N D Brest ( C) 9,1 9,4 11 12,5 15,6 18,1 20,4 20,6 18,7 15,3 11,9 10 Moscou ( C) -6,3-4,2 1,5 10,4 18,4 21,7 23,1 21,5 15,4 8,2 1,1-3,5 1. (a) Graduer une droite de 9 à 21 avec pour unité 1 cm puis y placer les températures mensuelles de Brest. (b) Déterminer pour cette série : son maximum, son minimum, sa moyenne, sa médiane, ses 1 er et 3 ème quartiles Q 1 et Q 3. Les indiquer sur la droite graduée. (c) Calculer l étendue et la différence Q 3 Q 1. Les interpréter graphiquement. 2. Déterminer ces mêmes indicateurs pour la série des températures à Moscou. 3. Les affirmations suivantes sont-elles exactes? Argumenter à partir des indicateurs précédents, sans revenir aux données initiales. (a) «Il fait toujours plus froid à Moscou qu à Brest.» -5-
(b) «En moyenne sur un an, il fait 6 degrés de plus à Brest qu à Moscou.» (c) «Le climat à Moscou est caractérisé par une forte amplitude thermique.» (d) «Les températures mensuelles sont beaucoup plus homogènes à Brest.» (e) «La température médiane de Brest dépasse de 4,6 degrés celle de Moscou.» Définition 4 L étendue d une série statistique est la différence entre la plus grande et la plus petite valeur de la série (notées Max et Min). L écart interquartile est la différence Q 3 Q 1 où : Q 1 est le premier quartile. Q 1 est la plus petite valeur de la série telle qu au moins 25% des valeurs lui soient inférieures ou égales. Q 3 est le troisième quartile. Q 3 est la plus petite valeur de la série telle qu au moins 75% des valeurs lui soient inférieures ou égales. Exemple Soit la série : 6 ; 9 ; 11 ; 23 ; 54 ; 65 ; 135 ; 143 ; 248 ; 305 d effectif 10. Max = 305, Min = 6 donc l étendue est 305 6 = 299. Le rang de Q 1 est le premier entier supérieur à 10 0, 25 = 2, 5. C est 3 et donc Q 1 est la 3 e valeur de la série rangée en ordre croissant : Q 1 = 11. Le rang de Q 3 est le premier entier supérieur ou égal à 10 0, 75 = 7, 5. C est 8 donc Q 3 est la 8 e valeur de la série rangée dans l ordre croissant : Q 3 = 143. L écart interquartile est Q 3 Q 1 = 143 11 = 132. -6-