Chapitre Statistique descriptive. Analyse de données Énigme On note x le prix au kg du produit. 5 % de remise en caisse : le prix au kg devient x 5 x = 0,85x. + 5 % de produit gratuit : le prix au kg devient x + 0,5 = x,5 0,87x. La promotion la plus avantageuse est la remise en caisse. Énigme On note d le nombre de dessinateurs et j le nombre de journalistes : 0d + 8j = 5 d + j 0d + 8j = 5(d + j) ; 0d + 8j = 5d + 5j ; j = 5d 5 = d j. Le rapport entre le nombre de dessinateurs et celui de journalistes est de, soit dessinateurs pour 5 5 journalistes.. Vérifier les acquis f = 6 50 = 0,68 P = f = 88 = 5, 50 élèves ont reçu exactement spams aujourd hui. + 0 + + + + + + 5 + + + = 5 La classe compte 5 élèves. ombre de spams 0 5 6 7 8 9 0 Effectif 0 5 wx = 0 + 0 + + + 0,6. 5 Ainsi, en moyenne, un élève de cette classe a reçu environ 5 spams aujourd hui. e = 8 8 = 65. Les valeurs sont rangées par ordre croissant. L effectif total est donc la médiane est la demi-somme des valeurs de rang 7 et de rang 8. 55 + 56 Me = = 55,5. Ainsi, au moins 50 % des résultats des élèves sont inférieurs ou égaux à 55,5 et au moins 50 % sont supérieurs ou égaux à 55,5. Les valeurs sont rangées par ordre croissant. L effectif total est. = 5. Le premier quartile q correspond à la 5 e valeur. q = 5. Ainsi, au moins un quart de ces anacondas mesure 5 m ou moins.. Activités d approche Activité Voir fichiers complémentaires sur le site compagnon. Thonier : B7 = MOYEE(A:E5) Moyenne : 9,65 Thonier : H7 = MOYEE(G:K5) Moyenne : 9,65 c) Cela ne suffit pas car les deux thoniers ont une moyenne de pêche supérieure à la masse minimale autorisée. d) Thonier : B8 = QUARTILE(A:E5;) Premier quartile : 7,75 Thonier : H8 = QUARTILE(G:K5;) Premier quartile : 6,5 Puisqu au moins un quart des valeurs d une série statistique sont inférieures ou égales au premier quartile, les autorités de pêche savent qu au moins un quart des thons pêchés par le thonier ont une masse très inférieure à la masse minimale autorisée. Ce thonier sera sanctionné. Activité B = SOMMEPROD(B:M*B:M)/SOMME(B:M)
c) La population moyenne exacte des régions est environ 59 5 habitants.. Exercices de base 7 6 élèves sont concernés par cette étude. 60 Pourcentage de filles : 55,. 7 6 Pourcentage de garçons :,78 environ. c) En séries technologiques : 8 69 Fréquence des filles : f = 60 7 0,5. Fréquence des garçons : g = 0,5 0,86. Donc f > g. d) Filles Garçons Littéraire 0,80 0,0 Sc. Éco. et Sociales 0,6 0,7 Scientifique 0,6 0,5 et En Cellule E5, saisir la formule =SOMME(D$5:D5)/ afin d obtenir le tableau cidessous. c) 0,5 Fréquences cumulées croissantes ombre de papillons Effectifs cumulés croissants (en jours) 8 0 6 8 0 5 9 9 6 c) Il y a eu jours avec papillons au moins dans le pré, donc 6 = 8 jours avec plus de papillons dans le pré. Taille supérieure à 80 90 00 0 0 ECD 5 0 67 7 E.C.D. 0 80 60 50 0 0 80 90 00 0 0 0 Taille c) «Les 50 plus grands basketteurs de BA mesurent plus de, m environ». 0, 0 5 5 5 0 5 55 65 75 Âge 85 «50 % de la population a un âge inférieur à 0 ans». Masse (en g) [79 ; 8[ [8 ; 85[ [85 ; 88[ [88 ; 9[ Fréquence 0,7 0,6 0, 0,07 FCD 0,7 0,7 0,07 0,75 0,6 0, 0, Fréquences cumulées décroissantes poids (en kg) 79 8 85 88 9 c) «75 % des expressos contiennent plus de 8,5 g de café». 70 60 50 0 0 0 0 0 Effectif 7 0 60 90 0 Dépenses (en euros)
0 0 0 Histogramme Fréquence (en %) 6 7 8 Diagramme circulaire Tranche horaire 6-7 h 7-8 h 8-9 h 9-0 h 0- h - h Fréquence (en %) 7,, 5 7 5,5 60 ombre de degrés 6 90 50 5 0 9 0 Tranche horaire (en h) 0- h - h 9-0 h 8-9 h 6-7 h 7-8 h 67 0 + 0 + 9 0 + 0 7 + 657 xx = 67 + 0 + 9 0 + 0 7 + 657 xx,. Le nombre moyen de véhicules par foyer est environ,. 67 + 0 + 9 0 + 0 7 =. foyers possèdent véhicules ou moins. On range les données par ordre croissant : 57,9 ; 08, ; 9,6 ; 7,9 ; 778, ; 7 ; 868 ; 505. Il y a 8 données, la médiane est donc la demi-somme de la e et de la 5 e valeur. 7,9 + 778, Me = = 50,. La distance médiane entre le Soleil et ses planètes est de 50 000 km. 57,9 + + 505 Distance moyenne : = 65,7 5. 8 La distance moyenne entre le Soleil et ses planètes est de 65 7 500 km. La distance médiane est inférieure à la distance moyenne entre le Soleil et ses planètes. Les valeurs sont rangées par ordre croissant. Le magasin compte ordinateurs. = est impair, soit = + +, donc la médiane est la e valeur. Me = 50. + 9 = 5,6 5,6 % des ordinateurs ont une capacité strictement inférieure à Me. = 0,75, donc Q est le e ordinateur. Q = 60. =,5, donc Q est le e ordinateur. Q = 500. [Q ; Q ] = [60; 500]. D après le tableau, 9 + + 7 + 5 = ordinateurs sont situés dans cet intervalle. 79. Donc environ 79 % des ordinateurs sont situés entre Q et Q. 69 % des familles se connectent h par jour ou moins ; 8 % des familles se connectent 5 h par jour ou moins. Or 8 69 =, donc % des familles se connectent entre et 5 h par jour. Par lecture graphique : Me, h ; Q, h ; Q,5 h ; donc Me h min ; Q h 6 min ; Q h 0 min. 5 0 8 6 ombre de matchs Joueur Joueur Distance (en km) 8 8,5 9 9,5 0 0,5 Joueur : Moyenne : xx = 8 8 + + 8 0,5 9, 8 Premier quartile : 8 = 9,5 ; Q est donc égal à la 0 e valeur ; Q = 8,5. Troisième quartile : 8 = 8,5 ; Q est donc égal à la 9 e valeur ; Q = 0.
Écart interquartile :,5. Joueur : Moyenne : xx = 0 8 + + 0,5 8 Premier quartile : 8 = 9,5 ; Q 0 e valeur ; Q = 9. = 9,. est donc égal à la Troisième quartile : 8 = 8,5 ; Q est donc égal à la 9 e valeur ; Q = 9,5. Écart interquartile : 0,5. c) En moyenne, ils parcourent le même nombre de kilomètres par match, mais le joueur est plus régulier que le joueur car son écart interquartile est plus faible.. Exercices d entraînement. et et. et. c) L écart interquartile est très faible, ce qui montre une grande régularité dans les temps de course.. c) Pour 8 des 0 dernières années, le temps de course appartenait à I. On peut donc prévoir un temps de course situé entre h 0 min 5 s et h 08 min 5 s, avec un risque d erreur.. xs = 900 + + 500 9 986. Salaire 900 00 500 700 900 E.C.C. 60 7 85 90 Salaire 00 500 700 900 00 500 E.C.C. 9 05 0 7 7 7 Salaire 700 900 00 500 E.C.C. 8 8 8 8 9 Les valeurs sont rangées par ordre croissant et il y en a 9 = 69 + + 69. La médiane est la 70 e valeur : Me = 700. 9 =,75. Le premier quartile est la 5 e valeur : Q = 00. 9 = 0,5. Le troisième quartile est la 05 e valeur : Q = 500. c) Étendue des salaires : e = 500 900 = 600. d) Point de vue du directeur : «Médiane Écart interquartile». Point de vue d observateur impartial : «Moyenne Étendue».. xs 968 ; Me = 700 ; Q = 00 ; Q = 500. Écart interquartile : 00 ; e = 800. xs = 009 ; Me = 700 ; Q = 500 ; Q = 500. Écart-interquartile : 000 ; e = 600. c) À partir de la série initiale, choisir 9 salaires inférieurs à 700 et les répartir en 9 salaires supérieurs à 700.. xx = x + + M p x p + + M p Pour tout i allant de à P : f i = M i où = + + M p. On part de la formule xx = x + + M p x p xx = x xx = + + M p x p x + + M p x p xx = f x + + f p x p.. On utilise la deuxième formule en transformant les pourcentages en fréquences. xx = 0,5 0,98 + 0, 0,99 + 0,7 + 0,06,0 xx = 0,989. Puisque xx = 7,5, la valeur oubliée est supérieure à 6. 6 7 + x = 7,5 donc + x = 60 ; x = 8. 8. xx = x + M x + M x + M + M xy = y + M y + M y + M + M xy = ax + M ax + M ax + M + M xy = a M x + M x + M x + M + M xy = axx. + 8 5,5 + 7,5. xx = = 5,5. + 8 + Le prix moyen de ces entrées est 5,5. On note x l ancien prix et y le nouveau. y = x + 0 x =,x En appliquant la formule du. avec a =,, on obtient xy =, 5,5 = 6,05. Le prix moyen de ces entrées est maintenant de 6,05. ORAGES : xx = 9,775 CAFÉ VERT : xx = 65, Il faut au préalable ranger les valeurs par ordre croissant : ORAGES : 78,6 ; 85,8 ; 87,6 ; 87,9 ; 88,7 ; 89,6 ; 90, ; 9,6 ; 95,8 ; ; 0, ; 0,. CAFÉ VERT : 50,76 ; 5,6 ; 55,5 ; 6, ; 6,5 ; 6,58 ; 65,7 ; 67,75 ; 69, ; 7,7 ; 79,75 ; 8,.
Il y a valeurs ; =. Donc, pour les deux séries, le premier quartile est la e valeur. ORAGES : Q = 87,6 CAFÉ VERT : Q = 55,5 = 9. Donc, pour les deux séries, le troisième quartile est la 9 e valeur. ORAGES : Q = 95,8 CAFÉ VERT : Q = 69,. c) Écart interquartile : ORAGES : 8, et CAFÉ VERT :,9. Les prix des oranges sont plus stables. On a demandé à Virginie de calculer la moyenne des naissances par jour, entre le er et le 7 août 009, dans cette clinique. Elle a considéré les jours comme des effectifs. En réalité, durant cette semaine, en moyenne, 0,7 enfants sont nés par jour. Ce graphique ne peut pas correspondre à l écran de la calculatrice parce que, sur le graphique, le troisième quartile vaut 5. Le premier patient parle du médecin ; et le deuxième patient du médecin. On peut reproduire le tableau comme ci-dessous. Entre 999 et 009 : Vitesse des vents (km/h) [6 ; 89[ [89 ; 8[ [8 ; 66[ [66 ; [ [ ; 58[ Centre de la classe 76 0,5 89 5 Effectif 7 6 6 Les calculs permettent d obtenir les indicateurs suivants : Moyenne :,67 km/h ; Médiane :,75 km/h ; Écart interquartile : [0,5 ; 89]. Saison 008-009 Vitesse des vents (km/h) [6 ; 89[ [89 ; 8[ [8 ; 66[ [66 ; [ [ ; 58[ Centre de la classe 76 0,5 89 5 Effectif 0 Les calculs permettent d obtenir les indicateurs suivants : Moyenne : 08, km/h ; Médiane : 0,5 km/h ; Écart interquartile : [76 ; 0,5]. Tous les indicateurs montrent que la saison 008-009 a été très calme. Q =,5 donc au moins un quart des appareils tombe en panne avant ans et demi. La publicité est mensongère. Alors que les données semblent différentes, les graphiques sont assez similaires. Cela signifie que la répartition des catégories de blessés a peu changé, si ce n est pour les «conducteurs et passagers de cycles avec moteur» pour lesquels la proportion s est accrue en 007 par rapport à 985. Les valeurs sont très regroupées autour de 9, ce qui explique la valeur médiane ; la valeur minimale est proche de 9 tandis que la valeur maximale est éloignée de 9, ce qui explique que xx > Me. La médiane est comprise entre 8 et 9 ; la moyenne est égale à 6,6, donc xx < Me. 6 8,5 + 6 9,5 + + 8 8,5 c) xx =,9 Il y a valeurs (puisque les données sont en pourcentage) rangées par ordre croissant. La classe médiane est située entre la 50 e classe et la 5 e classe. La classe médiane est [ ; [. Utiliser les quartiles eut été plus judicieux qu utiliser ces deux couples. À la sortie de l algorithme : = n + n + + n p et S = n x + n x + + n p x p. L algorithme calcule et affiche S, qui est la moyenne de la série statistique. Cette affirmation est fausse. D une part, plus de personnes atteignent 80 ans que 90 ans, d autre part, lorsqu on vieillit les risques de mourir sont évidemment plus élevés. Il faut raisonner avec des phrases du type «80 ans ou moins». L affirmation du géologue est fausse. Le chiffre de 000 000 est, à l origine, une approximation. Y ajouter ans n a pas de sens. c) Cette affirmation est fausse. Ce chiffre de 90 % est dû au fait que la grande majorité des trajets sont situés dans un rayon de 5 km du domicile. Il faut saisir =MOYEE(B8:X8) en cellule Y. c) et d) 5
Dans le pays et dans le pays, le médicament est plus efficace que le placebo. c) Pour les deux pays pris ensemble, le médicament est moins efficace que le placebo. Faux. Contre-exemple : Série : ; Me = ; xx = Série : 9 ; Me = ; xx = 6 Ces séries ont la même médiane mais des moyennes différentes. Faux. Contre-exemple : Série : ; Me = ; xx =. Série : 0 5 ; Me = ; xx =. Ces séries ont la même moyenne bien qu elles n aient pas la même médiane. Faux. Contre-exemple : ; ; ; pour cette série statistique, la moyenne est 6 et la médiane est. Vrai. Par exemple la série : possède une moyenne égale à sa médiane :. c) Faux. Contre-exemple : 6 ; ; ; ; Q = ; Q = ; xx = 0. Donc xx [Q ; Q ]. 5. Se préparer au contrôle QCM. Faux. Erreur possible : confusion entre les valeurs et les effectifs. Faux. Avec cette formule, on calcule bien la fréquence de la cellule B, mais en l étirant vers la droite, on ne calcule pas la fréquence de la cellule C ; en effet, la formule devient =C/SOMME(C:H). c) Vrai. En effet, «SOMME($B:$G)» est l effectif total de la série, et les dollars permettent de faire glisser cette formule vers la droite sans modifier l effectif total.. Faux. Erreur possible : oublier que sur la courbe, il y a des points intermédiaires. Par exemple, le point de coordonnées (0 ; 0) qui est sur la courbe ne correspond à aucun point du tableau. 6 Faux. Erreur possible : mauvaise lecture du graphique qui comporte trois informations et non deux comme dans le tableau. c) Vrai. En effet, il suffit de vérifier que chaque point du tableau, de coordonnées (Valeur ; Effectif), se trouve sur la courbe.. Faux. Erreur possible : calculer la moyenne de la liste,,, 5, 8, 0,. Faux. Erreur possible : calculer la moyenne de la liste,,, 6,,,. c) Vrai. En effet : xx = + + = 7 + + 9 soit xx 5,.. Vrai. En effet : l effectif total est 8, donc la médiane est la demi-somme de la neuvième et de la dixième valeur qui sont toutes deux égales à 5. Faux. Erreur possible : avoir considéré la valeur centrale de la ligne des effectifs (nombre de matchs). c) Faux. Erreur possible : erreur de calcul.. Faux. Erreur possible : n avoir calculé que le troisième quartile. Vrai. En effet : Q est la cinquième valeur donc Q =, Q est la quatorzième valeur, donc Q = 8, ainsi l écart interquartile est 8 = 5. c) Faux. Erreur possible : avoir pris la quatrième et non la cinquième valeur pour Q. Vrai Faux Faux. En effet, c est un indicateur de position : revoir le cours paragraphe page 6. Vrai. En effet, il suffit de multiplier par. c) Vrai. Revoir le graphique du cours, paragraphe page 6. d) Faux. Erreur possible : confusion entre «50 % des données» et «Au moins 50 % des données». Voir le graphique du cours, paragraphe page 6. e) Faux. Erreur possible : ne songer qu à des séries quantitatives et oublier qu il peut y en avoir des qualitatives. f) Faux. Dans le cas d un nombre pair de valeurs, la médiane peut être située entre deux données. Faux. Erreur possible : avoir calculé la moyenne des effectifs. Faux. Erreur possible : confondre effectif et valeurs. Ici, l étendue est : 9 0 = 9. c) Vrai. En effet, il y a 8 valeurs, donc la médiane est située entre la quatorzième et la quinzième valeurs qui sont toutes deux situées dans la classe «5 à 9». d) Vrai. En effet, 7 + + 8 + 6 = 5, donc 5 élèves ont reçu moins de 5 SMS, ce qui représente environ 89 % des élèves 5 8 89.
Pour réviser Longueur 7 76 78 80 8 8 86 Fréquence 0, 0,5 0, 0, 0,7 0, 0,0 F.C.D. 0,9 0,75 0,5 0, 0,7 0,0 0,5 0,0 0,5 0,0 0,05 0 Fréquence Longueur 7 76 78 80 8 8 86 % des pantalons vendus mesurent 8 cm ou plus de long. Effectifs 0 0 6 0 0 0 6 8 0 6 8 50 Longueur Longueur [0 ; [ [ ; [ [ ; 6[ [6 ; 8[ [8 ; 0[ E.C.C 5 8 58 60 Longueur [0 ; [ [ ; [ [ ; 6[ [6 ; 8[ [8 ; 50[ E.C.C 76 99 76 97 500 99 noix mesurent moins de mm. 77 La moyenne est wx =,5. La médiane est Me = 5. Il faut commencer par ranger les valeurs par ordre croissant : 0 5 8 8 9 50 56 Il y a 9 valeurs, 9 = + + la médiane est donc située à la 5 e valeur. Me = 8. Ce qui signifie qu au moins 50 % des marguerites effeuillées comptaient 8 pétales au moins et au moins 50 % comptaient 8 pétales ou plus. Il faut commencer par ranger les valeurs par ordre croissant : 7 8 9 9 6 Il y a 0 valeurs. 0 =,5 donc Q est situé à la e valeur. Q = 9. 0 = 7,5 donc Q est situé à la 8e valeur. Q =. Ce qui signifie qu au moins un quart des marguerites effeuillées (5 %) comptaient 9 pétales ou moins ; et au moins trois quarts des marguerites effeuillées (75 %) comptaient pétales ou moins.. Mexico : e = 8, = 6, ; Barcelone : e =, 9,5 =,8. Mexico : wx 5,6 ; Barcelone : wx 6,5. 6, + 6, c) Mexico : Me = = 6,5 ;,6 + 7,6 Barcelone : Me = = 6,. d) Mexico : Q =,9 ; Q = 6,8 ; Barcelone : Q = 0, ; Q =,5.. Le calcul de la moyenne. Les calculs de l étendue (ou de l écart interquartile). c) Le calcul de la médiane. d) Le calcul de l intervalle interquartile de Mexico. 6. Exercices d approfondissement Cette classe compte élèves. 7 élèves mettent plus de min et 0 élèves mettent entre 7 et min. 7
Il y a élèves. La médiane est située entre la 6 e et la 7 e valeur, donc, graphiquement, Me,5. = 8. Le premier quartile est la 8e valeur : Q = 8. =. Le troisième quartile est la e valeur : Q = 0. c) 8 Durée (en min) 7 7 7 Effectif 0 5 6 6 0 wx = + + 0 7,7. La durée moyenne des trajets est de,7 min environ, soit min et s. Les sorties : Beaucoup Assez Peu ou pas du tout Les sujets de société : L international : Le sport : L environnement : L économie : La politique :. Longueur L Fréquence Hauteur L < 6 m 0,76 0,095 6 m L < 8 m 0,9 0,9 5 8 m L < 0 m 0, 0,07 0 m L < m 0,09 0,06 m L < 5 m 0,0 0,0 5 m L < 8 m 0,006 0,00 8 m L < m 0,00 0,000 L m 0 0. Fréquence c) 0, 0, 0,0 0,09 0,08 0,07 0,06 0,05 0,0 0,0 0,0 0,0 Longueur 0 6 8 0 5 8 0 Centre,5 7 9,5 6,5 7 des classes Fréquence 0,76 0,9 0, 0,09 0,0 0,006 0,00 0 wx = 0,76,5 + + 0 7 6, Ces voiliers mesurent, en moyenne, 6, m environ.. Peugeot-Citroën : 66 milliers de véhicules ; Renault : 58, milliers de véhicules ; Ford : 0, milliers de véhicules ; Mercedes : 50,5 milliers de véhicules. Dans chacune des séries il y a 0 valeurs qu il faut ranger par ordre croissant. La médiane est alors la demisomme de la 5 e et de la 6 e valeur. 67 + 6 Peugeot-Citroën : Me = = 60. 59 + 56 Renault : M e = = 556,5. c) Chez Renault, les années 00 à 007 correspondent à des valeurs inférieures à la médiane.. Les premier et troisième quartiles correspondent respectivement à la e et à la 8 e valeur. Peugeot-Citroën : Q = 60 ; Q = 659 Écart interquartile : [60 ; 659] Renault : Q = 5, Q = 600 Écart interquartile : [5 ; 600]. Les quatre constructeurs restent globalement dans des nombres d immatriculations analogues aux 5 dernières années. On ne peut pas parler de crise. Ford réalise la plus grosse augmentation par rapport à 007 avec + 8,7 %. i j Liste 7 6 7 6 76 76 76 76 76 67 67 L algorithme trie la liste dans l ordre croissant.
Valeur 0 5 Total Effectif 5 6 7 5 5 Diverses réponses peuvent être apportées. Âge moyen : Guadeloupe : 0, ans France : 8 ans Dans les deux cas, les hommes sont plus touchés ; les personnes entre 0 et 9 ans sont les plus touchées. a + b + c = 9 a + b = Ce système est équivalent à b + c = 9,5 a + b + c = 87 + c = 87 c = a + b = ; a + b = ; a + b = ; b + c = 79 b + c = 79 b + = 79 c = a = 8 b = 6 ; b = 6. a + 6 = c = On note x la somme disponible pour Pierre cette année. Il a dépensé, cette année, 0,x pour le sport ; 0,x pour le cinéma ; 0,x pour la musique et 0,x pour la lecture. Il dépensera l année prochaine : pour le sport : 0,x + 50 0,x = 0,6x 5 pour le cinéma : 0,x + 0,x = 0,x pour la musique : 0,x + 0 0,x = 0,x 5 pour la lecture : 0,x + 0,x = 0,05x Ainsi, sa dépense l année prochaine sera : 0,6x + 0,x + 0,x + 0,05x =,5x. Répartition des dépenses de loisirs pour l année prochaine : 0,6x Sport : 8, %,5x Cinéma : 0,x 6,9 %,5x Musique : 0,x 6,5 %,5x Lecture : 0,05x 8, %,5x ombre de candidats présents : 6 + 95 + 60 = 9 ombre de candidats reçus : 75 80 85 6 + 95 + 60 = 60 Taux de réussite global du lycée : 60 9 0,85. 9