1. Vocabulaire associé à une série statistique STATISTIQUES (a) L ensemble sur lequel on travaille en statistique est appelé............ Si cet ensemble est trop vaste, on en restreint l étude à une partie appelée............ Un élément de cet ensemble est appelé............ (b) La particularité commune que l on étudie est appelée............ Remarques : (1) si celle-ci s exprime par un nombre, il s agit d un caractère quantitatif. Si les valeurs du nombre exprimé sont isolées notée x i, il s agit d un caractère discret. Par contre, si ces valeurs sont prises dans tout un intervalle, il s agit d un caractère continu. (2) si la particularité étudiée ne s exprime pas par un nombre, il s agit d un caractère qualitatif. Exemples : Le nombre de frère et sœur d un élève de seconde 10 est un caractère............... il peut prendre les valeurs 0, 1, 2, 3, 4... La taille des élèves de seconde 10 est un caractère......... il peut prendre toutes les valeurs entre 1,55 m et 1,95 m. Dans une population, la couleur des yeux est un caractère......... (c) L effectif d une valeur d un caractère est le............ d individus noté n i ayant cette valeur. Le nombre total d individus noté N de la population est appelé............ (d) Le rapport f i = n i est appelé............ N Remarques : f i est un nombre toujours compris entre 0 et 1.Souvent, les nombres f i s expriment par un pourcentage. La somme des nombres f i est toujours égale à 1. (e) Une série statistique est l ensemble des résultats d une étude : valeurs du caractère et effectifs correspondants. On représente souvent une série statistique sous forme d un tableau. valeurs du caractère x 1 x 2 x 3 x 4... effectifs n 1 n 2 n 3 n 4... fréquences f 1 f 2 f 3 f 4... 2. Cas d une série à caractère discret : Exemple : La course automobile des 24h du Mans consiste à effectuer en 24h le plus grand nombre de tours d un circuit. Voici les résultats des 25 meilleurs pilotes. Nombre de tours effectués 310 320 330 340 350 360 Effectifs 4 4 5 7 3 2 Effectifs cumulés croissants Fréquences Fréquences cumulées croissantes (a) Compléter le tableau. (b) Répondre aux questions suivantes : i. Combien de coureurs ont fait moins de 320 tours?......................... ii. Quel est le pourcentage de coureurs ayant fait 350 tours ou moins?......................... (c) Construire le diagramme en bâtons de la série 1
(d) Construire le polygone des effectifs cumulés croissants et le polygone des fréquences cumulées croissantes de la série. Définitions des indicateurs d une série statistique : (a) La différence des valeurs extrêmes du caractère s appelle......... (b) Le mode pour un caractère discret, noté M o, est la valeur qui correspond au plus grand effectif. (c) La moyenne dans le cas d une série discrète est le nombre noté x= n 1x 1 + n 2 x 2 +... + n i x i N ou x= f 1 x 1 + f 2 x 2 +...f i x i (d) La médiane d une série, dont les valeurs du caractères sont discrètes et rangées dans l ordre croissant, est la valeur (pas necessairement dans la série) partageant la population en deux groupes de même effectif. (e) Le premier quartile d une série, dont les valeurs du caractère sont discrètes et rangées dans l ordre croissant, est la valeur de la série pour laquelle le quart de l effectif est atteint ou dépassé (f) Le troisième quartile d une série, dont les valeurs du caractère sont discrètes et rangées dans l ordre croissant, est la valeur de la série pour laquelle les trois quarts de l effectif est atteint ou dépassé (g) L écart interquartile est l intervalle entre le premier quartile et le troisième quartile. Application à l exemple de la course des 24h du Mans : i. Donner l étendue, le mode et la moyenne de la série......................... ii. Donner la médiane, le 1er et le 3ème quartile, l intervalle interquartile......................... iii. Donner la médiane, le 1er et le 3ème quartile en rajoutant une donnée 3 voitures ont fait 362 tours......................... iv. Construire le diagramme en boîte de la série. 2
3. Cas d une série à caractère continu : Exemple : Dans un college de 480 élèves, le bureau du foyer a procédé à 2 enquêtes sur la totalité de la population. Les résultats concernant le temps consacré chaque semaine par les élèves à regarder la télévision sont consignées dans le tableau suivant : Temps passé devant la tv en h [0 ;4[ [4 ;8[ [8 ;10[ [10 ;12[ [12 ;20[ [20 ;28] Effectif 60 74 60 70 120 96 Fréquences Fréquences cumulées croissantes 4. Construire l histogramme de la série 5. Construire la courbe des fréquences cumulées 3
(a) Donner l étendue......................... (b) Donner la classe modale......................... (c) Donner la moyenne......................... (d) Donner la médiane......................... (e) Donner le 1er quartile et le 3ème quartile......................... Les résultats concernant les types de musique par les élèves sont consignés dans un tableau Type de musique Rock Rap Techno Variétés françaises Variétés internationales Autre Total Effectif Angle associé Construire un diagramme circulaire représentant les résultats. 4
6. Echantillonage : On lance une étude sur une partie de la population, on dit que c est un............. Le nombre d individus de l échantillon est............ de l échantillon. (a) Théorème de stabilisation des fréquences : En notant p la proportion de la population vérifiant le critère étudié et f la proportion de l échantillon vérifiant le même critère. Plus la taille de l échantillon augmente, plus.............. exemple :............ (b) Théorème de l intervalle de fluctuation : Définition : Si on réalise plusieurs échantillons de même taille, la fréquence observée, f, du caractère varie : c est ce qu on appelle la...... Théorème : Avec les conditions, que la taille de l échantillon (n) soit supérieure à 25 et que p soit dans l intervalle [0,2 ;0,8]. Dans plus de 95% des cas, f [p 1 ; p + 1 ]. n n Remarque : On retrouve que.................. Application : Ce théorème permet de prendre une décision à partir d un échantillon Exercice 1 : Une machine ensache des bonbons de la façon suivante. Elle choisit au hasard les bonbons dans une cuve qui contient, à part égale, uniquement des bonbons à la fraise et à la menthe. Il y a 50 000 bonbons dans la cuve. Chaque paquet contient 100 bonbons. On prend le premier paquet de bonbons et on note f la frequence observée de bonbons à la menthe. i. Expliquer pourquoi le sachet peut être assimilé à un échantillon. ii. Si la machine est bien réglée, quel est l intervalle de fluctuation de f? iii. En ouvrant le sachet, on trouve dans le paquet 42 bonbons à la fraise et 58 bonbons à la menthe. Peut-on considérer, au seuil de 95%, que l ensacheuse est bien réglée? Exercice 2 : On souhaite savoir si une entreprise exerce de la discrimination à l embauche vis vis du personnel féminin. La proportion de femmes dans la population active est 0,5. On considère l intervalle de fluctuation au seuil de 95%. i. Si une entreprise contient 1183 femmes sur 2540 salariés. Exerce-t-elle une discrimination? ii. Quel doit être le nombre minimal de femmes dan sl entreprise pour que la proportion de femmes appartienne à l intervalle de fluctuation? 5
(c) Théorème de l intervalle de confiance : Connaissant f la fréquence du caractère d un échantillon de taille n, On appelle l intervalle [f 1 n ; f + 1 n ] l intervalle de confiance au seuil de 95%. p appartient à 95% des intervalles de ce type. Exercice :Un candidat commande 2 sondages pour connaitre les intentions de vote des electeurs. Le 1er sondage donne 54% su 250 personnes interrogées. Le 2eme sondage donne 53 % sur 1900 personnes interrogées. Quelle interpretation peut il faire sur le jour de l election?......... 6