nde CHAPITRE 6 : STATISTIQUES www.coursapprendre.fr La statistique est la science qui consiste à collecter des données chiffrées, à les analyser, à les commenter et à les critiquer. I Vocabulaire Population : Une population est un ensemble de personnes ou d objets, appelés individus, définis par une propriété commune appelée caractère. Exemple de population : les habitants d un pays, classe de seconde, les automobiles fabriquées en 0. Caractères qualitatifs : Ce sont les caractères dont les valeurs ne sont pas des nombres. Exemple : profession, couleur des yeux. Caractères quantitatifs : Ce sont les caractères qui prennent des valeurs numériques. Exemple : l âge, la taille, le nombre de sœurs Si les valeurs du caractère sont regroupées en intervalles, appelés Classes (ex : Taille [70;7[ ), on dit que le caractère est continu. Si les valeurs du caractère sont isolées (notes, âge, ), on dit que le caractère est discret. Une étude statistique s effectue sur un ensemble appelé Population, dont les éléments sont appelés Individus, et consiste à collecter et étudier un même aspect sur chaque individu, appelé Caractère. Définition Une série statistique quantitative brute est constituée de la liste de toutes les valeurs x, x,, x p. Le nombre de valeurs, ou effectifs de la série est N. Exemple Voici le relevé du nombre de pulsations cardiaques par minute de élèves d une classe de seconde. Les résultants sont les suivants (Série A) : 7 6 67 6 6 6 7 6 60 6 6 6 6 66 6 60 6 6 8 6 6. Ce relevé du nombre de pulsations cardiaques est une série statistique quantitative brute. Définition Une série est dépouillée quand on connaît la liste des valeurs prises x, x,, x p et l effectif de chacune d elles n, n,..n p. L effectif de la série est N = n + n +.. + n p Exemple La série A dépouillée donne : 7 8 60 6 6 6 6 66 67 6 6
nde CHAPITRE 6 : STATISTIQUES www.coursapprendre.fr Définition Une série peut être aussi définie par la distribution de fréquence. La fréquence d une valeur est le quotient de l effectif de cette valeur par l effectif total de la population Les fréquences sont des nombres compris entre 0 et, souvent exprimées en pourcentage. Fréquence d une valeur = effectif de la valeur x effectif total 00 si on veut obtenir des pourcentages Exemple La distribution de fréquence de la série A donne : Fréquence 7 8 60 6 6 6 6 66 67 6 6 6 6 6 6 6 On peut aussi faire un regroupement par classe d amplitude (largeur de l intervalle). Dans ce cas l étude est moins précise, mais permet d avoir une vision plus globale. Exemple Le regroupement de la série A en classe d amplitude pulsations cardiaques par minutes donne : Fréquence [ ; 6[ [6 ; 60[ [60 ; 6[ [6 ; 68[ 7 6 8 II I Caractéristiques de position La vue d'un tableau ne permet pas forcément de connaître suffisamment des données pour pouvoir en analyser les répartitions, d'autant que la consultation de tableaux peut s'avérer très longue. On cherche alors à résumer celle-ci par une caractéristique de tendance centrale, c'est à dire par un seul nombre destiné à caractériser l'ensemble d'une façon objective et impersonnelle. II. Moyenne Définition Soit x, x,, xp une série statistique quantitative de p valeurs d effectifs respectifs n, n,.., np. La moyenne pondérée de la série, notée x est donnée par : x = n x + n x + n x +... + n x n + n + n +... + n p p p
nde CHAPITRE 6 : STATISTIQUES www.coursapprendre.fr Remarque Pour une série statistique dont les valeurs sont regroupées en classe, la moyenne est calculée en prenant les a + b valeurs du centre de chaque classe. Le centre de classe de [a ; b[ est donnée par. Exemple Dans la série A, la moyenne du nombre de pulsations cardiaques par minute est : x = x + x + x + x7 + x8 +...x67 6 = 60 Dans le cas où la série A est regroupée en classe d amplitude pulsations cardiaques par minutes, la moyenne est : [ ; 6[ [6 ; 60[ [60 ; 6[ [6 ; 68[ Centre de classe 8 6 66 x + x8 + x6 + x66 x = Remarque = 60 Pour une série prenant les valeurs x, x,, x p avec des fréquences respectives f, f,..f p, la moyenne est donnée par la formule suivante : x = f x + f x +... + f p x p II. Médiane Définition La médiane notée Me d'une série statistique est la valeur du caractère qui partage l effectif total en deux parties égales, c est à dire telle 0% au moins des valeurs de la série soient inférieures ou égales à Me et telle que 0% au moins des valeurs de la série soient supérieures ou égales à Me. Pour déterminer la médiane, on range la série de N valeurs par ordre croissant des valeurs : Si l effectif N est impair, la médiane est la valeur de la série de rang N + Si l effectif N est pair, on prend comme médiane la moyenne des valeurs de rang N et N + Exemple 6 On range les valeurs de la série A dans l ordre croissant. N est pair. La médiane est la moyenne de la 6 e valeur (60) et la 7 e valeur 6, soit Me = 60. La médiane de la série «7 0 0» est (valeur de rang )
nde CHAPITRE 6 : STATISTIQUES www.coursapprendre.fr II. Quartiles Définition 6 Les quartiles sont les valeurs du caractère qui partagent l'effectif total en parties égales. Le premier quartile Q est la plus petite valeur du caractère pour laquelle % des valeurs de la série statistique lui sont inférieures ou égales. Q est donné par le rang N. Le troisième quartile Q est la plus petite valeur du caractère pour laquelle 7 % des valeurs de la série statistique lui sont inférieures ou égales. Q est donnée par le rang N. Le deuxième quartile Q correspondant à la médiane. Exemple 7 Pour la série A, A N =, donc : Le rang de Q est, soit 8 : Q est la 8 e valeur, soit 8. Le rang de Q est X, soit : Q est la e valeur, soit 6. III Caractéristiques de dispersion Deux séries de données peuvent avoir des moyennes et médianes très proches, tout en étant constituées des données très différentes. Pour les comparer, on calcule deux caractéristiques de dispersion : Définition 7 L intervalle interquartile est [Q ; Q]. Il contient au moins 0% des valeurs de la série. Son amplitude, Q Q, est appelée écart interquartile. Définition 8 L étendue : c est la différence entre la valeur la plus haute et la valeur la plus basse de la série. Exemple 8 Pour la série A, A l intervalle interquartile est [8 ; 6], soit un écart interquartile de 6 8 =. L étendue est de.
nde CHAPITRE 6 : STATISTIQUES www.coursapprendre.fr IV s et fréquences cumulés Définition Dans le cas d'un caractère quantitatif, on peut ordonner les différentes valeurs de la série dans l'ordre croissant. L effectif cumulé croissant d une valeur x i est la somme des effectifs de toutes les valeurs du caractère inférieures ou égales à xi La fréquence cumulée croissante d une valeur x i est le quotient de l effectif cumulé croissant de cette valeur par l effectif total. Exemple Le tableau des effectifs cumulés croissants et décroissants de la série A donne : 7 8 60 6 6 6 6 66 67 Total 6 6 s Cumulés Croissants s Cumulés Décroissants + = - = + = - = + = 7 - = 7 7+ = 8 7- = 8+6 = - = + = 6-6 = 8 6+ = 8- = 6 + = 6- = +6 = 8 - = 0 8+ = 0 0-6 = 0+ = - = + = - = Exemple 0 Dans le cas où la série A est regroupée en classe d amplitude pulsations cardiaques par minutes, on obtient : Fréquence Fréquences Cumulées Croissantes Fréquences Cumulées Décroissantes [ ; 6[ [6 ; 60[ [60 ; 6[ [6 ; 68[ 7 6 7 7 6 6 6 8 6 V Représentation graphique d une série statistique On peut visualiser la série statistique par le biais d autres moyens, notamment à l'aide de représentations graphiques. Selon la nature de la série statistique, on peut avoir recours à différents types de représentation graphique. V. Séries statistiques à caractère quantitatifs On utilise principalement deux types de représentations : Pour les caractères discrets, on peut utiliser les diagrammes "en bâtons" Pour les caractères continus, regroupés en intervalles, on peut utiliser un "histogramme".
nde CHAPITRE 6 : STATISTIQUES www.coursapprendre.fr Dans les deux types de représentation graphique, le caractère est porté en abscisses et l'effectif ou la fréquence sont portés en ordonnée. Exemple L histogramme de la série A est regroupée en classe d amplitude pulsations cardiaques par minutes est : y 6 7 8 60 6 6 6 6 6 66 67 68 6 x Med Remarque Lorsque les classes ne sont pas réguliers (pas la même amplitude), on définit une unité d aire. Courbe des fréquences cumulées On peut réaliser la courbe des effectifs cumulés croissants et/ou décroissants (appelée polygone) dans le cas d une série à caractère quantitatif. Exemple : Série S A : y 0 E.C.D E.C.C 0 0 0 6 7 8 60 6 6 6 6 6 66 67 68 6x D Q Med Q D V. Séries statistiques à caractère qualitatifs On utilise souvent les des diagrammes à secteurs : Diagrammes circulaires ou semi-circulaires (Voir exercices).