SÉRIES STATISTIQUES A UE VARIABLE Pourquoi étudier la statistique? La statistique a pour objet de recueillir des données, de les organiser et les présenter de façon à pouvoir les analyser et en tirer des enseignements permettant de gérer ou de prévoir. Exemple Un proviseur de lycée fait réaliser une enquête concernant les entreprises d accueil des élèves stagiaires. L enquête porte sur les trois points suivants : - le type d entreprise ayant accueilli des stagiaires - la distance de l entreprise au lycée - nombre de stagiaires accueillis dans l année par l entreprise Les résultats de cette enquête sont présentés dans les tableaux suivants : Type d entreprise ombre Entreprise commerciale 47 Entreprise industrielle 4 Entreprise bancaire 1 Administration 7 Distance en km ombre [0 ; 5[ 8 [5 ; 10[ 0 [10 ; 15[ 30 [15 ; 0[ 17 [0 ; 5[ 10 [5 ; 50[ 5 ombre de ombre stagiaires 1 5 3 1 4 4 Séries statistiques à une variable 1
Activité n 1 : Vocabulaire et tableaux Population et unité statistique La population est l ensemble des unités statistiques sur lequel vont porter les observations - Dans l exemple, la population étudiée est Echantillon L échantillon est une partie (ou sous-ensemble) de la population. Caractère Le caractère statistique est une propriété étudiée de la population. Le caractère est : qualitatif, s il n est pas représenté par un nombre quantitatif, si on peut lui attribuer une valeur numérique Le caractère quantitatif est : discret, s il ne prend que certaines valeurs ; continu, s il peut prendre toutes les valeurs dans un intervalle donné. Cet intervalle est alors partagé en classes. - Dans l exemple, le type d entreprise est un caractère Le nombre de stagiaires par entreprise est un caractère La distance de l entreprise au lycée est un caractère Classe Une classe est un sous-ensemble de la population correspondant à une même valeur ou valeurs voisines prises par le caractère. L amplitude d une classe [a ; b[ est la différence b a. Le centre de la classe [a ; b[ noté x est a + b. Séries statistiques à une variable
- Dans l exemple, la distance en kilomètres varie de 0 à 50 km, elle est répartie en six classes : [0 ; 5[, [5 ; 10[, [10 ; 15[, [15 ; 0[, [0 ; 5[, [5 ; 50[. L amplitude de la classe [0 ; 5[, est L amplitude de la classe [5 ; 50[ est Le centre de la classe [5 ; 10[ est Effectif, fréquence L effectif d une classe ou d une valeur est le nombre d éléments qui correspondent à cette classe ou valeur, il est noté n. i Le total des effectifs est : = n 1 + n + n 3 + + n p = n i La fréquence en valeur relative est f i = n i La fréquence en pourcentage est f i = n i x 100 - Dans l exemple, est l effectif de la classe [0 ; 5[ et est l effectif total. est la fréquence de la classe [0 ; 5[. est la fréquence en pourcentage de la classe [0 ; 5[. Effectif et fréquence cumulés L effectif cumulé croissant (la fréquence cumulée croissante) de la valeur de rang i est la somme de tous les effectifs (de toutes les fréquences) jusqu au rang i compris. L effectif cumulé décroissant (la fréquence cumulée décroissante) de la valeur de rang i est la somme de tous les effectifs (de toutes les fréquences) à partir de la dernière valeur jusqu au rang i compris. - Dans l exemple, considérons l étude du nombre de stagiaire par entreprise. Compléter le tableau suivant : ombre de stagiaires Effectifs n i Effectifs cumulés croissants ECC Effectifs cumulés décroissants ECD Fréquences (%) Fréquences cumulées croissantes FCC Fréquences cumulées croissantes FCD 1 5 3 1 4 4 Séries statistiques à une variable 3
Activité n : Représentations graphiques Un graphique permet de visualiser rapidement un certain nombre d informations et d avoir une vue plus globale du phénomène étudié. Graphiques des effectifs et fréquences Diagramme circulaire Le diagramme circulaire est souvent utilisé pour les séries à caractère qualitatif. L angle au centre du secteur angulaire est proportionnel à l effectif (ou la fréquence). - Dans l exemple, considérons le type d entreprise accueillant des stagiaires. Compléter le tableau suivant : Types Effectifs n i Angle au centre Entreprise commerciale 47 Entreprise industrielle 4 Entreprise bancaire 1 Administration 7 Total Entreprise commerciale Administration Entreprise industrielle Entreprise bancaire Diagramme en bâtons La représentation graphique des effectifs ou fréquences d une variable discrètes peut se construire sous forme d un diagramme en bâtons. La longueur des bâtons est proportionnelle à l effectif (ou la fréquence). Séries statistiques à une variable 4
- Dans l exemple, considérons l étude du nombre de stagiaire par entreprise. ombre de Effectifs n i stagiaires 1 5 3 1 4 4 ombre 60 50 40 30 0 10 0 0 1 3 4 5 6 ombre de stagiaires Histogramme La représentation graphique des séries à variable continue peut s effectuer sous forme d histogramme. Un histogramme des effectifs (ou fréquences) est constitué de rectangles ayant pour base l amplitude de classes et dont les aires sont proportionnelles aux effectifs (ou fréquences). Distance en km ombre [0 ; 5[ 8 [5 ; 10[ 0 [10 ; 15[ 30 [15 ; 0[ 17 [0 ; 5[ 10 [5 ; 50[ 5 L amplitude d une classe unitaire est 5. L amplitude de la classe [5 ; 50[ est 5 soit 5 fois l amplitude d une classe unitaire. L effectif de cette classe doit être distribué de façon égale sur ces ombre 35 30 5 0 15 10 5 0 0 5 10 15 0 5 30 35 40 45 50 Distance en km 5 classes : 5 5 = 1 Séries statistiques à une variable 5
Polygone des effectifs cumulés ou des fréquences cumulées Le polygone des effectifs cumulés croissants ou de fréquences cumulées croissantes est formé des segments de droite joignant les points : - d abscisses : la borne supérieure d une classe. - d ordonnée : l effectif cumulé d une classe. Le 1 er point est placé sur l axe des abscisses et a pour abscisse la borne inférieure de la classe. Le polygone des effectifs cumulés décroissants ou de fréquences cumulées décroissantes est formé des segments de droite joignant les points : - d abscisses : la borne inférieure d une classe. - d ordonnée : l effectif cumulé d une classe. Le dernier point est placé sur l axe des abscisses et a pour abscisse la borne supérieure de la classe. ombre de stagiaires [0 ; 5[ 8 [5 ; 10[ 0 [10 ; 15[ 30 [15 ; 0[ 17 [0 ; 5[ 10 [5 ; 50[ 5 Effectifs n i ECC ECD Fréquences (%) FCC FCD ombre 100 90 80 70 60 50 40 30 0 10 Distance en km 0 0 5 10 15 0 5 30 35 40 45 50 55 Séries statistiques à une variable 6
Activité n 3 : Paramètres de position Mode, classe modale Le mode est la valeur du caractère qui correspond à l effectif ou à la fréquence maximale. Dans le cas de séries à variable continue, on parle de classe modale (les classes ayant la même amplitude). Le mode de cette série est car cette valeur correspond au plus effectif. La classe modale est car elle correspond au plus grand effectif. Moyenne arithmétique Si x 1, x, x p sont les valeurs du caractères étudié et n 1, n, n p les effectifs correspondants, la moyenne de la série statistique est : x = n 1 x 1 + n x + + n p x p ou x = n i x i ou x = f i x i Remarque : si la série statistique est continue, x i représente le centre de la classe. Distance en km ombre n i [0 ; 5[ 8 [5 ; 10[ 0 [10 ; 15[ 30 [15 ; 0[ 17 [0 ; 5[ 10 [5 ; 50[ 5 Centre des classes x i Produit n i x i La distance moyenne de l entreprise au lycée est : Séries statistiques à une variable 7
Médiane La médiane est la valeur du caractère qui partage l effectif total en deux parties de même effectif. a- Dans le cas d un caractère discret si l effectif total est impair, la médiane est la valeur du caractère situé au milieu de la série. si l effectif total est pair, la médiane est la demi somme des deux valeurs centrales du caractère. b- Dans le cas d un caractère continue La médiane peut-être recherchée : par la lecture, sur le polygone des effectifs cumulés, de l abscisse du point ayant pour ordonnée. par calcul (voir exemple) ombre 100 lecture graphique 90 80 70 60 50 40 30 0 10 Distance en km 0 0 5 10 15 0 5 30 35 40 45 50 55 La médiane est Me = Séries statistiques à une variable 8
calcul 1- On cherche la classe dans laquelle se trouve la médiane. - On cherche le coefficient directeur de la droite (AB). 3- On cherche la médiane en utilisant le point M Effectif total : = 90 = 45 Classe médiane [10 ; 15[ B A partir des points A et B M a = A partir des points A et M A Calcul de la médiane La médiane est Séries statistiques à une variable 9
Activité n 4 : Paramètres de dispersion L étendue L étendue de la série est la différence entre la plus grande valeur observée de la variable et la plus petite. - Dans l exemple, considérons l étude du nombre de stagiaire par entreprise. L étendue de cette série est L étendue de cette série est L écart type L écart type mesure la dispersion d'une série de valeurs autour de leur moyenne. Une faible valeur de l écart type traduit une forte concentration des données autour de la moyenne. On appelle variance d une série statistique le nombre : Σn i (xi x) V ou V Σni xi x ou i i V Σf x x On appelle écart type d une série statistique la racine carrée de sa variance : σ V Distance en km ombre n i [0 ; 5[ 8 [5 ; 10[ 0 [10 ; 15[ 30 [15 ; 0[ 17 [0 ; 5[ 10 [5 ; 50[ 5 Centre des classes x i x i -x (x i -x )² n i (x i -x )² V = σ V = Séries statistiques à une variable 10
Séries dites «normales» On a souvent des séries statistiques dont la distribution suit une courbe en cloche (courbe de Gauss). On dit qu une telle série suit une loi normale. Pour de telles séries, on peut montrer que : x σ; x σ - environ 68% des valeurs appartiennent à l intervalle - environ 95% des valeurs appartiennent à l intervalle x σ; x σ - environ 99% des valeurs appartiennent à l intervalle x 3σ; x 3σ Séries statistiques à une variable 11