SÉRIES STATISTIQUES A UNE VARIABLE PARAMÈTRES DE POSITION ET DE DISPERSION Eemple Le responsable d une maison de retraite a réalisé une enquête concernant les résidents de son établissement : - L activité préférée parmi celle proposées les après midi - L âge des résidents - La fréquentation à ces activités au cours d une semaine Les résultats de cette enquête sont présentés dans les tableau suivants : Type d activité Travau manuels 16 Loto 8 Wii 40 Jeu de cartes 1 Âge [75 ; 85[ 4 [85 ; 90[ 30 [90 ; 95[ 4 [95 ; 105[ 18 Fréquentation au activités 0 6 1 18 4 3 30 4 1 5 6 Séries statistiques à une variable : Paramètres de position et de dispersion 1
Activité n 1 : Le mode Le mode d'une série statistique est la valeur du caractère correspondant au plus grand effectif. Dans le cas où les valeurs du caractère sont regroupées en classes, on parle de classe modale. si les observations sont regroupées en classes de même amplitude, la classe modale est la classe correspondant au plus grand effectif. si les classes n'ont pas la même amplitude, la classe modale correspond à l'effectif le plus élevé par classe d'amplitude unitaire. - Dans l eemple sur le type d activité choisi par les résidents, le mode est : - Dans l eemple sur l âge des résidents, la classe modale est : - Dans l eemple sur la fréquentation au activités, le mode est : Activité n : La médiane La médiane est un paramètre de position. La médiane d'une série statistique est la valeur du caractère telle qu'il y est dans cette série autant de valeurs plus grandes que de valeurs plus petites. Caractère quantitatif discret : o Lorsque le nombre de valeurs est impair, la médiane est la valeur du caractère correspondant au rang n+1 (n étant le nombre de valeurs). o Lorsque le nombre de valeurs est pair, la médiane peut-être toute valeur du caractère compris entre la valeur de rang n et n + 1 (n étant le nombre de valeurs). Caractère quantitatif continu (valeurs du caractère regroupées en classe): Recherche graphique de la médiane : en traçant les polygones des effectifs cumulés croissants et décroissants, on obtient un point d'intersection dont l'abscisse est la médiane. L'ordonnée de ce point correspond à la moitié de l'effectif total. Le tracé d'une seule courbe peut donc suffire. De la même façon, il est possible de déterminer graphiquement la médiane à l aide des polygones des fréquences cumulées croissantes et(ou) décroissantes. Séries statistiques à une variable : Paramètres de position et de dispersion
- Dans l eemple sur la fréquentation au activités : 1 ;1 ;1 ; ;1 ; ; ; ; ;3 ;3 ; ;3 ;4 ;4 ; ;4 ;5 ;5 ; ;5 ;6 ;6 ; ;6 n 1 n 6 n 7 n 4 n 5 n 48 n 49 n 78 n 79 n 90 n 91 n 96 Le nombre de valeurs étant impair (96), la médiane peut être toute valeur comprise entre la valeur de rang 48 et la valeur de rang 49. Par habitude, on prendra la valeur moyenne, la médiane est donc - Dans l eemple sur l âge des résidents Effectifs 100 95 90 85 80 75 70 65 60 Coordonnées du point M du polygone dont l ordonnée est 96 = 48 : M( ; 48) La médiane de cette série statistique est donc 55 50 45 40 35 30 5 0 15 10 5 0 75 80 85 90 95 100 105 110 Somme ( ) Séries statistiques à une variable : Paramètres de position et de dispersion 3
Activité n 3 : La moyenne La moyenne est un paramètre de position. La moyenne d'une série de valeurs est le rapport de la somme de ces valeurs sur le nombre de valeurs. On la note. n n... n 1 1 p p N 1 ; ; sont les valeurs du caractère si le caractère est quantitatif discret et les centres des classes si le caractère est quantitatif continu. n 1 ; n ; les effectifs correspondants Remarque : calcul du centre d une classe classe [a ; b [ centre de classe : a + b - Dans l eemple sur la fréquentation au activités : Fréquentation au activités i 0 6 1 18 4 3 30 4 1 5 6 i La moyenne en jours de la fréquentation au activité est : - Dans l eemple sur l âge des résidents : Âge [75 ; 85[ 4 [85 ; 90[ 30 [90 ; 95[ 4 [95 ; 105[ 18 Centres des classes i i L âge moyen des résidents est : Séries statistiques à une variable : Paramètres de position et de dispersion 4
Activité n 3 : La variance et l écart-type L écart-type est un paramètre de dispersion. Il caractérise l étalement des valeurs du caractère autour de la moyenne. Pour calculer l écart-type, on calcule d abord la variance V n ( - ) n ( - )... n ( - ) 1 1 p p V N puis l écart-type : V Plus l écart-type est élevé, plus les valeurs sont dispersées autour de la moyenne. Plus l écart-type est petit, plus les valeurs sont regroupées autour de la moyenne. - Dans l eemple sur la fréquentation au activités : = Fréquentation au activités i 0 6 1 18 4 3 30 4 1 5 6 ( i - )² La variance est : L écart-type est : - Dans l eemple sur l âge des résidents : = Âge [75 ; 85[ 4 [85 ; 90[ 30 [90 ; 95[ 4 [95 ; 105[ 18 Centres des classes i ( i - )² La variance est : L écart-type est : Séries statistiques à une variable : Paramètres de position et de dispersion 5
Loi normale : Une série statistique suit une loi normale lorsque : 68% de la population est dans l intervalle [ - ; + ] 95% de la population est dans l intervalle [ - ; + ] 99,7% de la population est dans l intervalle [ - ; + ] Déterminons si cette série statistique concernant l âge des résidents suit une loi normale. Effectifs 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 5 0 15 10 5 0 75 80 85 90 95 100 105 110 Somme ( ) Séries statistiques à une variable : Paramètres de position et de dispersion 6