DESCRIPTION NUMERIQUE D UNE VARIABLE Les caractéristiques de position. Tous droits réservés au réseau AGRIMEDIA Statistique : dossier N 3 Février 1996 1
CDR AGRIMEDIA DESCRIPTION NUMERIQUE D UNE VARIABLE Apprentissage et Evaluation Objectifs : - Calculer un mode, une médiane ou une moyenne. Contenu : - Explications concernant le calcul de ces caractéristiques - Exercices d application avec correction - Exercices de synthèse des dossiers 1 à 3. Pré-requis : - Connaître le langage statistique (dossier 1) - Savoir organiser des données brutes sous forme de tableau (dossier 1) - Etre capable de représenter graphiquement une série de données statistiques (dossier 2) Public concerné : - Toute personne désirant maîtriser le calcul des caractéristiques numériques d une série statistique. 2
Introduction. Les études statistiques nous entourent quotidiennement, que ce soit à la télévision, à la radio ou dans les journaux. L exemple le plus fréquent est donné par les sondages : - sondage sur l utilisation d une lessive, - sondage pour la cote de popularité d un homme politique, - sondage pour l audimat d une émission de télévision, - sondage sur l efficacité d un désherbant ou d un désinfectant, etc... Ces sondages sont réalisés à partir d enquêtes qui fournissent un grand nombre de données statistiques. Ces données sont triées puis classées et présentées sous forme de tableaux statistiques. Mais, pour exploiter au mieux ces tableaux, il peut être intéressant de faire ressortir une valeur qui permettra de préciser l information recherchée. On appelle cette valeur une CARACTERISTIQUE de la distribution. Il existe trois caractéristiques différentes suivant l information recherchée : * la valeur qui a l effectif le plus grand appelée MODE Ex. : le désherbant le plus efficace ou l homme politique qui a la cote de popularité la plus élevée. * la valeur moyenne de la variable : appelée MOYENNE. Ex. : moyenne des notes scolaires d un élève sur plusieurs devoirs ou plusieurs matières. * la valeur de la variable qui sépare la série en deux parties d effectifs égaux : appelée MEDIANE. Ex. : la valeur du salaire qui permet de séparer l ensemble des employés d une entreprise en deux groupes de même effectif. Ces trois valeurs sont appelées CARACTERISTIQUES DE POSITION. Nous allons les étudier en détail grâce aux exemples suivants. I - LE MODE ET LA CLASSE MODALE 3
Définition Reprenons l exemple de la fabrication de camemberts développé dans le dossier I. Supposons que l industriel se pose la question suivante : «Quel est le poids de fromage que l on retrouve le plus souvent?». Pour répondre à cela, reprenons le tableau statistique : Poids des camemberts Classes camemberts Effectifs [260 ; 270[ 1 [270 ; 280[ 1 [280 ; 290[ 4 [290 ; 300[ 3 [300 ; 310[ 8 [310 ; 320[ 12 [320 ; 330[ 7 [330 ; 340[ 4 Total : 40 On remarque que la classe [310 ; 320[ possède un effectif de 12. C est le plus grand effectif du tableau. Il signifie que 12 fromages ont un poids compris entre 310 et 320 grammes. La classe qui correspond à cette valeur maximale de l effectif est appelée : CLASSE MODALE. ici : CLASSE MODALE = [310 ; 320[ On peut aussi appeler MODE la valeur centrale de cette classe, ici : MODE = 315 g. A RETENIR ON APPELLE MODE (Noté : MO) LA VALEUR DE LA VARIABLE QUI POSSEDE L EFFECTIF MAXIMAL OU CLASSE MODALE LA CLASSE QUI CORRESPOND A CET EFFECTIF. 4
Exercices Exercice 1 : On a relevé le nombre de garçons dans des familles de 6 enfants et on a regroupé les valeurs dans le tableau ci-dessous : Variable Effectif garçons : x i familles : n i 0 1 2 3 4 5 6 1 3 4 8 3 1 0 Donner le mode de cette série. Exercice 2 : Dans une sapinière, on a mesuré tous les arbres présents et on a établi le tableau suivant : Hauteur des sapins (en m) sapins [0;1[ [1;2[ [2;3[ [3;4[ [4;5[ [5;6[ [6;7[ [7;8[ [8;9[ [9;10[ 1 3 12 24 50 85 35 20 8 2 Donner la classe modale et le mode de cette série. Exercice 3 : Soient les extraits d articles de journaux suivants, donner le(s) mode(s) pour chaque série. Voir réponses page 8 5
1) Situation démographique par région 1990 (en milliers) Alsace 1 623 Aquitaine 2 796 Auvergne 1 322 Basse Normandie 1 391 Bourgogne 1 609 Bretagne 2 796 Centre 2 370 Champagne-Ardenne 1 347 Corse 250 Franche-Comté 1 096 Haute Normandie 1 736 Ile de France 10 645 Languedoc-Roussillon 2 115 Limousin 723 Lorraine 2 304 Midi-Pyrénées 2.431 Nord-Pas de Calais 3 962 Pays de Loire 3 055 Picardie 1 809 Poitou-Charentes 1 595 Provence-Alpes-Côte d Azur 4 257 Rhône-Alpes 5 346 Donner le mode Extrait de Nord Eclair 29/XI/1994 2) L endettement par zone en 1992 En % de la dette totale En milliards de dollars Amérique latine et Caraïbes... 30 496,33 Europe et Asie Centrale... 20 329,06 Extrême-Orient et Pacifique... 19 320,19 Afrique Subsaharienne... 12 194,26 Moyen-Orient et Afrique du Nord... 11 188,98 Asie du Sud... 8 133,35 Total PVD... 100 1 622,17 Donner le mode On pourra remarquer qu on retrouve dans ce tableau à la fois l effectif (dette en milliards) et la fréquence (pourcentage de la dette totale). Source : Banque mondiale, World Debt Tables 1993-1994 Extrait du Monde : Dossiers et documents n 224 - Sept. 94 6
3) Accroissement annuel de la population (en pourcentage de 1962 à 1990) 1962-1968 1968-1975 1975-1982 1982-1990 Alsace 1,16 1,03 0,45 0,44 Aquitaine 1,04 0,52 0,58 0,63 Auvergne 0,50 0,20 0,02-0,14 Basse-Normandie 0,71 0,52 0,48 0,36 Bourgogne 0,72 0,64 0,23 0,10 Bretagne 0,49 0,72 0,60 0,39 Centre 1,15 1,13 0,72 0,57 Champagne-Ardenne 0,99 0,63 0,10 0,00 Franche-Comté 1,12 0,95 0,32 0,15 Haute Normandie 1,16 0,92 0,52 0,60 Ile de France 1,48 0,95 0,28 0,70 Languedoc-Roussillon 1,57 0,69 1,05 1,14 Limousin 0,05 0,05-0,03-0,23 Lorraine 0,60 0,35-0,07-0,09 Midi-Pyrénées 0,98 0,54 0,35 0,54 Nord-Pas de Calais 0,70 0,36 0,07 0,09 Pays de Loire 0,80 0,99 0,82 0,53 Picardie 1,07 0,89 0,51 0,49 Poitou-Charentes 0,34 0,45 0,37 0,21 Provence-Alpes-Côte d Azur 2,67 1,58 1,08 0,90 Rhône-Alpes 1,62 1,12 0,69 0,79 Donner les 4 modes correspondants aux 4 colonnes (1 par colonne = 1 par tranche d évolution). Extrait du Monde : Dossiers et documents n 226 - Novembre 1994. 7
Corrections Démarche conseillée : 1ère étape : repérer l effectif le plus grand 2ème étape : repérer la valeur de la variable associée à cet effectif. Exercice 1 Effectif maximal : 8 d où le MODE vaut 3, Mo = 3 Le mode est donc de 3 garçons par famille de 6 enfants. Exercice 2 : Effectif maximal : 85 d où la CLASSE MODALE est : [5;6[ d où Mo = 5,5 Les sapins dont la hauteur est comprise entre 5 et 6 m sont les plus nombreux dans la sapinière. Exercice 3 : a) le mode est l Ile de France. C est la plus peuplée des régions. b) le mode est Amérique latine et Caraïbes. C étaient les pays les plus endettés en 1992. c) entre 1962 et 1968 : le mode est Provence - Alpes - Côte d Azur entre 1968 et 1975 : le mode est Provence - Alpes - Côte d Azur entre 1975 et 1982 : le mode est Provence - Alpes - Côte d Azur entre 1982 et 1990 : le mode est Languedoc - Roussillon Les modes représentent pour chaque période la région dont l accroissement de la population a été le plus fort. 8
Remarque : On peut facilement trouver le MODE ou la CLASSE MODALE d une série en regardant la représentation graphique. En effet, le plus grand effectif correspondant sur le graphique à la plus GRANDE TAILLE du bâton ou au plus HAUT rectangle de l histogramme. Traçons les graphiques des exercices 1 et 2 familles 8 7 (( )) 6 5 4 3 2 1 0 0 1 2 3 4 5 6 mode Ex. 1 : Diagramme en bâtons Le MODE est : 3 garçons par famille Nombre de garçons par famille sapins 90 80 70 60 50 40 30 20 10 0 0 1 2 3 4 5 6 7 8 9 10 Hauteur des sapins (en m) Ex. 2 : Histogramme II - La MEDIANE (notée Me) La CLASSE MODALE est [5;6[ 9
1) Cas des variables continues (regroupées par classes). Une autre question que peut se poser l industriel est de savoir en dessous de quelle valeur on trouve la moitié de l effectif, ce qui lui permettra de séparer sa production en deux parties égales. Pour cela on dispose de 2 méthodes : * à partir du tableau statistique en calculant les Effectifs Cumulés Croissants (E.C.C.), ou les Effectifs Cumulés Décroissants (E.C.D.). * à partir du graphique correspondant. a) Tableau statistique Reprenons le tableau créé dans le dossier 1 Poids des camemberts Classes camemberts Effectifs E.C.C. [260;270[ 1 1 (= 1) [270;280[ 1 2 (= 1 + 1) [280;290[ 4 6 (= 1 + 1 + 4) [290;300[ 3 9 (= 1 + 1 + 4 + 3) [300;310[ 8 17 [310;320[ 12 29 [320;330[ 7 36 [330;340[ 4 40 Effectif total N = 40 L effectif total est N = 40 fromages. La moitié est donc égale à : N 40 = = 20 fromages. 2 2 On va regarder quelle classe contient le 20 ème fromage. Pour cela on regarde dans la colonne des E.C.C. le premier nombre supérieur à 20. Ici, il s agit de 29, la classe correspondante est [310;320[ ; on dira que cette classe est la CLASSE MEDIANE car le 20 ème fromage est dans cette classe. Cette méthode est rapide mais imprécise car on ne détermine pas une valeur précise mais la classe qui contient le 20 ème fromage. Il existe une méthode plus précise : avec le graphique des Effectifs Cumulés Croissants. (E.C.C.) b) Graphique des Effectifs Cumulés Croissants : E.C.C. 10
Reprenons le graphique établi dans le dossier 2 (les courbes cumulatives) p23. 40 2 = 40 35 30 25 20 15 10 5 0 E.C.C. Me 260 270 280 290 300 310 320 330 340 350 360 poids des fromages ( en g) On regarde le poids correspondant au 20 ème fromage. On le retrouve bien dans la classe médiane [310;320[ mais le tracé de la courbe permet d indiquer une valeur plus précise : ici 312 La médiane est donc : 312 g Il y a 20 fromages dont le poids est inférieur à 312 g et 20 fromages dont le poids est supérieur à 312 g. c) Graphique des E.C.C. et E.C. D. Si l on complète le schéma ci-dessus avec les E.C.D., la MEDIANE est l intersection des 2 courbes. camemberts 40 2 = 20 40 35 30 25 20 15 10 5 Effectifs Cumulés 0 260 270 280 290 300 310 320 330 340 Me Comme précédemment, on trouve Me = 312 g. E.C.C E.C.D Poids des camemberts (en g) E.C. C E.C. D 260 0 40 270 1 39 280 2 38 290 6 34 300 9 31 310 17 23 320 29 11 330 36 4 340 40 0 A RETENIR ON APPELLE MEDIANE (NOTEE ME) LA VALEUR DE LA VARIABLE QUI SEPARE LA SERIE EN DEUX PARTIES D EFFECTIFS EGAUX. 11
LA CLASSE QUI CONTIENT LA MEDIANE EST APPELEE CLASSE MEDIANE. 2) Cas des variables discontinues. Prenons par exemple l ensemble des notes obtenues par un élève en mathématiques (notes sur 10) 8-7 - 7-4 - 9-9 - 10-6 - 9-5 soit 10 notes Classons les dans un tableau statistique avec E.C.C. Note : x i Effectif E.C.C. 4 1 1 5 1 2 6 1 3 7 2 5 8 1 6 9 3 9 10 1 10 La moitié de l effectif représente : 10 2 = 5 notes. Ici on voit que 7 est la 5 ème note dans la colonne des E.C.C. La médiane est donc : 7 Me = 7 Autre exemple à partir des 11 notes obtenues en français par l élève : 10-4 - 6-7 - 9-9 - 7-5 - 9-10 - 8 Si l on classe les notes dans un ordre croissant : Notes : 4 5 6 7 7 8 9 9 9 10 10 Rang 1 ère 2 ème 3 ème 4 ème 5 ème 6 ème 7 ème 8 ème 9 ème 10 ème 11 ème de la note 5 notes 5 notes Note centrale On s aperçoit que la 6 ème note sépare la série de notes en deux parties d effectifs égaux. Cette note est appelée la MEDIANE. Sa valeur est : Me = 8. Comme l effectif est impair le rang de cette MEDIANE est obtenu en effectuant : 11+ 1 = 6. Ici c est la 6 ème note qui est la MEDIANE. 2 A RETENIR 12
LA MEDIANE EST OBTENUE POUR LA VALEUR DE L E.C.C. OU DE L E.C.D. EGALE A N/2 SI N N + 1 EST PAIR ET SI N EST IMPAIR. 2 LA MEDIANE EST TOUJOURS SITUEE AU MILIEU DES VALEURS RANGEES EN ORDRE CROISSANT (OU DECROISSANT). Remarque : Si on avait classé les notes dans un ordre décroissant : Notes : 10 10 9 9 9 8 7 7 6 5 4 Note centrale On retrouve bien la valeur de la médiane égale à 8. 5 notes 5 notes 13