L enseignement des statistiques
Un Vendredi noir à la Bourse! 3860 3850 3840 3830 3820 3810 3800 3790 3780 3770 3760
L indice des valeurs est en repli de 2% 3900 3850 3800 3750 3700 3650 3600 3550 3500
Pour manger, un salarié sur dix a recours aux associations! Dans le journal Libération du 17-18 juin 2006, un titre page 14 : «Pour manger, un salarié sur dix a recours aux associations.» Il y a environ 24 millions de salariés en France, donc 2,4 millions auraient recours aux associations pour manger? Mais dans l article, on lit que parmi les personnes faisant appel aux banques alimentaires, une sur dix est salariée. C est bien différent!
«Aujourd hui, il n est pas exagéré de considérer la statistique en France comme une discipline émergeant difficilement». (Rapport de l Académie des Sciences, juillet 2000).
Les problématiques conduisant à des questions de nature statistique sont variées. La prise en compte de l aléatoire a gagné presque tous les domaines : le contrôle de qualité en milieu industriel, la prévision des petits et des grands risques, l élaboration de politiques de santé publique, les calculs financiers, etc Pour comprendre l actualité, une formation à la statistique est aujourd hui indispensable ; c est une formation qui développe les qualités d analyse et de synthèse et exerce le regard critique.
«La statistique enseignée dans le secondaire voudrait être de la statistique descriptive, mais consiste le plus souvent en une fastidieuse série d exercices de calculs de moyenne, d écart types et de tracés d histogrammes c est à peu près aussi intéressant que de lire un annuaire du téléphone sans aucune raison de le faire». (Claudine Robert 1996)
? Préféreriez vous travailler dans une entreprise où le salaire moyen est de 1 500 ou bien dans une entreprise où le salaire moyen est de 3 000?
Est il possible de faire de la plongée dans un lac dont la profondeur moyenne est 50 cm?
Un domaine d enseignement «jeune» Apparaît en 1965 en Première A, B et D et en 1970 en Première C. Apparaît en Seconde en 1981. Apparaît au Collège seulement en 1986. Une évolution en 1992: on demande de réaliser (au moins une fois) une étude statistique de A à Z. «Révolution» en 2000 : le programme de Seconde demande de consacrer 1/8 du temps à l enseignement des statistiques.
Des fonctions données à l enseignement des statistiques dans les programmes Une fonction sociale Une fonction institutionnelle, qui présente deux composantes : - une composante disciplinaire ; - une composante interdisciplinaire. Une fonction de formation générale
Une distinction Les statistiques : ce sont des dénombrements de sujets, d objets, d évènements dans des populations ou des sous populations. La statistique : c est un mode de pensée permettant de recueillir, de traiter et d interpréter les données qu on rencontre dans divers domaines.
Enseigner les statistiques et les probabilités? Que ce soit dans le domaine des statistiques ou dans celui des probabilités, notre enseignement français accuse un certain retard sur d autres pays, en particulier sur les pays anglo-saxons. Différentes raisons peuvent expliquer ce retard : impression que ce ne sont pas de «vraies mathématiques» manque de formation des enseignants manque de temps
Le traitement statistique Phénomène empirique : données brutes Statistiques données traitées Les statistiques vont transformer les données brutes en les représentant de façon «classée» pour pouvoir en faire des «résumés». Ces «résumés» vont pouvoir donner des interprétations du phénomène empirique. Problème fondamental de la statistique: concilier le mieux possible deux pôles antagonistes : la «fidélité» et la «clarté»
Dans les programmes
Les programmes de l école primaire Cycle 2 Organisation et gestion des données Lire ou compléter un tableau dans des situations concrètes simples Utiliser un tableau, un graphique. Organiser les informations d un énoncé
Cycle 3 Organisation et gestion des données Savoir organiser les données d un problème en vue de sa résolution. Construire et utiliser un tableau ou un graphique en vue d un traitement des données. Interpréter un tableau ou un graphique.
Problèmes pouvant être posés aux élèves en fin de cycle 3 Un graphique est donné. On doit : - soit commenter les données qui sont représentées; - soit élaborer ou compléter un tableau à partir du graphique. Un tableau de données est fourni. On doit: - soit commenter ces données; - soit élaborer ou compléter un graphique. Les données sont fournies dans un texte. On doit: - soit élaborer ou compléter un tableau; - soit élaborer ou compléter un graphique.
Un graphique est donné Cela peut être: -Un diagramme en barres ; -Un diagramme en bandes ; -Un diagramme circulaire ; -Un diagramme cartésien ; -.
CM2 On donne un diagramme en barres On extrait des informations à partir du graphique
Euromaths On donne un diagramme en bandes On extrait des informations à partir du graphique
CM1 On donne un diagramme cartésien. On extrait des informations à partir du graphique. On complète un tableau à partir des données lues sur le graphique.
CM2 On donne un diagramme circulaire. On extrait des informations à a partir du graphique.
Un tableau est donné On demande de construire ou de compléter un diagramme à partir d un tableau de valeurs numériques.
CE2 Construction d un diagramme en barres
CM1 On donne un tableau. On doit construire un diagramme en barres. Quelle notion doivent maîtriser les élèves pour mener à bien cette tâche?
CM1 O n donne un tableau. Il faut compléter un diagramme en barres.
Sixième Organisation et représentation des données Représentations usuelles : tableaux (tableaux en deux ou plusieurs colonnes, tableaux à double entrée) Représentations usuelles (lire, utiliser, interpréter): - diagrammes en bâtons - *diagrammes circulaires ou demi circulaires - graphiques cartésiens Utilisation de calculatrices et de logiciels
Cinquième Représentation et traitement des Effectifs *Fréquences données Classes : regroupement des données en classes d égale amplitude Tableaux de données, représentations graphiques de données (diagrammes divers, histogramme) Utilisation d un tableur
Tableau récapitulant l évolution des tonnages et des chiffres d affaire de la pêche dans le département des Côtes d Armor de 1991 à 1998.
Etude des tonnages par catégorie
Des questions qui se posent - Quel est le tonnage de poissons pêchés en 1998? - Quelle est la catégorie la plus pêchée en 1992, en 1998? - Quelles sont les différences les plus significatives entre les deux années?
Quelles sont les différences les plus significatives entre les deux années?
Résumé de la pêche par catégorie en 1986
Evolution du tonnage de la pêche à l araignée entre 1991 et 1998
ou bien.
Cinquième Représentation et traitement des données Effectifs *Fréquences Classes (de même amplitude) Tableau de données, représentations graphiques de données (diagrammes divers, histogrammes)
Attention aux histogrammes
Quatrième Traitement des données Moyennes pondérées Créer, modifier une feuille de calcul, insérer une formule. Créer un graphique à partir des données d une feuille de calcul. Usage du tableur et de la calculatrice
Troisième Statistique Caractéristiques de position Approche de caractéristiques de dispersion : - médiane ; - premier et troisième quartiles ; - étendue. Travail en liaison avec les autres disciplines Utilisation d un tableur
La médiane et les quartiles dans les manuels
Définitions actuelles Médiane. La série des données est ordonnée par ordre croissant. Si la série est de taille impaire (2n+1), la médiane est la valeur du terme de rang n+1. Si la série est de taille paire (2n), la médiane est la demi - somme des valeurs des termes de rang n et n+1. Quartiles. Le premier (respectivement le troisième) quartile est le plus petit élément Q1 (respectivement Q3) des valeurs des termes de la série ordonnée par ordre croissant, tel qu au moins 25%(respectivement 75%) de ces valeurs soient inférieures ou égales à Q1 (respectivement Q3).
Seconde Statistique descriptive, analyse de données Caractéristiques de position et de dispersion : - médiane, quartiles ; - moyenne. Utiliser un logiciel (tableur) ou une calculatrice pour étudier une série statistique. Effectifs cumulés, fréquences cumulées. Représentations graphiques: nuage de points, courbe des fréquences cumulées.
Comparaison de deux séries à l aide d un logiciel 2 500 2 000 1 500 1950 1 000 2007 500 0 Pays-Bas Allemagne France Italie Suède Royaume-Uni Espagne Japon États-Unis Durée annuelle du travail en heures
Des écueils de cet enseignement Exercice du serveur Wims (Seconde) Soit la série statistique suivante: Valeurs 6.5 7 8 2.5 10.5 2 1 0.5 9.5 4.5 3 4 6 0 10.5 9.5 Calculer pour cette série statistique: - la moyenne; - la valeur maximale; - la valeur minimale; - l étendue statistique
Une série d exercices issus d un manuel de BTS
Premières générales ES et L Statistique descriptive, analyse de données Caractéristiques de dispersion : variance, écart-type. Diagramme en boîte. S Statistique descriptive, analyse de données Caractéristiques de dispersion : variance, écart-type. Diagramme en boîte.
Un diagramme en boîte
Premières technologiques STG ST2S STI 2D - STL Séries de données Histogrammes, diagrammes en boîte, en secteurs ou en bâtons. Tendance centrale : - moyenne - médiane. Dispersion : - quartiles, déciles. - Intervalle interquartile, intervalle interdécile. - écart type. Tableau croisé d effectifs Etude fréquentielle, notion de fréquence de A sachant B Présentation des données Histogrammes à pas non constants Tableau à double entrée Indicateurs de centralité - moyenne ; calcul à partir des moyennes des sous populations. - Médiane Indicateurs de dispersion - quantiles, décile, intervalle interquartile, intervalle interdécile - diagramme en boîte - écart type Statistique descriptive, analyse de données Caractéristiques de dispersion : variance, écart-type.
Terminales (en 2011-2012) ES STG ST2S STL Nuage de points associé à une série statistique à deux variables numériques. Point moyen. Ajustement affine par moindres carrés. Etude de séries de données statistiques quantitatives à deux variables Nuage de points, point moyen Ajustement affine Séries chronologiques Séries statistiques à deux variables -qualitatives : tris croisés étude fréquentielle, notion de fréquence de A sachant B. -quantitatives : tableaux d effectifs, nuage de points associés, points moyens. Exemples d ajustements. Séries statistiques à deux variables quantitatives : tableaux d'effectifs, nuage de points associés, point moyen.
Problème de l ajustement affine
Petite étude d un fichier de mesures corporelles Variables du fichier des mesures corporelles 252 hommes densité (gr/cm 3 ) Pourcentage de masse graisseuse : BF% Age en année Poids en kg Taille m : hauteur en mètres IMC =poids en kg/(taille en m) 2 Tours en cm de Cou Poitrine taille Hanche Cuisse Genou Cheville Biceps avant bras Poignet 56
Résumés numériques densité body fat % age Poids kg taille m cou poitrine taille hanches cuisse genou cheville biceps avant bras poignet IMC Lorentz Moy. Dév. Std Nombre Minimum Maximum Médiane 1,1 1,9E-2 250 1,0 1,1 1,1 19,0 8,3 250 0,0 47,5 19,2 44,8 12,5 250 22,0 81,0 43,0 81,1 13,3 250 53,8 164,7 79,9 1,8,1 250 1,6 2,0 1,8 38,0 2,4 250 31,1 51,2 38,0 100,8 8,4 250 79,3 136,2 99,6 92,4 10,7 250 69,4 148,1 90,9 99,8 7,1 250 85,0 147,7 99,3 59,4 5,2 250 47,2 87,3 59,0 38,6 2,4 250 33,0 49,1 38,5 23,1 1,7 250 19,1 33,9 22,8 32,3 3,0 250 24,8 45,0 32,0 28,7 2,0 250 21,0 34,9 28,7 18,2,9 250 15,8 21,4 18,3 25,4 3,6 250 18,0 48,9 25,0 71,4 5,0 250 59,4 85,6 71,1 57
Poids et BF Poids kg 40 60 80 100 120 140 160 180 body fat % 0 5 10 15 20 25 30 35 40 45 50 58
Résumés numériques densité body fat % age Poids kg taille m cou poitrine taille hanches cuisse genou cheville biceps avant bras poignet IMC Lorentz Moy. Dév. Std Nombre Minimum Maximum Médiane 1,1 1,9E-2 250 1,0 1,1 1,1 19,0 8,3 250 0,0 47,5 19,2 44,8 12,5 250 22,0 81,0 43,0 81,1 13,3 250 53,8 164,7 79,9 1,8,1 250 1,6 2,0 1,8 38,0 2,4 250 31,1 51,2 38,0 100,8 8,4 250 79,3 136,2 99,6 92,4 10,7 250 69,4 148,1 90,9 99,8 7,1 250 85,0 147,7 99,3 59,4 5,2 250 47,2 87,3 59,0 38,6 2,4 250 33,0 49,1 38,5 23,1 1,7 250 19,1 33,9 22,8 32,3 3,0 250 24,8 45,0 32,0 28,7 2,0 250 21,0 34,9 28,7 18,2,9 250 15,8 21,4 18,3 25,4 3,6 250 18,0 48,9 25,0 71,4 5,0 250 59,4 85,6 71,1 densité body fat % age Poids kg taille m cou poitrine taille hanches cuisse genou cheville biceps avant bras poignet IMC Lorentz Moy. Dév. Std Nombre Minimum Maximum Médiane 1,1 1,9E-2 249 1,0 1,1 1,1 19,0 8,3 249 0,0 47,5 19,2 44,8 12,5 249 22,0 81,0 43,0 80,7 12,2 249 53,8 119,2 79,8 1,8,1 249 1,6 2,0 1,8 37,9 2,3 249 31,1 43,9 38,0 100,6 8,1 249 79,3 128,3 99,6 92,2 10,2 249 69,4 126,2 90,9 99,6 6,4 249 85,0 125,6 99,3 59,2 4,9 249 47,2 74,4 58,9 38,5 2,3 249 33,0 46,0 38,4 23,1 1,6 249 19,1 33,9 22,8 32,2 2,9 249 24,8 39,1 32,0 28,7 2,0 249 21,0 34,9 28,7 18,2,9 249 15,8 21,4 18,3 25,3 3,3 249 18,0 39,1 25,0 71,4 5,0 249 59,4 85,6 70,9 59
Pourcentage Pourcentage Taille en m moyenne=médiane=1,8m 14 12 10 8 6 4 2 0 1,62 1,66 1,7 1,74 1,78 1,82 1,86 1,9 1,94 1,98 hauteur 30 25 20 15 10 5 2 1,96 1,92 1,88 1,84 1,8 1,76 1,72 1,68 1,64 1,6 taille m 0 1,6 1,65 1,7 1,75 1,8 1,85 1,9 1,95 2 hauteur 60
Pourcentage Age Moyenne 44,8 ans, médiane 43 ans 84 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 70 75 80 85 age 76 68 60 52 44 36 28 20 age 61
cou genou cheville biceps avant bras poignet Mesures corporelles 50 130 120 110 45 40 100 35 90 80 70 30 25 60 20 50 40 poitrine taille hanches cuisse 15 62
Pourcentage Poids en kg Moyenne 80,7 médiane 79,8 122 18 16 14 12 10 8 6 4 2 0 50 60 70 80 90 100 110 120 Poids kg 114 106 98 90 82 74 66 58 50 Poids kg 63
Pourcentage Pourcentage Indice de masse corporelle IMC=poids en kg/(taille en m) 2 Insuffisance pondérale IMC<18,5 Surpoids : IMC entre 25 et 30 Obésite à partir de 30 100 80 50 45 40 60 40 35 30 25 20 15 10 5 0 15 20 25 30 35 40 45 50 IMC 20 0 10 15 20 25 30 35 40 IMC 64
Poids kg Poids kg Lien taille poids 130 120 110 100 90 80 70 60 50 1,6 1,65 1,7 1,75 1,8 1,85 1,9 1,95 2 taille m 130 120 110 100 90 80 70 60 50 1,6 1,65 1,7 1,75 1,8 1,85 1,9 1,95 2 taille m Y = -88,45 + 94,736 * X; R^2 =,265 65
poids Liens âge poids 180 Nuage de points 160 140 120 100 80 60 40 20 30 40 50 60 70 80 90 age 66