Où sont les cloches de Gauss?

Documents pareils
Loi binomiale Lois normales

Annexe commune aux séries ES, L et S : boîtes et quantiles

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

TESTS D'HYPOTHESES Etude d'un exemple

Principe d un test statistique

TSTI 2D CH X : Exemples de lois à densité 1

Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

TABLE DES MATIERES. C Exercices complémentaires 42

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Peut-on imiter le hasard?

Représentation d une distribution

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Conseil économique et social

Chapitre 3. Les distributions à deux variables

PROGRAMME AEC COMPTABILITÉ FINANCIÈRE INFORMATISÉE

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Calcul élémentaire des probabilités

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Introduction à l approche bootstrap

EXERCICE 2 : SUIVI CINETIQUE D UNE TRANSFORMATION PAR SPECTROPHOTOMETRIE (6 points)

Chapitre 2 Le problème de l unicité des solutions

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Chaînes de Markov au lycée

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Chapitre 1 : Notions. Partie 9 - Rente viagère. Qu est-ce q u u n e «r e n t e v i a g è r e»?

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Statistiques Descriptives à une dimension

TECHNIQUE POUR LES (TRES) GRANDS DEBUTANTS!]

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Incertitudes expérimentales

Simulation de variables aléatoires

Classe de première L

LUMIÈRE NATURELLE BIEN-ÊTRE ET SÉCURITÉ AU TRAVAIL

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Cryptographie et fonctions à sens unique

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Cours de Tests paramétriques

Une discipline scolaire

L E Ç O N. Marches aléatoires. Niveau : Terminale S Prérequis : aucun

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Projet : Ecole Compétences Entreprise ECONOMIE TECHNICIEN/TECHNICIENNE EN COMPTABILITE

Analyse de la variance Comparaison de plusieurs moyennes

Towards realistic modeling of IP-level topology dynamics

Innovations Majeures de la Version 4

Cours Fonctions de deux variables

Complément d information concernant la fiche de concordance

Note de service À : De :

LA LETTRE DE MOTIVATION

C f tracée ci- contre est la représentation graphique d une

Le menu du jour, un outil au service de la mise en mémoire

Exercice du cours Gestion Financière à Court Terme : «Analyse d un reverse convertible»

Titre 4 - Analyse de l impact de la résiliation annuelle sur les marges des contrats emprunteurs

pka D UN INDICATEUR COLORE

FICHE N 8 Photodiversité, d une banque d images à un portail d activités en ligne Anne-Marie Michaud, académie de Versailles

L emprunt indivis - généralités

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Fluctuation d une fréquence selon les échantillons - Probabilités

Supports. Images numériques. notions de base [1]

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Guide de l utilisateur

A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Mesures et incertitudes

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

La simulation probabiliste avec Excel

Relation entre deux variables : estimation de la corrélation linéaire

FONCTION DE DEMANDE : REVENU ET PRIX

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Chapitre 3 : INFERENCE

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Coup de Projecteur sur les Réseaux de Neurones

LA COUR DES COMPTES a rendu l arrêt suivant :

Chapitre 1 : Évolution COURS

C est un mouvement plan dont la trajectoire est un cercle ou une portion de cercle. Le module du vecteur position OM est constant et il est égal au

Guide de rédaction d un protocole de recherche clinique à. l intention des chercheurs évoluant en recherche fondamentale

LA CONDUITE D UNE MISSION D AUDIT INTERNE

Directive sur les services de paiement

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Projet Fish & Catering Sector (Mise à jour du 13/10/08)

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

MODELES DE DUREE DE VIE

PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?

SEANCE 4 : MECANIQUE THEOREMES FONDAMENTAUX

données en connaissance et en actions?

Modélisation aléatoire en fiabilité des logiciels

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Présentation du programme. de physique-chimie. de Terminale S. applicable en septembre 2012

Nathalie Barbary SANSTABOO. Excel expert. Fonctions, simulations, Groupe Eyrolles, 2011, ISBN :

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

3. Caractéristiques et fonctions d une v.a.

Les mathématiques du XXe siècle

Transcription:

Où sont les cloches de Gauss? Valérie Fontanieu Statisticienne, Institut National de Recherche Pédagogique. On dit que certaines mesures répétées donnent lieu à un histogramme «en forme de cloche». est pourquoi, dans des manuels scolaires de physique, de biologie ou de mathématiques, on suggère parfois aux élèves de «voir une forme de cloche» émerger d un histogramme, là où eux voient une montagne, un tas, mais vraiment, pas de cloche. L objet cloche leur est d ailleurs peu familier. Les cloches en fonte des cours d école se sont envolées il y a longtemps. Mais que signifie «une forme de cloche»? De quoi est-ce spécifique? 1

Des exemples Voici 1 observations de 3 variables A, et et un histogramme de chacune de ces séries de données. Ont-ils une forme de cloche? 3 1 1 - -3 - -1 1 3 A 3 3 1 1 - -3 - -1 1 3 3 3 1 1-3 - -1 1 3

ette question est vague : c est quoi une forme de cloche? De quoi parle-t-on? Il y a toutes sortes de cloches En statistique, cela signifie que les données peuvent être considérées comme un échantillon d une loi de Gauss. Pour s en faire une meilleure idée, on superpose à l histogramme la courbe représentative de la densité d une loi de probabilité de Gauss dont les paramètres sont calculés, pour bien «coller» aux données (voir annexe 1) ; ces courbes matérialisent la forme de cloche en jeu. La question précédente peut être reposée ainsi : les histogrammes ci-dessous s ajustent-ils bien à une courbe en cloche? On a interrogé quelques personnes : les avis sont partagés, surtout pour les variables et, moins pour A où la forme en cloche semble acceptée. 3 3 1 1 - -3 - -1 1 3 A 3 3 1 1 - -3 - -1 1 3 3 3 1 1-3 - -1 1 3 3

On nous a suggéré un autre découpage des classes, reproduit ci-dessous, qui a conduit à contester radicalement, au niveau visuel, le cas de. On est toujours dans l observation graphique 3 3 1 1 - -3 - -1 1 3 A 3 3 1 1 - -3 - -1 1 3 3 3 1 1-3 - -1 1 3

ent observations, c est déjà beaucoup, mais voyons ce qui se passe avec plus de données. Les séries traitées ci-dessus sont les 1 premières valeurs d échantillons de taille 1, construits à partir de simulations. Les histogrammes ci-dessous correspondent aux 1 valeurs simulées. Que penser de ces histogrammes? A l œil nu, cloche ou pas cloche? 1 1 1 1 - - - -3 - -1 1 3 A 1 1 1 1 1 - - - -3 - -1 1 3 1 1 1 1 1 - - - -3 - -1 1 3 Là il y a consensus. Les trois histogrammes s ajustent agréablement aux courbes représentatives des «cloches de Gauss» : à l œil nu, les trois variables sont «gaussiennes» ; les paramètres (moyenne et écart-type) peuvent être estimés par les moyennes et écart-type des données simulées.

A Moy. Dév. Std Nombre Minimum Maximum Médiane -,3 1,3 1 -,,11 -,1 -,3 1, 1-3,7 3,1 -,3,99 1,17 1-3,3,7,9 Des tests Mais allons un peu plus loin et mettons en œuvre un test statistique qui validera ou infirmera l adéquation à ces données d un modèle gaussien. Un test classique pour cette situation est le test de Kolmogorov Smirnov 1. Les données sont fournies dans le fichier Excel joint ; ceux qui le souhaitent pourront mettre eux-mêmes le test en œuvre. Sur les trois séries de 1 données, le modèle gaussien est accepté avec un test de Kolmogorov au risque de première espèce,1, bien que visuellement l ajustement soit peu convaincant. De fait, avec peu de données, l ajustement à une courbe en cloche est rarement flagrant à l œil nu (voir aussi l annexe ). Sur les séries de 1 données, le modèle gaussien est accepté avec un test de Kolmogorov au risque de première espèce,1 pour les variables et. Pour la variable A, le modèle est refusé au même risque,1 mais il est accepté avec le même test et un risque de première espèce,1 : la situation est donc ambiguë. On notera qu avec 1 données, l histogramme relatif à A semblait aussi bien s ajuster à une courbe en cloche que ceux des variables et : l impression à l œil nu est ici que tout est en cloche : histogrammes à une seule bosse, assez bien symétriques 3. Accepter ou non le modèle gaussien pour A dépend de l usage que l on a du modèle. Ici, les données sont construites, et il convient maintenant de dévoiler comment elles l ont été. Pour obtenir les 1, puis 1 valeurs de, on a simulé la loi normale centrée réduite. Pour obtenir les 1, puis 1 valeurs de, on a simulé 1 valeurs de la loi uniforme sur [,], que l on a ajouté à la série. Pour obtenir les 1, puis 1 valeurs de A, on a fait le calcul suivant : la i-ème valeur a i de la série A est égale à : a i = b i +1,3 cos(i) où b i est la ième donnée de la série et où l unité d angle est le radian. 1 http://www.math-info.univ-paris.fr/smel/cours/cadre_cours.html http://www.math-info.univ-paris.fr/smel/simulations/tks/tks.html Nous avions choisi ici un risque de première espèce égal à,1 ; il est à ce niveau plus fort d accepter le modèle que si nous avions choisi un risque,1. En effet, dans ce dernier cas, on veut avoir une chance sur 1 de rejeter le modèle à tort, contre une chance sur 1 ici : plus on est prudent sur le risque de se tromper en cas de rejet, plus facilement on acceptera le modèle. 3 La courbe en cloche est à décroissance rapide, mais ce n est pas facile d en juger à l œil nu.

Pour conclure Seule la variable, par construction, suit une loi gaussienne. La loi de la variable en est très proche, et même avec 1 données, le modèle gaussien reste acceptable. La loi de la variable A est proche d une loi de Gauss. Nous avons ici construit des données dans le but de préciser l implicite sous le terme «histogrammes en cloche» et pour dégager les enseignants d une sorte d obligation de voir des cloches même quand c est quelque peu artificiel. Nous avons ainsi pu : - expliciter ce qu est ici une forme de cloche : c est la représentation graphique d une fonction (une densité de loi de probabilité) associée à un modèle des données par une loi de Gauss ; - voir sur un exemple qu on peut observer à l œil nu de bons ajustements avec une loi qui n est pas gaussienne, ou inversement, avec peu de données, considérer visuellement que l ajustement est douteux alors que les données sont simulées avec une loi normale. On notera qu en pratique, on a souvent moins de 1 données et très rarement 1 données et la problématique est autre. L origine des données doit toujours être prise en compte pour discuter du choix du modèle. En contrôle industriel, les recommandations classiques pour faire le test de normalité et obtenir certains labels de qualité portent sur des échantillons de à données. ependant, les spécialistes savent que les tests décèlent souvent nettement moins bien les problèmes de fabrication que les vérifications du tracé chronologique des données et l analyse précise des conditions de relevé (étude d un procédé non maîtrisé, mélange de plusieurs machines, ou de plusieurs produits). Enfin, signalons une confusion avec une autre situation où l on parle d histogrammes en cloche : il s agit non plus d histogrammes construits avec des données empiriques ou simulées mais d histogrammes de lois de probabilité. En tel cas, l ajustement est visuellement excellent et illustre graphiquement le théorème central limite (annexe 3). N oublions pas que face à une série de données, plusieurs modèles probabilistes sont envisageables. voir http://www.statistix.fr/spip/spip.php?article 7

Annexe 1 L équation des «courbes en cloche» 3 3 1 1 - -3 - -1 1 3 3 3 1 1 - -3 - -1 1 3 Les courbes tracées ci-dessus sont les courbes représentatives de la fonction f définie par : f (x)= s 1 ( x m) exp, avec m=. et s=.99 π s (on a f(),) Ici, m et s sont respectivement la moyenne et l écart type des données ayant servi à construire l histogramme. Si on avait tracé un histogramme avec un pas de largeur k (ce qui revient aussi à changer d unité) on aurait tracé sur le même graphique la courbe représentative de kf. Ainsi, dans le graphique ci-dessous, on a k=.. 1 1 1 1 1 - -3 - -1 1 3

Annexe Quatre autres séries de taille 1 simulées selon la loi N(,1) et les «cloches de Gauss» associées 3 1 - -3 - -1 1 3 N(,1) 3 1 - -3 - -1 1 3 N(,1) 3 1 - -3 - -1 1 3 N(,1) 3 1 - -3 - -1 1 3 N(,1) Annexe 3 Histogrammes théoriques et courbes en cloche Il est difficile de «voir» des «formes de cloches» sur des histogrammes construits à partir d un nombre raisonnable de données issues d expériences réelles. Par contre, certains histogrammes théoriques collent bien avec une courbe en cloche. i-dessous, le point d abscisse i a pour ordonnée la valeur de la probabilité qu une variable aléatoire de loi binomiale (,.) vaille i, i =,, ; la courbe tracée est la courbe 1 ( x m) représentative de f, avec f (x)= exp, pour m = et s = /. La raison de cet s π s ajustement est donnée par le théorème central limite. olonne 1,1,1,,,, 1 1 3 3 olonne 9