Comment construire un diagramme de Henry avec Excel et comment l interpréter



Documents pareils
La simulation probabiliste avec Excel

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Traitement des données avec Microsoft EXCEL 2010

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Annexe commune aux séries ES, L et S : boîtes et quantiles

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Apllication au calcul financier

Statistique : Résumé de cours et méthodes

Comment créer et utiliser une fonction

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Fonctions homographiques

LE PROCESSUS ( la machine) la fonction f. ( On lit : «fonction f qui à x associe f (x)» )

Logiciel XLSTAT version rue Damrémont PARIS

Chapitre 6. Fonction réelle d une variable réelle

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Continuité et dérivabilité d une fonction

Logistique, Transports

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Le calcul du barème d impôt à Genève

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

TSTI 2D CH X : Exemples de lois à densité 1

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

Leçon N 4 : Statistiques à deux variables

Fonctions de plusieurs variables

Loi binomiale Lois normales

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Dérivation : Résumé de cours et méthodes

CAPTEURS - CHAINES DE MESURES

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Baccalauréat ES Amérique du Nord 4 juin 2008

Introduction à la statistique descriptive

Nombre dérivé et tangente

Le suivi de la qualité. Méthode MSP : généralités

Relation entre deux variables : estimation de la corrélation linéaire

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

F411 - Courbes Paramétrées, Polaires

Angles orientés et fonctions circulaires ( En première S )

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Mesurer les altitudes avec une carte

Apprentissage par renforcement (1a/3)

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

La fonction exponentielle

TP 7 : oscillateur de torsion

Chapitre 3. Les distributions à deux variables

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

Statistiques Descriptives à une dimension

Outil de contrôle du calcul des intérêts Maj le 15 juil. 11 (12:23) Page 1/7 Association Bande Populaire du Sud Ouest

Réalisation de cartes vectorielles avec Word

Complément d information concernant la fiche de concordance

Débuter avec Excel. Excel

Chp. 4. Minimisation d une fonction d une variable

Exercice sur la planification de l élaboration d un programme TPMDidacticiel de MS Project pour la planification de projets

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

1. Vocabulaire : Introduction au tableau élémentaire

Union générale des étudiants de Tunisie Bureau de l institut Préparatoire Aux Etudes D'ingénieurs De Tunis. Modèle de compte-rendu de TP.

SOMMAIRE MONTAGE DU COMPTEUR ET CAPTEURS...3 LE MOT DU CHEF DE PRODUIT...5 L ORGANISATION DE L ECRAN...5 LES PICTOGRAMMES UTILISES...5 LES BOUTONS...

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

Lecture graphique. Table des matières

La mesure de Lebesgue sur la droite réelle

LES DECIMALES DE π BERNARD EGGER

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Précision d un résultat et calculs d incertitudes

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Chapitre 0 Introduction à la cinématique

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

LibreOffice Calc : introduction aux tableaux croisés dynamiques

Correction du baccalauréat ES/L Métropole 20 juin 2014

Infolettre #18 : Les graphiques avec Excel 2010

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

EXCEL TUTORIEL 2012/2013

Cours Fonctions de deux variables

COMPTE-RENDU «MATHS EN JEANS» LYCEE OZENNE Groupe 1 : Comment faire une carte juste de la Terre?

Microsoft Excel Présentation du tableur Excel

Limites finies en un point

point On obtient ainsi le ou les points d inter- entre deux objets».

La place de SAS dans l'informatique décisionnelle

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Représentation des Nombres

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Activité 11 : Nuage de points ou diagramme de dispersion

FONCTION EXPONENTIELLE ( ) 2 = 0.

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Exercices Corrigés Premières notions sur les espaces vectoriels

Deux disques dans un carré

Partie 1. Fonctions plus complexes dans Excel. Fonctions Si(), Et(), Ou() et fonctions imbriquées. Opérateurs logiques. I.1.

Microsoft Excel. Tableur

Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Fonction quadratique et trajectoire

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Transcription:

Comment construire un diagramme de Henry avec Ecel et comment l interpréter Kathy Chapelain et Emmanuel Grenier emmanuel.grenier@lasalle-beauvais.fr Relu par Henry P. Aubert, Jacques Goupy et Jacques Vaillé Objet Le diagramme de Henry (ou «droite de Henry») permet d apprécier l adéquation d une distribution observée à la loi de Gauss. En abscisse,, on porte les valeurs observées ou les limites supérieures des classes lorsque les valeurs sont regroupées en classes. En ordonnée, on porte le «normit» de (la fonction normit sera définie à la page ). Sur ce système d aes, des réalisations d une variable gaussienne donnent un nuage de points proche d une droite.,5,5 Normit de,5 35 -,5 4 45 5 55 6 65 - -,5 - -,5 Figure Pour l eemple de la Figure, on peut supposer que les valeurs observées sont des réalisations d'une même variable gaussienne. Note : le diagramme de Henry est un cas particulier de diagramme «Quantile-Quantile» (Voir les fiches «Méthodes d ajustements graphiques» dans la page Ecel ense []). La présente fiche eplique comment faire un diagramme de Henry avec Ecel et propose une aide à l interprétation par des eemples. Le document joint Diagramme de Henry.ls fournit les données des eemples ainsi qu une feuille de calcul toute faite pour vos propres données. Revue MODULAD, 6 - - Numéro 35

Principe Nous invitons le lecteur non initié au probabilités ou à la statistique descriptive à se reporter au chapitres correspondants dans le manuel du groupe «Les cercles d Ecel ense» [3]. La construction du diagramme s opère de la manière suivante (voir la norme AFNOR «Etude de la normalité d'une distribution» []) : ) On calcule l effectif cumulé pour chaque (valeur observée ou limite supérieure de la classe si les valeurs sont regroupées en classes), c est-à-dire le nombre de valeurs inférieures ou égales à. ) On calcule la fréquence cumulée, c est-à-dire l effectif cumulé divisé par l effectif total. 3) On détermine le fractile correspondant pour la loi de Gauss standard (le fractile d ordre p est la valeur u telle que la probabilité cumulée jusqu à u est égale à p). On obtient ainsi le «normit» de (de l anglais normal unit) Probabilité cumulée pour la loi de Gauss standard Fréquence cumulée en,5 - normit de Valeur de la variable Figure 4) On représente les couples ( ; y), avec y = normit de, par un nuage de points. Prenons le cas où les valeurs observées sont des réalisations d une variable gaussienne standard. La fréquence cumulée en des valeurs observées est alors proche de la probabilité cumulée en pour la loi de Gauss standard (d autant plus proche que le nombre d observations est important). Le normit de est donc proche de. Probabilité cumulée ou fréquence cumulée Fréquence cumulée en,5 normit - de Valeur de la variable Fonction de probabilité cumulée pour la loi de Gauss standard Fonction de fréquence cumulée des valeurs observées Figure 3 Le nuage des points ( ; y), avec y = normit de, est alors proche de la droite y =. Prenons le cas d une variable gaussienne de moyenne théorique μ et d écart-type théorique σ quelconques. On revient à une variable de Gauss standard en centrant et en réduisant la Revue MODULAD, 6 - - Numéro 35

variable, c est-à-dire par la transformation = ( μ)/σ. Le nuage des points sera donc dans ce cas proche de la droite d équation y = ( μ)/σ. Construction avec Ecel Cas d observations non regroupées en classes Voir la feuille Eemple dans le document Diagramme de Henry.ls On reprend les 4 étapes décrites précédemment : ) Calcul de l effectif cumulé L effectif cumulé est le rang de classement des valeurs dans un ordre croissant : fonction RANG. ) Calcul de la fréquence cumulée Figure 4 On divise l effectif cumulé par l effectif total. L effectif total peut être obtenu en prenant le maimum des effectifs cumulés. En pratique, on augmente l effectif total d une unité pour que le normit puisse être calculé sur la valeur maimale. D autres corrections sont possibles : voir la norme AFNOR []. Figure 5 Revue MODULAD, 6-3 - Numéro 35

3) Calcul du normit On applique au fréquences cumulées la réciproque de la fonction de répartition de la loi de Gauss standard : fonction LOI.NORMALE.STANDARD.INVERSE. Figure 6 4) Représentation des couples ( ; y), avec y = normit de, par un nuage de points On sélectionne la plage des et celle des normits (sélection de plages discontinues avec la touche Ctrl), on clique sur l icône Assistant graphique et on choisit Nuage de points. Pour l eemple, on obtient le graphique de la page. Cas d observations regroupées en classes Les intervalles des classes doivent être fermés à droite (bornes supérieures incluses). Les valeurs sont alors les limites supérieures des classes. On les entre par ordre croissant et on entre les effectifs des classes correspondantes. Voir la feuille Eemple. Note : Figure 7 Dans la feuille d eemple, les effectifs des classes n ont pas été saisis mais calculés à partir des valeurs observées et des limites des classes. On a utilisé la fonction FREQUENCE. On aurait pu utiliser la fonction NB.SI (voir la fiche «Comment faire un histogramme» dans le manuel [3]) ou passer par l Utilitaire d analyse «Histogramme». Les effectifs cumulés se calculent en additionnant les effectifs depuis la première classe. Revue MODULAD, 6-4 - Numéro 35

Figure 8 On revient ensuite à l étape ) de la procédure précédente. Interprétation à partir d eemples Voir dans le document Ecel les feuilles Eemple à Eemple 5. Eemple L effectif (38 observations) ne justifie pas un regroupement en classes. Représentons la distribution des valeurs observées par un nuage de points. 65 6 55 5 45 4 35 3 4 Numéro d'observation Figure 9 Peut-on faire l hypothèse que ces valeurs sont des réalisations d une variable gaussienne? On construit le diagramme de Henry. On obtient le diagramme de la Figure (page ). Le nuage étant proche d une droite, on n a pas de raison de rejeter l hypothèse. Eemple On a maintenant suffisamment d observations pour regrouper les valeurs observées en classes et représenter leur distribution par un histogramme. Revue MODULAD, 6-5 - Numéro 35

, Densité de fréquence,,8,6,4, 5 5 3 35 4 45 5 Valeur observée Figure La distribution est symétrique, en forme de cloche. A première vue, il semblerait qu on puisse la modéliser par une loi de Gauss. Pour le confirmer, on construit le diagramme de Henry (avec les mêmes classes mais en regroupant les classes de faible effectif). 3 Normit de - 5 3 35 4 45 5 - -3 Figure Le nuage de points étant proche d une droite, on peut modéliser la distribution observée par une loi de Gauss. Remarque : Le diagramme de Henry permet d approcher la moyenne et l écart-type des réalisations d une variable gaussienne lorsqu on ne dispose que de la distribution des valeurs regroupées en classes. On repère la droite de tendance du nuage des points, ou «droite de Henry», et on approche la moyenne par l intersection à l origine, m, et l écart-type par, s, l inverse de la pente (voir la norme AFNOR []). Revue MODULAD, 6-6 - Numéro 35

3 Normit de 5 3 35 4 45 - m m+s - Figure Pour l eemple, on obtient m = 33, et s = 4, (valeurs très proches de la moyenne et de l écart-type des valeurs observées). On peut généralement déterminer la droite au jugé, les points étant quasi alignés dans le cas où les observations sont issues d une variable gaussienne et regroupées en classes. Attention : la fonction graphique d Ecel Ajouter une courbe de tendance ne donne pas la droite de tendance d un nuage de points mais la droite de régression. La droite de tendance d un nuage de points ( ; y) est la droite d équation y* = * où y* et * sont les valeurs de y et de centrées et réduites (pour la droite de Henry, il faut pondérer la moyenne et l écart-type par l effectif de la classe correspondante). Eemple 3 La distribution observée est très dissymétrique pour cet eemple., Densité de fréquence,5,,5 5 5 5 3 35 4 45 5 55 6 65 7 Valeur observée Figure 3 Cette dissymétrie se traduit sur le diagramme de Henry par une tendance non linéaire du nuage de points : Revue MODULAD, 6-7 - Numéro 35

Normit de 3,5,5,5 -,5 4 6 - -,5 8 Figure 4 Une tendance dont la pente diminue avec traduit une répartition dissymétrique étalée vers les valeurs importantes de. La pente augmenterait dans le cas d un étalement vers les faibles valeurs de. Remarque : Un passage à une échelle logarithmique (Clic double sur l ae des abscisses / Format / Echelle / Sélectionnez Echelle logarithmique) donne une tendance linéaire. Normit de 3,5,5,5 -,5 - -,5 Figure 5 Pour l eemple, on pourrait modéliser la distribution par une loi de Gauss sur les logarithmes des observations. Eemple 4 Comme pour l Eemple, on travaille sur les données non regroupées parce que l effectif est faible. Revue MODULAD, 6-8 - Numéro 35

75 7 65 6 55 5 45 4 35 3 5 5 5 5 3 35 4 45 5 55 Numéro d'observation Figure 6 La distribution est symétrique. Peut-on ici aussi supposer que les valeurs observées sont des réalisations d une variable gaussienne? Construisons le diagramme de Henry.,5,5 Normit de,5 -,5 5 3 35 4 45 5 55 6 65 7 - -,5 - -,5 Figure 7 La forme de nuage traduit une distribution symétrique mais non gaussienne (ici, la distribution est plus proche de la loi uniforme que de la loi de Gauss). Eemple 5 Le problème n est plus de tester l adéquation à une loi de Gauss. On a repéré des valeurs etrêmes (les observations n 6, 9 et 3) et on voudrait juger si ces observations sont aberrantes sous l hypothèse d une distribution gaussienne. Revue MODULAD, 6-9 - Numéro 35

5 3 9 7 5 3 9 7 5 5 5 5 3 35 4 Numéro d'observation Figure 8 Ces observations s'écartent de l'alignement dans le diagramme de Henry. On peut par conséquent considérer qu elles sont aberrantes sous l hypothèse d une répartition gaussienne.,5,5 n 6 Normit de,5 -,5 - -,5 - -,5 5 5 5 n 9 n 3 Figure 9 Remarques : Une observation n est pas aberrante en soi mais sous une hypothèse de loi. Cette méthode est utilisée pour dépouiller les résultats des plans de criblage de facteurs. On parle alors de «diagramme de Daniel». Voir le chapitre «Plans d epériences» dans le manuel du groupe «Les cercles d Ecel ense» [3]. Revue MODULAD, 6 - - Numéro 35

Références [] AFNOR - Etude de la normalité d'une distribution. NF X 6-5, décembre 995 [] Goldfarb B., Pardou C. - Méthodes d ajustements graphiques. Ecel'ense - MODULAD n 33, juillet 5. www.modulad.fr [3] Morineau A., Chatelin Y.-M. (Coordinateurs) L'analyse statistique des données. Apprendre, comprendre et réaliser avec Ecel. Editions Ellipses, 5. Revue MODULAD, 6 - - Numéro 35