MÉTHODE GRAPHIQUE DE CALCULS DE LA MOYENNE ET DE L'ÉCART TYPE DUNE DISTRIBUTION NORMALE TEST DE NORMALITÉ



Documents pareils
1. Vocabulaire : Introduction au tableau élémentaire

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

MESURE DE LA TEMPERATURE

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

La fonction exponentielle

Complément d information concernant la fiche de concordance

Mesurer les altitudes avec une carte

Loi binomiale Lois normales

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Correction du baccalauréat STMG Polynésie 17 juin 2014

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Chapitre 1 I:\ Soyez courageux!

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

SYSTEMES LINEAIRES DU PREMIER ORDRE

Séries Statistiques Simples

Précision d un résultat et calculs d incertitudes

Chapitre 1 Régime transitoire dans les systèmes physiques

TSTI 2D CH X : Exemples de lois à densité 1

TESTS D'HYPOTHESES Etude d'un exemple

CAPTEURS - CHAINES DE MESURES

Figure 1 Différents éléments influençant les mesures de seuil réalisées en champ visuel

Chapitre 1 : Évolution COURS

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

Traitement des données avec Microsoft EXCEL 2010

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

I. Ensemble de définition d'une fonction

Lecture graphique. Table des matières

Statistique Descriptive Élémentaire

Correction de l examen de la première session

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Statistique : Résumé de cours et méthodes

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Les mesures à l'inclinomètre

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Représentation d une distribution

Fonctions de plusieurs variables

Evaluation de la variabilité d'un système de mesure

Retentissement de la réforme de l'ircantec 2008 sur la retraite des Praticiens Hospitaliers.

Nombre dérivé et tangente

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Chapitre 3. Les distributions à deux variables

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

INF6304 Interfaces Intelligentes

La polarisation des transistors

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Sujet. calculatrice: autorisée durée: 4 heures

Estimation et tests statistiques, TD 5. Solutions

AFFAIBLISSEMENT DÛ AUX NUAGES ET AU BROUILLARD

Commun à tous les candidats

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Dérivation CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de :

Régression linéaire. Nicolas Turenne INRA

CHAPITRE VIII : Les circuits avec résistances ohmiques

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

C f tracée ci- contre est la représentation graphique d une

Relation entre deux variables : estimation de la corrélation linéaire

Développements limités. Notion de développement limité

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

BACCALAUREAT GENERAL MATHÉMATIQUES

Logiciel XLSTAT version rue Damrémont PARIS

Fonction inverse Fonctions homographiques

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Module 16 : Les fonctions de recherche et de référence

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

CARACTERISTIQUE D UNE DIODE ET POINT DE FONCTIONNEMENT

L analyse boursière avec Scilab

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Leçon N 4 : Statistiques à deux variables

Premier ordre Expression de la fonction de transfert : H(p) = K

FONCTION DE DEMANDE : REVENU ET PRIX

REMARQUES SUR LE PETIT FRAGMENT DE TABLETTE CHYPRO MINOENNE TROUVÉ A ENKOMI EN par EMILIA MAS SON

Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

Statistiques Descriptives à une dimension

Représentation des Nombres

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

PARTIE NUMERIQUE (18 points)

Partie 1 - Séquence 3 Original d une fonction

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Collecter des informations statistiques

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

Théorème du point fixe - Théorème de l inversion locale

Annexe commune aux séries ES, L et S : boîtes et quantiles

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Transcription:

REVUE FORESTIÈRE FRANÇAISE 791 MÉTHODE GRAPHIQUE DE CALCULS DE LA MOYENNE ET DE L'ÉCART TYPE DUNE DISTRIBUTION NORMALE TEST DE NORMALITÉ r PAR R. TOMASSONE Ingénieur des Eaux et Forêts Ψ Section de la Station de Recherches L'analyse statistique des résultats expérimentaux demande des calculs souvent longs, et lorsque les calculs sont faits à la main, à la règle à calcul ou même avec une machine à calculer de bureau, les risques d'erreur sont grands. Comme d'autre part les calculs usuels ne demandent pas une grande précision, une interprétation graphique des résultats suffit la plupart du temps ; cette interprétation possède en outre l'avantage d'être beaucoup plus claire. Le problème que nous nous proposons de traiter ici est lié à l'étude de la distribution normale (*) : 1) Etant donné un η échantillon (**) issu d'une loi normale, calculer sa moyenne et son écart type. (*) Pour la définition statistique de base: distribution, fonction de répartition (courbe des fréquences cumulées), distribution normale, cf. «La méthode statistique et ses applications en matière forestière». R.F.F., août 1953, numéro spécial et référence [5]. (Les chiffres entre crochets [ ] renvoient à la bibliographie qui se trouve à la fin de l'article). (**) Dans la terminologie statistique un η échantillon est un échantillon constitué par η éléments.

792 REVUE FORESTIÈRE FRANÇAISE 2) Soumettre à un test l'hypothèse «la population dont une image est donnée par le η échantillon est une population normale )) (*). Cette seconde partie nous paraît très importante notamment en vue de l'application des méthodes statistiques à l'analyse des corrélations et à l'analyse de variance. Dans les deux cas, on suppose que les distributions des mesures sont normales ; lorsqu'elles ne le sont pas, les conclusions qu'on peut tirer des résultats d'une analyse statistique sont fausses. En particulier, lorsqu'on calcule un coefficient de corrélation et lorsqu'on trouve qu'il n'est pas «significativement différent de 0», on conclut très vite que les deux caractères étudiés sont indépendants : ceci peut être faux car l'absence de corrélation entraîne l'indépendance seulement si les distributions des deux caractères sont normales. 1. Estimation de la moyenne et de l'écart type : Méthode de la droite de Henry On sait que la densité de probabilité d'une distribution normale de moyenne m et d'écart type es est donnée par la formule : 1 Γ (χ _ m)2 Τ (**) f (χ) exp I I a\j 2π L 2σ2 J La fonction de répartition normale F (x) correspond à la somme de toutes ces densités jusqu'à une valeur χ : c'est cette quantité F (x) que nous allons utiliser. Si on prend un graphique dont les graduations correspondent : en abscisse X : les intervalles de classe, en ordonnée F : une graduation avec pour échelle linéaire l'écart type correspondant à la distribution σ = 1 ; le point de coordonnée X, F (dans le cas où la distribution parente est normale, répétons-le) décrit une droite [3]. Une table de la loi normale donne pour fréquences cumulées (F) les valeurs suivantes : a 2 1 0 1 2 F (en %) 2,28 15,87 50,00 84,13 97,72 (*) Ici soumettre à un test signifie: étant donné les risques d'erreur que l'on accepte de prendre pour une grandeur de l'échantillon, est-ce que les écarts observés entre la répartition de l'échantillon et la répartition normale admettant même moyenne et même écart type ne sont dus qu'à des causes non contrôlées? (ce que le statisticien appelle: le hasard). (**) exp () = exponentielle.

MÉTHODE GRAPHIQUE DE CALCULS 793 Dans la pratique, on trouve des graphiques entièrement quadrillés suivant ces graduations (*). L'intersection avec la droite F = 50 donne la moyenne estimée m. La pente de la droite est inversement proportionnelle à l'écart type Ö : donc plus Tangle avec une parallèle à l'axe des abscisses est grand, plus la dispersion est faible. Pratiquement, on obtient <* comme différence entre les deux valeurs χ (83,13) et χ (50,00) Exemple: Exp. de comparaison de provenances d'épicéas' [M. LE- MOINE 62-23] ; on a mesuré sur 100 plants (**) de la provenance AURS les hauteurs figurant au tableau I. TABLEAU I (1) X Classe de hauteur (2) f fréquence relative (3) F fréquences ' cumulées (4) X 20,6 variable centrée (5) X 20, 5,6 variable cen réduite 12 14 16 18 20 22 24 26 28 30 32 5 11 11 14 12 14 9 5 13 2 4 5 16 27 41 53 67 76 81 94 96 100 8,06 6,06 4,06 2,06 0,06 1,94 3,94 5,94 7,94 9,94 11,94 1,44 1,08 0,72 0,37 0,01 0,35 0,71 1,06 1,42 1,77 2,13 Nous utilisons les colonnes 1, 2 et 3 du tableau I : pour la classe 11-13 (centre de classe 12) on trace un trait à F = 5 pour la classe 13-15 (centre de classe 14) on trace un trait à F 16 et ainsi de suite jusqu'à Γ avant-dernière classe. On trace la droite joignant les points les plus à droite des traits de chaque classe (voir fig. 1) : (*) On les appelle «Diagramme de la droite de Henry ou droite échantillon» (anamorphe de la courbe de probabilité totale de la loi de Gauss). (**) donc ici fréquence relative en pourcentage est égale au nombre plants.

METHODE GRAPHIQUE DE CALCULS 795 l'intersection avec F = 50,00 donne moyenne = 20,6 l'intersection avec F = 84,13 donne χ (84,13) = 26,2 d'où a 26,2 20,6 = 5,6 Le calcul exact donne χ = 20,88 σ = 5,4 2. Test de normalité de la distribution En pratique, les points ne sont pas rigoureusement alignés, un simple coup d'oeil sur le graphique permet de se rendre compte si l'hypothèse de normalité est valable. Mais cette méthode est très intuitive, elle ne tient aucun compte du nombre de mesures dont on dispose. Il est normal qu'avec 40 mesures, la dispersion soit grande même si la distribution parente est normale; avec 1000 une grande dispersion est fort improbable. Des graphiques portant des intervalles de confiance ont été tracés, ce sont eux que nous allons utiliser (cf JACQUET [1]). Pour ne pas en construire un trop grand nombre, ils correspondent à Ö = 1 et au seuil de confiance couramment utilisé de 95 %. Pour ce test on utilise les colonnes 4 et 5 du tableau I et la figure 2: on «centre» la variable, c'est-à-dire qu'on calcule les écarts par rapport à la moyenne estimée 20,6 (colonne 4). on «réduit» la variable en divisant par 5,6 (colonne 5). Si l'hypothèse de normalité est exacte, la nouvelle variable χ 20,6 suit une loi normale de moyenne 0 d'écart type 1. Pour 5,6 un η échantillon, les points, au seuil de 95 %, doivent tous être situés dans la plage de confiance correspondante. Par exemple, sui la figure 2, pour η = 100, rien ne s'oppose à admettre que la di > tribution est normale (*) (**). On peut donc conclure qu'au seuil choisi et avec l'effectif dont on dispose, la distribution des hauteurs est normale et que l'estimation de la moyenne est m = 20,6, celle de l'écart type o = 5,6. Pour appliquer ce test, il suffira donc de construire un graphique correspondant à la figure 1, de centrer et de réduire la variable pour tracer un autre graphique équivalent à la figure 2, et d'utiliser le calque ci-joint pour tester l'hypothèse de normalité. (*) Un test du y? beaucoup plus long à mettre en œuvre permet d'arriver au même résultat. (**) Pour d'autres exemples de distribution que l'on peut rencontrer dans des problèmes forestiers, cf. PARDE [2] et SMITH [4].

796 FÎT*«} «ô«##:i:.iéai! REVUE FORESTIÈRE FRANÇAISE

MÉTHODE GRAPHIQUE DE CALCULS 797 BIBLIOGRAPHIE [1] R. JACQUET (1962). Contribution aux études de plages de confiance d'une droite de Henry. Thèse présentée à la Faculté des Sciences de l'université de Nancy. [2] J. PARDE (1961). Dendrometrie. Louis-Jean. Gap. [3] RISSER et TRAYNARD (1957). Les Principes de la Statistique Mathématique. 2 e édition. Gauthier-Villars. Paris. [4] SMITH J.H.G. and KER J.W. (1957). Some distributions encountered in sampling forest stands. Forest Science 3 (2), p. 137-144. [5] VESSEREAU A. (1960). Méthodes Statistiques en Biologie et en Agronomie. 2 e édition. Baillère. Paris. [6] R.F.F. (Août 1953). Numéro spécial. La méthode statistique et ses applications en matière forestière.