CHAPITRE 11. La loi normale

Documents pareils
TSTI 2D CH X : Exemples de lois à densité 1

Statistiques Descriptives à une dimension

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Représentation d une distribution

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Annexe commune aux séries ES, L et S : boîtes et quantiles

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Chapitre 2. Eléments pour comprendre un énoncé

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Module 16 : Les fonctions de recherche et de référence

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

FORMULAIRE DE STATISTIQUES

Etude de fonctions: procédure et exemple

3. Caractéristiques et fonctions d une v.a.

Précision d un résultat et calculs d incertitudes

O, i, ) ln x. (ln x)2

Loi binomiale Lois normales

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Exercice du cours Gestion Financière à Court Terme : «Analyse d un reverse convertible»

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Fonctions homographiques

Cours Fonctions de deux variables

Estimation et tests statistiques, TD 5. Solutions

2.4 Représentation graphique, tableau de Karnaugh

BACCALAUREAT GENERAL MATHÉMATIQUES

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Moments des variables aléatoires réelles

Probabilités III Introduction à l évaluation d options

Simulation de variables aléatoires

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

MATHÉMATIQUES. Mat-4104

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Raisonnement par récurrence Suites numériques

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Calculs de probabilités avec la loi normale

La fonction exponentielle

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

M2 IAD UE MODE Notes de cours (3)

La Clé informatique. Formation Excel XP Aide-mémoire

Mesures et incertitudes

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Introduction à l étude des Corps Finis

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Intégration et probabilités TD1 Espaces mesurés Corrigé

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Texte Agrégation limitée par diffusion interne

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Résolution d équations non linéaires

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Chapitre 3. Les distributions à deux variables

TD1 Signaux, énergie et puissance, signaux aléatoires

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS =

Projet de Traitement du Signal Segmentation d images SAR

La simulation probabiliste avec Excel

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Lois de probabilité. Anita Burgun

Les Conditions aux limites

Introduction à la théorie des files d'attente. Claude Chaudet

I- Définitions des signaux.

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Leçon N 4 : Statistiques à deux variables

Corrigé des TD 1 à 5

23. Interprétation clinique des mesures de l effet traitement

Probabilités. C. Charignon. I Cours 3

Commun à tous les candidats

Correction du baccalauréat ES/L Métropole 20 juin 2014

Fonctions de plusieurs variables

Séries Statistiques Simples

Calcul élémentaire des probabilités

IV- Equations, inéquations dans R, Systèmes d équations

Statistique Descriptive Élémentaire

Cours de Tests paramétriques

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

NOTIONS DE PROBABILITÉS

4 Distributions particulières de probabilités

Complément d information concernant la fiche de concordance

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Oscillations libres des systèmes à deux degrés de liberté

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Travaux dirigés d introduction aux Probabilités

EXCEL TUTORIEL 2012/2013

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Probabilités conditionnelles Loi binomiale

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Les suites numériques

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Rappels sur les suites - Algorithme

Transcription:

50

CHAPITRE 11 La loi normale 1. Introduction à l inférence statistique Dans ce chapitre, nous étudierons la façon de faire de l inférence statistique, c est-à-dire qu à partir de la moyenne x ou d une proportion p d un échantillon, nous serons en mesure d estimer la moyenne µ ou la proportion π de la population. Naturellement, si nous approximons µ par x, nous commettrons une certaine erreur puisque l échantillon n est pas la population. Par contre, plus la taille de l échantillon est grande, plus x se rapprochera de la véritable moyenne de la population. Le même phénomène se produit avec les proportions. C est ce que l on appelle en mathématique la Loi de Grands Nombres. Comme nous l avons mentionné, si l on utilise x pour approximer µ, on commet une certaine erreur. De plus, si nous prenons un autre échantillon de même taille, il nous donnera une autre moyenne. C est pourquoi au lieu d estimer la moyenne et la proportion d une manière ponctuelle (comme nous venons de le faire), on utilisera plutôt une estimation par intervalle de confiance. Cela signifie que la moyenne µ se trouvera entre x ME et x + ME, où ME est la marge d erreur sur la moyenne. On note alors que µ [ x ME, x + ME]. Cependant, déterminer la valeur de cette marge d erreur n est pas simple, surtout qu elle varie selon l échantillon utilisé. Nous aurons besoin d une théorie afin de pouvoir arriver à notre fin. Cette théorie est celle des probabilités et plus particulièrement de la Loi Normale. L idée générale, nous y reviendrons plus en profondeur plus tard, a été développer par Quételet pour expliquer le tour de poitrine des soldats anglais. Le principe est que si l on prend tous les échantillons de taille n possibles d une population très grande, alors la distribution des moyennes de tous ces échantillons suit une loi normale de moyenne 51

52 11. LA LOI NORMALE µ et d écart-type σ/ n. La figure 1 montre à quoi ressemble cette distribution. Les propriétés de cette distribution seront étudiées dans la prochaine section. Les propriétés de cette distribution seront étudiées µ dans la prochaine section. Fig. 1. Courbe Normale. Revenons à notre marge d erreur ME. Grâce à la distribution normale des moyennes de tous les échantillons de taille n, nous serons en mesure de déterminer ME. Il suffira de décider ce que l on appelle le Niveau de confiance que l on désire. Celui-ci correspond à la probabilité que la véritable moyenne de la population (de même pour la proportion) se trouve dans l intervalle de confiance. Habituellement, on prend un niveau de confiance soit de 95% ou de 99%. Ainsi, on sera en mesure de déterminer l intervalle de confiance. Regardons un exemple que l on recontre assez souvent est lors des élections. Exemple 11.1. Le parti Libéral obtiendrait 32% des voix, contre 28% pour le PQ et 26% pour l ADQ. La marge de d erreur de 2%, 19 fois sur 20. Cela signifie que les proportions de 19 échantillons sur 20 se trouvent dans la marge d erreur de 2%. Donc, le niveau de confiance choisit est de 95%, car 19/20 = 95%.

2. LA LOI NORMALE 53 Les prochaines sections servent à détailler les calculs et à les justifier. 2. La loi normale 2.1. Introduction. La loi normale de moyenne µ et d écart-type σ correspond à une courbe de Gauss d équation f(x) = 1 σ (x µ) 2 2π e 2σ 2. La loi normale possède quelques caractéristiques intéressantes. 1) Cette fonction est entièrement déterminée par µ et σ. 2) L aire sous la courbe est 1 et ce, pour toutes les valeurs de µ et de σ. 3) La courbe est symétrique par rapport à x = µ, c est-à-dire que l aire à gauche de x = µ est la même qu à droite. La deuxième propriété est sans doute la plus importante. C est elle qui nous permettra de faire une estimation de moyennes ou de proportions à l aide d un intervalle. C est également cette propriété qui nous permet de dire que la courbe normale est une fonction de densité de probabilité. Étudions maintenant une petite partie des probabilités afin d être en mesure de faire de l inférence statistique. Si une certaine variable X, dite variable aléatoire, obéit à une loi normale de moyenne µ et de variance σ 2, on note X N(µ, σ 2 ). Ici, nous sommes intéressés par la probabilité que X soit comprise entre deux valeurs x 1 et x 2. On note cette probabilité P(x 1 < X < x 2 ). La théorie des probabilités nous dit que P(x 1 < X < x 2 ) correspond à l aire de la région sous la courbe normale délimitée par x 1 et x 2. La figure 2 montre cette probabilité. 2.2. Loi normale centrée réduite. Il n existe cependant pas de formules pour calculer l aire sous la courbe. Nous devons utiliser une table où les aires y sont déjà déterminées. Par contre, cette table n est valide que pour la loi normale de moyenne 0 et de variance 1, notée N(0, 1). On appelle cette loi, loi normale centrée réduite. Cette table est présentée à la page 56. Avant d expliquer comment retrouver une loi normale centrée réduite à partir d une loi normale quelconque, examinons la façon d utiliser la table.

54 11. LA LOI NORMALE x 1 µ x 2 Fig. 2. Aire sous la courbe normale pour déterminer P(x 1 < X < x 2 ). important important important important important Il est à noter que P(0 < Z < z) = P(0 Z z). Cela signifie que l inégalité stricte et l inégalité correspond à la même valeur. Exemple 11.2. Si Z N(0, 1), trouvons a) P(0 < Z < 0.5) b) P( 1 < Z < 1) c) P( 0.5 < Z < 2) d) P(1.15 < Z < 3) a) Pour déterminer P(0 < Z < 0.5), il faut se servir de la table de loi normale. Celle-ci nous donne P(0 < Z < z). Dans cet exemple, z = 0.5. Ainsi, on n a qu à aller à la 6 e ligne et à la première colonne. Les lignes représentent la valeur de z à la première décimale et les colonnes correspond à la valeur de la deuxième décimale. On obtient donc que P(0 < Z < 0.5) = 0.1915. b) Puisque la table de loi normale donne la valeur valeur pour P(0 Z z), nous n avons pas accès directement à P( 1 < Z < 1). Il faut utiliser la propriété de symétrie de la courbe normale. Il est facile de voir à l aide d un dessin que P( 1 < Z < 1) = P( 1 < Z 0) + P(0 < Z < 1) Par la propriété de symétrie, on a que P( 1 < Z 0) = P(0 Z < 1).

Ainsi, 2. LA LOI NORMALE 55 P( 1 < Z < 1) = P( 1 < Z 0) + P(0 < Z < 1) = P(0 Z < 1) + P(0 < Z < 1) = 2P(0 Z < 1) Dans la table, on trouve que P(0 Z < 1) = 0.3413. D où, P( 1 < Z < 1) = 2 0.3413 = 0.6426. c) On utilise le même principe pour trouver P( 0.5 < Z < 2). Ainsi, P( 0.5 < Z < 2) = P( 0.5 < Z 0) + P(0 < Z < 2) = P(0 Z < 0.5) + P(0 < Z < 2) par symétrie = 0.1915 + 0.4772 = 0.6687 d) Pour ce cas, il faut user d astuces. La figure 3 montre la technique. Ainsi, = 0 1.15 3 0 3 0 1.15 Fig. 3. Calcul de P(1.15 < Z < 3). P(1.15 < Z < 3) = P(0 Z < 3) P(0 Z < 1.15) = 0.4987 0.3749 = 0.1238

56 11. LA LOI NORMALE La table donne l aire sous la courbe normale centrée réduite ce qui correspond à P(0 Z z). 0 z z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 Table de la loi normale.

2. LA LOI NORMALE 57 On est parfois intéressé par P(Z c) ou P(c < Z). Regardons comment on fait pour déterminer ces probabilités. Exemple 11.3. Soit Z N(0, 1). Trouver a) P(Z 0.21) b) P(Z > 0.21) Regardons comment trouver ces probabilités. a) Réécrivons P(Z 0.21). P(Z 0.21) = P(Z 0) + P(0 < Z < 0.21). On a que P(Z 0) = 0.5, car elle correspond à la moitié de l aire totale sous la courbe. Donc, P(Z 0.21) = 0.5 + P(0 < Z < 0.21) = 0.5 + 0.0832 = 0.5832. b) Ce cas est un peu différent. P(Z > 0.21) est l aire à droite de z = 0.21. Puisque l aire totale sous la courbe est 1, on a P(Z > 0.21) = 1 P(Z 0.21) = 1 0.5832 = 0.4168 On peut également poser la question dans l autre sens comme le montre l exempe suivant : Exemple 11.4. Soit Z N(0, 1). Trouver c tel que P( c Z c) = 0.9544 Puisque la courbe est symétrique, le problème revient à trouver c tel que P(0 Z c) = 0.9544/2 = 0.4772 On recherche 0.4772 dans la table et on obtient que c = 2. 2.3. La cote Z. Il est cependant rare qu un phénomène suit une loi normale de moyenne 0 et de variance 1. Il faut tout même être en mesure de déterminer des probabilités avec seulement l aide de la table de loi normale centrée réduite. Pour ce faire, nour devrons utiliser la cote Z d une variable X. Définition 11.1. Soit une variable aléatoire X N(µ, σ 2 ). La cote Z est définie comme suit : Z = X µ N(0, 1). σ

58 11. LA LOI NORMALE Puisque Z suit une loi normale N(0, 1), on peut déterminer des probabilités comme nous l avons fait dans la section précédente. Exemple 11.5. Soit X N(12, 25). Trouvons a) P(7 < X < 17) b) P(X 13) Tout d abord, il faut identifier µ et σ. Ici, µ = 12 et σ = 25 = 5. Par la suite, on peut déterminer les probabilités. a) On doit tout d abord écrire la cote Z de X. Ainsi, 7 µ P(7 < X < 17) = P < X µ < 17 µ σ σ σ 7 12 = P < X 12 17 12 < 5 5 5 = P ( 1 < Z < 1) = 2P(0 Z < 1) = 0.6426 b) Nous devons effectuer le même processus pour déterminer P(X 13). X µ P(X 13) = P 13 µ σ σ X 12 13 12 = P 5 5 = P(Z 0.2) = 1 P(Z < 0.2) = 1 (0.5 + P(0 Z 0.2)) = 1 (0.5 + 0.0793) = 1 0.5793 = 0.4207 Il est intéressant d interpréter les résultats obtenus. Par exemple, on a trouvé que P(X 13) = 0.4207. Cela signifie que 42.07% des données de la distribution de X sont supérieures à 13. On a donc qu environ 58% des données sont inférieures à 13. On peut donc dire que le rang centile de 13 est 58, c est-à-dire R 100 (13) = 58.

3. DISTRUBUTION DES MOYENNES DES ÉCHANTILLONS 59 3. Distrubution des moyennes des échantillons Nous sommes maintenant intéressés à étudier la distribution des moyennes de tous les échantillons de taille n d une population de taille N. Cette théorie nécessite un peu de notation. C est pourquoi nous vous référons à l annexe A afin de bien comprendre chacun des symboles. Afin de bien comprendre le principe, nous l expliquerons avec un exemple. Supposons que nous avons une population de taille 1000 et que nous cherchons à connaître la moyenne d une certaine variable X. Alors, on choisit un échantillon au hasard de taille 100 que l on note E 1. Cet échantillon nous donne une certaine moyenne X 1 et un écart-type s 1. Nous recommençons le processus afin d obtenir un deuxième échantillon E 2 qui possède une moyenne X 2 et un écart-type s 2. Ainsi de suite, nous effectuons ce procédé k fois. Regardons ce qui ce produit avec la distribution des X i. Ici, nous avons pris au hasard 1000 chiffres entre 0 et 1 (la population) et par la suite nous avons pris quelques échantillons de taille 100 au hasard et tracer l histogramme de la fréquence des moyennes des échantillons. La figure 4 montre ces histogrammes. On remarque que lorsque nous augmentons le nombre de données, c est-à-dire le nombre de moyennes de divers échantillons, la distribution semble suivre une certaine loi normale. C est effectivement le cas. Le théorème suivant provient de la théorie des probabilités. On le tiendra pour acquis. Théorème 11.1. Soit X une variable aléatoire telle que dont la moyenne de la population est µ et l écart-type est σ. On a que 1) si X N(µ, σ 2 ), alors X N µ, σ2 n 2) si X est d une distribution quelconque et si n 30, alors X N µ, σ2. n En d autres termes, si la taille des échantillons choisis d une manière aléatoire est plus grande que 30, on a que la distribution des moyennes de tous les échantillons suit une loi normale de moyenne µ X = µ et d écart-type σ X = σ/ n.,

60 11. LA LOI NORMALE Fréquence 18 16 14 12 10 8 6 4 2 0 0 0.2 0.4 0.6 0.8 1 Xb (a) Avec k = 100 Fréquence 40 35 30 25 20 15 10 5 0 0 0.2 0.4 0.6 0.8 1 Xb (b) Avec k = 200 Fréqucnce 50 45 40 35 30 25 20 15 10 5 0 0 0.2 0.4 0.6 0.8 1 Xb (c) Avec k = 300 Fréquence 60 50 40 30 20 10 0 0 0.2 0.4 0.6 0.8 1 Xb (d) Avec k = 400 Fig. 4. Distribution des moyennes pour différents nombres d échantillons. Vérifions ces dires avec l exemple précédent. On a calculé la moyenne et l écart-type de cette population. Ainsi, µ = 0.5021 σ = 0.2740. Étudions la suite des moyennes des échantillons pour différents k, c està-dire différents nombres d échantillons. On remarque que plus il y a k Moyenne écart-type 100 0.5077 0.0286 200 0.5036 0.0268 300 0.5033 0.0283 400 0.5026 0.0285 d échantillons, plus la moyenne des moyennes se rapproche de µ. Pour ce qui est de l écart-type, on sait que σ X = σ/ n = 0.2740/ 100 =

3. DISTRUBUTION DES MOYENNES DES ÉCHANTILLONS 61 0.0274. On remarque également qu on est autour. Pour obtenir exactement µ X et σ X, il faut faire les calculs pour tous les échantillons de taille 100 possible. Ceci est quasiment impossible. Le nombre de ces échantillons n est même pas calculable avec mon ordinateur. Par exemple, si la population est 100 et que l on prend des échantillons de taille 20, il y a 535983370403809590000 échantillons possible.

ANNEXE A Notation Symboles Signification Exemples X Caractère étudié dans la population Âge d un étudiant µ Moyenne du caractère étudié dans la population Âge moyen de tous les étudiants σ Écart-type du caractère étudié dans la population Écart-type de l âge de tous les étudiants x Moyenne d un échantillon choisi dans la population Âge moyen des étudiants de votre groupe s Écart-type d un échantillon choisi dans la population groupe Écart-type de l âge des étudiants de votre Moyenne échantillonnale du caractère étudié Âge moyen d un échantillon aléatoire de taille X dans la population 100 choisi parmi tous les étudiants µ X Moyenne des moyennes Moyenne des moyennes des âges de tous les de tous les échantillons aléatoires de taille échantillons possibles de 100 étudiants. n. µ X = µ σ X π p P Écart-type des moyennes de tous les échantillons aléatoires de taille n. Proportion des individus de la population possédant une caractéristique Proportion des individus d un échantillon possédant une caractéristique Proportion échantillonnale des individus ossédant une caractéristique µ P Moyenne des proportions de tous les échantillons aléatoires possibles de taille n. µ P = π σ P Écart-type des proportions de tous les échantillons aléatoires possibles de taille n. Écart-type des moyennes des âges de tous les échantillons possibles de 100 étudiants. Proportion de fumeurs parmi tous les étudiants Proportion de fumeurs parmi les étudiants de la classe Proportion de fumeurs d un échantillon aléatoire de 100 étudiants Moyenne des proportions de fumeurs de tous les échantillons aléatoires possibles de 100 étudiants. Écart-type des proportions de fumeurs de tous les échantillons aléatoires possibles de 100 étudiants. 63