2 Variables aléatoires indépendantes

Documents pareils
Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

STATISTIQUE : TESTS D HYPOTHESES

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

1 Mesure et intégrale

SÉRIES STATISTIQUES À DEUX VARIABLES

Limites des Suites numériques

Chapitre 3 : Fonctions d une variable réelle (1)

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Séquence 5. La fonction logarithme népérien. Sommaire

Les Nombres Parfaits.

Processus et martingales en temps continu

Cours de Statistiques inférentielles

CHAPITRE 2 SÉRIES ENTIÈRES

Dénombrement. Chapitre Enoncés des exercices

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

EXERCICES : DÉNOMBREMENT

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Statistique descriptive bidimensionnelle

STATISTIQUE AVANCÉE : MÉTHODES

Comportement d'une suite

Etude de la fonction ζ de Riemann

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

55 - EXEMPLES D UTILISATION DU TABLEUR.

Probabilités et statistique pour le CAPES

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

14 Chapitre 14. Théorème du point fixe

Séries réelles ou complexes

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Cours 5 : ESTIMATION PONCTUELLE

20. Algorithmique & Mathématiques

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Statistique Numérique et Analyse des Données

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Terminale S. Terminale S 1 F. Laroche

c. Calcul pour une évolution d une proportion entre deux années non consécutives

4 Approximation des fonctions

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Processus géométrique généralisé et applications en fiabilité

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Principes et Méthodes Statistiques

Suites et séries de fonctions

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Baccalauréat S Asie 19 juin 2014 Corrigé

Exercices de mathématiques

Université Pierre et Marie Curie. Biostatistique PACES - UE

Chap. 5 : Les intérêts (Les calculs financiers)

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Module 3 : Inversion de matrices

2 ième partie : MATHÉMATIQUES FINANCIÈRES

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

MESURE DE L'INFORMATION

Des résultats d irrationalité pour deux fonctions particulières

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

Chapitre 3 : Transistor bipolaire à jonction

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Introduction : Mesures et espaces de probabilités

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Initiation à l analyse factorielle des correspondances

Les algorithmes de tri

Chaînes de Markov. Arthur Charpentier

Contribution à la théorie des entiers friables

Formation d un ester à partir d un acide et d un alcool

Gérer les applications

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

DETERMINANTS. a b et a'

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Échantillonnage et estimation

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Lorsque la sécurisation des paiements par carte bancaire sur Internet conduit à une concurrence entre les banques et les opérateurs de réseau

Télé OPTIK. Plus spectaculaire que jamais.

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Nous imprimons ce que vous aimez!

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

2. Commerce international et emploi informel en zone CEMAC

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Risque de longévité et détermination du besoin en capital : travaux en cours

LE WMS EXPERT DE LA SUPPLY CHAIN DE DÉTAIL

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

S-PENSION. Constituez-vous un capital retraite complémentaire pour demain tout en bénéficiant d avantages fiscaux dès aujourd hui.

Transcription:

-stat_ii.b 7 Variables aléatoires idépedates. Variables idépedates Exemple de deux variables idépedates O lace quatre fois ue pièce de moaie. O ote X = ombre de piles obteus lors des deux premiers lacers, Y = ombre de piles obteus lors des deux deriers lacers. Ituitivemet, les valeurs de Y e sot pas "ifluecées" par les résultats de X. Les variables X et Y sot idépedates. Nous aimerios caractériser la situatio par ue relatio mathématique. Représetos les différetes issues possibles pedat le déroulemet des quatre lacers de la pièce de moaie. A chaque lacer, il y a deux possibilités qu'o peut représeter par u embrachemet. Chaque évéemet situé à l'extrémité d'ue brache (tout e bas) a ue chace sur 6 de se produire. Doc px, Y 6 px, Y 6 px, Y 0 6 px, Y 6

-stat_ii.b px, Y 4 6 px, Y 0 6 px 0, Y 6 px 0, Y 6 px 0, Y 0 6 Avec les résultats précédets, dressos u tableau des probabilités X0 Y0 Y Y 6 X X 6 4 6 6 Y 0 4 3 6 px,y 6 0 0 X Nous complétos le tableau précédet par les sommes de chaque lige et de chaque coloe

-stat_ii.b 9 X0 Y0 Y Y 6 X X 6 4 6 6 p X 0 4 p X p X 4 p Y 0 4 p Y p Y 4 p X 0 = px = 0, - désige la probabilité que X = 0, la variable Y preat toutes les valeurs possibles. p X 0 = px = 0, - est égale à la somme de la première lige du tableau : p X 0 px 0, px 0, Y 0 px 0, Y px 0, Y 6 6 4 p Y = p-, Y = désige la probabilité que Y =, la variable X preat toutes les valeurs possibles. p Y = p-, Y = est égale à la somme de la deuxième coloe du tableau : p Y p, Y px 0, Y px, Y px, Y 4 Les ombres p X i sot les probabilités de la distributio margiale X, c'est-à-dire qui se rapportet à la première composate de la variable aléatoire à deux dimesios Z = X = i, -, la variable Y preat toutes les valeurs possibles. Les ombres p Y j sot les probabilités de la distributio margiale Y, c'est-à-dire qui se rapportet à la deuxième composate de la variable aléatoire à deux dimesios Z = -, Y = j, la variable X preat toutes les valeurs possibles. A quoi correspod le produit des probabilités margiales? p X 0p Y 0 4 4 6 px 0, Y 0 p X 0p Y 4 px 0, Y etc. Das le tableau des probabilités, la propriété s'exprime comme suit: pour des variables idépedates, la probabilité d'u évéemet est égale au produit des probabilités margiales: X0 4 X X 4 Y0 Y Y 4 4 4 4 4 4 4 4 4 4 O a la propriété caractéristique suivate: X, Y idépedates pour tous les couples i, j px i, Y j p X ip Y j

-stat_ii.b 0 Exemple de deux variables o idépedates O lace trois fois ue pièce de moaie. O ote X = ombre de piles obteus lors des deux premiers lacers, Y = ombre de piles obteus lors des deux deriers lacers. Ituitivemet, les valeurs de Y sot "ifluecées" par les résultats de X. Par exemple, si X = 0, il est impossible que Y = ; ou ecore, si X =, il est impossible que Y = 0. Les variables X et Y e sot pas idépedates. Nous aimerios caractériser la situatio par ue relatio mathématique. Représetos les différetes issues possibles pedat le déroulemet des trois lacers de la pièce de moaie. A chaque lacer, il y a deux possibilités qu'o peut représeter par u embrachemet. pile face X X X X0 X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y,,,,0,, 0, 0,0 Chaque évéemet situé à l'extrémité d'ue brache (tout e bas) a ue chace sur de se produire. Doc

-stat_ii.b px, Y px, Y px, Y 0 0 px, Y px, Y px, Y 0 px 0, Y 0 px 0, Y px 0, Y 0 Avec les résultats précédets, dressos u tableau des probabilités Y0 Y Y X0 0 X 4 X 0 Complétos le tableau précédet par les sommes de chaque lige et de chaque coloe Y0 Y Y X0 0 p X 0 4 X 4 p X X 0 p X 4 p Y 0 4 p Y p Y 4 p X 0 = px = 0, - désige la probabilité que X = 0, la variable Y preat toutes les valeurs possibles. p X 0 = px = 0, - est égale à la somme de la première lige du tableau : p X 0 px 0, px 0, Y 0 px 0, Y px 0, Y 0 4 p y = p-, Y = désige la probabilité que Y =, la variable X preat toutes les valeurs possibles. p Y = p-, Y = est égale à la somme de la deuxième coloe du tableau : p Y p, Y px 0, Y px, Y px, Y 4 Les ombres p X i sot les probabilités de la distributio margiale X, c'est-à-dire qui se rapportet à la première composate de la variable aléatoire à deux dimesios Z = X = i, -, la variable Y preat toutes les valeurs possibles.

-stat_ii.b Les ombres p Y j sot les probabilités de la distributio margiale Y, c'est-à-dire qui se rapportet à la deuxième composate de la variable aléatoire à deux dimesios Z = -, Y = j, la variable X preat toutes les valeurs possibles. Le tableau des probabilités e possède pas la propriété la probabilité d'u évéemet est égale au produit des probabilités margiales p X 0p Y 0 4 4 6 px 0, Y 0 p X 0p Y 4 4 0 px 0, Y 6... Le tableau des produits des probabilités margiales diffère du tableau des probabilités: X0 4 X X 4 Y0 Y Y 4 4 4 4 4 4 4 4 4 4 Le fait que les deux variables e soiet pas idépedates se traduit par la propriété caractéristique suivate: px i, Y j p X ip Y j pour au mois u couple i, j Défiitio de deux variables idépedates Das le cas de deux variables discrètes X, Y, o défiit les probabilités margiales comme suit: p X x i px x i, px x i, Y y k p Y y j p, Y y j px x r, Y y j k r Le fait que les deux variables X et Y soiet idépedates se traduit par la propriété caractéristique suivate: la probabilité d'u évéemet est égale au produit des probabilités margiales E d'autres termes, X, Y idépedates pour tous les couples i, j px x i, Y y j p X x i p Y y j px x i, Y y j px x i, Y y k px x r, Y y j k r. EX Y = EX EY Exemple O lace quatre fois ue pièce de moaie. O ote X = ombre de piles obteus lors des deux premiers lacers, Y = ombre de piles obteus lors des deux deriers lacers. Avec les valeurs calculées das le., o a

-stat_ii.b 3 O a EY EX 0 p X 0 p X p X 0 4 4 E X Y 0 0 px 0, Y 0 0 px 0, Y 0 px, Y 0 px, Y 0 px 0, Y 0 px, Y 0 px, Y px, Y px, Y 0 0 0 4 0 0 6 EX Y EX EY Cas gééral Propositio X, Y idépedates EX Y EX EY E mots : Pour des variables aléatoires idépedates, l' espérace du produit est égale au produit des espéraces Démostratio pour des variables aléatoires discrètes EX Y x i y j px x i, Y y j x i y j p X x i p Y y j i j i j x i p X x i y j p Y y j x i p X x i y j p Y y j i j i j EX EY La propositio est valide pour des variables aléatoires quelcoques, e particulier cotiues..3 VX + Y = VX + VY s X +Y = s X +s Y Exemple O lace quatre fois ue pièce de moaie. O ote X = ombre de piles obteus lors des deux premiers lacers, Y = ombre de piles obteus lors des deux deriers lacers. Avec les valeurs calculées das les paragraphes. et., o a EY EX E X Y EX EY VY VX 0 4 4

-stat_ii.b 4 VX Y 0 0 px 0, Y 0 0 px 0, Y 0 px, Y 0 px, Y 0 px 0, Y 0 px, Y 0 px, Y px, Y px, Y 4 6 0 4 0 6 0 6 4 6 Pour deux variables idépedates, o a VX Y VX VY Cas gééral Démostratio : faisos appel aux règles coues VX Y EX Y EX Y EX XYY EX EY EX EX Y EY E X EX EY E Y EX E X EY E Y EX Y EX EY VX VY 0 VX VY O a démotré la propositio X, Y idépedates VX Y VX VY E mots : E d'autres termes, Pour des variables aléatoires idépedates, la variace de la somme est égale à la somme des variaces XY X Y doc, pour l'écart-type de la somme, X, Y idépedates XY X Y Comparaiso des variaces empirique s x + y et s x + s y Partos de variables aléatoires idépedates. Par exemple, pour les variables aléatoires X =lacer d'ue pièce de moaie (covetio 0 = pile, = face); Y =lacer d'u dé; Z = X, Y = lacer ue pièce de moaie et u dé (variable de dimesio ) ; o a obteu, e répétat 0 épreuves idépedates de la variable Z, les échatillos suivats Needs"Statistique`" piece BeroulliDistributio ; de DiscreteUiformDistributio, 6; 0;

-stat_ii.b 5 x RadomItegerpiece,,,, 0, 0,,, 0, 0, y RadomItegerde,, 3, 6, 4,, 6, 5,, 6, 5 NVariaceMLEx y 3.4 NVariaceMLEx VariaceMLEy 3.44 Ce que les variables aléatoires réaliset exactemet das u modèle théorique idéal VX Y VX VY les échatillos empiriques de variables idépedates e le réaliset qu'approximativemet s x y s x s y Les échatillos de grade taille ot u comportemet plus proche du modèle théorique 00 000; x RadomItegerpiece, ; y RadomItegerde, ; NVariaceMLEx y 3.66 NVariaceMLEx VariaceMLEy 3.654 Exercice.3 - a) Soiet X et Y deux variables aléatoires cotiues uiformémet distribuées sur l'itervalle 0, [. Par simulatio, formez deux échatillos de même taille : x pour X, y pour Y. Calculez et comparez mx y, mx my aisi que vx y, vx vy b) Soit (X, Y) ue paire de variables aléatoires défiie comme suit : X est cotiue uiformémet distribuée sur l'itervalle 0, [ et Y = uif. distr. sur 0; 0.5 si X < uif. distr. sur, si X. Par simulatio, formez u échatillo x, y = x, y, x, y,... de taille. Calculez et comparez aisi que mx y, mx my

-stat_ii.b 6 vx y, vx vy c) Expliquez pourquoi o obtiet des quatités approximativemet égales das la situatio a) et des quatités différetes das la situatio b). Exercice.3 - Soiet X et X deux variables aléatoires idépedates. La distributio de X est ormale, d'espérace m = 0, d'écart-type s = 3. La distributio de X est ormale, d'espérace m = 0, d'écart-type s = 4. Au moye d'ue simulatio, estimez la moyee m et l'écart-type s de la somme Y = X + X. Comparez les résultats de la simulatio avec les paramètres théoriques m et s. Exercice.3-3 Soiet X, X,..., X des variables de Beroulli idépedates de même probabilité p et S = X + X +... + X la variable biomiale (, p). Calculez l'écart-type théorique s S..4 Espérace et écart-type de la moyee Exemple itroductif O lace ue pièce de moaie et o compte le ombre de "face". Das le modèle théorique, otos X le ombre de "face" e u lacer, à savoir : X = 0 avec prob., avec prob. M 0 le ombre moye de "face" pour 0 lacers; M 000 le ombre moye de "face" pour 000 lacers. Nous allos comparer les valeurs théoriques à celles obteues par des simulatios. Pour géérer ue moyee de lacers, o divise par la variable biomiale,. Ue expériece cosistat à lacer fois ue pièce, gééros u échatillo de k expérieces: Needs"Statistique`" som : BiomialDistributio, ; echat, k : N RadomItegersom, k; Le ombre moye de "face" e 0 lacers est ue variable aléatoire M 0 dot o peut cosidérer u échatillo de taille 50 e0 echat0, 50 0.4, 0.7, 0.6, 0.7, 0.5, 0.4, 0.4, 0.7, 0.4, 0.3, 0.4, 0.4, 0.7, 0.5, 0.5, 0., 0.6, 0.4, 0.4, 0.6, 0.3, 0.4, 0.6, 0., 0.6, 0.5, 0.4, 0.7, 0.9, 0.4, 0.5, 0.3, 0.6, 0.4, 0.5, 0.6, 0.6, 0.6, 0.6, 0.4, 0.5, 0.6, 0.4, 0.6, 0.7, 0.3, 0.7, 0.7, 0.7, 0.7 m0 Meae0 0.54

-stat_ii.b 7 s0 StadardDeviatioMLEe0 0.46969 Le ombre moye de "face" e 000 lacers est ue variable aléatoire M 000 dot o peut cosidérer u échatillo de taille 50 e000 echat000, 50 0.503, 0.49, 0.56, 0.45, 0.59, 0.497, 0.475, 0.5, 0.506, 0.56, 0.5, 0.49, 0.57, 0.59, 0.496, 0.496, 0.4, 0.5, 0.5, 0.494, 0.494, 0.50, 0.5, 0.4, 0.47, 0.5, 0.4, 0.49, 0.49, 0.454, 0.496, 0.4, 0.479, 0.505, 0.43, 0.5, 0.503, 0.5, 0.4, 0.49, 0.50, 0.533, 0.49, 0.54, 0.495, 0.55, 0.45, 0.5, 0.47, 0.50 O remarquera que les moyees sot mois fluctuates avec 000 lacers qu'avec 0. E d'autres termes, l'écart-type de la moyee est plus petit pour 000 lacers que pour 0 lacers. m000 Meae000 0.499 s000 StadardDeviatioMLEe000 0.0577 O pourra observer que * les valeurs moyees de X, M 0 et M 000 sot comparables (eviro ); * l'écart-type avec 000 lacers vaut eviro de l'écart-type avec 0 lacers. 0 Ce paragraphe se propose d'expliquer pourquoi. Nous motreros que, pour ue moyee comptat 00 fois plus de termes, 000 00 0 où 000 VM 000 et 0 VM 0 Espérace et écart-type de la moyee Cosidéros la moyee M de variables aléatoires idépedates X, X,..., X de même espérace m=ex =...= EX et de même écart-type s = VX =...= VX M X X... X M est ue variable aléatoire. L'espérace mathématique de M est calculée avec les propriétés coues EM E X X... X EX EX... EX... La variace de M est calculée avec les propriétés précédemmet établies VM V X X... X VX VX... VX... L'écart-type théorique de M est

-stat_ii.b M SM VM Reteos les formules suivates qui sot valables, e particulier, pour des épreuves répétées idépedates (m et s désiget l'espérace et l'écart-type d'ue épreuve, le ombre d'épreuves et M la variable aléatoire "moyee des épreuves"): EM VM E d'autres termes, pour l'écart-type de la moyee s M = VM, o a M Retour à l'exemple itroductif Nous pouvos maiteat expliquer pourquoi l'écart-type avec 000 lacers vaut eviro de l'écart-type avec 0 0 lacers 000 000 0 0 0 0 où 000 VM 000 et 0 VM 0 Plus gééralemet, pour gager u chiffre caractéristique sur la précisio de la moyee (c'est-à-dire pour réduire l'écart-type d'u facteur ), il faut predre u échatillo de taille o pas 0 fois plus grade mais 00 fois plus 0 grade! Exemple Laços fois ue pièce de moaie. Le jet uméro j est modélisé par la variable aléatoire X j X j = 0 (pile) avec probabilité X j = (face) avec probabilité dot l'espérace mathématique est m=ex k = 0 μ + μ = et dot l'écart-type théorique est s= 0 - + - Ces variables sot idépedates. = La moyee M des variables représete le ombre moye de "face" obteu avec les jets. M est ue variable aléatoire qui vérifie EM M

-stat_ii.b 9.5 Estimateurs o biaisés Exemple itroductif O lace trois fois ue pièce de moaie et o compte le ombre moye de "face". A partir d'expérieces, o veut estimer la moyee et l'écart-type d'u lacer. Needs"Statistique`" piece BeroulliDistributio ; Ue observatio doe, par exemple, obs RadomItegerpiece, 3 0, 0, m3 Meaobs 3 v3 VariaceMLEobs 9 Etat doé que les résultats précédets sot très fluctuats, orgaisos ue série d'observatios et faisos leur moyee: 000; obs TableRadomItegerpiece, 3, ; mobs MapMea, obs; m3m NMeamObs 0.505333 vobs MapVariaceMLE, obs; v3m NMeavObs 0.69 Comparos avec les valeurs théoriques. Nous partos de trois variables aléatoires idépedates : X j = 0 avec prob., j =,, 3, dot ous formos la moyee M avec prob. 3 = X 3 + X + X 3. Nous ous demados si les paramètres empiriques de M 3 costituet ue estimatio raisoable des paramètres théoriques de X j. Plus précisémet, ous allos comparer * la moyee empirique de trois observatios m 3 = mm 3 et l'espérace d'u jet m =EX j ; * l'écart-type empirique de trois observatios v 3 = vm 3 et l'écart-type théorique d'u jet s = VX j. EX j VX j 4 0.5 voir Statistique I, Exercice 3.

-stat_ii.b 0 La comparaiso de m 3 et m doe bie le résultat attedu : m 3 Par cotre, v 3 et s sot très différets. La raiso est qu'il faudrait calculer o pas v s i x i m où m est la moyee empirique, mais plutôt x i i où m est l'espérace mathématique. Vérifios-le sur l'exemple précédet: vcorx, x, x3 : 3 x x x3 ; vobscor MapvCor, obs; v3cor NMeavObsCor 0.5 Nous avos démotré, das Statistique I, exercice 4. -, que la valeur de t pour laquelle la foctio suivate est miimale t # i x i t est la moyee arithmétique t = m. C'est pourquoi si, das l'expressio i x i, o remplace m par m, o obtiet ue valeur trop petite. O dit que s est u estimateur biaisé de s. Das ce paragraphe, ous motreros qu'ue estimatio sas biais de s est 3 s ; umériquemet, 3 v3m 0.53667 Hypothèses O cosidère maiteat u échatillo doé de taille x, x,..., x auquel correspodet, das le modèle théorique, variables aléatoires idépedates idetiquemet distribuées X, X,..., X de même espérace m et de même écart-type s. Remarquez que, das le cas où l'o extrait d'ue populatio fiie u échatillo o exhaustif par u tirage sas remise, otre hypothèse 'est pas vérifiée. Estimateur de l'espérace mathématique A la moyee empirique m mx x x... x

-stat_ii.b correspod, das le modèle théorique, la variable aléatoire M X X... X D'ue part, puisque les variables sot idépedates et idetiquemet distribuées, EM E X X... X EX EX... EX D'autre part, m état ue réalisatio de la variable aléatoire M, o a Em EM ce qui motre que m est u estimateur sas biais de l'espérace mathématique de M. Nous otos EM m Calculos EM. D'après les règles de calcul EM EX k pour k,,..., Fialemet, m est u estimateur o biaisé de l'espérace mathématique de chaque épreuve X k : m Estimateur sas biais de l'écart-type théorique A la variace empirique s s x mx mx correspod la variable aléatoire Z X X... X M s est ue réalisatio de la variable aléatoire Z. Puisque Es = EZ, s est u estimateur sas biais de l'espérace mathématique de Z, ce qui se ote EZ s Calculos EZ. D'après les propriétés de Statistique I, 3.4, o a EZ E X X... X M EX EX... EX EM Das l'expressio précédete, détermios EX i et EM VX i EX i EX i EX i VX i EX i VM EM EM EM VM EM puis effectuos la substitutio

-stat_ii.b EZ EX EX... EX EM O dit que s est u estimateur biaisé de s parce que à s correspod la variable aléatoire Z dot l'espérace mathématique diffère de s. Pour obteir u estimateur sas biais, o utilise la relatio EZ Fialemet, s est u estimateur o biaisé de la variace théorique de chaque épreuve X i : s Par suite, s est u estimateur o biaisé de l'écart-type théorique de chaque épreuve X i: s C'est aisi que se justifie la formule de l'écart-type corrigé que l'o utilise pour les échatillos de petite taille s x m x m... x m x m x m... x m La correctio cosiste à remplacer par - : x m x m... x m Avec Mathematica, la foctio à utiliser 'est pas StadardDeviatioMLE mais? StadardDeviatio StadardDeviatiolist gives the stadard deviatio of the elemets i list. StadardDeviatiodist gives the stadard deviatio of the symbolic distributio dist. à O remarquera que, pour des échatillos de grade taille, la correctio est égligeable. Aisi, pour = 00, o a >.005 Repreos l'exemple itroductif: vcorobs MapVariace, obs; vcor3m NMeavCorObs 0.53667

-stat_ii.b 3 Exercice.5 - Pour = 5, par ue simulatio, estimez s = écart-type de la distributio biomiale 5,. Comparez avec l'écart-type théorique s = p- p (selo l'exercice.3-3)..6 Cetral limit theorem Exercice -6- (Exercice de révisio; voir Statistique I, exercice 4. - 3) a) Cosidéros maiteat le ombre moye de six obteus e laçat 00 fois le dé. Cette variable aléatoire, désigée par M 00, est ue distributio biomiale. [Avec Mathematica] Tracez so diagramme à bâtos. Comparez avec la distributio ormale. Remarque : E gééral, o e peut pas superposer u diagramme de fréqueces et u diagramme de desité sauf das le cas particulier où tous les bâtos peuvet être iterprétés comme des barres de largeur. b) Effectuos maiteat ue simulatio de M 00. [Avec Mathematica] O demade de - costruire u échatillo de taille ; - grouper les doées e les traitat comme ue variable cotiue; - superposer l'histogramme et la distributio ormale. Problématique Nous savos déjà que, si les variables que l'o somme sot de Beroulli, idépedates et idetiquemet distribuées, alors leur somme est ue variable biomiale S, dot la moyee est M = S, qui est doc voisie d'ue distributio ormale. Qu'e est-il si la distributio des variables de départ 'est pas de Beroulli? Cosidéros la moyee M de variables aléatoires idetiquemet distribuées, d'espérace mathématique m et d'écarttype s. Nous supposos que les variables obéisset à ue distributio quelcoque et que est ue costate etière pas trop petite. Nous savos déjà que l'espérace mathématique de M est m et que l'écart-type de M est s M = s. Mais que peut-o dire de la distributio de M? Il pourrait d'abord ous sembler que la distributio de M dépede de la distributio des variables participat à la moyee. Fort étoammet, pour de grades valeurs de, la distributio de M est voisie d'ue distributio ormale quelle que soit la distributio des variables dot o fait la moyee. Comme exemple, cosidéros la moyee de variables cotiues idetiquemet distribuées. Distributio cotiue uiforme distr UiformDistributio0, ; La moyee de la distributio uiforme est la valeur cetrale: Meadistr Comme ous l'avos étudié das Statistique I, 4.,

-stat_ii.b 4 StadardDeviatiodistr 3 N 0.675 Moyee de 7 variables idetiquemet distribuées Statistique` M : MeaRadomRealdistr, 7 TableM, 0 0.533636, 0.500779, 0.3456, 0.39633, 0.493, 0.36705, 0.433, 0.54704, 0.6565, 0.5567, 0.6634, 0.54534, 0.4645, 0.543, 0.47443, 0.399095, 0.396, 0.60, 0.5965, 0.570 La moyee est ue variable aléatoire dot o peut calculer la moyee et l'écart-type (moyee des moyees, écarttype des moyees): 4000; x TableM, ; mm Meax 0.5074 sm StadardDeviatioMLEx 0.05 Comparaiso avec la valeur théorique m N 7 0.0909 Pour effectuer ue descriptio statistique, choisissos u itervalle proche de m - 3 s, m + 3 s et partageos-le e 9 classes comme suit u Rage 3 0, 3 0, 6 0 9 5, 4 5, 3, 5, 7 5, 5, 3 5, 3, 5, 4 5 effectifs BiCoutsx, u 47, 94, 476, 73, 94,, 46, 0, 5 freq effectifs 47 4000, 97 000, 9 000, 73 4000, 457 000, 07 000, 43 000, 0 4000, 9 000

-stat_ii.b 5 g histogrammeu, freq orm NormalDistributio, m; g PlotPDForm, t, t, 0.`, 0.9`, PlotStyle Black, Thick 3.5 3.0.5.0.5.0 0.5 0.4 0.6 0. Showg, g, AxesLabel Noe, "Desité" Coclusio: O peut observer que la moyee arithmétique de 7 variables est approximativemet ormale. Pourtat, la distributio des 7 variables de départ est très loi d'être ormale puisqu'elle est uiformémet distribuée sur 0,.

-stat_ii.b 6 Cetral limit theorem Le résultat précédet est gééralisable : la distributio ormale est ue distributio particulière vers laquelle tedet toutes les moyees. Le cetral limit theorem ous l'éoce plus précisémet. Hypothèses: A partir de variables aléatoires idépedates idetiquemet distribuées X, X,..., X, d'espérace m=ex =...= EX et d'écart-type s = VX =...= VX, o forme ue ouvelle variable aléatoire M = X + X +... + X. Coclusio: Pour tedat vers l'ifii, la distributio de M ted, e probabilité, vers la distributio ormale de moyee m et d'écart-type s M = s. La démostratio du cetral limit theorem relève du iveau uiversitaire. Applicatio à la simulatio : estimatio de l'erreur Rappel E accord avec les résultats de Statistique I, 4, la distributio ormale de moyee m et d'écart-type s M possède les propriétés suivates l'itervalle m -s M, m+s M cotiet eviro 6.3 % des observatios; l'itervalle m - s M, m+ s M cotiet eviro 95.5 % des observatios; l'itervalle m -3 s M, m+3 s M cotiet eviro 99.7 % des observatios; Coséquece: Pour de grades valeurs de, la moyee empirique de tirages idépedats a ue distributio approximativemet s ormale. E otat m la moyee empirique, s l'écart-type empirique et s M = l'estimatio de s M, ous auros approximativemet la probabilité que l'itervalle m -s M, m +sm cotiee m est de 6.3 % eviro; la probabilité que l'itervalle m - s M, m + sm cotiee m est de 95.5 % eviro; la probabilité que l'itervalle m - 3 s M, m + 3 sm cotiee m est de 99.7 % eviro. - Justificatio: Das la relatio suivate, o peut échager les rôles de m et m. s M est estimé par m M, M M m M M m M M m M M m M m M m M m M, m M M sm s s Pour des valeurs de pas trop petites, l'approximatio s M > s M est légitime. Par suite m M, M approx m M, m M

-stat_ii.b 7 Le cetral limit theorem ous fourit aisi ue estimatio de l'erreur dot ous tireros profit das le chapitre Simulatio.