Statistiques inférentielles. Introduction. Exemples. Définition (Échantillon aléatoire) Définition (Statistique inférentielle) Exemple 1.

Documents pareils
STATISTIQUE : TESTS D HYPOTHESES

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Principes et Méthodes Statistiques

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Cours 5 : ESTIMATION PONCTUELLE

Échantillonnage et estimation

Cours de Statistiques inférentielles

Les nouveaux relevés de compte

Dénombrement. Chapitre Enoncés des exercices

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Limites des Suites numériques

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Module 3 : Inversion de matrices

STATISTIQUE AVANCÉE : MÉTHODES

Formation d un ester à partir d un acide et d un alcool

Université Pierre et Marie Curie. Biostatistique PACES - UE

SÉRIES STATISTIQUES À DEUX VARIABLES

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Initiation à l analyse factorielle des correspondances

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

55 - EXEMPLES D UTILISATION DU TABLEUR.

Les Nombres Parfaits.

Statistique Numérique et Analyse des Données

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Comportement d'une suite

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Processus et martingales en temps continu

Processus géométrique généralisé et applications en fiabilité

Chapitre 3 : Transistor bipolaire à jonction

EXERCICES : DÉNOMBREMENT

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Statistique descriptive bidimensionnelle

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Compte Sélect Banque Manuvie Guide du débutant

Risque de longévité et détermination du besoin en capital : travaux en cours

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Chap. 5 : Les intérêts (Les calculs financiers)

Chapitre 3 : Fonctions d une variable réelle (1)

Probabilités et statistique pour le CAPES

Baccalauréat S Asie 19 juin 2014 Corrigé

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Nous imprimons ce que vous aimez!

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Suites et séries de fonctions

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

LE WMS EXPERT DE LA SUPPLY CHAIN DE DÉTAIL

Comment les Canadiens classent-ils leur système de soins de santé?

Exercices de mathématiques

20. Algorithmique & Mathématiques

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

La maladie rénale chronique

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Simulations interactives de convertisseurs en électronique de puissance

Chaînes de Markov. Arthur Charpentier

Mécanismes de protection contre les vers

1 Mesure et intégrale

Opérations bancaires avec l étranger *

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Terminale S. Terminale S 1 F. Laroche

GUIDE METHODOLOGIQUE INDUSTRIES, OUVREZ VOS PORTES

14 Chapitre 14. Théorème du point fixe

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Régulation analogique industrielle ESTF- G.Thermique

Protection de votre réseau d entreprise:

Séries réelles ou complexes

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Les solutions mi-hypothécaires, mi-bancaires de Manuvie. Guide du conseiller

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Gérer les applications

CHAPITRE 2 SÉRIES ENTIÈRES

Donnez de la liberté à vos données. BiBOARD.

Code de Déontologie Commercial Changer les choses avec intégrité

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Neolane Leads. Neolane v6.0

RECHERCHE DE CLIENTS simplifiée

Contribution à la théorie des entiers friables

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

La gestion commerciale dans QuadraENTREPRISE. > Edition personnalisée des pièces

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

Présentation & organisation du cours. Introduction : décider en milieu industriel. Les méta-heuristiques. Le travail à réaliser

Transcription:

Statistiques iféretielles Pierre-Heri WUILLEMIN Licece d Iformatique Uiversité Paris 6 Itroductio Soit ue populatio de taille N sur laquelle o observe ue propriété, dot o veut calculer moyee µ et de variace σ 2. O a accès qu à u échatillo de la populatio. Défiitio (Échatillo aléatoire U échatillo aléatoire est u prélèvemet aléatoire de idividus das cette populatio. X 1, X 2,, X sot alors v.a. idépedates, idetiquemet distribuées (i.i.d. de moyee µ et la variace σ 2. Sur cet échatillo, o peut calculer ue moyee m et ue variace s 2. Quel rapport etre m et µ, s 2 et σ 2? Défiitio (Statistique iféretielle La statistique iféretielle a pour but d iduire les caractéristiques icoues d ue populatio à partir d u échatillo issu de cette populatio. Les caractéristiques de l échatillo, ue fois coues, reflètet avec ue certaie marge d erreur possible celles de la populatio. L iférece statistique est doc u esemble de méthodes permettat de tirer des coclusios fiables à partir de doées d échatillos statistiques. Exemples Statistiques iféretielles 2 / 14 Sodages électoraux, Tests de fiabilités, de qualité, etc. Exemple 1 Ue associatio de cosommateurs veut détermier si la quatité de vi est bie égale à 75cl das les bouteilles de Bordeaux. À cette fi, elle examie u échatillo de 100 bouteilles. Exemple 2 Equête, sur u échatillo de 400 idividus de la populatio active, pour savoir si le taux de chomage, qui était de 10% le mois derier, s est modifié. Statistiques iféretielles 3 / 14

Échatillo représetatif Défiitio (Échatillo représetatif Il est écessaire de s assurer que l échatillo est représetatif de la populatio. L échatilloage aléatoire est le meilleur moye d y parveir. U échatillo aléatoire est u échatillo tiré au hasard das lequel tous les idividus ot la même chace de se retrouver. Das le cas cotraire, l échatillo est biaisé. Échatillo biaisé Soit ue populatio de 58 étudiats e iformatique de taille moyee 1m78. O choisit u échatillo o sexiste de 5 garços et 5 filles. Moyee de l échatillo : 1m74. Le biais : la populatio comporte 40 garços pour 18 filles. Doc, chaque garço avait ue probabilité 5 40 5 d être das l échatillo, et pour chaque fille : 18. Statistique Statistiques iféretielles 4 / 14 À partir des (X i, o peut costruire de ouvelle v.a. permettat de sythétiser ue iformatio. Soit f (X 1,, X ue applicatio défiie sur l échatillo. Nécessairemet, c est égalemet ue v.a.! Défiitio O appelle statistique toute applicatio défiie uiquemet sur l échatillo. Statistiques usuelles X = X 1 + + X : moyee d échatillo ( Xi S 2 X 2 = : variace d échatillo (ou variace corrigée 1 i=1 W = X µ est pas ue statistique car µ est pas observable sur l échatillo!! X et S 2 sot bie des variables aléatoires! Statistiques iféretielles 5 / 14 Échatilloage : aalyse de X Soit u caractère X de moyee µ et de variace σ 2. Soit u échatillo représetatif (X 1,, X i.i.d. E(X = E( X 1 + + X = E(X 1 + + E(X = E(X = E(X De même, Fialemet : E(X = µ V ( X = σ2 Pour suffisammet grad, X suit ue loi ormale N (µ; σ. suffisammet grad quad 30. Si X N (µ; σ alors ce résultat est vrai même pour petit. Statistiques iféretielles 6 / 14

Théorème Cetral Limite Théorème (TCL Quelle que soit la distributio d ue variable aléatoire X, la moyee m d u échatillo de taille suit symptotiquemet ue loi ormale N (µ, σ. Théorème (TCL gééralisée Soit S = X i, avec les X i v.a. idépedate, à variace fiie. Alors i=1 ( σ S N µ, Statistiques iféretielles 7 / 14 Retour sur la loi ormale Rappel Si X N (µ; σ alors X µ σ N (0; 1 N (µ; σ P(x ]µ σ, µ + σ[ 68,0% P(x ]µ 2 σ, µ + 2 σ[ 95,0% P(x ]µ 3 σ, µ + 3 σ[ 99.7% Statistiques iféretielles 8 / 14 Estimatio poctuelle Das l échatilloage, o a pu évaluer la distributio de X à partir des doées de la distributio de la populatio (µ et σ. Das l estimatio, o se pose le problème iverse : état doée u échatillo de moyee m et de variace s 2, que peut-o dire de µ et σ 2? Estimatios poctuelles La moyee m de l échatillo est la meilleure estimatio poctuelle de µ : La variace corrigée µ = m 1 s2 est la meilleure estimatio poctuelle de σ 2 : σ = 1 s Ue populatio peut être décrite par la fréquece p 1 d occurrece de la propriété étudié. O peut alors calculer f la v.a. de cette fréquece das l échatillo. Estimatio poctuelle de p la fréquece f est la meilleure estimatio poctuelle de p. Statistiques iféretielles 9 / 14

Estimatio par itervalle de cofiace Soit P la populatio, de moyee µ, de variace σ 2. Soit u échatillo de taille de moyee m et de variace s 2, µ pour σ, m et 30 sot coues O sait que (sous les boes coditios σ X N (µ; et doc Z = X µ N (0; 1 σ O cherche u itervalle I α tel que la P(µ I α = 1 α avec α [0, 1]. I α est l itervalle de cofiace avec le rique α. Soit t α, P( t α Z t α = 1 α. P( t α X µ t σ α = 1 α σ P( t α σ X µ t α = 1 α P(X t α σ µ X + t α σ = 1 α Défiitio (Itervalle de cofiace à risque α I α = [m t α σ, m + t α σ ] avec t α tel que P( t α Z t α = 1 α. PS- cf. page suivate : t α = z α 2. Statistiques iféretielles 10 / 14 Extrait de la table de la loi ormale valeurs das le tableau ci-dessous : les α tels que (Z > z α = α α zα 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2206 0,2177 0,2148 0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0859 0,0853 0,0838 0,0823 1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681 1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0466 0,0455 1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 0 z α Statistiques iféretielles 11 / 14 Itervalle de cofiace suite µ pour σ icou, m et 30 coues E otat S 2 = 1 s2 la variace corrigée de l échatillo : ( 1 X N µ; S et doc Z = X µ S 1 N (0; 1 p pour f et 30 coues f N ( p; p(1 p σ 2 pour m, s 2 et 30 coues E otat S 2 = 1 s2 la variace corrigée de l échatillo : E(S 2 = σ 2 V (S 2 0 Statistiques iféretielles 12 / 14

Calculs d itervalles Exemple 1 Exemple 1 Ue etreprise reçoit u stock importat de pièces. L etreprise accepte la livraiso que si la proportio de pièces défectueuses est iférieur à 5%. O extrait du stock 200 pièces et o e déombre 15 défectueuses. L etreprise doit-elle accepter cette livraiso? Statistiques iféretielles 13 / 14 Calculs d itervalles Exemple 2 Cofitures Les poids e grammes de 1000 pots de cofiture sortis successivemet d ue machie à coditioer ot été les suivats (les résultats sot doés par classes de logueur 2, l origie de la première état 2000 et l extrémité de la derière 2022 : classe 1 2 3 4 5 6 7 8 9 10 11 effectif 9 21 58 131 204 213 185 110 50 16 3 E admettat que le poids des pots suit ue loi ormale, estimer poctuellemet, puis à l aide d u itervalle de cofiace à 95%, sa moyee et so écart-type. Statistiques iféretielles 14 / 14