1 Introduction. 2 Probabilités : Variables Aléatoires Continues. 3 Estimation. 4 Tests. 5 Régression



Documents pareils
STATISTIQUE : TESTS D HYPOTHESES

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Cours de Statistiques inférentielles

Limites des Suites numériques

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Échantillonnage et estimation

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Principes et Méthodes Statistiques

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Chapitre 3 : Fonctions d une variable réelle (1)

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

SÉRIES STATISTIQUES À DEUX VARIABLES

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

55 - EXEMPLES D UTILISATION DU TABLEUR.

Les Nombres Parfaits.

STATISTIQUE AVANCÉE : MÉTHODES

CHAPITRE 2 SÉRIES ENTIÈRES

1 Mesure et intégrale

Dénombrement. Chapitre Enoncés des exercices

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Statistique descriptive bidimensionnelle

Chapitre 3 : Transistor bipolaire à jonction

Baccalauréat S Asie 19 juin 2014 Corrigé

Cours 5 : ESTIMATION PONCTUELLE

EXERCICES : DÉNOMBREMENT

Comportement d'une suite

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

20. Algorithmique & Mathématiques

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Séquence 5. La fonction logarithme népérien. Sommaire

Terminale S. Terminale S 1 F. Laroche

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Statistique Numérique et Analyse des Données

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Comment les Canadiens classent-ils leur système de soins de santé?

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Neolane Leads. Neolane v6.0

Formation d un ester à partir d un acide et d un alcool

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Etude de la fonction ζ de Riemann

14 Chapitre 14. Théorème du point fixe

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Risque de longévité et détermination du besoin en capital : travaux en cours

Processus et martingales en temps continu

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Probabilités et statistique pour le CAPES

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Processus géométrique généralisé et applications en fiabilité

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Exercices de mathématiques

4 Approximation des fonctions

Gérer les applications

Le chef d entreprise développe les services funéraires de l entreprise, en

Les algorithmes de tri

Introduction : Mesures et espaces de probabilités

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Chap. 5 : Les intérêts (Les calculs financiers)

Solutions particulières d une équation différentielle...

Initiation à l analyse factorielle des correspondances

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Université Pierre et Marie Curie. Biostatistique PACES - UE

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Création et développement d une fonction audit interne*

Faites prospérer vos affaires grâce aux solutions d épargne et de gestion des dettes

LE WMS EXPERT DE LA SUPPLY CHAIN DE DÉTAIL

GUIDE METHODOLOGIQUE INDUSTRIES, OUVREZ VOS PORTES

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

Logiciel de synchronisation de flotte de baladeurs MP3 / MP4 ou tablettes Androïd

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Séries réelles ou complexes

Neolane Message Center. Neolane v6.0

COMMENT ÇA MARCHE GUIDE DE L ENSEIGNANT 9 E ANNÉE

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Divorce et séparation

Une action! Un message!

Donnez de la liberté à vos données. BiBOARD.

Microscope de mesure sans contact pour inspection et mesures de précision

MÉMENTO Aide-mémoire à l usage des administrateurs des coopératives PSBL-P. Programme de logement sans but lucratif privé

Nous imprimons ce que vous aimez!

La maladie rénale chronique

Transcription:

Pla du cours Méthodes de statistique iféretielle. A. Philippe Laboratoire de mathématiques Jea Leray Uiversité de Nates Ae.Philippe@uiv-ates.fr 1 Itroductio 2 Probabilités : Variables Aléatoires Cotiues 3 Versio modifiée le 19 mai 2016 4 http://www.math.scieces.uiv-ates.fr/~philippe/ 5 Régressio A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 1 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 2 / 166 Pla de la sectio Itroductio Quelques problèmes Itroductio 1 Itroductio 1 U fabricat souhaite vérifier la qualité des ampoules électriques produites par ue ouvelle chaîe de productio. Il faut doc évaluer la durée moyee de foctioemet des ampoules. Commet évaluer cette durée moyee? O e peut pas tester toutes les ampoules! 2 Le resposable d u parti politique souhaite estimer la proportio des militats favorables à la cadidature de Mr X pour la prochaie électio présidetielle. Commet calculer la popularité d u cadidat au sei d ue populatio? Iterroger tous les militats est trop coûteux. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 3 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 4 / 166

Itroductio Itroductio Populatio & Échatillo Pour résumer Défiitio La populatio : l esemble de tous les élémets cosidérés das ue étude. Défiitio L échatillo est u sous esemble fii de la populatio. La taille de l échatillo est le ombre d élémets sélectioés pour costituer l échatillo. Le but de l iférece statistique. Tirer des coclusios cocerat certaies caractéristiques de la populatio à partir des iformatios coteues das l échatillo. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 5 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 6 / 166 Retour aux exemples Itroductio 1 Le fabricat d ampoules. Il prélève u échatillo costitué de 130 ampoules. Pour chaque ampoule, il mesure la durée de foctioemet. La moyee de l échatillo vaut 36 000 heures. Ue estimatio pour la populatio est 36 000 heures. 2 Le resposable du parti. Il costitue u échatillo de taille 400. Parmi les persoes sélectioées, 250 sot favorables au cadidat proposé. Ue estimatio de la proportio de la populatio favorable à Mr X est 250/400 = 0.625 Quelle est la qualité de ces deux estimatios? Itroductio Erreur d échatilloage Elle résulte de l utilisatio d u sous esemble de la populatio (l échatillo) et o de la populatio toute etière. Exemple : le resposable du parti (suite). deux échatillos différets vot fourir des estimatios différetes. Quelle est la précisio des estimatios réalisées? A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 7 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 8 / 166

Probabilités : Variables Aléatoires Cotiues Pla de la sectio Probabilités : Variables Aléatoires Cotiues Gééralités 2 Probabilités : Variables Aléatoires Cotiues Gééralités Loi gaussiee/ormale 2 Probabilités : Variables Aléatoires Cotiues Gééralités Loi gaussiee/ormale A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 9 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 10 / 166 Probabilités : Variables Aléatoires Cotiues Gééralités U exemple de loi discrète : la loi Biomiale Probabilités : Variables Aléatoires Cotiues Plus gééralemet Gééralités U hôtel possède 50 chambres. Au pritemps le taux de remplissage est de 75%. O ote X le ombre de chambres occupées u jour doé. C est ue variable aléatoire. X {0,..., 50} pred u ombre fii de valeurs, c est ue variable aléatoire discrète. La loi de X est la loi biomiale de paramètre = 50 et p = 0.75. c est à dire, pour tout k {0,..., 50}, o a P(X = k) = C k 50p k (1 p) 50 k La probabilité que l hôtel soit complet vaut P(X = 50) = C 50 50 0.75 50 (1 0.75) 0 = 0.75 50 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 11 / 166 Ue variable aléatoire discrète pred u ombre au plus déombrable de valeurs. L esemble des valeurs prises par X peut doc s écrire de la forme {x i, i E} où E est u sous esemble de N La loi de la variable aléatoire X est la suite des probabilités p k = P(X = x k ) pour tout k E L espérace (moyee) de X : La variace de X : var(x ) = k E E(X ) = k E p k x k ( ) 2 p k xk 2 p k x k A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 12 / 166 k E

Probabilités : Variables Aléatoires Cotiues Gééralités U exemple de variable aléatoire o discrète Défiitio Probabilités : Variables Aléatoires Cotiues Gééralités O ote X le temps de vol etre Paris et Vilius. C est ue variable aléatoire qui pred des valeurs comprises etre 135m et 165m. La variable aléatoire X peut predre toutes les valeurs de l itervalle [135, 165]. Cette variable aléatoire est doc pas ue variable discrète. Défiitio O dit que X est ue variable aléatoire cotiue. La loi d ue variable aléatoire cotiue est défiie à partir d ue foctio f appelée desité qui vérifie les propriétés suivates : f est positive pour tout x R, f (x) 0 l aire e dessous la courbe représetative de f vaut 1 autremet dit f (x)dx = 1 10 5 0 5 10 0.0 0.1 0.2 0.3 0.4 x A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 13 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 14 / 166 Probabilités : Variables Aléatoires Cotiues Gééralités Probabilités : Variables Aléatoires Cotiues Gééralités Calcul des probabilités Illustratio L aire comme mesure des probabilités Soit X ue variable aléatoire cotiue, f sa desité Défiitio La probabilité que X appartiee à l itervalle [a, b] P(a X b) est égale à l aire e dessous de la courbe représetative de la desité comprise etre x = a et x = b 1 La courbe e bleu représete la desité de la variable aléatoire 2 L aire de la zoe e vert représete sur l image de gauche : P(X a) sur l image du milieu : P(a X b) sur l image de droite : P(X b) Autremet dit P(a X b) = b a f (t)dt A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 15 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 16 / 166

Probabilités : Variables Aléatoires Cotiues Gééralités Probabilités : Variables Aléatoires Cotiues Gééralités Espérace/Variace Défiitio X ue variable aléatoire cotiue. La foctio de répartitio de X (otée F ) est défiie par F (x) = P(X x) Quelques propriétés 1 P(X = x) = 0 2 P(X x) = P(X < x) 3 P(a X b) = P(X b) P(X a) = F (b) F (a) 4 P(X b) = 1 P(X b) = 1 F (b) X ue variable aléatoire cotiue de desité f L espérace de X s écrit E(X ) = xf (x) dx et la variace de X var(x ) = ( x 2 f (x) dx ) 2 xf (x) dx A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 17 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 18 / 166 Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Défiitio de la loi ormale ou gaussiee 2 Probabilités : Variables Aléatoires Cotiues Gééralités Loi gaussiee/ormale La loi gaussiee est ue loi cotiue qui déped de deux paramètres µ R et σ > 0. Sa desité est f µ,σ (x) = 1 e 1 2σ 2 (x µ)2 2πσ Défiitio (Cas particulier) O dit que la loi gaussiee est stadard si µ = 0 et σ = 1. O ote F 0,1 sa foctio de répartitio. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 19 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 20 / 166

Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Le rôle des deux paramètres µ, σ Probabilités : Variables Aléatoires Cotiues desité de la loi ormale d'ecart type 1 Loi gaussiee/ormale desité de la loi ormale de moyee 0 µ est u paramètre de positio σ u paramètre de dispersio Propriétés Soit X ue variable aléatoire gaussiee. E(X ) = µ, la moyee var(x ) = σ 2, la variace σ est l écart type de X desite 0.0 0.1 0.2 0.3 0.4 MOY= 5 MOY=0 MOY=5 10 5 0 5 10 x Desités de lois gaussiees ayat la même variace mais des moyees différetes desite 0.0 0.1 0.2 0.3 0.4 SD=1 SD=3 SD=6 10 5 0 5 10 Desités de lois gaussiees ayat la même moyee mais des variaces différetes x A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 21 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 22 / 166 Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Table de la loi gaussiee stadard Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Propriétés de la loi gaussiee stadard La table doe les valeurs de F 0,1 (u), u 0 (aire e vert) Soit X ue variable aléatoire gaussiee stadard. Pour tout x, o a P(X x) = P(X x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x Preos u = 1.96 = 1.9 + 0.06. P(X x) = 1 P(X x) autremet dit F 0,1 ( x) = 1 F 0,1 (x). P( x X x) = F 0,1 (x) F 0,1 ( x) = 2F 0,1 (x) 1 O a u 1 = 1.9 et u 2 =.06 d où F 0,1 (1.96) = 0.975. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 23 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 24 / 166

Applicatios Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Probabilités : Variables Aléatoires Cotiues Lie etre les lois gaussiees Loi gaussiee/ormale Soit X ue variable aléatoire gaussiee stadard. 1 E utilisat la table : P(X 1.96) = F 0,1 (1.96) = 0.975 2 Calcul de P(X 1.96). Cette valeur est pas das la table. P(X 1.96) = F 0,1 ( 1.96) = 1 F 0,1 (1.96) = 1 0.975 = 0.025 3 Calcul de P( x X x) pour x = 1, 2, 3 P( x X x) = F 0,1 (x) F 0,1 ( x) = 2F 0,1 (x) 1 0.68 x = 1 = 0.95 x = 2 0.99 x = 3 1 Si la loi de X est la loi gaussiee de moyee µ et d écart type σ alors la loi de Y = X µ est la loi gaussiee de moyee 0 et σ d écart type 1 2 Si la loi de Y est la loi gaussiee de moyee 0 et d écart type 1 alors la loi de X = σy + µ est la loi gaussiee de moyee µ et d écart type σ A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 25 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 26 / 166 Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Calcul pour la loi gaussiee (µ, σ) Probabilités : Variables Aléatoires Cotiues Loi gaussiee/ormale Soit X est ue variable gaussiee de moyee µ et d écart type σ. Pour calculer P(X x), o se ramèe à ue loi gaussiee stadard. O pose Y = X µ X = σy + µ σ P(X x) = P(σY + µ x) = P(Y x µ σ ) Comme la loi de Y est la loi gaussiee stadard, le derier terme est doé par la table de la loi gaussiee. ( ) x µ P(X x) = F 0,1 σ Exemple Si la loi de X est gaussiee de moyee 4 et d écart type 2. O pose Y = X 4 2 P(X 6.5) = P(2Y + 4 6.5) = P(Y 6.5 4 ) 2 = P(Y 1.25) = 0.8943 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 27 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 28 / 166

Exemple itroductif Pla de la sectio 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 29 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 30 / 166 Exemple itroductif Exemple itroductif La situatio Deux méthodes Le directeur du persoel du groupe αβ a été chargé de développer le profil de 2500 resposables de sociétés apparteat au groupe αβ. Les caractéristiques à étudier sot le salaire moye auel et sa dispersio la participatio au programme de formatio e gestio mis e place par la société. O a doc trois paramètres à calculer la moyee µ et l écart type σ du salaire auel pour la populatio la proportio p de la populatio ayat suivi la formatio Le recesemet. O doit iterroger 2500 persoes. Le coût de la collecte est très élevé, il écessite u etretie avec chaque resposable. L estimatio. O estime les trois paramètres à partir d u échatillo de taille << 2500. Il faut alors 1 Costruire u échatillo de taille 2 Calculer des estimateurs des trois paramètres 3 Évaluer la qualité des estimateurs. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 31 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 32 / 166

Exemple itroductif Exemple itroductif les doées collectées O costruit u échatillo costitué de 30 resposables de sociétés du groupe. Pour chaque persoe de l échatillo, o collecte deux iformatios so salaire. O ote S 1,..., S 30 les salaires s il a participé au programme de formatio que l o code par 1 pour oui et 0 pour o. O ote F 1,..., F 30 les réposes S F S F S F 1 50427.82 1 11 53714.13 1 21 54276.3 1 2 47770.71 1 12 56641.81 1 22 58389.2 1 3 51686.39 1 13 45535.32 0 23 48762.44 0 4 44520.07 1 14 55626.63 1 24 48916.25 0 5 47976.9 0 15 54898.44 0 25 51026.77 1 6 59979.41 1 16 49246.59 0 26 50999.26 1 7 47022.2 1 17 57261.6 1 27 55811.3 1 8 44252.88 1 18 52876.62 0 28 48622.47 1 9 51641.93 1 19 49841.11 1 29 47226.59 0 10 51206.19 1 20 54256.2 0 30 53419.27 1 S = salaire F = formatio (0 :o, 1 :oui) A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 33 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 34 / 166 Exemple itroductif Exemple itroductif Caractéristiques de l échatillo Recesemet 1 moyee de l échatillo : x = 51461.09 2 écart type de l échatillo : S = 4091.18 3 proportio de l échatillo ayat suivi le programme de formatio : p =.7 x 1,..., x u échatillo de taille. sa moyee : x = 1 i=1 x i sa variace : S 2 = 1 i=1 (x i x) 2 so écart type S = i=1 (x i x) 2 1 Après u recesemet de la populatio etière, o obtiet 1 moyee de la populatio µ = 51800 x = 51461.09 2 écart type de la populatio σ = 4000 S = 4091.18 3 proportio de la populatio ayat suivi le programme de formatio p =.67 p =.7 Les valeurs calculées sur l échatillo e correspodet pas exactemet aux valeurs de la populatio. Erreur d échatilloage A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 35 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 36 / 166

Exemple itroductif Échatilloage Évaluatio des erreurs ici Erreur absolue : EA = estimatio vraie valeur EA Erreur relative : ER = vraie valeur 1 sur la moyee : EA = x µ = 338.90 et x µ ER = < 0.01% µ 2 Sur l écart type : EA = 91.18 et ER = 2.2% 3 sur la proportio : EA =.03 et ER = 5% 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 37 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 38 / 166 Défiitio d u échatillo Échatilloage poctuelle d ue moyee O suppose que l o dispose d u échatillo aléatoire de taille issu d ue populatio. L échatillo satisfait les coditios suivates 1 Tous les idividus sot sélectioés das la même populatio 2 Les idividus sot sélectioés de faço idépedate. 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 39 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 40 / 166

d ue moyee poctuelle d ue moyee Costructio de l estimateur de µ poctuelle d ue moyee Soit X ue caractéristique/variable de la populatio. O ote µ sa moyee das la populatio σ so écart type. Questio Commet estimer le paramètre µ? Quelle est la précisio de l estimatio? Les doées O dispose des valeurs de la variable X pour les idividus sélectioés das l échatillo : x 1,..., x O estime la moyee de la populatio par la moyee de l échatillo x = 1 x i = x 1 + + x i=1 x est ue estimatio poctuelle de µ Remarque x est ue variable aléatoire. À chaque répétitio du processus d échatilloage, il est vraisemblable d obteir ue valeur différete pour la moyee x. O peut doc calculer la loi de x, sa moyee, sa variace etc A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 41 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 42 / 166 Propriétés de l estimateur x poctuelle d ue moyee 1 La moyee de x est égale à la moyee de la populatio µ. E( x) = µ 2 La variace de x : var( x) = σ2 où σ 2 est la variace de la populatio. 3 L écart type de x : σ( x) = A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 43 / 166 σ poctuelle d ue moyee l écart type décroît vers zéro quad la taille de l échatillo ted vers l ifii. la moyee reste ichagée quelque soit la taille de l échatillo Graphique Évolutio de la loi de x e foctio de la taille de l échatillo. La populatio est gaussiee de moyee µ = 10 et d écart type σ = 1 0.0 0.5 1.0 1.5 2.0 2.5 =1 5 30 50 A. Φlippe (U. Nates) 6 Méthodes 8 de statistique 10iféretielle. 12 19 14mai 2016 44 / 166

poctuelle d ue moyee Théorème cetral limite Loi de x : cas gaussie Lorsque la distributio de la populatio est gaussiee alors la loi de x est aussi ue loi gaussiee Populatio x loi gaussiee gaussiee moyee µ µ variace σ 2 σ2 σ écart type σ 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 45 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 46 / 166 Théorème cetral limite Théorème cetral limite Loi de x : le cas des grads échatillos Illustratio du TCL Loi de la populatio. Le théorème cetral limite doe la loi de x pour les grads échatillos quelque soit la loi de la populatio. Théorème O suppose que la loi de la populatio est de moyee µ et d écart type σ. Lorsque la taille de l échatillo est assez grade, la loi de x peut être approchée par ue loi gaussiee de moyee µ et d écart type σ. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 47 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 48 / 166

Théorème cetral limite Théorème cetral limite Loi de x pour des échatillos de taille = 5 Loi de x pour des échatillos de taille = 30 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 49 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 50 / 166 Théorème cetral limite Théorème cetral limite Loi de x pour des échatillos de taille = 50 E pratique O peut approcher la loi de x par ue loi gaussiee pour des grads échatillos. O admet souvet comme limite > 30. Remarque Si la loi de la populatio est gaussiee alors la loi de x est gaussiee quelque soit la taille de l échatillo. Remarque La loi d échatilloage révèle la faço dot les valeurs de x sot distribuées autour de µ. Nous allos utiliser cette loi pour cotrôler l erreur d estimatio pour costruire ue estimatio par itervalle. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 51 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 52 / 166

Erreur d estimatio : coclusios probabilistes 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio La coaissace de la loi de x permet de tirer des coclusios probabilistes sur l erreur x µ (même si µ est icou) Les situatios étudiées sot les suivates les grads échatillos σ cou σ icou les petits échatillos pour des populatios gaussiees σ cou σ icou A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 53 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 54 / 166 Cas des grads échatillos > 30 D après le théorème cetral limite la loi de x peut être approchée par ue loi gaussiee de moyee µ et d écart type σ/. la loi de x µ peut être approchée par ue loi gaussiee σ stadard. Par coséquet ( x µ P σ c est à dire P ) [ 1, 96 ; 1.96] = 0.95 ( x µ [ 1, 96 σ ; 1.96 σ ]) = 0.95 Soit Z ue variable gaussiee stadard. D après la table de la loi gaussiee, o sait que P(Z [ 1, 96 ; 1.96]) = 0.95 E effet P(Z [ a ; a]) = 2F 0,1 (a) 1 = 0.95 et F 0,1 (1.96) = 0.975 Coclusio probabiliste sur l erreur 95% des valeurs de x géèret ue erreur absolue iférieure à 1, 96 σ A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 55 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 56 / 166

Illustratio : distributio de la loi de x Gééralisatio 1 O fixe α ]0, 1[, 1 α est de iveau de cofiace. 2 O costruit a (qui déped de α) tel que P( x µ [ a ; a]) = 1 α σ = 2 x géère ue erreur absolue iférieure à a avec ue probabilité de 1 α. 95% des valeurs de x σ µ 3.92 3.92 = 2x1.96 α 2 a 1 α des valeurs de x µ a α 2 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 57 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 58 / 166 Quatile de la loi gaussiee stadard. Défiitio Soit X ue variable gaussiee stadard. Le quatile d ordre β de la loi gaussiee stadard est le réel q(β) tel que P(X q(β)) = β F 0,1 (q(β)) = β Erreur d estimatio : grad σ cou Théorème Hypothèses la taille de l échatillo est assez grade (>30) la variace de la populatio σ 2 est coue Soit α fixé. O a ( P x µ [ q(1 α/2) σ ; q(1 α/2) σ ]) = 1 α x géère ue erreur absolue iférieure à q(1 α/2) σ avec ue probabilité de 1 α. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 59 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 60 / 166

le calcul... Grads échatillos, σ est icou O remarque que x µ [ q(1 α/2) σ ; q(1 α/2) σ ] ( x µ) [ q(1 α/2) ; q(1 α/2)] σ Comme la loi de ( x µ) peut être approchée par la loi gaussiee σ stadard, o a ( P = P x µ [ q(1 α/2) σ ; q(1 α/2) σ ]) = F 0,1 (q(1 α/2)) F 0,1 ( q(1 α/2)) = 2F 0,1 (q(1 α/2)) 1 = 2(1 α/2) 1 = 1 α A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 61 / 166 Les itervalles dépedet de l écart type de la populatio σ qui gééralemet est icou. O estime l écart type de la populatio par celui de l échatillo S = 1 (x i x) 2 Remarque S 2 est u estimateur poctuel de la variace de la populatio σ 2 Théorème Quad est assez grad, la loi de par la loi gaussiee stadard. i=1 ( x µ) peut être approchée S A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 62 / 166 Erreur d estimatio : grad σ icou Théorème Hypothèses la taille de l échatillo est assez grade (>30) la variace de la populatio σ 2 est icoue Soit α fixé. O a ( P x µ [ q(1 α/2) S ; q(1 α/2) S ]) = 1 α x géère ue erreur absolue iférieure à q(1 α/2) S avec ue probabilité de 1 α. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 63 / 166 Cas des petits échatillos gaussies Si la loi de la populatio est gaussiee alors la loi de la loi gaussiee stadard Théorème Hypothèses la populatio est gaussiee la variace de la populatio σ 2 est coue ( x µ) est σ Soit α fixé. O a ( P x µ [ q(1 α/2) σ ; q(1 α/2) σ ]) = 1 α x géère ue erreur absolue iférieure à q(1 α/2) σ avec ue probabilité de 1 α. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 64 / 166

Loi de Studet Foctio de répartitio des lois de Studet Soit ν R +. La loi de Studet à ν degrés de liberté est ue loi cotiue dot la desité est de la forme Soit X ue variable distribuée suivat la loi de Studet à ν degrés de liberté. P = P(X u) (aire e vert) e Propositio Quad le degré de liberté ν est grad, o peut approcher la loi de Studet par ue loi gaussiee stadard A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 65 / 166 si ν = 8 alors P(X < 1.859) = 0.95. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 66 / 166 Quatiles de la loi de Studet Petits échatillos gaussies, σ icou O ote t(ν, β) le quatile d ordre β de la loi de Studet à ν degrés de liberté. P(X t(ν, β)) = β Fixos β = 0.975 ν 1 2 3 20 30 40 500 t(ν, 0.975) 12.706 4.302 3.182 2.085 2.041 2.022 1.960 Pour la loi gaussiee stadard, o a q(0.975) = 1.96. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 67 / 166 Importat : O commece par corriger l estimateur de la variace O pose Sc 2 = 1 (x i x) 2 = 1 1 S 2 Défiitio i=1 S 2 c est la variace modifiée/corrigée de l échatillo. C est u estimateur poctuel de la variace de la populatio Théorème La loi de ( x µ) est ue loi de Studet à 1 degrés de liberté. S c A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 68 / 166

Erreur d estimatio : populatio gaussiee, σ icou Théorème Hypothèses la populatio est gaussiee la variace de la populatio σ 2 est icoue Soit α fixé. O a ( [ P x µ t( 1, 1 α/2) S c ; t( 1, 1 α/2) S ]) c = 1 α par itervalle de la moyee 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio x géère ue erreur absolue iférieure à t( 1, 1 α/2) S c avec ue probabilité de 1 α. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 69 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 70 / 166 par itervalle par itervalle de la moyee Cas des grads échatillos par itervalle de la moyee À partir de l échatillo, o souhaite costruire u itervalle qui vérifie la propriété suivate : il y a ue probabilité 1 α que l itervalle cotiee la moyee de la populatio. Défiitios 1 1 α est le coefficiet de cofiace. 2 L itervalle obteu est appelé itervalle de cofiace de iveau 1 α. par itervalle de la moyee d ue populatio Hypothèses la taille de l échatillo est assez grade (>30) la variace de la populatio σ 2 est coue [ x σ q(1 α/2) ; x + σ ] q(1 α/2) est u itervalle de cofiace de iveau 1 α pour la moyee µ il y a ue probabilité 1 α que l itervalle de cofiace cotiee la moyee de la populatio. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 71 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 72 / 166

le calcul par itervalle de la moyee Il y a ue probabilité 1 α que la valeur de x géère ue erreur iférieure à σ q(1 α/2) d où par itervalle de la moyee La courbe e vert est la desité de la loi de x. O costruit 10 itervalles de cofiace de iveau 95% à partir de 10 échatillos différets. P( x µ σ q(1 α/2)) = 1 α Esuite, il suffit de remarquer que x µ σ q(1 α/2) [ µ x σ q(1 α/2) ; x + σ ] q(1 α/2) A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 73 / 166 L itervalle e rose e cotiet pas la vraie valeur de la moyee. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 74 / 166 par itervalle de la moyee Cas des grads échatillos, σ icou O estime σ par l écart type de l échatillo S S = 1 (x i x) 2 par itervalle de la moyee d ue populatio Hypothèses i=1 la taille de l échatillo est assez grade (>30) la variace de la populatio σ 2 est icoue [ x S q(1 α/2) ; x + S ] q(1 α/2) par itervalle de la moyee Petits échatillos gaussies, σ cou O retrouve le résultat des grads échatillos. par itervalle de la moyee d ue populatio Hypothèses la populatio est gaussiee la variace de la populatio σ 2 est coue [ x σ q(1 α/2) ; x + σ ] q(1 α/2) est u itervalle de cofiace de iveau 1 α pour la moyee µ est u itervalle de cofiace de iveau 1 α pour la moyee µ A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 75 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 76 / 166

par itervalle de la moyee Petits échatillos gaussies, σ icou O utilise l écart type corrigé de l échatillo S c pour estimer σ S c = 1 (x i x) 1 2 par itervalle de la moyee d ue populatio Hypothèses la populatio est gaussiee la variace de la populatio σ 2 est icoue [ x S c t( 1, 1 α/2) ; x + S ] c t( 1, 1 α/2) est u itervalle de cofiace de iveau 1 α pour la moyee µ. i=1 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 77 / 166 Retour à l exemple du groupe αβ par itervalle de la moyee O suppose que la populatio est gaussiee. Situatio 1 O dispose d u échatillo de taille 30 et la variace de la populatio est coue. Avec ue probabilité de 95%, l erreur est iférieure à 1.96σ 1 = 1.96 4000/ 30 = 1431.382 L itervalle de cofiace au iveau 95% est [51461.09 1431.38 ; 51461.09 + 1431.38] = [50029.7 ; 52892.4] Remarque Sur l échatillo sélectioé, ous avios EA = x µ = 338.90 après recesemet. Le cas observé appartiet aux 95% des cas favorables. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 78 / 166 par itervalle de la moyee Situatio 2 O suppose que la loi des salaires est gaussiee. La variace de la populatio est icoue. Calcul de la variace modifiée S 2 c = S 2 30/29. D où S c = S 2 30/29 = 4161.12 Das la table de la loi de Studet, o trouve t(29, 0.975) = 2.04 Avec ue probabilité de 95%, l erreur est iférieure à 2.04 4161.1/ 30 = 1553.78 L itervalle de cofiace au iveau 95% est [51461.09 1553.78 ; 51461.09 + 1553.78] = [49907.31 ; 53014.87] A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 79 / 166 Pour résumer par itervalle de la moyee Les itervalles de cofiace sur la moyee de la populatio σ cou σ icou petits échatillos grads échatillos [ loi gaussiee quelle que soit la loi x ± σ ] [ q(1 α/2) x ± σ ] q(1 α/2) [ x ± S ] [ c t( 1, 1 α/2) x ± S ] q(1 α/2) Notatios : [a ± b] est l itervalle [a b; a + b] 1 S = i=1 (x i x) 2 et S c = 1 1 i=1 (x i x) 2 q(β) est le quatile d ordre β de la loi gaussiee stadard et t(ν, β) celui de la loi de Studet à ν degrés de liberté A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 80 / 166

poctuelle d ue variace Costructio de l estimateur poctuelle d ue variace 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 81 / 166 O souhaite estimer la variace de la populatio. 1er estimateur : O estime la variace de la populatio par la variace de l échatillo S 2 = 1 (x i x) 2 Remarque (estimatio biaisée) E(S 2 ) = 1 σ2 σ 2 o dit que l estimateur a u biais. 2ème estimateur : O améliore l estimateur S 2 e preat la variace modifiée Sc 2 = 1 (x i x) 2 1 i=1 i=1 Le biais est corrigé, o a E(S 2 c ) = σ 2 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 82 / 166 poctuelle d ue variace poctuelle d ue variace Propriétés de S 2 c Loi du χ 2 La moyee de S 2 c est égale à la variace de la populatio µ E(S 2 c ) = σ 2 Soit ν R +. La loi du χ 2 à ν degrés de liberté est ue loi cotiue. La desité est de la forme La variace de S 2 c coverge vers zéro pour des variables L 4. De plus si l échatillo est gaussie, o a var(s 2 c ) = σ 4 2 1 Comparaiso des deux estimateurs Quad la taille de l échatillo est grade, les deux estimateurs sot équivalets. Remarque La desité est ulle sur R doc P(X < 0) = 0 et P(X 0) = 1 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 83 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 84 / 166

Propositio poctuelle d ue variace Quad le degré de liberté ν est grad, o peut approcher la loi du χ 2 par la loi gaussiee de moyee ν et d écart type 2ν poctuelle d ue variace Foctio de répartitio des lois du χ 2 Soit X ue variable distribuée suivat la loi du χ 2 à ν degrés de liberté. P = P(X u) A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 85 / 166 si ν = 5 alors P(X < 11.07) = 0.95. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 86 / 166 poctuelle d ue variace poctuelle d ue variace Quatiles de la loi du χ 2 Loi de l estimateur S 2 c O ote k(ν, β) le quatile d ordre β de la loi du χ 2 à ν degrés de liberté. P(X k(ν, β)) = β Fixos β = 0.975 ν 1 3 5 10 20 500 k(ν, 0.975) 5.02 9.35 12.83 20.48 34.17 563.85 Pour la loi gaussiee de moyee 500 et d écart type 1000, le quatile supérieur d ordre β = 0.975 vaut 561.97 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 87 / 166 Théorème Si la populatio est gaussiee alors la loi de 1 σ 2 S 2 c est la loi du χ 2 à 1 degrés de liberté. Grads échatillos gaussie Quad la taille de la populatio est assez grade ( > 30), o peut approcher la loi de 1 Sc 2 par la loi gaussiee de moyee 1 et d écart type 2 2. σ 2 Autremet dit o peut approcher la loi de loi gaussiee stadard ( ) S 2 c 1 σ 1 2 2 par la A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 88 / 166

poctuelle d ue variace Itervalle de cofiace pour la variace par itervalle de la variace d ue populatio Hypothèses la populatio est gaussiee [ ( 1)S 2 c k( 1, 1 α/2) ; ] ( 1)Sc 2 k( 1, α/2) est u itervalle de cofiace de iveau 1 α pour la variace σ 2 Approximatio gaussiee poctuelle d ue variace par itervalle de la variace d ue populatio gaussiee Quad la taille de l échatillo est assez grade > 30, Sc 2 1 + q(1 α/2) ; 2 1 S 2 c 1 q(1 α/2) 2 1 est u itervalle de cofiace de iveau 1 α pour la variace σ 2 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 89 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 90 / 166 poctuelle d ue proportio Costructio de l estimateur poctuelle d ue proportio 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio O étudie ue caractéristique X qui pred deux modalités {0, 1}. Soit p la proportio de la populatio qui possède la modalité 1 O veut estimer p à partir de otre échatillo. Costructio de l estimateur O ote p la proportio de l échatillo qui possède la modalité 1. C est u estimateur poctuel de p A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 91 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 92 / 166

Propriétés de la loi de p poctuelle d ue proportio Loi d échatilloage de p poctuelle d ue proportio 1 La moyee de la variable p est égale à la proportio p das la populatio. p(1 p) 2 L écart type de p vaut. Le graphique suivat représete l écart type e foctio de p. Quad la taille de l échatillo est assez grade, o peut approcher la loi de p par ue loi gaussiee de moyee p et d écart type p(1 p). O peut cosidérer que est grad si p 5 et (1 p) 5. 0 100 200 300 400 500 approximatio par ue gaussiee VALIDE p>5 et (1 p)>5 0.0 0.2 0.4 0.6 0.8 1.0 p A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 93 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 94 / 166 poctuelle d ue proportio Précisio de l estimatio : grads échatillos poctuelle d ue proportio par itervalle : grads échatillos Soit α fixé. O a ( [ ]) p(1 p) p(1 p) P p p q(1 α/2) ; q(1 α/2) = 1 α p géère ue erreur absolue iférieure à q(1 α/2) ue probabilité de 1 α. Remarque L erreur déped de p qui est icou. p(1 p) avec O estime l écart type de la loi de p par Théorème Pour assez grad, la loi de ( p p) p(1 p) p(1 p) peut être approchée par la loi gaussiee stadard. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 95 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 96 / 166

Itervalle de cofiace poctuelle d ue proportio Retour à l exemple du groupe αβ poctuelle d ue proportio par itervalle de la proportio p Hypothèse la taille de l échatillo est assez grade p 5 et (1 p) 5. e pratique o vérifie si p 5 et (1 p) 5 [ ] p(1 p) p(1 p) p q(1 α/2) ; p + q(1 α/2) est u itervalle de cofiace de iveau 1 α pour la proportio p L estimatio de p : p =.7 et la taille de l échatillo est = 30. O a bie p = 21 5 et (1 p) = 9 5 O peut utiliser l approximatio par ue gaussiee 1 Avec ue probabilité de 95%, l erreur sur l estimatio de p est iférieure à p(1 p) 1.96 = 1.96 0.3 0.7/ 30 = 0.16 Après le recesemet, ous avios ue erreur absolue de : EA =.03 2 L itervalle de cofiace au iveau 95% est [0.7 0.16, 0.7 + 0.16] = [0.54, 0.86] A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 97 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 98 / 166 poctuelle d ue proportio Le secod tour d ue électio présidetielle A et B sot les deux cadidats présets au secod tour. Les résultats du secod tour sot B 51% et A 49% Les régios de cofiace pour les deux proportios e foctio de la taille de l échatillo poctuelle d ue proportio Icertitude sur le cadidat vaiqueur Quelle est la précisio des sodages? O réalise de ombreux sodages sur des échatillos de taille afi d évaluer le pourcetage de sodages qui e doet pas le bo cadidat vaiqueur. Ce graphique représete ce pourcetage e foctio de. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 99 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 100 / 166

poctuelle d ue proportio u autre résultat : 52,5% cotre 47.5% Coclusio 3 Exemple itroductif Échatilloage poctuelle d ue moyee Théorème cetral limite par itervalle de la moyee poctuelle d ue variace poctuelle d ue proportio Coclusio A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 101 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 102 / 166 La boe démarche Coclusio Pla de la sectio La démarche statistique pour estimer ue caractéristique/u paramètre de la populatio (moyee, variace, proportio, etc.) est la suivate 1 O costitue u échatillo de taille 2 O récolte les observatios x 1,..., x 3 O calcule l estimateur du paramètre d itérêt. 4 Avat d évaluer la qualité de l estimateur, o doit répodre aux questios suivates : 1 Dispose-t-o d u grad échatillo? 2 La populatio est-elle gaussiee? 5 O fixe u iveau de cofiace 1 α 6 O calcule l erreur d estimatio et/ou u itervalle de cofiace 4 Défiitios et exemples Test sur la moyee Comparaiso de deux échatillos Test du χ 2 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 103 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 104 / 166

Défiitios et exemples Défiitios et exemples U test statistique 4 Défiitios et exemples Test sur la moyee Comparaiso de deux échatillos Test du χ 2 Das la première partie du cours u échatillo est utilisé pour estimer les paramètres d ue caractéristique de la populatio, par exemple ue moyee ue variace ue proportio Nous poursuivos l iférece statistique par la descriptio des tests statistiques. U test statistique est utilisé pour détermier si ue assertio sur ue caractéristique de la populatio doit être rejetée. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 105 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 106 / 166 Défiitios et exemples Défiitios et exemples Le cotrôle de qualité. Pricipe gééral Das ue des etreprises du groupe αβ, o procède à l assemblage de 10 composats électroiques sur ue plate-forme. La qualité de soudure sur la plate-forme e satisfait pas les critères de qualité établis pour ce produit. l avis de l igéieur U igéieur a émis l hypothèse que le problème serait dû à des défauts de placage sur les plates-formes. Questio La proportio de plates-formes défectueuses das les stocks de l etreprise est-elle supérieure à celle aocée par le fourisseur? Étape 1 O commece par formuler ue première hypothèse sur ue caractéristique de la populatio. Cette hypothèse, otée H 0, est appelée l hypothèse ulle. Étape 2 O défiit esuite ue secode hypothèse qui cotredit l hypothèse ulle H 0. Cette hypothèse, otée H a, est appelée l hypothèse alterative. Étape 3 O utilise les doées issues d u échatillo pour tester les deux hypothèses e compétitio H 0 et H a. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 107 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 108 / 166

Défiitios et exemples Défiitios et exemples Illustratio Quelle décisio peut-o predre? Situatio : Ue société de trasport aoce que la durée moyee µ du trajet etre Paris et Lille a été réduite de 5 miutes, la durée moyee du trajet serait de 58m au lieu de 1h03. Ue associatio d usagers coteste cette aoce. Les hypothèses O cofrote les deux hypothèses suivates : H 0 : l affirmatio de l associatio d usagers µ = 63m H a : l affirmatio de la société de trasport µ = 58m O dispose d u échatillo de taille = 35 dot la moyee des durées de trajet vaut x = 59.1m et l écart type S = 5.1m. La différece etre x et 63 peut-elle être attribuée aux fluctuatios de l échatilloage ou doit-elle être attribuée à ue réductio réelle de la durée du trajet? Remarques Quelle est la probabilité de commettre ue erreur si H 0 est vraie? Quelle est la probabilité de commettre ue erreur si H a est vraie? A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 109 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 110 / 166 Défiitios et exemples la société de trasport (suite) la loi de x la société de trasport (suite) Défiitios et exemples L hypothèse H 0 est vraie la loi de x peut être approchée par la loi gaussiee de moyee 63 et d écart type 5.1 0.86 35 Représetatio de la loi de x L hypothèse H a est vraie la loi de x peut être approchée par la loi gaussiee de moyee 58 et d écart type 5.1 35 Supposos que l hypothèse H 0 soit vraie. O calcule la probabilité d observer ue valeur iférieure à 59.1. O a P 0 ( x 59.1) = P ( x 63 0.86 = F 0,1 ( 4.53) = 1 F 0,1 (4.53) 310 6 ) 59.1 63 0.86 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 111 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 112 / 166

la société de trasport (suite) Défiitios et exemples Commet choisir la limite c? O fixe α = 5%, la probabilité de commettre ue erreur quad H 0 est vraie, autremet dit α est la probabilité que x < c quad H 0 est vraie. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 113 / 166 la société de trasport (suite) Défiitios et exemples Autremet dit o cherche la valeur c telle que 1 la loi de x peut être approchée par la loi gaussiee de moyee 63 et d écart type 5.1 35 2 P 0 ( x < c) = 0.05 ( x 63 P 0 ( x < c) = P 0.86 < c 63 ) 0.86 ( ) c 63 = F 0,1 = 0.05 0.86 d où et ( F 0,1 c 63 ) = 0.95 0.86 c 63 = 1.64 c = 61.58 0.86 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 114 / 166 la société de trasport (fi) Défiitios et exemples Test sur la moyee La décisio O a observé x = 59.1. Comme x < c = 61.58, o décide de rejeter l hypothèse ulle (o accepte la réductio de la durée du trajet) pour le test de seuil α = 5%. U autre type d erreur O calcule la probabilité de décider H 0 alors que H a est vraie La loi de x peut être approchée par la loi gaussiee de moyee 58 et d écart type 5.1 35 4 Défiitios et exemples Test sur la moyee Comparaiso de deux échatillos Test du χ 2 P 1 ( x > 61.58) = P ( x 58 0.86 = 1 F 0,1 ( 61.58 58 0.86 ) 61.58 58 > 0.86 ) = 10 5 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 115 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 116 / 166

Test sur la moyee Test sur la moyee Décisio et erreur Décisio O teste les hypothèses H 0 cotre H a État de la populatio H 0 est vraie H a est vraie Accepter H 0 Décisio correcte Erreur de 2de espèce Rejeter H 0 Erreur de 1ère espèce Décisio correcte Notatios : α est la probabilité de commettre ue erreur de première espèce β est la probabilité de commettre ue erreur de secode espèce A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 117 / 166 La démarche 1 O fixe la probabilité d erreur de première espèce α c est le risque de rejeter H 0 (accepter H a ) alors que H 0 est vraie. 2 O costruit ue régio R 0 telle que si x R o alors o rejette l hypothèse ulle H 0 (o accepte H a ) la probabilité de x R o est égale à α quad H 0 est vraie Défiitio O dit que la décisio est prise au iveau α Remarque La probabilité d erreur de secode espèce β est pas fixée par le statisticie qui met e œuvre le test. Pour de ombreux tests, il est pas possible de calculer la valeur de β. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 118 / 166 Test sur la moyee Test sur la moyee Les décisios La décisio est prise à partir d u échatillo de taille. O calcule la moyee de l échatillo x. Si x R o alors o décide de rejeter H 0 (d accepter H a ). Le risque de commettre ue erreur est iférieur ou égal à α. Si x R o alors o décide d accepter H 0. Remarque Lorsque β est icou, o utilise plutôt l expressio o e peut pas rejeter H 0 plutôt que o accepte H 0. Utiliser cette expressio permet de différer tout jugemet et toute actio. Tester les hypothèses de recherche Situatio : Les voitures de type XYZ cosommet e moyee, 9 litres d essece tous les 100 kilomètres. Des chercheurs ot développé u ouveau moteur pour ce modèle. Hypothèses : Les chercheurs veulet prouver que le ouveau moteur est plus écoomique. O ote µ la cosommatio moyee e litres pour 100 kilomètres. L hypothèse de recherche est µ < 9 Les hypothèses appropriées sot H 0 : µ = 9 et H a : µ < 9 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 119 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 120 / 166

Test sur la moyee Costructio du test sur la cosommatio O mesure la cosommatio sur u échatillo de 100 voitures équipées du ouveau moteur. O calcule la moyee x Commet fixer la limite C? Si x C alors o accepte H a sio o accepte H 0 1 O fixe l erreur de première espèce α = 0.05 2 O cherche la valeur de C telle que si H 0 est vraie [µ = 9], o a P(accepter H a ) = P( x < C) = 0.05 Test sur la moyee O dispose d u grad échatillo = 100 > 30 et σ = 1 est cou. Si H 0 est vraie alors la loi de Z = x 9 1/ peut être approchée par 100 ue loi gaussiee stadard 0 1 2 3 4 Decisio Ha Decisio Ho 5% 8.6 8.8 9.0 9.2 9.4 x loi de x sous Ho O cherche C telle que P( x < C) = P(Z C 9 1/ 100 ) = 0.05 Das la table, o lit C 9 1/ = 1.64 doc C = 8.83 100 Si x < 8.83 alors o rejette l hypothèse ulle (o accepte l hypothèse alterative) au iveau 5% A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 121 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 122 / 166 Test sur la moyee Test sur la moyee Tester la validité d ue assertio Sur l échatillo costitué par les igéieurs, la moyee des cosommatios est égale à x = 8.5. Les résultats de l échatillo idiquet que l o rejette H 0 et doc que l o accepte H a au iveau 5% Les igéieurs ot le support statistique écessaire pour affirmer que le ouveau moteur est plus écoomique. La productio pourra alors commecer. Situatio : U producteur de tiges filetées préted que la logueur moyee µ des tiges est d u mètre. U échatillo de tiges est costitué et leur logueur est mesurée pour tester l affirmatio du fabricat. Hypothèses : O accorde le bééfice du doute au producteur et so assertio correspod à H 0. O formule les hypothèses H 0 : µ = 1 et H a : µ 1 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 123 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 124 / 166

Test sur la moyee Costructio du test sur la qualité des pièces O mesure la logueur de 100 tiges. O calcule la moyee x Commet fixer la limite C? Si x 1 C alors o accepte H a sio o accepte H 0 1 O fixe l erreur de première espèce α = 0.05 2 O cherche la valeur de C telle que si H 0 est vraie [µ = 1] alors P(accepter H a ) = P( x 1 > C) = 0.05 Test sur la moyee O dispose d u grad échatillo = 100 > 30 et σ = 1 est cou. Si H 0 est vraie alors la loi de Z = x 1 1/ peut être approchée par 100 ue loi gaussiee stadard 0 1 2 3 4 Decisio Ha Decisio Ho 2.5% 2.5% 0.6 0.8 1.0 1.2 1.4 x loi de x sous Ho Decisio Ha O cherche C telle que P( x 1 > C) = P( Z = 0.05 Das la table, o lit C 1/ = 1.96 doc C = 0.19 100 C 1/ 100 ) Si x < 0.81 ou x > 1.19 alors o rejette l hypothèse ulle (autremet dit o accepte l hypothèse alterative) au iveau 5%. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 125 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 126 / 166 Test sur la moyee Test sur la moyee Les différetes hypothèses sur la moyee de la populatio Sur l échatillo de tiges, la logueur moyee des tiges est x = 1.1. Les doées de l échatillo e permettet pas de rejeter H 0. O accepte H 0. O e peut pas cotester l affirmatio du fabricat. Hypothèse ulle H 0 la moyee est égale à µ 0 H 0 : µ = µ 0 la moyee est supérieure ou égale à µ 0 H 0 : µ µ 0 la moyee est iférieure ou égale à µ 0 H 0 : µ µ 0 Hypothèse alterative H a la moyee est différete de µ 0 H a : µ µ 0 la moyee est strictemet supérieure à µ 0 H a : µ > µ 0 la moyee est strictemet iférieure à µ 0 H a : µ < µ 0 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 127 / 166 Remarque L égalité doit toujours apparaître das l hypothèse ulle H 0. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 128 / 166

Test sur la moyee Test sur la moyee : grad, σ cou Hypothèse Hypothèse H a est acceptée ulle H 0 alterative H a H 0 est rejetée µ = µ 0 µ > µ 0 µ µ 0 x > µ 0 + q(1 α) σ µ = µ 0 µ < µ 0 µ µ 0 x < µ 0 q(1 α) σ Test sur la moyee Test sur la moyee : grad, σ icou Hypothèse Hypothèse H a est acceptée ulle H 0 alterative H a H 0 est rejetée µ = µ 0 µ > µ 0 µ µ 0 x > µ 0 + q(1 α) S µ = µ 0 µ < µ 0 µ µ 0 x < µ 0 q(1 α) S µ = µ 0 µ µ 0 x > µ 0 + q(1 α/2) σ ou bie x < µ 0 q(1 α/2) σ µ = µ 0 µ µ 0 x > µ 0 + q(1 α/2) S ou bie x < µ 0 q(1 α/2) S A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 129 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 130 / 166 Test sur la moyee Test sur la moyee : cas gaussie, σ cou Hypothèse Hypothèse H a est acceptée ulle H 0 alterative H a H 0 est rejetée µ = µ 0 µ > µ 0 µ µ 0 x > µ 0 + q(1 α) σ µ = µ 0 µ < µ 0 µ µ 0 x < µ 0 q(1 α) σ Test sur la moyee Test sur la moyee : cas gaussie, σ icou Hypothèse Hypothèse H a est acceptée ulle H 0 alterative H a H 0 est rejetée µ = µ 0 µ > µ 0 µ µ 0 x > µ 0 + t( 1, 1 α) S c µ = µ 0 µ < µ 0 µ µ 0 x < µ 0 t( 1, 1 α) S c µ = µ 0 µ µ 0 x > µ 0 + q(1 α/2) σ ou bie x < µ 0 q(1 α/2) σ µ = µ 0 µ µ 0 x > µ 0 + t( 1, 1 α/2) S c ou bie x < µ 0 t( 1, 1 α/2) S c A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 131 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 132 / 166

Comparaiso de deux échatillos Comparaiso de deux échatillos de comparaiso 4 Défiitios et exemples Test sur la moyee Comparaiso de deux échatillos Test du χ 2 Problème O veut tester si deux échatillos ot la même moyee. Deux situatios 1 les deux échatillos sot idépedats Exemple O veut comparer les salaires moyes des techicies de deux etreprises. 2 les échatillos sot appariés Exemple Pour tester l efficacité d u médicamet, o compare le taux de cholestérol avat et après le traitemet sur u groupe de malades. Les échatillos e sot pas idépedats car les mesures sot effectuées sur les mêmes idividus. A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 133 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 134 / 166 Comparaiso de deux échatillos Comparaiso de deux échatillos Échatillos idépedats Plus gééralemet U grad magasi implate deux boutiques l ue est située das le cetre ville l autre das u cetre commercial e balieue Le directeur des vetes remarque que les produits qui se vedet bie das u des magasis e se vedet pas forcémet bie das le secod. Il attribue cette variatio des vetes au fait que l âge moye des cliets est différet etre les deux magasis. boutique taille âge moye écart type de l échatillo pop. 1 cetre ville 1 = 36 x 1 = 40 as S 1 = 9 as pop. 2 balieue 2 = 49 x 2 = 35 as S 2 = 10 as O suppose que les deux populatios sot idépedates Populatio 1 moyee µ 1 écart type σ 1 Populatio 2 moyee µ 2 écart type σ 2 La questio Les deux moyees sot-elles égales? µ 1 = µ 2? O teste µ 1 = µ 2 cotre µ 1 µ 2 Les observatios : o dispose de deux échatillos idépedats. échatillo 1 extrait de la populatio 1 taille 1 moyee x 1, écart type S 1 échatillo 2 extrait de la populatio 2 taille 2, moyee x 2, écart type S 2 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 135 / 166 A. Φlippe (U. Nates) Méthodes de statistique iféretielle. 19 mai 2016 136 / 166