Échantillonnage et estimation



Documents pareils
Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Probabilités conditionnelles Loi binomiale

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

TESTS D'HYPOTHESES Etude d'un exemple

Estimation et tests statistiques, TD 5. Solutions

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Feuille d exercices 2 : Espaces probabilisés

Probabilités sur un univers fini

Loi binomiale Lois normales

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

Probabilités Loi binomiale Exercices corrigés

I. Cas de l équiprobabilité

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Correction du baccalauréat STMG Polynésie 17 juin 2014

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Cours de Tests paramétriques

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Les devoirs en Première STMG

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Chapitre 3 : INFERENCE

Exercices sur le chapitre «Probabilités»

Fluctuation d une fréquence selon les échantillons - Probabilités

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Ressources pour le lycée général et technologique

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

P1 : Corrigés des exercices

Annexe commune aux séries ES, L et S : boîtes et quantiles

Correction du baccalauréat ES/L Métropole 20 juin 2014

Probabilités conditionnelles

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

4 Distributions particulières de probabilités

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Les probabilités. Chapitre 18. Tester ses connaissances

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Peut-on croire un sondage?

Calculs de probabilités conditionelles

Exemple On lance une pièce de monnaie trois fois de suite. Calculer la probabilité d obtenir exactement deux fois pile.

Qu est-ce qu une probabilité?

LES GENERATEURS DE NOMBRES ALEATOIRES

Principe d un test statistique

mathématiques mathématiques mathématiques mathématiques

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

PROBABILITÉS CONDITIONNELLES

Probabilités sur un univers fini

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

Comment faire parler les chiffres

Université Paris 8 Introduction aux probabilités Licence Informatique Exercices Ph. Guillot. 1 Ensemble fondamental loi de probabilité

mathématiques mathématiques mathématiques mathématiques mathématiques mathématiques SÉRIE ES ANNALES DES SUJETS DE MATHÉMATIQUES SESSION 2013

Exercices de dénombrement

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

Coefficients binomiaux

Travaux dirigés d introduction aux Probabilités

TSTI 2D CH X : Exemples de lois à densité 1

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

Mesure de probabilité, indépendance.

Lois de probabilité. Anita Burgun

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

1 Recherche en table par balayage

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

4. Exercices et corrigés

Espaces probabilisés

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Développements limités. Notion de développement limité

Image d un intervalle par une fonction continue

Chaînes de Markov au lycée

UE Ma probabilité conditionnelle, indépendance, dénombrement

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

La fonction exponentielle

Indépendance Probabilité conditionnelle. Chapitre 3 Événements indépendants et Probabilités conditionnelles

NOTIONS DE PROBABILITÉS

La simulation probabiliste avec Excel

Compte rendu du stage ATSM Probabilités et statistique

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Leçon 5. Systèmes de gestion à recomplétement périodique et stock de sécurité

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Relation entre deux variables : estimation de la corrélation linéaire

TEST PRATIQUE DU TEST DE LOGIQUE MATHEMATIQUE ET VERBAL

Chapitre 2. Eléments pour comprendre un énoncé

Baccalauréat ES Amérique du Nord 4 juin 2008

Statistique : Résumé de cours et méthodes

INTRODUCTION. 1 k 2. k=1

Probabilités conditionnelles Loi binomiale

Algorithmique avec Algobox

Probabilités. C. Charignon. I Cours 3

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Statistiques Descriptives à une dimension

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Transcription:

Échantillonnage et estimation Dans ce chapitre, on s intéresse à un caractère dans une population donnée dont la proportion est notée. Cette proportion sera dans quelques cas connue (échantillonnage), dans certains cas supposée connue (prise de décision) et dans d autres cas inconnue (estimation). Pour des raisons généralement économiques, on étudie le caractère, non pas sur la population entière, mais sur des échantillons de taille extraits de cette population. Pour ce faire, on prélève au hasard des individus de cette population un par un avec remise. On constitue ainsi un échantillon aléatoire de taille. Dans une situation tel qu un sondage on pourrait donc être amené à interroger deux fois la même personne. Pour éviter cela on procède successivement et sans remise. Si la taille de l échantillon n excède pas 10 % de la taille de la population entière, ce prélèvement ne modifie pas sensiblement la proportion du caractère dans la population. 1. Échantillonnage et prise de décisions Intervalle de fluctuation asymptotique d une fréquence, rappel Considérons une population d effectif dans laquelle un caractère qualitatif est répandu avec une proportion connue. Prélevons un échantillon de taille de cette population et soit la variable aléatoire qui compte le nombre d individu possédant le caractère ; cette variable suit une loi binomiale de paramètres et. La variable aléatoire est la fréquence aléatoire du caractère dans l échantillon. Dans une urne contenant 4 boules rouges et 6 boules blanches, on effectue tirages au hasard avec remise. Le nombre de boules rouges suit une loi binomiale de paramètres et. La fréquence de boules rouges est donnée par la variable aléatoire. À l aide de la calculatrice, on peut effectuer divers calculs. Par exemple : La probabilité qu on observe 42 % de boules rouges est La probabilité qu on observe au moins 40 % de boules rouges est La probabilité qu on observe entre 31 % et 50 % de boules rouges est Définition. On appelle intervalle de fluctuation au seuil de 95 % un intervalle tel que En seconde on a admis que l intervalle sous cette forme. convient. Le résultat était énoncé Échantillonnage et estimation Classe de Terminale ES Page 1

Théorème. Si est la proportion d un caractère dans une population (avec, alors pour un échantillon de taille avec, la fréquence du caractère dans l échantillon appartient à l intervalle avec une probabilité 95 %. L intervalle de fluctuation au seuil de 95 % de la fréquence de boules rouges observées dans des échantillons de taille 100 est Cela signifie qu avec une probabilité de 95 %, la fréquence de boules rouges dans un échantillon de taille 100 sera comprise entre 30 % et 50 % La loi binomiale permet de calculer très exactement les probabilités des différentes fréquences observables dans un échantillon de taille, à savoir les valeurs, avec. En calculant les probabilités des événements «la fréquence observée dans l échantillon prélevé de taille est comprise entre et», événement qui s écrit, on déterminera facilement un intervalle de fluctuation. Pour cela, on considère les plus petits entiers et tels et Un intervalle de fluctuation de au seuil de 95 % est alors. On cherche deux entiers et tels que. À l aide d un tableur ou d une calculatrice, on constate que est le plus petit entier tel que et est le plus petit entier tel que. Par conséquent on a ou encore. Donc est un intervalle de fluctuation au seuil de 95 % de la fréquence de boules rouges observées dans les échantillons de taille 100. Avec la méthode de seconde on avait trouvé, ce qui à peine moins précis, mais avec des calculs bien plus simples. Échantillonnage et estimation Classe de Terminale ES Page 2

Intervalle de fluctuation asymptotique et loi normale La variable aléatoire suit une loi binomiale de paramètres et. On admet que sa loi peut être approximée par la loi normale d espérance et d écart-type. Graphiquement, cela se traduit par le fait que l histogramme de la loi binomiale est très bien approché par la densité de la normale. En pratique dès que, et on utilise cette approximation. suit la loi binomiale de paramètre et. Comme, et, le résultat admis précédemment affirme que la loi de peut être approximée par une loi normale d espérance et d écart-type, c est-à-dire par la loi. On a représenté sur un même graphique la distribution de. ainsi la densité de la loi On a vu dans le chapitre précédent que On en déduit ou encore en divisant par, Ce résultat conduit au théorème suivant. Théorème. L intervalle est un intervalle de fluctuation asymptotique au seuil de 95 % de la variable aléatoire fréquence. Ici on a, donc l intervalle de fluctuation donné par cette méthode est. Échantillonnage et estimation Classe de Terminale ES Page 3

Prise de décision Dans ce paragraphe, la proportion du caractère étudié est supposée être égale à. La prise de décision consiste, à partir d un échantillon de taille, à valider ou non cette hypothèse faite sur la proportion. Pour ce faire, on calcule la fréquence observée du caractère étudié dans cet échantillon ; on détermine un intervalle de fluctuation asymptotique au seuil de 95 % de la fréquence par l une des 3 méthodes. enfin on applique la règle de décision suivante si la fréquence observée appartient à l intervalle de fluctuation asymptotique au seuil de 95 %, on ne rejette pas l hypothèse faite sur ; si la fréquence observée n appartient pas à l intervalle de fluctuation asymptotique au seuil de 95 %, on rejette l hypothèse faite sur la proportion avec un risque de 5 % de se tromper. Remarque. Le risque de 5 % signifie que la probabilité que l on rejette à tort l hypothèse faite sur la proportion alors qu elle est vraie est approximativement égale à 0,05. C est une probabilité conditionnelle. Dans le cas où l on ne rejette pas l hypothèse faite sur la proportion, le risque d erreur n est pas quantifié. Une machine fabrique des composants électroniques qui présentent un défaut de fabrication avec une probabilité. On constitue un échantillon de taille 100 de composants issus de la fabrication. On en détecte 49 présentant un défaut de fabrication. La machine nécessite-t-elle d être réparée? On fait l hypothèse que la machine est bien réglée, donc que. Un intervalle de fluctuation au seuil de 95 % de la fréquence de pièces présentant un défaut sur des échantillons de taille 100 est. On énonce la règle de décision : «Soit la fréquence observée de pièces présentant un défaut sur un échantillon de taille 100. Si, on ne rejette pas l hypothèse, sinon on la rejette». Ici, donc on ne rejette pas l hypothèse. On peut donc dire que la machine ne nécessite pas d être réparée, au seuil de confiance de 95 %. Échantillonnage et estimation Classe de Terminale ES Page 4

2. Estimation et intervalle de confiance Dans ce paragraphe, on suppose que la proportion du caractère étudié est inconnue. Définition. Un intervalle de confiance pour une proportion au niveau de confiance est la réalisation, à partir d un échantillon, d un intervalle aléatoire contenant la proportion avec une probabilité supérieure ou égale à. Théorème. L intervalle est un intervalle de confiance de la proportion au niveau de confiance. Remarques. Le niveau de confiance indique simplement que dans plus de 95 cas sur 100, on énonce à juste titre que la proportion inconnue appartient à l intervalle de confiance considéré. Par contre, on ne peut faire aucun pronostic sur la localisation possible de cette proportion dans l intervalle ; en particulier elle n a aucune raison d en être le centre. Il est incorrect de dire «la proportion se situe avec une probabilité égale à 95 % dans l intervalle de confiance» car le proportion n est pas aléatoire. Dans d autres disciplines on utilise l intervalle de confiance suivant : La proportion étant inconnue, on ne peut pas vérifier si les paramètres et satisfont les conditions, et. Pour remédier à ce problème, on approche la proportion inconnue par la fréquence observée sur l échantillon, puis on vérifie si les conditions, et sont satisfaites. Exemple Un sondage réalisé sur 989 personnes par l institut IPSOS le 19 avril 2002 avant le premier tour des élections présidentielles créditait Chirac de 20 % des votes, Jospin de 18 % et Le Pen de 14 %. Les intervalles de confiance des proportions de votes pour ces trois candidats étaient donc respectivement et Au seuil de confiance, on constate qu il était impossible de prédire le classement de ces trois candidats à l issue du premier tour. Leurs scores ont été respectivement 19,88 %, 16,18 % et 16,86 %, propulsant Le Pen au second tour contre toute attente (de la part des journalistes, mais pas des statisticiens)., Échantillonnage et estimation Classe de Terminale ES Page 5