Échantillonnage - Estimation

Documents pareils
Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Fluctuation d une fréquence selon les échantillons - Probabilités

TESTS D'HYPOTHESES Etude d'un exemple

Dérivation : Résumé de cours et méthodes

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Probabilités. I - Expérience aléatoire. II - Evénements

POKER ET PROBABILITÉ

Probabilités conditionnelles Loi binomiale

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Les suites numériques

Régime de retraite patronal-syndical (Québec) de l'association internationale des machinistes (A.I.M.)

Algorithmique avec Algobox

Date : Tangram en carré page

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Espaces probabilisés

CHAPITRE VIII : Les circuits avec résistances ohmiques

I. Introduction aux fonctions : les fonctions standards

LES GENERATEURS DE NOMBRES ALEATOIRES

Les probabilités. Chapitre 18. Tester ses connaissances

Probabilités Loi binomiale Exercices corrigés

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Probabilités conditionnelles Loi binomiale

La simulation probabiliste avec Excel

Factorisation Factoriser en utilisant un facteur commun Fiche méthode

Par combien de zéros se termine N!?

TP : Shell Scripts. 1 Remarque générale. 2 Mise en jambe. 3 Avec des si. Systèmes et scripts

Pourquoi l apprentissage?

Raisonnement par récurrence Suites numériques

NOTIONS DE PROBABILITÉS

6. Les différents types de démonstrations

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Guide pour remplir la fiche de règlement d emprunt

Exemple On lance une pièce de monnaie trois fois de suite. Calculer la probabilité d obtenir exactement deux fois pile.

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Effectuer un paiement par chèque

Cours d algorithmique pour la classe de 2nde

L'INTÉRÊT COMPOSÉ. 2.1 Généralités. 2.2 Taux

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Exercices sur le chapitre «Probabilités»

QUELQUES RELATIONS ENTRE LES PRINCIPAUX MOMENTS REPRÉSENTATIFS DU RISQUE EN ASSURANCE AUTOMOBILE, SUR LA BASE D'UN ÉCHANTILLON SEGMENTÉ

Indépendance Probabilité conditionnelle. Chapitre 3 Événements indépendants et Probabilités conditionnelles

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Faciliter l adhésion à une complémentaire santé

Investissement dans la construction de nouveaux bâtiments résidentiels (travaux mis en place) Méthodologie

ANALYSE GÉNÉRALE - PROPOSITION DE CORRIGÉ. Exercice 1

VI- Exemples de fiches pédagogiques en 3 ème année primaires

Définition : On obtient les nombres entiers en ajoutant ou retranchant des unités à zéro.

Condition de stabilité d'un réseau de les d'attente à deux stations et N classes de clients 1

Introduction à la Statistique Inférentielle

Listes de fournitures du secondaire pour la rentrée

D'UN THÉORÈME NOUVEAU

Carl-Louis-Ferdinand von Lindemann ( )

Les bases de données Page 1 / 8

Exercices INF5171 : série #3 (Automne 2012)

Copropriété: 31, rue des Abondances Boulogne-Billancourt

Simulation en santé. Outil de gestion des risques. Avril Dr MC Moll 1

Programmation Objet - Cours II

MATHÉMATIQUES APPLIQUÉES S4 Exercices

1. Création d'un état Création d'un état Instantané Colonnes Création d'un état Instantané Tableau... 4

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Simulation de variables aléatoires

Examen Médian - 1 heure 30

Renouvellement du conseil d administration du CCAS/CIAS

D.E.S.C.F - UV 1 - Module 8 Consolidation dans les groupes de sociétés. Corrigé - Cas IG/IP/MEE

Application BAEP 1 Poutre continue à deux travées

Resolution limit in community detection

= constante et cette constante est a.

Rapidolect Les Productions de la Columelle ( ) Page 1

Exercices de dénombrement

Angles orientés et trigonométrie

Les devoirs en Première STMG

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

Série TD 3. Exercice 4.1. Exercice 4.2 Cet algorithme est destiné à prédire l'avenir, et il doit être infaillible! Exercice 4.3. Exercice 4.

LES NOUVELLES CONTRAINTES EN MATIERE DE MARCHES PUBLICS

TP3 : Creation de tables 1 seance

Chapitre 2. Classes et objets

LES DECIMALES DE π BERNARD EGGER

Dossier projet isn 2015 par Victor Gregoire

I GENERALITES SUR LES MESURES

Initiation à la programmation en Python

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

Initiation à la recherche documentaire

Régler les paramètres de mesure en choisissant un intervalle de mesure 10µs et 200 mesures.

Complément d information concernant la fiche de concordance

Les 5 différents types d ordres

Problème : Calcul d'échéanciers de prêt bancaire (15 pt)

Création d'un questionnaire (sondage)

Le chiffre est le signe, le nombre est la valeur.

Informations générales

Protection sociale complémentaire : les dispenses d'affiliation de vos salariés (retraite, prévoyance, mutuelle)

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Introduction a l'algorithmique des objets partages. Robert Cori. Antoine Petit. Lifac, ENS Cachan, Cachan Cedex. Resume

P1 : Corrigés des exercices

CH.6 Propriétés des langages non contextuels

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Probabilités conditionnelles

Mathématiques et petites voitures

Transcription:

Échantillonnage - Estimation 2 nde Introduction : Ce chapitre répond à deux types de questions : Exemple d'introduction. Vu le sondage, le candidat sera-t-il élu ou non? (Oral) Avant une élection, un sondage indique qu'un candidat a 56 % d'intentions de votes. Mais si un sondage sur 4 personnes ne nous dit pas la même chose que s'il s'agit d'un sondage sur 000 personnes. Remarquons aussi que la proportion de votants avorables au candidats dépend de l'échantillon choisi. Combien de personnes aut-il interroger pour être sûr(e) qu'il sera élu? Peut-on être sûr(e) à 00%? non. Alors «sûr» dans quel sens? Exemple d'introduction 2. Discrimination ou non? (Oral) Au vu de la proportion de emmes ou de noirs dans une entreprise, comment établir s'il y a discrimination ou non? A partir de quelle valeur la proportion est-elle anormalement aible et révèle une discrimination? Peut-on être sûr(e) à 00%? non. Alors «sûr» dans quel sens? Table des matières I. Modélisation de la situation... II. Intervalle de luctuation, intervalle de coniance... A. Intervalle de luctuation: Quelles luctuations peut-on attendre entre divers échantillons tirés d'une même population?...2 B. Intervalle de coniance: Pour évaluer la proportion dans l'ensemble de la population connaissant la proportion observée dans l'échantillon...2 I. Modélisation de la situation Déinition []. Un échantillon est une partie de la population étudiée. Les individus de l'échantillon sont choisis au hasard pour obtenir un échantillon représentati de l'ensemble de la population. Le nombre d'individus ormant l'échantillon s'appelle la taille de l'échantillon. Exemple d'introduction 3. Oral, diérencier P et. intentions de votes pour un candidat donné Pourcentage d'obèses? Critère = obèse ou non. Pourcentage de malades guéris par un nouveau médicament? Critère = guéris ou non. Notation [2]. On note p la proportion de la population (totale) vériiant le critère étudié. On note la proportion de l'échantillon vériiant le critère étudié ( comme réquence). Remarque : Pour une population donnée, p est ixe mais si on ait plusieurs sondages, on trouve des valeurs de légèrement diérentes à chaque ois. A quoi cela sert? permet souvent d'estimer p. Pour avoir une approximation raisonnablement précise, il aut que l'échantillon soit suisamment grand, voir [5]. Théorème de stabilisation des réquences [3]. Plus la taille de l'échantillon est grande, plus se rapproche de p. II. Intervalle de luctuation, intervalle de coniance Ce sont en ait deux versions du même théorème (et voilà pourquoi les conditions d'applications sont semblables), l'une [4] servant () à dire si la proportion observée semble compatible avec une populations dans laquelle la proportion est p et (2) à prévoir l'étendue des luctuations entre divers échantillons d'une même population; l'autre [5] servant à évaluer p connaissant, avec une précision d'autant meilleure que l'échantillon est grand. Mme Helme-Guizon Cours 2nde page

A. Intervalle de luctuation: Quelles luctuations peut-on attendre entre divers échantillons tirés d'une même population? On l utilise quand p, la proportion dans l'ensemble de la population, est connue ; l'hypothèse à vériier pour utiliser le théorème porte sur p et on obtient un encadrement de, la proportion observée dans l'échantillon. théorème de l'intervalle de luctuation au seuil de 95% [4]. si la taille n de l'échantillon est supérieure ou égale à 25 ( n 25 ) et si la proportion dans la population vériie 0,2 p 0,8 alors, dans ces conditions, dans plus de 95% des cas, la réquence observée vériie [ p n ; p+ càd p n p+ Intervalle de luctuations au seuil de 95% :Il existe des luctuations entre échantillons, mais, pour 95% au moins des échantillons, la proportion observée se trouve dans cet intervalle. Application 4. Si les conditions d'application du théorème sont vériiées mais que pourtant la proportion observée n'est PAS dans l'intervalle de luctuation, cela indique que soit dans la populations initiale la proportion n'etait pas égale à p soit que l'échantillon n'a pas été choisi au hasard soit que l'on est tombé sur un des rares échantillons pour lesquels cela se produit. Exemple: Discrimination ou non? Pratique: On calcule (ou on connait) une valeur théorique pour p et et on regarde si la proportion observée est dans l'intervalle de luctuation. Si les échantillons sont reéllement choisis au hasard, donc en l'absence de discrimination, pour au moins 95% des échantillons la réquence abservées est dans l'intervalle de luctuation. Si elle ne l'est pas, cela indique qu'il y a probablement 2 discrimination. Remarque : p n p+ n n p + B. Intervalle de coniance: Pour évaluer la proportion dans l'ensemble de la population connaissant la proportion observée dans l'échantillon On l utilise quand p, la proportion dans l'ensemble de la population, n'est PAS connue; l'hypothèse à vériier pour utiliser le théorème porte sur, la proportion observée dans l'échantillon (et pas sur p. Heureusement! Vu que p est inconnu, ce serait impossible à vériier!) et on obtient un encadrement de p. théorème de l'intervalle de coniance au seuil de 95% [5]. si la taille n de l'échantillon est supérieure ou égale à 25 ( n 25 ) et la proportion dans l'échantillon vériie 0,2 0,8 alors, dans ces conditions, dans plus de 95% des cas, la proportion dans la population (totale) vériie p [ n ; + càd n p + Intervalle de coniance au niveau 95%: On a coniance que p se trouve dans cet intervalle pour au moins 95% des échantillons observés. Application 5. Estimation de p d'après les resultats d'un sondage. Rappel sur les méthodes de travail : Travail quotidien = Reprendre ce qui a été ait en classe (en aisant des restitutions jusqu'à savoir retrouver sans aucune aide les déinitions et les propriétés vues ou révisées au cours de la séance et reaire sans aucune aide les exercices aits en classe au cours de la séance.) «rares» car avec le choix du seuil de 95%, il y a au plus 5% des échantillons pour lesquels n'est pas dans l'intervalle de luctuations. 2 «Probablement» car on travaille au seuil de 95% et pas 00%. Mme Helme-Guizon Cours 2nde page 2

Illustration de la notion d'intervalle de luctuation via une simulation Cette simulation vise à illustrer le théorème suivant : théorème de l'intervalle de luctuation au seuil de 95% si la taille n de l'échantillon est supérieure ou égale à 25 ( n 25 ) et si la proportion dans la population vériie 0,2 p 0,8 alors, dans ces conditions, dans plus de 95% des cas, [ p n ; p+ càd p n p+ Intervalle de luctuations au seuil de 95% :Il existe des luctuations entre échantillons, mais dans au moins 95% des échantillons, la proportion observée se trouve dans cet intervalle. Dans cette ormule, est la réquence observée : Par exemple, si on lance 00 ois une pièce, et que pile apparaît 59 ois, on dit que la réquence d apparition de «pile» est = 59 00 =0,59. p est la réquence théorique. Lorsqu'on étudie un caractère dans une population c'est la proportion de la population présentant ce caractère et dans le cas du lancer d'une pièce, c'est la probabilité. Lors du lancer d une pièce, nous avons deux possibilités : pile ou ace. La probabilité d avoir pile est de une chance sur deux d'où p= 2 =0,5 n est le nombre de répétitions de l expérience. Par exemple, si on lance 00 ois la pièce, n = 00. Cette ormule nous indique que si on lance 00 ois une pièce non truquée (c'est-à-dire pour laquelle on exactement autant de chance d obtenir «pile» que «ace»), l intervalle de luctuation à 95% a pour bornes : {p n =0,5 00 =0,5 0,=0,4 p+ n =0,5+ 00 =0,5+0,=0,6 Partie. Programmation de la simulation par une calculatrice du lancer d'un dé ) Avant de programmer, amiliarisons-nous avec les nombres aléatoires et la modélisation du problème. Pour comprendre la situation, commençons par un cas simple sans programmation : () Votre machine peut générer des nombres aléatoires : Rand (TI) ou Ran# (Casio ) est un nombre aléatoire compris entre 0 et (Plus précisément, 0 Rand <.) [voir Manuel Repères 2nde, page 67] (2) On choisit une règle qui indique si le nombre obtenu correspond à «pile» ou à «ace» : Par exemple, on peut dire que si Rand (ou Ran#) < 0.5, la pièce est tombée sur «pile». (3) Lancez 4 ois votre pièce virtuelle (= demandez 4 nombres aléatoires à votre machine), calculez à la main la réquence d apparition de pile. 2) Écrire un programme qui simule le lancer d une pièce. Vous allez réaliser un programme sur votre calculatrice qui aiche 4 nombres aléatoires et vous calculerez à la main la réquence d apparition de pile. 3) Écrire un programme qui simule le lancer d une pièce 25 ois de suite et qui calcule la réquence d apparition de «pile» : Améliorez le programme précédent pour qu il calcule (et aiche à la in!) la réquence d apparition de «pile». 4) A quoi s'attend-on pour la réquence observée lorsqu'on augmente le nombre de lancers?............................................................................................. Mme Helme-Guizon Cours 2nde page 3

Partie 2. Fluctuations de la réquence d'apparition de «PILE» quand on réalise plusieurs simulations ) Avec 25 lancers : Grâce à votre programme, vous allez alors simuler le lancer de 25 pièces à plusieurs reprises et noter la réquence d apparition de pile dans le tableau : Série de 25 lancers 2 3 4 5 6 7 8 9 0 [ 0,5 ;0,5 + 25 25]? On commencera par calculer 0,5 25 et 0,5 +, puis on complétera la phrase suivante : 25 Pour...... échantillons sur les 0 c'est à dire...... % des échantillons, la réquence observée est dans l'intervalle............... 2) Avec 00 lancers : Vous allez alors simuler le lancer de 00 pièces à plusieurs reprises et noter la réquence d apparition de pile. Série de 00 lancers 2 3 4 5 6 7 8 9 0 [ 0,5 ;0,5 + 00 00]? Réponse : Pour...... échantillons sur les 0 c'est à dire...... % des échantillons, la réquence observée est dans l'intervalle............... Partie 3. Fluctuations de la réquence d'un événement quand on lance un dé équilibré Écrire un programme qui simule le lancer d un dé. Vous étudierez la réquence d apparition de la ace «5» ou de la ace «6». Donnez vos conclusions. Coupe de pouce : La onction «partie entière», notée Int sur vos machines retourne le plus petit entier inérieur ou égal au nombre choisi. Ainsi, Int(3)=3 ; Int(2,8)=2 ; Int(3,5)=3 ; Int(87,25)=87...etc. TI 89 : int(+6*rand()) ; Casio x-9860g : Int(+6*Ran# ) Échantillonnage p connue Utilisation = Prise de décision à partir d'une échantillon : On regarde si la valeur observée pour est «raisonnable» (Pour voir s'il y a discrimination contre les emmes dans une entreprise, pour voir si un jury a vraiment été choisi au hasard...etc) Si n 25 et 0,2 p 0,8 alors pour au moins 95% des échantillons, la réquence observée vériie [ p n ; p+ n ] Intervalle de luctuation au seuil de 95% Résumé de cours Estimation p inconnue, Utilisation = Estimation : On estime p au moyen de. (pour estimer la proportion p de gens qui vont voter pour un candidat à partir des résultats d'un sondage...etc) Si n 25 et 0,2 0,8 alors pour au moins 95% des échantillons, la réquence théorique vériie p [ n ; + Intervalle de coniance au seuil de 95% Mme Helme-Guizon Cours 2nde page 4

Découverte de la notion d'intervalle de luctuation via une simulation Partie. Programmation de la simulation par une calculatrice du lancer d'un dé ) Avant de programmer, amiliarisons-nous avec les nombres aléatoires et la modélisation du problème. Pour comprendre la situation, commençons par un cas simple sans programmation : (4) Votre machine peut générer des nombres aléatoires : Rand (TI) ou Ran# (Casio ) est un nombre aléatoire compris entre 0 et (Plus précisément, 0 Rand <.) (5) On choisit une règle qui indique si le nombre obtenu correspond à «pile» ou à «ace» : Par exemple, on peut dire que si Rand (ou Ran#) < 0.5, la pièce est tombée sur «pile». (6) Lancez 4 ois votre pièce virtuelle (= demandez 4 nombres aléatoires à votre machine), calculez à la main la réquence d apparition de pile. 2) Écrire un programme qui simule le lancer d une pièce. Vous allez réaliser un programme sur votre calculatrice qui aiche 4 nombres aléatoires et vous calculerez à la main la réquence d apparition de pile. 3) Écrire un programme qui simule le lancer d une pièce 25 ois de suite et qui calcule la réquence d apparition de «pile» : Améliorez le programme précédent pour qu il calcule (et aiche à la in!) la réquence d apparition de «pile». 4) A quoi s'attend-on pour la réquence observée lorsqu'on augmente le nombre de lancers?............................................................................................. Partie 2. Fluctuations de la réquence d'apparition de «PILE» quand on réalise plusieurs simulations ) Avec 25 lancers : Grâce à votre programme, vous allez alors simuler le lancer de 25 pièces à plusieurs reprises et noter la réquence d apparition de pile dans le tableau : Série de 25 lancers 2 3 4 5 6 7 8 9 0 [ 0,5 25 25] ;0,5+ On commencera par calculer 0,5 et 0,5 +, puis on complétera la phrase suivante : 25 25 Pour...... échantillons sur les 0 c'est à dire...... % des échantillons, la réquence observée est dans l'intervalle............... 2) Avec 00 lancers : Vous allez alors simuler le lancer de 00 pièces à plusieurs reprises et noter la réquence d apparition de pile. Série de 00 lancers 2 3 4 5 6 7 8 9 0 [ 0,5 00 00] ;0,5+ Réponse : Pour...... échantillons sur les 0 c'est à dire...... % des échantillons, la réquence observée est dans l'intervalle............... Partie 3. Fluctuations de la réquence d'un événement quand on lance un dé équilibré Écrire un programme qui simule le lancer d un dé. Vous étudierez la réquence d apparition de la ace «5» ou de la ace «6». Donnez vos conclusions. Coupe de pouce : La onction «partie entière», notée Int sur vos machines retourne le plus petit entier inérieur ou égal au nombre choisi. Ainsi, Int(3)=3 ; Int(2,8)=2 ; Int(3,5)=3 ; Int(87,25)=87...etc. TI : int(+6*rand()) ou RanInt(,6) ou EntAlea(,6) chercher dans le catalogue (touche «catalog» ); Casio x-9860g : Int(+6*Ran# ), chercher dans le catalogue (touche «catalog»). Mme Helme-Guizon Cours 2nde page 5