CHAPITRE 8 - Échantillons, simulations et fluctuations d'échantillonnage



Documents pareils
POKER ET PROBABILITÉ

NOTIONS DE PROBABILITÉS

Probabilités conditionnelles Loi binomiale

Exemple On lance une pièce de monnaie trois fois de suite. Calculer la probabilité d obtenir exactement deux fois pile.

Feuille d exercices 2 : Espaces probabilisés

Analyse Combinatoire

Les probabilités. Chapitre 18. Tester ses connaissances

La simulation probabiliste avec Excel

Fluctuation d une fréquence selon les échantillons - Probabilités

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Seconde et première Exercices de révision sur les probabilités Corrigé

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Pourquoi l apprentissage?

Chapitre 3. Les distributions à deux variables

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

1. Déterminer l ensemble U ( univers des possibles) et l ensemble E ( événement) pour les situations suivantes.

Trier les ventes (sales order) avec Vtiger CRM

P1 : Corrigés des exercices

INTRODUCTION. A- Modélisation et paramétrage : CHAPITRE I : MODÉLISATION. I. Paramétrage de la position d un solide : (S1) O O1 X

Probabilités sur un univers fini

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

Idées reçues et autres contre-vérités

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Logiciel d'analyse de la Masse Salariale

Gestion de projet - contraintes, chevauchement, attente entre 2 tâches, jalons

Qu est-ce qu une probabilité?

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

RECUEIL DES RÈGLES DE GESTION RÈGLEMENT RELATIF À LA NOMINATION ET AU RENOUVELLEMENT DE MANDAT DU DIRECTEUR GÉNÉRAL ET DU DIRECTEUR DES ÉTUDES (R-02)

Calculs de probabilités

Algorithmique avec Algobox

PROBABILITÉS CONDITIONNELLES

Application 1- VBA : Test de comportements d'investissements

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Des familles de deux enfants

Les outils de simulation pour chaque type de structure permettent d estimer l impact de la réforme sur la période

Exercices sur le chapitre «Probabilités»

Comment les Français gèrent l eau dans leurs foyers?

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Ecran : Processeur : OS : Caméra : Communication : Mémoire : Connectique : Audio : Batterie : Autonomie : Dimensions : Poids : DAS :

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Epreuve écrite d admissibilité du Mercredi 15 Janvier 2014 DOSSIER REPONSE

Facebook : Attention aux images!

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

ENQUÊTE AUPRÈS DES EMPLOYEURS DE BLIND RIVER

Réseau : Interconnexion de réseaux, routage et application de règles de filtrage.

Les Français et le don d organes

Navigation dans Windows

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Terminal Infocomm et Poste Infocomm

Notice de paramétrage Version 1.1

Carl-Louis-Ferdinand von Lindemann ( )

Andrey Nikolaevich Kolmogorov

TRAVAUX DIRIGÉS D'ÉLECTRONIQUE DE PUISSANCE

Femme ascensoriste pourquoi pas VOUS?

Exercices de dénombrement

I. Cas de l équiprobabilité

Feature Team Primer. par Craig Larman et Bas Vodde. Version 1.2

Tout ce que vous avez toujours voulu savoir sur Les Assessment Centers.

Mode d emploi base de données AIFRIS : Commande et inscriptions

Le coloriage virtuel multiple et ses applications

Sondage d opinion auprès des Canadiens Perception à l égard des couples de même sexe PROJET

LES GENERATEURS DE NOMBRES ALEATOIRES

L'INTÉRÊT COMPOSÉ. 2.1 Généralités. 2.2 Taux

ROTARY INTERNATIONAL District 1780 Rhône-Alpes Mont-Blanc Don volontaire de cellules souches

Le seul ami de Batman

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

P R E AV I S N 3 1 / Parcelle no 48 - Secteur Ramiers Demande de crédit extrabudgétaire. pa_31_secteur-ramiers-p-48.doc/29.09.

CALCUL DES PROBABILITES

Par : Abdel YEZZA, Ph.D. Date : avril 2011 / mise à jour oct (ajout de la section 3 et augmentation de la section 1)

Comment retrouver le fichier "bingo" sauvegardé dans l'ordinateur? Socle commun

Un nouveau regard de l assurance au féminin : la «Hub Decider Woman» Paris, le 8 juin 2011

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

Plan pluriannuel d accessibilité du BCEI Dernière mise à jour : décembre Exigence Délai Description État

SE FORMER. une passerelle vers l emploi. Personnes Handicapées AIDES ET SERVICES DE L AGEFIPH NOVEMBRE l Les bonnes questions à se poser

L emploi des jeunes. Les résultats de l étude Avril pour

LE PROBLEME DU PLUS COURT CHEMIN

ht t p: // w w w.m e di al o gis.c om E - Ma i l : m ed i a l og i m e di a l o g i s. c om Envoi des SMS

Probabilités Loi binomiale Exercices corrigés

Trouver un job grâce au numérique : les défis du marché du recrutement en ligne

Projet L1, S2, 2015: Simulation de fourmis, Soutenance la semaine du 4 mai.

L IMPÔT SUR LA FORTUNE

Ch.G3 : Distances et tangentes

Fonctions de deux variables. Mai 2011

Impact des robots d indexation sur le cache de second niveau de SPIP IMBERTI Christophe - SG/SPSSI/CP2I/DO Ouest 06/06/2012 mis à jour le 05/07/2012

Traitement de texte : Quelques rappels de quelques notions de base

Proposition de correction pour l épreuve de STG Communication et gestion des ressources humaines

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

SIMULER ET CONCEVOIR LE TRAVAIL FUTUR

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Structures algébriques

Observatoire Orange Terrafemina

Comparaison de fonctions Développements limités. Chapitre 10

Entente administrative sur la certification de produits conclue entre. la Direction générale de Transports Canada, Aviation civile (TCAC)

Transcription:

CHAPITRE 8 - Échantillons, simulations et fluctuations d'échantillonnage A) Définitions 1) Échantillons Un échantillon, au sens statistique, est un sous-ensemble d'un ensemble plus grand, qu'on espère représentatif de cet ensemble, et qu'on étudie précisément à sa place pour obtenir des renseignements probables sur lui. Exemples :. Avant une élection, on fait des sondages pour prévoir le résultat. Pour cela, on sélectionne un certain nombre de personnes, supposées constituer un "échantillon" représentatif de l'ensemble des votants, et on leur demande leurs intentions de vote.. Si on veut connaître la répartition des espèces dans un lagon, on choisit un certain nombre d'habitats représentatifs du lagon, et on décompte les membres de chaque espèce dans ces endroits sélectionnés. ) Simulations Une simulation consiste, en statistiques, à collecter les résultats trouvés à partir d'un échantillon et à en tirer des paramètres statistiques qui devraient ressembler à ceux de l'ensemble complet. Si on connaît la loi de probabilité suivie par le caractère étudié sur cet ensemble, on peut réaliser des simulations par informatique, ou par des expériences aléatoires obéissant à la même loi. Exemples :. Au lancer de pièce de monnaie, pile ou face ont autant de chances d'arriver (on parle d'équiprobabilité). On peut donc simuler un lancer de pièce en utilisant un programme d'ordinateur (ou de calculatrice) pour créer une suite de "1" et de "0" tirés au hasard, qui représenteront les piles et les faces.. De même, si un dé n'est pas truqué, les chiffres de 1 à 6 sont des résultats équiprobables. Une calculatrice ou un ordinateur muni d'un logiciel adéquat (tableur par ex) peut aussi nous fournir des nombres aléatoires, qui permettent de simuler des lancers de dés (lancers fictifs). 3) Fluctuations d'échantillonnages Si l'on fait plusieurs simulations, leurs résultats ne seront pas forcément identiques, puisque le hasard intervient. On parle alors de "fluctuation d'échantillonnage" pour exprimer que les résultats varient d'une simulation à l'autre. 4) Intervalle de fluctuation a) Définition Imaginons que l'on ait fait un grand nombre de simulations, chacune sur un échantillon de n éléments (que ce soient des individus, des tirages ou des expériences), dans un cas où deux réponses seulement sont possibles (on les appellera "pile" et "face"). On appelle alors intervalle de fluctuation l'intervalle à l'intérieur duquel se situent 95% des résultats de simulations. Page 1/5

b) Théorème (admis) : Si le résultat suit une "loi de Bernoulli (ou Bernouilli)", c'est à dire avec deux réponses possibles, et une probabilité égale à p d'obtenir "pile" et 1 p d'obtenir "face", et si on a les conditions "n > 5" et "0, p 0,8", Alors cet intervalle aura pour largeur n. Autrement dit : Si l on fait des simulations et que la probabilité d un résultat est p, 95 % des résultats trouvés par les simulations se trouveront dans l intervalle [ p 1 n ; p+ 1 n ]. Réciproquement : Si on fait une simulation pour estimer une probabilité p, on aura 95 % de chances que p se trouve dans l intervalle [ f 1 n ; f + 1 n ] où f est le résultat de la simulation sur un échantillon de dimension n. c) Exemples : i) Supposons qu'on lance un dé bien équilibré, et qu'on compte le nombre de résultats supérieurs à 4. Cet événement aura chances sur 6, don 1 sur 3; de se produire, soit une probabilité p = 1/3 33%. Si l'on fait un millier d'échantillons de 100 lancers aléatoires, l'intervalle de fluctuation aura une largeur de 100 = 10 =0,, donc 95% des résultats seront entre 3% et 43%. ii) Supposons qu un sondage sur 100 personnes donne 35 % de chances que le candidat A soit élu, quel sera l intervalle de fluctuation correspondant? Même question si on interroge 1 000 personnes. B) Exemples de simulations 1) Jeu de Pile ou Face a) But de la simulation Vérifier que sur un grand nombre d'essais, on obtient bien à peu près autant de pile que de face.. On utilise la calculatrice pour générer des nombres aléatoires dont on extrait les chiffres (on peut aussi utiliser un tableur où on demande un nombre aléatoire égal à 0 ou 1).. On assimile pile à pair et face à impair. On compte les résultats. On fait un diagramme en bâtons c) Examen des résultats. On doit constater que l'on a à peu près 50% de "pile" et 50% de "face". d) Intervalle de fluctuation Si l'on fait 1 000 échantillons de 100 essais, on devra trouver que 95% des résultats sont compris entre 40% et 60%. Page /5

) Famille de deux enfants a) Présentation du problème On a 3 possibilités : FF, FG ou GG (F = Fille, G = Garçon). On suppose que F et G sont équiprobables et on veut avoir une idée de la répartition entre FF, FG et GG. Plutôt que de faire des statistiques sur une vraie population, on va faire une simulation.. Même principe que pour le (1) mais cette fois on associe chaque fois deux lancers successifs pour trouver un résultat.. On calcule ensuite les fréquences des 3 résultats possibles. c) Examen du résultat On doit constater la répartition suivante : ¼ ; ½ ; ¼. 3) Lancer de dés a) Présentation du problème Le résultat est un nombre de à 1, mais ces nombres ne sont pas équiprobables!. Comme en 1, mais on retient seulement les chiffres 1 à 6 et on les groupe par. On peut aussi avec un tableur trouver des chiffres aléatoires entre 1 et 6.. On fait un tableau c) Examen du résultat. On voit là non équiprobabilité des résultats possibles. Explication : Imaginons que le premier dé est rouge et l'autre bleu. On peut trouver tous les résultats équiprobables possibles en associant à chaque résultat du dé bleu chaque résultat du dé bleu. On compte alors, pour chaque somme de à 1, les résultats qui donnent cette somme. Ce nombre, divisé par le nombre total de résultats possibles, donne la probabilité de chaque somme. 4) Calcul de π a) But Calculer π en utilisant des nombres aléatoires. Si on prend des points au hasard, c'est-à-dire des couples (x,y) de réels au hasard, leur répartition doit se faire en fonction des aires respectives du quart de cercle et du carré. Page 3/5

c) Calculs et examen du résultat. Ça marche! (mais la convergence est très lente!) d) Intervalle de fluctuation En essayant 1 000 fois avec des échantillons de 100 essais, trouver l'intervalle de fluctuation. C) Application à la prise de décisions 1) Prise de décision à partir d'un échantillon Exemple : Parité ou pas parité? Deux entreprises recrutent dans un bassin d'emploi où il y a autant de femmes que d'hommes. On voudrait savoir si elles respectent la parité. Dans l'entreprise A, il y a 100 employés, dont 43 femmes, soit 43%. Dans l'entreprise B, il y a 500 employés dont 1150 femmes, soit 46%. Question 1 : Quelle entreprise respecte le mieux la parité? On pourrait croire que c'est la B... Hé bien non!!!! Supposons que les deux entreprises suivent la règle de la parité, c'est à dire qu'il y a 50% de chances de recruter une femme, et 50% un homme. L'intervalle de fluctuation pour la première entreprise est de 100 =0%, donc la proportion doit être comprise entre 40% et 60%, ce qui est le cas. L'intervalle de fluctuation pour la second entreprise est de comprise entre 48% et 5%, ce qui n'est pas le cas. Donc, c'est bien l'entreprise B qui ne respecte pas la parité... Question : 500 =4%, donc la proportion doit être Quelle nombre d'employés aurait dû avoir l'entreprise B pour être dans les 95% de chances de respecter la parité? Page 4/5

) Estimation d'une proportion Supposons que sur un échantillon représentatif de 400 personnes, on obtienne une moyenne de 70% de "oui" à une question donnée. Quelle est la largeur de l'intervalle de sécurité qui permet d'avoir 95% de chances de contenir la vraie moyenne? Ce sera 400 = 0 =10%, donc elle sera comprise entre 65% et 75%. Exemple : Que serait l'intervalle de sécurité de 95% si l'échantillon est de 900 personnes? Page 5/5