Chapitre VI Échantillonages et simulations



Documents pareils
TESTS D'HYPOTHESES Etude d'un exemple

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Cours de Tests paramétriques

Probabilités Loi binomiale Exercices corrigés

Principe d un test statistique

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Probabilités conditionnelles Loi binomiale

Probabilités sur un univers fini

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Chapitre 3 : INFERENCE

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Fluctuation d une fréquence selon les échantillons - Probabilités

Les probabilités. Chapitre 18. Tester ses connaissances

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Probabilités sur un univers fini

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Exercices sur le chapitre «Probabilités»

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Analyse de la variance Comparaison de plusieurs moyennes

Calculs de probabilités conditionelles

LES GENERATEURS DE NOMBRES ALEATOIRES

Correction du baccalauréat ES/L Métropole 20 juin 2014

Estimation et tests statistiques, TD 5. Solutions

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Problèmes de Mathématiques Filtres et ultrafiltres

TSTI 2D CH X : Exemples de lois à densité 1

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Cryptographie et fonctions à sens unique

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Qu est-ce qu une probabilité?

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Intégration et probabilités TD1 Espaces mesurés Corrigé

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Document d orientation sur les allégations issues d essais de non-infériorité

Feuille d exercices 2 : Espaces probabilisés

P1 : Corrigés des exercices

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Loi binomiale Lois normales

Annexe commune aux séries ES, L et S : boîtes et quantiles

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Raisonnement par récurrence Suites numériques

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

NOTIONS DE PROBABILITÉS

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Commun à tous les candidats

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

4. Exercices et corrigés

Correction du baccalauréat S Liban juin 2007

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

La nouvelle planification de l échantillonnage

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

4 Distributions particulières de probabilités

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

CHAPITRE 5. Stratégies Mixtes

LES DECIMALES DE π BERNARD EGGER

Travaux dirigés d introduction aux Probabilités

1 de 46. Algorithmique. Trouver et Trier. Florent Hivert. Mél : Florent.Hivert@lri.fr Page personnelle : hivert


Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Limites finies en un point

Introduction à la Statistique Inférentielle

Introduction au Calcul des Probabilités

Chapitre 14 Cours à terme et futures. Plan

1. Les comptes de dépôt et d épargne

Exercices Corrigés Premières notions sur les espaces vectoriels

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Que faire lorsqu on considère plusieurs variables en même temps?

Ressources pour le lycée général et technologique

INF6304 Interfaces Intelligentes

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Arbre de probabilité(afrique) Univers - Evénement

Continuité d une fonction de plusieurs variables

Précision d un résultat et calculs d incertitudes

Conclusions de Madame l'avocat général Béatrice De Beaupuis

Chapitre 2. Eléments pour comprendre un énoncé

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Objets Combinatoires élementaires

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Image d un intervalle par une fonction continue

Dualité dans les espaces de Lebesgue et mesures de Radon finies

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

T de Student Khi-deux Corrélation

Logique. Plan du chapitre

Transcription:

Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des n résultats obtenus par n répétitions indépendantes de la même expérience. Exemple : On effectue deux séries de 00 lancés d une pièce équilibre et oote la fréquence d apparition du côté Pile. On obtient alors deux échantillons A et B de taille 00. Dans un groupe de 000 personnes, on selectionne un individu, oote la couleur de ses cheveux et on le replace dans le groupe. En répetant 50 fois cette experience, on obtient un échantillon de taille 50. Si l on constitue deux échantillons de taille n pour une même experience, on constate que les distributions des fréquences des deux échantillons ne sont pas les mêmes : c est ce qu on appelle la fluctuation d échantillonnage. 2. Intervalle de fluctuation Commentaires : Deux introductions possibles pour poser la problématique : À partir d une expérience aléatoire, on réalise des échantillons de taille n. Pour chaque échantillon, oote la fréquence d un caractère dont la probabilité est p. Les fréquences fluctuent autour de la probabilité. Cependant, sous certaines conditions, on peut encadrer cette fluctuation pour une majorité des échantillons. Soit une experience aléatoire pour laquelle la probabilité p d un caractère est connue. On souhaite réaliser un échantillon de taille n de cette expérience. En raison de la fluctuation d échantillonnage, la fréquence qui sera observée pour le caractère ne sera pas égale à la probabilité attendue. Cependant, sous certaines conditions et en admettant un certain risque, l écart entre ces valeurs peut être encadrer. Ainsi la fréquence f calculée sur un échantillon de taille n diffère très souvent de la probabilité p d apparition du caractère étudié. Sous certaines conditions, on peut encadrer cette fluctuation.

Chapitre 6 Théorème : Soit un échantillon de taille n 25 sur lequel on observe un caractère de probabilité d apparition p tel que 0, 2 p 0, 8. Si f désigne[ la fréquence du caractère observé dans l échantillon, alors f appartient à l intervalle p ; p + ] avec une probabilité d au moins 0, 95. Cet intervalle est appelé intervalle de fluctuation de taille n au seuil de 95%. Application : Prévision Autrement dit, dans au moins 95% des cas, l écart entre la fréquence observée et la probabilité est inférieur à n. Ainsi, si je réalise un échantillon, je peux affirmer en prenant un risque de 5%, que la fréquence que j obtiendrais sera dans l intervalle de fluctuation. La valeur est appelé la marge d erreur au seuil de 95%. n Commentaires : Attention, plus mon échantillon est grand, plus l intervalle est précis mais le risque d erreur reste à 5%. Exemple : Roger prévoit de lancer 2500 fois une pièce de monnaie équilibrée. Puisque n = 2500 25 et p = 0, 5 est compris entre 0, 2 et 0, 8, je peux parier avant de réaliser l expérience, et[ en acceptant un risque de 5% que Roger aura entre une fréquence dans l intervalle 0.5 ; 0.5 + ] = [0.48; 0.52]. 2500 2500 Après l expérience, Roger connait la valeur de f et peut savoir si ma prévision était correcte. Application 2 : Prise de décision Dans une population donnée, on étudie un caractère et on émet l hypothèse : La proportion du caractère est p Pour juger de cette hyptothèse, on prélève un échantillon de taille n, et on calcule la fréquence, notée f, du caractère au sein de l échantillon. Si f = p, oe rejette pas l hyptothèse mais ce cas est peu fréquent en raison de la fluctuation d échantillonnage. Si f p, on regarde l écart entre f et p : Si cet écart (la marge d erreur) est inférieur à n (i.e f est dans l intervalle de fluctuation), oe rejette pas l hypothèse au motif que le hasard produirait un tel écart dans 95% des échantillons envisageables. Si cet écart est supérieur à (i.e f est hors l intervalle de fluctuation), on n rejette l hyptothèse puisqu un tel écart n apparait que dans 5% des échantillons envisageables. Soit il s agit vraiment un échantillon exceptionnel (et on a eu tort de rejeter l hyptothèse) soit l intervalle de fluctuatio est pas correct, ce qui signifie que la proportion choisie n était pas adaptée. http://lyceeenligne.free.fr/ 2

Exemple : Voir correction de l exo 6.3 du livret Commentaires : Attention, il y a une différence entre accepter une hypothèse et ne pas la rejetter. En fait, on conduit une sorte de raisonnement par l absurde sur la valeur de la proportion p réelle. Si f est hors de l intervalle de fluctuation, on a une contradiction puisque que cela devrait arriver que rarement (5% des cas). Mais si f est dans l intervalle de fluctuation, o a aucune contradiction...ce qui ne prouve rien sur l hypothèse émise. En effet, on peut très bien avoir le cas où la valeur supposée pour p est proche de celle la valeur réelle et ainsi l intervalle de fluctuation supposé chevauche l intervalle de fluctuation réel, créant ainsi une zone de non rejet à tort (voir commentaire suivant). En bref, si f est dans l intervalle de flucutation, on rejette l hypothèse sinon oe la rejette pas car «o est pas sur qu elle n est pas fausse». Pour la prise de décision, il y a deux erreurs possibles : rejeter une hypothèse juste. La probabilité de cette erreur est de 5%. On parle d erreur de première espèce. En effet, si l hypothèse est correcte alors 95% des échantillons sont dans l intervalle de fluctation et donc 5% des échantillons sont en dehors. Ce sont ceux là qui nous font rejeter l hypothèse d où une erreur estimée à 5%. Ne pas rejeter une hypothèse fausse. La probabilité de cette erreur n est pas connue. On parle d erreur de deuxième espèce. En effet, si la probabilité supposée est fausse, alors l intervalle de fluctuation est centré sur cette valeur (et non pas sur la vraie valeur). La probabilité de ne pas rejeter (à tort) l hyptothèse est égale à l aire du domaine rouge... qui est non calculable de façon générale. Ci-dessous la correction de l exos. Ayant lancé une pièce de monnaie, on dispose de deux échantillons : l un de taille 00 (43 fois pile, soit 43% des lancers) et l autre échantillon de taille 2500 (50 fois pile soit 46% des lancers). Ces échantillons représentent-ils un modèle de lancer de pièce équilibrée? (autrement dit, une probabilité de 0.5 a-t-elle pu simuler ces échantillons?) Une première (fausse) idée est de dire que comme 46% est plus proche de 43%, l échan- 3

Chapitre 6 tillon 2 représente plus le lancer d une pièce équilibrée que l échantillon. En effet, supposons que la pièce soit équilibrée. Alors la probabilité d apparition de la face Pile est 0.5 et l intervalle de fluctuation pour le premier échantillon (de taille 00) est [ 0.5 ; 0.5 + ] = [0.4; 0.6] 00 00 et le deuxième échantillon (de taille 2500) est [ 0.5 ; 0.5 + ] = [0.48; 0.52] 2500 2500 La fréquence du premier échantillon est dans l intervalle de fluctuation. Cet échantillon fait partie de ceux observables dans 95% des cas et donc oe rejette pas qu il puisse provenir du lancer d une pièce équilibrée. La fréquence du second échantillo est pas dans l intervalle de fluctuation. Soit il fait donc partie de ceux observables dans 5% des cas (cas rare), soit l intervalle de fluctuation (et donc la probabilité choisie pour le calculer) n est pas correct. On rejette l hypothèse que le second échantillon représente un modèle de pièce équilibrée. 3. Intervalle de confiance L objectif de cette section est de voir comment on peut estimer une proportion inconnue dans une population à partir d un échantillon. Sous les conditions du théorème, on a que si f est la fréquence d un échantillon de taille n alors dans 95% des cas, on a p n f p + n f n p f + n f n p f + n On en déduit que, pour plus de 95% [ des échantillons aléatoires de taille n, la probabilité inconnue p appartient à l intervalle f ; f + ], calculé à partir de l échantillon. Application 3 : Estimation On adopte la procédure d estimation suivante : Pour estimer la probabilité d un caractère au sein d une population, on prélève UN échantillon aléatoire de taille n pour lequel on obtient UNE[ fréquence f. La probabilité p, inconnue, de la population mère est dans l intervalle f ; f + ] dans 95% des cas. Cet intervalle est appelé intervalle de confiance de p au niveau de confiance 95%. Remarques : http://lyceeenligne.free.fr/ 4

L intervalle de confiance ne correspond pas à une probabilité. Ce n est pas par hasard que l on parle de «confiance» et non de «probabilité». On a un seul intervalle centré sur f obtenu après l expérience aléatoire du tirage dans l urne. Il n y a plus de hasard : p est, ou non, dans l intervalle de confiance (et o en sait rien). La probabilité est dans la fiabilité de la procédure (95% des cas) et non sur le seul intervalle que l on connaisse. Donc ne pas dire que «p a 95% de chances d être dans un intervalle de confiance donné» mais plutôt p est dans 95% des intervalles de confiance. Ne pas confondre (malgré la symétrie dangereuse de la formule) intervalle de fluctuation et intervalle de confiance. Il y a autant d intervalles de confiance que d échantillons. Ils sont déterminés à partir de la fréquence f de l échantillon. Il y a un seul intervalle de fluctuation déterminé à partir de la probabilité. Bilan : Il y a deux démarches très différentes : Soit on suppose une probabilité p pour le caractère étudié et dans ce cas on prélève un échantillon puis on utilise l intervalle de fluctuation supposé au seuil de 95% pour juger l hypothèse. Le nombre 0, 95 correspond dans un cas à une probabilité. Soit oe connait pas p et dans ce cas, plutot que de baser sur une estimation ponctuelle, on calcule l intervalle de confiance au seuil de 95%. Oe peut pas affecter une probabilité au fait que p appartienne à l intervalle de confiance. C est soit vrai, soit faux. Le nombre 0,95 n a aucune interprétation en terme de probabilité. On parle de «niveau de confiance». 5