Statistique Classique et Statistique Bayesienne

Documents pareils
Des familles de deux enfants

dénombrement, loi binomiale

Accès optiques : la nouvelle montée en débit

L information sera transmise selon des signaux de nature et de fréquences différentes (sons, ultrasons, électromagnétiques, électriques).

prix par consommateur identiques différents prix par identiques classique 3 unité différents 2 1

Module : réponse d un système linéaire

TP : Outils de simulation. March 13, 2015

Santé et hygiène bucco-dentaire des salariés de la RATP

Découvrez les bâtiments* modulaires démontables

Un modèle de composition automatique et distribuée de services web par planification

Bois. P.21 Bois-béton à Paris. Carrefour du Bois. Saturateurs. Usinage fenêtres. Bardages P.25 P.34 P.31 P.37. La revue de l activité Bois en France

Représentation d une distribution

S2I 1. quartz circuit de commande. Figure 1. Engrenage

DIVERSIFICATION DES ACTIVITES ET PRIVATISATION DES ENTREPRISES DE CHEMIN DE FER : ENSEIGNEMENTS DES EXEMPLES JAPONAIS

Chambre Régionale de Métiers et de l Artisanat. Région Auvergne. Région Auvergne

Les emprunts indivis. Administration Économique et Sociale. Mathématiques XA100M

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Sous le feu des questions

Calcul élémentaire des probabilités

En vue de l'obtention du. Présentée et soutenue par Philippe NERISSON Le 5 février 2009

TSTI 2D CH X : Exemples de lois à densité 1

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Continuité en un point

VOIP. Pr MOUGHIT Mohamed Cours VOIP Pr MOUGHIT Mohamed 1

.NET remoting. Plan. Principes de.net Remoting

Catalogue 3 Chaine sur Mesure

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Application 1- VBA : Test de comportements d'investissements

«INVESTIR SUR LE MARCHE INERNATIONAL DES ACTIONS A-T-IL PLUS D EFFET SUR LA PERSISTANCE DE LA PERFORMANCE DES FONDS? ILLUSTRATION BRITANNIQUE»

CATALOGUE 2. Chaine avec attachements

Moments des variables aléatoires réelles

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Compression scalable d'images vidéo par ondelettes 2D+t

NFE107 Urbanisation et architecture des systèmes d information. Juin «La virtualisation» CNAM Lille. Auditeur BAULE.L 1

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Calculs de probabilités avec la loi normale

Vous êtes un prestataire touristique dans les Monts de Guéret? L Office de Tourisme du Grand Guéret peut vous accompagner!

Intérêts. Administration Économique et Sociale. Mathématiques XA100M

c. Calcul pour une évolution d une proportion entre deux années non consécutives

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Texte Agrégation limitée par diffusion interne

Théorème du point fixe - Théorème de l inversion locale

Loi binomiale Lois normales

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Cours Fonctions de deux variables

Documents et lieux de mémoire de la persécution et de la déportation des Juifs à Nîmes. Pistes d'intervention auprès des classes de 3e et de 1ère.

POKER ET PROBABILITÉ

Probabilités III Introduction à l évaluation d options

Continuité d une fonction de plusieurs variables

Suites numériques 3. 1 Convergence et limite d une suite

Commande prédictive des systèmes non linéaires dynamiques

Lois de probabilité. Anita Burgun

Soutenance de stage Laboratoire des Signaux et Systèmes

Mécanique du point : forces Newtoniennes (PCSI)

Introduction à la Statistique Inférentielle

Correction du baccalauréat ES/L Métropole 20 juin 2014

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Travaux dirigés d introduction aux Probabilités

Image d un intervalle par une fonction continue

Procès - Verbal du Conseil Municipal Du lundi 15 décembre 2014

CHAPITRE 1. Suites arithmetiques et géometriques. Rappel 1. On appelle suite réelle une application de

Apprentissage par renforcement (1a/3)

Limites finies en un point

Probabilités conditionnelles Loi binomiale

EXERCICE 4 (7 points ) (Commun à tous les candidats)

S'organiser pour ne plus se noyer dans l'information

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Simulation de variables aléatoires

Réduire l effet de levier des banques, un impact néfaste sur notre économie? (2/2)

Développements limités, équivalents et calculs de limites

TESTS D'HYPOTHESES Etude d'un exemple

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

3. Caractéristiques et fonctions d une v.a.

Leçon 01 Exercices d'entraînement

OPTIMISATION À UNE VARIABLE

NC 35 Norme comptable relative aux états financiers consolidés

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Nombre de marches Nombre de facons de les monter

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

CHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Espérance conditionnelle

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

3. Conditionnement P (B)

C r é a t i o n D e S i t e s. P o l C R O V A T T O

Le défi : L'avantage Videojet :

Complément d information concernant la fiche de concordance

Annexe commune aux séries ES, L et S : boîtes et quantiles

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

N 518 SÉNAT QUATRIÈME SESSION EXTRAORDINAIRE DE

Manuel de l'utilisateur

Transcription:

Statistique Classique et Statistique Bayesienne Plaçons-nous dans les conditions du cas Guilde du Livre. Vous avez une décision à rendre (acheter les ouvrages ou non) et les conséquences de cette décision déendent d'un aramètre : la roortion de vos clients qui vont acheter l'ouvrage. Un statisticien classique vous dira : le aramètre est un aramètre inconnu mais certain. Pour estimer ce aramètre, il va vous suggérer de tirer un échantillon au hasard de clients. Suosons que l'on retienne un échantillon de 100 clients et que sur ces 100, 49 se déclarent rêts à acheter l'ouvrage. Le statisticien classique vous dira alors que l'estimation onctuelle de est 49/100. Son raisonnement est fondé sur toute une théorie, dite théorie de l'estimation, et sur les roriétés articulières de l'estimateur du maximum de vraisemblance. De fait, ce statisticien vous dira que le nombre de ersonnes favorables dans un échantillon de 100 ersonnes suit une loi Binomiale de aramètres 100 et et que la valeur de qui rend maximum la robabilité d'obtenir ce que l'on a obtenu (c'est à dire 49 ersonnes favorables sur 100) est récisément 49/100. Pour le démontrer il suffit d'écrire que la robabilité d'obtenir ce que l'on a obtenu n'est autre que : 100! 49! 51! ( 1 ) 49 51 et de dériver cette exression ar raort à. Bien sûr, le statisticien classique ne se contente as de cette estimation onctuelle. En effet, en s'en tenant là, on conclurait sur la base de 100 lancés qu'une ièce est truquée dès lors que l'on observe un nombre de Pile différent de 50 alors que l'on sait que : P(obtenir 50 Piles sur 100 lancés/ièce non truquée) = 0,08 Pour aller lus loin le statisticien classique vous roosera de réaliser une estimation ar intervalle de confiance. Pour cela, il suffit de se raeler que dès que la taille de l'échantillon devient suffisamment grande, la loi Binomiale converge vers la loi Normale. Dans notre cas, tout cours de statistique vous dira que la roortion de ersonnes favorables dans notre échantillon suit aroximativement une loi Normale de moyenne et de variance (1-)/n. Si j'aelle X cette roortion dans l'échantillon (attention : avant de connaître les résultats récis de l'échantillon X est une variable aléatoire) on a donc : P( 1,96 < X ( 1 ) n < +1,96 ) = 0,95 la valeur 1,96 étant lue dans les tables de la loi Normale centrée réduite.

On a alors : PX ( 196, ( 1 ) n< < X+ 196, ( 1 ) n) = 095,. Arrivé là le statisticien classique sera généralement un eu embarrassé our vous dire ce dont il s'agit vraiment. Il vous dira d'abord que l'on eut estimer (1-) soit ar 0,25 (sa valeur maximale) soit ar x (1 x ) où x est la valeur de la roortion constatée dans l'échantillon. Il vous dira ensuite qu'il a bâti un intervalle de confiance à 95% our. Dans notre cas on aurait obtenu comme réalisation de l intervalle de confiance (en remlaçant (1 ) ar 0,25) : = 0,49 ± 0,098 L'ennui avec cet intervalle, c'est son interrétation. Puisque est un aramètre certain, il ne fait as sens d'affirmer que la robabilité our que soit comris entre 39,2% et 58,8% est de 95%. Si vous demandez au statisticien classique d'interréter son intervalle de confiance, il vous fera robablement un long discours our vous dire que si l'on avait tiré 100 échantillons et si on avait construit 100 intervalles de confiance sur la base de ces échantillons, alors la vraie valeur de aurait été comrise dans 95 de ces intervalles (en moyenne). Tout ceci, vous en conviendrez, est bien difficile à comrendre, d'autant lus que l'on a rarement le tems de tirer 100 échantillons. Le statisticien bayesien ne vous dira as du tout la même chose, même si, en bout de course, les deux démarches euvent arfois se rejoindre. Tout d'abord il vous mettra en garde. Faire de la statistique n'est eut-être as intéressant our vous si cela coûte tro cher : un etit calcul de VEIP n'est jamais suerflu. Le statisticien bayesien vous dira : Il existe une vraie valeur de dans la nature. Cette valeur vous est inconnue, mais vous avez à son sujet un certain nombre d'informations. Par exemle vous savez qu'il est très imrobable que soit très roche de 1 ou de 0. Cette information vous vient de votre connaissance de vos clients et de votre intuition. Je vais essayer ar un certain nombre de questions simles d'encoder vos croyances sous la forme d'une distribution de robabilité subjective sur. Ces questions sont du tye Désirez-vous arier 100 F sur le fait que est inférieur à 0,4 ou référez-vous ariez ces 100 F à Pile ou Face, etc.. Nous avons déjà l'habitude de ce tye de question. À la suite de cet encodage on obtiendra une distribution de robabilité subjective sur dont je eux rerésenter grahiquement la densité :

f() 0 1 À artir de cette distribution de robabilité subjective, les choses deviennent beaucou lus simles. Si je veux, our une raison ou our une autre, faire de l'estimation onctuelle, je eux retenir un indicateur de tendance centrale de cette distribution de robabilité : mode, médiane ou moyenne. Je eux tout aussi simlement utiliser cette distribution our bâtir un vrai intervalle de confiance au sens où je eux trouver deux bornes 1 et 2 telles que, our moi, la robabilité que soit comris entre 1 et 2 soit de 95% (ar exemle). Si je décide alors qu'il est rentable our moi d'acquérir lus d'information (et cette rentabilité sera aréciée en tenant comte des conséquences de mes décisions) il ne me reste lus qu'à réviser mes croyances à la lumière de l'information aortée ar l'échantillon en utilisant le théorème de Bayes. Dans le cas continu, celui-ci nous dit que : f( ) f( x/ ) f( / x) = z f( ) f( x/ ) d si j'aelle x les résultats aortés ar l'échantillon. Si je le souhaite je eux refaire de l'estimation onctuelle et/ou ar intervalle de confiance en utilisant cette nouvelle distribution de robabilité de densité f(/x). Les démarches classiques et bayesiennes sont donc fort différentes, avec, selon moi, un net avantage à la seconde du oint de vue de la cohérence et de la rise en comte des conséquences du roblème, lorsque la statistique a our but de nous aider à décider. Ces deux démarches euvent ceendant coïncider au niveau des résultats, en articulier lorsque l'on disose de très eu d'information a riori et que f() tend vers une loi Uniforme. Ceci est relativement naturel uisque, dans l'otique classique, on fait récisément l'hyothèse, imlicite, que l'on ne sait rien a riori et que toute l'information est aortée ar l'échantillon. Dans le cas où l'on ne sait rien a riori, on a f() = 1, [0 ; 1]. Dans la formule de Bayes dans le cas continu on eut remarquer que le dénominateur ne déend as de uisque que l'on intègre sur toute les valeurs ossibles de. On eut donc écrire

f(/x) = Kxf(x/) où K est un terme ne déendant as de. Dans ces conditions faire de l'estimation onctuelle arès révision de mes croyances revient à chercher une caractéristique de tendance centrale la distribution révisée. Si je choisis d'utiliser le mode de cette distribution, je vais retenir la valeur de maximisant f(/x). Or cette valeur est maximale lorsque f(x/) est maximale c'est à dire lorsque maximise la vraisemblance de l'information aortée ar l'échantillon. On se retrouve donc, dans ce cas très articulier, dans les conditions de l'estimation onctuelle classique avec l estimateur du maximum de vraisemblance. Un cas articulier imortant de la statistique bayesienne concerne le cas où la distribution de robabilité a riori suit une loi aroximativement normale. Si vos croyances a riori suivent une loi Normale de moyenne ݵ et de variance σ Ý 2 et que les résultats (une moyenne ar exemle) rovenant d'un échantillon de taille n suivent une loi Normale de moyenne µ et de variance σ 2 /n (attention ݵ et σ Ý 2 n'ont rien à voir avec µ et σ 2 /n. La remière variance traduit l'état de votre information tandis que la seconde reflète la variance dans la oulation) alors l'alication du théorème de Bayes (arès un eu de maniulation) nous dit alors que nos croyances révisées à la lumière des résultats de l'échantillon suivent un loi Normale de moyenne & & µσ + µ ( σ / n) 1 σ& + 1 ( σ / n) et de variance σ& ( σ / n) σ& + ( σ / n) Il est facile de montrer que lorsque &σ 2 tend vers l'infini, c'est à dire lorsque les croyances a riori tendent vers une loi Uniforme, les croyances a osteriori suivent une loi Normale de moyenne µ et de variance σ 2 /n et l'on se retrouve dans le cas de la statistique classique. À l'inverse lorsque l'on a un comortement têtu a riori avec &σ 2 tendant vers 0 l'information aortée ar l'échantillon ne contribue as à remettre en cause les croyances antérieures et a osteriori vos croyances sont les mêmes qu'a riori. Lorsque la taille de l'échantillon tend vers l'infini, la variance σ 2 /n tend vers 0. On constate alors qu'a osteriori les croyances suivent une loi Normale de moyenne µ avec un écart tye tendant vers 0 et on retrouve également ici comme cas limite la statistique classique. Suosons ar exemle que l'on ense que la roortion d'électeurs qui votera Réublicain aux rochaines élections résidentielles aux USA a autant de chance d'être inférieure que

suérieure à 52%. En affinant un eu votre distribution de robabilité a riori, on s'aerçoit que votre intervalle de confiance au niveau 50% our cette roortion est [49% ; 55%] et que cette distribution est sensiblement normale. Sachant que P( > 55%) = 0,25 et que la moyenne de votre distribution est égale à 52%, un calcul simle ermet de conclure que vos croyances a riori suivent une loi Normale de moyenne 52% et d'écart tye 3%/0,67 = 4.5% (le 0,67 venant d'une table de loi normale). Vous lisez dans la resse que sur 400 ersonnes interrogées lors d'un sondage, 192 ont émis l'intention de voter Réublicain. De même que lus haut, tout cours de statistique nous enseigne que la roortion de ersonnes favorables dans l'échantillon suit une loi Normale de moyenne Ý et de variance Ý (1- Ý )/400, si j'aelle Ý la roortion de ersonnes votant Réublicain dans l'électorat. Le roblème c'est que l'on ne connaît as Ý. On eut ceendant l'estimer ar 192/400 0,48 et on a Ý (1- Ý )/400 (0,025) 2. A osteriori vos croyances suivent donc une loi Normale de moyenne 0, 52 ( 0, 045) + 0, 48 ( 0, 025) 1 ( 0, 045) + 1 ( 0, 025) = 49% et de variance ( 0, 045) ( 0, 025) ( 0, 045) + ( 0, 025) = (2%) 2 Votre nouvel intervalle de confiance à 50% est donc en ourcentage de 49% ± 0,66x2% soit 49% ± 1,32%. Votre intervalle de confiance à 95% est de 49% ± 1,96x2% = 49 ± 3,92%. En utilisant uniquement l'information fournie ar l'échantillon, votre intervalle de confiance à 50% en statistique classique aurait été de 48% ± 0,66x2,5% = 48% ± 1,6%, l'intervalle de confiance à 95% étant 48% ± 1,96x2,5% = 48% ± 4,9%.