MQT1183 Méthodes statistiques

Documents pareils
Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Cours de Tests paramétriques

Principe d un test statistique

Estimation et tests statistiques, TD 5. Solutions

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Probabilités III Introduction à l évaluation d options

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

DÉCISION DU TRIBUNAL DE LA SÉCURITÉ SOCIALE Division générale Assurance-emploi

TESTS D'HYPOTHESES Etude d'un exemple

FICHE OBLIGATIONS LEGALES

Analyse de la variance Comparaison de plusieurs moyennes

Livret 10. Mise à jour février Département Tertiaire

Président : M. Blin, conseiller le plus ancien faisant fonction., président REPUBLIQUE FRANCAISE AU NOM DU PEUPLE FRANCAIS

Introduction aux Statistiques et à l utilisation du logiciel R

Document d orientation sur les allégations issues d essais de non-infériorité

Pleins feux sur les IFRS

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Fiscalité et émission des reçus pour fins d impôt

ANNEXE B2 TRADUCTION NON OFFICIELLE (TRADUCTION NON OFFICIELLE) Seuil de recettes extracôtières

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Les monte escaliers de MediTek La solution pour votre mobilité à votre domicile

ORGANISME DE PLACEMENT COLLECTIF DE TYPE A

La règlementation autour du cadeau d affaire et promotionnel

Notes explicatives relatives à la Loi sur la taxe d accise. Publiées par le ministre des Finances l honorable James M. Flaherty, c.p.

Primes à l acquisition

NOTICE TELESERVICES : Gérer les contrats de paiement de l impôt sur le revenu

Biostatistiques : Petits effectifs

Assurance gratuite contre la perte de revenus

Recommandation sur les conventions concernant la distribution des contrats d assurance vie

COMPTE RENDU. Atelier-débat avec les futurs clients éligibles. 25 septembre 2002

AVIS N 118 DU 13 FEVRIER 2009 DU BUREAU DU CONSEIL DE L EGALITE DES CHANCES ENTRE HOMMES ET FEMMES, RELATIF A LA PROPOSITION DE DIRECTIVE PORTANT

1 Définition de la non stationnarité

Conférence EIFR 18 décembre 2014

RAPPORT DE 2010 SUR L ATTRIBUTION DE BÉNÉFICES AUX ÉTABLISSEMENTS STABLES

Un coupon cadeau pour votre campagne sur Google Adwords

T de Student Khi-deux Corrélation

COMPTABILITÉ DE GESTION

Econométrie et applications

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

I. S. F. ET DELOCALISATIONS FISCALES UN IMPACT DIFFICILE A MESURER FAUTE D UN TABLEAU DE BORD SATISFAISANT

BROSSE DE DÉSHERBAGE GAUCHE/DROITE

particuliers professionnels ENTREPRISES Face à face argumenté de vente

IMMOBILIER. le parcours de vente. du vendeur.

Conditions d utilisation de la plateforme de trading bilatérale

Communiqué de presse Nos très chères banques

La définition La méthode. Les échelles de mesure L ENQUETE PAR SONDAGE : LA METHODE

COMMISSION DE L ÉQUITÉ SALARIALE

LE GRAND ÉCART L INÉGALITÉ DE LA REDISTRIBUTION DES BÉNÉFICES PROVENANT DU FRACTIONNEMENT DU REVENU

Section Configuration

Comment préparer une demande de financement

UNE SOLUTION CRM CONÇUE POUR LA FORCE DE VENTE

Les réponses à vos questions

SE PREPARER A GERER UNE CRISE SOCIALE... Exoteam - Déjeuner MEFPVSG - 10/04/12

Chapitre 3. Les distributions à deux variables

V- SUIVI DU RECOUVREMENT

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

1. STRUCTURATION FEDERALE BI POLAIRE

Exit tax: L expatriation présente-t-elle encore un intérêt FISCAP Avril 2012 Michel Collet, Avocat associé CMS Bureau Francis Lefebvre

DÉCISION DU TRIBUNAL DE LA SÉCURITÉ SOCIALE Division d appel Demande de permission d en appeler

Mémoire de la Corporation des associations de détaillants d automobiles présenté dans le cadre du processus prébudgétaire 2014

Introduction à la Statistique Inférentielle

Régime social et fiscal des primes d intéressement

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

Suppression de la taxe professionnelle et création de la Contribution Economique Territoriale (CET)

BOURSES SCOLAIRES ET PRISE EN CHARGE

Partage des capitaux propres de F1 à la consolidation de N. Éléments Total Part du groupe 60 % Capitaux propres de F1 hors résultat N

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Pratique. Égalité professionnelle entre les femmes et les hommes. Guide destiné aux entreprises

Convocations. Assemblées d'actionnaires et de porteurs de parts. Ales Groupe. Société anonyme au capital de Euros

La prévention des risques hors du cadre professionnel habituel

Les Français et le don d organes

VI. Tests non paramétriques sur un échantillon

45. CONTRIBUTION MUTUALISEE DES CLUBS AU DEVELOPPEMENT REGIONAL (C.M.C.D.)

Newsletter - Mesures fiscales de la loi de Finances pour 2012

BNP Paribas Diversipierre. Société de Placement à Prépondérance Immobilière à Capital Variable. Document à caractère publicitaire

Rédaction d un Plan d affaires

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

LE COMPTE EPARGNE TEMPS

CONTRAT N. SONT CONVENUS des conditions suivantes énoncées dans le présent contrat et ses annexes (ciaprès dénommés le «contrat»).

POLITIQUE 4.4 OPTIONS D ACHAT D ACTIONS INCITATIVES

Les dépenses admissibles du travailleur autonome

Cours 9 : Plans à plusieurs facteurs

18 SEPTEMBRE E-réputation : une image positive pour une stratégie de conquête!

Projet de décision unilatérale instituant (ou régularisant) un régime collectif complémentaire obligatoire couvrant le risque

RÈGLEMENT relatif au programme Remise en argent

REGLEMENT DE CONSULTATION LOCATION ET MAINTENANCE D UNE MACHINE A AFFRANCHIR ET D UNE MACHINE A METTRE SOUS PLI POUR LE SERVICE DU COURRIER

$ de rénos pour une maison intelligente! LE PRÉSENT CONCOURS S ADRESSE UNIQUEMENT AUX RÉSIDENTS DU CANADA ET IL EST RÉGI PAR LA LOI CANADIENNE

Bien acheter sur l Internet. EPN de Côte de Nacre 13 décembre Gérard Becher Président de l UFC Que Choisir de CAEN

Banque Zag. Troisième pilier de Bâle II et III Exigences de divulgation. 31 décembre 2013

Se référer aux textes 210 S ORGANISER ET AGIR

TABLE DES MATIERES. C Exercices complémentaires 42

COMBIEN UN MÉDECIN A-T-IL BESOIN D ARGENT POUR SA RETRAITE?

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Une nouvelle génération de calculatrices avec des fonctions spécifiques, pour le grand public

Le 15 décembre 2014 ADOPTION DE LA LOI FAVORISANT LA SANTÉ FINANCIÈRE ET LA SUIVEZ RETRAITESAI SUR. Numéro 14-22

Transcription:

MQT1183 Méthodes statistiques Sébastien Blais Département des sciences administratives, UQO 20 mars 2017

Rappels Exercice 8.35.

Aujourd hui Chapitre 9: Test d hypothèses 1 Introduction 2 Hypothèses nulle et alternative 3 Erreurs de première et seconde espèce 4 Hypothèse sur la moyenne,σ connu (théorie) 5 Hypothèse sur la moyenne, σ inconnu 6 Hypothèse sur la proportion

La troisième partie du cours pour sur l inférence statistique, qui comporte deux types de problèmes 1 estimation ponctuelle (chapitre 7) par intervalle (chapitre 8) 2 décision test d hypothèse introduction, une population (chapitre 9) plusieurs populations, moyennes (chapitre 10) plusieurs populations, proportions (chapitre 11) Les problèmes de décision considérés dans ce cours: 1 sont binaires: on décide de faire, ou de ne pas faire, quelque chose. 2 repose sur l observation d un événement: on fait quelque chose si un certain événement est observé.

Exercice 4.60 Quelle décision doit être prise? Quelle est la règle de décision? Quelles sont les erreurs (mauvaises décisions) possibles?

La pièce est-elle truquée? Je lance la pièce de monnaie 10 fois: j obtiens 3 piles et 7 faces. Quelles sont les erreurs (mauvaises décisions) possibles? Quelle est la règle de décision? Quelle est la probabilité de faire une erreur?

Si p = 0, 5 P(X=x) P(X<=x) P(X>=x) 0 0,001 0,001 1,000 1 0,010 0,011 0,999 2 0,044 0,055 0,989 3 0,117 0,172 0,945 4 0,205 0,377 0,828 5 0,246 0,623 0,623 6 0,205 0,828 0,377 7 0,117 0,945 0,172 8 0,044 0,989 0,055 9 0,010 0,999 0,011 10 0,001 1,000 0,001

Problème de MaxFlight MaxFlight fabrique des balles de golf. Lorsque le processus de fabrication est bien réglé, les balles produites parcourent 295 verges en moyenne. Un programme d assurance qualité prévoit le prélèvement périodique de 50 balles pour évaluer le réglage du processus de fabrication et décider s il doit être ajusté. Problème de décision: 1 binaire: on ajuste le réglage, ou non. 2 événement: si la moyenne de l échantillon (une statistique de test) est inférieure à 290 verges (une valeur critique).

Aujourd hui Chapitre 9: Test d hypothèses 1 Introduction 2 Hypothèses nulle et alternative 3 Erreurs de première et seconde espèce 4 Hypothèse sur la moyenne,σ connu (théorie) 5 Hypothèse sur la moyenne, σ inconnu 6 Hypothèse sur la proportion

Hypothèses nulle et alternative Le problème de décision binaire se formule par l intermédiaire de deux hypothèses, qui prennent souvent la forme de conditions sur les paramètres de la population hypothèse nulle: comprend toujours une égalité Exemple: H 0 : µ=295 (le processus est bien réglé) Exemple: H 0 : µ 295 (le processus produit des balles dont la portée est d au moins 295 verges) hypothèse alternative: le complément de la nulle 1 Exemple: H 1 : µ 295 (le processus n est pas bien réglé) 2 Exemple: H 1 : µ < 295 (le processus produit des balles dont la portée est inférieure à 295 verges) Remarques: 1 Apprendre à bien formuler ces hypothèses demande de la pratique. 2 Le manuel utilise la notation H a pour l hypothèse alternative.

Idée générale - Problème de MaxFlight Supposons que nous avons calculé une moyenne d échantillon de 291 verges (σ = 12 connu). Puisque l hypothèse nulle (H 0 : µ 295) comprend une égalité, on peut calculer la distribution d une statistique de test sous cette égalité Exemple: Si µ = 295, x suit une loi normale d espérance 295 et d écart type 12/ 50 = 1, 7. On peut donc calculer la probabilité d observer une valeur plus petite que la valeur observée de la statistique ) de test. Exemple: P( X < 291) = P( X 295 1,7 < 291 295 1,7 = P(Z < 2, 35) = 0, 0094 Si cette probabilité est faible (on y reviendra), c est probablement l hypothèse nulle est fausse. Exemple: Si µ = 295, il y avait moins de 1% de chances d observer une moyenne d échantillon aussi faible que 291.

Idée générale - Problème de MaxFlight (suite) Si µ = 295, il y avait moins de 1% de chances d observer une moyenne d échantillon aussi faible que 291. De deux choses l une: 1 Vous avez observé un événement qui avait moins de 1 chance sur 100 de se produire 2 µ < 295 Remarque: Si µ > 295, la probabilité d observer une moyenne d échantillon aussi faible que 291 est encore plus faible.

Formes des hypothèses nulle et alternative Les trois formes possibles sont 1 unilatéral inférieur, H 0 : µ µ 0 et H 1 : µ<µ 0 On rejette la nulle lorsque x est assez petite. 2 unilatéral à supérieur, H 0 : µ µ 0 et H 1 : µ>µ 0 On rejette la nulle lorsque x est assez grande. 3 bilatéral, H 0 : µ = µ 0 et H 1 : µ µ 0 On rejette la nulle lorsque x est assez loin de µ 0. Remarques: La valeur de µ 0 est donnée (souvent µ 0 = 0; µ 0 = 295 dans le problème de MaxFlight) Dans plusieurs manuels, l hypothèse nulle prend toujours la forme d une égalité.

Rejet ou non de la nulle On n accepte jamais la nulle. Il est possible qu un échantillon permette de rejeter la nulle ou qu il ne permette pas de le faire. Exemple: Supposons que j ai une pièce de monnaie truquée avec P(pile) = 0, 25. Je lance la pièce deux fois et j obtiens {pile, face}. La probabilité de cet événement est 0, 375. Vous voulez tester H 0 : p = 0, 5 avant de jouer avec moi. Si p = 0, 5 (sous la nulle), l événement observé est vraisemblable: P(pile, face) = 0, 5. Vous ne rejetez pas la nulle. Ce serait par contre imprudent de l accepter...

Aujourd hui Chapitre 9: Test d hypothèses 1 Introduction 2 Hypothèses nulle et alternative 3 Erreurs de première et seconde espèce 4 Hypothèse sur la moyenne,σ connu (théorie) 5 Hypothèse sur la moyenne, σ inconnu 6 Hypothèse sur la proportion

Erreurs de première et seconde espèce Lorsqu on prend une décision, on peut faire deux types d erreur 1 première espèce: rejeter la nulle lorsqu elle est vraie 2 seconde espèce: ne pas rejeter la nulle lorsqu elle est fause Exemple (problème de MaxFlight): 1 On conclut que le processus est mal réglé alors que ce n est pas le cas. On procède alors inutilement au réglage. 2 On ne conclut pas que le processus est mal réglé alors que c est le cas. On fabrique alors des balles avec un processus mal calibré.

Seuil de signification La règle de décision est généralement choisie par l intermédiaire d un seuil de signification (α), soit la probabilité de faire une erreur de première espèce lorsque l hypothèse nulle est satisfaite avec égalité. Exemple: On choisit la règle de décision de sorte que la probabilité de rejeter la nulle par erreur (erreur de première espèce) est α = 0, 05. La probabilité de procéder inutilement à un réglage est de 0,05. Remarque: On ne connaît pas la probabilité de faire une erreur de deuxième espèce.

Comment choisir le seuil de signification Par défaut, on prend souvent 5%. En pratique, ça dépend du coût associé aux erreurs de première et seconde espèces: régler ou pas: coût du réglage / perte de réputation prêter ou pas: perte en cas de défaut / perte de revenus parapluie ou pas: encombrement / mouillé ceinture de sécurité ou pas: encombrement / blessures ou mort nouveau médicament:? /?

Aujourd hui Chapitre 9: Test d hypothèses 1 Introduction 2 Hypothèses nulle et alternative 3 Erreurs de première et seconde espèce 4 Hypothèse sur la moyenne,σ connu (théorie) 5 Hypothèse sur la moyenne, σ inconnu 6 Hypothèse sur la proportion

Deux méthodes équivalentes De manière générale, il y a deux manières de faire un test. Dans tous les cas, on commence par choisir le seuil de signification et calculer une statistique de test. Pour une hypothèse sur la moyenne, lorsque σ est connu, la statistique est z = x µ 0 σ/ n. On rejette H 0 lorsque l une ou l autre de ces conditions sont satisfaites: 1 valeur p: la probabilité d observer z est inférieur à α 2 valeur critique: z est inférieure et/ou (selon le cas) supérieure à une valeur critique.

Problème de Hilltop Hilltop vend du café dans des boîtes de 3 livres. Pour protéger les consommateurs, la Commission fédérale du commerce veut vérifier qu il y a au moins 3 livres de café par boîte, en moyenne, à partir d un échantillon de 36 boîtes. Des analyses antérieures permettent de considérer que l écart type de la population est 0, 18. Quelle est l hypothèse nulle? Quelle est l hypothèse alternative? Quelle est la statistique de test? Quelle est la distribution de la statistique de test sous la nulle? Quel est le seuil de signification du test?

1. Approche de la valeur p Supposons que la moyenne d échantillon est 2, 92. La statistique de test observée est z = x µ 0 σ/ n 2, 92 3 = 0, 18/ = 2, 67. 36 Quelle est la probabilité d observer z = 2, 67? Sous la nulle, z est une normale centrée réduite et la valeur p est P(Z 2, 67) = 0, 0038 Puisque 0, 0038 < 0, 01, on rejette la nulle en faveur de l alternative H 1 : µ < 3. On conclut que les boîtes contiennent moins de 3 livres de café, en moyenne.

2. Approche de la valeur critique (test unilatéral) On cherche la valeur (critique) z α telle que P(Z z α ) = α sous la nulle, et on rejette la nulle si z z α. Puisque Z est une normale centrée réduite sous la nulle, z 0,01 = 2, 33 et on rejette H 0 puisque 2, 67 < 2, 33

Test bilatéral Les hypothèses ont la forme H 0 : µ = µ 0 H 1 : µ µ 0 Pour le problème de MaxFlight H 0 : µ = 295 H 1 : µ 295

1. Approche de la valeur p Sous la nulle, z suit une loi normale centrée réduite. Supposons que la moyenne d échantillon (n = 50) est 297, 6. z = x µ 0 σ/ n = 297, 6 295 12/ 50 = 1, 53. Quelle est la probabilité d observer une valeur de Z aussi loin de 0 que 1, 53? 1 P( 1, 53 Z 1, 53) = P(Z 1, 53)+P(Z 1, 53) = 2 P(Z 1, 53) = 2 0, 0630 = 0, 1260. Au seuil de α = 0, 05, on ne peut pas rejeter la nulle puisque 0, 1260 > 0, 05. On ne peut pas conclure qu un réglage est requis.

2. Approche de la valeur critique (test bilatéral) On cherche la valeur (critique) z α/2 telle que P ( z α/2 Z z α/2 ) = 1 α sous la nulle, et on rejette la nulle si z z α/2 ou z z α/2. Puisque Z est une normale centrée réduite sous la nulle, z 0,025 = 1, 96 et on ne peut pas rejeter H 0 puisque 1, 53 < 1, 96. On conclut que la portée des balles n est pas significativement différente de 295 verges. Remarque: De manière équivalente, on peut rejeter la nulle lorsque z z α/2.

Relation avec l estimation par intervalle Une autre manière de faire un test bilatéral consiste à calculer un intervalle de confiance et de rejeter la nulle si l intervalle de confiance ne contient pas µ 0. Exemple: L intervalle de confiance à 95% autour de 297, 6 est 297, 6±1, 96 12 50 = 297, 6±3, 3 = 297, 6±3, 3 = [294, 3; 300, 9]. Puisque µ 0 = 295 est contenu dans cet intervalle, on ne peut pas rejeter la nulle et on conclut que la portée des balles n est pas significativement différente de 295 verges.

Aujourd hui Chapitre 9: Test d hypothèses 1 Introduction 2 Hypothèses nulle et alternative 3 Erreurs de première et seconde espèce 4 Hypothèse sur la moyenne,σ connu (théorie) 5 Hypothèse sur la moyenne, σ inconnu 6 Hypothèse sur la proportion

Hypothèse sur la moyenne, σ inconnu Rien de surprenant ici: La statistique est t = x µ 0 s/ n. Elle suit une loi t de Student avec n 1 degrés de liberté lorsque la population est normale.

Aujourd hui Chapitre 9: Test d hypothèses 1 Introduction 2 Hypothèses nulle et alternative 3 Erreurs de première et seconde espèce 4 Hypothèse sur la moyenne,σ connu (théorie) 5 Hypothèse sur la moyenne, σ inconnu 6 Hypothèse sur la proportion

Hypothèse sur la proportion Dans ce cas: On fait appel au TCL pour justifier une approximation normale de la distribution de la statistique de test. Sous la nulle H 0 : p = p 0, la variance de la population est p 0 (1 p 0 ) La statistique de test z = p p 0 p 0 (1 p 0 ) n suit donc une loi normale centrée réduite. Remarque: L erreur type n est pas la même que lorsqu on construit un intervalle de confiance.

Problème de Pine Creek Le club de golf de Pine Creek a mis en place une campagne publicitaire pour augmenter la proportion des femmes parmi les joueurs. Elle veut tester si cette campagne a été efficace avec un échantillon de 400 joueurs, avec un seuil de signification de 5%. L échantillon comptait 100 femmes. Quelles sont l hypothèse nulle et l hypothèse alternative? Quelle est la valeur observée de la statistique de test? Peut-on rejeter la nulle? 1 Quelle est la valeur p du test? 2 Quelle est la valeur p du test?