Chapitre 3 : INFERENCE

Documents pareils
Chapitre 3 : INFERENCE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Introduction à la Statistique Inférentielle

VI. Tests non paramétriques sur un échantillon

Loi binomiale Lois normales

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Principe d un test statistique

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Cours de Tests paramétriques

Précision d un résultat et calculs d incertitudes

TSTI 2D CH X : Exemples de lois à densité 1

Probabilités III Introduction à l évaluation d options

Moments des variables aléatoires réelles

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Chapitre 7 : Intégration sur un intervalle quelconque

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Le calcul du barème d impôt à Genève

Chapitre 3. Les distributions à deux variables

Document d orientation sur les allégations issues d essais de non-infériorité

Cours de méthodes de scoring

Annexe commune aux séries ES, L et S : boîtes et quantiles

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Lois de probabilité. Anita Burgun

Représentation d une distribution

SCP Célice, Blancpain et Soltner, SCP Nicolaý, de Lanouvelle et Hannotin, avocat(s) REPUBLIQUE FRANCAISE AU NOM DU PEUPLE FRANCAIS

TESTS D'HYPOTHESES Etude d'un exemple

Hedging delta et gamma neutre d un option digitale

Quantification Scalaire et Prédictive

La simulation probabiliste avec Excel

M2 IAD UE MODE Notes de cours (3)

Amphi 3: Espaces complets - Applications linéaires continues

Biostatistiques : Petits effectifs

Travaux dirigés d introduction aux Probabilités

Simulation de variables aléatoires

Econométrie et applications

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

La pratique du coaching en France. Baromètre 2010

Propriétés des options sur actions

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Chapitre 2 Le problème de l unicité des solutions

Programmes des classes préparatoires aux Grandes Ecoles

Estimation et tests statistiques, TD 5. Solutions

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

FORMULAIRE DE STATISTIQUES

Limites finies en un point


Texte Agrégation limitée par diffusion interne

Cours 9 : Plans à plusieurs facteurs

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Introduction à l approche bootstrap

Commun à tous les candidats

OUTILS STATISTIQUES ET NUMÉRIQUES

PRIME D UNE OPTION D ACHAT OU DE VENTE

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

3. Conditionnement P (B)

1 Définition de la non stationnarité

CAPTEURS - CHAINES DE MESURES

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Fonctions de plusieurs variables

CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER. Epargne et emprunt Calcul actuariel

1.1 Codage de source et test d hypothèse

Automatique (AU3): Précision. Département GEII, IUT de Brest contact:

TABLE DES MATIERES. C Exercices complémentaires 42

Comparaison de fonctions Développements limités. Chapitre 10

Continuité et dérivabilité d une fonction

LES DECIMALES DE π BERNARD EGGER

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Projet de loi C-31 Loi de mise en œuvre de l accord Canada États-Unis pour un meilleur échange de renseignements fiscaux

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Glossaire de termes relatifs à l assurance de la qualité et aux bonnes pratiques de laboratoire

Analyse de la variance Comparaison de plusieurs moyennes

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Les réseaux cellulaires

Logiciel XLSTAT version rue Damrémont PARIS

Relation entre deux variables : estimation de la corrélation linéaire

Suites numériques 3. 1 Convergence et limite d une suite

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Continuité d une fonction de plusieurs variables

Le RSA, une voie d insertion dans le monde salarial?

Introduction et sommaire

données en connaissance et en actions?

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Introduction aux Statistiques et à l utilisation du logiciel R

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Statistiques Descriptives à une dimension

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

OPTIMISATION À UNE VARIABLE

Variables Aléatoires. Chapitre 2

MARTINGALES POUR LA FINANCE

LES GENERATEURS DE NOMBRES ALEATOIRES

L Assurance. L Assurance

EXERCICES - ANALYSE GÉNÉRALE

Transcription:

Chapitre 3 : INFERENCE 3.3 LES TESTS D HYPOTHESE 3.3.1 Formuler des hypothèses 3.3.2 Erreurs de 1 e et 2 e espèce 3.3.3 Test sur la moyenne d une population 3.3.4 Puissance du test 3.3.5 Proportion 3.3.6 Tests du Khi-deux Les tests d hypothèse 1 / 67

Chapitre 3 : INFERENCE 3.3 LES TESTS D HYPOTHESE 3.3.1 Formuler des hypothèses 3.3.2 Erreurs de 1 e et 2 e espèce 3.3.3 Test sur la moyenne d une population 3.3.4 Puissance du test 3.3.5 Proportion 3.3.6 Tests du Khi-deux Les tests d hypothèse 2 / 67

H et H 1 (1) On peut distinguer deux approches inférentielles : o l estimation ponctuelle et par intervalle des paramètres de la population, et o les tests d hypothèses, servant à déterminer si une assertion au sujet de la valeur d un paramètre de la population doit être ou non rejetée. Le point de départ d un test d hypothèse est l hypothèse nulle, notée H. Le complément de H est l hypothèse alternative, notée H 1 (parfois aussi H a ). H et H 1 sont antagonistes, càd mutuellement exclusives. H peut être considérée comme l hypothèse de statu-quo ou de stabilité, tandis que H 1 est l hypothèse de recherche ou d évolution (càd ce qu il s agit de prouver). Les tests d hypothèse 3 / 67

H et H 1 (2) Le cas le plus courant sont des tests d hypothèses paramétriques, portant sur des assertions sur un paramètre θ. Dans ce cas, on distingue trois formes principales de H et H 1 : } o H : θ θ ; H 1 : θ < θ tests unilatéraux o H : θ θ ; H 1 : θ > θ o H : θ = θ ; H 1 : θ θ test bilatéral On peut aussi formuler des tests d hypothèses non paramétriques, notamment si on veut savoir si une variable de la population suit une certaine distribution statistique, ou si deux variables aléatoires sont indépendantes. Les tests d hypothèse 4 / 67

H et H 1 (3) A l issue du test, on aboutit à l une des deux décisions suivantes : o non-rejet de H, ou o rejet de H Exemple Statville : o Hypothèses pour tests paramétriques unilatéraux : H : x 4 H : p.5 o Hypothèses pour tests paramétriques bilatéraux : H : x = 55 H : p =.52 o Hypothèses pour tests non paramétriques : H : revenu N(55, 6) H : la distribution des revenus est indépendante du sexe Les tests d hypothèse 5 / 67

Chapitre 3 : INFERENCE 3.3 LES TESTS D HYPOTHESE 3.3.1 Formuler des hypothèses 3.3.2 Erreurs de 1 e et 2 e espèce 3.3.3 Test sur la moyenne d une population 3.3.4 Puissance du test 3.3.5 Proportion 3.3.6 Tests du Khi-deux Les tests d hypothèse 6 / 67

Bases (1) Soit H est vraie, soit H 1 est vraie, mais pas les deux. Idéalement, le test devrait conduire à l acceptation de H lorsque H est vraie et au rejet de H lorsque H 1 est vraie. Cependant, puisque les tests d hypothèses sont basés sur les informations d un échantillon, nous devons admettre la possibilité d erreurs. Deux types d erreur sont possibles : o Le test rejette H tandis que H est vrai. On commet une erreur de première espèce. (ou : «de Type I»). o Le test ne rejette pas H tandis que H 1 est vrai. On commet une erreur de seconde espèce. (ou : «de Type II») Les tests d hypothèse 7 / 67

Bases (2) La probabilité de commettre une erreur de première espèce s appelle le «seuil de signification», noté α. Les valeurs de α typiquement choisies sont 5%, 1% ou 1%. La probabilité de commettre une erreur de seconde espèce s appelle le «risque de seconde espèce», noté β. La puissance d un test, notée γ, est la probabilité de rejeter H correctement, càd quand H est effectivement fausse. γ = 1 β Maximiser la puissance d un test est minimiser le risque de deuxième espèce. Les tests d hypothèse 8 / 67

Tableau récapitulatif Réalité inconnue H vraie H 1 vraie accusé est innocent accusé est coupable Non-rejet de H libérer l accusé Conclusion correcte (1 α) Erreur de seconde espèce (β) Conclusion du test Rejet de H pendre l accusé libérer l innocent Erreur de première espèce (α) libérer le coupable Conclusion correcte (1 β) = γ pendre l innocent pendre le coupable Les tests d hypothèse 9 / 67

α contre β (1) Il y a un arbitrage entre seuil de signification et risque de deuxième espèce : plus α est bas, plus β est élevé. Autrement dit : Plus on abaisse le seuil de signification, plus on réduit la puissance du test. (Plus on diminue le risque de pendre l innocent, plus on augmente le risque de libérer le coupable.) La plupart des tests sont des «tests de signification» ne permettant de choisir que le niveau de α, qui impliquera un certain niveau de β. Définir comme H l assertion qu il serait plus coûteuse d écarter à tort ( «hypothèse privilégiée» ; présomption d innocence ; «fardeau de la preuve» sur H 1 ) Choisir un seuil de signification d autant plus bas qu il serait coûteux de rejeter H par erreur (càd de commettre une erreur de première espèce) Les tests d hypothèse 1 / 67

α contre β (2) La puissance d un test est liée non seulement au seuil de signification mais aussi à la divergence entre H et la vérité : Le test est d autant plus puissant que θ est différent de θ. Exemple 1 : Plus le revenu moyen supposé par le syndic de Statville avant de mener l analyse (µ ) est différent du revenu moyen effectif (µ), plus le risque d accepter µ à tort est faible. Exemple 2 : Plus le crime effectivement commis par l accusé est grave, moins il y a de risque qu il soit acquitté à tort. C est à cause de l incertitude liée à l erreur de second espèce dans les tests de signification qu on utilise l expression «nonrejet de H» plutôt que l expression «acceptation de H». Les tests d hypothèse 11 / 67

Chapitre 3 : INFERENCE 3.3 LES TESTS D HYPOTHESE 3.3.1 Formuler des hypothèses 3.3.2 Erreurs de 1 e et 2 e espèce 3.3.3 Test sur la moyenne d une population 3.3.4 Puissance du test 3.3.5 Proportion 3.3.6 Tests du Khi-deux Les tests d hypothèse 12 / 67

Test unilatéral, σ connu Rappel : En réalité, σ est rarement connu, mais il est utile de commencer l explication des méthodes inférentielles en supposant que tel soit le cas. Tout comme dans le cas de l estimation d intervalles de confiance, les méthodes pour tester des hypothèses présentées ci-dessous sont exactes si l échantillon est issu d une population normalement distribuée. Autrement, ces méthodes restent applicables si la taille de l échantillon est suffisamment grande ( théorème centrale limite). Nous commençons par étudier des tests unilatéraux : o H : θ θ ; H 1 : θ < θ (test unilatéral inférieur) o H : θ θ ; H 1 : θ > θ (test unilatéral supérieur) Les tests d hypothèse 13 / 67

Exemple Statville (1) Imaginons que les communes soient éligibles pour des subventions fédérales si leur revenu moyen est < 54 francs. Le syndic est l administration fédérale sont donc intéressés à savoir si µ < 54 ou µ 54. (Rappel : µ = 518, σ = 4) Supposons que l administration fédérale cherche à minimiser ses dépenses et préfèrerait donc ne pas devoir verser des subventions. De son point de vue il serait donc plus grave de conclure à tort que Statville soit éligible pour des subventions que de conclure à tort que Statville ne soit pas éligible. Elle cherche donc à contrôler le risque de conclure à tort que µ < 54. H : µ 54 ; H 1 : µ < 54 Les tests d hypothèse 14 / 67

Exemple Statville (2) Supposons que le syndic aimerait bien recevoir des subventions, que ça soit justifié ou non. De son point de vue il serait donc plus grave de conclure à tort que Statville n est pas éligible pour des subventions que de conclure à tort que Statville est éligible. Il cherche donc à contrôler le risque de conclure à tort que µ 54. H : µ 53999 ; H 1 : µ > 53999 Puisque c est elle qui paierait, supposons que l administration fédérale arrive à imposer sa formulation des hypothèses d analyse, et qu elle exige un seuil de signification de 1% ainsi qu un échantillon aléatoire simple couvrant au moins 1.2% de la population communale (Statville : 25.12 = 3). Les tests d hypothèse 15 / 67

Exemple Statville (3) Distribution d échantillonnage de la moyenne d échantillon x lorsque H est «tout juste» vraie (µ = 54): σ 4 σ x = = = 73.3 n 3 54 Les tests d hypothèse 16 / 67

La statistique de test Sous H, et puisque la distribution d échantillon de x est normale : x µ z = N (,1) σ x Pour des tests d hypothèses relatifs à la moyenne d une population dans le cas de σ connu, nous utilisons la variable aléatoire normale centrée réduite z comme statistique de test pour déterminer si x s écarte suffisamment de µ pour entraîner le rejet de H. Les tests d hypothèse 17 / 67

Approche par la valeur p La valeur p (ou «probabilité critique») liée à la statistique de test z donne la probabilité que la statistique de test observée dans l échantillon se soit produite si H était vraie. Ainsi, la valeur p mesure le soutien fourni par l échantillon à H et permet de déterminer si H doit être rejetée étant donné α. Si on décide de rejeter H, la valeur p donne la probabilité de commettre une erreur de première espèce. Une valeur p petite implique un risque faible d erreur de première espèce. Avec σ connu, et une fois qu on a choisi un seuil de signification α, on rejette H si p α, x µ o où : p = P z si H 1 : µ > µ (test unilatéral supérieur), σ n x µ o et : p = P z si H 1 : µ < µ (test unilatéral inférieur). σ n Les tests d hypothèse 18 / 67

Exemple Statville (4) Statistique de test : x µ x µ 51814 54 2186 z = = = = = 2.99 σ σ n 4 3 73.3 x Ainsi, la valeur p correspond à la P(z 2.99) = P(z 2.99). Table des probabilités normales centrées réduites P( z 2.99) = P( z < ) P( 2.99 < z < ) = P( z > ) P( < z < 2.99) =.5.4986 =.14 ou P( z 2.99) = 1 P( z < 2.99) = 1.9986 =.14 version de la table du manuel de Anderson et al. version de la table sur le site du cours Les tests d hypothèse 19 / 67

Exemple Statville (5) σ 4 σ x = = = 73.3 n 3 Puisque.14 <.1, on rejette H Statville a droit à des subventions x = 51814 z = v aleur p =.14 x 54 73.3 Excel : =LOI.NORMALE.STANDARD(-2.99) µ = 54 z = - 2.99 Les tests d hypothèse 2 / 67

Approche par la valeur critique La valeur critique d un test unilatéral est égale à la valeur de la statistique de test qui correspond à une aire α (le seuil de signification) dans la queue pertinente de la distribution d échantillonnage de la statistique de test. En d autre termes, la valeur critique est la plus petite valeur de la statistique de test, en valeur absolue, qui entraîne le rejet de H. Avec σ connu, et une fois qu on a choisi un seuil de signification α, on rejette H si z z (1 α). Les approches par la valeur p ou par la valeur critique conduisent toujours à la même décision. L approche par la valeur critique est plus simple si on utilise les tables statistiques, mais les valeurs p donnent plus d information et sont donc fournies par les logiciels statistiques. Les tests d hypothèse 21 / 67

Exemple Statville (6) z (.5.1) = z.49 = 2.33 Les tests d hypothèse 22 / 67

Test bilatéral, σ connu Formulation du test : H : µ = µ ; H 1 : µ µ Tout comme pour le test bilatéral, sous H, et puisque la distribution d échantillon de x est normale, la statistique de test est donnée par : x µ z = N (,1) σ x Approche par la valeur p : Avec σ connu, et une fois qu on a choisi un seuil de signification x µ x µ α, on rejette H si p α, où p = P( z ) + P( z ) σ σ Approche par la valeur critique : Avec σ connu, et une fois qu on a choisi un seuil de signification α, on rejette H si z z 1 (α/2) Les tests d hypothèse 23 / 67 x x

Exemple Statville (7) Imaginons que le syndic débatte du salaire moyen avec ses conseillers. Il est convaincu que le salaire moyen est de 5 francs, tandis que certains conseillers pensent que cette estimation est trop basse et d autres croient qu elle est trop élevé. Ils font donc un pari sur o H, défendue par le syndic : µ = 5, et o H 1, défendue par les conseillers : µ 5. Ils se mettent d accord de fixer un seuil de confiance de 5% (donc d admettre un risque avec une probabilité de 5% de rejeter l estimation du syndic même qu il ait raison). n = 3, x = 51814, et σ = 4 (supposé connu) x µ x µ 51814 5 1814 z = = = = = 2.48 σ σ n 4 3 73.3 x Les tests d hypothèse 24 / 67

Exemple Statville (8) Distribution d échantillonnage de la moyenne d échantillon x lorsque H est vraie (µ = 5): σ 4 σ x = = = 73.3 n 3 µ = 5 Les tests d hypothèse 25 / 67

Exemple Statville (9) Approche par la valeur p : Le syndic perd son pari, car 1.3% < 5%. P z 2.48 =.66 P ( z 2.48) =.66 ( ) Excel : =LOI.NORMALE.STANDARD(-2.48) 2.48 2.48 valeur p = 2.66 =.132 Les tests d hypothèse 26 / 67

Exemple Statville (1) Approche par la valeur critique : Le syndic perd son pari, car 2.48 > 1.96 = z.975. S ils s étaient mis d accord sur un seuil de signification de 1%, ce qui aurait impliqué une exigence plus forte pour rejeter H, le syndic aurait gagné le pari. o valeur p : 1.3% > 1 % o valeur critique : 2.48 < 2.576 = z.995 Les tests d hypothèse 27 / 67

Test unilatéral, σ inconnu (1) Dans la plupart des cas pratiques, on doit s appuyer sur l échantillon pour l estimation de µ (via x ) et de σ (via s). Tout comme pour les intervalles de confiance, les tests d hypothèse avec σ inconnu sont basés sur la distribution du t de Student. Sous H, la statistique de test devient donc : t x µ n = t s n 1 Les tests d hypothèse 28 / 67

Test unilatéral, σ inconnu (2) Approche par la valeur p : Avec σ inconnu et une fois qu on a choisi un seuil de signification α, on rejette H si p α, o où : o et : p p = P t = P t x µ s n n 1 x µ s n n 1 Approche par la valeur critique : si H 1 : µ > µ (test unilatéral supérieur), si H 1 : µ < µ (test unilatéral inférieur). Avec σ inconnu, et une fois qu on a choisi un seuil de signification n 1 α, on rejette H si t t α. Les tests d hypothèse 29 / 67

Exemple Statville (11) Reprenons la question si la commune de Statville est éligible pour des subventions fédérales, donc si µ < 54 ou µ 54 ; et supposons que ni µ ni σ ne soient connus (ce qui est bien plus réaliste que de supposer que σ soit connu). n = 3, x = 51814, s = 3348 H : µ 54 ; H 1 : µ < 54 (test unilatéral inférieur) x µ 51814 54 2186 Statistique de test : t = = = = 3.58 s n 3348 3 611.3 Les tests d hypothèse 3 / 67

Exemple Statville (12) Approche par la valeur p : o La valeur p correspond à la P(t 29 3.58) = P(t 29 3.58) o Table des probabilités du t de Student, 29 degrés de liberté t 29.1 = 3.396, t 29.5 = 3.659 (voir table sur site du cours) la valeur p doit être inférieure à.1 et supérieur à.5, mais on ne peut pas dire davantage o Excel : =LOI.STUDENT(3.58;29;1) donne la valeur p exacte (p =.6). Approche par la valeur critique : o t = 3.58 > t = 2.462 H rejetée 29.1 Les tests d hypothèse 31 / 67

Test bilatéral, σ inconnu Formulation du test : H : µ = µ ; H 1 : µ µ Tout comme pour le test bilatéral, sous H, et puisque la distribution d échantillon de x est normale, la statistique de test est donnée par : x µ n 1 t = t s n Approche par la valeur p : Avec σ inconnu, et une fois qu on a choisi α, on rejette H si p α, où x µ x µ p = P t + P t s n s n Approche par la valeur critique : Avec σ inconnu, et une fois qu on a choisi α, on rejette H si t t α. n 1 2 n 1 n 1 ( ) ( ) Les tests d hypothèse 32 / 67

Exemple Statville (13) Rappel : le pari entre le syndic et ses conseillers o H, défendue par le syndic : µ = 5, et o H 1, défendue par les conseillers : µ 5 o Seuil de confiance de 5% n = 3, x = 51814, s = 3348 x µ 51814 5 1814 t = = = = s n 3348 3 611.3 2.97 Les tests d hypothèse 33 / 67

Exemple Statville (14) Approche par la valeur p : Le syndic perd son pari, car.6% < 5%. 29 P( t 2.97) =.3 29 P( t 2.97) =.3 2.97 2.97 t valeur p = 2.3 =.6 Les tests d hypothèse 34 / 67

Test d hypothèse et intervalle de confiance (1) Définition de l intervalle de confiance pour µ avec un seuil de confiance 1 α : x ± t n 1 α 2 s n Définition de la région de non-rejet de H pour x dans un test d hypothèse bilatéral avec un seuil de signification α : µ ± t n 1 α 2 s n (impliqué par statistique de test «critique» : t x n 1 = = tα 2) s µ n Les tests d hypothèse 35 / 67

Test d hypothèse et intervalle de confiance (2) Pour un α donné, si x se situe dans la région de non-rejet, µ se situe dans l intervalle de confiance. Inversement, si µ est dans l intervalle de confiance, x sera dans la région de non-rejet de H : µ = µ. On peut donc utiliser les intervalles de confiance pour tester des hypothèses bilatérales sur µ : o Si µ est contenu dans l intervalle de confiance, on ne peut pas rejeter H : µ = µ, à un seuil de signification α. o Si µ n est pas contenu dans l intervalle de confiance, on peut rejeter H : µ = µ, à un seuil de signification α. Les tests d hypothèse 36 / 67

Test d hypothèse et intervalle de confiance (3) Test d une hypothèse unilatérale sur µ : o Exemple : H : µ µ (test unilatéral inférieur) o Si µ est contenu dans l intervalle de confiance, on ne peut pas rejeter H : µ µ, à un seuil de signification α/2. o Si la borne inférieure de l intervalle de confiance est en dessus de µ, on ne peut pas rejeter H : µ µ, à un seuil de signification α/2. o Si la borne supérieure de l intervalle de confiance est en dessous de µ, on peut rejeter H : µ µ, à un seuil de signification α/2. Les tests d hypothèse 37 / 67

Exercice Excel Générer échantillon aléatoire : ( 518,4) x N, n = 3 o Utilitaire d analyse Génération de nombres aléatoires Calculer x, (s n) o Utilitaire d analyse Statistiques descriptives Calculer statistique de test de la moyenne, t (H : µ = 52) o =(x -52)/ (s n) Calculer valeur p d un test unilatéral supérieur (H 1 : µ > 52) o =SI(t>;LOI.STUDENT(t;29;1);1-LOI.STUDENT(-t;29;1)) Calculer valeur p d un test unilatéral inférieur (H 1 : µ < 52) o =SI(t>;1-LOI.STUDENT(t;29;1);LOI.STUDENT(-t;29;1)) Calculer valeur p d un test bilatéral (H 1 : µ 52) o =SI(t>;LOI.STUDENT(t;29;2);LOI.STUDENT(-t;29;2)) Les tests d hypothèse 38 / 67

Signifiance statistique et signifiance pratique signifiance statistique signifiance pratique/économique! Un résultat «statistiquement significatif» est un résultat qui ne peut être expliqué (à une certaine probabilité près) par µ µ 1 l erreur d échantillonnage. «grand» s n Un résultat «économiquement significatif» est un résultat dont l ampleur est suffisamment grande qu il est judicieux d en tenir compte. µ 1 µ «grand» En augmentant n suffisamment, toute H peut être rejetée sauf une H exactement correcte. Ne pas s intéresser uniquement à la signification statistique, particulièrement quand on travaille avec des grands échantillons! Les tests d hypothèse 39 / 67

Chapitre 3 : INFERENCE 3.4 LES TESTS D HYPOTHESE 3.4.1 Formuler des hypothèses 3.4.2 Erreurs de 1 e et 2 e espèce 3.3.3 Test sur la moyenne d une population 3.3.4 Puissance du test 3.3.5 Proportion 3.3.6 Tests du Khi-deux Les tests d hypothèse 4 / 67

Puissance du test Rappel : La puissance d un test, γ = 1 β, est la probabilité de rejeter H correctement, càd quand H est effectivement fausse. Maximiser la puissance d un test est minimiser le risque de deuxième espèce. La puissance d un test o augmente avec la distance entre la vraie valeur du paramètre et la valeur hypothétique θ θ (cas d un test sur les moyennes : µ µ ), o augmente quand on augmente le seuil de signification α (α β γ ), o diminue quand l écart type de la population σ augmente, et o augmente quand on augmente la taille de l échantillon n. Les tests d hypothèse 41 / 67

Test unilatéral Puissance d un test unilatéral sur la moyenne : o H : µ µ ; H 1 : µ < µ ; seuil de signification : α o Puissance du test ( n 1 = γ = 1 β = P x µ ) tα s n H1 ( n 1 = P x µ ) tα s n µ = µ 1 < µ n 1 µ tα s n µ 1 = P t s n 1 n 1 P t µ µ = t α s n o On peut voir par simple inspection de cette expression que γ doit augmenter quand augmentent ( µ µ 1), n et α, et diminuer quand augmente s. Les tests d hypothèse 42 / 67

Test bilatéral Puissance d un test bilatéral sur la moyenne : o H : µ = µ ; H 1 : µ µ ; seuil de signification : α o γ = 1 β ( n 1 ) ( n 1 µ ) α 2 1 µ α 2 1 = P x t s n H + P x + t s n H µ µ 1 n 1 µ µ 1 n 1 = P t tα 2 + P t + tα 2 s n s n o De nouveau, on peut voir par simple inspection de cette expression que γ doit augmenter quand augmentent µ µ 1, n et α, et diminuer quand augmente s. Les tests d hypothèse 43 / 67

Exemple Statville (1) Reprenons le test unilatéral pour les subventions fédérales, mais supposons que le seuil d éligibilité soit abaissé d un revenu moyen de 54 francs à un revenu moyen de 52 francs. H : µ 52 ; H 1 : µ < 52 n = 3, x = 51814, s = 3348 (rappel : µ = 518) x µ 51814 52 186 Statistique de test : t = = = =.3 s n 3348 3 611.3 valeur critique 29.1 2.462 t = H non rejetée Question : Quelle est la probabilité que ce verdict ne soit pas correct? Donc, quelle est le risque d avoir commis un erreur de seconde espèce, β, et donc la puissance du test, γ = 1 β? Les tests d hypothèse 44 / 67

Exemple Statville (2) Afin de pouvoir calculer γ, il faut spécifier une valeur précise du paramètre sous H 1, µ 1. Définissons µ 1 ainsi que H 1 soit «tout juste» vraie : µ 1 = 51999 Donc µ µ 52 51999 γ = = s n 611.3 1 n 1 29 P t tα P t t.1 1 29 ( 29 = P t t ).1 P t t.1 =.1 611.3 Si H 1 était donc «tout juste» vraie et le revenu moyen de Statville était en dessous du seuil critique de 1 franc, le risque de seconde espèce (càd de conclure à tort que Statville n est pas suffisamment pauvre) serait de 99 pourcent. Les tests d hypothèse 45 / 67

Exemple Statville (3) Comme alternative, définissons µ 1 ainsi que cette valeur corresponde au revenu moyen vrai (fictif) : µ 1 = 518 52 518 29 γ = P t t.1 611.3 = P t.327 2.462 = P( t 2.135) ( ) γ =.2 (Excel : =LOI.STUDENT(2.135;29;1)) La puissance de ce test reste donc très faible, et il est judicieux de parler de «non-rejet» de H plutôt que d «acceptation» de H. Les tests d hypothèse 46 / 67

Exemple Statville (4) Augmentons encore l écart entre µ et µ 1 : µ 1 = 5 52 5 29 γ = P t t.1 611.3 = P t 3.272 2.462 = P( t.81) ( ) γ =.79 (Excel : =1-LOI.STUDENT(.81;29;1)) En traçant ainsi la relation entre γ et µ µ 1 en variant µ 1, on peut dessiner la «courbe caractéristique» de la puissance d un test. Les tests d hypothèse 47 / 67

Exemple Statville (5) La courbe caractéristique pour le test unilatéral des moyennes H : µ 52 ; H 1 : µ < 52 ; n = 3, s = 3348 α =.1 1 α =.5.8 γ.6 α =.1 α =.1.4.2 48 49 µ 1 5 51 52 Les tests d hypothèse 48 / 67

Exemple Statville (6) Rappel : µ 1 = 5 52 5 =.1 = = 611.3 29 γ P t t P ( t 3.272 2.462).79 Augmentons la taille de l échantillon à n = 4 52 5 =.1 = = 529.4 39 γ P t t P ( t 3.778 2.426) test d hypothèse convergent : lim( γ ) = 1 n.91 Alternativement, augmentons le seuil de signification à α =.5 52 5 29.94 γ = P t t.5 = P ( t 3.272 1.699) = 611.3 Les tests d hypothèse 49 / 67

Chapitre 3 : INFERENCE 3.5 LES TESTS D HYPOTHESE 3.5.1 Formuler des hypothèses 3.5.2 Erreurs de 1 e et 2 e espèce 3.3.3 Test sur la moyenne d une population 3.3.4 Puissance du test 3.3.5 Proportion 3.3.6 Tests du Khi-deux Les tests d hypothèse 5 / 67

Bases (1) Les trois cas de figure : o H : p p ; H 1 : p < p test unilatéral inférieur o H : p p ; H 1 : p > p test unilatéral supérieur o H : p = p ; H 1 : p p test bilatéral Si np > 5 et n(1 p) > 5, alors la distribution d échantillonnage de la proportion d échantillon p devient approximativement normale : p ( 1 p) p N ( p, σ ) p, où σ p = n Alors, sous H : p N ( p σ ), p, où σ p = p ( 1 p ) n Les tests d hypothèse 51 / 67

Bases (2) La statistique de test est donc donnée par : z p p p p = = σ p p ( 1 p ) n N (,1) Approche par la valeur critique : On rejette H o si z z 1 α, quand H 1 : p > p ou H 1 : p < p (test unilatéral), o et si z z 1 α/2, quand H 1 : p p (test bilatéral). Les tests d hypothèse 52 / 67

Bases (3) Approche par la valeur p : On rejette H si p α, où p p σ o p = P z o p = P z p p p σ p si H 1 : p > p (test unilatéral supérieur), si H 1 : p < p (test unilatéral inférieur), et p p p p o p = P z + P z σ p σ p si H 1 : p p (test bilatéral). Les tests d hypothèse 53 / 67

Exemple Statville (1) Imaginons que le syndic réfléchit à introduire un quorum de >5% de participation aux assemblées communales. Il cherche à trouver, à partir de son échantillon de 3 personnes, si ce quorum n aurait pas été atteint lors de la dernière assemblée. Il se fixe un seuil de signification de 5%. H : p.5 ; H 1 : µ >.5 ; α =.5 (test unilatéral supérieur) Approche par la valeur p : p p.63.5 p = P z = P z = P ( z 1.424) =.8 σ p.5( 1.5) 3 Approche par la valeur critique : z = 1.424 < 1.645 = z non-rejet de H!.95 Les tests d hypothèse 54 / 67

Exemple Statville (2) Aire =.43 valeur p = P(z 1.47) =.7 Les tests d hypothèse 55 / 67

Chapitre 3 : INFERENCE 3.6 LES TESTS D HYPOTHESE 3.6.1 Formuler des hypothèses 3.6.2 Erreurs de 1 e et 2 e espèce 3.3.3 Test sur la moyenne d une population 3.3.4 Puissance du test 3.3.5 Proportion 3.3.6 Tests du Khi-deux Les tests d hypothèse 56 / 67

Bases (1) Test d ajustement du khi-deux : on cherche à tester l hypothèse selon laquelle une variable de la population, x, suit une certaine distribution statistique L, avec q moments estimés dans l échantillon ( ˆ θ ˆ ˆ ) 1, θ2,..., θ q. Il s agit donc d un test d hypothèse non paramétrique. ˆ 1, ˆ ˆ 2,..., q ˆ 1, ˆ ˆ 2,..., q H : x L( θ θ θ ) ; H 1 : x L( θ θ θ ) X Les tests d hypothèse 57 / 67

Bases (2) Démarche : 1. grouper les valeurs observées de la variable en classes j = 1,,k, ainsi que l effectif théorique d ajustement (fréquence attendue) N soit au moins égal à 5 pour chaque t j classe (pour convergence de la loi binomiale vers la loi t N = n * P x Classe H 5 normale) : ( ) j 2. calculer pour chaque classe j le nombre d observations N j (fréquence observée) j 3. statistique de test : D ( t ) 2 k N j N j 2 t = χ t ( k q 1) j 1 N, si N j 5 = j j si les q moments sont estimés empiriquement ; autrement, prendre (k 1) degrés de liberté Les tests d hypothèse 58 / 67

Dérivation du test (1) Définition de la loi du khi-deux : ( ) z N,1 j ; z indépendants j k K z χ =, j = 1 2 2 j k r où r indique le nombre de relations liant les différents z j. j Densité de la loi du χ 2 en fonction du nombre de degrés de liberté Les tests d hypothèse 59 / 67

Dérivation du test (2) Supposez une variable binomiale Y 1 Bin( n, p 1 ), avec une 2 moyenne µ = np et une variance σ Y = np1(1 p1). Y 1 1 Dans le contexte du test du khi-deux, Y 1 correspondrait à la fréquence observée, et np 1 correspondrait à la fréquence attendue de la classe 1. Théorème centrale limite (convergence de la loi binomiale vers la Y1 µ Y1 loi normale) Z = N (,1), si np 5. σ Y 1 1 Les tests d hypothèse 6 / 67

Dérivation du test (3) Supposez k = 2 Y2 = n Y1 et p2 = 1 p1. Alors : Z 2 2 2 ( Y np ) ( Y np ) ( 1 p ) + ( Y np ) p np1 ( 1 p1 ) np1 ( 1 p1 ) ( Y1 np1 ) ( Y1 np1 ) ( Y1 np1 ) ( Y2 np2 ) np n ( 1 p ) np np = = 2 1 1 1 1 1 1 1 1 2 2 2 2 = + = + 1 1 1 2 Avec k variables de ce type, on peut montrer que : k ( Y ) 2 j npj 2 D = χk 1 np j = 1 j χ 2 1 ( Y np ) = ( n Y n + np ) = ( Y np ) 2 2 2 1 1 2 2 2 2 Les tests d hypothèse 61 / 67

Exemple Statville (1) Le syndic cherche à savoir si la distribution des revenus dans sa commune suit une loi normale, se basant sur son échantillon aléatoire simple de taille n = 3 (dont x = 51814 et s = 3348). Il définit cinq classes de revenu dont sous H chacune a une t probabilité de 2%, ainsi que N =.2 * 3 = 6 j : o borne supérieure de la première classe = x 1, x N 51814,3348 telle que P(x x 1 ) =.2 si ( ) j Excel : =LOI.NORMALE.INVERSE(.2;51814;3348) o borne supérieure de la deuxième classe = x 2, x N 51814,3348 telle que P(x 1 < x x 2 ) =.2 si ( ) Excel : =LOI.NORMALE.INVERSE(.4;51814;3348) o etc. Les tests d hypothèse 62 / 67

Exemple Statville (2) Histogramme (fréquences observées) : Excel : Outils Utilitaire d analyse Histogramme (donner Plage des classes) Histogramme Fréquence 8 7 6 5 4 3 2 1 48996 5965 52662 54631 ou plus sous H, cette distribution est uniforme, avec six observations par classe Classes Les tests d hypothèse 63 / 67

Exemple Statville (3) Statistique de test : D ( t ) 2 k N j N j t j = 1 N j = χ = χ 2 2 2 ( 5 2 1) 1 = 4 6 + 7 6 + 7 6 + 5 6 + 7 6 6 1 = ( 4 + 1 + 1 + 1 + 1 ) = 1.33 6 Valeur p =.51 (Excel : =LOI.KHIDEUX(1.33;2)) ([ ] 2 [ ] 2 [ ] 2 [ ] 2 [ ] 2 ) Valeur critique (α = 5%) : χ 2 2 k q 1, α = χ2,.5 = 5.99 (Excel : =KHIDEUX.INVERSE(.5;2)) H non rejetée Les tests d hypothèse 64 / 67

Exemple Statville (4) Le syndic a lu que dans le pays tout entier, la distribution des revenus peut être approximée par une loi normale avec une moyenne µ = 53 et un écart type σ = 5 (moments qu il n a pas dû estimer dans son échantillon). Il cherche à vérifier si cette distribution est valide aussi pour sa commune, se basant sur le même échantillon. Il redéfinit cinq classes de revenu dont sous la nouvelle H chacune a une probabilité de 2%, ainsi que N =.2 * 3 = 6 j : t j o borne supérieure de la première classe = x 1, x N 53,5 telle que P(x x 1 ) =.2 si ( ) Excel : =LOI.NORMALE.INVERSE(.2;53;5) o etc. Les tests d hypothèse 65 / 67

Exemple Statville (5) Histogramme (fréquences observées) : Excel : Outils Utilitaire d analyse Histogramme (donner Plage des classes) Histogramme Fréquence 12 1 8 6 4 2 48792 51733 54267 5728 ou plus Classes sous H, cette distribution est uniforme, avec six observations par classe Les tests d hypothèse 66 / 67

Exemple Statville (6) Statistique de test : D ( t ) 2 k N j N j t j = 1 N j = χ = χ 2 2 4 ( 5 1) 1 = 4 6 + 1 6 + 8 6 + 6 6 + 2 6 6 1 = ( 4 + 16 + 4 + + 16 ) = 6.67 6 Valeur p =.15 (Excel : =LOI.KHIDEUX(6.67;4)) ([ ] 2 [ ] 2 [ ] 2 [ ] 2 [ ] 2 ) Valeur critique (α = 5%) : χ 2 2 k 1, α = χ4,.5 = 9.49 (Excel : =KHIDEUX.INVERSE(.5;4))! H non rejetée si α 15% Les tests d hypothèse 67 / 67