Statistique - Tests d hypothèses. Exercices



Documents pareils
Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Estimation et tests statistiques, TD 5. Solutions

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Principe d un test statistique

T de Student Khi-deux Corrélation

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Analyse de la variance Comparaison de plusieurs moyennes

Exercices supplémentaires sur l introduction générale à la notion de probabilité

TSTI 2D CH X : Exemples de lois à densité 1

Evaluation de la variabilité d'un système de mesure

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Relation entre deux variables : estimation de la corrélation linéaire

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Accompagnement de projet environnement. Entreprise : Scell-it Yourself

Dossier retraite. Profil 1B. Année de naissance. Profil 1A

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Partie 1 - Séquence 3 Original d une fonction

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Équivalence et Non-infériorité

Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1

25/01/05 TD Entrepôt de données IHS / Master ICA

Cours de Tests paramétriques

FORMATION ECLAIRAGE PUBLIC

Appel à manifestation d intérêt

Formation des enseignants. Le tensiomètre. Objet technique modélisable issu de l environnement des élèves

Je m inscris au forfait, donc je consulte toujours dans ma maison médicale

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

FORMULAIRE DE STATISTIQUES

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

(Ordonnance n 109/08) Efficace le 1 septembre, 2008 CODE DE DÉONTOLOGIE VISANT LES TRANSACTIONS D ACHAT DIRECT

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

À l'intention des parents

Chapitre 5. Le ressort. F ext. F ressort

Chapitre 2/ La fonction de consommation et la fonction d épargne

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Chapitre 2 Les ondes progressives périodiques

Surveillance consolidée des banques et des négociants en valeurs mobilières

Probabilités conditionnelles Loi binomiale

Ordonnancement robuste et décision dans l'incertain

Biostatistiques : Petits effectifs

! " # $ % & '! % & & # # # # % & (

Introduction à la théorie des files d'attente. Claude Chaudet

Capteur mécanique universel HF 32/2/B

La classification automatique de données quantitatives

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Leading in Welded Bellows Technology. Soufflets à membranes soudées pour de nombreuses applications.

23. Interprétation clinique des mesures de l effet traitement

Un moyen simple d'être plus favorable aux familles Les points les plus importants du Family Score en un coup d'œil

Chapitre 1 : Évolution COURS

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE

CardiOuest Mail : info@cardiouest.fr - Téléphone :

Théorie des sondages : cours 5

Optimisation des performances d échangeurs de chaleur.

CORRECTION BANQUE DUPONT-DURAND

Questions générales sur le stationnement

Introduction. Les articles de la presse spécialisée tendent à nous laisser penser que c est en effet le cas :

Repérage de l artillerie par le son.

TABLE DES MATIERES. C Exercices complémentaires 42

OBJETS D ETUDE EN ECONOMIE-DROIT

DOSSIER : TOURISME ET HANDICAP

Le chi carré. Le sommaire. Approche quantitative

FAQ. Admissions en Bachelor. A la Haute école de gestion Arc. Année académique Dernière mise à jour : / GCH

choisir H 1 quand H 0 est vraie - fausse alarme

PROPOSITION TECHNIQUE ET FINANCIERE

«Evaluation de l activité physique chez les enfants et adolescents à l aide d une méthode objective» SOPHYA

Le coaching centré sur la solution

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Exercices de Statistique HEI /2015 A. RIDARD

ENTREPRISES EMPLOYEURS ET SALARIÉS TOUT SAVOIR SUR LA GÉNÉRALISATION DE LA COMPLÉMENTAIRE SANTÉ

Voici une demande qui revient régulièrement lors de mes rencontres avec les employeurs :

Lagrange, où λ 1 est pour la contrainte sur µ p ).

LES DIFFERENTS TYPES DE MESURE

C.F.A.O. : Conception et Fabrication Assistées par Ordinateur.

Véhicule électrique HS Véhicule électrique HS Liberté et qualité de vie. Prix bas permanents.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

F-MAR15. Brochure de produit

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Réussir l ouverture d un commerce de restauration rapide

La simulation probabiliste avec Excel

1 Définition de la non stationnarité

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Le profil des acheteurs à distance et en ligne

Former des enseignants à l intégration des TICE bilan des usages, perspectives et questionnement

Contributions à l expérimentation sur les systèmes distribués de grande taille

FAQ RENOUVELLEMENT QUESTIONS ESSENTIELLES AU RENOUVELLEMENT :

Techniques d interaction dans la visualisation de l information Séminaire DIVA

AUTRES ASPECTS DU GPS. Partie I : tolérance de Battement Partie II : tolérancement par frontières

BACCALAURÉAT PROFESSIONNEL SUJET

Les politiques fiscales d incitation à donner

Étude comparative sur les salaires et les échelles salariales des professeurs d université. Version finale. Présentée au

Dispositions de la loi de finances 2014 relatives à la contribution libératoire

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Transcription:

Module 2101 Statistique - Tests d hypothèses Exercices Fabrice Heitz Septembre 2013

1 Tests sur une seule population (comparaison par rapport à une référence) Exercice 1 : Test sur la moyenne : réglage d une machine 1. Une machine produit des tiges métalliques dont la longueur nominale est égale à 8,30 cm. Les fluctuations de longueur dues au procédé de fabrication correspondent à un écart-type de 0,6 cm. Sur la base d un échantillon aléatoire de taille N = 100, on veut tester si la machine est bien réglée. La moyenne des longueurs mesurées sur l échantillon est de 8,57 cm. Faut-il réaliser un test unilatéral ou bilatéral? Conclure pour un seuil de signification α de 5%, 1% et 0,1%. Réponse : Z = 4, 50. L hypothèse H 0 (machine bien réglée) est rejetée pour toutes les valeurs de α. 2. Quelle serait la conclusion avec seulement 20 échantillons pour la même moyenne mesurée (on supposera dans ce cas que la longueur des pièces produites suit une loi normale)? Réponse : Z = 2, 01. L hypothèse H 0 est rejetée pour α=5%. On ne peut rejeter H 0 pour α=1% et 0,1%. 3. Une machine produit des tiges métalliques dont la longueur nominale, égale à 8,30 cm est supposée suivre une loi normale. Sur la base d un échantillon aléatoire de taille N = 20, on veut tester si la machine est bien réglée. La moyenne et l écart-type des longueurs mesurées sur l échantillon est respectivement de 8,57 m et 0,6 cm. Que peut-on en conclure (pour les mêmes seuils de signification)? Réponse : T = 2, 01. L hypothèse H 0 n est rejetée pour aucune valeur de α. 4. Comparer et commenter les différents cas. Exercice 2 : Test sur la variance : précision d usinage de pièces automobiles Les pièces des moteurs d automobiles de dernière génération sont usinées avec une très grande précision. L écart-type des dimensions d une pièce ne doit pas dépasser 10µm (les dimensions suivent une loi normale, la dimension moyenne n est pas donnée). On prélève sur une unité de production 25 moteurs pour lesquels des mesures dimensionnelles menées sur la même pièce donnent un écart-type de 13, 5µm. Peut-on conclure que la 1

variabilité est supérieure à la valeur tolérée (on adoptera un seuil de signification de 1%)? Réponse : χ 2 = 43, 7. Rejet de H 0 au seuil 1%. Donc on peut conclure que l unité de production est défaillante. Exercice 3 : Test sur une proportion : la marche des bébés Des études en psychologie du développement on montré qu à l âge de 12 mois, 50 % des bébés normaux marchent. On souhaite mener une étude sur les retards de développement des bébés prématurés. On teste l hypothèse que les bébés prématurés marchent plus tardivement que les bébés normaux. On observe une population de 80 bébés prématurés. A 12 mois, 35 de ces 80 bébés marchent. Faut-il réaliser un test unilatéral ou bilatéral? Peut-on, au seuil de signification de 5%, valider l hypothèse de recherche? Quelle est la p-valeur dans ce cas? Réponse : Z=-1,12. On ne peut rejeter H 0 (les observations disponibles ne montrent pas que les bébés prématurés marchent plus tardivement). La p-valeur est : p = 0, 1314 (donc le test serait significatif pour un choix de α > 13, 14%). Exercice 4 : Test sur une proportion : le dé est-il pipé? On joue avec un dé qui semble tomber trop souvent sur la face 6. Dans une expérience on a lancé 40 fois ce dé et obtenu 10 fois le 6. 1. Au seuil de signification de 5% peut-on conclure que le dé est pipé par excès d apparition du 6? 2. Sur 40 lancers, à partir de quelle proportion de faces 6 peut-on conclure que le dé est pipé (au seuil de signification de 5%)? 3. Quelle est la réponse à la question 2, lorsqu on on ne sait pas a priori si le dé, que l on soupçonne d être pipé, tombe trop souvent ou pas assez souvent sur la face 6? Réponses : 1) Z = 1, 41. On ne peut donc conclure que le dé est pipé. 2) Pour conclure à un dé pipé on devrait observer, sur 40 lancers, un nombre de faces 6 11 (test unilatéral). 3) Dans ce cas le nombre de faces 6 doit être 12 ou 2. 2

2 Tests comparant deux populations Exercice 5 : Comparaison de moyennes : ph-mètre 1. Pour mesurer le ph d une solution, on utilise un ph-mètre qui affiche un résultat dont la loi est N (µ, 0, 05 2 ), où µ est la vraie valeur du ph de la solution. On a mesuré le ph d une solution A par 12 mesures indépendantes et trouvé une moyenne de 7,4, et le ph d une solution B par 10 mesures indépendantes et trouvé une moyenne de 7,5. Peut-on considérer que les deux solutions ont même ph, au niveau de risque 1%? Réponse : Z = 4, 67. L hypothèse H 0 est rejetée au seuil 1% (et même 0,1%). On conclut donc que les deux solutions n ont pas même PH. 2. Pour mesurer le ph d une solution, on utilise un nouveau ph-mètre qui affiche un résultat dont la loi est N (µ, σ 2 ), où µ est la vraie valeur du ph de la solution et où σ n a pas été déterminé. On a mesuré le ph d une solution A par 12 mesures indépendantes et trouvé une moyenne de 7,4 et un écart-type empirique de 0,09, et le ph d une solution B par 10 mesures indépendantes et trouvé une moyenne de 7,5 et un écart-type empirique de 0,08. Peut-on considérer que les deux solutions ont même ph? Réponse : T = 2, 73. les mesures disponibles ne permettent pas de rejeter H 0 (solutions de mêmes PH), au seuil 1% Exercice 6 : Comparaison de moyennes et variances : taille des poissons d après Stéphane Guidon, DESS bioinformatique, LIRMM Dans une étude en biologie on mesure la longueur des spécimens mâles et femelles de poissons adultes appartenant à la même espèce. On obtient les résultats suivants (longueurs en mm) : mâles 120 107 110 116 114 111 113 117 114 112 femelles 110 111 107 108 110 105 107 106 111 111 Peut-on affirmer que la taille des individus diffère entre les deux sexes de cette espèce? (On supposera que les tailles dans les deux populations sont distribuées selon des lois normales). On n oubliera pas de tester tout d abord l hypothèse d homoscédasticité (égalité des variances). On prendra α = 5%. 3

Réponse : N 1 = 10 ; X1 = 113, 40 ; S 1 3, 7178 ; N 2 = 10 ; X2 = 108, 60 ; S 2 2, 2706 Test d égalité des variances : F 2, 68, seuil de décision pour α = 5% : 4,03. Donc l hypothèse d égalité des variances est acceptée. On peut donc réaliser le test de comparaison des moyennes (test de Student) : T 3, 48, seuil de décision pour α = 5% : 2,10. Conclusion : les tailles sont en moyenne significativement différentes. Exercice 7 : Comparaison de proportions : traitements anti-cancéreux On teste deux traitements anti-cancéreux A et B sur deux populations de patients P A et P B (de même taille n A = n B = 50). L efficacité d un traitement est évaluée par l éventuelle diminution de la taille de la lésion tumorale, estimée par imagerie médicale, après un an de traitement. Pour la population soumise au traitement A on observe une diminution de la taille des tumeurs dans 27 cas sur 50, pour le traitement B, dans 18 cas. Peut-on conclure à une différence d effet des deux traitements (au seuil de 5 %)? Peut-on conclure que le traitement A est plus efficace que le traitement B (avec le même seuil de signification)? Réponse : valeur du test = 1,8091 Test bilatéral : seuil 1,96, on ne peut rejeter H 0 Test unilatéral : seuil 1,64, rejet de H 0 3 Tests du χ 2 Exercice 8 : Test d homogénéité : comparaison de méthodes pédagogiques d après F. et M. Diener, Université Nice Sophia Antipolis Dans une Ecole, trois groupes de professeurs ont mis au point trois méthodes différentes d enseignement des statistiques, qu on a appliqué à trois échantillons d étudiants ayant sensiblement le même niveau initial. A l examen les résultats furent les suivants : Admis Ajournés Total Méthode 1 51 29 Méthode 2 38 12 Méthode 3 86 34 Total Peut-on affirmer que l une des trois méthodes est plus efficace que les autres en termes de réussite à l examen? (Effectuer un test d homogénéité). Réponse : χ 2 2, 51, ddl=2, à α = 5% on ne peut rejeter H 0. 4

4 Calcul de la puissance d un test Exercice 9 : Calcul de puissance dans un test (comparaison d une moyenne à une référence) Applet : http://www.math.usu.edu/~schneit/ctis/hterrors/ Figure 1 Les deux types d erreurs dans un test d hypothèse H 0 vraie H 1 vraie rejet de H 0 (décision H 1 ) α 1 β non rejet de H 0 1 α β Erreur de 1ère espèce : décider H 1 (rejeter H 0 ) alors que H 0 est vraie α = p(h 1 H 0 ) risque de 1ère espèce Erreur de 2ème espèce : ne pas rejeter H 0 alors que H 1 est vraie β = p(h 0 H 1 ) risque de 2ème espèce Puissance du test : 1 β = p(h 1 H 1 ) La puissance mesure la capacité du test à discriminer correctement les deux hypothèses. Un bon test est un test qui, pour α donné 1, maximise la puissance 1 β (ou minimise le risque de 2ème espèce β). Un test satisfaisant doit avoir une puissance d au moins 0,80. 1. on choisit souvent α = 5% ou α = 1% 5

Enoncé de l exercice : on considère un test de comparaison de la moyenne d une variable d intérêt sur une population (e.g. durée de vie d un moteur, voir étude de cas du cours) par rapport à une valeur de référence µ 0. La variable aléatoire d intérêt X est supposée suivre une loi normale N (µ, σ). Les deux hypothèses à tester sont : H 0 : µ = µ 0 H 1 : µ > µ 0 (test unilatéral) On note µ 1 la vraie moyenne si H 1 est vraie. Le test est mené sur N échantillons X i prélevés sur la population. Le test est mené sur la moyenne empirique : X = 1 N N i=1 X i N (µ, σ2 ) N si H 0 est vraie : X N (µ0, σ2 si H 1 est vraie : X N (µ1, σ2 ) N ) N La statistique T utilisée pour le test est : T = X µ 0 σ/ N On se fixe le risque de 1ère espèce α et on détermine le seuil de décision z α tel que : p(z > z α ) = + z α f Z (z)dz = α où z N (0, 1) (pour α = 5%, z α = 1, 64). 1. Montrer que l expression de la puissance 1 β pour ce test est : ( ) µ1 µ 0 N 1 β = p(z > z α ) σ } {{ } z 1 β où z N (0, 1). On note = µ 1 µ 0 la différence entre les moyennes sous H 1 et H 0. 2. Etudier qualitativement les variations de la puissance du test lorsque : α varie varie N varie Réponse : lorsque α, β et la puissance lorsque, β et la puissance lorsque N, β et la puissance On utilisera les résultats des calculs précédents et la simulation disponible sur : http://wise.cgu.edu/power_applet/power.asp 3. Pour α = 0, 05, σ = 1 et N = 30, déterminer la plus petite différence de moyenne que l on peut mettre en évidence avec ce test, en garantissant une puissance 1 β 0, 80. Même question pour N = 10 et N = 20. Réponse : N = 10 : min 0, 78, N = 20 : min 0, 55, N = 30 : min 0, 45 4. Quel est le nombre minimal d échantillons nécessaires pour mettre en évidence une différence de moyenne de = 0, 1? (en conservant une puissance 0, 80). Réponse : N 616 On utilisera les résultats des calculs précédents et la simulation disponible sur : http://wise.cgu.edu/power_applet/power.asp 6