Estimation et tests statistiques, TD 5. Solutions



Documents pareils
Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Loi binomiale Lois normales

Chapitre 3 : INFERENCE

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Lois de probabilité. Anita Burgun

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Principe d un test statistique

TSTI 2D CH X : Exemples de lois à densité 1

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Analyse de la variance Comparaison de plusieurs moyennes

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Calcul élémentaire des probabilités

Programmes des classes préparatoires aux Grandes Ecoles

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

TESTS D'HYPOTHESES Etude d'un exemple

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Introduction à l approche bootstrap

Probabilités conditionnelles Loi binomiale

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Moments des variables aléatoires réelles

Les devoirs en Première STMG

Correction du baccalauréat ES/L Métropole 20 juin 2014

mathématiques mathématiques mathématiques mathématiques

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Probabilités conditionnelles Exercices corrigés

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

EPREUVES AU CHOIX DU CANDIDAT. Durée : De 09 h 00 à 12 h 00 (Heure de Yaoundé, TU + 1)

Introduction à la statistique non paramétrique

Représentation d une distribution

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Biostatistiques : Petits effectifs

Ressources pour le lycée général et technologique

IFT3245. Simulation et modèles

Calculs de probabilités conditionelles

4 Distributions particulières de probabilités

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Probabilités III Introduction à l évaluation d options

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Cours de Tests paramétriques

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Simulation de variables aléatoires

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

VI. Tests non paramétriques sur un échantillon

MATHÉMATIQUES. Mat-4104

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

CAPTEURS - CHAINES DE MESURES

Correction du baccalauréat STMG Polynésie 17 juin 2014

Université Paris 8 Introduction aux probabilités Licence Informatique Exercices Ph. Guillot. 1 Ensemble fondamental loi de probabilité

LES GENERATEURS DE NOMBRES ALEATOIRES

Intégration et probabilités TD1 Espaces mesurés

Travaux dirigés d introduction aux Probabilités

T de Student Khi-deux Corrélation

Statistique : Résumé de cours et méthodes

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Statistiques Descriptives à une dimension

Probabilités Loi binomiale Exercices corrigés

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

PROBABILITES ET STATISTIQUE I&II

Annexe commune aux séries ES, L et S : boîtes et quantiles

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

Lagrange, où λ 1 est pour la contrainte sur µ p ).

3. Caractéristiques et fonctions d une v.a.

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

mathématiques mathématiques mathématiques mathématiques mathématiques mathématiques SÉRIE ES ANNALES DES SUJETS DE MATHÉMATIQUES SESSION 2013

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Que faire lorsqu on considère plusieurs variables en même temps?

Mesures et incertitudes

Commun à tous les candidats

Introduction à la Statistique Inférentielle

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

4. Exercices et corrigés

Bases : Probabilités, Estimation et Tests.

Baccalauréat ES Amérique du Nord 4 juin 2008

OUTILS STATISTIQUES ET NUMÉRIQUES

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

FORMULAIRE DE STATISTIQUES

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Lecture graphique. Table des matières

Statistique inférentielle TD 1 : Estimation

Le groupe Casino choisit NP6 pour adapter sa communication aux enjeux du Responsive Design

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

Donner les limites de validité de la relation obtenue.

I. Cas de l équiprobabilité

Variables Aléatoires. Chapitre 2

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses

Transcription:

ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études antérieures ont montré que la masse d un oeuf choisi au hasard peut être considérée comme la réalisation d une variable aléatoire normale X, de moyenne m et de variance σ 2. On admet que les masses des oeufs sont indépendantes les unes des autres. On prend un échantillon de n = 36 oeufs que l on pèse. Les mesures sont données (par ordre croissant dans le tableau suivant : 50,34 52,62 53,79 54,99 55,82 57,67 51,41 53,13 53,89 55,04 55,91 57,99 51,51 53,28 54,63 55,12 55,95 58,10 52,07 53,30 54,76 55,24 57,05 59,30 52,22 53,32 54,78 55,28 57,18 60,58 52,38 53,39 54,93 55,56 57,31 63,15 a Calculer la moyenne empirique et l écart-type empirique de cette série statistique. Tracer le boxplot et un histogramme. b Donner une estimation des paramètres m et σ. c Donner un intervalle de confiance au niveau 95%, puis 98%, de la masse moyenne m d un oeuf. d Tester si la moyenne de cette variable est égale à 56. a x = 55.083, s = 2.683, Q1 = 53.29, Med = 54.96, Q3 = 56.5. Boxplot : moust1 = 50.34, moust2 = 60.58, un outlier=63.15. eff largeur hauteur 50-52 3 2 1.5 Histogramme : 52-54 11 2 5.5 54-56 13 2 6.5 56-58 5 2 2.5 58-64 4 6 0.67 b x est une estimation de m, s est une estimation de σ. c IC de niveau de confiance 1 α = 95% pour m : s s x z α/2, x z α/2 = 54.207,55.96 36 36 car z α/2 = z 0.025, PZ 1.96 = 0.975 quand Z de loi N(0,1, et donc z α/2 = 1.96. IC de niveau de confiance 1 α = 98% pour m : s s x z α/2, x z α/2 = 54.043,56.123 36 36 car z α/2 = z 0.001, PZ 2.3263 = 0.99 quand Z de loi N(0,1, et donc z α/2 = 2.3263. Exercice 2 On suppose que le poids d un nouveau né est une variable normale d écart-type égal à 0,5 kg. Le poids moyen des 49 enfants nés au mois de janvier 2004 dans l hôpital de Charleville-Mézières a été de 3,6 kg. a Déterminer un intervalle de confiance à 95% pour le poids moyen d un nouveau né dans cet hôpital. b Quel serait le niveau de confiance d un intervalle de longueur 0,1 kg centré en 3,6 pour ce poids moyen? a IC de niveau de confiance 95% pour le poids moyen : x 1.96 σ 7, x z σ α/2 = 3.46, 3.74 7 1

b P X 0.05 m X 0.05 0.05 = P σ/7 X m σ/ n 0.05 σ/7 ( 0.05 = 2F = 2F(0.7 1 = 2 0.758 1 = 0.516 0.5/7 Le niveau de confiance est donc 0.516. Exercice 3 On veut étudier la proportion p de gens qui vont au cinéma chaque mois. On prend donc un échantillon de taille n = 100. Soit N le nombre de personnes dans l échantillon qui vont au cinéma mensuellement. 1 Quelle est la loi de N? Par quelle loi peut-on l approcher et pourquoi? En déduire une approximation de la loi de F = N/n. 2 On observe une proportion f de gens qui vont chaque mois au cinéma. Donner la forme d un intervalle de confiance pour p, de niveau de confiance 1 α. 3 Applications numériques : f = 0,1, 1 α = 90%, 95%, 98%. 1 On suppose que les personnes ont bien été interrogées indépendamment. Ainsi, on a un schéma de Bernoulli : une personne interrogée va au cinéma chaque mois > SUCCES, sinon, ECHEC. Et donc N suit une loi binomiale B(n = 100,p ( 100 PX = k = p k (1 p 100 k, k = 0,...,100 k Comme n 20, si np > 5 et n(1 p > 5 (à vérifier lors de l application numérique, on peut approcher cette loi par la loi normale N(np, np(1 p, et donc F suit approximativement ( la loi N p, n. 2 IC f z α/2 n,f z α/2 n où PZ z α/2 = α/2, Z de loi normale centrée réduite, 1 α est le niveau de confiance. 3 f = 0.1, - 1 α = 90%, z α/2 = 1.645, IC 0.05,0.15-1 α = 95%, z α/2 = 1.96, IC 0.04,0.16-1 α = 98%, z α/2 = 2.326, IC 0.03,0.17 Exercice 4 Un appareil de télécommunications reçoit un signal stocké à chaque (petite unité de temps dans une suite de variables (X n. Cet appareil doit détecter un signal effectif, en le différenciant d un bruit. On suppose que le bruit est une suite de variables indépendantes de loi normale de moyenne nulle et de variance 1. Pour un signal, la moyenne n est pas nulle. Aujourd hui on a observé une suite de 40 variables (x 1,...,x 40, supposées indépendantes, de variance 1. La moyenne empirique vaut 0,6. S agit-il de bruit? Construire un test pour répondre à cette question. On veut tester H 0 : m = 0 contre H 1 : m 0. On utilise la statistique de test Z = X σ/ n. Région de rejet : Z > 1.96 pour un risque 5%. Ici, on observe z obs = 0.6 1/ 40 = 3.79 >> 1.96, donc on rejette H 0. On a bien un signal et de plus, la p-valeur vaut Le test est extrêmement significatif. P H0 Z > 3.79 = 2(1 F(3.79 = 0.0001 Exercice 5 On utilise une nouvelle variété de pommes de terre dans une exploitation agricole. Le rendement de l ancienne variété était de 41.5 tonnes à l ha. La nouvelle est cultivée sur 100 ha, avec un rendement moyen de 45 tonnes à l ha et un écart-type de 11.25. Faut-il, au vu de ce rendement, favoriser la culture de la nouvelle variété? 2

On veut tester H 0 : m = 41.5 contre H 1 : m > 41.5. On utilise la statistique de test Z = X 41.5 s/ n. Région de rejet : Z > 1.645 pour un risque 5%. Ici, on observe z obs = 3.11 > 1.645, donc on rejette H 0. On a bien une amélioration significative du rendement et de plus, la p-valeur vaut Le test est extrêmement significatif. P H0 Z > 3.11 = 1 F(3.11 = 0.00096 Exercice 6 Dans une agence de location de voitures, le patron veut savoir quelles sont les voitures qui n ont roulé qu en ville pour les revendre immédiatement. Pour cela, il y a dans chaque voiture une boîte noire qui enregistre le nombre d heures pendant lesquelles la voiture est restée au point mort, au premier rapport, au deuxième rapport,..., au cinquième rapport. On sait qu une voiture qui ne roule qu en ville passe en moyenne 10% de son temps au point mort, 5% en première, 30% en seconde, 30% en troisième, 20% en quatrième, et 5% en cinquième. On décide de faire un test du χ 2 pour savoir si une voiture n a roulé qu en ville ou non. 1 Sur une première voiture, on constate sur 2000 heures de conduite : 210 h au point mort, 94 h en première, 564 h en seconde, 630 h en troisième, 390 h en quatrième, et 112 h en cinquième. Cette voiture n a-t-elle fait que rester en ville? 2 Avec une autre voiture, on obtient les données suivantes : 220 h au point mort, 80 h en première, 340 h en seconde, 600 h en troisième, 480 h en quatrième et 280 h en cinquième. On veut tester l adéquation de notre échantillon à la loi discrète : p 0 = 0.1, p 1 = 0.05, p 2 = 0.3, p 3 = 0.3, p 4 = 0.2, p 5 = 0.05. On effectue un test du χ 2. En fait, on veut tester H 0 = la voiture n a roulé qu en ville, contre H 1 = la voiture n a pas roulé qu en ville. 1 Pour la première voiture, on constate On calcule la distance du χ 2. 5 i=0 0 1 2 3 4 5 eff obs obs i 210 94 564 630 390 112 eff th th i 200 100 600 600 400 100 (th i obs i 2 th i = 102 200 62 100 362 600 102 600 102 400 122 100 = 6.21 Détermination du seuil : Pχ 2 5 > c = 0.05 = c = 11.07. Comme 6.21 < 11.07, on ne peut pas rejeter H 0 : la voiture n a roulé qu en ville. 2 Pour la seconde voiture, on constate On calcule la distance du χ 2. 0 1 2 3 4 5 eff obs obs i 220 80 340 600 480 280 eff th th i 200 100 600 600 400 100 5 (th i obs i 2 = 458.67 >> 11.07 th i i=0 On rejette H 0 : la voiture n a pas roulé qu en ville. La p-valeur vaut 0. La décision ne fait pas de doute. 3

Exercice 7 Une chaîne d agences immobilières cherche à vérifier que le nombre de biens vendus par agent par mois suit une loi de Poisson de paramètre λ = 1,5. 1 On observe 52 agents pendant un mois dans la moitié nord de la France. On trouve la répartition suivante : 18 agents n ont rien vendu, 18 agents ont vendu 1 bien, 8 agents ont vendu 2 biens, 5 agents ont vendu 3 biens, 2 agents ont vendus 4 biens, et un agent a vendu 5 biens. Avec un test du χ 2, chercher s il s agit bien de la loi de Poisson attendue. 2 Répondre à la même question avec les 52 agents dans la moitié sud de la France : 19 agents n ont rien vendu, 20 agents ont vendu un bien, 7 agents 2 biens, 5 agents 3 biens et 1 agent 6 biens. 1 On veut comparer les effectifs observés avec les effectifs théoriques calculés à partir de la loi P(1.5. k 0 1 2 3 4 5 6 et eff obs 18 18 8 5 2 1 0 eff th 11.6 17.4 13 6.5 2.4 0.73 0.37 On doit regrouper les classes pour avoir un effectif théorique de 5 au minimum. k 0 1 2 3 et eff obs 18 18 8 8 eff th 11.6 17.4 13 10 La distance du χ 2 vaut : 5.88 et le seuil est 7.815 (on a 3 ddl. On accepte donc H 0 et on conclut que l échantillon provient de la loi P(1.5. 2 9.48 et le seuil est le même, donc on rejette H 0 : l échantillon ne provient pas de cette loi. Exercice 8 On teste un médicament X destiné à soigner une maladie en phase terminale. On traite des patients avec ce médicament tandis que d autres reçoivent un placebo ( contrôle. On note dans la variable statut si les patients ont survécu plus de 48 jours. Voici le tableau obtenu statut traitement non oui contrôle 17 29 X 7 38 Conclusion? ( 17 46 24/91 0.5 46 24/91 ( 7 45 24/91 0.5 45 24/91 = 4.335 > 3.8 seuil pour 1 ddl ( 29 46 67/91 0.5 46 67/91 ( 38 45 67/91 0.5 45 67/91 donc on rejette l indépendance : la survie des patients dépend de leur traitement. Exercice 9 On mesure la taille du lobe frontal de 30 crabes Leptograpsus variegatus. Voici les 30 longueurs obtenues : 12.6 12.0 20.9 14.2 16.2 15.3 10.4 22.1 19.8 15 12.8 20 11.8 20.6 21.3 11.7 18 9.1 15 15.2 15.1 14.7 13.3 21.7 15.4 16.7 15.6 17.1 7.2 12.6 Est-ce que cette variable suit une loi normale? On effectue un test du χ 2 avec 6 classes de probabilité 0.1667. Tout d abord, pour la loi normale centrée réduite, F 1 (0.1667 = 0.9661, F 1 (2 0.1667 = 0.4316, F 1 (3 0.1667 = 0 4

F 1 (4 0.1667 = 0.4316, F 1 (5 0.1667 = 0.9661 La transformation x σx m permet de se ramener à la loi N(m,σ. Ici, les paramètres sont inconnus, on les estime donc par la moyenne empirique 15.45 et l écart-type empirique 3.84, et on trouve les 6 classes délimitées par : 11.7402 13.7927 15.45 17.1073 19.1598 Pour ces classes, les effectifs observés sont 4-6-8-4-1-7 et les effectifs théoriques sont tous égaux à 5. Ainsi, 6.4, ddl=3 et le seuil est 7.8. Donc on valide l hypothèse de normalité des données. Exercice 10 Tester l adéquation à la loi normale N(5,2 de l échantillon suivant : 4.42 6.17 5.74 3.39 4.65 3.91 6.52 5.31 7.49 5.06 4.87 3.03 5.46 3.63 6.82 6.27 5.19 4.67 7.38 4.49 6.37 4.23 4.90 4.70 6.45 4.79 6.77 4.28 4.31 5.19 Pour cet exercice, on réalise un test d adéquation du χ 2 avec 6 classes d effectifs théoriques 5. Les 6 classes sont obtenues à partir des 6 classes pour la loi normale centrée réduite trouvées dans l exercice précédent et transformées par x 5 2x : 3.0678 4.1368 5 5.8632 6.9322 Les effectifs observés sont 1 3 11 6 7 2. Et 14. Le seuil est 11.07. On rejette donc la loi proposée. 5