INSA Méthodes Statistiques M8 Exame Fial 03-3 h Sauf idicatio cotraire, o cosidérera das les exercices u risque de première espèce de 5%. Exercice Zé doux, thé poits Au iveau atioal, le score moye sur les exames d etrée au collège est 45 avec u écart type de 95. U échatillo aléatoire de 5 étudiats de première aée etrat au collège de Touffreville motre u score moye de 50.. Y a t-il ue différece sigificative etre le collège de Touffreville et le iveau atioal? Solutio de l exercice il faut faire u Z test (loi de Gauss) z = -50/(95/sqrt(5)) z = -6.4889 pval = cdf( orm,z,0,) pval = 4.345e- o rejette H 0 : o peut dire qu il y a ue différece sigificative etre le collège de Touffreville et le iveau atioal Exercice T es où, Zed? poits L alcaliité, e milligrammes par litre, de l eau das le cours supérieur et iférieur des rivières das ue régio doée est cou pour être distribué ormalemet. Dix lectures d alcaliité sot faits das le cours supérieur d ue rivière das la régio et quize das le cours iférieur de la même rivière avec les résultats suivats. cours supérieur 9 75 9 88 94 63 86 77 7 69 cours iférieur 86 95 35 68 64 3 08 79 6 43 08 85 97. Peut o affirmer, avec ue risque de première espèce de %, que l alcaliité de l eau das le cours iférieur de cette rivière est supérieure à celle das la partie supérieure? Il faut faire u test de Studet Solutio de l exercice xi = [9 75 9 88 94 63 86 77 7 69]; xa = [ 86 95 35 68 64 3 08 79 6 43 08 85 97]; = legth(xi) = 0 = legth(xa) = 5 mi = mea(xi) mi = 80.5000 ma = mea(xa) ma = 99 sig = /(+-)*(sum((xi-mi).^) + sum((xa-ma).^)) sig = 43.9783 t = (mi-ma)/sqrt(sig*(/+/)) t = -.778 pval = cdf( t,t,+-) pval = 0.000 o garde H 0. O e peut doc pas affirmer, avec u risque de première espèce de %, que l alcaliité de l eau das le cours iférieur de cette rivière est supérieure à celle das la partie supérieure. Exercice 3 A Paris, hé! 3 poits U alimet de commodité, cou comme «Quickosh», a été itroduit sur le marché e javier 00. Après ue mauvaise aée pour les vetes le fabricat a lacé ue campage de publicité itesive au cours de Javier 0. Le tableau ci-dessous eregistre les vetes, e milliers d euros, pour ue période d u mois avat et d u mois après la campage de publicité, pour chacue des oze régios.
régios rd sud est out es ses sse e o sso ce vetes avat campage,4,6 3,9,0 3,, 3,3, 3,,,8 vetes après campage 3,0,5 4,0 4, 4,8,0 3,4 4,0 3,3 4, 3,9. Peut o affirmer qu ue augmetatio des vetes s est produite? Solutio de l exercice 3 Il faut faire u test de Studet sur doées appariées X = [.4 3.0.6.5 3.9 4.0.0 4. 3. 4.8..0 3.3 3.4. 4.0 3. 3.3. 4..8 3.9] D = X(:,) - X(:,) D = -0.6 0. -0. -. -.6 0. -0. -.9-0. -.0 -. = legth(d) = m = mea(d) m = -0.8545 sig = /(-)*sum((d-m).^) sig = 0.87 t = m/sqrt(sig*(/)) t = -3.47 pval = cdf( t,t,-) pval = 0.0054 o peut doc affirmer, avec u risque de première espèce de 5%, qu ue augmetatio des vetes s est produite. Exercice 4 Les kids de Cold play 4 poits Des études de marché amèet à peser que la musique de fod pourrait affecter le comportemet d achat des cliets. Ue étude das u supermarché a comparé trois situatios affectées au hasard : pas de musique, musique d accordéo fraçais, et ue musique de madolie italiee. Das chaque situatio, le ombre de bouteilles de vi fraçais, italie, et autre achetés a été eregistré. Voici u tableau qui résume les résultats : Musique aucue accordéo madolie vi fraçais 30 39 30 vi italie 5 9 autre 84 75 84. Peut o affirmer que le type de musique ifluece les vetes? Il faut faire u test du chi Solutio de l exercice 4
O = [30 39 30 5 9 84 75 84] m = sum(o); = sum(o,); T = *m/sum(), T = 3.849 3.493 34.957.6048.0477.3475 80.5703 76.709 85.768 D = sum(sum((o-t).^./t)) D = 0. ddl = (legth()-)*(legth(m)-) ddl = 4 pval = - chicdf(d,ddl) pval = 0.0403 o peut doc affirmer, avec u risque de première espèce de 5%, que le type de musique ifluece les vetes. Exercice 5 L art est graisse io 9 poits O a observé deux variables : la température (otée t) et le temps écessaire au démarrage (otée d). Les observatios ot été résumées das le tableau suivat : et o doe les résultats suivat : t i = 60.77 d i = 38.07 i t d 9.5 0.53 5.08.44 3.06 3.3 4 9.8.4 5 3.93 3.3 6-0.93 3.94 7 8.8 0.6 8-3.8 3.94 9 3.9 3.83 0 5.79 0.79 -.05 3.96.0 3.90 3 7.37 0.03 4-0.36 3.89 5.48 3.97 t i = 53.33 d i = 3.70. la régressio liéaire simple : a) posez u modèle de régressio liéaire de d e foctio de t pour chaque observatio i =, 5 : d i = at i + b + ε i avec ε N (0, σ ) b) estimez les paramètres du modèle o a t = t i = 60.77 5 = 4.05 et d = d i = 38.07 5 t i d i = 79.8 =.54 3
d où â = d i t i d i t i t i ( ) t i = 5 79.8 60.77 38.07 5 53.33 60.77 = 0.6 et b = d â t =.54 + 0.6 4.05 = 3.60 c) proposez ue estimatio de la variace de l erreur.6 d) quelle serait selo vous le temps écessaire au démarrage pour ue température de -4 â( 4) + b = 4.65 e) doez u itervalle de cofiace sur cette prédictio. o pred u studet à 3 ddl avec α = 0.05 o lit das les tables t α =, 6. t α σ + ( 4 t) + (t i t) =, 6 4.65 + ( 4 4.05) + 5 53.33 60.77 = 5.30 4.5 4 o a doc ue prévisio das l itervalle 4.65 5.3 = 0.65; 4.65 + 5.3 = 9.95 f) que pesez vous de la qualité du modèle? Il est mauvais car les résidus sot structurés (cf figure ci dessous) observatio modèles liéaire modèles de l expert.5 3.5.5 3.5 0.5 0.5 0.5 0.5.5 0 4 0 4 6 8 0 4 0 4 6 8 0. L expert du domaie préted que pour ue température iférieure à 3,5, le temps écessaire au démarrage est costat, et que ce temps est u polyôme du secod degré e foctio de la température lorsque celle ci dépasse 3,5. a) posez le modèle de régressio associé aux dires de l expert { a si t 3, 5 b + ct + dt sio Le modèle état cotiu e 3.5 o a a = b + c3.5 + d(3.5). ce qui doe le modèle réduit suivat ou { a si t 3, 5 c(t 3, 5) + dt, 5 sio { b + 3.5c +.5d si t 3, 5 b + ct + dt sio 4
b) écrire ce modèle sous forme matricielle : d = Xa + ε avec ε N (0, σ I) et X = 0.43 3.5 ou X = 3.8 3.94.58 3.6 3.9 3.83.9.3 5.79 0.79 3.87 4.5.05 3.96 4.69 54.79.0 3.90 5.66 7.6 7.37 0.03 6.3 84.8 0.36 3.89 7.56 0.6.48 3.97 selo la variable que l o décide d élimier. c) proposez ue foctio de type Matlab permettat d estimer sous forme vectorielle les paramètres du modèle. Voice u programe pour la première costructio de la matrice X. Pour l autre, seule la lige correspodat à la costructyio de X chage. [t id] = sort(t); % pour des raisos de commodité o trie les observatios d = d(id) id = fid(t>3.5); % recherche des valeurs iférieures à 3.5 0 = legth(fid(t<=3.5)); X = [oes(,) [zeros(0,) t(id)-3.5] [zeros(0,) t(id).^-3.5^]]; %X = [oes(,) [3.5*oes(0,) t(id)] [.5*oes(0,) t(id).^]]; a = (X *X)\(X *y) d) si ce modèle était exact, quelle serait selo vous le temps écessaire au démarrage pour ue température de -4? le programme doe a = 3.94-3.64 0.4. Le prédictio est doc la costate 3.94. 5