y i = αx i + β + u i,



Documents pareils
Exemples d application

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Analyse de la variance Comparaison de plusieurs moyennes

STATISTIQUES. UE Modélisation pour la biologie

Régression linéaire. Nicolas Turenne INRA

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Introduction à l approche bootstrap

Chapitre 3. Les distributions à deux variables

Principe d un test statistique

VI. Tests non paramétriques sur un échantillon

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Fonctions de plusieurs variables

Cours de Tests paramétriques

Fonctions de deux variables. Mai 2011

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

FORMULAIRE DE STATISTIQUES

Corrigé du baccalauréat S Asie 21 juin 2010

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Estimation et tests statistiques, TD 5. Solutions

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

TABLE DES MATIERES. C Exercices complémentaires 42

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Équations non linéaires

Chapitre 4 : Régression linéaire

Le Modèle Linéaire par l exemple :

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Résumé du Cours de Statistique Descriptive. Yves Tillé

LE PROCESSUS ( la machine) la fonction f. ( On lit : «fonction f qui à x associe f (x)» )

1 Définition de la non stationnarité

Exercices Corrigés Premières notions sur les espaces vectoriels

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Évaluation de la régression bornée

Programmation linéaire et Optimisation. Didier Smets

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

PROBABILITES ET STATISTIQUE I&II

données en connaissance et en actions?

Introduction à la statistique non paramétrique

Statistiques à deux variables

Exercices - Polynômes : corrigé. Opérations sur les polynômes

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Université Paris-Dauphine DUMI2E 1ère année, Applications

Les indices à surplus constant

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Biostatistiques : Petits effectifs

Angles orientés et trigonométrie

Représentation géométrique d un nombre complexe

Enjeux mathématiques et Statistiques du Big Data

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Introduction à l étude des Corps Finis

Etude des propriétés empiriques du lasso par simulations

Le risque Idiosyncrasique

Econométrie La régression linéaire simple et multiple

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

BIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année

Relation entre deux variables : estimation de la corrélation linéaire

Statistiques descriptives

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

Température corporelle d un castor (une petite introduction aux séries temporelles)

Coup de Projecteur sur les Réseaux de Neurones

Les cartes de fidélités... 2 Natures de pièces... 5 Impression des chèques cadeaux... 6 Statistiques fidélités... 8 Fiche client...

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

FORMULES DE CALCUL. Prix = PV TTC = PV HT x (1 + taux de TVA) TVA = PV HT x taux de TVA PV HT = PV TTC 1 + taux de TVA

PROBABILITÉS CONDITIONNELLES

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Correction du Baccalauréat S Amérique du Nord mai 2007

La classification automatique de données quantitatives

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

CCP PSI Mathématiques 1 : un corrigé

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

2 LE MODELE NÉOCLASSIQUE

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Pour l épreuve d algèbre, les calculatrices sont interdites.

Probabilités (méthodes et objectifs)

Econométrie et applications

LE PRODUIT SCALAIRE ( En première S )

Apprentissage non paramétrique en régression

Chapitre 1 : Évolution COURS

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

IV- Equations, inéquations dans R, Systèmes d équations

Les travaux doivent être remis sous forme papier.

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Comment bien régresser: La statistique peut-elle se passer d artefacts?

Équivalence et Non-infériorité

Incertitudes expérimentales

NON-LINEARITE ET RESEAUX NEURONAUX

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Loi binomiale Lois normales

Transcription:

I.1 ) TD1 L3 Econométrie Rappel : L estimateur ˆα (resp. ˆβ)estaussinotéa (resp. b). 160 150 consommation Y 140 130 10 (x i, ŷ i ) e i 110 100 110 10 130 140 150 160 170 180 )a). Sous forme exacte y i = αx i + β. b) Sous forme aléatoire revenu X y i = αx i + β + u i, où u i est une famille de variables aléatoire vérifiant E(u i )=0et (u i ) i n deux à deux indépendantes, et la variance V (u i ) est une constante qui ne dépend pas de i. c) On cherche à minimiser le résidu mais il n est pas nul i.e. les points ne sont apriorijamaissurladroite. 3 ) On calcule les moyennes empiriques x = 1 n i=1 x i = 145 et ȳ = 1 n n i=1 y i =17. Par définition, l estimateur de α est i=1 ˆα = (y i ȳ)(x i x) i=1 (x =0.861. i x) On retrouve l ordonnée à l origine ˆβ en écrivant que la moyenne ( x, ȳ) est sur la droite de régression : ˆβ =ȳ α x =.188. 1

Les résidus entre les observations y i et la prédiction ŷ i s écrivent e i =ŷ i y i. SCR = n e i =115.685 i=1 4 ) (ˆα, ˆβ) sont des estimateurs de α, β. Lesvaleurse i sont des instances des variables aléatoires u i.d unecertainemanièree i est un estimateur de u i. 5 ) α est le taux marginal de substitution. Pour obtenir l élasticité il faut se ramener à des pourcentages, dx/x dy/y = αx i y i =0.98 6 ) On a calculé la somme des carrés des résidus (SCR) et on obtient donc ˆσ u = i=1 e i n = 115.685 =11.568. 10 Puis σ ˆα = ˆσ u i=1 (x i x) =0.004 et σ ˆβ = x ˆσ a + ˆσ u n =51.347 7 ) On teste si α et β sont significativement non nuls. On sait que T = ˆα α ˆσ α suit une loi de Student St(n ). Pour effectuer le test { H 0 : α =0, H 1 : α 0 on construit t obs = ˆα 0 ˆσ α =17.59. Pour p = 0.05 on lit dans la table t p =.8. Larégiond acceptation (R.ACC) est [.8,.8]. Finalementt obs R.ACC, donc on rejette H 0 et on conclut que H 1 est significativement vraie. Le test pour β est le même, t obs = ˆβ σ ˆβ =0.97 R.ACC donc la valeur de ˆβ n est pas significative. Remarque : la relation linéaire entre x et y est significative si α est significativement non nul. 8 ) Avec la même valeur de t p que pour la question précédente on construit IC(α) =[ˆα ± t p σˆα] = [0.75, 0.97] IC(β) =[ˆβ ± t p σ ˆβ] =[ 13.83, 18.09].

9 ) Par définition R = R = R = cov(x,y ) V (X)V (Y ).Laformuledecalculusuelest i=1 x iy i n xȳ) i=1 x i n x ) i=1 y i nȳ ) =0.9687 Remarque : pour établir cette égalité on utilise i=1 (x i x) = i=1 x i ) n x, formule à comparer avec l égalité V (X) =E(X ) E(X).Onaégalement i=1 (x i x)(y i ȳ) = i=1 x iy i ) n xȳ. 10 ) II.A. ŷ =0.86x +.13 R =0.97 (1) : 51.3 500 450 surface Y (cm ) 400 350 300 e i 50 00 150 00 50 300 350 prix X (euros) On calcule pour les estimateurs des coefficients des deux régressions ˆα = 1.1, ˆβ =51.08 et pour la relation inverse, ˆα =0.8147 et β = 37.845. II.B. 1 ) La formule de calcul donne R = R = 0.985.Onpeutaussivérifier i=1 x iy i n xȳ) i=1 x i n x )( = n i=1 y i nȳ ) R =ˆαˆα =1.1 0.8147. 3

) Il faut calculer σu,l estimateurdelavariancedeu.vuqu onadéjàcalculé R on peut utiliser l égalité ( n n ) ˆσ u = i=1 e i n = 1 R yi n nȳ =88.81. On en déduit les variance des estimateurs de α et β, σ ˆα =0.0044 et σˆβ =69.39. On construit les tests à partir de la variable T T = ˆα α St(n ) σˆα { H 0 : α =0 H 1 : α 0, t obs = ˆαˆσ α =408.065 On lit dans la table t p =.365,larégiond acceptationdeh 0 est i=1 [ t p,tp ]=[.365,.365] t obs, donc on peut rejeter H 0, α est significativement non nul. 3 ) On construit à partir de R la variable F F = R /1 F(1,n ). (1 R )/(n ) Ici F obs =33.48.Onlitpourn =7et p =0.05,lavaleurcritiquet p =6.61 donc F obs t p la régression est bonne dans son ensemble. Remarque : le test de Student pour α et β est bilatéral, le test de Fisher pour R est unilatéral. 4 ) On prédit à partir des estimations de α et β 0.81 510 37.84 = 377.65 euros 5 ) De même à partir de ˆα et ˆβ, 1. 400 + 51 = 534.8 cm. 4

III. 1 ) 550 500 Nombre de salariés Y 450 400 350 300 (x i, ŷ i ) ei 50 600 700 800 900 1000 1100 100 1300 1400 Chiffre d affaires X ) On trouve a =ˆα =0.31 et b = ˆβ =98.68. 3 ) ˆσ u = n i=1 e i =389.47, n i=1 x iy i n xȳ) R = i=1 x i n x )( =0.937, n i=1 y i nȳ ) σˆα = ˆσ u n =7.3 10 3. i=1 (x i x) 4 ) Ce test vérifie que α est significativement non nul. On teste ainsi l existence d une relation linéaire entre x et y. On construit t obs = ˆαˆσ α =11.54. Lavaleurcritiquepourn =11observations est t p =.6,donct obs [ t p ] et α est significativement non nul.,tp 5 ) 0.31 177 + 98.68 = 65.031.Onprédit65031 salariés. 6 ) On utilise les intervalles de confiance de α et β à p =0.05. Onreprend dans la table de Student le même t p que pour le 4 ) et on obtient les intervalles En réutilisant ces intervalles il vient IC(α) =[ˆα ± t p σˆα] = [0.5, 0.37] IC(β) =[ˆβ ± t p σ ˆβ] = [40.8, 156.5]. IC(α) 177 + IC(β) = [485.79, 818.7]. Donc la valeur fournie ne contredit pas le modèle, elle est dans l intervalle de confiance. 5

IV. 1 ) On retrouve dans le tableau ˆα = 0.0589, ˆβ = 36.4, SCT = 1150, SCE =97.3 et SCR =177.7.OnpeutvérifierSCT= SCE+SCR. Par définition { H 0 : α =0 R = SCE SCT =1 SCR SCT =0.8455. ), t obs = ˆαˆσ H 1 : α 0 α =5.3 La valeur critique pour n =7observations est t p =.571, donct obs [ t p ] et α est significativement non nul.,tp On peut commenter que t obs n est pas très loin de la région d acceptation. 3 ) On construit à partir de R la variable F F = R /1 F(1,n ). (1 R )/(n ) On obtient F obs = 7.36. Onlitpourn = 7 et p = 0.05, lavaleurcritique t p =6.61 donc F obs t p la régression est bonne dans son ensemble. En fait il y aplusieursvaleursdei pour une même valeur de V dans le tableau, on pouvait s attendre à ce que la régression soit mauvaise. 80 75 70 Ventes V 65 60 55 50 (x i, ŷ i ) e i 45 40 100 00 300 400 500 600 700 Investissement I 6