Mondialisation et Développement

Documents pareils
Chapitre 3. Les distributions à deux variables

Le modèle de régression linéaire

Les Notes de l Institut d émission

Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales

Relation entre deux variables : estimation de la corrélation linéaire

1 Définition de la non stationnarité

Chapitre 2/ La fonction de consommation et la fonction d épargne

OSGOODE HALL LAW SCHOOL Université York MÉMOIRE PRIVILÉGIÉ ET CONFIDENTIEL

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

MegaStore Manager ... Simulation de gestion d un hypermarché. Manuel du Participant

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER. Epargne et emprunt Calcul actuariel

Evaluer l ampleur des économies d agglomération

Eco-Fiche BILAN DE L ANNEE 2012 QUELLES PERSPECTIVES POUR 2013? 1

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Publication de comptes financiers du secteur privé non-financier

Table des matières. Télécharger MetaTrader 4. Première connexion à MetaTrader 4. Se connecter à MetaTrader 4. Modifier la langue

Analyse de la relation entre primes de terme et prime de change dans un cadre d équilibre international

Régression linéaire. Nicolas Turenne INRA

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Calcul du versement périodique 2015 GUIDE.

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

INCIDENCE DU COMMERCE EXTÉRIEUR SUR LE COMMERCE INTÉRIEUR : NOUVELLE ANALYSE DE LA COURBE EN «L» NOUVELLE ANALYSE DE LA COURBE EN «L»

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Calcul du versement périodique 2014 Guide détaillé

L Econométrie des Données de Panel

Principe d un test statistique

La mise en œuvre de la politique monétaire suisse

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Résumé non technique

OBSERVATOIRE DE L EPARGNE EUROPEENNE

Partie 5 : La consommation et l investissement

LSM2 : un modèle avec secteur bancaire pour le Luxembourg

Les effets d une contrainte de crédit sur la convergence économique : Le cas des pays de l UEMOA

RENTABILITE IMMOBILIERE ET PRESSION FISCALE

VI. Tests non paramétriques sur un échantillon

Hedging delta et gamma neutre d un option digitale

Margill 3.3 Guide de démarrage rapide

MÉTHODOLOGIE POUR LE CALCUL DE L AMORTISSEMENT ET DE LA VALEUR DU STOCK NET DOMICILIAIRE DIVISION DE L INVESTISSEMENT ET DU STOCK DE CAPITAL

THÈME: «INTÉGRATION DU COMMERCE DES SERVICES DANS LES PLANS NATIONAUX ET RÉGIONAUX DE DÉVELOPPEMENT»

Économétrie, causalité et analyse des politiques

Best Styles ou comment capturer au mieux les primes de risque sur les marchés d actions

Stratégie d assurance retraite

LANCEMENT D UN PROGRAMME DE FORMATION DE NOUVEAUX NÉGOCIATEURS APPEL DE CANDIDATURES

Tableaux de bord de gestion du risque Rapport d audit permanent

Samedi 24 octobre 2009

Banque nationale suisse

Calcul élémentaire des probabilités

PRIX DE VENTE À L EXPORTATION GESTION ET STRATÉGIES

Modèle de demande d'habilitation d'un Mastère LMD

Consignes pour les travaux d actualité Premier quadrimestre

Cegid Business Paie. Mise à jour plan de paie 01/03/2014. Service d'assistance Téléphonique

Une nouvelle norme mondiale sur la comptabilisation des produits

Probabilités III Introduction à l évaluation d options

Quel est le régime d assurance maladie applicable à l artiste de spectacle vivant, mobile dans la Grande Région?

I. BILAN 2013 ET PROSPECTIVE 2014

Coup de Projecteur sur les Réseaux de Neurones

MARCHÉ SÉCURITÉ-SURVEILLANCE-GARDIENNAGE 2010

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Item 169 : Évaluation thérapeutique et niveau de preuve

Nombre de crédits Nombre d'évaluation UE Majeure de spécialité 6 2. UE mineure de spécialité 3 ou 2 1. UE libre 1 1

M_CONTRAN Contrats nouveaux

Rappel sur les bases de données

Le Logiciel de Facturation ultra simplifié spécial Auto-Entrepreneur

Les investissements internationaux

TRAVAIL ET GESTION DE L EMPLOI?

Premier. système libre. de gestion. et d organisation. des Structures. de Services. à la Personne

ANNEXE VII EFFETS MACROECONOMIQUES DE LA REFORME PIECE JOINTE N 2 SIMULATIONS REALISEES A PARTIR DU MODELE MACROECONOMETRIQUE MESANGE

Cegid Business Paie. Mise à jour plan de paie 01/01/2014. Service d'assistance Téléphonique

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

Séance 4. Gestion de la capacité. Gestion des opérations et de la logistique

Initiative socialiste pour des impôts équitables Commentaires Bernard Dafflon 1

MODE D EMPLOI LOI POUR LE POUVOIR D ACHAT : Rachat de jours de repos, déblocage anticipé de la participation, prime exceptionnelle...

Programme «Société et Avenir»

Objet : Remarques de Manufacturiers et exportateurs du Québec sur le régime d assuranceemploi

Chapitre 6. Le calcul du PIB, de l inflation et de la croissance économique. Objectifs d apprentissage. Objectifs d apprentissage (suite)

PROGRAMME INTERNATIONAL POUR LE SUIVI DES ACQUIS DES ÉLÈVES QUESTIONS ET RÉPONSES DE L ÉVALUATION PISA 2012 DE LA CULTURE FINANCIÈRE

Le montant des garanties constituées aux fins du STPGV est-il excessif?

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

STRICTEMENT CONFIDENTIEL

Le risque Idiosyncrasique

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Pleins feux sur les IFRS

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

AUNEGE Campus Numérique en Economie Gestion Licence 2 Comptabilité analytique Leçon 3. Leçon n 3 : la détermination et l enchaînement des coûts

Les indices à surplus constant

Cegid Business Paie. Mise à jour plan de paie 01/11/2014. Service d'assistance Téléphonique

Soutenance de stage Laboratoire des Signaux et Systèmes

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Annexe - Balance des paiements et équilibre macro-économique

Pourquoi les ménages à bas revenus paient-ils des loyers de plus en plus élevés?

LA CONNAISSANCE DES COMPTES FINANCIERS ET NON FINANCIERS DES ACTEURS FINANCIERS

ENSIIE. Macroéconomie - Chapitre I

Transcription:

Mondialisation et Développement Rappel intuitif des notions d économétrie 21 septembre 2011 Jeanne Tschopp Plan 1. Qu est-ce que l économétrie et à quoi sert-elle? 2. Les données (a) Variables quantitatives versus qualitatives (b) Représentation des données i. Séries temporelles ii. Coupes transversales iii. Séries longitudinales ou panel 3. Le modèle économétrique (a) Qu est-ce qu un modèle économétrique (b) Identification d un effet marginal i. Significativité statistique d un coefficient A. Hypothèse nulle de nullité du coefficient B. Traitement des erreurs ii. Ampleur d un coefficient A. Correlation versus causalité B. Endogénéité 1

1 Qu est-ce que l économétrie et à quoi sert-elle? L économétrie est l application de techniques statistiques et mathématiques à des problèmes économiques. Elle sert à tester une théorie et ses hypothèses. Le chercheur formule une théorie permettant d expliquer des phénomènes économiques observables (ou faits marquant de la réalité) et d illustrer les mécanismes qui poussent à les observer. Cette théorie est parfois formalisée à l aide de la modélisation théorique qui pour rester maniable correspond nécessairement à une représentation réduite de la réalité. L économétrie confronte la théorie (soit formalisée, soit fondée sur des raisonnements intuitifs) avec les données qui partiellement sont le reflet de la réalité. Lorsque le modèle économétrique est formulé de manière appropriée, son estimation permet de valider ou d infirmer la théorie. Schéma 1. L utilisation de l économétrie requiert un choix attentif (i) des données et (ii) du modèle économétrique. 2 Les données Les données sont mesurées par des variables quantitatives ou qualitatives et peuvent être représentées sous formes de séries temporelles, de coupes transversales (ou instantanées) ou de panel (ou séries longitudinales). 2.1 Variables quantitatives versus qualitatives Une variable quantitative est mesurable et ramène à la notion de quantité (ex: salaire). En revanche, une variable qualitative fait référence à la notion de qualité (ex: l appartenance d un pays à l OMC). En général les variables qualitatives sont représentées par des variables ordinales, appelées également dummies (ex: la variable prend la valeur 1 si le pays fait partie de l OMC et zéro sinon). 2.2 Représentation des données Dessin 1. 2.2.1 Séries temporelles ou longitudinales (Time series) 1 Les séries temporelles sont unidimensionelles et consistent d observations d une ou plusieurs variables à travers le temps (ex: le PIB de la Suisse de 1990 à 2000). Table 1. Les données en séries temporelles peuvent être collectées à diverses fréquences: journalières (ex: cours de l action), hebdomadaires (ex: offre de monnaie aux Etats-Unis), mensuelles (ex: inflation), trimestrielles (ex: 1 Le terme longitudinal est parfois utilisé pour décrire des données de panel. 2

PIB) ou annuelles (ex: taux de mortalité infantile au Etats-Unis). Dans ce type de représentation des données, l ordre chronologique joue un rôle essentiel puisqu il véhicule de l information sur l historique, la dynamique et le degré de corrélation des données (ex: dans la mesure où le PIB reste relativement stable d un trimestre à l autre, connaître le niveau du PIB du trimestre précédent informe sur le niveau probable du PIB le timestre suivant). Elles sont souvent caractérisées par de la tendance et par de la saisonnalité. La saisonnalité correspond aux changements de la variable expliqués par des fluctuations saisonnières (ex: le revenu d une station de ski est plus fort en haute saison qu en basse saison). La tendance correspond à l évolution de la variable au cours du temps qui n est pas expliquée par des fluctuations saisonnières (ex: le nombre d années d études moyen des suisses a connu une tendance à la hausse depuis les années 70.). Table 2. Ces données sont particulièrement utiles lorsque l analyse du phénomène étudié requiert la prise en compte de sa dynamique. 2.2.2 Coupes transversales ou instantanées (Cross section) Les coupes transversales sont unidimensionelles et consistent d un échantillon aléatoire d unités (ex: ménages, firmes, villes, secteurs, etc.) observé à un moment donné (ex: le taux d imposition dans les différents cantons suisse en 2000). Table 3. Puisque la notion de temps n a aucune importance, ces données permettent une analyse statique exclusivement. Généralement, l économètre pourra faire l hypothèse que la coupe transversale est un échantillon aléatoire de la population sous-jacente. 2.2.3 Panel (panel data) et pooling (pooled cross section) Les données de panel et de pooling sont des coupes transversales répétées à travers le temps. Elles consistent donc en un regroupement de données en coupes transversales à travers le temps (ex: le PIB des pays de la zone Euro de 1990 à 2000). Autrement dit, les données de panel sont des observations d une variable sur un ensemble d individus où l individu est l unité statistique observée à plusieurs moments du temps (ex: dans l exemple précédent, la variable est le PIB et l unité statistique est le pays). Ces données ont donc une double dimension: la dimension en coupe transversale et la dimension chronologique. Table 4. Les données de panel et de pooling présentent un avantage majeur. La double dimensionalité accroît considérablement le nombre d observations. La base de donnée devient donc plus riche en information et offre plus de variation à exploiter, ce qui rend l estimation économétrique plus précise. En outre, la variabilité réduit le risque de colinéarité souvent présent dans les données en séries temporelles. 3

Le désavantage majeur ce type de données est relié à la collecte de données. Sans compter le coût de collecte, il est très probable que les observations soient non renseignées et que le panel ne soit pas cylindré, càd qu il manque des observations sur les individus, sur les périodes ou sur les deux. Dans le cas d enquêtes de ménages par exemple, le problème provient de l attrition des enquêtés; de leur sortie du panel ou du refus de répondre au fur et à mesure que le temps passe. Bien qu elles soient constituées de données dans les deux dimensions, les données en pooling ne tiennent pas compte de la structure du panel; les observations de la même unité statistique sont traitées comme des observations indépendantes. Les panels présentent certains avantages tels que: Elles permettent de tenir compte de l hétérogénéité inobservable entre les individus et fixe au cours du temps (effet individuel). Cela revient à exploiter la variation des données au sein de la même unité statistique: la variation within. En pratique cela revient à rajouter des dummies marquant l unité statistique ou pour chaque variable, éliminer la moyenne des observations de la même unité statistique. Supposez par exemple que l on désire savoir s il existe des primes salariales sectorielles (càd des différences salariales entre les secteurs qui sont non expliquées par les caractéristiques individuelles). Dans un modèle en coupes transversales ou en pooling, on introduira dans l équation salariale des variables indicatrices des secteurs. L interprétation des coefficients de ces variables sera pourtant délicate car elles pourront refléter également des différences inobservées (ex: formation, qualification) des travailleurs entre les secteurs. L utilisation de données de panel permettent de tenir compte d effet fixes individuels inobservables et de mesurer avec plus de précision ces primes salariales sectorielles. Elles permettent également de tenir compte d effet temporels ayant affecté tous les individus à un moment donné (ex: crise économique mondiale de 2008). Cela revient à exploiter la variation des données à travers l unité statistique: la variation between. En pratique cela revient à rajouter des dummies marquant l unité temporelle ou pour chaque variable, éliminer la moyenne des observations à travers l unité statistique. Contrairement aux données en coupes transversales, elles permettent de formuler des modèles dynamiques prenant en compte le processus d ajustement des variables économiques (ex: au vu des coûts d ajustement, de licenciement, d embauche, de création ou de fermeture, les effectifs d une entreprise à un moment donné dépendent du nombre d employés à la période précédente). Techniquement, tenir compte de la dynamique implique ajouter la variable dépendante retardée dans le modèle économétrique, ce qui est impossible avec des données en coupes transversales. 3 Le modèle économétrique 3.1 Qu est-ce qu un modèle économétrique Un modèle économétrique est une présentation formalisée d un phénomène sous forme d équation dont les variables sont des grandeurs économiques. Formellement, où y it = β 0 + β 1 x it + β 2 z it +... + d i + d t + ɛ it, (1) 4

i: unité statistique observée (ex: individu) t: temps y: variable dépendente ou à expliquer (ex: le salaire) x,z: variables indépendantes, explicatives ou dites de contrôle, qui varient à travers les individus et le temps (ex: l age, le niveau d éducation) d i : variables indicatrices permettant de contrôler pour les caractéristiques individuelles fixes à travers le temps (ex: le genre dans la mesure où on fait l hypothèse que les individus n ont pas recours à la chirurgie) d t : variables indicatrices permettant de contrôler pour les effets temporels ayant affecté tous les individus à un moment donné (ex: crise économique mondiale de 2008) ɛ: terme d erreur β 0 : terme constant à travers le temps et les individus β 1, β 2 : coefficients capturant l effet marginal de x sur y et z sur y, respectivement 3.2 Identification d un effet marginal Le but ultime de l économètre est d identifier un effet marginal, càd de déterminer la significativité statistique de l effet et l ampleur de ce dernier. En pratique et sous format stata, cet effet marginal est représenté par un coefficient estimé dans une table de régression. Les erreurs standards correspondantes sont présentées entre parenthèses sous le coefficient. Une étoile au dessus du coefficient indique que le coefficient est statistiquement significatif à 10%. Deux et trois étoiles indiquent qu il est statistiquement significatif à 5% et 1%, respectivement. 3.2.1 Significativité statistique d un coefficient Hypothèse nulle d un coefficient Pour déterminer si un coefficient est statistiquement significatif on teste généralement l hypothèse suivante: H0 : β = 0 H1 : β 0, où H0 correspond à l hypothèse nulle que le coefficient est égal à zéro et H1 est l hypothèse alternative. On dira qu un coefficient est statistiquement significatif si l hypothèse nulle est rejetée. Si cette dernière ne peut pas être rejetée (! au jargon), on dira que le coefficient est statistiquement non significatif (càd le modèle tel qu estimé ne détecte pas d effet ce qui ne signifie cependant pas qu il n existe pas d effet en réalité). Il existe plusieurs manières afin de d interpréter ce test: Dessin 2. 5

valeur du p: si p<0.05, l hypothèse nulle de nullité du coefficient β est rejetée à 95% (voir dessin zone de rejet). valeur du t calculé comme β σ : si t>1.96, l hypothèse nulle de nullité du coefficient β est rejetée à 95%. intervalle de confiance à 95% calculé comme ˆβ ± 1.96 σ: si zéro n appartient pas à l intervalle de confiance, alors l hypothèse nulle de nullité du coefficient β est rejetée à 95%. Si un coefficient est statistiquement significatif, à disons 5%, cela signifie que si l on tire 20 échantillons aléatoires de la population et qu on estime 20 régressions, alors il existe 1 chance sur 20 de se tromper et conclure qu il existe un effet alors qu il n y en a pas. On parlera d erreur d optimisme ou d erreur de type I. Les erreurs de type I et II sont définies comme suit: Erreur de type I: Faux positif ; probabilité que le résultat du test statistique soit dans la zone de rejet alors que H0 est vrai. Erreur de type II: Faux négatif ; probabilité de ne pas rejeter une hypothèse nulle fausse. Traitement des erreurs La significativité statistique des coefficients dépend de manière considérable du traitement appliqué au terme d erreur. Sa présence peut être justifiée par l omission de variables, des caractéristiques non observables ou encore des erreurs de mesures. Le fait qu il ne soit pas observable force l économètre à estimer les coefficients d intérêts. Cela nécessite de faire des hypothèses stochastiques sur le terme d erreur ou en d autres termes sur ces propriétés probabilistes. Le traitement approprié du terme d erreur dépend de sa structure, ce qui nous ramène à considérer la variance de l erreur et la corrélation des erreurs à travers les observations. On dira que le terme d erreur est homoscédastique si on suppose que la variance de l erreur est constante pour chaque observation, càd pour toutes les valeurs des variables explicatives. Dans le cas contraire, on parlera d hétéroscédasticité. Figure 1. Considèrez par exemple un modèle expliquant les dépenses en loisirs (y) des ménages par, inter alia, le revenu (x). Les familles dont le revenu est faible dépenseront relativement peu en loisir. La variation des dépenses en loisirs entre familles à faible revenu sera faible. Pour les familles bénéficiant d un revenu important, les dépenses en loisirs seront plus élevées et par conséquent la variabilité de ces dernières entre les familles plus grande (puisque l étendue des dépenses possibles est plus importante). Dans ce modèle particulier, l économètre voudra permettre aux erreurs d avoir une structure hétéroscédastique. Négliger l hétéroscédasticité peut conduire à sous-estimer l erreur standard et donc à rejeter une hypothèse nulle vraie, ce qui revient à une erreur de type I. Lorsqu elle est prise en compte, on dira que les erreurs standards sont robustes. Permettre aux erreurs d être hétéroscédastiques ne les autorise pas à être autocorrélées. Dans le cadre d un panel, il est rare que les erreurs soient entièrement indépendantes les unes des autres. Dans un tel cas, la manière la plus usuelle de traiter la structure des erreurs est d utiliser ce qu on appelle le clustering. Le clustering au niveau de l unité statistique observée (ex: une région) permet aux erreurs de la même unité d être corrélées à travers le temps, mais n autorise aucun type de corrélation à travers les différentes unités 6

(ex: deux régions différentes). Le clustering sur la dimension temporelle permet aux erreurs d être corrélées de manière arbitraire à travers les unités mais n autorise aucune corrélation à travers le temps. Ce type de clustering est moins féquent dans la mesure où les observations sont souvent fonction de leurs valeurs passées. 3.2.2 Ampleur d un coefficient Corrélation versus causalité L économiste a recours à l économétrie afin d identifier un effet causal (càd y x ) et non une corrélation. Alors que la corrélation mesure l intensité d une relation linéaire entre deux variables, la causalité capture une relation causale entre la variable explicative et la variable dépendante. D un point de vue économétrique, l identification d un effet causal nécessite que la variable explicative et le terme d erreur soient indépendants, càd il est nécessaire que E[xɛ] = 0. Si cette dernière condition n est pas vérifiée, on dira que x est endogène. Dans un tel cas, la relation causale ne sera pas identifiée de manière appropriée et le coefficient d intérêt sera biaisé. La taille et le sens du biais dépend du degré et du sens de la corrélation entre la variable explicative endogène et le terme d erreur. Le problème de l endogénéité est le pain quotidien de l économètre. Endogénéité Les causes de l endogénéité peuvent être multiples; elle peut résulter (i) d une variable omise du modèle estimé, (ii) de causalité renversée entre la variable explicative et la variable dépendante, (iii) de mauvais contrôles (bad controls) ou encore (iv) d un problème de sélection des données (càd les observations ne sont pas un échantillon aléatoire de la population). premiers cas qui sont les plus courants dans la pratique. Nous ne traiterons ici que les deux Supposez qu une variable explicative soit omise du modèle de régression. L effet de cette variable sera capturé par le terme d erreur. Si la variable omise et la variable d intérêt sont corrélées, le terme d erreur sera lui aussi corrélé avec la variable explicative d intérêt (via la variable omise), créant ainsi un problème d endogénéité (ex: on inclut l âge mais on omet le niveau d éducation dans une équation de détermination des salaires). Supposez que le vrai modèle est donné par y = α 0 + α 1 x 1 + α 2 x 2... + υ, où E[x 1 υ] = 0 et E[x 1 x 2 ] 0, mais que l on estime y = α 0 + α 1 x 1 +... + ε. Alors ε = υ + α 2 x 2 et E[x 1 ε] = E[x 1 (υ + α 2 x 2 )] = α 2 E[x 1 x 2 ] 0. Supposez qu il existe une causalité renversée entre la variable explicative et la variable dépendante (ex: la relation entre les accords commerciaux et la volatilité de la politique commerciale). Dans ce cas, puisque y (qui est bien évidemment fonction de son terme d erreur) explique également x, cette dernière sera nécessairement corrélée avec le terme d erreur: y = α 0 + α 1 x +... + ε x = β 0 + β 1 y +... + υ = β 0 + β 1 [α 0 + α 1 x +... + ε] +... + υ = E[xε] 0 Généralement, l endogénéité est traitée à l aide de variables instrumentales (ou instruments). Intuitivement, les variables instrumentales sont des variables corrélées avec la variable endogène mais exogènes à la 7

variable dépendante. Autrement dit, une variable est considérée comme étant un instrument valable si cette variable affecte la variable expliquée uniquement via la variable endogène. Formellement, cela signifie que E[zy] = 0, où z dénote l instrument. Dans la pratique en général, instrumenter la variable endogène revient à estimer des doubles moindres carrés ( two stage least squares ). Pour ce faire, il est nécessaire d avoir au moins un instrument pour chaque variable endogène. Afin de tester l exogénéité de l instrument (et donc de convaincre l audiance de la validité de la variable instrumentale!), plus d un instrument par variable endogène sont requis. Les doubles moindres carrés constistent en deux estimations effectuées l une après l autre. Dans la première estimation, toutes les variables explicatives du modèle (sauf bien entendu la variable endogène) et les variables instrumentales sont regressées sur la variable endogène. C est à cette étape que l on pourra à l aide d un F-test vérifier le pouvoir explicatif des instruments. Il est communément accepté que les instruments détiennent suffisemment de pouvoir explicatif lorsque le F-test de la première estimation est supérieur à 10. Les valeurs prédites à l aide de l équation de première étape seront utilisées dans une seconde étape dans laquelle les variables prédites et les autres variables explicatives exogènes seront régressées sur la variable dépendante. Les instruments n apparaissent pas dans cette seconde étape. C est à cette dernière étape que l on pourra tester l exogénéité des instruments, via un Hansen ou Sargan test. Si le test ne peut pas être rejeté, on concluera que les instruments sont dans l ensemble exogènes. 8

Figure 1: Hétéroscédasticité f(y x) y... E(y x) =!0 +! 1 x x 1 x 2 x 3 x L3 Econométrie - Econométrie II 6 9