MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)

Documents pareils

Remboursement d un emprunt par annuités constantes

Les jeunes économistes

Généralités sur les fonctions 1ES

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

Editions ENI. Project Collection Référence Bureautique. Extrait

Montage émetteur commun

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES

Économétrie. Annexes : exercices et corrigés. 5 e édition. William Greene New York University

STATISTIQUE AVEC EXCEL

IDEI Report # 18. Transport. December Elasticités de la demande de transport ferroviaire: définitions et mesures

Mesure avec une règle

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

Dirigeant de SAS : Laisser le choix du statut social

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.

Exercices d Électrocinétique

TD 1. Statistiques à une variable.

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

Chapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique

Fiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage

CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE?

Impôt sur la fortune et investissement dans les PME Professeur Didier MAILLARD

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF

Interface OneNote 2013

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.

EH SmartView. Identifiez vos risques et vos opportunités. Pilotez votre assurance-crédit. Services en ligne Euler Hermes

Chapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3.

I. Présentation générale des méthodes d estimation des projets de type «unité industrielle»

ÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS.

CHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE

PREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174)

UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS

COMPARAISON DE MÉTHODES POUR LA CORRECTION

DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS

La Quantification du Risque Opérationnel des Institutions Bancaires

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES

UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE

Intégration financière et croissance économique : évidence empirique dans. la région MENA

1. Les enjeux de la prévision du risque de défaut de paiement

CHAPITRE DEUX : FORMALISME GEOMETRIQUE

VIELLE Marc. CEA-IDEI Janvier La nomenclature retenue 3. 2 Vue d ensemble du modèle 4

BUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES

Paquets. Paquets nationaux 1. Paquets internationaux 11

En vue de l'obtention du. Présentée et soutenue par Meva DODO Le 06 novembre 2008

1.0 Probabilité vs statistique Expérience aléatoire et espace échantillonnal Événement...2

Pratique de la statistique avec SPSS

Grandeur physique, chiffres significatifs

L enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir

GATE Groupe d Analyse et de Théorie Économique DOCUMENTS DE TRAVAIL - WORKING PAPERS W.P Préférences temporelles et recherche d emploi

GEA I Mathématiques nancières Poly. de révision. Lionel Darondeau

MODÈLE D ISING À UNE ET DEUX DIMENSIONS.

Prêt de groupe et sanction sociale Group lending and social fine

Corrigé du problème de Mathématiques générales Partie I

Pour plus d'informations, veuillez nous contacter au ou à

INTERNET. Initiation à

Système solaire combiné Estimation des besoins énergétiques

ESTIMATION DES TITRES VIRAUX : UNE PROGRAMMATION PRATIQUE ET FIABLE SUR CALCULATRICE DE POCHE, ET ACCESSIBLE PAR l INTERNET

Pourquoi LICIEL? Avec LICIEL passez à la vitesse supérieure EPROUVE TECHNICITE CONNECTE STABILITE SUIVIE COMMUNAUTE

hal , version 1-14 Aug 2009

santé Les arrêts de travail des séniors en emploi

TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1

Integral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation

Le Prêt Efficience Fioul

Afflux de capitaux, taux de change réel et développement financier : évidence empirique pour les pays du Maghreb

Stéganographie Adaptative par Oracle (ASO)

En vue de l'obtention du. Présentée et soutenue par Elayeb Bilel Le 26 juin 2009

RAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD

Documents de travail. «La taxe Tobin : une synthèse des travaux basés sur la théorie des jeux et l économétrie» Auteurs

LICENCE DE SCIENCES PHYSIQUES UV 3LSPH50. Année MODÉLISATION. Recherche des paramètres d'une représentation analytique J.P.

Corrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio

Des solutions globales fi ables et innovantes.

Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr

Terminal numérique TM 13 raccordé aux installations Integral 33

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à

Analyse des Performances et Modélisation d un Serveur Web

Prise en compte des politiques de transport dans le choix des fournisseurs

La théorie classique de l information. 1 ère partie : le point de vue de Kolmogorov.

Les prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe

Réseau RRFR pour la surveillance dynamique : application en e-maintenance.

Thermodynamique statistique Master Chimie Université d Aix-Marseille. Bogdan Kuchta

Pro2030 GUIDE D UTILISATION. Français

INTRODUCTION. Jean-Pierre MAGNAN Chef de la section des ouvrages en terre Département des sols et fondations Laboratoire central

Séparation de Sources par lissage cepstral des masques binaires

Une analyse économique et expérimentale de la fraude à l assurance et de l audit

Version provisoire Ne pas citer sans l accord des auteurs

THESE. Khalid LEKOUCH

Dynamique du point matériel

Professionnel de santé équipé de Médiclick!

L ABC du traitement cognitivo-comportemental de l insomnie primaire

Les méthodes numériques de la dynamique moléculaire

AVERTISSEMENT. Contact SCD INPL: LIENS

MEMOIRE. Présenté au département des sciences de la matière Faculté des sciences

P R I S E E N M A I N R A P I D E O L I V E 4 H D

Projet de fin d études

TRAVAUX PRATIQUES SPECTRO- COLORIMETRIE

Ecole Polytechnique de Montréal C.P. 6079, succ. Centre-ville Montréal (QC), Canada H3C3A7

Transcription:

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Unversté d Orléans Econométre des Varables Qualtatves Chaptre 3 Modèles à Varable Dépendante Lmtée Modèles Tobt Smples et Tobt Généralsés Chrstophe Hurln Polycopé de Cours Master Econométre et Statstque Applquée (ESA) Unversté d Orléans Faculté de Drot, d Econome et de Geston Bureau A 4 Rue de Blos BP 6739 45067 Orléans Cedex www.unv-orleans.fr/deg/masters/esa/

Contents 1 LeModèleTobtSmple... 7 1.1 EstmatonparlesMondresCarrésOrdnares... 9 1.1.1 ApplcatondesMCOàl ensembledesobservatons... 9 1.1. Applcaton des MCO aux observatons pour lesquelles y > 0... 1 1. Estmaton par la méthode en deux étapes : Heckman (1976).... 14 1.3 EstmatonparleMaxmumdeVrasemblance... 16 1.3.1 LogVrasemblancedansunmodèleTobtsmple... 16 1.3. Re-paramétrsaton d Olsen (1978)... 18 1.4 Applcaton... 1 1.5 Effetsmargnaux... 3 1.6 Proprétésdel estmateurdumvsousdeshypothèsesnonstandard... 7 1.6.1 Hétéroscédastcté... 7 1.6. Nonnormalté... 31 1.7 ExtensonsdumodèleTobtSmple:modèlesàcensuremultples... 35 1.7.1 ModèleTobtsmpleàcensuresmultples... 35 1.7. Modèle Tobt smple à double censure : Rosett et Nelson (1975)..... 37 1.7.3 Applcatonmodèleàdoublecensure... 39 LesModèlesTobtGénéralsés... 40.1 ModèleTobtGénéralséType... 41.1.1 DéfntonduTobtgénéralsédetypeII... 41.1. EstmatonparMaxmumdeVrasemblance... 4.1.3 Estmaton en deux étapes : Heckman (1976)... 45.1.4 Exemples... 47.1.5 ModèledeTroncatureAuxlareouModèleHeckt... 48. AutresModèlesTobtGénéralsés... 50..1 ModèleTobtGénéralséType3... 50.. ModèleTobtGénéralséType4... 50..3 ModèleTobtGénéralséType5... 50 3 LesModèlesàrégmes... 50 3.1 Modèleàrégmesobservables... 50 3. Modèleàrégmesnobservables... 50 A Annexes... 51 A.1 Concavtédelalog-vrasemblance... 51 A. Programmedesmulatond unprobtsmple... 51

Econométre des Varables Qualtatves. Cours C. Hurln 3 Introducton Nous allons à présent envsager le cas des modèles à varable dépendante lmtée :ce sont des modèles pour lesquels la varable dépendante est contnue mas n est observable que sur un certan ntervalle. Ans, ce sont des modèles qu se stuent à m chemn entre les modèles de régresson lnéares où la varable endogène est contnue et observable et les modèles qualtatfs. En effet, les modèles à varable dépendante lmtée dérvent des modèles à varables qualtatves, dans le sens où l on dot modélser la probablté que la varable dépendante appartenne à l ntervalle pour lequel elle est observable. Nous verrons que la structure de base des modèles à varable dépendante lmtée est représentée par le modèle Tobt. Avant de présenter plus en détal les modèles à varable dépendante lmtée, et plus spécfquement le modèle Tobt, l convent au préalable de précser les termes que nous allons utlsés par la sute dans le cadre de ce chaptre. Les modèle Tobt se réfèrent de façon générale à des modèles de régressons dans lesquels le domane de défnton de la varable dépendante est contrant sous une forme ou une autre. En économe, de tels modèles ont été ntés par James Tobn (1958). Son analyse portat sur les dépenses de consommaton en bens durables et reposat sur une régresson tenant compte spécfquement du fat que ces dépenses ne peuvent pas être négatves. La varable dépendante état ans assujette à une contrante de non négatvté. Tobn qualfa sonmodèlede modèle à varable dépendante lmtée 1 (lmted dependent varables model) d où le ttre de ce chaptre. Ce modèle et ses généralsatons sont plus connus parm les économstes sous le nom de modèle Tobt. Ce terme a été ntrodut par Goldberger (1964) en rason des smlartés avec le modèle probt. Toutefos, ces modèles sont auss appelés modèles de régresson censurées (censored regresson models) oumodèle de régresson tronquée (truncated regresson models). Cette termnologe plus précse permet en effet d ntrodure la dstncton entre des échantllons tronqués et des échantllons censurés : 1. Un modèle de régresson est dt tronqué lorsque toutes les observatons des varables explcatuves et de la varable dépendante fgurant en dehors d un certan ntervalle sont totalement perdues.. Un modèle de régresson est dt censuré lorsque l on dspose au mons des observatons des varables explcatves sur l ensemble de l échantllon. Nous verrons par la sute que le modèle Tobt est ans un modèle de régresson censurée. Lesmodèlescensurésettronquésontétéutlsésdansd autresdscplnesndépendamment de leur utlsaton et développement en économe, et ce notamment en bologe et dans 1 Tobn J. (1958), Estmaton of Relatonshps for Lmted Dependent Varables, Econometrca, 6, 4-36.

Econométre des Varables Qualtatves. Cours C. Hurln 4 les scences de l ngéneur. En bologe, de tels modèles furent utlsés pour représenter le temps de surve des patents en foncton de certanes caractérstques : les échantllons étaent en effet censurés ou tronquées dès lors que le patent reste en ve à la dernère date d observaton de l échantllon ou s l ne peut pas être ausculté à cette date pour une rason quelconque. De la même façon en ngénere, les modèles censurés et tronqués sont utlsés pour analyser le temps de surve d un matérel ou d un système en foncton de ses caractérstques. De tels modèles sont alors qualfés de modèles de surve (survval models). Les économstes et les socologues ont auss utlsés des modèles de surve pour évaluer la durée de phénomènes comme le chômage, le marage, la durée de résdence dans certans leux etc... Mathématquement, les modèles de durée appartennent à la même classe que les modèles Tobt, mas font souvent l objet d un tratement à part. Entre 1958, date de paruton de l artcle de Tobn et les années 70, les modèles Tobt ont été utlsés très fréquemment en économe sous l effet de la conjoncton de deux phénomènes : d une part la plus grande dsponblté de bases mcro-économques et d autre part le développement des capactés nformatques qu a perms de trater des modèles Tobt de grande talle. Du fat de ces très nombreuses applcatons, dfférentes extensons et généralsatons ont été proposées pourle Tobt : modèle Tobt généralsé, modèles à seuls stochastques... C est pourquo on a ntrodut la caractérsaton de modèle Tobt smple pour désgner le modèle développé par Tobn et le dstnguer des autres extensons. Amemya (1983) dentfe ans 5 types de modèle de Tobt, le Tobt smple étant qualfé de modèle Tobt Type I. Plus formellement, consdérons N couples de varables (x,y ) où la varable y est engendrée par un processus aléatore tel que E (y /x )=x β, où β R K est un vecteur de paramètres. On suppose que la varable y n est pas toujours observable : on ne l observe que s sa valeur est supéreure à un certan seul c. On peut ans construre une varable y, qu est égale à y lorsque celle-c est observable et qu vaut c par conventon lorsque y n est pas observable. y = y c s y >c snon =1,..N (0.1) La constante c peut être dentque pour tous les ndvdus. Deux cas peuvent alors se présenter suvant la nature des observatons : 1. S le vecteur x est observable pour tous les ndvdus et cela ndépendamment du fat que la varable y sot observable ou non, on un échantllon censuré. Seule la varable y est observable sur un ntervalle [c, + [. S le vecteur x est observable unquement pour les ndvdus pour lesquels la varable y est observable, on un échantllon tronqué. On ne dspose d observatons (x,y ) que pour les ndvdus pour lesquels y >c. On a par exemple un échantllon tronqué dans le cadre d une enquête où les ménages ne répondent à l enquête que s ls répondent à la queston permettant de détermner y. Ceux pour lesquels y c ne répondent pas à l enquête ou sont élmnés de l échantllon par les enquêteurs.

Econométre des Varables Qualtatves. Cours C. Hurln 5 L utlsaton de modèles Tobt suppose que soent partculèrement connus les résultats relatfs aux moments et aux moments condtonnels d une varable dstrbuée selon une lo normale tronquée. C est pourquo, avant de présenter ces modèles, nous proposons les résultats suvants. Sot Φ (.) la foncton de répartton de la lo normale centrée rédute N (0, 1) et sot φ (.) la foncton de densté assocée. Proposton 0.1. Consdérons une varable y suvant une lo normale tronquée telle que : y s y y = > 0 (0.) 0 snon où y est dstrbuée selon une lo normale N m, σ. On admet alors les proprétés suvantes : 1. Espérance de y : m m E (y) =m Φ + σφ σ σ (0.3). Espérance condtonnelle de y : E (y/y > 0) = m + σ φ m σ m Φ m = m + σλ σ σ où λ (x) =φ (x) /Φ (x) désgne le rato de Mll. 3. Varance de y : m V (y) =σ Φ + m m σ σ W σ W m σ avec W (x) = x Φ (t) dt = xφ (x)+φ (x). Par conséquent : m σ V (y) = m Φ m σφ m + m σφ σ m σ m σ Φ m + σ Φ σ σ φ m σ 4. Varance condtonnelle de y : V (y/y > 0) = σ 1 m m σ λ σ λ m σ m Φ m σ (0.4) (0.5) (0.6) Notons smplement que pusque le rato de Mll λ (x) joue un grand rôle dans l analyse des moments d une lo normale tronquée, l est ntéressant de vérfer qu l s agt d une foncton décrossante de x : λ(x) x = λ (x) W (x) Φ (x) (0.7)

Econométre des Varables Qualtatves. Cours C. Hurln 6 La forme générale du rato de Mll est reprodute sur la fgure (0.1). Fgure 0.1: Rato de Mll : λ (x) =φ (x) /Φ (x) 6 5 4 Rato de Mll 3 1 0-5 -4-3 - -1 0 1 3 4 5 Etudons à présent le modèle Tobt Smple ou modèle Tobt de type 1 suvant la termnologe d Amemya (1983).

Econométre des Varables Qualtatves. Cours C. Hurln 7 1. Le Modèle Tobt Smple Comme nous l avons dt en ntroducton le modèle Tobt a été développé par Tobn (1958), même s le terme de modèle Tobt n est apparu qu en 1964 dans un artcle de Goldberger. Dans son étude, Tobn cherche à modélser la relaton entre le revenu d un ménage et les dépenses en bens durables. Il dspose pour cela d un échantllon de N = 735 consommateurs tré du Survey of Consumer Fnances. Tobn observe que lorsque l on représente les couples revenus - dépenses des N consommateurs, la relaton obtenue ressemble au graphque (1.1) c-dessous. Une des caractérstques essentelles des données étant que pluseurs observatons pour le montant des dépenses de consommaton sont nulles. Eneffet, ces observatons sont nulles pour tous les ménages n ayant pas acheté de bens durables sur la pérode. Pour ces ndvdus, on dspose ans d observatons sur le revenu mas pas d observatons sur les dépenses de consommaton : on un échantllon censuré. Fgure 1.1: Nuage de Ponts : Modèle Tobt Smple 6 5 4 3 1 0 0 0.5 1 1.5.5 3 3.5 4 4.5 Cette proprété remet en cause l hypothèse de lnéarté et montre que les mondres carrés ordnares ne sont pas la méthode pertnente pour estmer une telle relaton. De façon plus générale, on peut pas c utlser une densté contnue pour explquer la dstrbuton condtonnelle des dépenses par rapport au revenu : en effet, une dstrbuton contnue est ncompatble avec le fat que pluseurs observatons des dépenses soent nulles. C est donc dans ce contexte que Tobn propose son modèle à varable dépendante lmtée (lmted dependent varable model). Dans cette secton nous parlerons de modèle Tobt en réference au Tobt smple pour alléger les notatons.

Econométre des Varables Qualtatves. Cours C. Hurln 8 L hstore que propose Tobn est alors la suvante. Consdérons un agent qu a le chox entre deux bens x et y, qu cherche à maxmser son utlté U (x, y) sous sa contrante de budget de la forme x + py R, où p est le prx relatf et R le revenu. On suppose que le prx du ben x sert de numérare. On admet parallèlement que la consommaton de ben x satsfat une contrante de non négatvté x 0, mas que la consommaton de ben y vérfe une contrante du type y y 0 ou y =0. Cette contrante tradut smplement une ndvsblté des premères untés de bens y. Supposons que y sot la soluton du programme de maxmsaton de l utlté sous la contrante de budget et la contrante x 0. (x,y ) = arg max U (x, y) {x,y} sc : x + py R. sc : x 0 Dès lors, deux cas sont à consdérer : sot le nveau de consommaton potentelle du ben y est suffsamment élevé par rapport au seul y 0 et l agent consomme effectvement du ben y en quantté y, sot l n est pas suffsamment élevé et l agent ne consomme pas de ben y. Formellement on a : y y = s y 0 >y 0 S l on suppose que la soluton non contrante y est foncton d un certans nombres de caractérstques x et d une perturbaton ε sous la forme y = β 0 + β 1 x + ε et s l on suppose la normalté des perturbatons ε, alors on peut reprodure des valeurs de la consommaton y semblables à celles du graphques (1.1). Il sufft pour cela de supposer que les seuls y 0 sont les mêmes pour tous les ndvdus et que y 0 =0. Ans, le modèle orgnellement proposé par Tobn (1958) est le suvant : Defnton 1.1. Un modèle Tobt Smple ou modèle Tobt de type I est défn par : y = x β + ε =1,..N (1.1) y y = s y > 0 0 s y 0 (1.) où x = x 1..xK, =1,.., N désgne un vecteur de caractérstques observables et où β =(β 1...β K ) R K est un vecteur de paramètres nconnus et où les perturbatons ε sont dstrbués selon une lo N 0, σε. On suppose ans que les varables y et x sont observées pour tous les ndvdus, mas que les varables y sont observables unquement s elles sont postves. On note X la matrce de dmenson (N,K) telles que les lgnes de cette matrce correspondent aux vecteurs x. On suppose en outre que lm N X X = Q X où Q X est une matrce défne postve. Remarquons que l écrture d un seul nul y > 0 peut parfatement être changé en un seul y >y 0 sansquelemodèlesotchangé. Ilsufft pour cela d absorber dans le vecteur des

Econométre des Varables Qualtatves. Cours C. Hurln 9 caractérstques x une constante et de lu assocer un coeffcent égal à y 0. Le cas où les seuls y,0 dffèrent selon les ndvdus nécesste toutefos de modfer le modèle. Essayons à présent de comprendre pourquo l applcaton d une méthode de mondres carrés ordnares ne permet pas d estmer de façon convergente le vecteur des paramètres β assocés aux varables explcatves. 1.1. Estmaton par les Mondres Carrés Ordnares Au delà des calculs, on observe mmédatement sur l exemple de la fgure (1.1) que l applcaton des Mondres Carrés Ordnares n est pas la méthode adéquate pour révéler la relaton entre consommaton et revenu pour au mons eux rasons : 1. Le nuage de pont sera alors mal décrt par une relaton du type consommaton = a + b revenu pusque le nuage de ponts comporte deux partes dstnctes.. L hypothèse de lo contnue généralement fate sur les perturbatons n est pas adaptée dans ce cas pusque la valeur nulle de la consommaton est observée de nombreuses fos dans l échantllon et a donc sans doute une probablté d apparton nettement dfférente de zéro. Nous allons toutefos montrer l applcaton des MCO à l ensemble des observatons ou l applcaton des MCO aux seules observatons pour lesquelles on observe la varable y condut à une estmaton basée des paramètres du vecteur β. On suppose que les N observatons de l échantllon sont générées à partr du processus générateur de données suvant : y = y 0 s y = x β + ε > 0 snon =1,..N avec x = x 1..xK, =1,.., N, β =(β1...β K ) R K et où les perturbatons ε sont dstrbués selon une lo N 0, σε. On cherche c à estmer le vecteur de paramètre β par le méthode des Mondres Carrés Ordnares. Deux solutons sont alors envsageables : 1. Sot on applque les MCO à l ensemble des observatons (x,y ) de l échantllon. Sot on applque les MCO aux seules observatons (x,y ) pour lesquels y > 0. Commençons tout d abord par applquer les MCO à l ensemble des observatons de l échantllon. 1.1.1. Applcaton des MCO à l ensemble des observatons L estmateur des MCO applqué à l ensemble des N couples d observatons (y,x ) est défn par la relaton suvante : N 1 N β LS = x x x y (1.3) =1 =1

Econométre des Varables Qualtatves. Cours C. Hurln 10 Supposons pour commencer que les varables exogènes x sont détermnstes et détermnons alors l expresson de E βls, comme sut : N 1 E βls = x x =1 N =1 x E (y ) (1.4) Cette expresson dépend de la quantté E (y ) qu correspond à l espérance d une varable normale tronquée. En applquant la formule de l espérance d une lo normale tronquée, on montre que : x β x β E (y )=x β Φ + φ On en dédut mmédatement que l estmateur des mondres carrés β est basé : en effet la quantté E βls est une foncton non lnéare de β et ne peut donc pas être égale à β. Le bas peut être postf ou négatf et pour le caractérser, consdérons le cas où K =1, on a alors 1 β LS = N =1 x y et l on en dédut que : N =1 x N E βls =1 = x E (y ) 1 N N = N x x β x β =1 x =1 x βφ + x φ σ ε S l on admet que lm V βls =0 n alors, on en dédut que l estmateur β LS converge vers E βls qu dans le cas général dffère de la vrae valeur β des paramètres : β LS p β = β (1.5) N L estmateur des MCO de β applqué sur l ensemble des observatons est non convergent. Il est alors relatvement dffcle dans le cas de varables détermnstes de donner un résultat général sur la forme du bas, c est à dre sur le fat que l estmateur β LS sur-estme ou sous estme la vrae valeur β des paramètres. C est pourquo, nous allons à présent envsager le cas de varables explcatves stochastques. =1 Envsageons à présent le cas où les varables x sont des varables aléatores. Goldberger (1981) a étudé les bas asymptotques de l estmateur des MCO dans ce cas en supposant que lestouteslesvarablesexplcatvesx, à l excepton du terme constant, étaent dstrbuées selon une lo normale. Goldberger réécrt ans le modèle sous la forme : y = y 0 s y = α + x β + ε > 0 snon =1,..N avec x = x 1..xK, =1,.., N, β =(β1...β K ) R K et γ R. Les résdus ε sont dstrbués selon une lo normale N 0, σε. Hypothèse On suppose que les varables explcatves x sont dstrbuées selon une lo normale N (0, Ω) avec cov ε x (k) =0, k =1,..,K.

Econométre des Varables Qualtatves. Cours C. Hurln 11 L hypothèse de nullté de l espérance des varables explcatves x n est pas gênante c pusque s l on consdère des varables non centrées, on peut sans problème ntégrer cette quantté dans le terme constant α. Proposton 1.. Sous les hypothèses de Goldberger (1981), l estmateur β LS des Mondres Carrés Ordnares obtenu sur l ensemble des observatons (x,y ) vérfe : p α β LS β Φ (1.6) N où α correspond à la constante de l équaton y = α + x β + ε et σ y = σ ε + β Ωβ, où Ω désgne la matrce de varance covarance des varables explcatves x. La démonstraton de cette proposton fgure dans Greene (1981) Exemple : Consdérons le cas où α =0. Etant donné que Φ (0) = 0.5, lorsque l n y pas de constante dans la défnton de la varable latente y (α =0), alors on obtent une relaton du type plm βls = 0.5 β. Dans ce cas, l estmateur obtenu sur la totalté de l échantllon converge asymptotquement vers la moté de la vrae valeur β des paramètres. En effet, sous l hypothèse de normalté avec E (x )=0, s la constante α est nulle, on a alors E (y )=0. La varable y est centrée et dstrbuée selon une lo symétrque, la lo normale N x β, σε. Dès lors sous l hypothèse de Goldberger lorsque α =0, on a Prob(y > 0) = Prob(y 0) = 0.5. Pour un échantllon de talle N suffsante, on a donc approxmatvement autant d observatons nulles de y que d observatons strctement postves : N 1 N/. Dès lors, la prse en compte de l ensemble des observatons dans l estmaton des MCO va condure à un estmateur de β convergeant vers la moté de la vrae valeur du vecteur β. Dans le cas K =1, lapentedela drote d ajustement lnéare assocée à la régresson sur l ensemble des observatons (c est à dre β LS ) correspond dans ce cas à la moté de la pente β assocée à la vrae relaton lnéare entre y et x. ********************************* **** Insérer Graphque avec α =0**** ********************************* Une des conséquences remarquables de cette proposton est la suvante : Remark 1. Sous les hypothèses de Goldberger (1981), l estmateur défn par la quantté β c LS =(N/N 1 ) β LS,oùN 1 est le nombre d observatons pour lesquelles y > 0, est un estmateur convergent de β. Un estmateur convergent de α peut être obtenu de façon smlare. β c LS = N p βls N β (1.7) 1 N De la même façon pour l estmateur corrgé α c LS de la constante α, on a : α c LS = N N 1 α LS σ y p N α (1.8) Reprenons l exemple du cas où le terme constant est nul : α =0. On a vu alors que l estmateur des MCO état basé et convergeat vers la moté de la vrae valeur des paramètres : p 0 β LS β Φ = β N σ y

Econométre des Varables Qualtatves. Cours C. Hurln 1 Or sous les hypothèses de Goldberger et en partculer sous l hypothèse E (x )=0, mposer la nullté de α revent à mposer la nullté de E (y ). Comme nous l avons dt la varable y est alors centrée et dstrbuée selon une lo symétrque, la lo normale N x β, σε. Dès lors, lorsque α =0, on a Prob(y > 0) = Prob(y 0) = 0.5. Pour un échantllon de talle N suffsante, on a donc approxmatvement autant d observatons nulles de y que d observatons strctement postves : p N N 1 N Ans l estmateur corrgé β c LS est convergent pusque : β c LS = N N 1 β LS p plm βls = β N Greene (1983) dérve les matrces de varance covarance asymptotques de cet estmateur. Malheureusement, on peut utlser cet estmateur que dans la mesure où l on est sur que les hypothèses de Goldberger sont satsfates et en partculer l hypothèses selon laquelle les varables explcatves sont dstrbuées selon des los normales. Ren n est spécfé sur les proprétés de cet estmateur lorsque les varables explcatves ne sont pas dstrbuées selon une lo normale. Il faudra donc utlser une autre méthode pour estmer β dans le cas général. ******************************************************** *** Illustrer par smulaton bas sur β LS et convergence de β c LS *** ******************************************************** Applquons à présent la méthode des MCO aux seules observatons pour lesquelles y > 0 afn d estmer le vecteur de paramètres β. 1.1.. Applcaton des MCO aux observatons pour lesquelles y > 0 Compte tenu du graphque (1.1), l état clar que l applcaton des MCO à l ensemble des observatons (x,y ) de l échantllon devat condure à une estmaton basée du coeffcent qu le le revenu à la consommaton. C est ce que nous avons démontré dans la secton précédente. Mas lorsque l on restrent l échantllon aux seules observatons pour lesquelles la varable latente est postve, ce résultat est beaucoup mons évdent à llustrer graphquement. y Applquons ans les MCO aux seules observatons pour lesquelles y MCO, noté β y>0,estdéfn par la relaton : > 0. L estmateur des β y>0 = y >0 x x 1 y >0 x y (1.9) où y >0 désgne la sommaton sur les ndces =1,..,N pour lesquels on a y > 0. Supposons que les varables exogènes x sont détermnstes et détermnons alors l expresson de E βy>0, comme sut : E βy>0 = x E (y /y >0 ) (1.10) y >0 x x 1 y >0 Cette expresson dépend de la quantté E (y /y >0 ) qu correspond à l espérance condtonnelle d une varable normale tronquée. En applquant la formule correspondante, on montre

Econométre des Varables Qualtatves. Cours C. Hurln 13 que : φ x β x β E (y /y >0 )=x β + = x β + λ Φ xβ (1.11) où λ (x) =φ (x) /Φ (x) désgne le rato de Mll. Dans ce cas encore, l estmateur des MCO est donc basé et le bas peut être postf et négatf : E βy>0 y = x >0 E (y /y >0 ) y = β + σ x >0 λ (x β/ ) ε (1.1) y >0 x y >0 x Envsageons à présent le cas où les varables x sont dstrbuées selon une lo normale. On se place alors dans le cadre des hypothèses de Goldberger (1981) décrtes à la secton précédente. On suppose que les varables explcatves x sont dstrbuées selon une lo normale N (0, Ω) avec cov ε x (k) =0, k =1,.., K. Sous ces hypothèses, Goldberger obtent le résultat suvant : Proposton 1.3. Sous les hypothèses de Goldberger (1981), l estmateur β y>0 des Mondres Carrés Ordnares obtenu sur les seules observatons (x,y ) pour lesquelles y > 0 vérfe : βy>0 p 1 γ N 1 ρ β (1.13) γ les paramètres γ et ρ étant respectvement défns par : γ = 1 α λ σ y σ y α + σ y λ α σ y (1.14) ρ = 1 σ β Ωβ (1.15) y où α correspond à la constante de l équaton y = α + x β + ε et où σ y = σ ε + β Ωβ, avec Ω matrce de varance covarance des varables explcatves x. La démonstraton de cette proposton fgure dans Goldberger (1981). On peut montrer que les paramètres γ et ρ vérfent : 0 γ 1 0 ρ 1 Dés lors, de façon générale on montre que l estmateur des MCO applqué aux seules observatons y > 0 sous estme l ensemble des composantes du vecteur β. plm β y>0 β (1.16) N Une des conséquences remarquable de cette proposton est la suvante : Remark. Sous l hypothèse de normalté des varables x, ledegrédesousestmaton est totalement unforme pour tous les éléments de β. 1 β (k) plm N β (k) y>0 = ξ k =1,..,K (1.17)

Econométre des Varables Qualtatves. Cours C. Hurln 14 Ans le bas affecte de façon symétrque l ensemble des paramètres estmés. Ce résultat n est plus valable dès lors que l on lève l hypothèse de normalté. *** Détermner le cas partculer où l estmateur β y>0 n est pas basé c est à dre lorsque α α γ = σ 1 y λ α + σ y λ = α α λ + λ =1 σ y ασy σ y ****************************************************** *** Insérer Smulatons Bas + Graphque pour le cas partculer ** ****************************************************** σ y σ y 1.. Estmaton par la méthode en deux étapes : Heckman (1976) Pusque la méthode des Mondres Carrés Ordnares ne peut condure qu à des estmatons basées des paramètres dans le cas d un modèle Tobt smple, sauf dans des cas très partculers, dfférentes méthodes d estmaton alternatves ont été proposées. La méthode d estmaton qu est la plus utlsée aujourd hu est celle du maxmum de vrasemblance (Goldberger 1981, Olsen 1978). Toutefos cette méthode est relatvement gourmande en termes de capactés de calcul, notamment dans la phase d optmsaton. C est pourquo, dans les années 70, du fat des contrantes nformatques, d autres méthodes d estmaton ont souvent été prvlégées parce qu elles nécesstaent mons de capactés de calcul : tel est le cas de la méthode d estmaton en deux étapes d Heckman (1976). Heckman (1976), suvant une suggeston de Gronau (1974), propose un estmateur en deux étapes dans un modèle Tobt généralsé à deux équatons (modèle que nous aborderons dans les sectons suvantes). Cet estmateur peut auss être utlsé pour estmer les paramètres d un modèle Tobt smple ou modèle Tobt de type I. Pour comprendre cette méthode, consdérons la formule de l espérance condtonnelle de y sachant que y > 0 : x β E (y /y >0 )=x β + λ (1.18) où λ (x) =φ (x) /Φ (x) désgne le rato de Mll. Ans, l espérance condtonnelle de y sachant y > 0 peut être décomposée en une composante lnéare en β etunecomposantenonlnéareen β. Consdérons à présent la parte quanttatve du modèle Tobt, c est à dre celle qu correspond à l observaton de y > 0. Pour ces observatons on a une relaton du type : y = E (y /y >0 )+v où v est de moyenne nulle. On remplace alors l espérance condtonnelle par son expresson, et l on obtent la relaton suvante. Proposton 1.4. Le modèle Tobt smple, pour y > 0, peut être représenté par la régresson non lnéare hétéroscédastque suvante : avec δ = β/ et v = y E (y /y >0 ) et E (v )=0et y = x β + λ (x δ)+v (1.19) Var(v )=σ ε σ εx δλ (x δ) σ ελ (x δ) (1.0)

Econométre des Varables Qualtatves. Cours C. Hurln 15 Ans, pour estmer les paramètres β, l sufft de consdérer la régresson non lnéare (1.19) et d en dédure un estmateur β H àpartrdesn 1 observatons pour lesquelles y > 0. La seule dffculté provenant de l hétéroscédastcté des perturbatons v, pusque Var(v ) dépend des caractérstques x va le rato de Mll λ (x δ) et drectement dans l expresson x δλ(x δ). Telle est l dée de la procédure d Heckman. Proposton 1.5. étapes : La procédure d estmaton d Heckman (1976) comporte deux 1. Etape 1 : Estmer le rato δ = β/ àpartrdumodèleprobt dchotomque suvant par une méthode de maxmum de vrasemblance 1 z = 0 s y > 0 snon =1,..N (1.1) avec Prob(z =1)=Φ (x β/ )=Φ (x δ). Sot δ l estmateur du MV de δ.. Etape : Régresser y sur x et λ x δ par une méthode de Mondres Carrés en ne consdérant unquement les N 1 valeurs postves de y y = x βh + λ x δ + v (1.) On note alors γ H = ans obtenu. β H l estmateur des paramètres du modèle Tobt En effet sous la forme (1.19), le modèle quanttatf apparaît comme un modèle lnéare en β et. Réécrvons le modèle sous forme vectorelle pour dérver les los asymptotques. On pose Z = X λ où X désgne la matrce de dmenson (N 1,K) dont les lgnes correspondent aux vecteur de varables explcatves x pour lesquelles y > 0 et où λ désgne un vecteur de dmenson (N 1, 1) dont le jème élément est donné par l estmateur du rato de Mll λ x j δ. Sot γ = β le vecteur des K +1paramètres à estmer. Le modèle (1.19) s écrt alors sous la forme : y = Zγ + w (1.3) où y désgne le vecteur des N 1 observatons de y pour lesquelles y w =(w 1...w N1 ) sont tels que : w = v + η = v + λ (x δ) λ x δ > 0 et où les résdus (1.4) Le résdu se décompose ans en la somme du résdu v de la représentaton (1.19) et d un terme provenant de l erreur d estmaton du paramètre δ = β/ dans la phase n 1 d estmaton du probt. L estmateur de Heckman en deux étapes est alors défn par : 1 γ H = Z Z Z y Amemya (1983) établt alors lé résultat suvant en ce qu concerne la dstrbuton asymptotque de γ H (cas partculer de Heckman 1979) :

Econométre des Varables Qualtatves. Cours C. Hurln 16 Proposton 1.6. L estmateur en deux étapes de Heckman (1976) est asymptotquement normalement dstrbué : N 1 p 1 (γ H γ) N (0,V γ) (1.5) N où N 1 désgne le nombre d observatons telles que y > 0, avec V γ = σ ε (Z Z) 1 Z Σ + σ ε (I Σ) X (X D 1 X) 1 X (I Σ) Z (Z Z) 1 (1.6) Il faut noter que dans cette expresson de V γ, la seconde matrce dans les crochets provent du fat que le rato de Mll λ a du être estmé dans une premère étape. S la valeur de ce rato état connu, la matrce de varance covarance asymptotque devendrat smplement : V γ = σ ε (Z Z) 1 Z ΣZ (Z Z) 1 Au delà de ces résultats, on vérfe quel estmateur de Heckman en deux étapes est asymptotquement convergent : p γ H γ (1.7) N 1 On dspose ans d un estmateur convergent et qu ne nécesste dans la premère étape que l utlsaton d un estmateur du maxmum de vrasemblance pour un probt smple. Cet estmateur représente donc un gan de capactés de calculs par rapport à l estmateur du maxmum de vrasemblance applqué drectement au modèle Tobt. Remarquons toutefos, que cet estmateur est basé à dstance fneenrason delacorrélatonentrelaperturbaton w = η + v et la varable explcatve λ x δ. 1.3. Estmaton par le Maxmum de Vrasemblance La procédure d estmaton la plus utlsée aujourd hu est celle du maxmum de vrasemblance. En effet, les capactés nformatques sont désormas suffsantes pour envsager l optmsaton des fonctons de vrasemblance assocées drectement aux modèles Tobt et non plus unquement aux probt dchotomques comme dans le cas de la procédure d Heckman (1976). Commençons par défnr la log-vrasemblance assocée au modèle Tobt smple : y y = 0 s y = x β + ε > 0 snon =1,..N avec x = x 1..xK, =1,.., N, β =(β1...β K ) R K et où les perturbatons ε sont dstrbués selon une lo N 0, σε. 1.3.1. Log Vrasemblance dans un modèle Tobt smple Consdérons un échantllon de N observatons y,notéy =(y 1,.., y N ). Lavrasemblancedece modèle est défne par : L y, β, σ x β 1 y x β ε = 1 Φ φ (1.8) : y =0 : y >0 En effet,onsatquesl ondéfnt une varable dchotomque probt z telle que 1 s y z = = x β + ε > 0 =1,..N (1.9) 0 snon

Econométre des Varables Qualtatves. Cours C. Hurln 17 alors on peut écrre la probablté que la varable y prenne des valeurs postves sous la forme Prob(z =1) = Prob(ε / <x β/ )=Φ (x β/ ). Par conséquent, la probablté que y prenne une valeur nulle s écrt comme la probablté complémentare : x β Prob(y =0)=Prob(z =0)=1 Φ Ce qu explque le terme du premer produt de la foncton de vrasemblance (1.8). Le second terme de cette expresson correspond tout smplement au produt des los margnales des varables y postves. On sat que s y > 0, on a part défnton y = y = x β + ε où les perturbatons ε sont dstrbués selon une lo N 0, σε. On en dédut que les varables y sont dstrbuées selon une lo normale N x β, σε. Ans, la lo margnale d une observaton y postve est défne par la quantté : 1 exp 1 y x β 1 y x β = φ π où φ (.) désgne la foncton de densté assocée à lo normale centrée rédute. On en dédut l écrture de la log-vrasemblance : Proposton 1.7. La log-vrasemblance concentrée assocée à un échantllon y = (y 1,.., y N ) dans un modèle Tobt smple s écrt : log L y, β, σ x β ε = log 1 Φ N 1 σ : y ε log σ 1 ε σ (y x β) (1.30) =0 ε : y >0 où N 1 désgne le nombre d observatons pour lesquelles y > 0. En effet, on sat que la log-vrasemblance est défne par : log L y, β, σ ε = x β log 1 Φ + 1 log : y =0 = : y =0 = : y =0 = : y =0 log 1 Φ log 1 Φ log 1 Φ x β x β x β : y >0 : y >0 φ log ( )+ N 1 log ( )+ y x β : y >0 : y >0 N 1 log ( ) 1 σ ε y x β log φ 1 log e (y x β) σ ε π : y >0 (y x β) N 1 log (π) En omettant les termes constants (log-vrasemblance concentrée), l vent : log L y, β, σ x β ε = log 1 Φ N 1 log ( ) 1 σ : y ε σ (y x β) =0 ε : y >0 Sachant que N 1 log ( )=(N 1 /) log σ ε, on retrouve l expresson (1.30) de la foncton de log vrasemblance. On en dédut alors l expresson des dérvées premères par rapport à β et à σ ε :

Econométre des Varables Qualtatves. Cours C. Hurln 18 Defnton 1.8. Dans le cas d un modèle Tobt, le gradent assocé à la log-vrasemblance s écrt sous la forme suvante : log L y, β, σ ε = 1 φ x β x β : y =0 1 Φ xβ log L y, β, σ ε σ = 1 ε σ 3 ε : y =0 x βφ 1 Φ x β xβ + 1 σ ε N 1 σ + 1 ε σ 4 ε : y >0 : y >0 (y x β) x (1.31) (y x β) (1.3) Amemya (1973) démontre que l estmateur γ = β σε dumaxmumdevrasemblance satsfasant : γ =argmax [log L (y, γ)] = arg max log L y, β, σ ε (1.33) {γ} {β, } est convergent et asymptotquement dstrbué selon une lo normale de moyenne nulle et de varance égale à l nverse de la matrce d nformaton de Fscher : L N (γ γ0 ) N 0,I (γ 0 ) 1 (1.34) N avec log L (y, γ) I (γ) = E γ γ (1.35) γ=γ 0 où γ 0 désgne la vare valeur du vecteur de paramètres 3. Nous allons à présent proposer un changement de paramètre permettant d obtenr une expresson de la log-vrasemblance globalement concave, comme dans le cas des modèles logt et probt dchotomques. 1.3.. Re-paramétrsaton d Olsen (1978) Nous avons montré que les estmateurs du maxmum de vrasemblance des paramètres d un modèle Tobt smple, notées respectvement β et, sont soluton du programme : max log L y, β, σ ε {β,} et vérfent donc par conséquent les condtons nécessares suvant, correspondant à l annulaton du vecteur gradent de la log-vrasemblance : log L y,β, σ ε = 1 φ x β x β σ β= β ε : y =0 1 Φ xβ + 1 y σ x β x =0 σ ε ε : y >0 log L y, β, σ ε σ ε σ ε =σ ε = 1 σ 3 ε : y =0 1 Φ φ x β x β x β N 1 σ + 1 ε σ 4 ε : y >0 y x β =0 Pour détermner les estmateurs β et, l convent donc de résoudre ce système de K + 1 équatons non lnéares. Comme dans le cas des modèles probt et logt, l n exste pas d expresson analytque des solutons de ce programme. La résoluton d un tel système ne peut 3 La formule de la matrce de varance covarance asympotoque des estmateurs du MVC dans la paramétrsaton (β, ) est donnée dans Amemya (1973).

Econométre des Varables Qualtatves. Cours C. Hurln 19 donc se fare qu en utlsant une procédure d optmsaton numérque. Nous avons vu dans le premer chaptre, que généralement on recours alors à des algorthmes d optmsaton fondés notamment sur la méthode du gradent (comme l algorthme de Newton Raphson par exemple). Amemya (1973) a démontré que la foncton de vrasemblance du modèle Tobt paramétrée en β et n est pas globalement concave. Cette proprété est alors partculèrement gênante pusque nous savons que les solutons des algorthmes d optmsaton numérque sont alors extrêmement sensbles au problème du chox des condtons ntales. S l exste des extrema locaux de la foncton à optmser, en l occurrence c la foncton de log-vrasemblance, l peut arrver que l algorthme converge vers ces extrema locaux. En effet, s l on utlse des condtons ntales dans l algorthme d optmsaton relatvement proches des extrema locaux de la foncton de log-vrasemblance, alors l y a des rsques que l algorthme d optmsaton s arrête en ces ponts pour lesquels le gradent est nul, mas qu ne maxmsent pas de façon globale la foncton de log-vrasemblance. On rsque alors d obtenr des estmateurs non convergents des vras paramètres du modèle Tobt, non pas en rason de mauvases proprétésdelaméthodeéconométrqueutlsée(maxmumdevrasemblance),massmplementen rason de la défallance de l algorthme d optmsaton numérque utlsé pour maxmser la logvrasemblance. Pluseurs solutons, non exclusves les unes des autres, peuvent être apportées à ce problème : 1. La premère soluton consste à modfer les valeurs des condtons ntales de l algorthmes d optmsaton 4 de sorte à vérfer la robustesse des estmatons obtenues à la modfcaton de ces valeurs. S le changement des valeurs ntales ne condut à aucune modfcaton des estmatons des paramètres, cela tend à montrer que l algorthme a convergé vers un extremum global. S en revanche, les estmatons sont modfées, cela prouve que la soluton précédente n état pas un extremum global de la foncton de vrasemblance. Mas se pose alors la queston de savor ce qu l en est pour les nouvelles estmatons obtenues? Correspondent elles à un extremum global de la foncton de la vrasemblance?. La deuxème soluton consste à vérfer la robustesse des estmatons au chox de l algorthme d optmsaton. Généralement, pluseurs algorthmes sont proposés sous les logcels usuels : smplex, Newton Raphson, Marquadt etc.. Ces algorthmes, fondées sur des méthodes dfférentes, n ont pas la même sensblté au chox des condtons ntales. Ans, s pour dfférents algorthmes, on obtent des estmatons relatvement proches, cela tend à prouver que ces estmatons correspondent au maxmum global de la foncton de log-vrasemblance. S, en revanche, on obtent des estmatons sensblement dfférentes pour dfférents algorthmes ayant convergés, cela tend à montrer que certans de ces algorthmes, pour les condtons ntales posées, ne permettent pas d dentfer le maxmum global de la vrasemblance. La queston qu se pose est alors de savor quel algorthme dot être prvlégé en foncton du problème posé? 3. La trosème soluton proposée par Olsen (1978) consste à reparamétrser la foncton de vrasemblance de sorte à garantr sa concavté globale. Dès lors, on supprme le problème de la sensblté des solutons des algorthmes au chox des condtons ntales sur les paramètres pusqu l n exste qu un seul extremum global pour la foncton de logvrasemblance. Le chox des condtons ntales et de l algorthme n affecte alors que la 4 Sous Evexs, clquez pour cela sur l onglet optons dans la fenêtre d estmaton.

Econométre des Varables Qualtatves. Cours C. Hurln 0 vtesse de convergence des procédure d optmsaton, et ne dot pas théorquement affecter les résultats. La soluton d Olsen (1978) est ans partculèrement hable pusqu elle supprme le problème en reformulant la log-vrasemblance du modèle Tobt en des paramètres transformés θ = β/ et h = σ 1 ε de sorte à obtenr une nouvelle expresson de la log-vrasemblance re-paramétrée globalement concave. Proposton 1.9 (Olsen 1978). La log-vrasemblance d un modèle Tobt re-paramétrée en θ = β/ et h = σ 1 ε est globalement concave : log L (y, θ,h)= log [1 Φ (x θ)] + N 1 log (h) 1 (hy x θ) (1.36) : y =0 : y >0 où N 1 désgne le nombre d observatons pour lesquelles y > 0. Preuve : la matrce hessenne assocée à la log-vrasemblance log L (y, θ,h) s écrt sous la formesuvante: log L(y,θ,h) log L(y,θ,h) H (θ,h) (K+1,K+1) = θ θ θ h (1.37) log L(y,θ,h) h θ log L(y,θ,h) h Olsen (1978) démontre alors que la matrce hessenne H (θ,h) estégaleàlasommededeux matrces telles que : Ψ (θ,h) 0 H (θ,h)= + Γ = 0 N : y + >0 x x : y >0 x 1 y h : y >0 y x : y >0 y où le bloc Ψ (θ,h) de dmenson (K, K) est défn par :: Ψ (θ,h)= φ (x θ) x θ φ (x θ) x x 1 Φ (x θ) 1 Φ (x θ) : y =0 avec x θ φ (x θ)[1 Φ (x θ)] 1 < 0. En effet, on sat que la quantté φ (z)+zφ (z) correspond àlaprmtvedelafonctonφ (z) : φ (z)+zφ (z) = z Φ (t) dt > z z R On en dédut que z R : φ (z) >z[1 Φ (z)] z φ (z)[1 Φ (z)] 1 < 0 Dès lors, pusque x x est une matrce défne postve, les deux matrces et Γ sont des matrces défnes négatves (cf annexe A.1) : dès lors, la matrce hessenne est égale à la somme de deux matrces défnes négatves, elle est donc défne négatve. La foncton de log-vrasemblance est donc globalement concave. Lorsque la log-vrasemblance est paramétrée en h et θ, le gradent s écrt sous la forme suvante :

Econométre des Varables Qualtatves. Cours C. Hurln 1 Defnton 1.10. Le gradent assocé à la log-vrasemblance d un modèle Tobt reparamétrée en θ = β/ et h = σ 1 ε est : log L (y, θ,h) θ = : y =0 log L (y, θ,h) h φ (x θ) 1 Φ (x θ) x 1 = N 1 h 1 : y >0 : y >0 (hy x θ) x (1.38) (hy x θ) y (1.39) Compte tenu du résultat d Olsen, l est possble en utlsant des algorthmes d optmsaton usuels de détermner les estmateurs du maxmum de vrasemblance des paramètres transformés θ et h. Ces estmateurs sont solutons du programme suvant : θ h =maxlog L (y, θ,h) {θ,h} et vérfent naturellement les condtons nécessares suvantes : log L (y, θ,h) log L (y, θ,h) θ = θ= θ h =0 h= h On en dédut alors les estmateurs des paramètres du modèles Tobt orgnel pusque l on a θ = β/σε et h = σ 1 ε : = h β = θ σε (1.40) Lamatrcedevarancecovaranceasymptotquedesestmateurs et β se dédut alors de celle de θ et β, qu s exprme en foncton de la matrce hessenne H θ, h selon les formules usuelles. 1.4. Applcaton Consdérons tout d abord une applcaton sur données smulées qu nous permettra par la sute d évaluer la portée des bas. On smule un échantllon de 1000 ponts satsfasant les proprétés suvantes : y = y 0 s y = α + βx + ε > 0 snon =1,..N avec x R, =1,..,N, pour une talle d échantllon N = 1000 et où les perturbatons ε sont dstrbués selon une lo N 0, σ ε. On pose la valeur suvante des paramètres : α =1 β =0.8 σ ε =1 On suppose c que la varable explcatve x satsfat l hypothèse de Goldberger (1981) : la varable explcatve x est dstrbuée selon une lo normale N (0, Ω), avec Ω =1, et est ndépendante du résdu, cov (ε x )=0. Le programme permettant de smuler la sére observable y est fourn en annexe (A.). Commençons par estmer les paramètres α, β et σ ε par une méthodedemaxmsatondelavrasemblancestandard. Les résultats sont représentés dans la fgure (1.) : Evews ndque tout d abord que l échantllon smulé comporte 781 observatons pour lesquelles y > 0 et 19 observatons censurées à gauche, c est à dre pour lesquels y =0. On vérfe tout d abord que l algorthme d optmsaton numérque de la maxmsaton de la vrasemblance a convergé après 5 tératons.. Compte tenu de la talle d échantllon N relatvement mportante,

Econométre des Varables Qualtatves. Cours C. Hurln Fgure 1.: Estmaton Modèle Tobt Smple par Maxmum de Vrasemblance les réalsatons des estmateurs α =0.965 et β =0.793 sont très proches des vraes valeurs α =1 et β =0.8. Evews fournt en outre un estmaton de la varance résduelle, comme tenu de la dstrbuton chose (en l occurrence une lo normale dans le cas d un modèle Tobt smple) : la réalsaton de l estmateur σ ε est alors égale à 0.97, valeur relatvement proche de la vrae valeur de la varance σ ε =1. Les z statstques correspondant aux tests de nullté des paramètres nous permettent de rejeter l hypothèse nulle au seul de 5% pour les tros paramètres α, β et σ ε. Comparons la réalsaton de ces estmateurs du maxmum de vrasemblance à celles obtenues par les estmateurs des MCO applqués à l échantllon complet, notés α LS, β LS et σ ε,ls reportés sur la fgure (1.3). On vérfe que l estmaton par les MCO sur les 1000 ponts des paramètres α et β donne des résultats largement mons bons que ceux obtenus par maxmum de vrasemblance, pusque nous avons vu précédemment que ces estmateurs sont basés. En effet pour une vrae valeur β =0.8, la réalsaton de l estmateur des MCO est, dans notre expérence, de 0.653. Nous avons vu que sous l hypothèse de normalté des varables x (hypothèse de Goldberger 1981), l estmateur des MCO du paramètre β vérfe : p α β LS β Φ (1.41) N Dans le cas de notre expérence, sachant que α =1et que : σ y = σ ε + β Ωβ = σ ε + β Ω =1+0.8 1=1. 64 σ y

Econométre des Varables Qualtatves. Cours C. Hurln 3 Fgure 1.3: Estmaton par les MCO sur l échantllon complet on en dédut que β LS p 1 0.8 Φ =0.8 Φ (0. 78087) = 0.660 N 1.64 Ans, on sat que théorquement l estmateur β LS converge en probablté vers la valeur 0.660. On vérfe en effet sur la fgure (1.3), pour une talle d échantllon N = 1000 relatvement mportante, que la réalsaton de β LS =0.653 est très proche de cette valeur asymptotque. Nous avons vu en outre, toujours sous l hypothèse de normalté des varables explcatves x, que l estmateur des MCO corrgé β c LS =(N/N 1 ) β LS est convergent : β c LS = N N p β LS β 1 N Dans le cas de notre smulaton, la réalsaton de cette estmateur vaut : β c LS = N β N LS = 1000 0.653 =. 80064 1 781 Cette réalsaton est en effet très proche de la vrae valeur β =0.8. On remarque que pour notre échantllon smulé, la réalsaton de l estmateur des MCO corrgé est plus proche de la vrae valeur que l estmateur du MV. ********************** **** 1 ) Fare estmaton MCO sur parte postve de la dstrbuton **** ) Introdure N smulatons sur β LS, β c LS, β y>0, β MV et β Hec en contrôlant le pourcentage de données censurées : Matlab **** 3 ) Répartr les applcatons Evews ou Lmdep sur les dfférentes sectons? ********************** 1.5. Effets margnaux Supposons que l on dspose d un estmateur convergent β des paramètres β et d un estmateur convergent σ ε de la varance des résdus. On cherche à mesurer les effets margnaux.

Econométre des Varables Qualtatves. Cours C. Hurln 4 Defnton 1.11. Les effets margnaux dans un modèle de régresson censuré correspondent à la déformaton des prévsons sur une varable contnue engendrée par une varaton d une unté d une des varables explcatves. Il y alors pluseurs prévsons possble dans le cas du modèle Tobt suvant que l on s ntéresse àlavarablecensuréey ou à la varable latente y. En effet, tros cas peuvent apparaître : 1. Sot l on consdère la prévson sur la varable latente représentée par l espérance condtonnelle =1,.., N : E (y / x )=x β (1.4). Sot l on consdère la prévson sur la varable dépendante représentée par l espérance condtonnelle =1,.., N : x β x β E (y / x )=Φ x β + φ (1.43) 3. Sot l on consdère la prévson sur la varable dépendante censurée représentée par l espérance condtonnelle =1,.., N : E (y / x,y > 0) = E (y / x,,y x β > 0) = x β + λ (1.44) On peut ans détermner dfférents effets margnaux suvant que l on consdère l une ou l autre de ces prévsons. Tout d abord s l on consdère la prévson sur la varable latente, on obtent tout smplement un effet margnal mesuré par la dérvé partelle de l espérance condtonnelle E (y / x ) par rapport à une composante quelconque du vecteur des varables explcatves x. Defnton 1.1. L effet margnal d une varaton untare de la kème varable explcatve x (k), k =1,.., K, sur la prévson de la varable latente y est mesuré par la quantté : E (y / x ) = β (k) =1,.., N (1.45) x (k) ou par l élastcté ε y : /x [k] ε y /x [k] = E (y / x ) x (k) x (k) β (k) E (y / x ) = x(k) x β =1,.., N (1.46) Ans, une varaton de 1% de la kème varable explcatve x (k) la prévson de la varable latente y alors calculer une élastcté moyenne ε y /x [k] ε y /x [k] = 1 N pour le ème ndvdu, modfe pour ce même ndvdu de ε y pour cent. On peut /x [k] sur l ensemble des N ndvdus telle que : N =1 ε y /x [k] = 1 N N Consdérons à présent la prévson sur la varable dépendante non censurée. De la même façon, l effet margnal est mesuré par la dérvé partelle de l espérance condtonnelle E (y / x ) par rapport à une composante quelconque du vecteur des varables explcatves x. =1 x (k) β (k) x β

Econométre des Varables Qualtatves. Cours C. Hurln 5 Defnton 1.13. L effet margnal d une varaton untare de la kème varable explcatve x (k), k =1,.., K, sur la prévson de la varable dépendante y est mesuré par la quantté : E (y / x ) x β = Φ β (k) =1,..,N (1.47) x (k) ou par l élastcté ε y/x : [k] ε y/x [k] = E (y / x ) x (k) x (k) x (k) β (k) E (y / x ) = x β + λ x β =1,.., N (1.48) Preuve : A partr de l espérance condtonnelle E (y / x ) détermnons l effet margnal assocé à x (k). E (y / x ) x (k) = = Φ x (k) Φ x β x (k) x β x β x β + φ = β (k) Φ xβ S l on pose z = x β/, on obtent : E (y / x ) x (k) β (k) x β + Φ x (k) = β (k) x β Φ (z) x (k) x β φ x β β (k) + x β + Φ z + φ(z) x (k) φ + x (k) xβ x (k) + Φ (z) Or, on sat que la quantté φ (z)+zφ (z) correspond à la prmtve de la foncton Φ (z) : φ (z)+zφ (z) = z Φ (t) dt z R Dès lors, par dérvaton par rapport à une composante z (k) on obtent : φ(z) z (k) [zφ (z)] + = Φ (z) z (k) φ(z) z Φ (z) + Φ (z)+z = z Φ (z) z (k) z (k) z (k) z (k) φ(z) Φ (z) + z =0 z (k) z (k) Ans, on obtent fnalement que : E (y / x ) = β (k) Φ (z) =β (k) x β Φ x (k) En ce qu concerne l élastcté ε y/x [k] suvante : β (k) x (k) ε y /x [k] x β = Φ = 1 x β + λ β (k) on montre que celle-c est défne par la quantté Φ xβ x (k) x β β (k) x β + φ xβ

Econométre des Varables Qualtatves. Cours C. Hurln 6 Ans, une varaton de 1% de la kème varable explcatve x (k) pour le ème ndvdu, modfe pour cent. On peut sur l ensemble des N ndvdus telle que : = 1 N x (k) β (k) N =1 x β + λ x β >. la prévson de la varable dépendante y pour ce même ndvdu de ε y/x [k] alors calculer une élastcté moyenne ε y /x [k] ε y/x [k] = 1 N N =1 De façon générale, on montre que ε y/x [k] ε y /x [k] ε y/x [k] McDonald et Mofft (1980) ont proposé une décomposton partculèrement ntéressante de l effet margnal assocé à la prévson sur la varable dépendante y. Cette décomposton est la suvante : E (y / x ) x (k) x β = Φ β (k) 1 λ x β x β x β + λ +β (k) x β x β x β φ + λ Dès lors, l effet margnal d une varaton untare de la kème varable explcatve x (k), k = 1,..,K, sur la prévson de la varable dépendante y peut se décomposer comme la somme de deux éléments : Remark 3. La varaton de x (k) adeuxeffets sur la prévson de la varable dépendante y représentés par la décomposton de McDonald et Mofft (1980): E (y / x ) x (k) = Prob(y > 0) E (y / x,y >0 ) x (k) + E (y / x,y >0 ) Prob(y > 0) x (k) 1. D une part, la varaton de x (k) modfe l espérance condtonnelle de y dans la parte postve de la dstrbuton.. D autre part, la varaton de x (k) affecte la probablté que l observaton y appartenne à cette parte de la dstrbuton. Au passage, cette décomposton nous donne la 3ème mesure de l effet margnal : celle relatve à la prévson de la varable dépendante sur la parte postve de la dstrbuton : E (y / x,y >0 ) = β (k) x β x β x β 1 λ x (k) + λ où λ (x) =φ (x) /Φ (x) désgne le rato de Mll. ************* Applcaton : construre les dfférentes EM et commentez (exemple éco) Utlser la smulaton ou Utlser exemple Eco : 1. calculer EM1 et élastcté sur y. calculer EM et élastcté sur y 3. Décomposer EM par McDonald et Mofft *************

Econométre des Varables Qualtatves. Cours C. Hurln 7 1.6. Proprétés de l estmateur du MV sous des hypothèses non standard Nous allons à présent nous ntéresser aux proprétés de l estmateur du MV sous prncpales hypothèses en présentant chaque fos les tests approprés : 1. Hypothèse d hétéroscédastcté. Hypothèse de non normalté Commençons par évoquer les problèmes d hétéroscédastcté. 1.6.1. Hétéroscédastcté De nombreuses études ont été consacrées au problèmedel hétéroscédastctédanslecadredes modèles Tobt smple. Hurd (1979) a ans évalué les bas asymptotques de l estmateur du MV d un modèle Tobt smple tronqué en présence de dfférentes formes d hétéroscédastcté. Rappelons que dans le cas d un modèle Tobt smple tronqué,onnedsposeque d observatons pour les ndvdus pour lesquels y > 0. La vrasemblance s écrt alors sous la forme : L y, β, σ N 1 x β 1 ε = Φ =1 φ x β (1.49) Hurd consdère une certane forme d hétéroscédastcté en générant deux sous échantllons : un échantllon de talle rn, avec r [0, 1], d observatons pour lesquelles σ ε = σ 1 et un second échantllon de talle (1 r) N d observatons pour lesquelles σ ε = σ = σ 1. Il étude alors la déformaton de la lmte en probablté de l estmateur du MV, noté plm β,enfoncton des valeurs de σ 1 en consdérant σ =1et r =0.5. Hurd démontre ans l exstence de bas asymptotques sur l estmateur du MV en présence d hétéroscédastcté et l constate que ces bas peuvent être très mportants pour certanes valeurs de σ 1. Reprenant la même approche, Arabmazar et Schmdt (1981) montre que les bas asymptotques de l estmateur du MV sont beaucoup mons mportant dans le cadre d un modèle Tobt smple censuré, tel que celu que l on a vu jusqu à présent. Les résultats de ces deux études llustrent parfatement le sens général des résultats de cette lttérature. Proposton 1.14. De façon générale, on montre que l estmateur du MV en présence d hétéroscédastcté est asymptotquement basé. L mportance des bas asymptotques croît avec le degré de censure des données. Il est toutefos dffcle d aboutr à une concluson plus précse que cette proposton dans la mesure où les dfférentes études proposées sur ce thème dffèrent très sensblement sur la représentaton retenue de l hétéroscédastcté. Les modèles utlsés sont en effet très spécfque. Il faut ans smplement retenr que l hétéroscédastcté pose un séreux problème d estmaton des modèles Tobt smples. La queston qu se pose est alors de savor comment tester l hétéroscédastcté? Consdérons tout d abord une forme partculère d hétéroscédastcté. Hypothèses Sot un modèle Tobt hétéroscédastque tel que =1,.., N : σ ε, = σ ε, (α) =σ ε exp (w α) (1.50) où α =(α 1.. α P ) et où w = w (1)...w (P ) R P est un vecteur de caractérstques.

Econométre des Varables Qualtatves. Cours C. Hurln 8 Cette spécfcaton est suffsamment générale pour englober dfférentes confguratons d hétéroscédastcté. En partculer, lorsque α =0, on retrouve le modèle Tobt smple homoscédastque. Sous cette hypothèse, la log-vrasemblance concentrée du modèle Tobt smple s écrt alors : log L y,β, σ ε, α = : y =0 log 1 Φ x β, (α) N 1 log σ ε, (α) 1 σ ε, (α) : y >0 (y x β) Les estmateurs du MV des paramètres du Tobt hétéroscédastque, notés β, σ ε et α vérfent alors respectvement les condtons suvantes : log L y,β, σ ε, α =0 γ = β, σ γ ε, α γ=γ où les composantes du gradent de la foncton de log-vrasemblance en β et σ ε correspondent à celles défnes pour le modèle Tobt smple (cf. proposton 1.8) lorsque α =0, c est à dre dans le cas homoscédastque. log L y,β, σ ε, α = 1 φ x β x + 1 N β α=0 : y =0 1 Φ x β σ (y x β) x = a x ε : y >0 =1 log L y, β, σ ε, α = 1 α=0 σ ε σ 3 ε : y =0 x βφ 1 Φ xβ x β N 1 σ + 1 ε σ 4 ε : y >0 (y x β) = N =1 b Sous ces hypothèses, un test naturel de l hypothèse d hétéroscédastcté consste donc à tester la nullté du vecteur α, pusque s α =0,onaσ ε, = σ ε =1,.., N. Ans sous les hypothèses précédentes, le test de l hypothèse nulle d homoscédastcté revent au test blatéral suvant : H 0 : α =0 (1.51) H a : α = 0 (1.5) Pluseurs méthodes sont envsageable pour mener à ben ce test sur les paramètres. Greene (1997) propose d utlser un test du multplcateur de Lagrange 5 (cf. chaptre 1). Defnton 1.15. La statstque LM du test de l hypothèse nulle d homoscédastcté H 0 : α =0est défne par : LM = log L y, β,, α α Q α log L y, β,, α α α (1.54) α=0 5 La statstque LM du multplcateur de Lagrange assocée au test undrectonnel H 0 : γ = a R k contre H 1 : γ = a admet la lo suvante sous H 0 : log L (y, γ) LM = γ I 1 log L (y, γ) L γ=γ c γ γ=γ c N χ (k) (1.53) où γet γ c désgnent respectvement les estmateurs non contrant et contrant de γ. α=0

Econométre des Varables Qualtatves. Cours C. Hurln 9 où β et désgnent les estmateurs du MV des paramètres β et σ ε obtenus sous l hypothèse nulle α =0, et où la matrce Q α α désgneleblocdedmenson(p, P) correspondant au vecteur de paramètre α de la matrce nverse de la matrce d nformaton de Fscher estmée sous H 0 : I β, σ ε, α (K+P +1,K+P +1) 1 α=0 = Q ββ (K,K) Q β σ ε (1,K) Q α β (P,K) Q βσ ε (K,1) Q σ ε (1,1) Q ασ ε (P,1) On montre alors que sous H 0 cette statstque converge en lo : Q β α (K,P ) Q α σ ε (1,P ) Q αα (P,P) (1.55) LM L N χ (P ) (1.56) où P rappelons-le désgne la dmenson du vecteur de varables explcatves w explquant la varance ndvudelle σ ε, (α). Ans, s la réalsaton de la statstque LM est supéreure au fractle de la lo du ch- à P degrés de lberté, alors on rejette l hypothèse nulle d homoscédastcté. Les résdus du modèle Tobt sont hétéroscédastques : les estmateurs du MV des paramètres β et σ ε sont asymptotquement basés selon les résultats d Arabmazar et Schmdt (1981). Quelle que sot la nature du modèle, l exste une autre façon de construre la statstque LM. Celle-c peut en effet s écrre en foncton de la matrce G β, σ ε, α de dmenson (N,K + P +1) contenant les dérvés de la log-vrasemblance évaluées pour chaque observaton sous l hypothèse H 0.Sot G β, σ ε, α le vecteur du gradent évalué sous H 0 : G β, σ ε, α (N,K+1+P ) α=0 = g 1 β, σ ε, α (1,K+P +1)... g N β, σ ε, α (1,K+P +1) (1.57) où les vecteurs g correspondent au gradent de la foncton de la log-vrasemblance évalués sous l hypothèse nulle α =0et pour chaque observaton ndvduelle y : g β, σ ε, α log L(y,β,σ =,α) ε log L(y,β,σ β,α) ε log L(y,β,σ σ ε,α) ε α (1,K+P +1) α=0 α=0 α=0 Greene (1997) montre que les vecteurs g (.) s écrvent sous la forme : g β, σ ε, α = a x b σ εb w (1,K) (1,1) (1,P ) (1,K+P +1) (1.58) où les scalares a et b sont défnes par les composantes du gradent assocé à la log-vrasemblance du modèle Tobt smple (cf. proposton 1.8) d une observaton donnée y, =1,..N. a = 1 (1 z ) λ σ x β ε b = 1 σ 3 (1 z ) x β λ ε x β + z (y x β) (1.59) z σ + z ε σ 4 (y x β) (1.60) ε

Econométre des Varables Qualtatves. Cours C. Hurln 30 avec λ (z) = φ (z) / [1 Φ (z)] = λ ( z) et où la quantté z correspond à la varable dchotomque smple suvante : 1 s y z = > 0 (1.61) 0 snon Naturellement un estmateur de ce vecteur du gradent de la log-vrasemblance sous H 0 : α =0peut être obtenu en remplaçant dans les expressons de a et de b les paramètres β et σ ε par leurs estmateurs du MV respectfs β et σ ε obtenus sous l hypothèse nulle α =0. g 1 β, σ ε, 0 (1,K+P +1) G β, σ ε, 0 =... = a 1x 1 b1 σ εb 1 w1... (N,K+1+P ) α=0 g N β, σ ε, 0 a N x N b N σ εb N wn (1,K+P +1) Reste alors à construre la matrce d nformaton de Fscher. Greene (1997) montre que sous H 0 l nverse de la matrce d nformaton de Fscher peut s écrre sous la forme : I β, σ ε, α 1 = G β, σ ε, 0 G β, σ ε, 0 (K+P +1,K+P +1) α=0 (K+P +1,N) (N,K+P +1) N = a x x a b x σ εa b x w a b x b σ ε b w (1.6) =1 σ εa b w x σ εb w σ εb w w Un estmateur de la matrce d nformaton de Fscher est alors donné par : 1 I β, σ N a ε, α x x a b x σ εa b x w = a b x b σ εb w α=0 =1 σ εa b w x σ εb w σ εb w w A partr de ces dfférents éléments on peut alors construre la statstque LM de la façon suvante : Defnton 1.16. Une autre expresson de la statstque LM du test de l hypothèse nulle d homoscédastcté H 0 : α =0est : LM (1,1) = e N (1,N) G β, σ ε, 0 (N,K+P +1) G β, σ ε, 0 (K+P +1,N) G β, σ ε, 0 (N,K+P +1) 1 G β, σ ε, 0 (K+P +1,N) e N (N,1) (1.63) où e N désgne un vecteur untare de dmenson (N,1) et où β et désgnent les estmateurs du MV des paramètres β et σ ε obtenus sous l hypothèse nulle α =0. On peut montrer que cette expresson de la statstque LM est dentque à celle proposée dans la défnton (1.15). La lo asymptotque et la règle de décson sont évdemment les mêmes que celles évoquées précédemment. Il exste enfn une trosème façon d obtenr la statstque LM :

Econométre des Varables Qualtatves. Cours C. Hurln 31 Defnton 1.17. Une autre expresson de la statstque LM du test de l hypothèse nulle d homoscédastcté H 0 : α =0est : LM = NR (1.64) où N désgnelenombred observatonsetoùr est le coeffcent de détermnaton de la régresson du vecteur untare e N =(1,...1) de dmenson (N,1) sur les K +P +1 colonnes de la matrce G β, σ ε, 0. En effet, une fos que l on a construt la matrce G β, σ ε, 0, on peut montrer que le coeffcent de détermnaton de la régresson de e N sur les colonnes G 1,G,.., G K+P +1 de cette matrce fournt au coeffcent N près la valeur de la statstque LM. S l on pose y = e N et X = G (.), on sat que le coeffcent de la régresson lnéare de y sur les colonnes de X est donné par la formule : R = 1 y X (X X) 1 X y N où N désgne le nombre d observaton. scalare N près. On reconnaît c la forme de la statstque LM au ***** **************************************************** 1 ) Smulaton : smuler bas à dstance fneavechétéroàlahurd. ) Applcaton : Construre un test sous LIMDEP et applcaton ***** **************************************************** 1.6.. Non normalté Lasecondeprncpalehypothèsequpeutaffecter de façon sensble les proprétés de l estmateur du MV est l hypothèse de non normalté des perturbatons. Alors quelles sont le proprétés de l estmateur du MV sous cette hypothèse de non normalté? Nous admettrons le résultat suvant : Proposton 1.18. De façon générale, on montre que l estmateur du MV n est pas convergent lorsque la vrae dstrbuton des perturbatons ε n est pas normale. Goldberger (1980) a en effet démontré dans le cas d un modèle Tobt smple tronqué, l exstence de bas asymptotque de l estmateur du MV lorsque la vrae dstrbuton des ε est une lo de Student, de Laplace ou une lo logstque. Pour démontrer ce résultat, Goldberger supposat que la varance des perturbatons état toutefos connue. Arabmazar et Schmdt (198) ont quant à eux montré que les bas étaent partculèrement accrus lorsque l on levat cette hypothèse et que l on supposat la varance des perturbatons étaent nconnues. Intutvement on conçot qu une erreur sur la dstrbuton des perturbatons et donc sur la forme de vrasemblance, peut condure à l apparton d un bas dans les estmateurs du MV. ******************************************************************** Effectuer Smulaton Tobt Smple avec lo Student, de Laplace ou lo logstque Estmaton MV foncton de la censure et de N ********************************************************************

Econométre des Varables Qualtatves. Cours C. Hurln 3 Partant du résultat que l applcaton de la procédure du MV à des perturbatons de lo non normale condut à un bas asymptotque, l convent donc de proposer un test permettant de repérer les cas où les perturbatons du modèle sont dstrbuées selon une lo non normale. Deux prncpales stratége de test sont proposés pour détecter la non normalté des perturbatons dans un modèle censuré ou tronqué : 1. Une stratége de test à la Hausman (1978) : Nelson (1981), Melenberg et Van Soest (1996). Un test de spécfcaton à la Hansen (198) : Pagan et Vella (1989) Nous n évoquerons c que le premer type de test. Pour les tests de spécfcaton reposant sur les condtons sur les moments vor Pagan et Vella (1989). Consdérons la démarche retenue par Melenberg et Van Soest (1996) fondée sur un test d Hausman (1978) avec esstamteur LAD de Powell (1984). Commençons par défnr de façon général le prncpe d un test de Hausman (1978). Ce test admet pour hypothèse nulle la normalté des résdus ε. Sot β l estmateur du MV du vecteur des paramètres β. Onsatquecetestmateurest() convergent,() asymptotquement effcace et () asymptotquement basé sous l hypothèse alternatve H 1 de non normalté des perturbatons.. Consdérons un second estmateur, noté β, du vecteur des paramètres β. On chost cet estmateur de sorte à ce qu l sot () monseffcace que l estmateur du MV sous H 0 mas () qu l sot convergent sous H 0 et sous l hypothèse alternatve H 1. Il ne reste plus alors qu à étuder la dstance entre les deux estmateurs β et β.eneffet : S les deux estmateurs sont proches : cela sgnfe que les deux estmateurs sont non basés : l hypothèse H 0 est acceptée S les deux estmateurs sont suffsamment élognés : cela sgnfe que l estmateur γ est basé : l hypothèse H 0 est rejetée. Reste alors à construre une mesure de la dstance entre les deux estmateurs. Hausman dans son artcle de 1978 montre que de façon générale, sous ces hypothèses, la quantté défne converge une lo du Ch deux admettant pour degré de lberté le nombre de paramètre estmés sous l hypothèse H 0. où V = V H N = β β V 1 β β L N χ (K) (1.65) β V β désgne la dfférence entre les matrces de varance covarances asymptotques des deux estmateurs obtenues sous H 0. Ce qu est remarquable c est que sous H 0, l n est pas nécessare de connaître les termes de covarances des deux estmateurs pour construre la statstque de test. Proposton 1.19. Sot β l estmateur du MV du vecteur des paramètres β. Sot β un estmateur convergent sous l hypothèse de non des perturbatons ε. Un test de l hypothèse nulle de normalté peut être réalsé à partr de la statstque du test de Hausman (1978) : H N = 1 β β V β V β β β (1.66)

Econométre des Varables Qualtatves. Cours C. Hurln 33 où V β et V β désgnent les matrces de varance covarances asymptotques des estmateurs sous H 0. Sous l hypothèse nulle de normalté : L H N N χ (K) (1.67) Ans, s la réalsaton de la statstque H N est supéreur au fractle à α% de la lo du Chdeux, la dstance entre les deux estmateurs est grande : on rejette l hypothèse nulle H 0 de normalté. L estmateur du MV est alors asymptotquement basé. Pour construre ce test, reste à défnr un estmateur convergent du vecteur de paramètres β sous l hypothèse de non normalté. Il y a là auss deux optques : 1. Sot on spécfe la dstrbuton non normale des perturbatons et l on construt un estmateur du maxmum de vrasemblance : Amemya et Boskn (1974) utlsent ans un estmateur du MV avec une dstrbuton log-normale. Sot on construt un estmateur convergent pour des formes très générales de dstrbutons des perturbatons à la fos normale et non normale : Powell (1984), Melenberg et Van Soest (1996). La premère approche est à la fos rsquée et relatvement complquée à mettre en oeuvre. Elle peut apparaître complquée dans la mesure où pour certanes formes de dstrbutons, l peut être délcat de construre la foncton de vrasemblance. De plus, ren ne garantt alors la concavté globale de cette foncton, ce qu peut poser des problèmes d optmsaton numérque. Mas elle de plus rsquée dans la mesure où l on rejette a pror la dstrbuton normale pour spécfer une forme alternatve de dstrbuton : log-normale, Student, Laplace etc.. Or, ren ne garantt que les perturbatons soent effectvement engendrées par cette dstrbuton. Une erreur sur la forme de la dstrbuton peut alors condure à une évaluaton basée des paramètres. C est pourquo, dans la lttérature on prvlége généralement la seconde approche : l approche non paramétrque ou sem-paramétrque. Melenberg et Van Soest (1996) proposent d utlser l estamteur LAD. L estmateur de Powell (1984) ou estmateur des Mondres Valeurs Absolues (LAD Least Absolute Devatons) est un exemple d estmateur non paramétrque convergent sous l hypothèse de non normalté. Defnton 1.0. L estmateur des Mondres Valeurs Absolues (LAD Least Absolute Devatons) de Powell (1984) des paramètres β du modèle Tobt smple est défn par : N β P =arg mn y max (0,x β) (1.68) {β} =1 Powell montre que cet estmateur est asymptotquement normal : N βp L β N 0,V βp (1.69) N oùlamatrcedevarancecovaranceasymptotqueestdonnéepar: V βp =4f (0) 1 lm x x (1.70) N N (K,K) :x β>0

Econométre des Varables Qualtatves. Cours C. Hurln 34 où f (.) désgne la foncton de densté des perturbatons. Paarsch (1984) a proposé dfférentes smulatons de Monte Carlo de cet estmateur, de l estmateur en deux étapes d Heckman et de l estmateur du MV obtenu sous l hypothèse de normalté pour des modèles Tobt avec des dstrbutons normal, exponentelle et de Cauchy. Sur de larges échantllons, l estmateur de Powell est toujours melleur (au sens du bas moyen) que l estmateur d Heckman et est melleur que l estmateur du MV dans le cas de dstrbuton de Cauchy. Powell (1984) note en outre que l estmateur β P est convergent y comprs sous l hypothèse d hétéroscédastcté. Ans, en utlsant la défnton précédente du test d Hausman et la défnton de l estmateur LAD on peut construre asément un test partculer de l hypothèse de non normalté fondé sur l estmateur de Powell. S l on note β l estmateur du MV obtenu sous l hypothèse de normalté et β P l estmateur de Powell, la statstque du test d Hausman devent : 1 H N = β βp V β V βp β βp (1.71) où V β et V βp désgnent les matrces de varance covarances asymptotques des estmateurs sous H 0 : V βp =4f (0) 1 lm x x (1.7) N N :x β>0 V β = I (β) 1 (1.73) avec log L (β, β) I (β) = E β β (1.74) Naturellement s le test condut à rejeter l hypothèse nulle de normalté, l convent de prvléger un estmateur convergent sous l hypothèse de non normalté : l estmateur LAD de Powell en est un, mas l exste de nombreux autres estmateur non paramétrques applcables dans ce cas. ******* *************************** Applcaton Evews ou Lmdep ou Matlab ******* ***************************

Econométre des Varables Qualtatves. Cours C. Hurln 35 1.7. Extensons du modèle Tobt Smple : modèles à censure multples Dfférentes extensons du modèle Tobt smple ont été proposées sans pour autant remettre en cause sa structure générale : une varable dépendante correspondant à une varable latente observée sur un certan ntervalle. Ces extensons portent fnalement sur la défnton de l ntervalle sur lequel est observé la varable latente y. En effet dans certanes applcatons, la varable dépendante peut être censurée à la fos à drote et à gauche. C est par exemple le cas sur un marché de cotaton où l exsterat une lmte nféreure et supéreure aux cours, auxquels cas la valeur du cours est fxée sot à un cours plancher sot à un cours plafond. On parle alors de modèle Tobt à censures multples. Lorsque les seuls de censure sont dentques à tous les ndvdus, on parle alors de modèle Tobt à double censures. Naturellement le modèle à double censure est un cas partculer du modèle à censures multples, c est pourquo nous débuterons notre analyse par ce derner. 1.7.1. Modèle Tobt smple à censures multples Le modèle Tobt smple à censures multples s écrt sous la forme suvante : Defnton 1.1. Un modèle Tobt smple à censures multples est défn par : c,1 s y y = y c,1 s c,1 <y c, (1.75) c, s y c, où (c,1,c, ) R désgne les bornes de censure et où : y = x β + ε =1,..N (1.76) où x = x 1..xK, =1,.., N désgne un vecteur de caractérstques observables et où β =(β 1...β K ) R K est un vecteur de paramètres nconnus et où les perturbatons ε sont dstrbués selon une lo N 0, σε. Consdérons un échantllon de N observatons y,notéy =(y 1,.., y N ). La la foncton de vrasemblance d un modèle à censures multples s écrt sous la forme : = L y, β, σ ε,c 1,1,c 1,,..., c N,1,c N, c,1 x β c, x β 1 Φ : y =c,1 Φ : y =c, : y =y 1 φ y x β (1.77) Le premer terme désgne le produt des probabltés que les observatons y prennent les valeurs de censures nféreures c,1 : Prob(y = c,1 )=Prob(y c,1 x β c,1 )=Φ Le second terme désgne le produt des probabltés que les observatons y prennent les valeurs de censures supéreures c, : Prob(y = c, )=Prob(y c, x β c, )=Φ

Econométre des Varables Qualtatves. Cours C. Hurln 36 Enfn, le trosème terme représente tout smplement le produt des los margnales des varables y lorsque ces dernères appartennent à l ntervalle comprs entre les deux bornes de censure. On sat que s c,1 <y c,, on a part défnton y = y = x β + ε où les perturbatons ε sont dstrbués selon une lo N 0, σε. On en dédut que les varables y sont alors dstrbuées selon une lo normale N x β, σε. Ans, la lo margnale d une observaton y sur cet ntervalle est défne par la quantté : 1 π exp 1 y x β 1 = φ y x β où φ (.) désgne la foncton de densté assocée à lo normale centrée rédute. On peut en dédure la log-vrasemblance dans un modèle à censures multples : Defnton 1.. La log-vrasemblance concentrée assocée à un échantllon y = (y 1,.., y N ) dans un modèle Tobt smple à censures multples s écrt : log L y, β, σ ε,c 1,1,c 1,,..., c N,1,c N, = : y =c,1 log Φ c,1 x β N 1 log σ 1 ε σ ε : y =y log : y =c, + c, x β 1 Φ (y x β) (1.78) où N 1 désgne le nombre d observatons pour lesquelles y = y. Il est souvent utle dans ces modèles de détermner les espérances condtonnelles de la varable dépendante lmtée et de la varable non censurée, notamment pour calculer les effets margnaux. On pose =1,..N : c,1 x β c,1 x β Φ 1, = Φ Φ, = Φ Dès lors, on montre (Alban 000) que l espérance de la varable dépendante lmtée est : E (y /x,c,1 <y c φ1, φ,,) =x β + (1.79) Φ, Φ 1, En effet dans le cas du modèle Tobt smple on a unquement une censure à gauche, ce qu se tradut par des seuls de censure égaux à c 1, =0et c, =+. On obtent alors : x β φ 1, = φ φ σ, = lm φ c,1 x β =0 ε c, x β Φ 1, = Φ Φ, = lm σ Φ c,1 x β =1 ε c, Ans, on montre que l espérance condtonnelle se ramène à l expresson suvante dans le cas du modèle Tobt smple : φ1, E (y /x,c,1 <y c, ) = x β + 1 Φ 1, φ (x β/ ) = x β + Φ (x β/ ) x β = x β + λ

Econométre des Varables Qualtatves. Cours C. Hurln 37 On retouve ans l expresson standard d une espérance condtonnelle d une lo normale censurée. Revenons au cas général, c est à dre au cas du modèle Tobt à censurs multples. L espérance de la varable dépendante non censurée est alors : E (y /x ) = Prob(y = c,1 ) c,1 + Prob(y = c, ) c, On obtent alors la formule suvante : +Prob(c,1 <y c, ) E (y /x,c,1 <y c, ) E (y /x ) = Φ 1, c,1 +(1 Φ, ) c, + x β (Φ, Φ 1, ) + φ1, φ, (1.80) 1.7.. Modèle Tobt smple à double censure : Rosett et Nelson (1975) Comme nous l avons dt précédemment le modèle Tobt smple à double censure est un cas partculer du modèle Tobt smple à censures multples. C est un modèle dans lequel on suppose que les seuls de censure à drote et gauche sont dentques pour tous les ndvdus. c,1 = c 1 c, = c =1,..N (1.81) Defnton 1.3. Un modèle Tobt smple à double censure (modèle de frcton ou de Rosett) est un modèle où les seuls de censures à gauche et à drote sont dentques pour tous les ndvdus. où (c 1,c ) R. y = c 1 y c s y c 1 s c 1 <y c s y c (1.8) Ce modèle est auss parfos appelé modèle de Rosett ou modèle de frcton du fat de l applcaton proposée par cet auteur. C est en effet Rosett et Nelson (1975) qu ont proposé la premère modélsaton Tobt smple à double censure. La log-vrasemblance concentrée assocée à un échantllon y =(y 1,.., y N ) dans un modèle Tobt smple à double censure s écrt : log L y, β, σ ε,c 1,c = : y =c 1 log Φ c1 x β N 1 log σ 1 ε σ ε + : y =y log : y =c où N 1 désgne le nombre d observatons pour lesquelles y = y. c x β 1 Φ (y x β) (1.83) Ce modèle est utlsé dans des applcatons où la varable dépendante ne répond qu à de fortes varatons (ou de fortes valeurs) des varables explcatves. Nous allons à présent évoquer deux exemples de modèle Tobt smples à double censure : 1. Modèle de dstrbutons de dvdendes : Maddala (1977). Modèle d nvestssement fnancer avec coût de transacton : Rosett (1959) Commençons par le modèle de Maddala (1977).

Econométre des Varables Qualtatves. Cours C. Hurln 38 Poltque de Dvdendes : Maddala (1977) Maddala (1977) remarque que le modèle Tobt smple à double censure ou modèle de frcton est partculèrement adapté pour modélser la poltque de dvdendes des entreprses, les varatons des salares offerts par les frmes ou tout autre décsons pour lesquelles les frmes répondent par saut après un certan effort cumulatf. Consdérons une socété par acton qu dstrbue des dvdendes à ses actonnares. Sot yt le montant désré de dvdende qu dépend d un ensembledecaractérstquesdel entreprse: montant des bénéfces, décsons d autofnancement, montant des nvestssements etc..on pose que ces caractérstques peuvent être représentées par un vecteur x t et qu elles sont lées au dvdende potentel par une relaton du type yt = x t β + ε t où ε t est dstrbué selon une lo N 0, σε. S l on suppose que le mécansme de dstrbuton des dvdendes est coûteux, on suppose que l entreprse lmte leur dstrbuton dans le temps (au plus une fos par an) mas auss suvant leur montant : L entreprse ne verse des dvdendes que s le montant potentel de ces dvdendes est supéreur à un certan seul c 1 L entreprse lmte le montant de ces dvdendes à un nveau c afn de mantenr une marge de manoeuvre fnancère. Dès lors, s l on note y t le montant des dvdendes effectvement versés on a : 0 s y y t = yt t c 1 s c 1 <yt c c s yt c Investssements fnancers et coûts de transacton : Rosett (1959) Rosett (1959) avat déjà proposé une applcaton dans laquelle apparassat une verson partculère du modèle Tobt smple à double censure. Ce n est qu en 1975 que Rosett et Nelson donneront la forme généraledumodèle,masc estpourquolenomdemodèlederosettoumodèledefrctonest généralement attrbué à ce modèle. Dans son applcaton Rosett(1959) consdère un modèle d nvestssement dans des actfs fnancers où les coûts de transacton peuvent lmter le volume des transactons par rapport au nveau désré. Le modèle suppose que les modfcatons dans la poston de l nvestsseur, c est à dre la décson d achat ou de vente, dépend des varatons du rendement. Sot yt la varaton désrée de la poston du ttre (montant acheté ou vendu), y t la varaton de la poston effectve et x t la varaton du rendement du ttre. L nvestsseur n effectuera une transacton que s les varatons du rendement sont suffsamment mportantes. La poston réelle du ttre ne change donc pas pour de pettes varatons à la hausse ou à la basse du rendement et donc de la poston désrée. Supposons que la poston désrée sot lée à la varaton du rendement par la relaton yt = x t β + ε t où ε t est dstrbué selon une lo N 0, σε. Le modèle est alors défn par : yt c 1 y t = 0 yt c s y t c 1 s c 1 <y t c s y t c où c 1 est le nveau de basse de la poston désré déclenchant la vente et c > 0 le nveau déclenchant l achat.

Econométre des Varables Qualtatves. Cours C. Hurln 39 1.7.3. Applcaton modèle à double censure *************************** Applcaton Evews ou Lmdep ***************************

Econométre des Varables Qualtatves. Cours C. Hurln 40. Les Modèles Tobt Généralsés Nous allons à présent envsager des modèles Tobt ncluant au mons deux varables y 1 et y. Cette classe de modèle s appelle la classe des modèles Tobt généralsés. Comme nous l avons dt en ntroducton, Amemya (1983) propose de classer les dfférents modèle Tobt généralsés en 5 prncpales classes. Le modèle Tobt smple étant par conventon défn comme le modèle Tobt de type I. L auteur propose la classfcaton suvante en foncton de la forme de lavrasemeblanceetdesproprétésdesvarablesntrodutesdanslemodèle: Tableau.1: Fonctons de Vrasemblance des Modèles Tobt Généralsés Modèle FormedelaVrasemblance y 1 y y 3 Tobt Type I P (y 1 < 0) P (y 1 ) C Tobt Type II P (y 1 < 0) P (y 1 > 0,y ) D C Tobt Type III P (y 1 < 0) P (y 1,y ) C C Tobt Type IV P (y 1 < 0,y 3 ) P (y 1,y ) C C C Tobt Type V P (y 1 < 0,y 3 ) P (y 1 > 0,y ) D C C Source : Amemya (1983), Tables 1 et, page 30, D : varable dchotomque, C : censurée Ans dans le cas du modèle standard, la notaton P (y 1 < 0) P (y 1 ) d Amemya désgne une foncton de vrasemblance de la forme y =0 P y 1, 0. y >0 f (y 1,) où f (y 1, ) désgne la densté margnale de la varable y 1, dstrbuée selon une lo N x β, σ ε. Les notatons pour les autres modèles sont smlares, sachant que P (y 1,y ) désgne la densté jonte des varables y 1 et y. L autre façon de dstnguer les dfférents modèles Tobt consste à dstnguer les proprétés des varables du système en dfférentant les varables dchotomques D et les varables censurées C. Eneffet dans ces modèles on a deux types de modélsaton de la varable y 1 : 1. Sot le sgne de la varable y 1 (par exemple dans le Tobt II) condtonne la modélsaton (la censure ou la troncaton) d une autre varable : on a alors une modélsaton dchotomque D sur cette varable.. Sot la varable y 1 joue un double rôle : son sgne détermne le modèle (la censure ou la troncaton) d une autre varable mas elle est en outre elle même une varable censurée. Nous allons dans un premer temps nous ntéresser au modèle Tobt généralsé de type II qu est très souvent utlsé et dont la structure est très smlare à celle des modèles de selecton (ou modèles à troncature auxlare) popularsés par Heckman et Gronau. Enfn, nous étuderons plus succntement les autres modèles Tobt généralsés recencés par Amemya (1983).

Econométre des Varables Qualtatves. Cours C. Hurln 41.1. Modèle Tobt Généralsé Type Reprenons l exemple des dépenses de consommaton en bens durables. Dans le modèle Tobt smple (ou modèle Tobt de type I), nous avons supposé que le consommateur décde smultanément () du fat qu l va ou non consommer et () du montant de revenu qu l va affecter à cette consommaton. Un modèle alternatf conssterat à supposer un comportement séquentel. Dans une premère étape l ndvdu décde ou non de consommer : cette décson peut être représentée par un modèle qualttatf dchotomque basée sur un certan crtère y1,. s y 1, > 0 l ndvdu décde de consommer s y1, 0 l ndvdu décde de ne pas consommer Dans une seocnde étape, s l a décdé de consommer, l ndvdu décde du montant qu l va consacrer à l achat du ben. On a alors un modèle de données censurées pusque, s l on note y, la consommaton effectve de l agent, celle-c est défne par =1,..N : y, = y, 0 s y 1, > 0 s y 1, 0 (.1) Cette formulaton généralse le modèle Tobt smple dans la mesure om l on retouve le modèle Tobt smple en posant y1,, = y,. L avantage de cette modélsaton est qu elle permet notamment de fare apparaître la plus ou mons forte corrélaton pouvant exster entre les deux décsons () décson de consommaton () décson du montant consommé. On a ben un modèletobtgénéralsédetypeiipusque seul le sgne de la varable y1, représenté par la varable dchotomque y 1, = I y1, > 0 mporte (y 1, est une varable D) tands que la varable y est censurée (y, est une varable C)..1.1. Défnton du Tobt généralsé de type II Ans, un modèle Tobt généralsé de type II est défne de la façon suvante : Defnton.1. Un modèle Tobt généralsé de type II est défn par =1,..N : y, = y, 0 s y 1, > 0 s y 1, 0 (.) y 1, = x 1, β 1 + ε 1, (.3) y, = x, β + ε, (.4) où x j, = x 1 j,..xk j j, avec j = 1, désgnent deux vecteurs de caractérstques observables, où les vecteurs β j = β j,1...β j,kj R Kj,j = 1, sont des vecteurs de paramètres nconnus et où les perturbatons ε j, sont dstrbués selon une lo N 0, σj, j =1, avec E (ε1, ε, )=σ 1, =1,..N. Ans, seul le sgne de la varable y1, estobservableetlavarabley, est observable unquement lorsque y1, > 0. On suppose que les varables x 1, sont observables pour tous les ndvdus de l échantllon, tands qu l n est pas nécessare que les varables x, soent observables pour

Econométre des Varables Qualtatves. Cours C. Hurln 4 les ndvdus pour lesquels y1, 0. Par la sute, on supposera tout de même que ces caractérstques sont observables pour tous les ndvdus, ce qu confère un statut de varable censurée à la varable y,. Enfn, pour smplfer les notatons, on ntrodut la varable dchotomque z 1, telle que : 1 s y1, z 1, = > 0 0 s y1, 0 (.5) En d autres termes, les couples de varables (z 1,,y, ) consttuent les varables dépendantes observées du système. Il convent en outre de noter la proprété suvante : Remark 4. Contrarement au cas du modèle Tobt smple, dans un modèle Tobt généralsé de type II, la varable dépendante y, peut prendre des valeurs négatves. Une telle proprété peut dans certans problèmes économques être génante, c est pourquo Cragg (1971) a proposé des modèles qu assure la non-négatvté de y,..1.. Estmaton par Maxmum de Vrasemblance Naturellement, tout comme dans le cas du modèle Tobt smple, les paramètres du modèle Tobt généralsé peuvent être estmés par maxmum de Vrasemblance (MV). Commençons par défnr la vrasemblance dans un tel modèle. D après la forme générque donnée par Amemya (1983), pour le modèle de type II, on a une vrasemblance de la forme P (y 1 < 0) P (y 1 > 0,y ). On pose θ = β 1, β, σ 1, σ, σ 1 l ensemble des paramètres du modèle. Formellement, s l on consdère un échantllon y =(y,1,..,y,n ) et un ensemble d observatons z 1 =(z 1,1,.., z 1,N ), la vrasemblance s écrt sous la forme : L (y,z,θ) = Prob y1, 0 f y, y 1, > 0 Prob y1, > 0 (.6) : y, =0 : y, =y, où f y, y 1, > 0 désgne la densté condtonnelle de y, sachant y1, > 0. Réécrvons la seconde parte de cette foncton. On note f y1 (.) la foncton de densté margnale assocée à y1,, l vent : Prob y1, > 0 = f y1 (z) dz Dès lors, on peut érécrre le second membre de la foncton de vrasemblance sous la forme d une ntégrale smple défne sur la foncton de densté jonte des varables y 1, et y,, notée f y1,y (.,.). Eneffet, en omettant les ndces pour smplfer les notatons, l vent : 0 f (y / y 1 > 0) Prob(y 1 > 0) = = = 0 0 0 f (y / z) f y1 (z) dz f y1,y (y,z) dz (.7) f y1,y (y,y 1) dy 1 (.8) Car en effet, on a par défnton f (y / z) f y1 (z) =f y1,y (y,z). Toute l astuce consste alors à réécrre la densté jonte f y1,y (y,y 1) en foncton de la densté condtonnelle de y 1 par rapport à y. En effet, on peut écrre cette quantté sous la forme suvante : f y1,y (y,y 1)=f (y 1/ y ) f y (y )

Econométre des Varables Qualtatves. Cours C. Hurln 43 où f y (.) la densté margnale de la varable y. On obtent ans l expresson suvante : f (y / y1 > 0) Prob(y 1 > 0) = f (y1 / y ) f y (y ) dy1 0 = f y (y ) 0 f (y 1/ y ) dy 1 (.9) Quel est l avantage de cette expresson? Cette expresson fat apparaître la densté condtonnelle de y 1 sachant que y = y,notéef (y 1/ y ), qu l est relatvement facle de calculer. On utlse pour cela le résultat suvant : Proposton.. Sot (y 1,y ) un couple de v.a.r. dstrbuées selon des los normales respectves N µ 1, σ1 et N µ, σ, telles que E (y1 y )=σ 1, la lo condtonnelle de y 1 sachant que y = y, est une lo normale d espérance E (y 1 / y = y ) avec et de varance V (y 1 / y = y ) avec : E (y 1 / y = y )=µ 1 + σ 1 σ (y µ ) (.10) V (y 1 / y = y )=σ 1 σ 1 σ (.11) Ans, dans le cadre du modèle Tobt, la lo condtonnelle de y 1 sachant que y = y, est une lo normale d espérance E (y 1/ y = y ) et de varance V (y 1/ y = y ) avec E (y 1/ y = y )=x 1 β 1 + σ 1 σ (y x β ) (.1) V (y1/ y = y )=σ 1 σ 1 σ On en dédut la relaton suvante : (.13) 0 0 f (y1/ y ) dy1 = 1 f (y1/ y ) dy1 0 E (y = 1 Φ 1/ y = y ) V (y 1 / y = y ) E (y1 = Φ / y = y ) V (y 1 / y = y ) On en dédut fnallement que : f (y1/ y ) dy1 x1 β = Φ 1 + σ 1 /σ (y x β ) 0 σ 1 (σ 1 /σ ) (.14) où Φ (.) désgne la foncton de répartton de la lo N (0, 1). Sachant que y sut une lo N x β, σ, on montre alors que : f y (y ) 0 f (y1 / y ) dy 1 = 1 y x β φ x1 β Φ 1 + σ 1 /σ (y x β ) σ σ σ 1 (σ 1 /σ )

Econométre des Varables Qualtatves. Cours C. Hurln 44 Sachant que f (y / y1 > 0) Prob(y 1 > 0) = f (y 0 1 / y ) f y (y ) dy, on montre donc fnallement que : f (y / y1 > 0) Prob(y1 > 0) = 1 y x β φ x1 β Φ 1 + σ 1 /σ (y x β ) σ σ σ 1 (σ 1 /σ ) Il est alors mmédat d écrre la vrasemblance du modèle Tobt généralsé à partr de l équaton (.6). Defnton.3. La vrasemblance assocée à un échantllon y =(y,1,..,y,n ) et un ensemble d observatons z 1 =(z 1,1,.., z 1,N ) dans un modèle Tobt généralsé de type II de paramètres θ = β 1, β, σ 1, σ, σ 1 s écrt : L (y,z,θ) = :y,=0 x1, β 1 Φ 1 :y,=y, σ 1 1 y x β φ x1 β Φ 1 + σ 1 /σ (y x β ) σ σ σ 1 (σ 1 /σ ) (.15) Onconstatequecettefonctondevrasemblancenedépenddeσ 1 que par l ntermédare du rato β 1 /σ 1 : l y a donc un problème d dentfablté. Seules sont dentfables les fonctons de σ 1, σ, β et β 1 /σ 1. On peut donc sans perte de généralté poser σ 1 =1ce qu permet d dentfer le reste des paramètres. Dans le cas où β 1 et β comportent des éléments en commun, le paramètre σ 1 est de nouveau dentfable. De la même façon que pour le modèle tobt smple, la foncton de vrasemblance assocée à un modèle tobt généralsée n est pas globalement concave. C est pourquo, l est souvent ntéressant d utlser la re-parmétrsaton d Olsen : h = 1 θ 1 = β 1 θ = β (.16) σ σ 1 σ S l on note ρ la corrélaton entre les deux perturbatons telle que : alors on montre le résultat suvant. σ 1 = ρσ 1 σ (.17) Proposton.4. Pour un nveau de corrélaton ρ des chocs donnés, la log-vrasemblance d un modèle tobt généralsé re-paramétré en h = σ 1, θ 1 = β 1 /σ 1 et θ = β /σ est globalement concave : log L (y,z,h, θ 1, θ, ρ) = log [1 Φ (x 1, θ 1 )] + N 1 log (h ) :y, =0 + log (h y x θ ) :y, =y, + :y, =y, log Φ x 1 θ 1 + ρ (h y x θ ) 1 ρ

Econométre des Varables Qualtatves. Cours C. Hurln 45 Ans l peut être ntéressant de modfer la méthode du maxmum de vrasemblance pour tenr compte de la concavté partelle de la log-vrasemblance en h, θ 1 et θ à ρ fxé. On peut par exemple fare un balayage sur ρ et maxmser pour chauqe valeur de ρ retenue la vrasemblance par rapport à h, θ 1 et θ. Il n y a alors aucun problème de chox dans les condtons ntales en rason de la proprété de concavté. Pus dans un second temps, on retent la valeur de ρ qu maxmse la valeur de la vrasemblance et l on en dédut les estmateurs correspondant des autres paramètres..1.3. Estmaton en deux étapes : Heckman (1976) Généralement les paramètres des modèles Tobt généralsés sont estmés par MV.Toutefos,l peut être utle de recourr à d autres méthodes d estmaton smples, qu même s elles ne sont pas effcaces, permettent d avor une premère dée de l échelle de grandeur des paramètres et qu peuvent en outre servr dans les phases de détermnaton des condtons ntales dans les algorthmes d optmsaton numérque de la vrasemblance. Parm ces méthodes d estmaton smples, on retrouve ben évdemment la méthode d estmaton en deux étapes proprosée par Heckman (1976) et présentée précédemment dans le cas du modèle Tobt smple. On consdère le modèle suvant : y, = y, 0 s y 1, > 0 s y 1, 0 (.18) y1, = x 1, β 1 + ε 1, (.19) y, = x, β + ε, (.0) où les perturbatons ε j, sont dstrbués selon une lo N 0, σj, j =1, avec E (ε1, ε, )= σ 1, = 1,..N. Pour construre l estmateur en deux étapes d Heckman, on cherche tout d abord à construre l espérance condtonnelle E y, y 1, > 0. Pour cela, consdérons l - expresson de y, et exprmons là en foncton de la projectoon lnére des résdus ε, sur les résdus ε 1,. Compte tenu des hypothèses fates sur les pertubatons, on a par hypothèse ε, = σ 1 σ 1 ε1, +µ, où µ, est ndépendant de ε 1, et normallement dstrbué de moyenne nullededevaranceégaleàσ σ 1 σ 1 1. Ans, on obtent : y, = x, β + ε, = x, β + σ 1 σ 1 y 1, x 1, β 1 + µ, On en dédut alors l expresson E y, y 1, > 0 en foncton de celle de E y1, y 1, > 0 que l on avat déjà construt dans le chaptre précédent. En effet, sachant : on montre que : E y, avec µ, = ε, σ 1 σ 1 ε1,. E y 1, y 1, > 0 = x 1, β 1 + σ 1 λ (x 1, θ 1 ) y 1, > 0 = x, β + σ 1 σ 1 E y, y 1, > 0 x 1, β 1 + µ, = x, β + σ 1 σ 1 1 λ (x 1,θ 1 )+µ, Ans, pour les observatons y, postves, on montre que l on a un modèle décrt par la relaton non lnéare suvante. y, = E y, y 1, > 0 + v

Econométre des Varables Qualtatves. Cours C. Hurln 46 avec v = y, E y, y 1, > 0 ou encore : y, = x, β + σ 1 σ 1 1 λ (x 1,θ 1 )+µ, (.1) où les perturbatons µ, vérfent µ, = µ, + v = ε, σ 1 σ 1 ε1, + y, E y, y 1, > 0 (.) On obtent ans la proposton suvante. Proposton.5. Le modèle Tobt généralsé de type II, pour les observatons y, > 0, peut être représenté par la relaton non lnéare hétéroscédastque suvante : y, = x, β + σ 1 σ 1 1 λ (x 1,θ 1 )+µ, (.3) avec θ 1 = β 1 /σ 1 et où les perturbatons µ, vérfent E µ, =0et : Var µ, = σ σ 1 σ 1 x 1, θ 1 λ (x 1, θ 1 )+λ (x 1, θ 1 ) (.4) Dans le cas du modèle Tobt généralsé de type II, la méthode d estmaton d Heckman, dte auss méthode d estmaton en deux étapes, en comporte en fat tros. Etape 1 : On commence par estmer le rato θ 1 = β 1 /σ 1 en utlsant la parte dchotomque du modèle, c est à dre en modélsant la probablté d obtenr une valeur y1, postve. 1 s y1, z 1, = > 0 0 s y1, 0 y1, N x 1 β 1, σ 1 (.5) Pour cela, on consdère le modèle probt dchotmque suvant : Prob(z,1 =1)=Prob y 1, > 0 = Φ (x 1 θ 1 ) (.6) Sot θ 1 un estmateur convergent de θ 1 obtenuàpartrdecemodèleprobt. Etape : A partr de l estmateur θ 1 on constut le rato de Mll λ x 1, θ1 pour chaque observaton x 1,. Sot λ x 1, θ1 l estmateur ans obtenu. On effectue alors la régresson lnéare suvante par la méthode des MCO : y, = x,β +ˆσ λ x 1, θ1 + µ, (.7) et l on obtent alors un estmateur asymptotquement convergent des paramètres β, noté β et un estmateur asymptotquement convergent ˆσ du rato de paramètres σ 1 σ 1 1. S l on mpose une contrante sur σ 1 (par exemple σ 1 =1)cela permet alors d dentfer la covarance σ 1. Toutefos, ces deux estmateurs ne sont effcaces en rtason de de l hétéroscédasctcté : Var µ, = σ σ σ 1 1 x 1, θ1 λ x 1, θ1 + λ x 1, θ1

Econométre des Varables Qualtatves. Cours C. Hurln 47 Etape 3 : Reste alors à estmer le paramètre σ. Pour cela, consdérons le résdu µ, de la régresson (.7). Pour une valeur donnée de σ 1, on obtent alors par constructon un estmateur convergent de σ : σ = 1 N 1 : y, >0 µ, + σ σ 1 1 N 1 : y, >0 x 1, θ1 λ x 1, θ1 + λ x 1, θ1 où N 1 désgne le nombre d observatons pour lesquelles y, > 0. (.8) On montre que les estmateurs β, σ et σ 1 ans obtenus sont asymptotquement convergent et normalement dstrbuées (Olsen 1980). Proposton.6. La convergence des estmateurs β, σ et σ 1 de Heckman ne nécesste pas de supposer la normalté jonte des varables y1, et y,. Il sufft de supposer que la varable y1, est dstrbuée selon une lo normale et que la composante des résdus µ, telle que y, = x, β + ε, = x, β + σ 1 σ 1 y 1, x 1, β 1 + µ, est ndépendamment dstrbuée par rapport à y 1,. Ans, contrarement à l estmateur du MV, la convergence de l estmateur de Heckman ne recquert pas la normalté jonte des deux varables latentes..1.4. Exemples Un des exemples les plus célébres de modèle Tobt généralsés de type II est l applcaton de Gronau (1974) sur le traval des femmes. Son modèle d offre de traval est fondé sur la théore du salare de réservaton et sera reprs par la sute de très nombreuses fos, notamment par Heckman avec des modèles de bas de sélecton. Le traval de Gronau (1974) consste à détermner sous quelles condtons les femmes décdent de travaller ou de ne pas travaller. Gronau suppose que le taux de salare réel effectvement offert aux femmes, noté W s, est ndépendant du nombre d heures travallées H. La femme maxmse son utlté U (C, X) où C désgneletempspasséàs occuperdesenfantsetx le vecteur des autres bens de consommaton. Etant donné le salare W s offert, la femme cherche donc le paner (C, X) qu maxmse son utlté sous la contrante de temps C + H = T où T désgne temps dsponble total et sous la contrante de revenu X = W s H + V où V désgne le montant de ses revenus autres que les revenus salaraux. Le programme est donc : max U (C, X) (.9) {C,X} sc : C + H = T sc : X = W s H + V Dès lors la femme n acceptera de travaller que s le TMS du ben C au ben X évalué au pont H =0(c est à dre sans travaller) est nféreur le taux de salare W s. U (C, X) / C U (C, X) / X <W s H=0

Econométre des Varables Qualtatves. Cours C. Hurln 48 Intutvement, sans travaller, la réducton d une unté du temps consacré aux enfants mplque pour mantenr le nveau d utlté une augmentaton de la consommaton égale au terme de gauche. S en travallant une unté la femme, gagne W s et que ce salare réel est supéreur à cette augmentaton nécessare de la consommaton, la femme décdera de travaller. S elle décde travaller, le nombre d heures travallées H sera défn par l égalté : U (C, X) / C s (H) =W U (C, X) / X Gronau qualfe le terme de gauche de housewfe s value of tme, mas plus généralemnt l s agt c d un salare de réservaton, noté W r. S W r >W s, l agent accepte de travaller, snon l refuse. En supposant que W r et W s peuvent s écrre comme la somme de combnasons lnéares des varables explcatves ndépendantes et d un terme d erreur, le modèle devent : W s = x 1, β 1 + ε 1, (.30) W r = x, β + ε, (.31) W s W = s W s >Wr (.3) 0 snon où W désgne le salare effectf. Pour les femmes ayant un salare de réservaton supéreur au salare offert, le salare effectf est nul pusque ces dernères refusent de travaller. En posant que y1, = W s W r et y1, = W s, en supposant que les perturbatons ε 1, et ε, sont normallement dstrbuées on retrouve un modèle tobt généralsé de type II. C est un tel modèle qu donna leu plus tard à l extenson des modèles à troncature auxlare ou modèles Heckt..1.5. Modèle de Troncature Auxlare ou Modèle Heckt Parfos, on appele modèle de Troncature Auxlare ou modèle Heckt, en hommage à Heckman, ou modèles de bas de sélecton, les modèles Tobt généralsés de type II. Les exemples sont multples : caractérstques des demandeurs d emplo connues que s ls sont nscrts à l ANPE, notes des étudants connues que s ls ont décdé de passer l examen, réponses aux enquêtes connues que s les ndvdus ont décdé de les fournr, etc... Tous ces exmples cachent un processus de selcton des ndvdus observés dans lequel ceux-c ntervennent de façon détermnante : on a donc un problème d auto-sélecton. Consdérons un modèle Tobt généralsé : y, = y, 0 s y 1, > 0 s y 1, 0 (.33) y 1, = x 1, β 1 + ε 1, (.34) y, = x, β + ε, (.35) Il est tentant alors d applquer les MCO à l ensemble des observatons pour détermner les paramètres β.

Econométre des Varables Qualtatves. Cours C. Hurln 49 Proposton.7. On montre que l estmateur β des MCO ne sera pas basé qu à partr du moment où le processus de sélecton sera totalement ndépendant de la varable auxlare y1, : E β = β ρσ 1 λ (x 1, β 1 )=0 ρ =0 (.36) Dès que le processus de sélevcton dépend, même partellement de y1,, le bas s ntrodut : l s agt d un bas de sélecton. Le bas apparaît parce que certanes varables explcatves, celles contenues dans x 1,, ont été oublées : l s agt encore une fos d un bas de varable omse. On parle parfos de modèle Heckt, en hommage à Heckman, la spécfcaton de ce derner étant donnée par : z = w γ + µ (.37) où y n est observée que s z > 0 ou encore s z =1avec : y = x β + ε (.38) 1 z = 0 s z > 0 s z 0

Econométre des Varables Qualtatves. Cours C. Hurln 50.. Autres Modèles Tobt Généralsés..1. Modèle Tobt Généralsé Type 3... Modèle Tobt Généralsé Type 4..3. Modèle Tobt Généralsé Type 5 3. Les Modèles à régmes 3.1. Modèle à régmes observables 3.. Modèle à régmes nobservables

Econométre des Varables Qualtatves. Cours C. Hurln 51 A. Annexes A.1.Concavtédelalog-vrasemblance Sot les matrces et Γ respectvement défnes par : Ψ (α,h) 0 = 0 N1 h : y Γ = x >0 x : y x >0 y : y y >0 x avec Ψ (α,h)= : y =0 : y >0 y φ (x α) x α φ (x α) x x 1 Φ (x α) 1 Φ (x α) (A.1) (A.) et x α φ (x α)[1 Φ (x α)] 1 < 0. Sachant que la matrce x x est défne postve. *** A fnr *** a b, egenvalues: b c 1 a + 1 c + 1 (a ac + c +4b ), 1 a + 1 c 1 (a ac + c +4b ) A.. Programme de smulaton d un probt smple Le programme permettant de smuler la sére observable y est le suvant : Trage des Epslon dans une lo N(0,1) scalar sgeps=1 genr eps=nrnd*sgeps Constructon de la Varable Exogène X scalar sgx=1 genr x=nrnd*sgx ConstructondelaVarableLatentey* scalar beta=0.8 scalar alpha=1 genr ystar=alpha+beta*x+eps ConstructondelaVarableObservaley genr y=0 genr y= (ystar>0)*ystar

Econométre des Varables Qualtatves. Cours C. Hurln 5 Bblographe Alban T. (000), Econométre des Varables Qualtatves, Dunod. Goldberger (1964) Goureroux C. (1989), Econométre des Varables Qualtatves, Economca. Greene W.H. (1997), Econometrc Analyss, Londres, Prentce Hall. McDonald, J. and R. Mofftt (1980) The Uses of Tobt Analyss, Revew of Economc and Statstcs, 6, 31831 Maddala. G.S. (1983), Lmted-dependent and Qualtatve Varables n Econometrcs, Econometrc Socety Monographs, 3, Cambrge Unversty Press. Tobn J. (1958), Estmaton of Relatonshps for Lmted Dependent Varables, Econometrca, 6, 4-36.