Econométrie des modèles de durée



Documents pareils
Probabilités III Introduction à l évaluation d options

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Limites finies en un point

MODELES DE DUREE DE VIE

Méthodes de Simulation

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Correction du Baccalauréat S Amérique du Nord mai 2007

Baccalauréat ES Amérique du Nord 4 juin 2008

F411 - Courbes Paramétrées, Polaires

NON-LINEARITE ET RESEAUX NEURONAUX

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Principe d un test statistique

TSTI 2D CH X : Exemples de lois à densité 1

Cours de méthodes de scoring

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Simulation de variables aléatoires

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

3 Approximation de solutions d équations

de calibration Master 2: Calibration de modèles: présentation et simulation d

Calculating Greeks by Monte Carlo simulation

Chap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R.

Chapitre 7 : Intégration sur un intervalle quelconque

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Cours d Analyse. Fonctions de plusieurs variables

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

PROBABILITES ET STATISTIQUE I&II

Programmes des classes préparatoires aux Grandes Ecoles

Analyse des durées de vie avec le logiciel R

La fonction exponentielle

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Introduction à la Statistique Inférentielle

Rappels sur les suites - Algorithme

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Correction du baccalauréat ES/L Métropole 20 juin 2014

3. Conditionnement P (B)

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Structures algébriques

Planche n o 22. Fonctions de plusieurs variables. Corrigé

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Notes du cours MTH1101 Calcul I Partie II: fonctions de plusieurs variables

Modélisation aléatoire en fiabilité des logiciels

Premier ordre Expression de la fonction de transfert : H(p) = K

Table des matières. I Mise à niveau 11. Préface

Image d un intervalle par une fonction continue

Continuité et dérivabilité d une fonction

4 Distributions particulières de probabilités

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Exercice : la frontière des portefeuilles optimaux sans actif certain

Classification non supervisée

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Chapitre 2 Le problème de l unicité des solutions

TABLE DES MATIERES. C Exercices complémentaires 42

Soutenance de stage Laboratoire des Signaux et Systèmes

Probabilités sur un univers fini

Rapport de projet Risque de Crédit, Risque de Défaut : Étude de l influence du taux de recouvrement sur le prix de CDOs.

Le modèle de Black et Scholes

FIMA, 7 juillet 2005

Développements limités. Notion de développement limité

Moments des variables aléatoires réelles

Modèle GARCH Application à la prévision de la volatilité

Texte Agrégation limitée par diffusion interne

Données longitudinales et modèles de survie

Capes Première épreuve

Précision d un résultat et calculs d incertitudes

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

MÉTHODE DE MONTE CARLO.

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

MCMC et approximations en champ moyen pour les modèles de Markov

choisir H 1 quand H 0 est vraie - fausse alarme

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Génération de scénarios économiques

Le modèle de régression linéaire

Espérance conditionnelle

Travaux dirigés d introduction aux Probabilités

Le théorème des deux fonds et la gestion indicielle

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

Théorie de l estimation et de la décision statistique

Relation entre deux variables : estimation de la corrélation linéaire

Méthode : On raisonnera tjs graphiquement avec 2 biens.

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Introduction au pricing d option en finance

Apprentissage par renforcement (1a/3)

Probabilités conditionnelles Exercices corrigés

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Cours Fonctions de deux variables

EPREUVES AU CHOIX DU CANDIDAT. Durée : De 09 h 00 à 12 h 00 (Heure de Yaoundé, TU + 1)

Leçon 01 Exercices d'entraînement

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Probabilités conditionnelles

Le Modèle Linéaire par l exemple :

Transcription:

Econométrie des modèles de durée Guillaume Horny Banque de France et UCLouvain Master 2 MOSEF Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 1 / 70

Introduction Introduction Pourquoi modéliser des durées? pour étudier la durée de séjour dans un état...... mais aussi l état suivant, vers lequel la transition a eut lieu Exemple d applications: mortalité, fiabilité d un équipement, chômage, défaillance d entreprises, cotations d entreprise, prévisions météorologiques... Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 2 / 70

Introduction Exemple: données Source : R. Miller (1997), Survival Analysis, John Wiley & Sons. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 3 / 70

Introduction Spécificité des durées VA strictement positives le temps est irréversible dépendance par rapport au temps données censurées hétérogénéité non-observée distributions des durées souvent non-centrées, très asymétriques plusieurs types de destinations possibles Exemple: durées de chômage techniques économétriques spécifiques Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 4 / 70

Introduction Amorce de bibliographie Gouriéroux, C. (1989) : Economérie des variables qualitatives, Economica. Cameron, C. et Trivedi, P. (2005): Microeconometrics La plupart des manuels comprennent un chapitre sur les durées... Pour aller plus loin: Lancaster, T. (1991): The Econometric Analysis of Transition Data, Cambridge University Press. Therneau, T. et Grambsch, P. (2000) : Modeling Survival Data, Springer. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 5 / 70

Chapitre 1: Notions de base Chapitre 1 Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 6 / 70

Chapitre 1: Notions de base Chapitre 1 1 Outils de base 2 Censures 3 Estimation par maximum de vraisemblance 3 Hétérogénéité non-observée 4 Echantillonnage Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 7 / 70

Outils de base Outils de base Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 8 / 70

Outils de base Chapitre 1 1 Outils de base 2 Censures 3 Estimation par maximum de vraisemblance 3 Hétérogénéité non-observée 4 Echantillonnage Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 9 / 70

Outils de base Intuition Du temps passé dans un état à la probabilité d en sortir... Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 10 / 70

Outils de base Notations Variable d intérêt: Soit T une variable aléatoire continue, positive, représentant la durée passée dans un état Caractérisation de la loi de T La distribution de T est entièrement caractérisée par l une des fonctions: fonction de répartition F (t) fonction de densité de probabilité f (t) fonction de survie fonction de hasard fonction de hasard intégré Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 11 / 70

Outils de base Fonction de répartition F (t) = Pr(T t), t > 0 (1) Propriétés: F (t) [0, 1], t > 0 F monotone non-décroissante : t 1 < t 2 F (t 1 ) F (t 2 ) F (0 + ) = 0 et lim t = 1 Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 12 / 70

Outils de base Densité de probabilité ou encore: Propriétés: f (t) = df dt = lim Pr(T [t, t + dt[) dt 0 dt F (t) = t f est positive car F est non-décroissante + 0 f (u)du = 1 a 0 f (u)du = Pr(T < a) = F (a) 0 (2) f (u)du (3) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 13 / 70

Outils de base Fonction de survie Ou encore: Propriétés: S(t) = S(t) [0, 1], t > 0 S(t) = Pr(T > t) = 1 F (t) (4) t t f (u)du = 1 f (u)du (5) 0 S est monotone non-croissante : t 1 < t 2 S(t 1 ) S(t 2 ) S(0 + ) = 1 et lim t = 0 (l événement d intérêt est possible, même s il ne se produit qu à la fin des temps) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 14 / 70

Outils de base Fonction de hasard 1 λ(t) = lim P(T [t, t + dt[ T t). (6) dt 0 dt Interprétation: Probabilité instantanée (ni une densité, ni une probabilité) de quitter à la date t l état actuel, sachant que l individu est dans cet état en t. Démographie: le taux de mortalité correspond à λ(t)dt, car pour dt petit: λ(t)dt P(T [t, t + dt[ T t). (7) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 15 / 70

Outils de base Fonction de hasard (suite) On a: λ(t) = lim dt 0 = lim dt 0 = f (t) S(t). 1 P((t T < t + dt) (T t)) dt Pr(T t) 1 P(t T < t + dt) dt Pr(T t) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 16 / 70

Outils de base Fonction de hasard (suite) On a aussi: Propriétés λ(t) = f (t) S(t) = 1 = d ln S(t) dt S(t) ds(t) dt λ : R + R + t 0 λ(u)du <, t > 0, mais 0 λ(u)du = λ n est généralement pas monotone Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 17 / 70

Outils de base Exemples graphiques de hasard Source: C. Gouriéroux (1989): Econométrie des variables qualitatives. Economica Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 18 / 70

Outils de base Hazard intégré Λ(t) = t Propriété: t 0 λ(u)du <, t > 0, mais 0 λ(u)du = 0 λ(u)du. (8) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 19 / 70

Outils de base Relations entre différentes fonctions Les fonctions Λ(t), S(t), f (t) et F (t) sont en bijection: Λ(t) = t 0 t λ(u)du = 0 d ln S(u) du = [ln S(u)] t 0 = ln S(t). (9) du S(t) = exp[ Λ(t)]. (10) f (t) = λ(t)s(t) = λ(t) exp[ Λ(t)]. (11) F (t) = 1 S(t) = 1 exp[ Λ(t)]. (12) la distribution de T peut-être caractérisée indifféremment une seule de ces fonctions! Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 20 / 70

Outils de base Autres relations Calcul d espérance: Si lim x + us(u) 0 (intégration par partie): E(T ) = 0 u ds(u) du du = Espérance de la durée de vie restante: Si lim x + us(u) 0: Démonstration: exercice! 0 S(u)du. (13) r(t) = E(T t T > t). (14) r(t) = 1 S(t) t S(u)du. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 21 / 70

Outils de base Autres relations (suite) Fonction de survie conditionnelle t > t 0 : S(t + t 0 t 0 ) = Pr(T > t + t 0 T > t 0 ) = S(t + t 0) S(t 0 ) ( t ) = exp λ(u)du. t 0 (15) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 22 / 70

Outils de base Exemple: la loi exponentielle de paramètre θ (θ > 0) fonction de densité: f (t) = θ exp( θt), t > 0 fonction de survie: S(t) = 1 F (t) = 1 t 0 θ exp( θu)du = 1 [ exp( θu)] t 0 = 1 ( exp( θt) + 1) = exp( θt) fonction de hasard: λ(t) = f (t)/s(t) = θ fonction de hasard intégré : Λ(t) = t 0 θdu = θt Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 23 / 70

Outils de base Exemple: la loi exponentielle (suite) fonction de survie ( conditionnelle: S(t t 0 ) = exp ) t t 0 θdu = exp( θ(t t 0 )) espérance de la durée de vie restante: r(t) = = = 1 exp( θt) 1 exp( θt) 1 exp( θt) = 1 θ. exp( θu)du t [ 1 ] θ exp( θu) t ( ) 1 θ exp( θt) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 24 / 70

Outils de base Loi du hasard intégré Le hasard est positif, donc le hasard intégré est monotone croissant et on peut écrire: [ T t ] Pr[T > t] = Pr λ(u)du > λ(u)du 0 0 = Pr [Z > z]. On a également: Pr[T > t] = exp( t 0 λ(u)du). D où: et Z suit une loi exponentielle de paramètre 1. Pr[Z > z] = exp( z), (16) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 25 / 70

Censures Censures Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 26 / 70

Censures Chapitre 1 1 Outils de base 2 Censures 3 Estimation par maximum de vraisemblance 3 Hétérogénéité non-observée 4 Echantillonnage Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 27 / 70

Censures Intuition Monsieur i est toujours au chômage à la fin de l enquête... Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 28 / 70

Censures Définitions Des durées sont généralement censurées, et c est la raison principale de l utilisation de la fonction de hasard plutôt que de l espérance : les hypothèses distributionnelles requises sont plus faibles. Soit C une VA positive. Les durées peuvent être censurées à gauche ou à droite: La durée T est censurée à droite si on observe, au lieu de T, le couple (T, δ) où T = min(t, C) et δ = 1[T < C]. La durée T est censurée à gauche si on observe, au lieu de T, le couple (T, δ) où T = max(t, C) et δ = 1[T > C]. les deux censures peuvent être présentes simultanément Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 29 / 70

Censures Illustration graphique A: pas de censure B: censure à droite C: censure à gauche D: censure à gauche et à droite E: censure entière à droite F: censure entière à gauche Source : D Addio, A.C. et Rosholm, M. (2002), Left censoring in duration data: Theory and Applications, Working Paper 2002-5, University of Aarhus. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 30 / 70

Censures Censures à dates fixes La variable de censure C peut être dégénérée (constante), on parle alors de censure fixe. on a une censure de Type I lorsque la date de censure est fixe et connue à l avance (ex: tests mécaniques) Le modèle Tobit présente une variable réelle sujette à une censure de type I en 0 on a une censure de Type II lorsque la période d observation s arrête après un nombre prédéterminé de transitions (ex: enquêtes cliniques) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 31 / 70

Censures Echantillon observé Lorsque T est censurée par C, on observe l échantillon iid (T, δ) i=1,...,n. On a alors deux types d observations: les durées non-censurées, complètes, où T = T et δ = 1 les durées censurées, incomplètes, où T = C et δ = 0 Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 32 / 70

Censures Censure indépendante (non-informative) Les approches standards supposent une censure indépendante : les paramètres de la loi de C sont non-informatifs sur le paramètres de la loi de T. La censure peut alors être traitée comme exogène. les censures de type I et II sont non-informatives Intérêt d une censure non-informative: facilite l identification (à suivre) simplifie l écriture de la vraisemblance (à suivre) Intuition: Pr[T = t, δ = 1] = Pr[T = t δ = 1] Pr[δ = 1]. Lorsque la censure est non-informative, Pr[T = t δ = 1] = Pr[T = t] et Pr[δ = 1] peut être ignorée car non-informatif sur T. La densité des observations se ramène à Pr[T = t] pour une durée non-censurée et Pr[T > t] pour une durée censurée. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 33 / 70

Censures Conséquences sur l identification La censure entraîne une perte d information. La distribution des observations censurées T permet-elle d identifier la loi de T? si on connaît la loi des observations, peut-on en déduire une unique loi pour T (via la survie ou le hasard)? Réponse: Pas nécessairement. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 34 / 70

Censures Exemple de non-identification Soit une censure à droite de type I à la date t 0. on ne peut pas identifier la partie de la distribution qui se trouve à droite de t 0 donc impossible de savoir s il y a des modes après t 0, la durée de vie restante après t 0, etc. on ne peut identifier que Pr(T > t 0 ) Dans le cas général: si la censure n est pas exogène, on ne peut pas identifier la loi de T à partir des observations sinon, l identification est possible. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 35 / 70

Censures Censure non-informative: une hypothèse raisonnable? l hypothèse de censure exogène n est pas toujours réaliste l hypothèse est généralement plus fragile dans les modèles à risques concurents Exemple: lorsqu un moteur est soumis à plusieurs risques de pannes, les risques sont généralement dépendant de l état général du moteur. Les risques sont donc corrélés, et la survenance de l un d eux censure les autres. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 36 / 70

Censures Vraisemblance en cas de censure exogène Hypothèses: censure à droite exogène (C T ) régresseurs constants dans le temps la densité de T est entièrement définie par un paramètre θ de dimension finie Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 37 / 70

Censures Vraisemblance en cas de censure exogène (suite) Contribution à la vraisemblance de i: Si non-censure (δ i = 1): Pr(T [t, t + dt[, δ i = 1, θ) Si censure (δ i = 0): Pr(T [t, t + dt[, δ i = 0, θ) D où: L i (θ) = Pr(T [t i, t i + dt[, C > T ; θ) δ i Pr(C [t i, t i + dt[, C < T ; θ) 1 δ i = [Pr(T [t i, t i + dt[; θ) Pr(C > t i )] δ i [Pr(C [t i, t i + dt[) Pr(t i < T ; θ)] 1 δ i Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 38 / 70

Censures Vraisemblance en cas de censure exogène (suite) La censure est indépendante (ne dépend pas de θ). Pour estimer θ, la vraisemblance se réduit à: L(θ) = = = n i=1 L i n Pr(T [t i, t i + dt[; θ) δ i Pr(T > t i ; θ) 1 δ i i=1 n f (t i ; θ) δ i S(t i ; θ) 1 δ i i=1 Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 39 / 70

Censures Remarques sur la vraisemblance les propriétés de l estimateur MV s appliquent: il est asymptotiquement gaussien, sans biais et efficace (suite plus loin). se limiter aux observations non-censurées revient à ne retenir que les durées les plus courtes (si censure à droite) donc à sélectionner l échantillon : l estimateur est biaisé en cas de censure à gauche, la vraisemblance comprend le terme 1 S(t i ) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 40 / 70

Censures Estimation par maximum de vraisemblance Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 41 / 70

Censures Chapitre 1 1 Outils de base 2 Censures 3 Estimation par maximum de vraisemblance 3 Hétérogénéité non-observée 4 Echantillonnage Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 42 / 70

Censures Quelques rappels Rappels sur le maximum de vraisemblance Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 43 / 70

Censures Log-vraisemblances Echantillon iid (t i ) i=1,...,n, tiré dans la loi P θ Distinguer deux cas: s il n y a pas de censure, la log-vraisemblance s écrit: ln L n (θ) = n ln f (t i ; θ). (17) i=1 s il y a censure à droite exogène, la log-vraisemblance s écrit (cf chap 1): n ln L n (θ) = [δ i ln f (t i ; θ) + (1 δ i ) ln S(t i ; θ)] (18) i=1 Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 44 / 70

Censures Conditions de régularité H1 les VA (T i ) i=1,...,n sont iid, de même loi de densité f (t; θ), θ Θ R p H2 l espace Θ des paramètres est compact H3 la vraie valeur inconnue θ 0 du vecteur de paramètre est identifiable: θ 0 θ 1, f (t; θ 0 ) f (t; θ 1 ), t. H4 θ 0 appartient à l intérieur de Θ H5 la log-vraisemblance ln L n est continue en θ H6 E θ0 [ln f (T i ; θ)] existe H7 1 n L n(t; θ) p.s. E θ0 [ln f (T i ; θ)], θ Θ. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 45 / 70

Censures Convergence de l EMV Sous ces conditions, la maximisation de la vraisemblance fournit un estimateur convergent de θ 0 : θ n arg max ln L n (θ) n p.s. θ 0 (19) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 46 / 70

Censures Efficacité asymtptotique et normalité Sous: H8 ln L n (θ) est deux fois continûment dérivable dans un voisinage de θ 0 H9 la matrice d information de Fisher évaluée en θ 0 existe et est inversible. I (θ 0 ) = E θ0 ( ln Ln (θ) θ = E θ0 ( 2 ln L n (θ) θ θ ) ln L n (θ) θ ). θ n est de plus efficace et asymptotiquement normal Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 47 / 70

Censures Quid en cas de censure? En général, sous les conditions de régularité habituelles, on peut estimer θ 0 en présence de données censurées Contre-exemple: On considère une population comprenant deux types d individus tels que la loi de T est un mélange de deux lois. Si toutes les durées d un groupe d individus sont censurées, alors les paramètres propres à ce groupe ne sont pas identifiés. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 48 / 70

Hétérogénéité non-observée Hétérogénéité non-observée Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 49 / 70

Hétérogénéité non-observée Chapitre 1 1 Outils de base 2 Censures 3 Estimation par maximum de vraisemblance 3 Hétérogénéité non-observée 4 Echantillonnage Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 50 / 70

Hétérogénéité non-observée Intuition Lorsque les individus sont plus hétérogènes que ce que le modèle ne prend en compte, qu observe-t-on? Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 51 / 70

Hétérogénéité non-observée Conséquences de l hétérogénéité non-observée? une partie de l hétérogénéité des agents n est pas observée par le statisticien (variables manquantes,...) l hétérogénéité observée (X ) et non-observée affectent la loi de T. En présence d hétérogénéité non-observée (HNO), des individus avec les mêmes valeurs de X peuvent avoir de vrais hasards différents! on parle également de modèles de mélange Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 52 / 70

Hétérogénéité non-observée Modélisation l hétérogénéité non-observée (ou omise) est modélisée par une VA v (v > 0), indépendante de l hétérogénéité observée. En t = 0, elle a une densité g, de support V. modèle linéaire: HNO biais variable omise modèles de durée (non-linéaires): HNO biais variable omise + biais dans l estimation de la dépendance au temps écoulé (à suivre) Intuition: les bons types (v élevés) transitent rapidement. Avec le temps, la population au risque comprend de plus en plus de mauvais types (v faibles) la probabilité empirique de sortie décroît dans le temps le hasard observé est décroissant, même sans dépendance négative au temps du vrai hasard! Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 53 / 70

Hétérogénéité non-observée Survie et densité observées (empiriques, agrégées) S m (t) = V S(t v)g(v)dv = E g [S(t v)] f m (t) = f (t v)g(v)dv = E g [f (t v)] ces fonctions sont calculées avec la distribution de v en t = 0 V Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 54 / 70

Hétérogénéité non-observée Hasard observé (empirique, agrégé) λ(t) = d dt ln S m(t) = f m(t) S m (t) = 1 S m (t) = 1 λ(t v)s(t v)g(v)dv S m (t) V = λ(t v) S(t v)g(v) dv S m (t) V V f (t v)g(v)dv Or : S(t v)g(v) S m (t) = S(t, v) S m (t) = g(v t) (20) g(v t) est la densité de V à la date t la proportion des différents types d individus dans l échantillon évolue dans le temps Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 55 / 70

Hétérogénéité non-observée Hasard agrégé (suite) λ(t) = V λ(t v)g(v t)dv = E gt [λ(t v)] = E g [λ(t v) T > t] le hasard agrégé est calculé avec la loi de v à la date t Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 56 / 70

Hétérogénéité non-observée Biais de la dépendance au temps Si λ() admet des dérivées à l ordre 1 continues: t E g t [λ(t v)] = λ(t v)g(v t)dv t V [ ] = V t λ(t v) g(v t)dv + [ ] = E gt t λ(t v) + λ(t v) V V λ(t v) t g(v t)dv ) dv ( t S(t v)g(v) S m (t) Or: S(t, v) (t v)g(v) = f S(t v)g(v)s m(t) t S m (t) S m (t) S m (t) 2 Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 57 / 70

Hétérogénéité non-observée Et: D où: S m(t) = f (t v)g(v)dv (21) V S(t, v) (t v)g(v) = f + S(t v)g(v) t S m (t) S m (t) S m (t) 2 f (t v)g(v)dv V Et: [ ] t E g t [λ(t v)] =E gt t λ(t v) + V V λ(t v) S(t v)g(v) S m (t) λ(t v) f (t v)g(v) dv S m (t) ( ) 1 f (t u)g(u)du dv S m (t) V Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 58 / 70

Hétérogénéité non-observée Ainsi: [ ] t E g t [λ(t v)] =E gt t λ(t v) [ + V V λ(t v) S(t v)g(v) dv S m (t) λ(t v) λ(t v)s(t v)g(v) dv S m (t) ] [ V λ(t v) S(t v)g(v) dv S m (t) = E gt [ t λ(t v) ] E gt [λ(t v) 2 ] + E gt [λ(t v)] 2 = E gt [ t λ(t v) ] Var gt [λ(t v)] ] Conclusion: en présence d hétérogénéité non-observée, l évolution du hasard agrégé est plus faible que l évolution moyenne des hasards individuels lorsque le hasard est constant en t mais de variance non-nulle, le hasard empirique décroît en t Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 59 / 70

Hétérogénéité non-observée Exemple: mover-stayer La VA v ne prend que la valeur v 1 ou v 2 (avec v 2 > v 1 et v 2 > 1). On a Pr[v = v 1 ] = α et Pr[v = v 2 ] = 1 α. On suppose le hasard constant : λ(t v k ) = v k, k = 1, 2. D où: S m (t) = E g [S(t v)] = α exp( v 1 t) + (1 α) exp( v 2 t) f m (t) = E g [f (t v)] = αv 1 exp( v 1 t) + (1 α)v 2 exp( v 2 t) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 60 / 70

Hétérogénéité non-observée Exemple: mover-stayer (suite) D où: λ m (t) = αv 1 exp( v 1 t) + (1 α)v 2 exp( v 2 t) α exp( v 1 t) + (1 α) exp( v 2 t) = αv 1 + (1 α)v 2 exp( (v 2 v 1 )t) α + (1 α) exp( (v 2 v 1 )t) si la population était homogène (v 1 = v 2 ), λ m (t) = v 1 le hasard empirique serait constant comme la population n est pas homogène (v 1 v 2 ), le hasard empirique est décroissant bien que les hasards individuels soient constants Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 61 / 70

Hétérogénéité non-observée Exemple: mover-stayer (suite) Hasard agrégé (v1 = 0.5, v2 = 1.5, alpha = 0.15) 0.5 1.0 1.5 v2 = 1.5 v1 = 0.5 0 2 4 6 8 10 t Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 62 / 70

Hétérogénéité non-observée Biais sur les paramètres Hypothèse: On suppose λ(t x, v) = v exp(xβ) On peut montrer que (exercice!): E g (v T > t) = exp(xβ)var[v T > t] 0 (22) la valeur moyenne de v décroît au fil du temps parmi les survivant De plus, on a: λ m (t x, v) = E gt [vλ 1 (x)] = exp(xβ)e g [v T > t] (23) On peut montrer que (exercice!): x E g [v T > t] = exp(xβ)βvar[v T > t] (24) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 63 / 70

Hétérogénéité non-observée Biais sur les paramètres (suite) Le hasard empirique vérifie donc: x ln λ m(t x, v) = β [ 1 exp(xβ) ] Var[v T t] < β = ln λ(t x, v) E[v T t] x (25) Conclusion: la pente du hasard observé est plus faible que la pente du vrai hasard Intuition: les individus ayant des valeurs de x qui augmentent la probabilité de sortie vont sortir rapidement. Après un certain temps, il ne reste plus que les individus avec les valeurs de x qui réduisent la probabilité de sortie. Si on omet v, on sous-estime l effet de x en lui imputant la variation dans la composition des v. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 64 / 70

Echantillonnage Echantillonnage Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 65 / 70

Echantillonnage Chapitre 1 1 Outils de base 2 Censures 3 Estimation par maximum de vraisemblance 3 Hétérogénéité non-observée 4 Echantillonnage Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 66 / 70

Echantillonnage Intuition Comment je construis mon échantillon? Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 67 / 70

Echantillonnage Echantillonnage de stock ou de flux? But de l échantillonnage: construire un échantillon représentatif Deux méthodes de construction d un échantillon de durées: échantillonnage de stock: à une date, on interroge des individus dans l état d intérêt sur le temps depuis lequel ils y sont échantillonnage de flux: on enregistre les durées pour les individus qui entrent dans l état d intérêt dans un intervalle de temps (on observe les durées depuis le début) Il est préférable de disposer d un échantillon dans le flux. Intuition: les durées longues sont sur-représentées dans l échantillonnage de stock (et donc les mauvais v et x), car elles ont plus de chance de courir à la date d enquête. Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 68 / 70

Echantillonnage Exemple d échantillonnage de flux Défaillances: on ne garde que les entreprises créées après une certaine date Chômage: on ne garde que les personne entrant dans le chômage après le début de l enquête Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 69 / 70

Echantillonnage Vraisemblance avec échantillonnage de stock Supposons que l individu i soit interrogé alors qu il est dans l état actuel depuis un temps si 0. Il en sort s1 i unités de temps plus tard, d où t i = si 0 + si 1. En l absence de censure, la vraisemblance s écrit: L(θ) = = = n Pr(T [t i, t i + dt[ T > si 0 ; θ) i=1 n i=1 n i=1 f (t i ; θ) S(s 0 i ; θ) λ(t i ; θ) S(t i; θ) S(s 0 i ; θ) Guillaume Horny (Banque de France) Econométrie des durées (chap 1) 2009 70 / 70