Econométrie des modèles de durée



Documents pareils
Analyse des durées de vie avec le logiciel R

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Modélisation aléatoire en fiabilité des logiciels

TABLE DES MATIERES. C Exercices complémentaires 42

Probabilités III Introduction à l évaluation d options

MODELES DE DUREE DE VIE

Application des courbes ROC à l analyse des facteurs pronostiques binaires

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Soutenance de stage Laboratoire des Signaux et Systèmes

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Économetrie non paramétrique I. Estimation d une densité

Valorisation d es des options Novembre 2007

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Le modèle de Black et Scholes

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Chapitre 7 : Intégration sur un intervalle quelconque

Calculating Greeks by Monte Carlo simulation

MCMC et approximations en champ moyen pour les modèles de Markov

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Chap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R.

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Correction du baccalauréat ES/L Métropole 20 juin 2014

Principe d un test statistique

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Méthodes de Simulation

Introduction à la statistique non paramétrique

Modèles pour des durées de survie.

La fonction exponentielle

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

NON-LINEARITE ET RESEAUX NEURONAUX

FORD C-MAX + FORD GRAND C-MAX CMAX_Main_Cover_2013_V3.indd /08/ :12

Quantification Scalaire et Prédictive

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TSTI 2D CH X : Exemples de lois à densité 1

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Chapitre 2 Le problème de l unicité des solutions

Texte Agrégation limitée par diffusion interne

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Lire ; Compter ; Tester... avec R

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Rappels sur les suites - Algorithme

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

FIMA, 7 juillet 2005

4 Distributions particulières de probabilités

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Théorie Financière 8 P. rod i u t its dé dérivés

OPTIMISATION À UNE VARIABLE

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

3 Approximation de solutions d équations

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

EXERCICE 4 (7 points ) (Commun à tous les candidats)

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Données longitudinales et modèles de survie

Le quizz des stats. Xavier Paoletti. Sce de biostatistiques / Inserm U900 Institut Curie

Programmes des classes préparatoires aux Grandes Ecoles

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Chaînes de Markov au lycée

Simulation de variables aléatoires

Séries Statistiques Simples

TESTS D'HYPOTHESES Etude d'un exemple

Introduction à la Statistique Inférentielle

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Modélisation des risques

ESSEC Cours Wealth management

PROBABILITES ET STATISTIQUE I&II

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

CHAPITRE 5. Stratégies Mixtes

Annexe commune aux séries ES, L et S : boîtes et quantiles

Image d un intervalle par une fonction continue

Initiation à l analyse en composantes principales

Raisonnement par récurrence Suites numériques

Apprentissage par renforcement (1a/3)

Rapport de projet Risque de Crédit, Risque de Défaut : Étude de l influence du taux de recouvrement sur le prix de CDOs.

Limites finies en un point

ALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII

Variables Aléatoires. Chapitre 2

Développements limités. Notion de développement limité

Précision d un résultat et calculs d incertitudes

Moments des variables aléatoires réelles


Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

de calibration Master 2: Calibration de modèles: présentation et simulation d

Manuel d Utilisateur - Logiciel ModAFi. Jonathan ANJOU - Maud EYZAT - Kévin NAVARRO

Chapitre 7. Récurrences

Méthodes de simulation des décès. appliquées au régime de retraite de la. fonction publique d État

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

choisir H 1 quand H 0 est vraie - fausse alarme

Premier modèle - Version simple

Probabilités sur un univers fini

Estimation et tests statistiques, TD 5. Solutions

MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année

Correction du Baccalauréat S Amérique du Nord mai 2007

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Transcription:

Econométrie des modèles de durée Guillaume Horny Banque de France et UCLouvain Master 2 MOSEF Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 1 / 59

Chapitre 2 : Temps discret et estimation non-paramétrique Chapitre 2 : Temps discret et estimation non-paramétrique Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 2 / 59

Chapitre 2 : Temps discret et estimation non-paramétrique Plan 1 Modèles en temps discret 2 Estimation non-paramétrique de la survie 3 Estimation non-paramétrique du hasard intégré 4 Comparaison des estimateurs de Kaplan Meier et de Breslow 5 Estimation non-paramétrique du hasard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 3 / 59

Modèles en temps discret Modèles en temps discret Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 4 / 59

Modèles en temps discret Chapitre 2 1 Modèles en temps discret 2 Estimation non-paramétrique de la survie 3 Estimation non-paramétrique du hasard intégré 4 Comparaison des estimateurs de Kaplan Meier et de Breslow 5 Estimation non-paramétrique du hasard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 5 / 59

Modèles en temps discret Durées discrètes le processus générant les données peut-être fondamentalement discret (ex: durée séparant deux livraisons...) En pratique, on mesure souvent des durées continues à des dates prédéterminés (semaine, mois...) on parle alors de durées groupées, car les transitions sont regroupées sur des intervalles de temps Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 6 / 59

Modèles en temps discret Exemple de durées groupées Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 7 / 59

Modèles en temps discret Hasard en temps discret Concepts équivalents au temps continu (et plus intuitifs!) Soient les dates de sorties t j (j = 1,...) Hasard en temps discret: Le hasard est ici une probabilité, dans [0, 1] λ d (t j ) = Pr(T = t j T t j ) (1) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 8 / 59

Modèles en temps discret Survie en temps discret Survie en temps discret S d (t) = Pr(T > t). (2) Intuition Pr(T > t 2 ) = Pr(T > t 1 ) Pr(T > t 2 T > t 1 ). Or: Pr(T > t 1 ) = 1 λ(t 1 ) Pr(T > t 2 T > t 1 ) = 1 Pr(T = t 2 T > t 1 ) = 1 λ(t 2 ) D où: S d (t) = [1 λ(t j )]. (3) j t j t Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 9 / 59

Modèles en temps discret Réécriture du hasard en temps discret λ d (t j ) = Pr(T = t j T t j ) = f d (t j ) S d (t j ). On utilise S d (t j ) = lim t tj S d (t), car S d (t j ) = Pr(T > t j ) et non pas Pr(T t j ). Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 10 / 59

Modèles en temps discret Hasard intégré en temps discret Λ d (t) = j t j t λ(t j ). (4) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 11 / 59

Estimation non-paramétrique de la survie Estimation non-paramétrique de la survie Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 12 / 59

Estimation non-paramétrique de la survie Chapitre 2 1 Modèles en temps discret 2 Estimation non-paramétrique de la survie 3 Estimation non-paramétrique du hasard intégré 4 Comparaison des estimateurs de Kaplan Meier et de Breslow 5 Estimation non-paramétrique du hasard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 13 / 59

Estimation non-paramétrique de la survie Estimateur empirique Soit un échantillon de durées (t i ) i=1,...,n Estimateur empirique: S n (t) = 1 n i=1,...,n 1[t l i > t] (5) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 14 / 59

Estimation non-paramétrique de la survie Estimateur empirique avec données censurées On observe (T i, δ i ) i=1,...,n au lieu de (T i ) i=1,...,n. estimer S par la survie empirique évaluée sur (T i ) i=1,...,n fournit une estimation biaisée Intuition: T i T i, et S n sous-estime S estimer S par la survie empirique évaluée sur (T i ) i=1,...,n δi =1 fournit une estimation biaisée Intuition: en cas de censure à droite, on évalue S n en utilisant les durées les plus courtes et S n sous-estime S Conclusion: N utilisez pas l estimateur empirique de S! Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 15 / 59

Estimation non-paramétrique de la survie Hypothèses et notations On dispose d un échantillon de n durées groupées, censurées à droite. Les durées sont observées à dates fixes 0 = t 0 < t 1 < t 2 <... < t K 1 < t K < +. Toutes les durées sont inférieures à t K. Pour chaque intervalle, on observe: d j, le nombre de transitions dans l intervalle ]t j 1, t j ] c j, le nombre de durées censurées dans l intervalle ]t j 1, t j ] r j, le nombre de durées au risque de se terminer par une censure ou une transition dans ]t j 1, t j ], cad les durées supérieurs à t j 1 Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 16 / 59

Estimation non-paramétrique de la survie Estimateur de Kaplan-Meier Un estimateur immédiat de λ(t j ) est: λ(t j ) = d j r j (6) estimateur de Kaplan-Meier de la fonction de survie: Ŝ KM (t) = [1 λ(t j )] j t j t = j t j t r j d j r j. Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 17 / 59

Estimation non-paramétrique de la survie Exemple de calcul On observe 21 durées, où indique une censure à droite 1,1,1,1, 2, 3, 4, 4, 5, 6,7, 8, 9, 10, 11, 12, 13, 14, 14, 15, 16. Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 18 / 59

Estimation non-paramétrique de la survie Exemple de calcul (suite) durées r j d j (r j d j )/r j Ŝ KM (t) 1 21 3 0.86 0.86 2 17 1 0.94 0.81 4 15 1 0.93 0.75 6 12 1 0.92 0.69 7 11 1 0.91 0.63 11 7 1 0.86 0.54 12 6 1 0.83 0.45 Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 19 / 59

Estimation non-paramétrique de la survie Propriétés de l estimateur de Kaplan-Meier la fonction est constante sur chaque intervalle elle est cadlag Ŝ KM (t) = 0 pour t > t K lorsqu il n y a pas de censure, c j = 0, j, et r j d j = r j+1. On a: Ŝ KM (t) = j t j t = r j+1 n. r j+1 r j = r 1 r 0 r 2 r 1... r j+1 r j Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 20 / 59

Estimation non-paramétrique de la survie Propriétés de l estimateur de Kaplan-Meier (suite) plusieurs transitions peuvent se produire dans le même intervalle de temps, en contradiction avec l hypothèse de temps continu. Ceci n affecte pas ŜKM. En effet, supposons dans un échantillon sans censure que l on ait 2 transitions dans l intervalle ]t j, t j+1 ]: ( ) ( ) ( ) ( ) n 1 n j n j 2 n j 3...... (7) } n {{ } ]t 0,t 1 ] n j + 1 } {{ } ]t j 1,t j ] } n j {{ } ]t j,t j+1 ] n j 2 } {{ } ]t j+1,t j+2 ] Conclusion: Après simplification, on retrouve l estimateur de Kaplan-Meier Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 21 / 59

Estimation non-paramétrique de la survie Propriétés de l estimateur de Kaplan-Meier (suite) on peut montrer que ŜKM est un estimateur non-paramétrique du maximum de vraisemblance cad qu il maximise la vraisemblance approchée: L app (S) = ( ) [S(t i 1 ) S(t i )] d i S(t i 1 ) c i. (8) i=1,...,n il est donc sans biais et de variance: Var[ŜKM(t)] = Ŝ 2 KM (t) j t j t d j r j (r j d j ). (9) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 22 / 59

Estimation non-paramétrique de la survie Exemple: survie de patients atteints d une leucémie aiguë Calcul de l estimateur de Kaplan-Meier avec le logiciel R, package survival. Source des données : R. Miller (1997), Survival Analysis, John Wiley & Sons. Programme: library(survival) plot(survfit(surv(time,status), data=aml)) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 23 / 59

Estimation non-paramétrique de la survie Exemple: données Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 24 / 59

Estimation non-paramétrique de la survie Exemple: estimation Figure: Estimation par Kaplan-Meier 0.0 0.2 0.4 0.6 0.8 1.0 0 50 100 150 Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 25 / 59

Estimation non-paramétrique de la survie Exemple: stratification par traitement Programme: # Estimation par Kaplan-Meier sagr <- survfit(surv(time, status), data = aml) s <- survfit(surv(time, status) ~x, data = aml) plot(sagr, conf.int=false, main="fonctions de survie estimées") lines(s, col=2:3) legend("topright", legend = c("agrégée","suivi", "Non-suivi"),\ col=1:3, lty = 1, lwd = 2) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 26 / 59

Estimation non-paramétrique de la survie Exemple: estimation Fonctions de survie estimées 0.0 0.2 0.4 0.6 0.8 1.0 Agrégée Suivi Non suivi 0 50 100 150 Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 27 / 59

Estimation non-paramétrique de la survie Test de l égalité des fonctions de survie Intuition: A partir du tableau de contingence, on peut calculer le nombre espéré de transition, sa variance et faire un test du Chi-2. Groupe 1 Groupe 2 Total Transition d 1 d 2 d1 + d 2 = d Non-transitions n 1 d 1 n 2 d 2 n d Total n 1 n 2 n nombre espéré de transition dans le groupe 1: e 1 = dn 1 /n. sa variance (loi hypergéométrique): V 1 = n 1 n 2 d(n d))/[n 2 (n 1)]. Test: [ i (d 1i e 1i )] 2 / i V 1i χ 2 1 Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 28 / 59

Estimation non-paramétrique de la survie Exemple: test égalité des fonctions de survie Programme: # test d égalité des fonctions de survie survdiff(surv(time,status)~x, data=aml, rho=0) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 29 / 59

Estimation non-paramétrique de la survie Exemple: résultat test égalité > survdiff(surv(time,status)~x, data=aml, rho=0) Call: survdiff(formula = Surv(time, status) ~ x, data = aml, rho = 0) N Observed Expected (O-E)^2/E (O-E)^2/V x=maintained 11 7 10.69 1.27 3.40 x=nonmaintained 12 11 7.31 1.86 3.40 Chisq= 3.4 on 1 degrees of freedom, p= 0.0653 Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 30 / 59

Estimation non-paramétrique de la survie Exemple: code Stata # déclaration des variables de durées stset time, failure(status) # Estimateur de Kaplan-Meier sts list # Estimateur de Kaplan-Meier stratifié sts list, by(x) # Représentation graphique sts graph, by(x) # test log-rank sts test x Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 31 / 59

Estimation non-paramétrique du hasard intégré Estimation non-paramétrique du hasard intégré Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 32 / 59

Estimation non-paramétrique du hasard intégré Chapitre 2 1 Modèles en temps discret 2 Estimation non-paramétrique de la survie 3 Estimation non-paramétrique du hasard intégré 4 Comparaison des estimateurs de Kaplan Meier et de Breslow 5 Estimation non-paramétrique du hasard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 33 / 59

Estimation non-paramétrique du hasard intégré Estimateur déduit de Kaplan-Meier Comme: S(t) = exp [ Λ(t)], Λ(t) = ln ŜKM(t). D où: Λ(t) = j t j t ( rj d j ln r j ), (10) pour tout t tel que ŜKM(t) > 0. Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 34 / 59

Estimation non-paramétrique du hasard intégré Estimateur de Nelson-Aalen Alternative: estimateur de Nelson-Aalen, plus simple et avec de meilleures propriétés de convergence que l estimateur déduit de Kaplan-Meier. On peut estimer le hasard intégré: Λ NA (t j ) = j t j t λ(t j ) = j t j t d j r j. (11) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 35 / 59

Estimation non-paramétrique du hasard intégré Exemple: hasard intégré de Nelson-Aalen Programme: # hasard intégré de Nelson-Aalen sagr.b <- survfit(surv(time, status),\\ type="fleming-harrington", data = aml) plot(sagr.b, conf.int=false, main="hasards intégrés estimés",\\ fun="cumhaz", xlab="t") Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 36 / 59

Estimation non-paramétrique du hasard intégré Exemple: hasard intégré de Nelson-Aalen Hasards intégrés estimés 0.0 0.5 1.0 1.5 2.0 0 50 100 150 t Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 37 / 59

Estimation non-paramétrique du hasard intégré Estimateur de S déduit de Nelson-Aalen De même, on peut déduire l estimateur de Breslow de S: Ŝ B (t) = exp d j. (12) r j j t j t Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 38 / 59

Comparaison des estimateurs de Kaplan Meier et de Breslow Comparaison des estimateurs de Kaplan Meier et de Breslow Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 39 / 59

Comparaison des estimateurs de Kaplan Meier et de Breslow Chapitre 2 1 Modèles en temps discret 2 Estimation non-paramétrique de la survie 3 Estimation non-paramétrique du hasard intégré 4 Comparaison des estimateurs de Kaplan Meier et de Breslow 5 Estimation non-paramétrique du hasard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 40 / 59

Comparaison des estimateurs de Kaplan Meier et de Breslow Comparaison KM-B de S Ŝ KM (t) = j t j t Ŝ B (t) = j t j t [ 1 d Λ(t ] j ), [ exp d Λ(t ] j ). 1 x exp( x), x 0, ŜKM ŜB si la durée la plus longue est une sortie: ŜKM(t max ) = 0 et Ŝ B (t max ) > 0 comme ŜKM est un estimateur du maximum de vraisemblance, il est sans biais et ŜB surestime légèrement S Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 41 / 59

Comparaison des estimateurs de Kaplan Meier et de Breslow Comparaison KM-B de S (suite) les deux estimateurs sont toutefois asymptotiquement équivalents Intuition: 1 x exp( x) pour x petit. les écarts sont donc faibles tant que les individus au risque ne sont pas trop peu nombreux, ce qui est le cas avec les échantillons rencontrés en pratique ( tant qu il y a une dizaine d individus au risque) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 42 / 59

Comparaison des estimateurs de Kaplan Meier et de Breslow Comparaison KM-B de S (suite) toutefois, les estimateurs peuvent être assez différents en présence de durées groupées, où lorsqu il y a des ex-aequo dans des durées discrètes on a vu que l estimateur de Kaplan-Meier n est pas sensible à ce problème l estimateur de Breslow y est sensible, d où un certain nombre de corrections qui ont été proposées. Toutefois, les résultats sont moins satisfaisant qu avec KM Conclusion: Utiliser les estimateurs pour ce pourquoi ils ont été conçus: pour estimer S ŜKM, pour estimer Λ Λ NA. Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 43 / 59

Estimation non-paramétrique du hasard Estimation non-paramétrique du hasard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 44 / 59

Estimation non-paramétrique du hasard Chapitre 2 1 Modèles en temps discret 2 Estimation non-paramétrique de la survie 3 Estimation non-paramétrique du hasard intégré 4 Comparaison des estimateurs de Kaplan Meier et de Breslow 5 Estimation non-paramétrique du hasard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 45 / 59

Estimation non-paramétrique du hasard Estimation par KM et NA Les estimateurs ŜKM et Λ NA approchent λ(t) par: λ(t) = d j r j. (13) Note: il est préférable d interpréter plutôt le taux de transition par unité de temps: λ u d j (t) = r j (t j t j 1 ). (14) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 46 / 59

Estimation non-paramétrique du hasard Lissage L estimateur (13) est toutefois une fonction en escalier, que l on préfère lisser par la technique du noyau de convolution. Note: C est ce que fait Stata par défaut à l issue de la commande sts graph, hazard Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 47 / 59

Estimation non-paramétrique du hasard Noyau de convolution Hypothèses: Soit K un noyau réel, c est-à-dire une fonction intégrable et intégrant à 1. On suppose K continue, symétrique, à support compact et à variations bornées. Exemples: Noyau gaussien K(x) = 1 2π exp( x 2 /2). (15) Noyau uniforme K(x) = 0.51( x l 1). (16) Soit une suite de paramètres strictement positifs (h n ) n 1 appelés fenêtres vérifiant h n 0. Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 48 / 59

Estimation non-paramétrique du hasard Estimation de f par noyau de convolution, durées non-censurées On suppose qu on a un échantillon, trié par ordre croissant, de durées non-censurées (t i ) i=1,...,n et de densité f inconnue. On estime f au point t par: fn (t) = 1 nh n n ( t ti K i=1 h n ). (17) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 49 / 59

Estimation non-paramétrique du hasard Estimation du hasard par noyau de convolution, durées non-censurées Un estimateur à noyau du hasard est donné par: ( ) 1 t u λ n (t) = K dλ n (u) h n h n ( ) 1 t u = K λ NA (u)du h n h n = 1 n ( ) t ti K h n i=1 h n 1 n i + 1. où le dernier terme est le hasard estimé pour l individu i. cette méthode lisse l estimateur de Nelson-Aalen par le noyau K Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 50 / 59

Estimation non-paramétrique du hasard Estimation par noyau de convolution, durées censurées L estimateur à noyau de f doit être adapté pour prendre en compte la censure on utilise l expression de l estimateur de Nelson-Aalen en présence de données censurées λ n (t) = 1 n ( ) t ti δ i K h n h n n i + 1. (18) i=1 Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 51 / 59

Estimation non-paramétrique du hasard Exemple: estimation de f par noyau (1/1) # simulations de durées weibull (alpha = 1) theta <- 1.5 time <- (- log (runif(1000)))^(1/theta) status <- seq(1,1, length=1000) skm <- survfit(surv(time, status)) # estimation de la densité f plot(density(time, kernel = "gaussian"), col=2, main="vraie \\ densité et densité estimée", xlab="t", ylab=" ") f <- function(t) {theta * t^(theta - 1) * exp(- t^theta)} curve(f, add=true, col = 1) legend("topright", legend = c("vraie","estimé"), col=1:2, \\ lty = 1, lwd = 2) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 52 / 59

Estimation non-paramétrique du hasard Exemple: estimation de f par noyau (2/2) Vraie densité et densité estimée 0.0 0.2 0.4 0.6 0.8 vraie estimé 0 1 2 3 4 t Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 53 / 59

Estimation non-paramétrique du hasard Exemple: estimation de f par noyau (3/3) # estimation "manuelle" de f avec le noyau gaussien t <- seq(0,3, length=1000) h <- 0.138 ksmooth <- function(x, xpts, h) { n <- length(x) D <- outer(x, xpts, "-") K <- dnorm(d / h) dens <- colsums(k) / (n*h) } kest <- ksmooth(time, t, h) plot(t, kest, col=2, main="vraie densité et densité estimée") curve(f, add=true, col = 1, lwd=2) legend("topright", legend = c("vraie","estimée"), col=1:2,\\ lty = 1, lwd = 2) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 54 / 59

Estimation non-paramétrique du hasard Exemple: estimation de f par noyau (4/4) Vraie densité et densité estimée 0.0 0.2 0.4 0.6 0.8 vraie estimée 0.0 0.5 1.0 1.5 2.0 2.5 3.0 t Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 55 / 59

Estimation non-paramétrique du hasard Exemple: estimation de λ par noyau (1/1) # durées non-censurées h <- 0.138 ksmooth2 <- function(x, xpts, h) { x <- sort(x) n <- length(x) D <- outer(x, xpts, "-") K <- dnorm(d / h) / (n- (1:n) + 1) dens <- colsums(k) / (h) } kest2 <- ksmooth2(time, t, h) has_true <- function(t) {theta * t^(theta - 1)} plot(t, kest2, col=2, main="vrai hasard et hasard estimé") curve(has_true, add=true, col = 1, lwd=2) legend("topleft", legend = c("vrai","estimé"), col=1:2) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 56 / 59

Estimation non-paramétrique du hasard Exemple: estimation de λ par noyau (2/2) Vrai hasard et hasard estimé 0.5 1.0 1.5 2.0 2.5 vrai estimé 0.0 0.5 1.0 1.5 2.0 2.5 3.0 t Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 57 / 59

Estimation non-paramétrique du hasard Exemple: estimation de λ par noyau (3/3) # durées censurées status <- ifelse(time < quantile(time)[4], 1, 0) time <- ifelse(time > quantile(time)[4], quantile(time)[4],\\ time) t <- seq(0,quantile(time)[4], length=1000) ksmooth3 <- function(x, xpts, delta, h) { x <- sort(x) delta <- sort(delta, decreasing = TRUE) n <- length(x) D <- outer(x, xpts, "-") K <- delta * dnorm(d / h) / (n - (1:n) + 1) dens <- colsums(k) / (h) } kest3 <- ksmooth3(time, t, status, h) Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 58 / 59

Estimation non-paramétrique du hasard Exemple: estimation de λ par noyau (4/4) Hasard estimé avec censure 0.2 0.4 0.6 0.8 1.0 1.2 vrai estimé 0.0 0.2 0.4 0.6 0.8 1.0 1.2 t Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 59 / 59