Cours 3 : Estmato paramétrque de la lo d ue durée de ve I-Gééraltés II- Doées complètes III- Doées cesurées IV- Doées troquées IV- Applcato aux modèles classques V- Méthodes umérques de recherche de l EMV
I- Gééraltés Applcablté : o a ue dée (emprque) de la forme p paramétrque du taux : h { h(., θ ), θ Θ, Θ R } estmato de h estmato de θ Approche classque : Estmato par Maxmum de Vrasemblace (EMV)
I- Gééraltés l ( t,..., t, θ ) Quelques déftos : Sot la desté d u échatllo aléatore ( T,..., T ), deux fos dfféretable par rapport à θ Θ, Θ R p o Défto : O appelle score le vecteur des dérvées partelles premères de l p U ( θ ) = ( U ( θ ),.., U p ( θ )) R U j ( θ ) = l ( T,..., T, θ ) θ j o Défto 2 : S le domae de défto de T e déped pas de θ, la matrce d formato de Fsher est défe par (s cette quatté exste) I l ( T,..., T, θ ) = 2 ( θ ) E θk θ j k p, j p Le score et l formato de Fsher mesuret l formato apportée par l échatllo sur la valeur de θ
II- Doées complètes Observatos : ( T,..., T ), T 0 de taux h( t, θ0), θ0 Θθ 0 cou Vrasemblace des observatos Log-vrasemblace des observatos: L ( T,... T, θ ) = f ( T, θ ) = l T T θ = f T = (,..., ) l (, θ ) ou l ( T,..., T, θ ) = l h( T, θ ) + l S( T, θ ) = = Estmateur du Maxmum de Vrase mblace (EMV) de θ (P) ˆ θ = arg max l ( T,... T, θ ) θ Θ
II- Doées complètes l Hypothèse : deux fos dérvable par rapport à θ ) l ( T,..., T, θ) ) θ j ( P ) θ soluto de ² l( T,..., T, θ ) θk θ j, k p j p = 0, j =... p ) < 0 θ Vos( θ )
II- Doées complètes Proprétés : sot θ la vrae valeur du paramètre. S Θ est u p 0 ouvert de R et s est deux fos cotûmet dfféretable l - Absece de bas asymptotque E ( ˆ θ ) θ 0 - Cosstace ( ˆ ) 0 lm P θ θ > ε = 0 ε 0 - Normalté asymptotque : ( ˆ θ θ ) N(0, I ( θ )) L / 2 0 0 Où I ( θ ) peut être estmée par 0 ˆ ² l Σ ( θ ) ( ˆ = t,..., t, θ) θk θ j k p, j p
III- Doées cesurées A- vrasemblace latete Dfféreces avec le modèle complet : o o O e peut estmer le paramètre qu à partr des doées observables O=(X,δ) varable observable Le modèle observable est u modèle qu fourt ue formato complète sur la durée de ve T T=varable latete Rq: utlser l estmateur obteu sur le sous-échatllo complet produt u estmateur basé. Log-vrasemblace latete =log-vrasemblace de l échatllo complet (cf modèle complet,), o calculable. l *( T,..., T, θ ) = l h( T, θ ) + l S( T, θ ) = =
III- Doées cesurées B Vrasemblace observable O appelle vrasemblace observable la vrasemblace de l échatllo observé : O = ( ) X, δ Proposto : Das les modèles de cesure drote étudés (type I, II et III o formatve), la log-vrasemblace observable s écrt K=quatté e dépedat pas de θ l ( O,... O, θ ) = K + δ l f ( X, θ ) + ( δ )l S( X, θ ) = = = K + δ l h( X, θ ) + l S( X, θ ) = = = K + δ l h( X, θ ) H ( X, θ ) = =
III- Doées cesurées B Vrasemblace observable Démostrato das le cas d u modèle de type I ( ) X δ ( o,..., o ), O =, / X = T c, δ = T c c R, T..d. de lo f (., θ ), θ Θ R p Desté des observato Vrasemblace : k( x,, ) = f ( x, ) S( x, ) δ δ δ θ θ θ (dem vor cours2) L ( O,... O, θ ) = k( X, δ, θ ) = l ( O,... O, θ ) = l k( X, δ, θ ) =
III- Doées cesurées B Vrasemblace observable Démostrato das le cas d u modèle de type III ( ) X δ ( o,..., o ), O =, / X = T C, δ = T C C..d. de lo g dépedate de θ ( o formatve), T..d. de lo f (., θ ), θ Θ R, T C Def : cesure formatve = sa lo déped du paramètre à estmer, la surveue de l a cesure déped de la lo de la durée.. p
III- Doées cesurées B Vrasemblace observable Desté des observatos : ( ) δ ( ) k( x, δ, θ ) = f ( x, θ )( G( x ) S( x, θ ) g( x ) δ (dém vor cours 2) Vrasemblace : Lorsque la cesure est pas formatve L ( O,... O, θ ) = k( X, δ, θ ) = l ( O,... O, θ ) = l k( X, δ, θ ) = = δ l( G( X )) + ( δ )l g( X ) = = + δ l f ( x, θ ) + ( δ )l S( x, θ ) = =
III- Doées cesurées B Vrasemblace observable Démostrato das le cas d u modèle de type II ( ) X δ ( o,..., o ), O =, / X = T X, δ = T X ( r ) ( r ) X = r stat d'ordre de l'échatllo, T..d. de lo f (., θ ), θ Θ R ( r ) p Vrasemblace L ( O,... O, θ ) = r! r S( X, θ ) f ( X, θ ) ( ) ( r) ( ) ( r)! =! l ( O,... O, θ ) = l δ l f ( X, θ ) ( δ )l S( X, θ ) ( r)! + + = =
III- Doées cesurées C Vrasemblace observable : cesure de type I I Démostrato : Les observatos e sot c pas dépedates L ( o,... o, θ ) dx = P( x T x + dx,..., x T x + dx, x < T,..., x < T ) () () () () ( r ) ( r ) ( r ) ( r ) ( r) ( r+ ) ( r) ( )! = P( x T x + dx,..., xr Tr xr + dxr, xr Tr +,..., xr T ) ( r)!! = S( x, ) (, θ ) ( r)! = r r ( r) θ f x( ) =
III- Doées cesurées C - Estmateur du maxmum de vrasemblace La vrasemblace latete est pas utlsable pour rechercher le max de vrasemblace. O utlse la vrasemblace observée. EMV : ˆ θ = arg max l ( O,..., O, θ ) θ Θ La pertece de cet estmateur est fodée sur la proposto suvate l ( O,..., O, θ ) l *( T,.., T, θ ) = Eθ O 0,.. O θ θ Le score observable est la melleure approxmato du score latet à partr des varables observables
III- Doées cesurées C - Estmateur du maxmum de vrasemblace Démostrato das le cas d ue varable: Relato etre les varables latetes et observables : f ( T, θ ) = f ( T, θ / O) k( O, θ ) l *( T, θ ) = f ( T, θ / O) + l( O, θ ) () E dérvat la relato () par rapport au paramètre pus e tégrat par rapport à la lo de T sachat O=o, o a: l *( T, θ ) = l f ( T, θ O) + l( O, θ ) θ θ θ Eθ l *( T, θ ) O E l f ( T, O) O l( O, ) 0 = θ θ θ 0 + θ θ θ E versat l tégrale et la dérvato E l f ( T, θ O) O = f ( t, θ O) dt = 0 θ θ
III- Doées cesurées C - Estmateur du maxmum de vrasemblace p Sot θ la vrae valeur du paramètre. S Θ est u ouvert de R 0 s l est deux fos cotûmet dérvable et s θ0 est detfable à partr de la lo de O, l EMV observable satsfat : - Absece de bas asymptotque E ( ˆ θ ) θ 0 - Cosstace - Normalté asymptotque : Où I ( θ ) peut être estmée par 0 θˆ ( ˆ ) 0 lm P θ θ > ε = 0 ε 0 ( ˆ θ θ ) N(0, I ( θ )) L / 2 0 0 ˆ ² l Σ ( θ ) ( ˆ = o,..., o, θ) θk θ j k p, j p
IV-Doées troquées ( ) T ( o,... o ), O =, Z T Z Z..d. de lo g, T..d. de lo f (., θ ), θ Θ R, T Z Vrasemblace p L ( O,... O, θ ) = k( T, Z, θ / T > Z ) = f ( T, θ ) g( Z ) = P( T > Z) = P( T > Z) = G( u) f ( u, θ ) du
IV-Doées troquées p Proprétés : S Θ est u ouvert de R s l est deux fos cotûmet dérvable et s la lo de T est detfable à partr de la lo de O, l EMV observable satsfat les mêmes boes proprétés que das le cas cesuré RQ : cf cours 2 pour les codtos d detfablté
V- Applcato aux modèles classque T sut ue lo expoetelle de paramètre λ ) Modèle complet λ = t = Cesure de type I II et III Où r est le ombre d stats d occurreces ) λ = r = x observés
V- Applcato aux modèles classque T sut ue lo de Webull (α,β) Modèle complet : ˆ ˆ l ˆ / l 0 ˆ t x t β β β β = = + = ˆ / ˆ t β β α = = ) Cesure type I et III: Il exste pas de forme explcte : l équato dot être résolue tératvemet ˆ ˆ t β β = = ˆ / ˆ ˆ x r β β α = = ˆ ˆ { } l ˆ / l 0 ˆ t c r x x r x x β β β β = < = + =
VI- Méthodes tératves de recherche de l EMV Objectf : résoudre umérquemet les équatos de vrasemblace das les cas où elles e peuvet être résolues aalytquemet (la plupart du temps) 3 composates : Ue valeur d talsato de l algorthme pour le paramètre : Ue formule d térato explquat commet à l étape k+ o calcule l approxmato de à partr de θ k + Des procédures d arrêt permettat de savor à quelle étape o peut cosdérer que fourt ue boe approxmato de θ θ k Cf : CIARLET [990] : Itroducto à l aalyse umérque matrcelle et à l optmsato. Pars : Duod. θ ˆ θ k ˆ θ *
Algorthme de Newto-Raphso Prcpe :
VI- Méthodes tératves de recherche de l EMV O s spre de la méthode classque précédete, utlsée pour trouver les zéros d u système d équatos, applqué c au système des équatos de la vrasemblace. (Valable s la focto de score a ue jacobee versble). O chost ue valeur d talsato de l algorthme A l étape k+, o remplace la focto à auler l ( o,..., o, θ ) U ( o, θ ) = θ par ue approxmato léare (so développemet de Taylor) au vosage de : la valeur qu aule cette expresso est θ k θ k +
VI- Méthodes tératves de recherche de l EMV Règles d arrêts: l faut qu ue ou pluseurs codtos cdessous soet satsfates : - Les valeurs térées sot à peu près stables: θ k+ θ k assez pett - Les valeurs de la focto objectf sot à peu près stables : assez pett l ( o, ) l ( o, θ ) θk+ k - Le score est proche de 0: assez pett U ( o, θ k )
VI- Méthodes tératves de recherche de l EMV Algorthme EM (expectato-maxmsato) (Dempster, Lard, Rub(977) Algorthme de recherche de l EMV das le cas de doées complètes. Marche be lorsque la varable latete est de type expoetelle (lo expoetelle, Webull)
V- Méthodes tératves de recherche de l EMV Idée : s la varable latete T état observable, l EMV serat trouvé e maxmsat la log-vrasemblace latete ˆ θ = arg max l *( T,..., T, θ ) θ Comme les observatos de T e sot pas dspobles, o remplace la vrasemblace latete par sa melleure approxmato, calculable à partr des observatos ( o,..., o ) : so espérace codtoelle sachat les observables, e estmat le vra paramètre θ par u estmateur % 0 θ. Cec revet doc à maxmser : Q( θ, % θ ) E l *( T,.., T, θ / O,... O = % θ ( )
V- Méthodes tératves de recherche de l EMV Algorthme : O part d ue valeur θ * Chaque térato de l algorthme comporte deux étapes. A l étape k+ : Etape E : calcul de Q ( θ, θ k ) Etape M : recherche de θ = Arg max Q( θ, θk ) k+ θ Θ Proprétés : - EM est crossat l ( o,..., o, θ ) l ( o,..., o, θ ) k+ k - Il coverge vers u maxmum local de la log-vrasemblace (qu e coverge pas toujours vers la vrae valeur du paramètre)
V- Méthodes tératves de recherche de l EMV Exemple: varables latetes..d. expoetelles de paramètre cou, cesure aleatore drote λ 0 Etape E : l *( T,..., T, λ) = l λ exp( λt ) = = l λ λt Q( λ, λ ) = l λ λe ( T / o,..., o ) k λ k
V- Méthodes tératves de recherche de l EMV = λ k = λk δ = E ( T / o,..., o ) E ( T / x, ) E ( T / x, δ = ) = x (observé das ce cas) λ k E ( T / x, δ = 0) = E ( T / T > x ) = tf ( t T > x ) dt = x + / λ λ k λk x k
V- Méthodes tératves de recherche de l EMV E ( T / o,..., o ) = E ( T / x, δ ) λ k λ k = = δ x + ( δ ) E ( T / T > x ) λ k = = = δ x + ( δ ) ( x + / λ ) k = = = x + = λ k r
V- Méthodes tératves de recherche de l EMV ( ) (, ) l k k r Q x λ λ λ λ λ = = + Etape M : O maxmse k k r x λ λ + = = + (, ) Q k λ λ
V- Méthodes tératves de recherche de l EMV Autres Algorthme :