Modèles pour des durées de survie.
|
|
|
- Eléonore Chénier
- il y a 10 ans
- Total affichages :
Transcription
1 Survie 1 Modèles pour des durées de survie. Catherine Huber Partie I Introduction 1 Quelques exemples Le terme de durée de survie est employé de manière générale pour désigner le temps qui s écoule jusqu à la survenue d un événement particulier qui n est pas forcément la mort : il peut s agir par exemple d une rechute et la durée de survie est, dans ce cas, un délai de rémission, ou de la guérison, et la durée de survie représente alors le délai qui sépare le diagnostic de la guérison. Dans le domaine biomédical, les deux objectifs principaux de l analyse des durées de survie sont les suivants: 1. Lors d un essai thérapeutique, il s agit de tester l efficacité d un nouveau traitement en comparant les durées de survie qu il permet d obtenir à celles que donne le traitement habituel (ou un placebo). 2. Lors d une étude épidémiologique, il s agit d évaluer la valeur pronostique d un ou plusieurs facteurs, soit sur la durée de survie, soit sur le délai de survenue d une maladie. Dans un cas comme dans l autre, les modèles employés et les méthodes correspondantes sont essentiellement les mêmes. Exemple 1 (Données de Freireich) : Freireich, en 1963, a fait un essai thérapeutique ayant pour but de comparer les durées de rémission, en semaines, de sujets atteints de leucémie selon qu ils ont reçu ou non du 6 M-P (le groupe témoin a reçu un placebo et l essai a été fait en double C. Huber Partie I
2 1 QUELQUES EXEMPLES Survie 2 aveugle). Durée de rémission, en semaines, selon le traitement: 6M-P 6, 6, 6, 6 +, 7, 9 +, 1, 1 +, 11 +, 13, 16, 17 +, 19 +, 2 +, 22, 23, 25 +, 32 +, 32 +, 34 +, Placebo 1, 1, 2, 2, 3, 4, 4, 5, 5, 8, 8, 8, 8, 11, 11, 12, 12, 15, 17, 22, 23. Les nombres suivis du signe + correspondent à des patients qui ont été perdus de vue àladateconsidérée. Ils sont donc exclus vivants de l étude et on sait donc seulement d eux que leur durée de survie est supérieure à celle indiquée. Par exemple, le quatrième patient traité, par 6 M-P a eu une durée de rémission supérieure à6 semaines, alors que les trois premiers ont eu une durée de rémission égale à 6 semaines. On dit que les perdus de vue ont été censurés, etceproblème de la censure demande un traitement particulier. En effet si l on se contentait d éliminer les observations incomplètes c est-à-dire les 12 patients censurés du groupe traité par le 6 M-P on perdrait beaucoup d information car on ne tiendrait pas compte des patients qui ont justement les durées de rémission les plus longues. Par exemple un test de Wilcoxon appliqué aux 9 patients restants dans le groupe 6 M-P et aux 21 patients du groupe Placebo sous-évaluerait l effet du traitement très visiblement. Exemple 2 (Données de Embury et al: leucémie) : Il s agit d un essai thérapeutique destiné à vérifier l efficacité d un traitement chimiothérapique d entretien pour des patients atteints de leucémie aiguë de la moelle épinière (AML pour Acute Myelogenous Leukemia), conduit à Stanford par Embury et al. Après avoir atteint un stade de rémission grâce à un traitement chimiothérapique, les patients ont été randomisés en deux groupes: l un reçoit un traitement chimiothérapiqe d entretien, l autre un placebo. Les durées de rémission complète, en semaines, sont les suivantes: Groupe traité: 9, 13, 13 +, 18, 23, 28 +, 31, 34, 45 +, 48, Groupe non traité: 5, 5, 8, 8, 12, 16 +, 23, 27, 3, 33, 43, 45. Exemple 3 (Données de Brown: cancer) : Il s agit de la comparaison de deux traitements contre un cancer: un essai thérapeutique a été mené chez des patients atteints de cancer, assignés aléatoirement à deux groupes, l un traité par A, l autre traité par B: Groupe A : Groupe B : On remarque que, dans cet exemple il n y a pas d ex-aequo. En principe, le temps étant continu, il ne devrait jamais y avoir d ex-aequo. Cependant, comme la précision avec C. Huber Partie I
3 2 CINQ FONCTIONS ÉQUIVALENTES Survie 3 laquelle les durées sont données est limitée, l unité de mesure étant le jour, la semaine ou le mois, ou même parfois l année, en pratique, on a souvent des ex-aequo. Comme la théorie mathématique (convergence et normalité asymptotique des estimateurs et des tests), est faite pour le temps continu, il importe de savoir comment traiter ces ex-aequo. Nous verrons qu il y a plusieurs façons de le faire. Deux exemples tests (pour faire les calculs directement) : La présentation des deux jeux de données suivants est différente. C est celle qui permet un traitement mathématique et informatique des données en introduisant une variable qui est l indicateur de censure: quand la variable de censure vaut, c est qu il y a un +, et quand elle vaut 1 c est qu il n y en a pas. Exemple test 1: Dans le premier cas, on a les durées, les indicateurs de censure et les indicateurs de traitement. temps censure traitement Exemple test 2: Dansledeuxième cas, on a comme première variable les dates de début et de fin. temps (1, 2] (2, 3] (5, 6] (2, 7] (1, 8] (7, 9] (3, 9] (4, 9] (8, 14] (8, 17] censure traitement Cinq fonctions équivalentes Cinq fonctions équivalentes définissent la loi de la durée: Supposons que la durée de survie X soit une variable positive ou nulle, et absolument continue. Alors sa loi de probabilité peut être définie par l une des fonctions suivantes: 1. La fonction de survie S Par définition S(t) =P{X t}, t ; (1) Pour t fixé c est la probabilité de survivre jusqu à l instant t. 2. La fonction de répartition F La fonction de répartition (f.r. ou c.d.f en anglais pour cumulative distribution function) est F (t) =P{X <t} =1 S(t) (2) Pour t fixé, c est la probabilité de mourir avant l instant t. C. Huber Partie I
4 2 CINQ FONCTIONS ÉQUIVALENTES Survie 4 Remarque Il est arbitraire de décider que S(t) =P (X t) ous(t) =P (X >t) entraînant du même coup que F (t) =1 S(t) vautf (t) =P (X <t)ouf (t) =P (X t). Lorsque la loi qui régit X est continue, cela n a aucune importance car ces deux quantités sont égales: P (X > t) = P (X t) et P (X < t) = P (X t). Cependant, dans les cas où S et donc F ont des sauts, ce qui arrive lorsque le temps est discret, compté en mois ou en semaines par exemple, on a quelquefois avantage à adopter la notation suivante qui évite toute ambiguïté: S (t) = P (X t) S + (t) =P (X >t) F (t) = P (X <t) F + (t) =P (X t) les limites à gauche (S et F )etàdroite(s + et F + ) de ces fonctions. On remarque que S S + F F + 3. La densité de probabilité f C est une fonction f(t) telle que pour tout t F (t) = t f(s)ds. (3) Si la fonction de répartition a une dérivée au point t alors P(t X<t+ dt) f(t) = lim = F (t) = S (t). (4) dt dt Pour t fixé, la densité de probabilité caractérise la probabilité demourirdansun petit intervalle de temps après l instant t. 4. Le taux d incidence ou risque instantané )h Le risque instantané est aussi très souvent appelé le taux de hasard (c est un anglicisme) est défini comme h(t) = lim dt P(t X<t+ dt X t) dt = f(t) S(t), (5) pour t fixé, caractérise la probabilité de mourir dans un petit intervalle de temps après l instant t, conditionnellement au fait d avoir survécu jusqu à l instant t. Aussi cela signifie-t-il le risque de mort instantané pour ceux qui ont survécu. 5. Le taux de hasard cumulé H C est l intégrale du taux de hasard h: H(t) = t C. Huber Partie I h(u)du = ln{s(t)}. (6)
5 3 LES TROIS TYPES DE CENSURE Survie 5 On peut déduire la fonction de survie du taux de hasard cumulégrâce àlarelation: S(t) =exp{ H(t)} =exp{ t h(u)du}. (7) N importe laquelle des fonctions ci-dessus peut être obtenue à partir de l une quelconque des autres. Quelques quantités associées à la loi de la survie: 1. Les quantiles de la durée de survie Pour <p<1, on définit le quantile t p et la fonction q(p) p (, 1) comme t p q(p) =inf{t : F (t) p}. (8) Quand F (t) est strictement croissante et continue alors t p = q(p) =F 1 (p), <p<1. (9) Pour p fixé, le quantile t p est le temps auquel une proportion p de la population adisparu. 2. Moyenne et variance de la durée de survie Le temps moyen de survie E(X) ainsi que sa variance Var(X) sont des quantités importantes: E(X) = S(t)dt, Var(X) =2 ts(t)dt {E(X)} 2. La moyenne et la variance peuvent être déduites de n importe laquelle des cinq fonctions ci-dessus (F, S, f, h, H), mais pas vice versa. 3 Les trois types de censure 1. Censure de type I : fixée Au lieu d observer les variables X 1,...,X n qui nous intéressent, on n observe X i que lorsque X i est inférieur ou égal à une durée fixée C, X i C, sinon on sait seulement que X i est supérieur à C. On note aussi T i = X i C. (le signe signifie : a b =min(a, b), la plus petite des deux valeurs a et b). 2. Censure de type II : attente On décide d observer les durées de survie des n patients jusqu à ce que r d entre eux soient décédés et d arrêter l étude à ce moment là. Si l on ordonne les durées de survie X 1,...,X n,soitx (1) la plus petite, X (i) la ième etc... : X (1) X (2) X (n) C. Huber Partie I
6 3 LES TROIS TYPES DE CENSURE Survie 6 On dit que les X (i) sont les statistiques d ordre des X i. La date de censure est alors X (r) et on observe: T (1) = X (1) T (2) = X (2) T (r) = X (r) T (r+1) = X (r)... T (n) = X (r) 3. Censure de type III : aléatoire Achaquepatienti, associons non seulement son temps de survie X i mais aussi son temps de censure C i.onn observeraévidemment que le plus petit des deux, c est-à-dire T i = X i C i Mais on peut supposer que, tout comme les Xi, les Ci sont indépendantes et équidistribuées (iid) de fonction de répartition G. On fait l hypothèse que : C i et X i sont indépendantes. Alors pour le ième patient, l information dont on dispose peut être résumée par: - la durée réellement observée T i - un indicateur D i du fait qu à l issue de cette durée d observation le patient est : - mort : D i = 1 - censuré :D i =. La censure aléatoire, lors d un essai thérapeutique peut avoir plusieurs causes: (a) Perte de vue : le patient peut décider d aller se faire soigner ailleurs et on ne le revoit plus. (b) Arrêt du traitement : le traitement peut avoir des effets secondaires si désastreux que l on est obligé d arrêter le traitement. (c) Fin de l étude : l étude se termine alors que certains des patients sont toujours vivants. patients A1 A2 A3 B1 B3 B Temps C. Huber Partie I
7 4 LE PROCESSUS PONCTUEL N(T ) Survie 7 Figure 1: Exemple: 3 patients. La figure 1 représente le suivi de trois patients. Le premier est entré audébut de l étude et il est mort àladatex 1 =6. Ledeuxième était toujours vivant à la fin de l étude, qui a eu lieu au temps 1. Il est donc censuré ent = 1. Et le troisième patient a été perdu de vue avant la fin de l étude. Il a donc été censuré au temps t =7. Remarque : L hypothèse d indépendance de X i et de C i est utile mathématiquement. Il est important de voir si elle se justifie. Dans les cas où la censure est due àun arrêt du traitement, elle n est pas vérifiée. Notation : Par abus de notation, lorsqu on ordonne les durées de survie (T i,d i ) selon les valeurs croissantes des T soit : T (1) T (2) T (n) On notera D (i) l indicateur de censure associé à T (i). 4 le processus ponctuel N(t) L étude des durées de survie peut être abordée d une autre façon: Au lieu de considérer X, la durée étudiée, qui est une variable aléatoire réelle positive, généralement continue, de densité f, fonction de répartition F et fonction de survie S =1 F,onreprésente l expérience par le processus ponctuel associé N(t), qui vaut tant que l événement n a pas eu lieu et 1 après, c est àdire N(t) =1{X t}, t. (1) La considération de ce processus fait intervenir naturellement les deux fonctions h et H quenousavonsintroduitesenplusdef, S et f, qui sont respectivement le taux d incidence instantané ou fonction de risque, h, et la fonction de risque cumulée H h(t) = f(t) S(t) H(t) = t h(u)du. (11) Bien que chacune de ces cinq fonctions (F, S, f, h, H) caractérise à elle seule la loi de N, la plus intéressante est h car elle est une description probabiliste du futur immédiat du sujet encore vivant et reflète des différences entre les modèles souvent moins lisibles sur les fonctions de survie, ou fonctions de répartition. Remarquons que ce taux instantané de mort est déterministe, le taux cumulé H est lui aussi déterministe. C. Huber Partie I
8 4 LE PROCESSUS PONCTUEL N(T ) Survie 8 Figure 2: Les deux représentations de la durée de survie x. Considérons maintenant la durée de vie sous l aspect d un processus ponctuel, N(t) qui saute d une unité autempst = x lorsque la variable aléatoire X vaut x. P (dn(t) =1 N(t )=) = h(t)dt P (dn(t) =1 N(t )=1) = que l on peut aussi écrire : P (dn(t) =1 N(t )) = h(t)dt avec probabilité S(t) = avec probabilité 1 S(t). L intensité λ(t) du processus à l instant t est aléatoire: où λ(t) =Y (t)h(t) Y (t) =1{t T } est l indicateur de présence du sujet juste avant l instant t. L intensité cumulée du processus ponctuel N est elle aussi une quantité aléatoire qui vaut, en adoptant la notation usuelle min(t, X) =t X : Λ(t) = t λ(u)du = t Y (u)h(u)du = H(t X). (12) A chaque instant t et conditionnellement à l ensemble Ft des événements du passé immédiat, c est à dire ayant eu lieu jusque juste avant t, l accroissement du processus N sur un intervalle de temps infinitésimal ]t, t + dt] est une variable de Bernoulli qui vaut 1 avec la probabilité f(t) =h(t) dt et avec la probabilité q(t) =1 h(t) dt : dn(t) = 1 avec probabilité f(t) = λ(t) dt = Y (t)h(t) dt = avec probabilité q(t) =1 λ(t) dt =1 Y (t)h(t) dt. C. Huber Partie I
9 4 LE PROCESSUS PONCTUEL N(T ) Survie 9 Conditionnellement à F t, l espérance de dn(t) est donc λ(t) dt et sa variance est aussi λ(t) dt car pq = λ(t) dt(1 λ(t) dt) est équivalent à λ(t) dt. Exemple. Considérons l exemple le plus simple qui est celui d une durée exponentielle de paramètre θ, c est à dire dont le taux instantané est constant et vaut θ.alors, pour tout t f(t) = θe θt S(t) = e θt h(t) = θ H(t) = θt. L intensité cumulée (aléatoire) vaut: Λ(t) =θ(t X) et la différence entre le processus ponctuel N et l intensité cumulée Λ est une martingale M : N(t) Λ(t) =M(t) On appelle Λ le compensateur prévisible de N car il est déterminé parft alors que M(t) est un processus qui, conditionnellement à Ft, est d accroissement nul en moyenne : c est une martingale, E[dM(t) F t ]=E[dN(t) h(t)dt F t ]=. processus theta t H(t) N(t) M(t) temps Figure 3: Les trois processus N, M et H dans le cas simple exponentiel. Exemple. Si à l exemple précédenton ajoute unecensuredroitec, c est à dire que l on observe, au lieu de X, la durée T =min(x, C),notée X C, ainsi que l indicatrice de C. Huber Partie I
10 4 LE PROCESSUS PONCTUEL N(T ) Survie 1 mort D =1{X C}, qui est nulle si c est la censure au lieu de la variable d intérêt qui est observée, alors l indicatrice de présence à risque du sujet est : Y (t) =1 { t X C}. Si de plus on a une troncature gauche U, c est àdirequex n est observée que si X excède U, sinon le sujet n est même pas répertorié, alors l indicatrice de présence à risque devient : Y (t) =1 {U t X C}. Notations Supposons que l on ait n patients, indexés par i =1,,n. A chaque patient correspond un indicateur Y i (t) deprésence àrisqueà l instant t et un processus ponctuel d événement N i (t), Y i (t) =1{T i t} (13) N i (t) =1{T i t, D i =1} (14) Si le taux instantané demorth i (t) dusujeti est le même pour tout i, soit h i (t) =h(t) t, (15) on a un n-échantillon. On note Y la somme des processus Y i (t) deprésence àrisque, et N la somme des processus N i (t) d événement: Y (t) = N(t) = n Y i (t). (16) i=1 n N i (t). (17) i=1 C. Huber Partie I
11 1 ESTIMATEUR DE NELSON-AALEN Survie 11 Partie II Sans Modèle: Approche Non Paramétrique. Si l on ne fait aucun modèle, les deux estimateurs les plus importants sont: l estimateur de Nelson-Aalen, Ĥ NA du taux de hasard cumulé, l estimateur de Kaplan-Meier ŜKM de la fonction de survie. 1 Estimateur de Nelson-Aalen du taux cumulé: 1.1 Définition Cet estimateur de H est fondé sur la remarque suivante: H(s + ds) H(s) h(s)ds = P (événement dans (s, s + ds) àrisqueens) Il est naturel d estimer cette quantité par[n(s + ds) N(s)]/Y (s). En sommant ces quantités sur les intervalles de (,t] et en faisant tendre ces intervalles vers, de telle sorte que chacun ne contienne qu un seul événement, on obtient l estimateur de Nelson-Aalen: t dn(s) Ĥ(t) = (18) Y (s) qui peut aussi s écrire, puisqu il n y a que des sauts: Ĥ(t) = {i:t i t} N(t i ) Y (t i ) où N(t i ) m(t i ) est le nombre des décès à l instant t i et Y (t i ) r(t i )lenombredes sujets à risque juste avant cet instant. L estimateur de Nelson-Aalen est une fonction en escalier qui a un saut de taille m(t i )/r(t i )à chaque instant de mort t i. On choisira donc la plus simple des trois écritures: Ĥ(t) = {i:t i t} (19) m(t i ) r(t i ). (2) car les trois équations (18), (19), (2) représentent la même quantité. Les deux premières sont utiles lorsqu on utilise l approche des durées de survie par les processus ponctuels. C. Huber Partie II
12 1 ESTIMATEUR DE NELSON-AALEN Survie Exemple 4: les données de Nelson-Aalen Exemple N-A (Données de Nelson et Aalen) : Il s agit de la durée de vie de ventilateurs, en nombre de milliers d heure de fonctionnement. La question qui se posait était de savoir si la fonction de risque h était décroissante dans le temps. Les durées sont en milliers d heures. durées censure Si on appelle t 1 le premier instant de mort (ici: panne), t 2 le second, etc.., on calcule Ĥ(t),pourt supérieur ou égal à la plus grande valeur observée, qui est de 87 5 heures, comme Ĥ(t) = Nombre de pannes en t 1 Nombre de ventilateurs àrisqueent 1 Nombre de pannes en t + 2 Nombre de ventilateurs àrisqueent 2 +etc... = Nombre de pannes en 4.5 Nombre de ventilateurs à risque en Nombre de pannes en 87.5 Nombre de ventilateurs à risque en 87.5 = = Deux interprétations de l estimateur de Nelson-Aalen On peut interpréter de deux façons différentes l estimateur de Nelson-Aalen: C. Huber Partie II
13 1 ESTIMATEUR DE NELSON-AALEN Survie Ĥ(t) estime le nombre moyen de pannes pour un élément unique perpétuellement à risque sur l intervalle de temps (t]. Pour l exemple des ventilateurs, cela signifie le nombre moyen de pannes attendu lorsqu on fait fonctionner un ventilateur pendant un nombre de milliers d heures égal à t en le remplaçant chaque fois qu il tombe en panne par un autre ventilateur qui a le même taux de panne instantané que celui qui a été remplacé, c est à dire qui a déjà fonctionné exactement le même nombre de milliers d heures que celui qu il remplace. (On appelle cela en fiabilité le protocole de réparation minimale ). 2. La pente de Ĥ(t) estime le risque instantané h. Leproblème posé par l estimation de h est comparable à celui de l estimation d une densité: tout comme la fonction de répartition empirique, l estimateur Ĥ(t) deh est une fonction en escalier. Il faut donc la lisser pour estimer h, qui est la pente de cette fonction. L objectif initial de l étude étaitdesedemandersilerisqueinstantanédécroît au cours du temps. Exercice 1 On fait l hypothèse que la durée de vie des ventilateurs a un risque instantané constant, égal à θ. 1. Estimer θ. 2. Tracer sur un même graphique l estimateur non-paramétrique du risque cumulé des ventilateurs. l estimateur du risque cumulé sous l hypothèse que la durée de vie suit une loi exponentielle. 1.4 Estimation de la variance de l estimateur de Nelson-Aalen L accroissement t N(t) =N(t + t ) N(t), qui est le nombre des événements dans un court intervalle de temps t suit approximativement une loi de Poisson de paramètre h(t)t. Or, pour une variable aléatoire de Poisson, le nombre moyen des événements est le produit du taux par le temps et par le nombre à risque. Conditionnellement au passé, t N(t) est de Poisson de moyenne et de variance toutes les deux égales à Donc t+t t Y (s)h(s)ds Y (t)h(t)t. Var [ t N(t) ] h(t)t Y (t) Y (t) C. Huber Partie II
14 2 ESTIMATION DE S Survie 14 qui peut être estimée par Var t N(s) Y (s) = t N(s) Y 2 (s) ce qui donne finalement pour estimateur de la variance de Ĥ(t): Var [Ĥ(t]] = N(t i ) i:t i t Y 2 (t i ). (21) qui peut s écrire aussi, en utilisant la notation simplifiée précédente (m(t i )etr(t i )pour les nombres de décès et de sujets àrisqueà l instant t i ): Var [Ĥ(t]] = m(t i ) (22) r 2 (t i ) i:t i t Exemple des durées de rémission de Freireich pour 6-MP: Rechutes Durées t terme Ĥ(t) σ(ĥ(t)) / / / / / / / Exercice 2: Calculer l estimateur de Nelson-Aalen du risque cumulépourlesventilateursdenelson- Aalen et tracer la courbe correspondante en fonction du temps. Faire de même pour les données d Embury et celles de Brown. Exercice 3: Démontrer que l estimateur de Nelson-Aalen du risque cumulé alapropriété suivante: n n Ĥ(T i )= N i. i=1 i=1 2 Estimation de la fonction de survie Si l on ne peut pas supposer a priori que la loi de la durée de survie obéit àunmodèle paramétrique, on peut estimer la fonction de survie S grâce à plusieurs méthodes non-paramétriques dont la plus intéressante est celle de Kaplan-Meier. Nous allons cependant donner d abord l estimateur de Harrington et Fleming car il se déduit immédiatement de l estimation du taux cumulé. C. Huber Partie II
15 2 ESTIMATION DE S Survie Estimateur de Harrington et Fleming de S:ŜHF C est l estimateur qui découle de l estimateur de Nelson-Aalen du risque cumulé H en utilisant la relation S = exp( H): Ŝ HF =exp( Ĥ NA ) (23) Grâce à la delta-méthode,on rappelle que, sous des conditions de régularité de la fonction f, Var (f(y )) f 2 (E(Y ))Var (Y )), on peut obtenir un estimateur de la variance de cet estimateur:ici la fonction f est l exponentielle, de dérivée f = f et donc Var (Ŝ) =Ŝ2 Var (Ĥ) Var S NA (t) =exp( 2 i m(t i ) r(t i ) ) i m(t i ) r(t i ) 2. (24) 2.2 Estimateur de Kaplan-Meier de S:ŜKM Cet estimateur est aussi appelé P-L (Produit-Limite) car il s obtient comme la limite d un produit. Il est fondé sur la remarque suivante : si t <t, la probabilité de survivre au-delà de l instant t est égale au produit suivant : S(t + )=P (X >t X >t ).S(t ). Si l on renouvelle l opération en choisissant une date t antérieure à t,onaurade même S(t )=P (X >t X>t )S(t ), et ainsi de suite. Si l on choisit pour les dates où l on conditionne celles où il s est produit un événement, qu il s agisse d une mort ou d une censure, on aura seulement à estimer des quantités de la forme : P (X >T (i) X>T (i 1) )=p i. Or p i est la probabilité de survivre pendant l intervalle de temps I i =]T (i 1) T i ] quand on était vivant au début de cet intervalle. Notant, comme précédemment, R i le nombre des sujets qui sont vivants (donc à risque de mourir) juste avant l instant T (i), ce qui peut aussi s écrire: #vivantsà l instant T (i) ou #sujetsder(t (i) )endésignant par R(t) l ensemble des sujets àrisqueà l instant t. et M i le nombre des morts à l instant T (i), q i =1 p i est la probabilité demourir pendant l intervalle I i sachant que l on était vivant au début de cet intervalle. Alors l estimateur naturel de q i est q i = M i R i. C. Huber Partie II
16 2 ESTIMATION DE S Survie 16 Supposons qu il n y ait pas d ex-aequo. Si D (i) = 1, c est qu il y a eu un mort en T (i) et donc M i =1. SiD (i) =, c est qu il y a eu une censure en T (i) et donc M i =. Par suite p i = 1 1 R i en cas de mort en T (i) = 1 en cas de censure car il est clair que R i = n i + 1. L estimateur de Kaplan-Meier est donc dans ce cas : Ŝ(t) = 1 (1 n i +1 )D (i). (25) T (i) t Exemple 5: cancer des bronches Sur 1 patients atteints de cancer des bronches on a observé les durées de survie suivantes, exprimées en mois: L estimateur de Kaplan-Meier de la fonction de survie S(t) se calcule de la manière suivante: temps R i m i Survie Intervalle 1 1 [ 1[ [1 3[ [3 5[ [5 8[ [8 9[ [9 11[ Exercice 4 Comparer cet estimateur de la survie à celui de Fleming et Harrington. Dans cet exemple, il n y a pas d ex-aequo. Cependant la plupart du temps il y en a, comme dans le premier exemple qui est celui des données de Freireich. 2.3 Traitement des ex-aequo Il y a plusieurs configurations possibles pour les ex-aequo: 1. Si ces ex-aequo sont des deux sortes, on considère que les observations non censurées ont lieu juste avant les censurées. 2. Si ces ex-aequo sont tous des morts, la seule différence tient àcequem i n est plus égal à 1 mais au nombre des morts et l estimateur de Kaplan-Meier devient: Ŝ(t) = (1 M i ). (26) R i T (i) t C. Huber Partie II
17 2 ESTIMATION DE S Survie 17 survie temps Figure 4: Estimateur de Kaplan-Meier de la fonction de survie pour le cancer des bronches C. Huber Partie II
18 2 ESTIMATION DE S Survie 18 Exercice 5 Calculer l estimateur de Kaplan-Meier de la survie pour les données de Freireich, séparément pour le groupe traité et pour le placebo. Comparer cet estimateur à celui de Fleming et Harrington. 2.4 Estimateur de Breslow du risque cumulé H:ĤBr On peut estimer H à partir de l estimateur de Kaplan-Meier de S en utilisant le fait que H = log(s): Ĥ Br = log(ŝkm). (27) ce qui donne Ĥ Br = log(1 q i ). (28) i:t (i) t Pour estimer la variance de cette somme, on remarque que la variance de chaque terme vaut en première approximation p i q i r i (1 q i = m i(r i m i )r 2 ) 2 i ri 3(r i m i ) 2 m = i r i (r i m i ) De plus, si les q i étaient indépendants, la variance de la somme serait égale àlasomme des variances. Cela donne pour variance de l estimateur de Breslow: Var (Ĥ(t)) = m i r i (r i m i ). (29) i:t (i) t 2.5 Estimateur de Greenwood de la variance de ŜKM: L estimateur de Greenwood de la variance de l estimateur de Kaplan-Meier de la fonction de survie est obtenu à partir de la précédente log(ŝkm(t)) = log(1 q i ) i:t (i) t Cela donne, en employant la delta-méthode qui consiste àconsidérer que si X est approximativement égal à µ + σz,où Z est centré etréduit et σ petit : Var (f(x)) = Var (f(µ + σz)) = Var(f(µ)+σZf (µ)) = σ 2 f (µ) 2,avecf =log: Var (log(ŝ(t))) i:t (i) t C. Huber Partie II m i r i (r i m i ) Var (Ŝ(t)) 1 Ŝ(t) 2
19 2 ESTIMATION DE S Survie 19 ce qui donne finalement pour variance de Ŝ(t) Var (Ŝ(t)) = Ŝ(t)2 i:t (i) t m i r i (r i m i ). (3) Remarque Nous avons donc deux estimateurs du risque cumulé. On peut démontrer qu ils sont équivalents, et que les estimateurs de leur variance le sont aussi. En fait il existe trois estimateurs de la variance Variance de Greenwood: m(t) Variance de Tsiatis: Variance de Klein: r(t)(r(t) m(t)) m(t) r(t) 2 m(t)(r(t) m(t)) r(t)(r(t)) 3 Nous avons rencontré les deux premiers. Exercice Justifier heuristiquement le troisième estimateur de la variance. C. Huber Partie II
20 2 DÉFINITION D UNE MARTINGALE Survie 2 Partie III Processus Ponctuels. 1 Modélisation du processus ponctuel: l histoire ou filtration F t Considérons maintenant la durée de vie sous l aspect d un processus ponctuel, N(t) qui saute d une unité autempst = x lorsque la variable aléatoire X vaut x. Pour faire un modèle statistique, on doit préciser sur quelle information il est fondé. Pour un processus de comptage, cela est fait en spécifiant l histoire, souvent appelée filtration, etnotée {F t,t }. Un choix naturel pour {F t,t } est l histoire de l expérience depuis le début (le temps ) jusqu à l instant t inclus. Quand on a un n- échantillon, il faut cependant remarquer que, en fait, ce n est pas le temps chronologique qui est utilisé. En effet, chaque patient a un temps qui est celui du début de la durée qui le concerne. On réaligne donc les processus àrisquey i et de comptage N i sur une origine commune des temps. Jusqu à présent, nous avons supposé que nous avions unéchantillon de patients expérimentant la même loi de durée de survie, donc le mêmerisquecumulé H que nous avons estimé par Nelson-Aalen. Mais il se peut que le risque instantané ne soit pas le même d un individu à l autre car il peut dépendre de certaines caractéristiques du sujet; il peut s agir par exemple de taux biologiques, de traits génétiques ou de conditions environnementales du sujet. On appelle ces caractéristiques des covariables. On modélise alors l effet de ces différentes covariables sur le risque h. 2 Définition d une martingale 2.1 Sommes de variables aléatoires indépendantes: A l origine, les martingales ont été inventées pour généraliser les sommes de variables aléatoires indépendantes et centrées. Supposons que nous ayons une somme de variables aléatoires indépendantes X 1,X 2,..., X k,...,, soits n = n k=1 X k. Alors, on a des théorèmes sur la limite de ces sommes, convenablement normées quand n tend vers l infini : lois des grands nombres (convergence en probabilité oupresquesûre vers un nombre) etthéorèmes limites centraux (approximations normales). Sans restriction de la généralité, on peut supposer que ces variables sont centrées: E(X k ) = pour tout k. Donc on suppose que X 1,X 2,..., X k,..., sont indépendantes et centrées. C. Huber Partie III
21 2 DÉFINITION D UNE MARTINGALE Survie 21 Alors on a, pour tout n, les trois propriétés suivantes E(X n+1 X 1,X 2,..., X n ) = E(X n+1 ) = E(X n+1 S 1,S 2,..., S n ) = E(S n+1 S 1,S 2,..., S n ) = E(S n + X n+1 S 1,S 2,..., S n ) = S n. (M) 2.2 Définition Définition 1 Lorsque une suite S 1,S 2,..., S n, de variables aléatoires vérifie la propriété, (M) E(S n+1 S 1,S 2,..., S n )=S n, pour tout n. on dit que la suite S 1,S 2,..., S n, est une martingale. Une définition équivalente de la propriété de martingale est la suivante : Définition 2 Un processus (M 1,M 2,..., M n, ) est une martingale à temps discret si pour tout n IN E( M n ) < E[M n+1 F n ] = M n, (M) où F n = σ{m 1,M 2,..., M n } est la tribu du passé jusqu à l instant n, quicroît avec n. Remarque : Si (M) est satisfaite, alors E[M n F k ]=M k pour tous les entiers k<ncar E[M n F k ]= E[E[M n F n 1 ] F k ],cequidonne,deprocheenproche,lerésultat. Définition 3 : Un processus M t est une martingale à temps continu si E( M t ) <, t IR et si de plus Remarques: (M) E[M t F s ]=M s, pour tous <s<t. (31) 1. Une propriété équivalente à(m) est:pourtous<t 1 <t 2 <...<t n+1, E[M tn+1 M t1,...,m tn ]=M tn. 2. La propriété de martingale (M)a pour conséquence que l espérance de l accroissement est nulle, ce qui s écrit : E[M t M s F s ] = pour tous <s<t. ou encore dans sa version infinitésimale : (M ) E[dM t F t ]=. C. Huber Partie III
22 3 PROPRIÉTÉS D UNE MARTINGALE Survie 22 3 Propriétés d une martingale 3.1 Le compensateur ou processus de variation prévisible < M>(t) d une martingale M La somme <M>des variances conditionnelles d une martingale centrée M est caractérisée par la définition suivante qui est issue d un résultat d existence et d unicité: Définition 4 : Le processus croissant de variation associé à une martingale M est l unique processus croissant et prévisible <M>tel que d<m>(t) =E[(dM(t)) 2 F t ]. 3.2 Le processus de variation quadratique ou de variation optionnelle [M] d une martingale M C est la limite en probabilité de {M(ti+1 ) M(t i )} 2 sur une partition de plus en plus fine de l intervalle [t]. Il est souvent noté [M](t) et appelé pour cela le processus à crochets.ilestcontinuà droite comme <M>et il alapropriété que M 2 [M] est une martingale. Quand M est à trajectoires continues, [M] =<M>. Quand M n est pas continue, ce qui est le plus souvent le cas, sauf pour le mouvement Brownien dans ce cours, [M](t) = s t M(s) 2. (32) où M(s) =M(s) M(s ). Aussi, [M] est il égal àlasommedescarrés des sauts de la martingale. 3.3 Exemples Exemple : Survie exponentielle de densité f(x) =θe θx. La variable X est une durée de vie de C. Huber Partie III
23 3 PROPRIÉTÉS D UNE MARTINGALE Survie 23 fonction de risque constante θ, N(t) = 1{X t}, dn(t) = Y (t)θdt + dm(t) =h(t)dt + dm(t), d<m>(t) = E[(dM(t)) 2 Ft ]=E[{dN(t) 2dN(t)h(t)dt +(h(t)dt) 2 } Ft ] = h(t)dt (h(t)dt) 2 h(t)dt = Y (t)θdt, <M>(t) = t Y (u)θdu = θ(t X) =H(t) Autrement dit, le processus de variation de la martingale M = N H est identique au processus d intensité cumulée H. Exemples de martingales: 1. Jeu : Un jeu est dit équitable si, à chaque tour n, l espérance du gain X n est égale à : E(X n )=. Mais, en général, la stratégie du joueur dépend de ce qui s est produit jusque là. Donc, si l on note S n la somme des gains au temps n, ona S n = X 1 + X X n 1 + X n = S n 1 + X n où S n 1 et X n ne sont pas nécessairement indépendantes. Cependant, le jeu reste équitable si E[X n F n 1 ]=. 2. Urne de Polya : On a dans une urne a boules rouges et b boules noires. On tire au hasard une boule dans l urne et on remet ensuite c + 1 boules de la même couleur que celle qui est sortie. On appelle M n la proportion des boules noires après n tirages et M la proportion initiale des boules noires, a n le nombre de boules rouges et b n le nombre de boules noires après n tirages. Alors M = b a + b, proportion initiale des noires, M n+1 = b n + c a n + b n + c, avec probabilité b n, a n + b n = b n a n + b n + c, avec probabilité 1 b n = a n. a n + b n a n + b n On en déduit que E[M n+1 F n ] = = b n b n + c a n + b n a n + b n + c + b n a n a n + b n + c a n + b n b n = M n. a n + b n C. Huber Partie III
24 3 PROPRIÉTÉS D UNE MARTINGALE Survie Mouvement Brownien (martingale normale) : Cet exemple est un exemple fondamental de martingale à temps continu, car c est justement vers ce type de processus que convergent les martingales associées à beaucoup de processus et en particulier aux processus ponctuels qui nous intéressent. On remarquera que nos martingales, associées aux processus ponctuels, sautent, alors que les trajectoires du mouvement Brownien, ou mouvement Brownien changé de temps,ne sautent pas. E(B(t)) = pour tout t, cov(b(s),b(t)) = s t pour tous s et t. A l origine le mouvement Brownien est nul (B() = ) et la loi de n importe quel k-uple de réels <t 1 <t 2 <... < t k est la loi multinormale ainsi définie : L(B(t 1 ),B(t 2 ),..., B(t k )) = N(m, Σ) où m est le vecteur de dimension k de composantes nulles et Σ est la matrice de covariance suivante : t 1 t 1 t 1 t 1 t 2 t 2 Σ= t 1 t 2 t k Figure 5: Exemple de trajectoire d un mouvement brownien. C. Huber Partie III
25 3 PROPRIÉTÉS D UNE MARTINGALE Survie 25 (( ) [ ]) s s En particulier, si s<t, L(B(s),B(t)) = N ;. Si l on appelle s t X = B(s) ety = B(t) etσ s et σ t les écarts-types correspondants, on a : σ s = s σ t = t cov(s, t) = s t = s corr(s, t) = s st = s, notée ρ, la densité dex est celle d une loi normale N (,σs) 2 et les densités jointe et conditionnelles de X et Y sont { 1 f X,Y (x, y) = 2π 1 exp (1 ρ 2 ) σ s σ t 2(1 ρ 2 ) (x2 2ρxy } + y2 ), σs 2 σ s σ t σt 2 f Y X (y x) = f X,Y (x, y) f X (x) { 1 x 2 = exp (1 1 2π(1 ρ2 ) σ t 2σs 2 1 ρ ) 1 2 2(1 ρ 2 ) ( y2 2ρxy } ) σt 2 σ s σ t { 1 1 = exp (y ρx σ } t ) 2. 2π(1 ρ2 ) σ t 2(1 ρ 2 )σt 2 σ s Donc E[B(t) B(s) =x] =ρx σ t s t = σ s t x s = x Par suite, E(B(t) B(s)) = B(s) et c est donc bien une martingale. De plus, Var[B(t) B(s) B(s)] = (1 ρ 2 )σt 2 = t s Var[dB(t) B(t)] = dt = d<b>(t). par définition même de <B>, processus de variation associé à B. Remarques 1. Ici, le processus de variation est déterministe : <B>(t) =t pour tout t. Mais généralement il ne l est pas. Il est déterministe en particulier si le processus est à accroissements indépendants. 2. Que se passe-t-il si l on fait un changement de temps t = v(u), où v est nulle en et croissante? Alors, B(v(u)) = Z(u), est une martingale gaussienne, et <Z>(t) =v(t). t C. Huber Partie III
26 4 CONVERGENCE VERS LA LOI NORMALE: Survie 26 4 Convergence vers la loi normale: Théorème 1 (caractérisation des martingales gaussiennes) Soient r fonctions du temps t, v 1,v 2,...,v r croissantes et nulles en, fixées. Alors, il existe Z = ( Z1, Z2,..., Zr ) processus gaussiens ayant les propriétés suivantes : (P1) Ils sont: 1. indépendants, 2. à trajectoires continues, 3. à accroissements indépendants, 4. nuls en. (P2) E(Z k (t)) = pour tout k {1, 2,...,r} et pour tout t de IR Var(Z k (t)) = v k (t) pour tout k. Réciproquement : Si Z 1,Z 2,...,Z r sont des martingales à trajectoires continues et telles que <Zi,Zj>(t) soit égale à si j est différent de i et sinon à v i (t) pour des v i croissantes àpartirde, alors les Z i sont des processus gaussiens indépendants à accroissements indépendants. Théorème 2 (TLC) Soit Z =(Z 1,Z 2,..., Z r ) une martingale gaussienne telle que ci-dessus et M (n) = (M (n) 1,...,M r (n) une suite de martingales telle que : (P1) Les sauts des M (n) i deviennent de plus en plus petits, c est à dire que si M est décomposée en la somme suivante M = M ɛ + M ɛ où le premier terme est une martingale contenant tous les sauts supérieurs à ɛ et le second est une martingale dont aucun des sauts ne dépasse ɛ, alors <M (n)ɛ i > (t) n teti {1, 2,...,r} (P2) Les processus de covariance des M (n) i convergent vers ceux des Z i : <M (n) i,m (n) j > P sii j <M (n) i,m (n) j > P v i (t)sij = i Alors M(n) tend en loi vers Z quand n tend vers l infini. C. Huber Partie III
27 5 MARTINGALE ET COMPENSATEUR ASSOCIÉS À UN PROCESSUS PONCTUEL DE COMPTAGE Survie 27 5 Martingale et compensateur associés à un processus ponctuel de comptage Comme nous l avons vu au chapitre I, le processus ponctuel N i (t) alapropriété que Par suite, E(dN i (t) F t )=Y i (t)h i (t)dt = λ i (t). Λ i (t) = t Y i (s)h i (s)ds est le compensateur prévisible du processus ponctuel N i et M i (t) =N i (t) t Y i (s)h i (s)ds = N i (t) Λ i (t) est la martingale associée au sujet i. Le compensateur est prévisible car il est l intégrale du produit de deux processus prévisibles. Nous allons maintenant obtenir les processus de variation prévisible et optionnelle (ou quadratique), < M > et [M], de la martingale M. Par définition, d<m>(t) = var(dm(t) F t ). = var(dn(t) t Y i(s)h i (s)ds F t ). Or, étant donné F t, dn(t) est une variable de Poisson dont la moyenne et la variance sont toutes les deux égales à Y i (s)h i (s)ds F t ). Donc <M i (t) >= t Y i (s)h i (s)ds =Λ i (t). C est àdirequele processus de variation prévisible de la martingale est égal au compensateur du processus ponctuel. Par ailleurs, le processus optionnel est égal par définition, à la limite en probabilité de la somme des carrés des accroissements de M i sur une partition de [ t] de plus en plus fine: N 1 [M](t) = lim (M(t k+1 ) M(t k )) 2 t 1 =,t N = t, t k+1 t k P k=1 Comme on l a vu au chapitre I, M i n est en général pas continue et [M](t) est la somme des carrés des sauts de M i. [M](t) = s t M i (s) 2. où M i (s) =M i (s) M i (s ). Donc, comme les sauts sont égaux à1,silecompensateur est absolument continu, [M i ]=N i. C. Huber Partie III
28 5 MARTINGALE ET COMPENSATEUR ASSOCIÉS À UN PROCESSUS PONCTUEL DE COMPTAGE Survie 28 Définition d une sous-martingale Un processus Z est une sous-martingale si 1. E(dZ(t) F t )), 2. E(Z(t) F s ) Z(s). [M] est une sous-martingale qui a <M>pour compensateur. [M] est l information observée tandis que <M>en est la moyenne. On peut vérifier, en utilisant l inégalité de Jensen, que le carré de la martingale M 2 i, est aussi une sous-martingale. Tout comme un processus ponctuel, une sous-martingale peut être décomposée, de manière unique en la somme d un compensateur et d une martingale (théorème de Doob). Quelques résultats: 1. var(m i (t)) = E(< M i > (t) =E(Λ i (t), 2. cov(m i (t),m i (s)) = var(m(t s)), Il y a deux façons importantes d obtenir des martingales 1. Soient n martingales par rapport à une même filtration F t,t>). Alors M(t) = i M i(t) est une martingale par rapport àlamême filtration. Ses processus de variation prévisible < M > et optionnel [M] sont respectivement (a) < M>= i (b) [M] = i où j j t d<m i,m j > (s) t d[m i,m j ](s) <M i,m j >= lim cov[{m i (t k+1 M i (t k )}, {M j (t k+1 ) M j (t k )}] 2. Si M une martingale de moyenne nulle et K(t) un processus prévisible assez régulier (une condition suffisante est qu il soit borné), alors le processus Z(t) = t K(s)dM(s) est aussi une martingale de moyenne nulle. En effet, K étant prévisible, il est F t ) mesurable et donc E{dZ(t) F t )} = E{K(t)dM(t) F t ) = K(t)E{dM(t) F t )} = K(t) = C. Huber Partie III
29 1 RISQUE INSTANTANÉ CONSTANT Survie 29 Partie IV Modèles paramétriques. Un modèle paramétrique peut être formulé enprécisant la forme de l une ou l autre des cinq fonctions équivalentes qui définissent la loi de la durée:λ, H, S, F ou f. Souvent, cependant, on privilégie le taux d incidence, ou risque instantané λ. Quand on analyse des durées de survie, les cinq formes les plus usuelles de risque instantané sont les suivantes: constant, monotone (croissant ou décroissant), en forme de, et en forme de. La dernière, qu on appelle aussi la courbe en forme de baignoire, comporte trois périodes distinctes: d abord, la période de mortalité infantile (ou des pannes de jeunesse dans le domaine industriel, burn in en anglais), ensuite une période de risque instantané relativement bas, enfin la période de vieillissement durant laquelle le risque instantané s accroît. Commençons par 1 Risque instantané constant L unique distribution continue qui admette un risque instantané constant est l exponentielle. 1.1 La loi exponentielle E(λ) S(t λ) = e λt, t (λ>), f(t λ) = λe λt t ; h(t λ) = λ t p = ln(1 p)/λ; <p<1; E(T ) = 1/λ, Var(T ) = (1/λ) 2. C. Huber Partie IV
30 2 RISQUE INSTANTANÉ MONOTONE Survie 3 Le risque instantané, ou risque instantané est égal au paramètre λ (voir la figure 1.1) t Figure Risque instantané monotone Il y a beaucoup de distributions de durées de vie dont le taux est monotone. 2.1 Lois de Weibull W (α, λ) Ce sont des lois qui généralisent la loi exponentielle (obtenue dans le cas particulier où le paramètre α est égal à 1), et pour lesquelles le risque instantané est une puissance du temps. S(t α, λ) = exp{ (λt) α } (λ, α > ); t ; h(t α, λ) = α(λ) α t α 1 ; f(t α, λ) = (αλ) α t α 1 exp { (λt) α } ; t p = 1 λ ( ln(1 p))1/α ; <p<1; E(T α, λ) = 1 Γ(1 + 1/α), λ Var(T α, λ) = ( 1 λ )2 (Γ(1 + 2/α) Γ 2 (1 + 1/α)). Lorsque α = 1, on retrouve la loi exponentielle W (1,λ)=E(λ). Si <α<1 (Figure 1.2), le risque instantané est décroissant de à. C. Huber Partie IV
31 2 RISQUE INSTANTANÉ MONOTONE Survie t Figure t Figure 1.3 Si α>1lerisqueinstantané est croissant de à (Figure 1.3). Exercice: Montrer que, si E suit une loi exponentielle de paramètre 1, alors la variable aléatoire log(x) =a + σ log(e) = log(λ)+ 1 α log(e) suit une loi de Weibull de paramètres α = 1 σ λ = e a Remarque à propos de Splus: en Splus le paramètre de forme (shape) est alpha et le paramètre d échelle (scale) est 1/λ. C. Huber Partie IV
32 2 RISQUE INSTANTANÉ MONOTONE Survie Lois Gamma G(θ, ν) f(t θ, ν) = θ ν Γ(ν)t ν 1 e θt (θ, ν > ); t ; F (t θ, ν) = 1 θt Γ(ν) uν 1 e u du; h(t θ, ν) = f(t,θ,ν) 1 F (t,θ,ν) ; E(T θ, ν) = ν θ, Var(T θ, ν) = ν θ 2. Notons que G(θ, 1) = E(θ). Si ν>1lerisqueinstantané est croissant de à θ (Figure 1.4) t 6 8 Figure 1.4 Si <ν<1lerisqueinstantanéestdécroissant de à 1 θ (Figure 1.5). C. Huber Partie IV
33 2 RISQUE INSTANTANÉ MONOTONE Survie t Figure 1.5 Les tests d adéquation ne permettent de distinguer Weilbull de gamma que lorsque la taille d échantillon est très grande. 2.3 Lois de Gompertz-Makeham GM(γ,γ 1,γ 2 ) S(t θ) = exp{ γ t γ 1 2 (e γ 2t 1)}, (γ,γ 1 >,γ 2 R); f(t θ, ν) = (γ + γ 1 e γ 2t )exp{ γ t γ 1 2 (e γ 2t 1)}; h(t θ) = γ + γ 1 e γ 2t. Notons que GM(γ,γ 1, ) = E(γ + γ 1 ) t Figure 1.6 C. Huber Partie IV
34 2 RISQUE INSTANTANÉ MONOTONE Survie 34 Lorsque γ 2 > lerisqueinstantanéestdécroissant de γ + γ 1 à γ (Figure 1.6). Si γ 2 < lerisqueinstantané est croissant de γ + γ 1 à (Figure 1.7) t Figure Mélange de deux distributions exponentielles ME(θ 1,θ 2,p 1 ) S(t θ 1,θ 2,p 1 ) = p 1 exp{ t θ 1 } + p 2 exp{ t θ 2 } ( <p 1 < 1, p 2 =1 p 1, θ 2 >θ 1 > ); f(t θ 1,θ 2,p 1 ) = p 1 θ 1 exp{ t θ 1 } + p 2 θ 2 exp{ t θ 2 }; h(t, θ 1,θ 2,p 1 ) = f(t, θ 1,θ 2,p 1 )/S(t, θ 1,θ 2,p 1 ); E(T ) = p 1 θ 1 + p 2 θ 2. Le risque instantané estdécroissant de c 2 = p 1 θ 1 + p 2 θ 2 à c 1 = 1 θ 2 (Figure 1.8). C. Huber Partie IV
35 2 RISQUE INSTANTANÉ MONOTONE Survie t Figure Weibull généralisée GW (θ, ν, γ) { S(t θ, ν, γ) =exp 1 (1+( tθ ) } 1/γ )ν, (θ, ν, γ > ); t ; (33) h(t θ, ν, γ) = ν γθ ν tν 1 {1+( t θ )ν ) 1/γ 1 ; t p = θ{(1 ln(1 p)) γ 1} 1/ν ; <p<1. Notons que GW (θ, ν, 1) = W (θ, ν), GW(θ, 1, 1) = E(θ). La Weibull généralisée a été suggérée par les modèles accélérés. Cette famille de lois est intéressante car elle comporte les cinq types de risque instantané répertoriés ci-dessus. De plus, tous ses moments existent. Pour ν>1, ν>γle risque instantané est croissant de à (Figure 1.9) t C. Huber Partie IV
36 2 RISQUE INSTANTANÉ MONOTONE Survie 36 Figure 1.9 Pour ν =1,γ<1lerisqueinstantané est croissant de (γθ) 1 à (Figure 1.1) t Figure 1.1 Pour <ν<1, ν<γle risque instantané estdécroissant de à (Figure 1.11) t Figure 1.11 Pour <ν<1, ν = γ le risque instantané estdécroissant de à θ 1 (Figure 1.12). C. Huber Partie IV
37 2 RISQUE INSTANTANÉ MONOTONE Survie t Figure Weibull exponentiée EW(θ, ν, γ). S(t θ, ν, γ) =1 { 1 exp[ ( t θ )ν ]} 1/γ (θ, ν, γ > ); t ; (34) h(t θ, ν, γ) = ν{1 exp[ ( t θ )ν ]} (1 γ)/γ exp[ ( t θ )ν ]( t θ )ν 1 γθ{1 (1 exp[ ( t θ )ν ])} 1/γ t p = θ[ ln(1 p γ )] 1/ν ; <p<1. Notons que EW(θ, ν, 1) = W (θ, ν), EW(θ, 1, 1) = E(θ). Cette distribution a été introduite par Efron (1988). Ses propriétés ont été étudiées par Mudholkar et Srivastava (1995). Tous les moments de cette distribution sont finis. Pour ν>1, ν γ le risque instantané estdécroissant de à. Pour ν =1,γ 1lerisqueinstantané est croissant de (γθ) 1 à. Pour <ν<1, ν<γle risque instantané estdécroissant de à. Pour <ν<1, ν = γ le risque instantané estdécroissant de θ 1 à. En résumé. Pour les valeurs des paramètres pour lesquelles le risque instantané est croissant on a différentes familles de distributions: W (θ, ν): h(t) croît de à ; G(θ, ν): h(t) croît de à c>; GM(γ,γ 1,γ 2 ): h(t) croît de c>à ; GW (θ, ν, γ): h(t) icroît de c à ; EW(θ, ν, γ): h(t) croît de c à. Pour les valeurs des paramètres pour lesquelles le risque instantané est décroissant: C. Huber Partie IV
38 3 RISQUE INSTANTANÉ EN Survie 38 W (θ, ν): h(t) décroît de à; G(θ, ν): h(t) décroît de à c>; ME(θ 1,θ 2,p 1 ):h(t) décroît de c 2 à c 1, c 2 >c 1. GM(γ,γ 1,γ 2 ): h(t) décroît de c 1 > toc 2 : <c 2 <c 1 ; GW (θ, ν, γ): h(t) décroît de à c ; EW(θ, ν, γ): h(t) décroît de <c à. 3 Risque instantané en 3.1 Lois Lognormales LN(µ, σ) ( ln t µ S(t µ, σ) =1 Φ σ f(t µ, σ) = 1 σt ϕ ( ln t µ σ ), (µ R,σ >); t ; (35) f(t, µ, σ) h(t µ, σ) = S(t, µ, σ) ; t p = e σφ 1 (p)+µ ; ) ; E(T )=e µ+σ2 /2, Var(T )=e 2µ+σ2 /2 (e σ2 1). Ici Φ est la fonction de répartition de la loi normale standard, ϕ(t) = 1 2π e t2 /2 =Φ (x). Le risque instantané croît de à sa valeur maximum puis décroît vers, i.e., il est en forme de (Figure 1.13) t C. Huber Partie IV
39 3 RISQUE INSTANTANÉ EN Survie 39 Figure 1.13 Si σ est grand, alors le maximum est atteint tôt dans la vie. Par suite, la loi lognormale est aussi utilisée pour modéliser les situations où lerisquedemortest décroissant. 3.2 Lois Log-logistiques LL(θ, ν) S(t θ, ν) = 1 1+( t θ )ν (θ, ν > ); (36) h(t θ, ν) = ν θ ν tν 1 (1+( t θ )ν ) 1 ; f(t, θ, ν) = ν θ ν tν 1 (1+( t θ )ν ) 2 ; p t p = θ( 1 p )1/ν ; <p<1. Pour <ν 1 la moyenne n existe pas. Pour ν>1 La variance existe pour ν>2: E(T )=θ Γ(1 + 1/ν) Γ(1 1/ν). Var(T )=θ 2 {Γ(1 + 2/ν) Γ(1 2/ν) Γ 2 (1 + 1/ν) Γ 2 (1 1/ν)}. Pour ν>1lerisqueinstantanécroît de à sa valeur maximum puis décroît vers, c est à dire qu il est en forme de (Figure 1.14). t infinity C. Huber Partie IV
40 3 RISQUE INSTANTANÉ EN Survie 4 Figure Loi gaussienne inverse IG(ν, θ) F (t θ, ν) =Φ ( ν ( t θ f(t θ, ν) = νθt 3/2 ϕ )) ( θ + e 2ν Φ ( t ν t ( ν ( t θ θ + )) θ, (θ, ν > ); t ; t )) θ ; (37) t f(t, θ, ν) h(t θ, ν) = 1 F (t, θ, ν) ; E(T )=θ, Var(T )=θ 2 /ν. Le risque instantanécroît de à sa valeur maximum puis décroît vers ν/2θ, i.e. qu il est en forme de (Figure 1.15) t Figure Loi de Birnbaum et Saunders (1969) BS(ν, θ) ( ( )) 1 t θ F (t θ, ν) =Φ ν θ t ( f(t θ, ν) = 1 ) t θ 2νt θ + ϕ t (θ, ν > ); t ; ( ( 1 t ν θ )) θ ; t C. Huber Partie IV
41 4 ADÉQUATION DES MODÈLES Survie 41 t p = θ 4 { νφ 1 (p)+ 4+{νΦ 1 (p)} 2 } 2 ; <p<1; f(t, θ, ν) h(t, θ, ν) = 1 F (t, θ, ν) ; ) E(T )=θ (1+ ν2, Var(T )=( θ ( 2 ν ) ) 4 ν2. Le risque instantané croît de à sa valeur maximum puis décroît vers 1/2θν 2, i.e. qu il est en forme de. La famille BS est très similaire à la famille inverse gaussienne IG. 3.5 Weibull généralisée GW (θ, ν, γ) Pour γ>ν>1lerisqueinstantanécroît de àdavaleurmaximum c = ν γθ ( γ(ν 1) γ ν ) ν 1 ν ( ν(γ 1) γ ν ) 1 γ γ (38) puis décroît vers, i.e., il est en forme de (Figure 1.16) t Figure Adéquation des modèles On peut utiliser pour voir graphiquement si un modèle paramétrique donnéestcon- venable les résidus de Cox et Snell. Ces résidus sont fondés sur la remarque C. Huber Partie IV
42 4 ADÉQUATION DES MODÈLES Survie 42 suivante: si X H, cequisignifiequex suit une loi de taux cumulé H, alors la variable aléaroire Y = H(X) suit une loi exponentielle de paramètre égal à 1. En effet P (Y y) =P (H(X) y) =P (X H 1 (y)) = e H(H 1 (y)) = e y car, si X a H pour taux cumulé, il a pour fonction de survie S(x) =P (X x) =e H(x). On procède donc de la façon suivante: 1. On estime H grâce au modèle paramétrique, ce qui donne Ĥ. 2. A chaque observation X i, on fait correspondre Y i = Ĥ(X i). 3. On estime non paramétriquement le taux cumulédesy i, par exemple par l estimateur de Nelson-Aalen. On appelle Ĥ1 cet estimateur. 4. Si le modèle était correct, Ĥ 1 devrait être (approximativement) égal au taux cumulé d une loi exponentielle de paramètre 1, qui est la première bissectrice des axes. 5. On trace la courbe représentative de Ĥ1. Si le modèle est correct, ce graphe devrait être proche de celui d une droite. C. Huber Partie IV
43 1 DÉFINITION DU MODÈLE Survie 43 Partie V Le modèle semi-paramétrique de Cox Le modèle de Cox est employé lorsqu on cherche à évaluer l effet de certains facteurs, appelés covariables sur la durée de survie. 1 Définition du modèle Le cadre est le suivant : Les 2n variables X 1,...,X n et C 1,...,C n que sont les durées de survie et les durées de censure des n individus considérés sont supposées indépendantes. On observe la suite des n couples de variables (T i,d i ): T i date de l événement terminal pour le ième individu (en supposant qu ils sont tous entrés à l instant ) D i indicatrice de la cause de départ ( D i = 1 si c est l événement d intérêt, sinon) D i =1{X C}. Mais on a aussi observé sur chacun des individus une, ou plusieurs (p), facteurs Z i = (Z i1,...,z ip )dontdépend la durée de survie X i. Il peut s agir de dosages biologiques, de conditions environnementales ou de caractéristiques génétiques. Ces variables Z sont généralement appelées covariables. Le modèle des hasards proportionnels, ou modèle de Cox suppose que h(t Z = Z i )=h (t)e β Z. (39) β =(β 1,...,β p ) est le vecteur des coefficients de la régression. Il s agit d estimer ces coefficients pour évaluer l impact de chacun des facteurs sur la durée étudiée. h (t) est le risque instantané de base. C est une fonction inconnue, qu il faut estimer elle aussi. Remarque 1: La famille des lois d un tel modèle est du type suivant: toutes les fonctions de survie sont égales à une même fonction S élevée à des puissances variées : où S = S θ. (4) θ = e β 1Z β pz p On dit qu il s agit d une famille d alternatives de Lehmann. Remarque 2: Comme le rapport des risques instantanés de deux sujets i et j qui ont les covariables fixes Z i et Z j vaut h i (t) h j = h (t)e β Zi (t) h (t)e β Z i = eβ Zi e β Z j C. Huber Partie V
44 3 VRAISEMBLANCE PARTIELLE DE COX: Survie 44 Remarque 3: on appelle aussi ce modèle modèle à hasards proportionnels (PH). Cependant, le modèle (PH) est en fait plus généralquelemodèle de Cox car le facteur multiplicatif n est pas nécessairement une exponentielle d une fonction linéaire des covariables: h(t Z = z,β) =h (t)g(z,β). (41) Danscemodèle, g est une fonction spécifiée de la covariable z et du paramètre β. 2 Un exemple simple:un essai clinique Prenons le cas le plus simple : une seule covariable (p = 1) prenant seulement les valeurs ou 1. Il peut s agir par exemple d un essai clinique (encore appelé essai thérapeutique) destiné à comparer l effet d un nouveau traitement (Z = 1pourles patients traités) à celui du traitement habituel ou d un placebo (Z = ), sur la durée de survie. On a alors deux populations de fonctions de survie respectives S et S 1 : Si Z =, S(t Z =) = S (t) Si Z =1, S(t Z =1) = S 1 (t) = S (t) eβ Le modèle comporte donc un paramètre qui est une fonction, h (t), considéré en général comme nuisible, et p paramètres réels β 1,,β p qui sont les quantités à estimer, ou à tester, car elles représentent l effet sur la durée de survie de chacune des covariables correspondantes. 3 Vraisemblance partielle de Cox: Pour éliminer le paramètre nuisible totalement inconnu qu est la fonction de hasard, ou risque instantané debaseh, Cox dans son article initial (JRSS B, 1972), considère la vraisemblance partielle suivante: V Cox (β) = n Y i (t)r i (β,t) { k Y k(t)r k (β,t) }dn i (t) i=1 t où T (1) <T (2) < <T (n) désigne la suite des instants où alieuunévénement (mort ou censure), et r i (β,t)=h (t)e β Z i. A l instant T (i) sont observés: D(i) lanaturedel événement, (censure) ou 1 ( mort ). Z(i) la covariable, de dimension p, de l individu qui est mort. R(i) les individus encore àrisqueà l instant T (i) ainsi que la valeur de leurs covariables: Z (k), k R(i). C. Huber Partie V (42)
45 4 ESTIMATION Survie 45 On peut montrer que cette vraisemblance partielle a les mêmes propriétés qu une vraisemblance ordinaire. En temps continu, l hypothèse est faite qu il n y a aucun ex-aequo. Le raisonnement originel et intuitif de Cox est le suivant (Plusieurs auteurs ont donné depuis des justifications théoriques : Gill et Andersen (AS 1982), Andersen, Borgan, Gill, Keiding (1993)): Supposons que h soit arbitraire. Aucune information ne peut être donnée sur β par les intervalles de temps durant lesquels aucune mort (aucun événement) n a eu lieu, car on peut concevoir que h soit identiquement nulle dans ces intervalles. On devra alors travailler conditionnellement à l ensemble des instants où une mort a lieu. Si le temps est discrétisé, on conditionnera aussi sur le nombre des morts qui ont lieu à un instant donné, car alors il y a des ex-aequo, mais pour le moment nous travaillons en temps continu, et il n y a donc pas d ex-aequo. A partirdumomentoù l on désire une méthode d analyse valable pour tout h,ilparaît inévitable de considérer cette loi conditionnelle. La probabilité pour qu une mort se produise dans un petit intervalle de temps [T (i) ; T (i) + t] vautàpeuprès : e p j=1 β jz (k) j h (T (i) ) t k R(i) et la probabilité pour que cette mort soit celle de (i) sachant qu une mort a eu lieu vaut : e p j=1 β jz (i) j p k R(i) e j=1 β jz (k) j Et on reconnaît chacun des termes du produit qui forme la vraisemblance partielle de Cox V Cox. 4 Estimation On peut montrer que cette vraisemblance partielle a les mêmes propriétés qu une vraisemblance exacte. L estimateur de Cox s obtient en maximisant V c. Notant L c le logarithme de V c,onobtient: L c (β) = n i=1 [Y i (t)z i (t)β log( j Y j (t)r j (β,t))]dn i (t). (43) Le vecteur des dérivées partielles de L c par rapport aux composantes de β, ou vecteur des scores, noté U DL(β) vaut U(β) = n i=1 [Z i (s) Z(β,s)]dN i (s). (44) C. Huber Partie V
46 4 ESTIMATION Survie 46 où Z(β,s) est la moyenne pondérée des covariables Z sur les observations encore à risque à l instant s: Z(β,s)= Yi (s)r i (β,s)z i (s). (45) Yi (s)r i (β,s) La matrice d information est égale à l espérance de moins la matice des dérivées secondes: I(β) = n i=1 V (β,s)dn i (s). (46) où V est la variance (matrice de variance-covariance dans le cas où p est supérieur à 1) pondérée des covariables Z à l instant s: V (β,s)= n i=1 Y i(s)r i (β,s)[z i (s) Z(β,s)][Z i (s) Z(β,s)] i Y. (47) i(s)r i (β,s) L estimateur du maximum de vraisemblance partielle est obtenu en résolvant le système d équations: U( β) =. (48) Il y a en tout p équations, une pour chacune des p variables : j =1, 2,...,p. En général, les solutions ne peuvent être obtenues que par itération. La solution β est consistante et asymptotiquement normale avec pour moyenne β et pour matrice de variance-covariance [E(I(β)] 1, l inverse de l espérance de la matrice d information, notée I. C est la matrice carrée, p p, qui a pour termes les dérivées secondes du logarithme de la vraisemblance. Pour calculer cette espérance il faudrait avoir la loi de la censure. Or, on ne la connaît pas en général. Aussi la remplace-t-on par I( β) de terme général {k R(i)} Z(k) j Z (k) j I jj = r k ( β) ( {k R(i)} Z(k) j r k ( β))( {k R(i)} Z (k) j r k ( β)) {i:d i =1} {k R(i)} {k R(i)} r. k( β) (49) Maintenant que l on dispose de l estimateur de β de β, on peut estimer le risque cumulé de base H par l estimateur de Breslow: Ĥ (t) = t dni (s) Yj (s)e β Z j (s). (5) C. Huber Partie V
47 5 EXAMEN DES RÉSIDUS Survie 47 5 Examen des résidus 5.1 Résidus de martingale Une fois qu on a estimélesparamètres β et la fonction de base H, on peut se demander si le modèle est adéquat. Pour cela, on considère des résidus, et en particulier les résidus de martingales. Ces résidus peuvent être utilisés pour évaluer: 1. La forme fonctionnelle de l influence d une covariable, dans un modèle qui tient déjà compte des autres covariables. 2. L adéquation du modèle en ce qui concerne l hypothèse de hasards proportionnels. 3. L efficacité du modèle pour prédire ce qui attend un nouveau sujet. 4. L influence de chacun des sujets de l étude sur l estimation des paramètres. On prend comme base des résidus la différence entre le processus ponctuel et son compensateur: M i (t) =N i (t) t Y i (s)e β Z i (s) dh (s) (i =1,,n) (51) M i (t) est la martingale résiduelle associée au sujet i. On en a une estimation en y remplaçant β et H par leurs estimateurs: M i (t) =N i (t) t Y i (s)e β Z i (s) dĥ(s) (i =1,,n) (52) Notons M i ( ) simplement M i.lerésidu peut être interprété comme, à chaque instant t, la différence sur [t] entre le nombre d événements et son espérance conditionnelle, ou comme l excès de mort. Les résidus ont quelque unes des propriétés des résidus du modèle linéaire: 1. Mi (t) = t. 2. E( M i )=cov( M i, M j ) =, asymptotiquement. Pour un modèledecoxsanscovariabledépendant du temps, T i représentant la durée d observation du sujet i et D i le statut final, ce résidu se réduit à la forme simple: M i = D i Ĥ(T i )e β Z i. (53) On peut remarquer qu un résidu de martingale évolue entre et 1. C. Huber Partie V
48 5 EXAMEN DES RÉSIDUS Survie Résidus des scores Les scores de la vraisemblance partielle sont le gradient du logarithme de la vraisemblance partielle: [ log(vc) β j ] β=b = n i=1 = n i=1 L ij (b, ) {Z ij(s) Z j (b, s)}dn i (s) {Z ij(s) Z j (b, s)}d M i (s) où Z j (b, s) Yi (s)r i (b, s)z ij (s) Yi (s)r i (b, s) (54) est la moyenne pondérée des covariables des sujets àrisqueà l instant s. L égalitécidessus (remplacement de dn i par d M i ) s obtient en remplaçant Ĥ par l estimateur de Breslow (4) pris au point b. Ondéfinit alors L ij ( β,.) comme le processus des scores et L ij ( β, ) comme le résidu des scores du sujet i et de la jème covariable. Par définition de β, la somme de résidus des scores est égale à. Lesrésidus des scores ne sont qu un exemple de la classe des transformés des résidus de martingales. 5.3 Résidus de la déviance L un des défauts des résidus de martingale est leur asymétrie (skewness en anglais). En effet, la valeur maximale d un tel résidu est 1, alors que sa valeur minimale est. Le résidu d un sujet est positif lorsque le sujet expérimente l événement avant que son taux de hasard cumulé n atteigne la valeur 1, sinon il est négatif. On peut donc effectuer une transformation qui donne une forme plus standard à la loi de ces résidus. La déviance est définie comme Dev =2{log(Vraisemblance du modèle sature) log(v c ( β))} (55) où unmodèle dit saturé estunmodèle pour lequel β est complètement libre, c est à dire que chaque sujet peut avoir son propre β. Il peut aussi y avoir des paramètres nuisibles qui sont maintenus constants pour l un et l autre modèle. Par exemple, dans le modèle linéaire, le paramètre nuisible est la variance σ 2. Dans notre modèle, ce sera le hasard de base cumulé H. Le résidu de la déviance du sujet i, noté d i,estdéfini comme la racine carrée du ième terme de la somme qui définit Dev, précédée du signe de M i : d i = sgn( M i )[ 2{ M i + D i log D i M i ) 1/2 (56) La fonction logarithme augmente les résidus compris entre et 1, tandis que la racine carrée contracte les valeurs négatives. C. Huber Partie V
49 7 FRAGILITÉ Survie résidus de Cox et Snell Ce sont les résidus qui consistent à 1. calculer, pour chaque observation X i, Y i = Ĥi(X i ), 2. calculer l estimateur de Nelson-Aalen du taux cumulé desy i, 3. comparer la courbe de ce taux cumulé au taux cumulé d une exponentielle de paramètre 1, première bissectrice des axes. 6 Modèle de Cox stratifié Par exemple, au lieu de supposer que l effet du sexe sur la survie est constant dans le temps et multiplicatif sur le risque comme dans un modèledecoxoùlacovariable sexe, notée ξ, etégale à pour un homme, et 1 pour une femme introduit un facteur e bξ dans le risque instantané: h(t Ξ =ξ,z = z) =h (t)e bξ+β z on peut faire l hypothèse que c est le risque de base qui est différent chez les hommes et chez les femmes. On dit alors qu on a un modèle de Cox stratifié: à chacun des deux sexes correspond une strate différente. Cependant, on continue de supposer que les covariables Z agissent de la même manière sur les deux risques instantanés, qui, eux sont différents: h(t ξ =,Z = z) =h (t)e β z h(t ξ =1,Z = z) =h 1 (t)e β z Les deux fonctions h et h 1 ainsi que le paramètre p-dimensionnel β sont supposés inconnus dans ce modèle. On utilise aussi la vraisemblance partielle pour estimer les paramètresdecemodèle. 7 Généralisation: les modèles de fragilité Les modèles de fragilité sont une généralisation du modèle de Cox. prenons par exemple un modèle de régression exponentiel: h(t Z) =h e <β,z> où <β,z>signifie β 1 Z 1 +β 2 Z 2 + +β p Z p,eth est une constante. On a alors, pour chaque valeur de Z un risque instantané constant, mais différent. Dans le modèle de Cox, h n est plus supposé constant mais dépendant du temps: h = h (t). Alors, si C. Huber Partie V
50 7 FRAGILITÉ Survie 5 on calcule la fonction de survie, elle vaut: S(t Z = z) = e t h(x z)dx = e e<β,z> t h (x)dx = e e<β,z> H (t) = (S (t)) eβz> Quelle est la raison pour laquelle nous devons généraliser ces modèles? Les modèles et méthodes standards supposent que la population est homogène. Or dans cetaines situations, cette hypothèse n est pas réalste. Les gens sont différents. Par exemple, ils peuvent avoir une prédisposition génétique à certaines maladies. On peut essayer de modéliser cette hétérogénéité en l introduisant dans le modèle. Aussi introduisons nous dans le modèle une nouvelle covariable, non observée, Z : On note h(t Z, Z )=h (t)e β Z e <β,z> η = e β Z où η est une variable aléatoire réelle positive de fonction de répartition F η (η) appelée la fragilité, ou frailty en anglais. La fonction de survie s écrit donc: S(t Z, η) = e t h (s)ηe <β,z> = e ηe<β,z> H (t) Comme η n est pas observée, la survie doit être moyennée sur η: S(t Z) = e ηe<β,z> H (t) df η (η). Exemple: Soit un modèle de Cox S(t Z) =e e<β,z>h (t),oùlerisquedebaseestexponentiel,de telle sorte qu en fait S(t Z) =e e<β,z>h t. Le choix le plus habituel pour la loi F η de la fragilité est la loi gamma de densité: f(a, b) = 1 b a Γ(a) xa 1 e x b. Alors on a: E(η) = ab Var(η) = ab 2 On suppose en général que la moyenne de η est égale à 1 et on prend alors comme unique paramètre de la loi sa variance, notée c ce qui donne: E(η) = ab = 1 Var(η) = ab 2 = c η g(1/c, c) C. Huber Partie V
51 7 FRAGILITÉ Survie 51 Le paramètre c, qui caractérise la variabilité de la fragilité peut être supposé connu ou inconnu. Regardons ce que devient la fonction de survie dans ce cas: S(t Z) = e ηe<β,z>h (t) f η (η)dη = e ηe<β,z>h (t) 1 c 1/c Γ(1/c) η1/c 1 e η/c dη η 1/c 1 e (1/c+e<β,Z> H (t))η dη = 1 c 1/c Γ(1/c) = 1 c 1/c Γ(1/c) Γ(1/c) (1/c+e<β,Z> H (t)) 1 (1/c+e <β,z> H (t)) 1/c 1 = (1/c+e<β,Z>H (t) ) 1/c c 1/c = (1+ce <β,z> H (t)) 1/c = e 1 c log(1+ce<β,z> H (t)) = e (log(1+ce<β,z> H (t))) 1/c = e G(e<β,Z> )H (t)) On voit donc par ce calcul qu un modèle de fragilité gamma généralise le modèle de Cox de la manière suivante: Pour la fragilité gamma, on a le modèle: avec S(t Z) =e G(e<β,Z> H (t)) G(u) = log((1 + cu) 1/c ) alors que pour le modèle de Cox, la fonction G est simplement l identité: G(u) = u. On pourra remarquer qu on obtient la fonction G en prenant moins le logarithme de la transformée de Laplace de la loi de la variable η de fragilité. C. Huber Partie V
52 1 LE PROBLÈME Survie 52 Partie VI Comparaison de deux échantillons. 1 Le problème Soient deux échantillons A et B de tailles respectives n A et n B de somme n. Les observations sont de la forme (T i,δ i,g i ) i=1,2,...,n où, pour l individu i, T i est la durée observée, δ i est l indicateur de mort, qui vaut 1 s il y a mort et sinon, et G i l indicateur de groupe qui vaut dans A et 1 dans B. Pour simplifier l écriture des expressions précédentes dans ce cas, les notations adoptées sont généralement les suivantes : R A,i = j A 1 {Tj T i }, le nombre d individus àrisquedeaent i, R B,i = j B 1 {Tj T i }, le nombre d individus àrisquedebent i, R i = R A,i + R B,i = j n 1 {Tj T i }, le nombre total d individus àrisqueent i, V n désigne la vraisemblance de Cox de l échantillon, L n son logarithme, DL n le vecteur des scores, dérivées premières par rapport au paramètre β, etd 2 L n la matrice des dérivées secondes de L n par rapport à β. Le modèle est le suivant : et les hypothèses àtester: h B (t) =h A (t)e θψ(t) H : θ = (h A = h B ) H 1 : θ (ψ Ψ)). Sous l hypothèse nulle, il n y a aucune différence entre les deux groupes, alors que sous l alternative, il y a une différence caractérisée par la famille de fonctions Ψ. Par exemple 1. Si Ψ est dans l ensemble des fonctions constantes, l hypothèse est celle des risques proportionnels, C. Huber Partie VI
53 2 TESTS FONDÉS SUR LES SCORES Survie Si Ψ est dans l ensemble des fonctions positives croissantes, etθ positif, B est pire que A et la situation s aggrave au cours du temps. 3. Si Ψ est dans l ensemble des fonctions négatives décroissantes, etθ positif B est meilleur que A et le gain est de plus en plus grand. Par rapport àlasituation précédente, on a simplement une interversion de A et B. 4. Si Ψ est dans l ensemble des fonctions croissantes traversant, etθ positif, B est d abord meilleur puis pire que A. 5. Si Ψ est dans l ensemble des fonctions croissantes puis décroissantes, etθ positif, tout dépend des traversées de. Pour tester ces deux hypothèses, nous allons considérer deux classes de tests dont on montrera qu elles n en font qu une en réalité :les tests fondés sur les scores et les tests de la classe K. Ce sont tous des tests du log-rank pondérés. 2 Tests fondés sur les scores La vraisemblance V n s écrit avec les notations précédentes : V n = n { h B (T i ) G i h A (T i ) 1 G i } δi. R B,i h B (T i ) G i + RA,i h A (T i ) 1 G i i=1 Le logarithme de la vraisemblance L n vaut : L n = n δ i G i log h B(T i ) n h A (T i ) δ i log(r B,i e θψ(ti) + R A,i ) i=1 i=1 où le premier logarithme est égal à θψ. Les scores valent donc : DL n (θ) = DL n () = n i=1 n i=1 { δ i ψ(t i ) G i { δ i ψ(t i ) G i R B,i e θψ(t i) R B,i e θψ(t i) + R A,i } R B,i. R B,i + R A,i }, On reconnaît ce que l on appelle les tests du log-rank pondérés, les poids w i étant ici égaux aux D i ψ(ti). Ces poids peuvent être déterministes : w i = 1 donne le test du log-rank C. Huber Partie VI
54 4 TESTS DE LA CLASSE K Survie 54 aléatoires, etnedépendant alors que de F t : w i = R(Ti) w i = R(Ti) w i = ŜA(t )ŜB(t )R(t) R A (t)r B (t) qui correspond au test de Gehan (Wilcoxon s il n y a pas de censure), intermédiaire entre log-rank et Gehan, qui est le test d Efron, où ŜA(t ) est l estimateur de Kaplan-Meier de la fonction de survie dans A en t. 3 Utilisation des processus ponctuels Tous les tests précédents sont de la forme générale n } R B,i w i {G i R B,i + R A,i i=1 K(t){ dn B(t) R B (t) dn A(t) R A (t) } où K est prévisible. En effet, notons w i = w(t i ), } R B,i { w i {G i = w(t i ) 1 i:δ i =1 R B,i + R A,i = On prend alors pour K la fonction i:δ i =1,i B 4 Tests de la classe K w(t) R A(t)R B (t) R(t) K(t) =w(t) R A(t)R B (t). R(t) } R B,i R B,i + R A,i { dnb (t) R B (t) dn A(t) R A (t) Par définition, ce sont des tests fondés sur une statistique de la forme W (t) = t K{ dn B R B dn A R A } i:δ i =1,i A où K(u) nedépend que de ce qui s est passé jusqu à l instant u, donc c est un processus prévisible. Les hypothèses qui suivent assurent la normalité asymptotique de la statistique W, sous l hypothèse nulle et sous une alternative contigüe où les fonctions de survie S n A }. R B,i w(t i ) R B,i + R A,i C. Huber Partie VI
55 5 PROPRIÉTÉS DES TESTS DE LA CLASSE K Survie 55 dans A et S n B dans B convergent vers la fonction de survie S de l hypothèse nulle : Hypothèses : (A 1 ) Quand n tend vers l infini, n A et n B tendent vers l infini de telle sorte que n A n q A, n B n q B. (A 2 ) S n A (t) S (t) uniformément sur [, [ quand n S n B (t) S (t) uniformément sur [, [ quand n de telle sorte que (A 3 ) notons γ = γ B γ A. h n 1 A(t) = h (t)[1 + γ A (t) + o( 1 )], nqa q B n h n 1 B(t) = h (t)[1 + γ B (t) + o( 1 )]; nqa q B n R A (t) n A r A (t) en probabilité, uniformément sur [, [ quand n, R B (t) n B r B (t) en probabilité, uniformément sur [, [ quand n, où les fonctions r A et r B sont les queues des durées T observées dans A et B, r A = S TA et r A = S TB, elles font par conséquent intervenir la censure, qui n est pas forcément supposée de même loi dans A et B. (A 4 ) K(t) nqa q B k(t), fonction déterministe, en probabilité quand n, uniformément sur les intervalles fermés de I = t :inf{r A (t),r B (t)} >. 5 Propriétés des tests de la classe K Théorème 3 : (Normalité asymptotique de W ). Sous les hypothèses (A1,...,A4), quandn tend vers l infini, la loi de W (t) tend vers la loi normale N (m t,σ 2 t ) où σ 2 t = t µ t = t k(u)γ(u) h (u) du, q A r A (u)+q B r B (u) k 2 (u) h (u) du. r A (u)r B (u) C. Huber Partie VI
56 5 PROPRIÉTÉS DES TESTS DE LA CLASSE K Survie 56 Démonstration : Remarquons que R A (t)/n A est la proportion de ceux qui restent àrisqueà l instant t dans A, c est à dire aussi l empirique de la probabilité P A (C u, X u) =S TA (u), queue de la distribution de la durée observée dans A. Remarquons aussi que dn A (t)/r A (t) est l empirique du taux de mort dans A, c est àdireh A (t)dt, etquee[dn A (t)/r A (t) Ft ]=h A (t)dt. Autrement dit, c en est un estimateur sans biais. Décomposons W en la somme de trois termes où W = U + V + R U(t) = t V (t) = R(t) = t t k (u) nq A q B { dna (u) } R A (u) h A(u) du, k (u) nq A q B { dnb (u) R B (u) h B(u) du k (u) nq A q B {h A (u) h B (u)} du, }, où k = k + o( n), et où R A h A compense dn A et R B h B compense dn B. Etudions séparément chacun des trois termes en remarquant que c est R qui constitue la partie principale, il s écrit en effet R(t) = t Pour U (et V ), nous utilisons l approximation k(u) γ(u) nq A q B h (u) du + o(1) = µ t + o(1). nqa q B dn A (t) R A (t)h A (t) R A (t) dm A(t) n A r A (t), alors U(t) t k(u) dm A (u) t nq A q B n A r A (u) = k(u) n na nb dm A (u) r A (u) U est donc une martingale comme intégrale d un processus prévisible par rapport à la martingale M A. Elle est de moyenne nulle et de processus de variation t k 2 (u) R A (u) <U>(t) = n n B ra 2 (u) h A(u) du. Comme R A (u)h A (u) du = d<m A > (u) ete(r A )=n A r A,leprocessusdevariation de U, <U>converge : n A C. Huber Partie VI
57 6 EXEMPLE: Survie 57 t <U>(t) k 2 (u) q B r A (u) h (u) du. Comme le comportement de U esttoutà fait analogue à celui de V,ona,pour U + V : <U+ V>(t) t k 2 (u)( q B r A (u) + q A r B (u) )h (u) du. 6 Exemple: Prenons comme alternative S B =(S A ) exp{β/ n} qui correspond à un changement d échelle pour la loi de Weibull, et en particulier pour l exponentielle. Alors γ n = γ B γ A = h B h A nqa q B h A H B = log S B = e β/ n ( log S A )=e β/ n H A h B = h A + h A { β n +(e β/ n 1 β n )} γ n γ = β q A q B. Pour chaque choix de K, onaurauntestd efficacité e(k, t) =(m t /s t ) 2 valant : { t e(k, t) = k(u)γ(u) h (u) du} 2 t q A r A (u)+q B r B (u) r A (u)r B k (u) 2 (u) h (u) du =(µ t ) 2. σ t Le problème qui se pose est donc de choisir le test optimal dans cette classe, c est à dire la fonction k, et la fonction aléatoire K quiconvergeraversk, lorsqu on connaît γ et le taux de base h. Il faut donc maximiser e(k, t) ci-dessus. Supposons que k soit de la forme où a est une constante, k = a γ ϕ + v ϕ = q Ar A + q B r B r A r B C. Huber Partie VI
58 6 EXEMPLE: Survie 58 et v est orthogonal à γ pour H : vγ dh =. Alors, l efficacité s écrit : e(k, t) = { t ( aγ + v)γdh ϕ } 2 t ( aγ + = ϕ v)2 ϕdh { t aγ 2 dh ϕ } 2 t ( a2 γ 2 + ϕ v2 ) dh qui est maximum pour v =. La meilleure fonction k est donc proportionnelle (a pouvant être quelconque) à k(t) = γ(t) ϕ(t) = γ(t) r A (t)r B (t) q A r A (t)+q B r B (t). Exemple On doit choisir K n (t) prévisible tel que K n (t) k(t) avec k(t) =β r A (t)r B (t) q A q B q A r A (t)+q B r B (t). C. Huber Partie VI
59 Survie 59 Partie VII Exercices. 1. Prouver que la loi gamma de densité: f(t α, λ) = λα Γ(α) tα 1 e λt, α >, λ > a un risque instantané croissant pour α>1 et décroissant pour α<1. Tracer ces densités pour diverses valeurs des paramètres λ et α en utilisant le logiciel Splus. 2. Calculer l information de Fisher d une observation d une loi exponentielle avec censure droite de type Tracer les fonctions de survie de la loi de Weibull S(t α, λ) =e (λt)α pour diverses valeurs des paramètres α et λ en utilisant le logiciel Splus. 4. Calculer la matrice d information d un échantillon de n durées de survie suivant la loi de Weibull de fonction de survie souffrant d une censure droite aléatoire. S(t α, λ) =e (λt)α 5. De février 1998 à février 21, 29 patients atteints d une grave hépatite virale ont été admis dans un essai thérapeutique de 16 semaines sur l effet d une thérapie à base de stérodes. Ils ont été randomisés entre deux groupes, dont l un recevait le traitement et l autre le placebo. Les durées de survie, en semaines, des 14 patients du groupe traité ontété: 1, 1, 1, 1 +, 4 +, 5, 7, 8, 1, 1 +, 12 +, 16 +, 16 +, (a) On ne fait aucune hypothèse sur la loi de la durée de survie sous le traitement. Estimer la fonction de survie S de la durée de survie sous le traitement en utilisant: Estimer le taux cumulé Λgrâce à l estimateur de nelson-aalen, Estimer la fonction de survie S de la durée de survie sous le traitement en utilisant L estimateur de Harrington et Fleming, L estimateur de Kaplan-Meier. Tracer ces deux estimateurs sur un même graphe grâce àslus. C. Huber Partie VII
60 Survie 6 (b) On suppose que la loi de la survie obéit àunmodèle exponentiel de paramètre λ, c est à dire de risque instantané égal à λ. Estimer λ par la méthode du maximum de vraisemblance et construire un intervalle de confiance de coefficient de confiance 95%. Estimer la probabilité desurvivreplusde16semainesetconstruireun intervalle de confiance de confiance 95%. Estimer la médiane du temps de survie et construire un intervalle de confiance de confiance 95%. (c) Tracer sur un même graphe les trois estimateurs ainsi obtenus pour la fonction de survie. Qu en pensez vous? 6. Pour les données de Embury et al sur la durée de rémission de la leucémie aigue, calculer un estimateur de l écart type de l estimateur de Kaplan-Meier de la fonction de survie. C. Huber Partie VII
61 TABLE DES MATIÈRES Survie 61 Partie VIII Quelques références En Français: 1. Analyse Statistique des Données de Survie, C.Hill, C. Com-Nougué, A. Kramar, T. Moreau, J. O Quigley, R. Senoussi,Cl. Chastang, Flammarion Sciences, 1996, 3ème édition, Analyse Statistique des Durées de Vie, C. Carbon, C. Huber, J.P. Lecoutre, Chr. Gouriéroux,ed. Droesbeke, Fichet, Tassi, Economica, En Anglais: 1. Accelerated Life Models; Modeling and Statistical Analysis, V. Bagdonovicius and Nikulin, 22, Kluwer Ac. Publ. 2. Censored data analysis, D. Cox, 3. Counting Processes and Survival Analysis, T.R. Fleming and D.P. Harrington, Wiley series in Probability and Mathematical Statistics, Analysis of Survival Data. D.R. Cox and D. Oakes, Chapman et Hall, Table des matières I Introduction 1 1 Quelques exemples 1 2 Cinq fonctions équivalentes 3 3 Les trois types de censure 5 4 le processus ponctuel N(t) 7 II Sans Modèle: Approche Non Paramétrique. 11 C. Huber Partie VIII
62 TABLE DES MATIÈRES Survie 62 1 Estimateur de Nelson-Aalen Définition ExempledeNelson-Aalen InterprétationdeNelson-Aalen VariancedeNelson-AAlen Estimation de S Estimateur de Harrington et Fleming de S:ŜHF Kaplan-Meier Traitementdesex-aequo Estimateur de Breslow du risque cumulé H:ĤBr Estimateur de Greenwood de la variance de ŜKM: III Processus Ponctuels. 2 1 Modélisation du processus ponctuel: l histoire ou filtration F t 2 2 Définition d une martingale Sommes de variables aléatoires indépendantes: Définition Propriétés d une martingale Le compensateur ou processus de variation prévisible <M>(t) d une martingale M Le processus de variation quadratique ou de variation optionnelle [M] d une martingale M Exemples Convergence vers la loi normale: 26 5 Martingale et compensateur associés à un processus ponctuel de comptage 27 IV Modèles paramétriques Risque instantané constant La loi exponentielle E(λ) Risque instantané monotone Lois de Weibull W (α, λ) Lois Gamma G(θ, ν) Lois de Gompertz-Makeham GM(γ,γ 1,γ 2 ) C. Huber Partie VIII
63 TABLE DES MATIÈRES Survie Mélanged exponentielles Weibull généralisée Weibull exponentiée Risque instantané en Loislog-normales Log-logistiques Gaussienneinverse Birnbaum et Saunders Weibull généralisée Adéquation des modèles 41 V Le modèle semi-paramétrique de Cox 43 1 Définition du modèle 43 2 Un exemple simple:un essai clinique 44 3 Vraisemblance partielle de Cox: 44 4 Estimation 45 5 Examen des résidus Résidusdemartingale Résidusdesscores Résidus de la déviance résidusdecoxetsnell Modèle de Cox stratifié 49 7 Fragilité 49 VI Comparaison de deux échantillons Le problème 52 2 Tests fondés sur les scores 53 3 Utilisation des processus ponctuels 54 4 Tests de la classe K 54 C. Huber Partie VIII
64 TABLE DES MATIÈRES Survie 64 5 Propriétés des tests de la classe K 55 6 Exemple: 57 VII Exercices. 59 VIII Quelques références 61 C. Huber Partie VIII
MODELES DE DUREE DE VIE
MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions
Analyse des durées de vie avec le logiciel R
Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger
La survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Chapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Modélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Le modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
Probabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
4. Martingales à temps discret
Martingales à temps discret 25 4. Martingales à temps discret 4.1. Généralités. On fixe un espace de probabilités filtré (Ω, (F n ) n, F, IP ). On pose que F contient ses ensembles négligeables mais les
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
La fonction exponentielle
DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction
Moments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Simulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer
Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy
3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. [email protected]. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier [email protected] http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Baccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Continuité et dérivabilité d une fonction
DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité
Correction de l examen de la première session
de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi
Méthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Texte Agrégation limitée par diffusion interne
Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse
TSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
4 Distributions particulières de probabilités
4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli
Estimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme
Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet
Théorème du point fixe - Théorème de l inversion locale
Chapitre 7 Théorème du point fixe - Théorème de l inversion locale Dans ce chapitre et le suivant, on montre deux applications importantes de la notion de différentiabilité : le théorème de l inversion
Précision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
PROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Programmes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Les indices à surplus constant
Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté
Filtrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Modèles à Événements Discrets. Réseaux de Petri Stochastiques
Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés
I. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
CCP PSI - 2010 Mathématiques 1 : un corrigé
CCP PSI - 00 Mathématiques : un corrigé Première partie. Définition d une structure euclidienne sur R n [X]... B est clairement symétrique et linéaire par rapport à sa seconde variable. De plus B(P, P
3. Conditionnement P (B)
Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante
Processus aléatoires avec application en finance
Genève, le 16 juin 2007. Processus aléatoires avec application en finance La durée de l examen est de deux heures. N oubliez pas d indiquer votre nom et prénom sur chaque feuille. Toute documentation et
Correction du Baccalauréat S Amérique du Nord mai 2007
Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n
Que faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Variables Aléatoires. Chapitre 2
Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,
Résolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Chapitre 0 Introduction à la cinématique
Chapitre 0 Introduction à la cinématique Plan Vitesse, accélération Coordonnées polaires Exercices corrigés Vitesse, Accélération La cinématique est l étude du mouvement Elle suppose donc l existence à
Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.
I. Introduction. 1. Objectifs. Le but de ces quelques séances est d introduire les outils mathématiques, plus précisément ceux de nature probabiliste, qui interviennent dans les modèles financiers ; nous
Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Fonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Correction du baccalauréat ES/L Métropole 20 juin 2014
Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)
Limites finies en un point
8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,
Travaux dirigés d introduction aux Probabilités
Travaux dirigés d introduction aux Probabilités - Dénombrement - - Probabilités Élémentaires - - Variables Aléatoires Discrètes - - Variables Aléatoires Continues - 1 - Dénombrement - Exercice 1 Combien
M2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre
IUFM du Limousin 2009-10 PLC1 Mathématiques S. Vinatier Rappels de cours Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre 1 Fonctions de plusieurs variables
CAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options
Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce
CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.
CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE EQUATIONS DIFFERENTIELLES Le but de ce chapitre est la résolution des deux types de systèmes différentiels linéaires
Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.
1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le
MATHS FINANCIERES. [email protected]. Projet OMEGA
MATHS FINANCIERES [email protected] Projet OMEGA Sophia Antipolis, septembre 2004 1. Introduction : la valorisation de contrats optionnels Options d achat et de vente : Call et Put Une option
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300
I3, Probabilités 2014 Travaux Dirigés TD 1 : rappels. Exercice 1 Poker simplié On tire 3 cartes d'un jeu de 52 cartes. Quelles sont les probabilités d'obtenir un brelan, une couleur, une paire, une suite,
Rappels sur les suites - Algorithme
DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................
PRIME D UNE OPTION D ACHAT OU DE VENTE
Université Paris VII - Agrégation de Mathématiques François Delarue) PRIME D UNE OPTION D ACHAT OU DE VENTE Ce texte vise à modéliser de façon simple l évolution d un actif financier à risque, et à introduire,
Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que
Introduction. On suppose connus les ensembles N (des entiers naturels), Z des entiers relatifs et Q (des nombres rationnels). On s est rendu compte, depuis l antiquité, que l on ne peut pas tout mesurer
Cours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Développements limités, équivalents et calculs de limites
Développements ités, équivalents et calculs de ites Eercice. Déterminer le développement ité en 0 à l ordre n des fonctions suivantes :. f() e (+) 3 n. g() sin() +ln(+) n 3 3. h() e sh() n 4. i() sin(
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4) Bernard Le Stum Université de Rennes 1 Version du 13 mars 2009 Table des matières 1 Fonctions partielles, courbes de niveau 1 2 Limites et continuité
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de :
Chapitre 1 L intérêt Au terme de ce chapitre, vous serez en mesure de : 1. Comprendre la notion générale d intérêt. 2. Distinguer la capitalisation à intérêt simple et à intérêt composé. 3. Calculer la
F411 - Courbes Paramétrées, Polaires
1/43 Courbes Paramétrées Courbes polaires Longueur d un arc, Courbure F411 - Courbes Paramétrées, Polaires Michel Fournié [email protected] http://www.math.univ-toulouse.fr/ fournie/ Année 2012/2013
Espérance conditionnelle
Espérance conditionnelle Samy Tindel Nancy-Université Master 1 - Nancy Samy T. (IECN) M1 - Espérance conditionnelle Nancy-Université 1 / 58 Plan 1 Définition 2 Exemples 3 Propriétés de l espérance conditionnelle
Calcul différentiel sur R n Première partie
Calcul différentiel sur R n Première partie Université De Metz 2006-2007 1 Définitions générales On note L(R n, R m ) l espace vectoriel des applications linéaires de R n dans R m. Définition 1.1 (différentiabilité
3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Calcul fonctionnel holomorphe dans les algèbres de Banach
Chapitre 7 Calcul fonctionnel holomorphe dans les algèbres de Banach L objet de ce chapitre est de définir un calcul fonctionnel holomorphe qui prolonge le calcul fonctionnel polynômial et qui respecte
Lagrange, où λ 1 est pour la contrainte sur µ p ).
Chapitre 1 Exercice 1 : Portefeuilles financiers Considérons trois types d actions qui sont négociées à la bourse et dont les rentabilités r 1, r 2 et r 3 sont des variables aléatoires d espérances µ i
(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Continuité en un point
DOCUMENT 4 Continuité en un point En général, D f désigne l ensemble de définition de la fonction f et on supposera toujours que cet ensemble est inclus dans R. Toutes les fonctions considérées sont à
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Introduction à la théorie des files d'attente. Claude Chaudet [email protected]
Introduction à la théorie des files d'attente Claude Chaudet [email protected] La théorie des files d'attente... Principe: modélisation mathématique de l accès à une ressource partagée Exemples réseaux
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Complément d information concernant la fiche de concordance
Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours
Séminaire TEST. 1 Présentation du sujet. October 18th, 2013
Séminaire ES Andrés SÁNCHEZ PÉREZ October 8th, 03 Présentation du sujet Le problème de régression non-paramétrique se pose de la façon suivante : Supposons que l on dispose de n couples indépendantes de
Exercices - Polynômes : corrigé. Opérations sur les polynômes
Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)
La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal
La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal
Chapitre 6. Fonction réelle d une variable réelle
Chapitre 6 Fonction réelle d une variable réelle 6. Généralités et plan d étude Une application de I dans R est une correspondance entre les éléments de I et ceu de R telle que tout élément de I admette
Baccalauréat ES Amérique du Nord 4 juin 2008
Baccalauréat ES Amérique du Nord 4 juin 2008 EXERCICE 1 Commun à tous les candidats f est une fonction définie sur ] 2 ; + [ par : 4 points f (x)=3+ 1 x+ 2. On note f sa fonction dérivée et (C ) la représentation
Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications
Université Paris-Dauphine DUMI2E 1ère année, 2009-2010 Applications 1 Introduction Une fonction f (plus précisément, une fonction réelle d une variable réelle) est une règle qui associe à tout réel x au
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
Les mathématiques de la finance Université d été de Sourdun Olivier Bardou [email protected] 28 août 2012 De quoi allons nous parler? des principales hypothèses de modélisation des marchés, des
Le modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
