Université Victor Segalen - Bordeaux 2

Dimension: px
Commencer à balayer dès la page:

Download "Université Victor Segalen - Bordeaux 2"

Transcription

1 Université Victor Segalen - Bordeaux 2 Année 2000 Thèse n 719 THÈSE pour le DOCTORAT DE L UNIVERSITÉ DE BORDEAUX 2 Mention : Sciences Biologiques et Médicales Option : Épidémiologie et Intervention en Santé Publique présentée et soutenue publiquement le 31 Mars 2000 par Melle Virginie RONDEAU ANALYSE PAR VRAISEMBLANCE PENALISEE DE DONNEES DE SURVIE GROUPEES : APPLICATION A LA RELATION ENTRE ALUMINIUM ET DEMENCE. Membres du Jury Monsieur le Professeur R. SALAMON Président Monsieur le Docteur D. HEMON Rapporteur Monsieur le Docteur JH. PETERSEN Rapporteur Madame le Professeur C. HUBER Examinateur Monsieur le Professeur JF. DARTIGUES Examinateur Monsieur le Docteur D. COMMENGES Directeur de thèse

2 A mes parents A ma famille A mes amis

3 A Monsieur le Professeur Roger Salamon : Je vous remercie d avoir accepté de présider ce jury. J ai eu la chance d être accueillie dans votre laboratoire et ceci a été pour moi l occasion d un grand enrichissement. Pour votre soutien à ma carrière et la confiance que vous m accordez, soyez-en ici remercié et trouvez ici le témoignage de ma plus profonde gratitude. A Monsieur le Docteur Denis Hémon : Vous me faites un grand honneur en acceptant de consacrer votre temps précieux pour juger cette thèse. J ai été très touché par l intérêt que vous avez porté à ce travail. Le fruit de vos reflexions et votre rigueur scientifique ont contribué à compléter ce document de manière pertinente. Veuillez recevoir mes plus vifs remerciements et l expression de ma sincère considération. A Monsieur le Docteur Jørgen Holm Petersen : You honore me to judge this work. I have much admiration for the quality of your work. I am very grateful for your presence among my judges. A Monsieur le Professeur Jean François Dartigues : J ai eu la chance d être également accueillie au sein de votre équipe. Votre enthousiasme, votre optimisme, vos conseils précieux en épidémiologie et la confiance que vous m avez accordée m ont permis de mener à bien ce travail. Je tiens à vous communiquer toute mon admiration et mes remerciements. A Madame le Professeur Catherine Huber : Je suis très sensible à l honneur que vous me faites en acceptant de juger cette thèse et je vous en remercie très vivement.

4 A Monsieur le Docteur Daniel Commenges : Je vous remercie de m avoir confié ce(s) sujet(s) de recherche. Votre disponibilité et les remarques constructives que vous avez su me prodiguer m ont permis de mener à bien ce travail et d améliorer mes connaissances. Trouvez ici le témoignage de ma profonde reconnaissance pour la confiance que vous m avez accordée dans la conduite de ces divers travaux.

5 Mes remerciements les plus chaleureux vont aussi à : Hélène, Luc et Pierre pour leur relecture attentive et constructive. Un grand merci pour tout le temps que vous m avez consacré et pour tous vos conseils précieux. l équipe Paquid pour leur sympathie, leur gaieté et leur grand soutien et plus particulièrement Annick, Catherine, Christophe, Marie-Hélène, Muriel et les psychologues. tous les membres de l Unité INSERM 330, pour leur sympathie et leur aide, notamment Alioum, Alphonse, Franck, Marie-Noëlle, Marthe-Aline, Réza, Sébastien, Valérie. Aline, Bene, Cathy, Caro, Chocho, Denis, Flo, JC, Laurent, Nadia, Nath, Olivier, Sophie mes amis, mes confidents, ceux qui me font rire et qui ont su me soutenir dans tous les moments. Cette thèse est enfin l occasion de vous exprimer mon profond attachement. maman, papa, Bibiche, Katia, Rejane, Olivier, Philippe, Hugo, Toinou, et toute ma famille qui ont contribué à leur manière à la réalisation de ce travail... Mes remercients vont également à la Fondation pour la Recherche Médicale qui m a aidée financièrement pour terminer cette thèse.

6 Table des matières 1 Introduction Problématique épidémiologique Différentes situations de données hétérogènes Schémas de données corrélées Données groupées Données répétées Données récurrentes Différents événements Objectifs et plan Modèles de survie pour données hétérogènes Définitions et notations en analyse de survie Différence entre données censurées et tronquées Fonction associée aux distributions de survie Estimation Modèles de régression Analyse de données multivariées : approche marginale Le modèle Matrice de variance-covariance corrigée Analyse de données multivariées : modèle à fragilité Le modèle simple à fragilité Le modèle à fragilité partagée Modèle à fragilité corrélée Estimations

7 3 Approche par vraisemblance pénalisée Vraisemblance pénalisée et modèle à fragilité Approximation par splines de la fonction de risque Estimation du paramètre de lissage Validation croisée Méthode à degrés de liberté fixé Variance des paramètres Estimateurs sans biais Tests statistiques Bandes de confiance Approche classique Approche bayesienne Etude par simulations Comparaison avec l algorithme EM Schéma d étude Programme Résultats des simulations Simulations illustratives Schéma d étude Résultats Etude de la relation aluminium-démence Démence et maladie d Alzheimer Hypothèse de la relation aluminium et démence Mécanisme d action possible de l aluminium Etudes épidémiologiques Précédents travaux sur l étude Paquid - ALMA Méthodologie de l étude ALMA Analyse des données groupées dans Paquid Méthode Résultats des analyses Estimation des fonctions de risque conditionnelles et marginales Discussion

8 6 Conclusion générale 94 Bibliographie 104 A Taux d incidence de la démence par commune dans Paquid 105 Index des notations 108

9 Résumé Les modèles classiquement utilisés en analyse de survie supposent l indépendance des temps de survie. Cette hypothèse peut être remise en cause lorsque l on étudie des données groupées. Les modèles de survie à fragilité partagée permettent de traiter l hétérogénéité des temps de survie entre groupes. Nous proposons une nouvelle méthode d estimation par vraisemblance pénalisée dans un modèle stratifié à fragilité gamma partagée dans un cadre de données censurées à droite et tronquées à gauche. Cette méthode permet d estimer simultanément une mesure de corrélation intra-groupe et des paramètres de régression et de corriger la variance des paramètres de régression spécifiques aux groupes. Cette méthode permet aussi d estimer non-paramétriquement la fonction de risque. Les résultats de l application n ont pas mis en évidence une hétérogénéité significative des taux d incidence de la démence entre les 70 zones géographiques de la cohorte Paquid. De plus, les résultats supportent l hypothèse d une association positive entre des concentrations élevées d aluminium dans l eau et un risque accru de démence. Mots clés : Modèles à fragilité, temps de survie corrélés, aluminium, démence. Abstract The models classically used in survival analysis assume the independence of survival times. This assumption can be called into question when grouped data are studied. The shared frailty models make it possible to treat the heterogeneity of survival times between groups. Our contribution is to show how the maximum penalized likelihood estimation can be applied to estimate non-parametrically the hazard function in a shared gamma frailty model with a framework of right censored and left truncated data. We examine the problem of obtaining variance estimators for regression coefficients and frailty parameter. The results of the application did not show a significant heterogeneity of the incidence rates of dementia between the 70 geographical areas of the Paquid cohort. Moreover, the results support the assumption of a positive association between high aluminium concentrations in tap water and an increased risk of dementia. Key words : Frailty models, correlated survival times, aluminium, dementia.

10 Chapitre 1 Introduction L analyse des données de survie étudie le délai jusqu à l apparition d un événement pour un ensemble d individus. A l origine, cet événement désignait le décès mais d autres événements peuvent être considérés tels que la survenue d une maladie en épidémiologie, la survenue d une panne dans les applications industrielles, l acceptation d une offre d emploi pour une personne au chômage en économie, ou le mariage en démographie. Les modèles classiquement utilisés en analyse de survie supposent l indépendance des temps de survie (au moins conditionnellement à un ensemble de variables explicatives observées). Il est raisonnable de penser que cette hypothèse peut être remise en cause lorsque l on étudie des groupes de sujets (familles, hôpitaux, zones géographiques) qui partagent un même environnement (alimentation, niveau de radon, style de vie) ou qui ont en commun des facteurs de risque génétiques. La présente recherche en biostatistique a été motivée par une étude épidémiologique particulière qui présente des données groupées en zones géographiques, l enquête Paquid réalisée dans l Unité INSERM Problématique épidémiologique Les connaissances sur l étiologie de la démence ou plus particulièrement de la maladie d Alzheimer sont encore très incomplètes. Dans cette maladie multifactorielle, de nombreux facteurs de risque ont été étudiés et certains facteurs de risque génétiques ont été identifiés, mais ils sont loin d expliquer l ensemble des cas de démence. L aluminium, de part sa neurotoxicité, pourrait être un facteur de risque environnemental associé à la démence. En effet, l hypothèse d un rôle toxique de l aluminium dans la démence repose sur plusieurs arguments [83]. Il a été montré en particulier chez les personnes dialysées, que 2

11 l aluminium de l eau du dialysat pouvait pénétrer dans le cerveau de patients et conduire dans les cas les plus graves à des encéphalopathies [5]. Plusieurs études épidémiologiques ont été également menées sur l effet de l aluminium dans la démence mais elles n ont pas permis de conduire à un consensus [64, 66, 65, 33]. Un objectif de la cohorte Paquid est d étudier les facteurs de risque associés à la démence, chez 3777 personnes de plus de 65 ans domiciliées dans les départements de Dordogne et de Gironde. La cohorte Paquid, réalisée dans 75 sites géographiques, renfermait une structure d échantillon unique et très adaptée pour analyser la relation entre la démence et un facteur environnemental comme l aluminium de l eau de boisson. En effet, dans cette cohorte nous disposions d une grande variabilité géographique de la mesure d exposition environnementale. Nous souhaitions donc réaliser une analyse de survie sur les démences incidentes dans la cohorte Paquid. Cependant une des caractéristiques de l échantillon de la cohorte Paquid est un regroupement des individus en zones géographiques (ou communes). Ainsi, les sujets d un même groupe qui peuvent partager la même exposition environnementale, ou une même structure socio-démographique (rural vs urbain) ou des mêmes facteurs génétiques (sur des grandes familles) risquent d être plus semblables que des sujets de groupes différents. Il existait donc une potentielle corrélation ou dépendance des temps de survie dans chaque groupe de la cohorte, ou une hétérogénéité des temps de survie entre groupes. Le modèle de Cox, classiquement utilisé en analyse de survie, fait une hypothèse d indépendance des temps de survie or cette hypothèse risque de ne plus être valide dans le cas des données groupées. L utilisation sur des données corrélées d un modèle de Cox conçu pour l analyse de données indépendantes peut biaiser les paramètres de régression et lorsque la variable explicative est spécifique à chaque groupe, elle conduit à une sousestimation de la variance de l estimateur du paramètre. La structure de l échantillon de la cohorte Paquid nous a donc amené à considérer des méthodes d analyses de survie adaptées aux données corrélées. Dans la suite de l exposé nous parlerons de temps de survie pour désigner des temps de survenue d une maladie ou des temps de décès.

12 1.2 Différentes situations de données hétérogènes Le risque de développer une maladie ou de décéder diffère pour différents individus d une population. Cette hétérogénéité entre individus peut refléter des différences biologiques présentes dès la naissance (telle qu une prédisposition génétique), mais elle peut aussi provenir d une fragilité acquise au cours du temps (telle que le tabagisme, le stress, les habitudes de vie, une exposition environnementale). Les études épidémiologiques, par des modèles de régression, cherchent à mesurer différents facteurs de risque pour étudier leur influence sur la survenue de maladies. Les variables qui sont observées ne représentent souvent qu une partie des facteurs de risque pertinents. De plus, il est possible que certains facteurs ne soient pas inclus dans les analyses, puisqu ils ne sont pas suspectés d avoir une influence. Cela peut être le cas de facteurs génétiques, les différents gènes qui ont une influence n étant pas tous connus. Ainsi, certains individus en raison de l exposition à des facteurs non observés, seront plus fragiles que d autres. Deux sources de variations peuvent expliquer l hétérogénéité de la population : des variables individuelles négligées ou des variables négligées, communes à un groupe de sujets. Lorsque l hétérogénéité provient d un ensemble de facteurs individuels non mesurés les temps de survie considérés sont bien indépendants. Un modèle de Cox classique peut donc être utilisé pour analyser les données. Cependant, pour tenir compte de l hétérogénéité des observations, un modèle de survie à fragilité corrélée sera préférable. Ces modèles seront exposés dans le chapitre (2). Lorsque l on considère des données groupées, l hétérogénéité entre groupes peut être expliquée par un ensemble de facteurs liés à chaque groupe. Cependant même après avoir considéré cette information il peut quand même subsister une corrélation des temps de survie dans chaque groupe liée à un ensemble de facteurs non observés. On va donc chercher à expliquer cette corrélation résiduelle. Une première solution serait d inclure une variable indicatrice propre à chaque groupe, cependant on se retrouve face à un problème d estimation d un grand nombre de paramètres qui ne sont pas toujours identifiables si le nombre de groupes est élevé. L autre solution est donc d inclure dans le modèle de survie un effet aléatoire, c est à dire une variable de fragilité partagée par tous les membres d un

13 même groupe pour expliquer cette hétérogénéité. Ces deux phénomènes d hétérogénéité sont traités différemment dans les analyses. La problématique épidémiologique sur laquelle nous souhaitions travailler nous a amenés à considérer essentiellement l hétérogénéité entre groupes en la traitant par des modèles de survie à fragilité partagée. 1.3 Schémas de données corrélées Nous allons exposer les différentes structures de données dans lesquelles les données peuvent être corrélées Données groupées Dans le cas des données groupées, on suit différents groupes de sujets simultanément. Les temps de survie sont notés T ij, i = 1,..., G, j = 1,..., n i où i indice le groupe et j indice un individu du groupe i. Les temps de survie de deux sujets de groupes différents (T ij et T i j ) sont supposés indépendants, alors que les temps de survie de deux sujets d un même groupe peuvent être dépendants. Le nombre de temps d observations (n i ) dans chaque groupe est supposé pré-spécifié, mais comme certains temps correspondent à des temps d événements et d autres à des temps de censure, le nombre d événements dans chaque groupe n est pas spécifié. Dans ce type de données, les temps de survie ne sont pas ordonnés. Les groupes de sujets considérés peuvent être des familles qui ont des gènes en commun, des usines dont les employés partagent la même exposition professionnelle, ou des hôpitaux dans le cadre d essais cliniques multicentriques. Un exemple de données groupées est l exemple de l étude de l efficacité d un traitement chez des patients atteints de rétinopathie diabétique. Pour cela, chez chaque patient, un œil est sélectionné aléatoirement pour être traité et l autre œil reste non traité. Les patients sont suivis plusieurs années jusqu à la survenue d une cécité totale. Dans cette étude une dépendance entre les durées de survie des deux yeux d un même patient sera présente.

14 1.3.2 Données répétées Dans le cas des données répétées, on étudie pour chaque sujet un même événement plusieurs fois, avec un nombre fixe de temps d observations pour chaque sujet. L unité (i) considérée ici est donc le sujet lui-même. Le j ième temps de survie pour le i ième sujet est noté T ij avec i = 1,..., G, j = 1,..., n i. Les temps de survie entre deux sujets (T ij et T i j) sont supposés indépendants, par contre les différents temps de survie pour un même sujet peuvent être dépendants. Comme dans les données groupées, le nombre de temps d observations (n i ) pour chaque individu est supposé pré-spécifié, par contre les temps de survie peuvent être ordonnés. Dans le cas des données répétées, on étudie pour chaque sujet un même événement plusieurs fois, avec un nombre fixe de temps d observations pour chaque sujet. L unité i considérée ici est donc le sujet lui-même. Une étude expérimentale, le labyrinthe aquatique peut illustrer ce type de données. Cette étude consiste en un test d apprentissage et de mémoire réalisé sur des rats. Ces derniers sont plongés dans un bassin contenant une plate-forme immergée et invisible qu ils doivent retrouver. Pour chaque rat, le temps nécessaire pour retrouver la plate-forme est mesuré. Cette expérience est renouvelée plusieurs fois sur chaque rat avec un nombre limité d épreuves. On se trouve typiquement en présence de données dépendantes pour un même sujet Données récurrentes En présence de données récurrentes, on étudie également pour chaque sujet un même événement plusieurs fois, mais avec un nombre aléatoire de temps d observations pour chaque sujet. Le j ième temps de survie pour le i ième sujet est noté T ij avec i = 1,..., G, j = 1,..., n i. L ordre d apparition des temps de survie peut être à considérer dans ce type de données. Cette structure de données est différente de celle des données répétées puisque le nombre de temps d observations (n i ) pour chaque individu est aléatoire.

15 Dans des essais thérapeutiques, on peut par exemple étudier le délai jusqu à la survenue de différentes crises d épilepsie chez un même sujet, ou les différents épisodes d hypoglycémie chez des sujets diabétiques Différents événements Sur des données récurrentes on s intéresse pour chaque sujet à la survenue d événements du même type, mais il peut être également intéressant d étudier différents types d événements pour un même sujet. On peut par exemple étudier pour un même sujet trois états, sain, malade et décédé. Il sera alors intéressant de savoir comment la survenue d un événement influence la survenue d un autre événement pour chaque personne. Pour cette structure de données, les modèles multi-états sont plus adaptés ; ce type de modèle ne sera pas traité dans cette thèse. Le tableau (1.1) résume les caractéristiques de ces différentes structures de données de survie corrélées. Ces données sont souvent appelées données de survie multivariées. Une unité sera définie soit par un groupe de sujets (dans le cadre des données groupées), soit par un seul sujet (dans le cadre des données récurrentes ou répétées). C est au sein de chaque unité que l on aura une dépendance des temps d observation. Tab. 1.1 Caractéristiques des différentes structures de données corrélées niveau de nb de temps regroupement d observations groupées un groupe de sujets fixe répétées un sujet fixe récurrentes un sujet aléatoire 1.4 Objectifs et plan L objectif de notre travail était de proposer une nouvelle méthode d estimation semiparamétrique dans des modèles de survie pour données hétérogènes. Cette méthode devait

16 permettre d analyser des données incomplètes, censurées à droite et tronquées à gauche en répondant simultanément aux trois objectifs suivants : Un premier objectif était d évaluer directement dans les modèles une mesure de corrélation intra-groupe et de déterminer si cette corrélation peut s expliquer par des facteurs environnementaux liés au groupe (ex : l aluminium) ou s il elle persistait même après ajustement sur ces facteurs. Un second objectif consistait à estimer des paramètres de régression et surtout des variances de ces paramètres correctement, notamment pour les variables explicatives spécifiques à chaque groupe. Un troisième objectif de la méthode était de pouvoir estimer une fonction de risque lisse adaptée au cas des données censurées à droite et tronquées à gauche. Le chapitre (2) sera consacré à l exposé des procédures existantes en analyse de survie pour données hétérogènes. Nous insisterons sur les modèles à effets aléatoires qui semblent les plus adaptés à notre application. Dans le chapitre (3) nous présenterons une méthode semi-paramétrique d estimation des paramètres de régression, d un paramètre de corrélation et de la fonction de risque. Cette méthode est basée sur la maximisation d une vraisemblance pénalisée. Des simulations seront présentées pour valider cette approche dans le chapitre (4). Le chapitre (5) sera dédié à l étude de l association entre des facteurs de risque environnementaux et la survenue d une démence sur la cohorte Paquid à l aide de la méthode d estimation proposée.

17 Chapitre 2 Modèles de survie pour données hétérogènes 2.1 Définitions et notations en analyse de survie Plusieurs ouvrages sont consacrés à l analyse de survie [51, 27, 44, 4, 54]. Dans ce chapitre nous rappellerons quelques définitions et notations utiles pour la suite de l exposé Différence entre données censurées et tronquées La spécifité des durées de survie est de correspondre à des variables aléatoires positives et de comporter des observations incomplètes dues en particulier à la censure ou à la troncature. Censure à droite Lorsque à la fin de la durée d observation, un sujet n a pas connu l événement d intérêt, son délai d apparition de l événement sera dit censuré à droite et sa durée d observation constituera le délai de censure C j. Si le délai de censure C j est une variable aléatoire supposée indépendante de la durée de survie T j, alors la censure à droite est aléatoire qui est le cas le plus fréquent en épidémiologie et qui est le cas que nous considèrerons par la suite. Si T j est la durée de survie, qui est définie comme une variable aléatoire positive, alors on observera pour chaque individu j, le couple (Y j, δ j ) relié à la variable T j par : Y j = min(t j, C j ) 9

18 et 1 si T j C j δ j = 0 si T j > C j où δ j est un indicateur de censure à droite égal à 1, si la variable de vie T j du sujet j est observée, et δ j = 0 si la variable T j est censurée à droite. Censure à gauche Une donnée est censurée à gauche si l on sait seulement que l événement s est produit avant une certaine date, sans qu il soit possible d en connaître la date exacte. Dans le cadre de données censurées à gauche, si T j est la durée de survie, alors on observera pour chaque individu j, le couple (Y j, δ j ) relié à la variable T j par : et Y j = max(t j, C j ) 1 si T j C j δ j = 0 si T j < C j On définit δ j un indicateur de censure à gauche égal à 1, si la variable de vie T j du sujet j est observée, et δ j = 0 si la variable T j est censurée à gauche. Censure par intervalle La variable durée de vie T j sera dite censurée par intervalle si au lieu d observer la variable durée de vie T j, on observe deux valeurs L j et R j (avec L j < R j ) telles que la seule information dont on dispose sur T j est que L j < T j < R j. Dans les enquêtes de cohorte, il est courant que les sujets ne soient pas suivis en temps continu mais plutôt à des visites successives. Si l événement s est produit entre deux visites, on peut parfois connaître la date exacte de survenue de l événement, dans d autres cas cela n est pas possible. Les délais de survenue de l événement seront alors censurés par intervalle. Tous les modèles de survie supposent l indépendance entre les temps de survie T j et les temps de censure C j. Cette hypothèse ne serait pas vérifiée si, par exemple des personnes n étaient plus suivies à cause d une aggravation de leur état. Les personnes les plus à risque de connaître l événement ne seraient plus dans l échantillon. L hypothèse d indépendance des variables C j et T j est fondamentale afin d obtenir une vraisemblance simple. Si on ne fait pas cette hypothèse, la distribution des délais de censure intervient

19 dans la vraisemblance. De plus la censure est supposée non-informative, si sa distribution ne dépend pas des paramètres qui interviennent dans la distribution de la variable durée de survie [4]. La censure sera par exemple non informative lorsque les perdus de vue (c est à dire des sujets qui ont quitté l étude avant la fin) ont la même probabilité d avoir l événement après leur temps de censure que ceux restant observés. Dans la suite de ce travail ces hypothèses sont supposées valides. Ces hypothèses sont raisonnables si les données censurées sont dues à des sujets qui n ont pas connus l événement à la fin de l étude (sujets exclus-vivants ). Elles sont moins clairement vérifiées quand les données censurées correspondent à des sujets perdus de vue. Troncature à gauche En analyse de survie, le cas de troncature le plus courant est celui de la troncature à gauche. La troncature à gauche se produit lorsque les sujets ne sont pas suivis depuis la date d origine choisie ; on parle alors d entrée retardée dans une cohorte. Choisir l âge comme le temps de base produit souvent des données tronquées à gauche puisque les sujets sont rarement suivis dès leur naissance (mise à part dans les études pédiatriques) et les sujets qui ont déjà subi l événement à l entrée dans l étude ne sont généralement pas sélectionnés pour participer à l étude. La troncature à gauche signifie que si le temps de survie T j est inférieur au temps d entrée dans la cohorte L j, le sujet n appartient pas à l échantillon d étude, c est à dire la durée de survie T j n est observable que conditionnellement au fait que T j > L j ; la variable L j appelée variable de troncature gauche, est supposée indépendante de la variable durée de vie T j. Il faut noter la différence entre la censure à gauche, dans laquelle on ne dispose que d une information partielle sur les individus qui ont eu l événement d intérêt avant un certain temps d entrée dans l étude, et la troncature à gauche, où ces individus ne seront pas inclus dans l étude. Dans l application présentée dans le chapitre (5), les déments incidents dans une cohorte de sujets de plus de 65 sont étudiés. L événement d intérêt est l apparition d une démence et le temps de base considéré est l âge du sujet. A l inclusion dans l étude certains sujets sont déjà déments ; si l on choisit d inclure dans les analyses ces déments prévalents, leur âge de passage à la démence est censuré à gauche

20 car l événement s est produit avant l inclusion. Ces cas prévalents sont en fait retirés de l échantillon d étude, car ils ne sont pas représentatifs des déments prévalents de plus de 65 ans ; en particulier, les sujets de la cohorte étaient inialement à domicile, or on sait qu environ 50% des déments de plus de 65 ans sont en institution. Cette sélection implique une troncature à gauche car les sujets ne font partie de l échantillon que conditionnellement au fait qu ils n ont pas développé une démence avant leur âge à l inclusion (âge de 65 ans ou plus). S il y a troncature, un certain nombre d individus ne sont pas observables et on n étudie qu un sous-échantillon. Ce phénomène est aussi appelé entrée retardée (delayed entry), car la date d origine est antérieure à la date d entrée dans l étude. Notons que si dans cette étude le temps de base considéré est le temps du calendrier, c est à dire si l on étudie le délai entre l entrée dans l étude et la survenue d une démence, le problème de la troncature à gauche ne se pose plus car la condition de troncature à gauche T j > 0 est toujours vérifiée. De façon similaire, même si cela peut sembler évident, on ne considère le risque de décès à un âge donné que pour les personnes qui sont encore en vie. En effet, si on souhaite étudier la mortalité dans cette même cohorte, le temps de base le plus pertinent est l âge du sujet puisqu il est lié à la mortalité. En plus de la censure classique liée à la nature prospective de l étude, l âge de survenue du décès est tronqué à gauche par l âge d entrée dans l étude. Troncature à droite et troncature par intervalle La troncature à droite se produit lorsque l on inclut dans l échantillon uniquement les personnes qui ont subi l événement, et un individu qui n a pas encore subi l événement ne sera pas observé. Ainsi, la durée de vie T j est tronquée à droite si T j n est observée que conditionnellement au fait que T j < R j ; la variable R j appelée variable de troncature droite, est supposée indépendante de la variable durée de vie T j. Le problème de troncature à droite se pose par exemple lorsque l on étudie des registres. Les sujets figurent dans ces registres qu à partir du moment où ils ont connu l événement d intérêt. Ainsi, lorsque l on s intéresse à la durée d incubation du SIDA ; des informations concernant les durées d incubation de certains sujets infectés lors d une transfusion sanguine, par exemple, sont disponibles dans des registres. Ces informations

21 sont tronquées à droite car les sujets porteurs du virus mais qui n ont pas encore développé la maladie ne sont pas observés ; en d autres termes, un individu n est observé que conditionnellement au fait que son temps de survenue de l événement soit inférieur à un certain temps d entrée dans le registre. Si l observation de la variable durée de vie T j est conditionnée par le fait que L j < T j < R j, on dit que T j est tronquée par intervalle. Les variables L j et R j sont des variables de troncature, supposées indépendantes de la variable de survie T j. Il apparaît donc que la troncature à droite est un cas particulier de la troncature par intervalle avec L j = 0. De même que la troncature à gauche est une troncature par intervalle où R j = Fonction associée aux distributions de survie Les durées de survie correspondent à des variables aléatoires positives, de distribution le plus souvent dissymétrique rendant difficile leur description par les distributions théoriques usuelles. Par exemple, la distribution normale qui joue un rôle important en statistique ne peut être utilisée en analyse de survie car les variables étudiées sont supposées prendre des valeurs positives. Toutefois, l étude des durées de survie utilise les fonctions classiques permettant de décrire les variables aléatoires continues. La variable durée de survie T j, définit le délai écoulé entre la date d origine et la date de décès. Nous considérons uniquement le cas où T j est une variable aléatoire positive et continue. La distribution de la variable aléatoire T j peut être caractérisée par les différentes fonctions suivantes qui sont liées entre elles. La fonction de densité de probabilité P r(t T < t + t) f(t) = lim t 0 t f(t) t peut être vu quand t est petit comme la probabilité pour un sujet de décéder au temps t. La fonction de répartition

22 La fonction de répartition est la probabilité de décéder entre 0 et t : F (t) = P r(t t) = La fonction de répartition est croissante et on a : t 0 f(u)du La fonction de survie F (0) = 0 et lim t + F (t) = 1 La fonction de survie S(t) est la probabilité de survivre au-delà de t : S(t) = P r(t > t) = 1 F (t) Si T est une variable aléatoire continue, alors, S(t) est une fonction décroissante, telle que S(0) = 1 et lim t + S(t) = 0 Cette fonction est très utilisée dans la littérature pour décrire la survie des personnes. La fonction de risque Une fonction fondamentale en analyse de survie est la fonction de risque, qui est aussi appelé risque instantané de décès. P r(t T < t + t T t) λ(t) = lim t 0 t λ(t) = f(t) S(t) = ln S(t)/ t λ(t) t peut être vu quand t est petit comme la probabilité approchée pour un sujet de décéder au temps t, conditionnellement au fait que ce sujet était vivant juste avant t. La fonction de risque cumulée il s ensuit que Λ(t) = t 0 λ(u)du S(t) = exp( Λ(t)) La distribution de la durée de vie T j peut être décrite par l une quelconque des fonctions f, F, S, λ ou Λ.

23 2.1.3 Estimation Construction de la vraisemblance L estimation des paramètres inconnus (θ) d un modèle peut être obtenue par la méthode du maximum de vraisemblance. Comme nous l avons vu précédemment les études d analyse de survie incluent un mélange de données censurées et tronquées, dont il va falloir tenir compte dans l écriture des fonctions de vraisemblance. La principale hypothèse sera l indépendance entre des temps de survies et des temps de censure. Supposons que l on étudie N sujets. Soit T j la durée exacte de survie du sujet j. On peut représenter les données par un couple de variables aléatoires (Y j, δ j ), où δ j indique si le temps T j est observé (δ j = 1) ou non (δ j = 0), et Y j est égal à T j si le temps de survie est observé. Un échantillon (Y 1, Y 2,..., Y n ) étant défini comme une suite de variables aléatoires indépendantes, on peut définir la vraisemblance comme le produit des contributions de chaque observation (décès ou censure) : n V (θ; Y 1, Y 2,..., Y n ) = V i (θ; Y i ) On peut définir les contributions individuelles à la vraisemblance, selon les différents types d observation : si le temps d observation considéré est un temps exact d événement, la contribution à la vraisemblance sera : V j = f(t j ) si le temps d observation considéré est un temps de censure à droite, on sait seulement que le temps d événement est plus grand que le temps de censure, V j = S(C j ) si le temps d observation considéré est un temps de censure à gauche, on sait seulement que le temps d événement s est déjà produit, V j = F (C j ) = 1 S(C j ) si le temps considéré est censuré par intervalle, on sait seulement que l événement s est produit dans un intervalle ]L j, R j [, V j = S(L j ) S(R j ) i=1

24 si le temps considéré est un temps exact et tronqué à gauche, V j = f(t j )/S(L j ) si le temps considéré est un temps exact et tronqué à droite, V j = f(t j )/(1 S(R j )) Par exemple, sur un échantillon de temps de survie tronqués à gauche (Y 1, Y 2,..., Y n ) qui peuvent être des temps de survie exacts (T 1, T 2,..., T n ) ou des temps de censures à droite (C 1, C 2,..., C n ), la vraisemblance totale sera : Approche paramétrique V (θ, T 1, T 2,..., T n ) = n j=1 ( ) δj ( ) 1 δj f(tj ) S(Cj ) S(L j ) S(L j ) L approche paramétrique en analyse de survie consiste à modéliser par une distribution théorique connue la distribution de la durée de survie étudiée (ex : modèle exponentiel ou modèle de Weibull). Un modèle de survie paramétrique est donc un modèle dans lequel la fonction de risque dépend d un vecteur de paramètres inconnus [51, 27]. L avantage réel des modèles paramétriques est de pouvoir ajuster une distribution donnée, mais en faisant une hypothèse forte sur la distribution des temps de survie. Approche non-paramétrique Afin d éviter de faire des hypothèses trop fortes sur les distributions des temps de survie, on peut utiliser des méthodes non-paramétriques. L estimateur non-paramétrique le plus simple de la fonction de distribution est la distribution empirique. C est l estimateur non-paramétrique du maximum de vraisemblance pour des observations complètes. Ainsi, même si on suppose que la vraie distribution est continue on l estime par une distribution discrète. Kaplan et Meier [52] puis Nelson [69] et Aalen [1] ont proposé un estimateur de la fonction de survie dans le cas des données censurées. Un inconvénient majeur de l estimateur non-paramétrique du maximum de vraisemblance est que la distribution estimée est discrète et on ne peut pas en déduire directement la fonction de risque. La fonction de risque est souvent plus intéressante et plus pertinente que la fonction de survie ou la fonction de risque cumulé. En particulier si l âge est choisi comme temps de base, la fonction de risque peut être assimilée à l incidence d une maladie en fonction de l âge

25 (lorsque les intervalles de temps pour calculer l incidence sont petits). Dans l approche non-paramétrique la fonction de risque est difficile à estimer puisqu il est nécessaire de lisser les masses discrètes des estimateurs de Kaplan Meier [52], ou de Nelson [69] et Aalen [1] par une méthode de lissage à noyaux pour obtenir une distribution continue. Méthodes d estimation par vraisemblance pénalisée Une autre approche non-paramétrique a été proposée pour estimer la fonction de risque : l approche par vraisemblance pénalisée [85]. Cette méthode permet d obtenir une fonction de risque lisse sans faire d hypothèse forte sur la forme de la distribution des temps de survie. La log-vraisemblance est donc pénalisée par un terme qui est d autant plus grand que la fonction de risque est peu lisse : pl(λ 0 (.)) = l(λ 0 (.)) κ λ 0(u) 2 du (2.1) où l est le logarithme de la vraisemblance, λ 0 (.) la fonction de risque de base et κ est le paramètre de lissage. Dans le terme de pénalisation (λ 0(u)) 2 du = λ 0(.) 2 est le carré de la norme L 2 de la dérivée seconde de la fonction de risque. Dans la suite de l exposé, nous développerons cette méthode d estimation par vraisemblance pénalisée Modèles de régression Le modèle à risques proportionnels de Cox Le modèle à risques proportionnels de Cox [24] permet d établir une relation paramétrique entre les facteurs de risque de décès et la distribution des durées de survie sans donner à celle-ci une forme paramétrique. L analyse qui en découle présente donc un caractère semi-paramétrique. Le modèle de Cox est devenu le modèle de référence pour l analyse statistique des enquêtes de cohorte en épidémiologie [51, 27, 44]. Le modèle à risques proportionnels exprime une relation entre la fonction de risque λ et un vecteur de variables explicatives x = (x 1, x 2,..., x p ), ces variables pouvant être spécifiques à chaque sujet ou communes à un ensemble de sujets. λ(t, x) = λ 0 (t)r(β, x)

26 où β est le vecteur des coefficients de régression et λ 0 (t) est la fonction de risque de base. Plus précisément, λ 0 (t) est le risque instantané de décès des sujets pour lesquels toutes les variables explicatives x i sont égales à 0. La fonction r(β, x) dépend des caractéristiques x du sujet, et cette dépendance est mesurée par les coefficients β. En général on choisit r(β, x) = exp(β x) de façon à obtenir une fonction de risque positive sans contraintes sur les coefficients β et quelles que soient les valeurs de x. Le modèle s écrit alors : λ(t, x) = λ 0 (t) exp(β x) Ceci conduit à l expression suivante pour la fonction de survie S(t, x) = S 0 (t) exp(β x) Le modèle à risques proportionnels de Cox fait plusieurs hypothèses sous-jacentes : Il est appelé modèle à risques proportionnels, car si on considère deux individus j et j ayant deux valeurs du vecteur des p variables explicatives x j et x j, le rapport de leur ( λ(t risque est constant et il ne dépend pas de t, j x j ) = exp [ p λ(t j x j ) k=1 β k(x jk x j k )]). La méthode d estimation est basée sur l hypothèse que les temps de survie d individus distincts sont indépendants les uns par rapport aux autres, conditionnellement aux variables explicatives. Bien que cette hypothèse puisse être valide dans certaines études, elle peut être fausse dans d autres, notamment lorsque les données sont groupées. Nous présentons dans le reste de l exposé des modèles ou des approches utilisés lorsque cette hypothèse n est plus vérifiée. Estimation et tests Pour estimer l effet des variables explicatives x sur la survie, on doit estimer les coefficients de régression β. On dispose d un échantillon de N sujets. Pour chaque sujet j, on observe une durée de survie, éventuellement censurée à droite, et un vecteur de p variables explicatives x j = x j1, x j2,..., x jp. Soit T la variable durée de survie étudiée. On note t 1, t 2,..., t k les différents temps de décès observés dans l échantillon, n l le nombre de décès observés en t l et D l l ensemble des indices des sujets décédés en t l. On indice par (1), (2),..., (k) les sujets décédés respectivement en t 1, t 2,..., t k. Soit R j l ensemble des indices des sujets à risque au temps t j et N j le nombre de ces sujets. Connaissant l effectif

27 à risque en t j, et sachant qu un individu est décédé en t j, la probabilité conditionnelle que le sujet (j) décède en t j parmi les sujets à risque au temps t j est égale à V j = λ(t j, x (j) ) l R j λ(t j, x l ) = exp(β x (j)) l R j exp(β x l ) (2.2) Cette probabilité ne dépend pas de la fonction de base λ 0 (t) considérée comme un paramètre de nuisance. La vraisemblance partielle de Cox [26] est le produit des probabilités conditionnelles calculées à chaque temps de décès t j (1 j k). V (β) = k j=1 exp(β x (j) ) l R j exp(β x l ) Pour tenir compte de la présence de cas ex aequo, on peut utiliser l expression approchée de la vraisemblance : V (β) = k j=1 exp(β y j ) [ l R j exp(β x l )] n j où, y j = i D j x j est la somme des vecteurs des variables explicatives des n j sujets décédés au temps t j. Cette approximation est satisfaisante lorsque le nombre d ex aequo n est pas élevé. La vraisemblance partielle de Cox peut être utilisée pour analyser des données tronquées à gauche et censurées à droite. La différence avec le modèle de Cox classique pour données censurées à droite réside dans la définition du nombre de sujets à risque. Le nombre de sujets à risque au temps t j est N j = n j=1 I(L i t j Y i ) et R j est l ensemble des indices des sujets à risques au temps t j (où L i est le temps de troncature gauche ). L estimateur du vecteur des coefficients de régression β est obtenu en maximisant cette vraisemblance partielle. Plus précisément, on définit la fonction de score U(β) = ln V (β)/ β (le vecteur des dérivées premières de ln V (β)). L estimateur ˆβ = ( ˆβ 1, ˆβ 2,..., ˆβ p ) est la solution de l équation U(β) = 0. Cette solution peut être calculée en utilisant une procédure itérative de maximisation. Les estimateurs ˆβ j suivent approximativement une loi normale. La matrice de variance-covariance des estimateurs de ˆβ est estimée par I 1 ( ˆβ), où I(β) = E( 2 ln V (β) ) est la matrice d information de Fisher. 2 β L utilisation de la vraisemblance partielle élimine la fonction de nuisance λ 0 (t). On peut néanmoins utiliser l estimateur ˆβ pour construire un estimateur (de Breslow) de la

28 fonction de risque cumulé de base ˆΛ 0 (t) et en déduire la fonction de survie S(t, x) pour une valeur donnée du vecteur des variables explicatives x : Λ 0 (t j ) = l:t l t j n l k R l exp( ˆβ x k ) Ŝ(t) = exp[ ˆΛ 0 (t) exp( ˆβ x)] Tests statistiques On note β 0 le vecteur (β 01,..., β 0p ). Pour tester l hypothèse nulle H 0 : β = β 0, contre l hypothèse alternative H 1 : β i = β 0i pour au moins un i, on peut utiliser l un des trois tests statistiques suivants : le test du score :U (β 0 )[I 1 (β 0 )]U(β 0 ) le test du rapport de vraisemblance : 2[ln(V (β 0 )) ln(v ( ˆβ))] le test de Wald : ( ˆβ β 0 ) [I β ( ˆβ)]( ˆβ β 0 ), où I β est la sous-matrice de la matrice d information de Fisher correspondant au vecteur des coefficients de régression β. Sous l hypothèse nulle, les statistiques des trois tests suivent asympotiquement des distributions de chi-deux à p degrés de liberté. Les trois tests donnent en général les mêmes résultats. Le test du score est le plus facile à calculer parce qu il ne nécessite pas de maximiser la vraisemblance. Le test de Wald découle directement des estimations des paramètres et de leur variance. Néanmoins, le test du rapport des vraisemblances serait le plus robuste et le plus fiable des trois. 2.2 Analyse de données multivariées : approche marginale L approche marginale a été développée par Lin et Wei [60] et par Wei et al [94] qui se sont tout d abord intéressés à un modèle dans lequel les individus subissaient des événements répétés, puis par Lee, Wei et Amato [56] qui s intéressaient davantage aux données groupées. Cette approche consiste à spécifier la fonction de risque marginale des temps de survie corrélés sans modéliser de façon explicite la structure de dépendance entre les temps de survie. Cette méthode traite ainsi la dépendance des temps de survie comme une nuisance.

29 2.2.1 Le modèle On considère T ij le temps de survie du j ieme sujet (j = 1,..., n i ) du i ieme groupe (i = 1,..., G), et C ij le temps de censure correspondant. Les temps de survie observés seront alors Y ij = min(t ij, C ij ) et l indicateur δ ij = I(T ij C ij ) permettra de déterminer si le temps de survie observé Y ij est un temps de censure ou d événement. Si X ij = (X 1ij,..., X pij ) correspond au vecteur des p variables explicatives, alors le vecteur des temps de survie T i = (T i1,..., T ini ) et le vecteur des temps de censure C i = (C i1,..., C ini ) sont supposés être indépendants conditionnellement au vecteur des variables explicatives X i = (X i1,..., X in i ). Dans cette approche, la distribution marginale pour chaque temps de survie est modélisée par un modèle à risques proportionnels, et la fonction de risque marginale en un temps t s exprime par : λ ij (t; X ij ) = λ 0 (t) exp{β X ij } (2.3) On peut noter que dans ce modèle, nous n avons pas d estimateur de la force de l association entre les individus dans chaque groupe. Le vecteur des coefficients de régression β = (β 1,..., β p ) est estimé par maximisation de la vraisemblance partielle classique de Cox construite à partir du modèle de travail précédent (2.3) dans lequel on supposera l indépendance des temps de survie. Dans le cas d événements récurrents où l on observe n i types d événements pour un même sujet i, il est nécessaire de permettre à la fonction de risque de base d être différente pour chaque type d événement. La fonction de risque pour le j ieme type d événement du sujet i est donnée par λ ij (t; X ij ) = λ 0j (t) exp{β X ij }. Ce modèle a été proposé par Wei et al [94]. Pour les données groupées il est généralement suffisant d estimer une fonction de risque de base commune à tous les sujets comme dans le modèle (2.3). Cependant dans chacune des situations, une modification de la matrice de variance-covariance est nécessaire Matrice de variance-covariance corrigée Lee et al [56] ont montré que lorsque l on avait des données corrélées, les estimateurs des coefficients de régression du modèle de Cox classique obtenus par maximisation de la vraisemblance partielle sont convergents et asymptotiquement normaux. Cependant, l estimateur correspondant de variance-covariance ˆV n est plus valide en raison de la

30 dépendance intra-groupe. Ainsi, ils proposent d utiliser Ṽ = ˆV C ˆV un estimateur corrigé et robuste de la matrice de variance-covariance pour ˆβ (dit estimateur sandwich ) qui ajuste la matrice de variance-covariance usuelle ˆV en tenant compte des possibles associations intra-groupes des événements. L estimateur de variance-covariance est dit robuste dans le sens où même si le modèle de Cox est mal spécifié, (avec par exemple des variables explicatives importantes omises) l estimateur de variance-covariance des paramètres de régression est quand même consistant [60]. Pour construire la matrice de variance-covariance corrigée, on considère ˆV la matrice de variance covariance usuelle p p pour β, basé sur le modèle de travail (sous l hypothèse d indépendance des données), ˆV = I 1 ( ˆβ), avec I la matrice d information de Fisher. Pour estimer la matrice de correction C, on considère les temps de survie (Y ij, δ ij, X ij ) et N ij (t) = I(Y j t) indique si l individu j du groupe i est à risque juste avant t ou non. Lin et al [60] puis Wei et al [94] démontrent que U(β) la fonction de score est asymptotiquement équivalente à une somme de vecteurs aléatoires indépendants et identiquement distribués, c est à dire n 1/2 U(β) n 1/2 G i=1 ni j=1 ni l=1 W ijw il. Ils déduisent alors, en appliquant le théorème de la limite centrale, que l estimateur ˆβ suit asymptotiquement une loi normale multivariée de moyenne β et d estimateur de la matrice de variance-covariance corrigée et robuste : Ṽ = ˆV C ˆV avec, c h,k l élément de la matrice C définie par : c h,k = G ni ni i=1 j=1 l=1 W ijhw ilk et pour k = 1,..., p [ W ijk = δ ij X ijk S ] 1k(Y ij ) S 0 (Y ij ) G n i g=1 h=1 Pour cela, on introduit les notations suivantes δ gh N ij (Y gh ) exp(β X ij ) S 0 (Y gh ) [ X ijk S ] 1k(Y gh ) S 0 (Y gh ) S 0 (t) = G n i N ij (t) exp(β X ij ) i=1 j=1 et, G n i S 1k (t) = N ij (t)x ijk exp(β X ij ) pour k = 1,..., p i=1 j=1 On peut montrer que si les temps de survie dans un même groupe sont indépendants alors C est asymptotiquement équivalente à ˆV 1, et la matrice de variance-covariance

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

MODELES DE DUREE DE VIE

MODELES DE DUREE DE VIE MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Application des courbes ROC à l analyse des facteurs pronostiques binaires Application des courbes ROC à l analyse des facteurs pronostiques binaires Combescure C (1), Perneger TV (1), Weber DC (2), Daurès J P (3), Foucher Y (4) (1) Service d épidémiologie clinique et Centre

Plus en détail

Analyse des durées de vie avec le logiciel R

Analyse des durées de vie avec le logiciel R Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance Auteur Laure de Montesquieu Responsable Centre

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

La fonction exponentielle

La fonction exponentielle DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de :

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de : Chapitre 1 L intérêt Au terme de ce chapitre, vous serez en mesure de : 1. Comprendre la notion générale d intérêt. 2. Distinguer la capitalisation à intérêt simple et à intérêt composé. 3. Calculer la

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction

Plus en détail

Modélisation géostatistique des débits le long des cours d eau.

Modélisation géostatistique des débits le long des cours d eau. Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE

Plus en détail

«Une bonne thèse répond à une question très précise!» : comment l enseigner?

«Une bonne thèse répond à une question très précise!» : comment l enseigner? «Une bonne thèse répond à une question très précise!» : comment l enseigner? Congrès du CNGE Angers Novembre 2008 Sébastien Cadier*, Isabelle Aubin**, Pierre Barraine* *Département de médecine générale

Plus en détail

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits 2.0 Interprétation des cotes d évaluation des risques relatifs aux produits L interprétation des cotes attribuées dans le cadre des évaluations des risques relatifs aux produits décrite plus loin repose

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1 33 Math. Inf. Sci. hum., (33 e année, n 130, 1995, pp.33-42) UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES Éric TÉROUANNE 1 RÉSUMÉ Le stéréogramme de liaison est

Plus en détail

Soutenance de stage Laboratoire des Signaux et Systèmes

Soutenance de stage Laboratoire des Signaux et Systèmes Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Études épidémiologiques analytiques et biais

Études épidémiologiques analytiques et biais Master 1 «Conception, évaluation et gestion des essais thérapeutiques» Études épidémiologiques analytiques et biais Roxane Schaub Médecin de santé publique Octobre 2013 1 Objectifs pédagogiques Connaitre

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Docteur José LABARERE

Docteur José LABARERE UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061 Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modèles à Événements Discrets. Réseaux de Petri Stochastiques Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés

Plus en détail

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7 Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Evaluation générale de la qualité des données par âge et sexe

Evaluation générale de la qualité des données par âge et sexe Analyse démographique pour la prise des décisions. Tendances, et inégalités de mortalité et de fécondité en Afrique francophone : les outils en ligne de l UNFPA / UIESP pour l'estimation démographique.

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Modèles et simulations informatiques des problèmes de coopération entre agents

Modèles et simulations informatiques des problèmes de coopération entre agents Modèles et simulations informatiques des problèmes de coopération entre agents Bruno Beaufils LIFL Axe CIM Équipe SMAC Laboratoire d'informatique Plan 1. Motivations 2. Dilemme itéré du prisonnier 3. Simulations

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

Norme comptable internationale 33 Résultat par action

Norme comptable internationale 33 Résultat par action Norme comptable internationale 33 Résultat par action Objectif 1 L objectif de la présente norme est de prescrire les principes de détermination et de présentation du résultat par action de manière à améliorer

Plus en détail

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Les débats sur l évolution des

Les débats sur l évolution des D o c u m e n t d e t r a v a i l d e l a B r a n c h e R e t r a i t e s d e l a C a i s s e d e s d é p ô t s e t c o n s i g n a t i o n s n 9 8-0 7 C o n t a c t : La u re nt V e r n i è r e 0 1 4

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette

Plus en détail

Correction du Baccalauréat S Amérique du Nord mai 2007

Correction du Baccalauréat S Amérique du Nord mai 2007 Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Résumé des communications des Intervenants

Résumé des communications des Intervenants Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit

Plus en détail

Introduction : Essais de phase I

Introduction : Essais de phase I Schéma de recherche de dose dans les essais de phase I : comparaison par simulations dans un cadre temporel A Doussau 1,2, MC Le Deley 3, B Asselain 1, G Vassal 3, X Paoletti 1 1 - Institut Curie, 2 -

Plus en détail

Mesure et gestion des risques d assurance

Mesure et gestion des risques d assurance Mesure et gestion des risques d assurance Analyse critique des futurs référentiels prudentiel et d information financière Congrès annuel de l Institut des Actuaires 26 juin 2008 Pierre THEROND ptherond@winter-associes.fr

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

ÉPREUVE COMMUNE DE TIPE 2008 - Partie D

ÉPREUVE COMMUNE DE TIPE 2008 - Partie D ÉPREUVE COMMUNE DE TIPE 2008 - Partie D TITRE : Les Fonctions de Hachage Temps de préparation :.. 2 h 15 minutes Temps de présentation devant le jury :.10 minutes Entretien avec le jury :..10 minutes GUIDE

Plus en détail

BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION

BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION À UNE INTERPRÉTATION CAUSALE Arthur Charpentier Professeur d actuariat à l Université du Québec, Montréal Amadou Diogo Barry Chercheur à l Institut de santé

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail