Laboratoire de Statistique Médicale. Modélisation Statistique et Analyse de Durées de Survie.

Dimension: px
Commencer à balayer dès la page:

Download "Laboratoire de Statistique Médicale. Modélisation Statistique et Analyse de Durées de Survie."

Transcription

1 Laboratoire de Statistique Médicale. Modélisation Statistique et Analyse de Durées de Survie. March 14, : Les principaux axes de recherche du laboratoire de Statistique Médicale de l Université Paris l analyse des durées de survie, les modèles markoviens, la modélisation déterministe et stochastique des épidémies d une population les variations géographiques l analyse asymptotique de méthodes statistiques, les fondements probabilistes des méthodes de la statistique. Les membres du laboratoire: Bernard Bru, PR à Paris 5, Fabienne Comte, PR à Paris 5, Catherine Huber, PR à Paris 5, Odile Pons, DR à INRA, Chantal Guihenneuc-Jouyaux, MC à Paris 5, Thu Hoang, MC à Paris 5, Virginie Lasserre, MC à Paris 5, Rachid Lounes, MC à Paris 5, Judith Rousseau, MC à Paris 5, Natacha Heutte, Ater à l Université de Caen, Yoan Madec, Ater à l IUT de Paris 5, Antoine Chambaz, moniteur à Paris 5, Galle Gusto, moniteur à Paris 5, Samuel Krempp, moniteur à Paris 5.

2 Le laboratoire, qui fera prochaînement partie de l équipe CNRS MAP5, en cours de création avec l UFR de Mahématiques de Paris 5, a des collaborations avec plusieurs équipes travaillant dans les domaines cités ci-dessus. Il fait partie de l IFR 69 et a des liens étroits avec d autres laboratoires, en particulier l Unité INSERM 472 à Villejuif, avec qui il partage le DEA de Santé Publique, l Unité INSERM 170, ceux de l Université Bordeaux 2, de l IUP de Vannes, de l UTC de Compiègne et du CREST (Insee). Elle entretient des collaborations suivies avec des personnalités d universités étrangères, comme Shulamith Gross, PR à City University, New York, qui a passé l année universitaire à Paris 5, Hector de Arazoza, PR à l Université de La Havane à Cuba, Brenda Mc Gibbon, PR à l Université de Montréal au Canada, Dariush Gorbanzadeh, MC au CNAM, Sylvia Richardson, DR de l Unité INSERM U 170, Christian Robert, PR à l Université Paris IX, Ilia Vonta PR à l Université de Nicosie à Chypre, etc. Les problèmes de la statistique médicale demandent à être résolus par une modélisation et des techniques bien adaptées. L analyse des durées de survie constitue un thème fondamental et repose sur différentes approches (S. Gross et C. Huber, O. Pons). Les démarches empiriques et bayésiennes classiques ont été enrichies par l utilisation d algorithmes stochastiques qui permettent parfois de modéliser une évolution plus fine de maladies et de prendre en compte des sources de variations non observées, un contrôle d outils de calculs tels que les algorithmes de chaînes de Markov cachées est alors nécessaire (Ch. Guihenneuc-Jouyaux, V. Lasserre J. Rousseau). D autres problèmes de la statistique médicale demandent à être résolus par des méthodes adéquates. Par exemple, pour la comparaison de fonctions effets-doses, on a besoin de tests non paramétriques efficaces (C. Huber, 1997). Il en est de même pour tester la croissance stochastique d une courbe (T. Hoang, 1999). Pour la surveillance du développement du cerveau de l enfant (en relation avec l épilepsie), on a besoin de développer des techniques de détection de points de rupture dans des modèles exponentiels (B. Bru, 1997, R. Lounès, 1997), qui sont en cours d extension à des modèles non paramétriques (R. Lounès, D. Gorbanzadeh, 1999). Pour le suivi de cohortes épidémiques de Sida, on a besoin de méthodes diverses, dont certaines relèvent d algorithmes stochastiques et d autres font appel à la fois à des modèles d équations différentielles pour la dynamique de populations et à l analyse des durées de survie (H. De Arazoza, R. Lounès, T. Hoang, 1999). 1 Analyse des durées de survie La statistique des modèles de durées permet d analyser la loi d instants d occurrence d événements à partir de données d observation d individus en continu et la contribution de l équipe sur ce plan est bien reconnue depuis la fin des années 80. Outre les applications médicales et épidémiologiques, les domaines d utilisation de ces méthodes sont variés, avec des travaux en fiabilité, en démographie, en dynamique de populations. Les événements étudiés peuvent être le décès, l apparition de maladies, la transition en différents stades d un processus de développement ou d évolution. Le suivi individuel permet de prendre en compte l évolution des phénomènes au cours du temps tout en intégrant les particularités des individus ou groupes d individus. Leur analyse pose des problèmes particuliers dus à ce que ces observations sont le plus souvent censurées et/ou tronquées, c est à dire privées d une partie de l information qu elles devraient contenir. Depuis leurs premiers articles parus sur ce sujet, S. Gross et C. Huber (1987) et O. Pons (1986) ont développé des modèles et des méthodes pour traiter ce type de données. Les modèles en jeu sont de type non paramétriques, ou semi-paramétriques. Le plus connu des modèles semi-paramétriques est le modèle de Cox (1972), très largement utilisé pour l étude de populations sous des conditions contrôlées; il exprime la fonction de risque d un événement sous la forme du produit d une fonction de base et d une fonction de régression sur un ensemble Z de variables explicatives individuelles observées, ou covariables, λ(t Z) = λ 0 (t)e βt 0 Z. Les propriétés asymptotiques des estimateurs et des tests pour ces modèles sont obtenues le plus souvent grâce à des techniques relatives aux processus ponctuels.

3 L étude de populations sous des conditions partiellement contrôlées nécessite d autres modélisations et différentes généralisations du modèle de Cox ont été étudiées. Une hétérogénéité peut provenir de l existence de variables non observées, individuelles ou communes à plusieurs individus. La dépendance ainsi créée entre les individus peut être modélisée de plusieurs manières. Une hétérogénéité peut être temporelle, avec une évolution qui varie selon plusieurs échelles de temps. Les hypothèses du modèle peuvent n être valables que localement, avec par exemple des modifications selon des ruptures. Sur ce thème des durées de survie, l équipe a des échanges très suivis avec d autres laboratoires qui travaillent dans le même domaine, en particulier l Unité INSERM 472 à Villejuif, qui appartient également à l IFR 69 et qui est dirigée par Thierry Moreau, réputé pour ses travaux en survie. Des collaborations et des groupes de travail se sont constitués. Plus récemment, des liens se sont établis avec d autres équipes qui se sont tournées vers ce domaine et vers celui de la fiabilité : celles de Bordeaux 2, de l IUP de Vannes et de l UTC de Compiègne. On peut remarquer que D. Cox, l un des précurseurs les plus célèbres dans les études de survie, avait commencé par des études de fiabilité en ingénierie. Aussi est-il intéressant de confronter les techniques employées pour l analyse de données de survie proprement dites à celles utilisées en fiabilité. Cela conduit à des apports fructueux dans les deux directions. Par exemple, qu il s agisse de survie ou de fiabilité, pour se libérer de l hypothèse trop restrictive de processus de Markov, on est amené à considérer des modèles semi-markoviens. Ces derniers donnent en particulier une représentation plus réaliste du devenir des patients en cours de traitement (N. Heutte, 1999). Dans cette perspective, nous avons organisé plusieurs rencontres nationales et internationales sur la survie et la fiabilité, un séminaire commun à ces quatre universités, dont l une des manifestations les plus marquantes a eu lieu autour de l invitation à Bordeaux de D. Cox en 1999, un colloque international Goodness-of-fit Tests and Validity of Models à Paris 5, les mai 2000, la seconde conférence internationale sur les Méthodes Mathématiques en Fiabilité à Bordeaux 2, les 4 7 juillet Outre ces liens avec des équipes voisines, nous avons des collaborations suivies avec des personnalités d universités étrangères, comme S. Gross, de l Université de New York, H. Arazoza de l Université de La Havane à Cuba, P. Hall de l Université de Canberra, I. Vonta, de l Université de Nicosie à Chypre et B. Mc Gibbon de l Université de Montréal au Canada. Les thèmes de cet axe de recherche sont détaillés ci-dessous. 1.1 Prise en compte de données manquantes L observation de variables peut manquer chez certains individus. Dans le cas où une covariable est observé avec des données manquantes indépendamment de la valeur de cette covariable, des méthodes adéquates ont été proposées. Le développement de telles méthodes pour le modèle de Cox et leur mise en oeuvre sur des données médicales sera poursuivi au sein de l équipe par O. Pons. D autre part, dans un modèle multi-états, il arrive aussi assez souvent que les instants de transition entre deux états, ne soient connus qu approximativement. O. Pons, C. Huber et N. Heutte comptent traiter ce cas de données incomplètement observées. Une application à des données de qualité de vie sous traitements anti-cancéreux est envisagée. O. Pons, (2000). Estimation in the Cox model with missing covariate data. Prépublication du séminaire de Paris 5.

4 1.2 Inclusion de la dépendance dans la modélisation des survies multidimensionnelles avec censure par des modèles hiérarchiques d interaction Des durées de survie corrélées surviennent dans beaucoup de circonstances. D une part, dans l expérimentation animale, lorsque des traitements sont appliqués à des sujets issus d une même portée pour plusieurs portées différentes, d autre part, en génétique épidémiologique, lorsqu on s intéresse aux durées de survie de jumeaux, et enfin dans les essais thérapeutiques, quand plusieurs durées sont mesurées chez le même sujet. C. Huber et S. Gross ont récemment développé une nouvelle famille de modèles, apparentés à la régression logistique, pour des durées de survie discrètes et groupées présentant une dépendance. S. Gross et C. Huber, (2000). Hierarchical Dependency Models for Multivariate Survival data with Censoring. Life Data Analysis (LIDA), 6, L extension de ce modèle à des durées continues sera la prochaine étape de ce travail. S. Gross et C. Huber comptent ensuite comparer leur approche par un modèle hiérarchique à celle qui consiste à introduire dans le modèle un facteur multiplicatif aléatoire, dit la frailty (fragilité) et celle qui consiste à travailler avec les working equations : S. Gross et C. Huber proposent d examiner les relations qu il pourrait y avoir entre leur modèle et l approche de Prentice et Hsu fondée sur les working equations, à la fois d un point de vue théorique et grâce à des simulations. Toujours à la fois sur le plan théorique et à l aide de simulations, S. Gross et C. Huber proposent de comparer la version continue de leur modèle avec la version correspondante des modèles de fragilité ayant les mêmes distributions marginales. Elles comptent finalement appliquer les résultats de cette étude méthodologique à une enquête de santé publique sur la survenue de maladies cardio-vasculaires, des données sur des jumeaux et des durées d implants auxquelles elles ont accès, en utilisant la version discrète et la version continue du modèle. C. Huber, (2000). Censored and Truncated Lifetime Data. in Recent Advances in Reliability Theory, N. Limnios, M. Nikulin ed., Birkhaser (pp ). 1.3 Prise en compte de divers types d hétérogénéité a. Hétérogénéité due à des mélanges: Une hétérogénéité peut provenir de l existence de variables individuelles non observées qui conduisent à des modèles de mélanges de lois. Lorsqu une population est structurée en k groupes et que l appartenance d un individu à un groupe est inconnue, on obtient ainsi un mélanges de k lois. L étude du comportement de la statistique du rapport de vraisemblance pour des hypothèses sur le nombre de composantes d un tel mélange est difficile. Nous avons étudié ce problème dans plusieurs modèles, avec et sans censure des observations; un modèle de mélanges a été utilisé pour l analyse de durées entre les occurrences d une maladie sous des conditions de susceptibilité variables et en présence de covariables individuelles. M. Lemdani and O. Pons, (1997). Estimation and test in finite mixture models for censored survival data. Statistics, 29, pp , M. Lemdani and O. Pons, (1999). Likelihood ratio tests in contamination models. Bernoulli, 5, pp , P. Gasqui, O. Pons and J.-B. Coulon (2000). An individual modelling tool for consecutive clinical mastitis during the same lactation in dairy cows: a method based on a survival model, Veterinary Research. b. Détection de ruptures dans des modèles de Cox Le modèle de Cox peut comporter plusieurs phases successives, les points de rupture pouvant avoir lieu soit dans le temps soit dans une covariable. O. Pons a développé des méthodes pour traiter ces deux cas lorsqu une rupture se produit dans la régression du modèle en des point inconnus et elle a étudié les propriétés asymptotiques des estimateurs.

5 O.Pons (1999). Estimation in a Cox regression model with a change-point at an unknown time, exposé au séminaire d Orsay, Paris XI, et soumis pour publication, O. Pons (1999). Estimation in a Cox regression model with a change-point according to a threshold in a covariate, soumis pour publication. c. Prise en compte de la multiplicité des échelles de temps: Une hétérogénéité peut être temporelle, l évolution dépendant de plusieurs échelles de temps, telles que la durée depuis l entrée dans un stade d évolution et l âge. Cette dépendance peut apparaître à la fois dans le risque de base λ X S (x; S) de la durée X dans un état conditionnellement à la date d entrée S dans cet état et dans les covariables dans un modèle de Cox de la forme λ X S,Z (x S, Z) = λ X S (x; S) e βt Z(S+x). O. Pons a construit un estimateur de la fonction de risque de base cumulée et du coefficient de régression et a étudié leur comportement asymptotique à l aide de projections de U-statistiques. Des simulations montre que l omission de la non stationnarité entraîne des biais qui peuvent être importants. O. Pons, and M. Visser, (2000). A non-stationary Cox model. Scand. J. Statist. 27, d. Variabilité des coefficients de la régression de Cox en fonction des covariables: Les coefficients du modèle de Cox, qui sont à l origine constants ont déjà été généralisés au cas de fonctions qui dépendent du temps ou d une covariable, étrangère à celles du modèle et des estimateurs fondés sur des splines avaient été proposés. Cependant, leur comportement n avait pas été étudié. O. Pons propose d autres estimateurs des paramètres d un modèle avec dépendance à une covariable et a étudié leur loi asymptotique. O. Pons, (1999). Nonparametric estimation in a varying-coefficient Cox model, Math. Meth. Statist. (accepté et à paraître). 1.4 Techniques de rééchantillonnage (bootstrap) pour les durées censurées A la suite d Efron qui, le premier, en 1981 (JASA) a introduit les techniques de rééchantillonnage pour des durées censurées indépendantes, Gross et Lai (Statistica Sinica, 1996) ont abordé plusieurs types de méthodes bootstrap, en particulier le bootstrap simple et le bootstrap évident pour des durées censurées et tronquées. S. Gross et C. Huber proposent d utiliser ces techniques pour des estimations par intervalles des paramètres de la régression pour les versions discrète et continue de leur modèle de dépendance. Elles pourront alors comparer les intervalles de confiance obtenus par le bootstrap simple, par le bootstrap évident, et les intervalles de confiance fondés sur l approximation normale des lois des paramètres de la régression. Elles comptent aussi appliquer la méthode de Lai et Wang (Statistica Sinica, 1993) fondée sur les U-statistiques pour établir la validité asymptotique du bootstrap simple, tout au moins dans le cas discret et dans certains cas particuliers du modèle continu. Gross, S. T. and Lai, T. L. (1996). Bootstrap Methods for Truncated and Censored data. Statistica Sinica, Vol 6,3, Modèles de fragilité (frailty) Les modèles de dépendance qui utilisent la fragilité ont été étudiés dans le cas où des censures droites sont présentes, mais pas lorsque les données sont sujettes aussi à des censures d un autre type ou à des troncatures. C. Huber et I. Vonta proposent de généraliser l étude de ces modèles au cas de censures et troncatures quelconques.

6 1.6 Tests séquentiels pour des durées de survie avec censure Une nouvelle approche séquentielle bayésienne de la comparaison de durées de survie dans les essais thérapeutiques est proposée par Y. de Rycke. Elle est motivée par les essais menés à l Institut Curie sur des traitements de cancer du sein. Fondée sur les intervalles de crédibilité, cette méthode permet d arrêter l essai dès qu il est concluant compte tenu des objectifs qu on s est fixé, sans attendre que le traditionnel nombre de sujets nécessaires à l étude ait été atteint. Cela peut constituer un gain appréciable dans certains cas, en particulier d un point de vue éthique. 1.7 Modélisation semi-markovienne de durées de survie N. Heutte développe un modèle semi-markovien pour les durées de vie avec censure. Ce modèle permet en particulier une représentation réaliste du processus vital d un malade en cours de traitement qui passe par divers états et y séjourne pendant des durées qui peuvent ou non dépendre de facteurs endogènes (dosages biologiques, traits génétiques,...) ou exogènes (traitement, environnement,...). Il s agit de tester la présence de tels effets et, dans le cas où elle est prouvée, d évaluer leur importance. 1.8 Méthodes non-paramétriques en survie : estimation du taux de hasard et régression C. Huber et B. Mac-Gibbon ont considéré le problème de l estimation non paramétrique du taux de hasard pour des durées de vie en présence de censure. Elles ont obtenu, par des méthodes qui sont dans le prolongement de celles de l article de C. Huber ( Lower bounds for function estimation. Springer Verlag, 1997) des bornes pour le risque quadratique minimax quand on estime un taux de hasard en présence de censure. S. Gross, and T. Lai, (1996). Nonparametric Estimation and regression Analysis with Left Truncated and Right Censored Data. Journal of the American Statistical Association, Vol 91, 435, , C. Huber and B. Mc Gibbon Lower bounds for estimating a hazard, article soumis. 2 Modèles Markoviens : 2.1 Modèle de Markov Caché C. Guihenneuc-Jouyaux, en collaboration avec S. Richardson, DR à l INSERM U 170, a travaillé sur des Modèles de Markov avec erreurs de mesure : approche bayésienne et application à l étude longitudinale du suivi de lymphocytes T4. La modélisation de l histoire naturelle de l infection par VIH par un processus de Markov en temps continu joue un rôle important dans les études actuelles. Les modèles supposent que l évolution du patient peut être caractérisée par un certain nombre de stades de gravité. Les taux de transition entre les stades peuvent être facilement estimés quand la classification d un patient dans un stade de gravité discret se fait sans ambiguté. Mais, cette classification est souvent fondée sur la discrétisation d une variable marqueur continue qui exhibe des fluctuations importantes (pouvant provenir de fluctuations individuelles à court terme, d erreurs de laboratoire ). Ainsi, la classification dans un stade est sujette à une erreur de mesure amenant à des estimations incorrectes des taux de transition. Cette constatation amène à formuler un modèle bayésien hiérarchique pour le processus de la maladie (processus de Markov sur des états cachés) et le processus de mesure (lien entre les observations et les états cachés) permettant de faire conjointement les estimations des paramètres de ces deux processus. Afin d estimer l ensemble de tous les paramètres à partir de leur distribution a posteriori, une méthode de Monte Carlo par chaîne de Markov implantée via un algorithme stochastique (échantillonneur de Gibbs) est mise en oeuvre (Gilsk, Richardson et Spiegelhalter (1995)). Il est ainsi possible de simuler la

7 distribution conjointe a posteriori des paramètres (paramètres statistiques et stades cachés) des deux processus. Cette approche est appliquée à la modélisation du suivi de patients séropositifs de deux études : la cohorte de San Francisco qui réunit environ 3800 temps de suivi de 430 patients de 1984 à 1992 et l essai Concorde contenant environ temps de suivi de 1641 patients de 1988 à 1995.Ce travail a donné lieu à deux publications (Guihenneuc et Richardson, 2000 et Guihenneuc et al., 2000) et à plusieurs conférences. C. Guihenneuc-Jouyaux, S. Richardson (2000). Modèles de Markov avec erreurs de mesure : Approche bayésienne et application à l étude longitudinale du suivi des lymphocytes T4. Biométrie et Méthodes Bayésiennes, SFB, n14 C. Guihenneuc-Jouyaux, S. Richardson, I.M. Longini (2000). Modelling markers of disease progression by a hidden Markov process: application to characterising CD4 cell decline. Biometrics, V. 56, Modélisation Markovienne discrète et continue Un second travail a été débuté au cours d un stage de DEA et se poursuit actuellement dans le cadre de la thèse de Yoann Madec co-encadrée par C. Guihenneuc, V. Lasserre et S. Richardson (INSERM U170). Le marqueur est une variable à support continu et il semblerait plus naturel d utiliser un modèle stochastique à espace d états continu pour en modéliser l évolution. Mais ce type de modèle nécessite la connaissance de la date d infection, qui est rarement connue dans les études cliniques ou épidémiologiques sur les patients VIH positifs. Ceci en limite l application. L objectif de cette thèse est double : proposer un modèle à espace d états continu avec date d infection inconnue et comparer ces différentes approches (continues et discrètes) sur la base de leur capacité de prédiction à court et long terme et des estimations des temps de passage. Une généralisation de ce travail est faite en intégrant une éventuelle rupture dans la trajectoire des patients. Cette partie a donné lieu à un article soumis. Y. Madec et C. Guihenneuc-Jouyaux (2000). Comparison of continuous and discrete Markov models for longitudinal data: Application to the follow-up of CD4 count, soumis. 2.3 Algorithmes stochastiques de type Monte carlo par Chaine de Markov. En collaboration avec C. P. Robert (CREST, INSEE, Paris) Cette partie concerne l étude du contrôle de convergence des algorithmes stochastiques par discrétisation de chaînes de Markov (MCMC). L utilisation des algorithmes stochastiques MCMC dans les modèles bayésiens est de plus en plus fréquente mais pose un problème de détection de convergence. Une première étude consiste à étudier ces problèmes de convergence dans le cas où les paramètres simulés par l algorithme MCMC sont à support continu. Beaucoup de résultats existent sur les problèmes de convergence des chaînes de Markov quand l espace d états est discret. Or, il est bien sûr très fréquent que le support d un paramètre soit continu. C. Guihenneuc et C. Robert montrent comment la théorie du renouvellement permet de créer une chaîne de Markov discrète à partir d une chaîne de Markov à espace d états continu. La méthode retenue consiste à sous-échantillonner une discrétisation de la chaîne continue en des temps de renouvellement. Une fois la chaîne de Markov discrète ainsi obtenue, divers résultats de convergence peuvent être utilisés. La notion de divergence développée par Kemeny et Snell (1960) est choisie dans cette étude. L outil de contrôle de la convergence qui s en déduit est d abord évalué sur des chaînes en parallèle avec divers temps d arrêt, puis sur un seul couple de chaînes, grâce au théorème de Birkhoff. Ce travail a donné lieu à un article dans JASA (Guihenneuc et Robert, 1998) et à une présentation à Rebild au Danemark en Mai 1996 au First European Conference on Highly Structured Stochastic Systems. Une seconde étude menée par C. Guihenneuc et J. Rousseau est en cours et a un double objectif : faire la comparaison entre différents algorithmes (Hastings Metropolis, diffusion de Langevin) dans le cas de paramètre multidimensionnel amélioration de la convergence

8 des algorithmes MCMC via Gibbs sampling dans le cas des modèles de Markov caché par l intégration d approximations de Laplace permettant la réduction du nombre de paramètres dans les échantillonneurs de Gibbs. Ce travail a été présenté lors de la conférence Second European Conference on Highly Structured Stochastic Systems, en Italie et de la conférence First European Conference on Spatial and Computational Statistics en Grande Bretagne. Un article est en cours de rédaction. Ces études s intègrent plus généralement au groupe de travail organisé au CREST (INSEE) par C. Robert sur le thème controle des algorithmes MCMC qui a donné lieu à un Lecture Note intitulé Discretization and MCMC Convergence Assessment, Robert ed, Springer Verlag en 1998 où C. Guihenneuc a participé à deux chapitres. K. L. Mengersen, C. P. Robert, C. Guihenneuc-Jouyaux (1998). MCMC Convergence Diagnostics: a Review. Proceedings of the sixth Valencia International Meeting on Bayesian Statistics. C. Guihenneuc-Jouyaux, C. P. Robert (1998) Valid Discretization via Renewal Theory, Lecture Note Discretization and MCMC Convergence Assessment. Robert ed, Springer Verlag. C. Guihenneuc-Jouyaux, C. P. Robert (1998). Finite Markov chain convergence results and MCMC convergence assessment. J. Am. Statis. Ass. 93, C. Guihenneuc-Jouyaux, S. Knight, K. L. Mengersen, S. Richardson and C. P. Robert (2000). MCMC Convergence Diagnostics in Action, en révision à J. Am. Statis. Ass. 2.4 Analyse des séquences d ADN L objectif consiste à décrire des modèles statistiques capables d expliquer au mieux l hétérogénéité des séquences et tenter d identifier les régions distinctes du génome, susceptibles de révéler des différences de fonction ou de structure. Le travail s organise autour de trois grands axes, statistique, biologique et informatique; il s effectue au sein d un groupe composé de membres du Laboratoire Mathématique et génome de l Université d Évry, du Laboratoire Mathématique, Informatique et génome de l INRA, de l Institut National Agronomique Paris Grignon et du Laboratoire d Analyse et Modèles Stochastiques de l Université de Rouen. Depuis quelques années, au sein du Laboratoire de Statistique Médicale de Paris 5, un travail a été poursuivi par F. Muri (MC à Paris 5), qui utilise un modèle, expliquant au mieux l hétérogénéité observée, pour délimiter les régions homogènes de la séquence d ADN étudiée. Le travail de thèse d O. Thébaud consiste à établir la théorie mathématique et statistique qui permettra de faire évoluer continuement la chaîne de Markov utilisée dans cette modélisation. On parle de chaînes de Markov dérivantes. Après un travail de simulations en C et C++, afin d appréhender le comportement des chaînes suivant la forme et la composition des modèles, ses recherches se sont orientées dans deux directions : la première en coupant les séquences en fenêtres de tailles fixées et en considérant la variable N = Nab[u, u ] Na[u, u ] qui estime la probabilité d avoir un a suivi d un b sur l intervalle [u, u ], soit l une des transitions de la matrice de transition de la chaîne de Markov dérivante. Ensuite, par le biais d une régression linéaire, on peut récupérer des estimations des matrices qui constituent le modèle. La phase suivante est de calculer l espérance et la variance de cette variable afin de savoir comment ces deux statistiques dépendent de l intervalle servant au calcul, ce qui est nécessaire pour la régression. Leur estimation utilise la Delta-Méthode. Son travail se complète par une partie beaucoup plus appliquée de simulations et d analyse des résultats obtenus, aussi bien d un point de vue biologique, avec des biologistes de l INRA, que statistique au sein du groupe génome ou la comparaison de ses résultats avec les travaux déjà effectués dans ce groupe avec les chaînes de Markov cachées aura grand intérêt. Enfin un objectif est de mettre à la disposition des biologistes des outils informatiques qui viendront compléter ceux déjà disponibles et créés par des membres du groupe génome.

9 3 Modélisation déterministe et stochastique des épidémies d une population à deux-types: application à l épidémie du Sida à Cuba La modélisation des épidémies d une population à deux types se fait à l aide de processus markoviens de type naissance et mort. Soit (X(t), Y (t), t 0) un processus de naissance et mort de type linéaire à taux dépendant du temps, où X(t) (resp Y (t)) représente à l instant t, la taille de la population de type 1 (resp type 2). On suppose de plus que le taux de naissance dans la population de type 2 dépend uniquement de la taille de la population de type 1. Soient λ(t)p, µ(t), ν(t) (resp λ(t)q, µ (t), ρ(t)) respectivement les taux de naissance, de mort et d immigration d un individu de type 1 (resp de type 2), où p représente le type - ratio (type 1 sur type 2) (p + q = 1). Si l on adjoint au processus bivarié le processus aléatoire Z(t) qui compte sur [0, t] les événements de type naissance et si Ψ(u, v, w, t) représente la fonction génératrice des probabilités de la loi jointe de (X(t), Y (t), Z(t)) conditionnellement à X(0) = m, Y (0) = 0 et Z(0) = m, alors Ψ(u, v, w, t) vérifie une équation différentielle aux dérivées partielle qui, dans le cas où les taux sont constants par rapport au temps, est fonction de Φ(u, v, w, t) fonction génératrice du processus (X(t), Y (t), Z(t)) sans immigration. Ainsi nous déduisons les lois marginales du processus ainsi que le comportement limite de ces marginales. Le premier cas de SIDA à Cuba a été diagnostiqué en Depuis cette date, un système de repérage des séropositifs a été mis en place en incluant la recherche active des partenaires sexuels des séropositifs connus (contact tracing). L objectif dans ce cas est d estimer la taille de l épidémie de VIH (connus et inconnus du système de santé cubain) en utilisant des modèles à compartiments ceci tant d un point de vue déterministe que stochastique (H. Arazoza & R. Lounes) et des méthodes d analyse de survie et de rétro-calcul (H. Arazoza & T. Hoang & R. Lounes). 1. utilisation des modèles à compartiments : L objectif est d estimer la taille de l épidémie de VIH (connus et inconnus du système de santé cubain) en utilisant des modèles déterministes et stochastiques à compartiments. H. Arazoza, PR à l Université de la Havane, et R. Lounes ont utilisé une variante du type de modèle précédent, où les équations du modèle sont légèrement différentes mais conduisent à une résolution de l équation aux dérivées partielles analogue à celle décrite plus haut. Dans ce modèle, les séropositifs et les sidéens inconnus du programme de santé public sont considérés comme des immigrations dont les taux sont à estimer. Étant données les conditions initiales (t = 0 pour 1985, m = 1) et les estimations des taux de naissance et de mort des deux types (basées sur la période ), ils ont pu estimer les taux associés aux séropositifs et sidéens inconnus du programme à l aide des équations moyennes (espérances des processus marginaux). Le modèle leur a ainsi permis d estimer le nombre de s éropositifs et de sidéens contaminés uniquement par voie sexuelle, connus du programme pour l année Une étude du modèle déterministe sous-jacent et une comparaison avec le modèle stochastique complètent l étude. Un prolongement de ce travail est l étude déterministe d un modèle non linéaire tenant compte de la recherche active (contact tracing). La dynamique se fait en trois compartiments : les séropositifs inconnus du programme de santé cubain, les séropositif connus du programme, et les sidéens connus du programme. En raison d interactions non linéaires entre ces différents compartiments, l étude du modèle d un point de vue stochastique est intraitable et seule l étude déterministe a été envisagée. Dans ce travail, les équilibres dont l un est dit équilibre d absence d épidémie et l autre équilibre endémique sont déterminés et leurs comportement asymptotiquement local et global est étudié. Un ajustement aux données cubaines est fait en vue d éstimer les paramètres pertinents du modèle. 2. Analyse de survie et Retro-calcul :

10 L analyse utilise aussi bien les méthodes statistiques que mathématiques. Le temps d incubation et le taux de survie sont estimés statistiquement en uitlisant la méthode de Kaplan Meier. Le taux d infection par le VIH est calculé par retro-calcul. Les résultats obtenus à l aide des modèles dynamiques donnent des estimations de l évolution future du taux d infection par le VIH et sont consistants avec ceux obtenus à l aide du retro-calcul. R. Lounes et H. De Arazoza, (1999). A two-type model for the Cuban national program on HIV/AIDS. IMA. J. Math. Appl. Med. Biol. 16, H. De Arazoza et R. Lounes, T. Hoang, Y. Interian. Modeling HIV Epidemic Under Contact Tracing The Cuban Case. Journal of Theoritical Medicine, accepté et à paraître. H. De Arazoza et R. Lounes, (1998). Predictions for the Cuban HIV-AIDS epidemic. H. De Arazoza et R. Lounes, (1999). A non linear model for a sexually transmitted disease with contact tracing. Soumis à publication H. De Arazoza, R. Lounes, T. Hoang et J. Perez. Predictions for the Cuban HIV-AIDS epidemic. 4 Variations géographiques. V. Lasserre et C. Guihenneuc ont travaillé sur la variabilité géographique en épidémiologie en collaboration avec S. Richardson (INSERM U170). 4.1 Biais des études de corrélations écologiques Notre étude méthodologique se situe dans une problématique d interprétation des études de données, non pas individuelles mais agrégées, appelées études écologiques. Les limitations de ces études écologiques ont été discutées de manière essentiellement qualitative par de nombreux auteurs car elles sont sujettes à différents types de biais, en particulier le biais dit écologique qui se rapporte à la différence entre les estimations des relations dose-effet au niveau individuel et au niveau agrégé. Comme la difficulté est d intégrer au niveau de l agrégat des relations multivariées non linéaires (modèles multiplicatifs de type exponentiel), il est nécessaire de connaître la distribution conjointe des facteurs de risque intra unités géographiques. Or, cette distribution est généralement inconnue. Nous avons développé le cas où les facteurs de risque d exposition d une maladie sont dichotomiques,(lasserre et al, 2000). Lors de données agrégées, les prévalences marginales d exposition pour chaque unité géographique i sont disponibles mais la prévalence de l exposition conjointe est a priori inconnue. Le taux d incidence de la maladie pour l unité géographique i étant fonction de cette prévalence conjointe, les risques sont donc inaccessibles de manière géńerale. Une première approche afin de contourner cette difficulté est de supposer que le risque d exposition conjointe est de type additif, mais ce modèle de risque est très contraignant et peu reconnu en épimémiologie. Une seconde approche plus réaliste est de supposer que le risque d exposition conjointe est de type multiplicatif. Afin de rendre le modèle estimable, il est alors nécessaire de supposer, de plus, l indépendance de la distribution conjointe des facteurs de risque intra unités géographiques. Si l hypothèse d indépendance de la distribution conjointe n est pas vérifiée, on peut néanmoins penser à encore proposer le modèle de risque de type mutiplicatif bien que cela entraîne une mauvaise spécification de modèle. Une étude basée sur des simulations nous a permis d étudier les conséquences directes d une mauvaise spécification de ce risque conjoint, de chiffrer le biais dans les estimations et d en déduire une politique du moindre mal afin d obtenir une amélioration du biais quel que soit le vrai modèle sous-jacent de l exposition conjointe. Cette réflexion est illustrée par un exemple d estimation du risque de la mortalité par cancer du poumon en France associée à deux facteurs de risque : expositions industrielle et urbaine, l unité géographique étant le département français.

11 Notre objectif est d étendre nos réflexions au cas où les facteurs de risque sont continus. Notre nouvelle démarche consiste à proposer une approximation de la distribution conjointe des facteurs de risque intra unité, qui utiliserait différents types de résumés quantitatifs univariés qui seraient disponibles (moyenne, variance, bornes...) dans chaque zone. Cette démarche s appuyera sur une formulation du problème d aggrégation dans le cadres des processus ponctuels (Cressie, 1991). Le premier critère que nous retiendrons pour choisir une approximation est celui du maximum d entropie (Cressie et Richardson, 2000). Ce critère permet de spécifier une distribution possédant un maximum de variabilité et qui satisfasse un certain nombre de contraintes sur sa moyenne, variance, intervalle de variabilité. Or, de telles informations sont celles qui sont typiquement disponibles dans des enquêtes qui s intéressent, par exemple, à l exposition d un échantillon de la population. Notre approche permettra donc d incorporer ce type d information dans les études de variations géographiques et ainsi, de contribuer à diminuer le biais écologique. Sa mise en oeuvre nécessitera tout d abord de développer des outils d optimisation numériques afin d obtenir la distribution du maximum d entropie. Des simulations seront ensuite réalisées afin d évaluer quantitativement l amélioration des estimations des risques qui peut être obtenue par cette approche. S. Richardson, C. Guihenneuc-Jouyaux, V. Lasserre (1996). Ecological studies- biases, misconceptions, and counter-examples. Am. J. Epidem. (Letter), 143, V. Lasserre, C. Guillennec-Jouyaux, S. Richardson (2000) Biases in ecological studies: utility of including within-area distribution of counfounders. Statist. in Medic. (to appear). 4.2 Modèles de régression pour l analyse de données irrégulières présentant une autocorrélation spatiale C. Guihenneuc, V. Lasserre et S. Richardson (INSERM U170) ont travaillé sur ce thème qui concerne la comparaison de différents modèles de régression pour l analyse de données irrégulières qui présentent une autocorrélation spatiale. L objectif ici est de proposer une modélisation de la structure spatiale des résidus dans un modèle de régression. En effet, la régression d un processus spatial, indicateur d une maladie, en fonction de variables explicatives est utilisée en santé publique et en épidémiologie. Ces modèles de régression posent un réel problème de choix de la structure spatiale des résidus. De par la probable existence de corrélation entre les valeurs du processus de maladie dans des zones voisines, il est peu réaliste de supposer l indépendance des résidus. De plus, des études ont montré que supposer à tort l indépendance pouvait avoir pour conséquence de conclure à tort à l existence d une liaison entre le processus de la maladie et les variables d exposition. Différentes modélisations de l autocorrélation des résidus existent dans la littérature. Chacune d elles suppose avoir des connaissances a priori sur les résidus permettant de faire soit des hypothèses de forme de décroissance de l autocorrélation, soit des hypothèses de relations entre les résidus proches. Lors de l étude de Richardson et al. (1992), nous avons analysé plusieurs structures spatiales des résidus et donc plusieurs formes paramétriques de matrices de corrélation que nous avons ensuite appliqué dans le cadre de l analyse des taux de mortalité par cancer du poumon et des industries en France. Ces différentes modélisations correspondent chacune à des formes particulières de décroissance de l autocorrélation en fonction de la distance. Le choix a priori de l une ou l autre de ces formes est bien souvent impossible à faire par un simple examen des données. Nous avons alors proposé de faire les estimations sous ces differents modèles puis de choisir a posteriori sur la base de critères de comparaisons. Chacune de ces modélisations offre l avantage de n être dépendante que d un ou deux paramètres supplémentaires rendant possible une estimation par maximum de vraisemblance profilée, mais il s est révélé que le choix de l une ou l autre de ces modélisations est souvent arbitraire car les divers critères de comparaison peuvent aboutir à des conclusions peu claires et parfois contradictoires. Enfin, une dernière approche cette fois-ci non paramétrique a été considérée se basant sur l estimation empirique de chacun des termes de la matrice de

12 variance covariance. Cette technique évite totalement le problème du choix de modèles mais malheureusement ne garantit pas l obtention à la finale d une matrice définie positive et a donc comme désavantage de devoir arbitrairement mettre des coefficients de la matrice à zéro. Ce travail a donné lieu à deux publications (Richardson et al, 1992 et Guihenneuc et al, 1993) et il fait toujours l objet d une série de cours dans le DEA de Santé Publique (Villejuif, Paris 11). Nous décrivons dans cette partie un nouveau type de modélisation et son implémentation. La nouveauté statistique est ici d intégrer le choix de la structure de corrélation spatiale directement dans la modélisation. Nous supposons ici, avoir K matrices de corrélation correspondant chacune à une forme bien particulière de structure de l autocorrélation. La matrice de corrélation des résidus que nous proposons est construite par un mélange pondéré des différentes matrices de corrélation envisagées permettant ainsi de modéliser la structure de corrélation de manière plus souple. Les coefficients de pondération s ajoutent aux paramètres à estimer et leur valeur quantifie l apport de chacune des structures spatiales. Le nombre de paramètres étant important, une approche par maximisation de vraisemblance n est pas envisageable. Nous proposons de simuler la loi a posteriori de l ensemble de ces paramètres par un algorithme stochastique MCMC (Markov Chain Monte Carlo) via un échantilloneur de Gibbs en mettant des lois a priori sur les paramètres peu informatives. L évaluation de la qualité de cette approche sera faite sur des données simulées offrant l avantage de totalement contrôler le modèle de simulation. Ainsi, l influence de l amplitude et de la forme de l autocorrélation pourra être étudiée. Notamment, le cas où certains poids sont nuls dans le modèle de simulation montrera dans quelle mesure la surparamétrisation du modèle d estimation perturbera les résultats. De plus, cette approche sera appliquée sur les données du cancer du poumon déjà traitées permettant ainsi la comparaison avec les résultats déjà obtenus. S. Richardson, C. Guihenneuc-Jouyaux, V. Lasserre (1992). Spatial linear models with autocorrelated error structure. The Statistician, 41, C. Guihenneuc, V. Lasserre, S. Richardson (1993). Modèles linéaires spatiaux avec une structure d erreurs autocorrélées. Biométrie et Analyse de Données Spatio-temporelles, 12, Analyse asymptotique de méthodes statistiques : 5.1 Tests non paramétriques de comparaison de deux fonctions Ce problème se pose en particulier pour les essais thérapeutiques lorsqu on veut comparer des effets qui sont fonctions des doses et d autres paramètres, sans avoir eu la possibilité de procéder à un appariement sur les doses lors du plan d expérience. On veut comparer les effets comme fonctions de la dose sous deux conditions différentes. On peut pour cela procéder à une interpolation qui optimise la comparaison en termes d une moyenne pondérée de la différence entre les deux fonctions. Ce travail, effectué par C. Huber en collaboration avec P. Hall et P. Speckman, a donné lieu à un article paru dans JASA en P. Hall, C. Huber, P. Speckman, (1997). Covariate-matched one-sided tests for the difference between functional means. JASA, Theory and Methods, Vol. 92,n 439, p Risque minimax pour l estimation d une fonction Une méthode générale a été obtenue par C. Huber pour obtenir le risque minimax lors de l estimation d une fonction liée à un modèle statistique, qu il s agisse d une densité de probabilité, d une densité spectrale, ou de toute autre fonction, pourvu que les liens de cette fonction avec la famille de probabilités qui régit le modèle obéissent à certaines conditions. La borne obtenue pour le risque minimax dépend du degré de régularité de l espace de fonctions. C. Huber, (1997). Lower bounds for function estimation. Festschrift for Lucien Lecam, Research papers in Probability and Statistics, Springer Verlag, pp

13 5.3 Tests de multinormalité Les modèles non paramétriques sont la plupart du temps à préférer à l hypothèse paramétrique très classique de multinormalité qui est très souvent faite dans les modèles employés en biostatistique. Or, s il existe depuis longtemps des tests de normalité en dimension un, il n y en avait aucun à disposition en plusieurs dimensions. Aussi, B. Bru a-t-il dirigé une thèse sur ce sujet (Nacira Seddik-Ameur, maître-assistant à l Université d Annaba. Sur les tests de multinormalité, 1995), dans laquelle on peut trouver une famille de tests explicites permettant de rejeter ou non cette hypothèse si couramment faite en pratique. B. Bru, direction de thèse : 1995 : Nacira Seddik-Ameur, maître-assistant à l Université d Annaba. Sur les tests de multinormalité. 5.4 Détection de rupture dans des modèles statistiques On considère une suite de variable aléatoires X 1,..., X n qui sont suceptibles de changer de loi après les k premières observations. L objectif est de détecter l éventuel changement de loi. R. Lounes et D. Ghorbanzadeh ont proposé divers tests paramétriques ou non paramétriques, classiques ou bayesiens. Dans le cadre classique et paramétrique, ils ont étudié le comportement d un test basé sur la statistique Log-Vraisemblance adaptée aux problèmes de rupture. La loi limite de cette statistique sous l hypothèse nulle est évaluée par des techniques asymptotiques. Sous cette hypothèse nulle, la distribution de la statistique de test obtenue par maximisation du rapport de vraisemblance converge vers le sup d une fonctionnelle carrée d un pont brownien. Dans le cadre classique et non paramétrique ils ont proposé une procédure de détection de deux points de rupture pour une suite de variables aléatoires indépendantes. La procédure developpée est fondée sur les rangs séquentiels de la suite d observations. Ils supposent que chacune des lois post-1ère rupture et post-2ème rupture est absolument continue par rapport à la loi avant l apparition de la première rupture. Ils appliquent les résultats obtenus à trois modèles particuliers : translation, dilatation et contamination. Le travail reste encore inachevé mais des résultats partiels ont été presentés en congrés. Dans le cadre bayesien, ils ont proposé un test de détection de rupture pour des observations indépendantes issues d une loi exponentielle. Ce test est fondé sur un modèle bayesien adapté aux problèmes de détection de rupture, il est appliqué aux données concernant le volume annuel de décharge du Nil au barrage d Assouan entre les années 1871 et Un prolongement naturel de ce travail a consisté à travailler sur des variables aléatoires indépendantes issues d une famille exponentielle. En collaboration avec C. Chiron (Service Hospitalier F. Joliot C.E.A., Orsay, Inserm U 29, Hôpital St-Vincent de Paul), R. Lounes a construit un test de détection de rupture pour des observations gaussiennes et l a appliqué sur un fichier de données concernant le flux sanguin cérébral (gauche-droite) chez des adolescents, et le résultat de ce travail a été publié dans une revue médicale. C. Chiron, I. Jambaque, R. Nabbout, R. Lounes, O. Dulac et A. Syrota, (1997). Changes in Regional Cerebral Blood Flow During Brain Maturation in Children and Adolescents II. Brain 120, D. Ghorbanzadeh et R. Lounes, (1998). A Bayes procedure for dectecting change in exponential random observations. Student Vol. 2(3), D. Ghorbanzadeh et R. Lounes. Appl. Math. and Comput., accepté et à paraître. D. Ghorbanzadeh et R. Lounes. A Bayesian test for detection of a change for exponential random observations. Soumis à publication.

14 5.5 Etudes Asymptotiques de régions de confiance La construction de régions de confiance est un problème classique et fondamentale de la statistique, elle permet en particulier de quantifier l erreur d estimation des paramètres. Dans la plupart des cas, ces régions de confiance sont construites à l aide d approximations, en considérant notamment que le nombre d observations, n, tend vers l infini. L étude asymptotique de régions de confiance, qu elle soit fréquentiste ou bayésienne, permet de construire et d étudier de manière plus ou moins précise les régions de confiance considérées et de construire des tests. Pour obtenir une bonne précision, il est souvent nécessaire, tout au moins utile, d obtenir des développements asymptotiques à des ordres supérieurs (O(n 1 ), O(n 3/2 ), voire plus) des couvertures de ces régions de confiance. Ces problèmes sont à peu près bien résolus lorsque les variables considérées sont indépendantes et continues, tant d un point de vue bayésien que fréquentiste; lorsque les variables sont discrètes ou dépendantes, peu de résultats existent. a. Variables discrètes L étude asymptotique de régions de confiance fréquentistes consiste à obtenir un développement asymptotique, à un ordre plus ou moins élevé, de la distribution de statistiques sous-tendant la région de confiance (par exemple le maximum de vraisemblance, lorsque l on s intéresse au test de Wald). La difficulté principale rencontrée lors de l étude de régions de confiance, dans le cadre d observations discrètes, vient du fait qu il n existe en général pas de développements asymptotiques à un ordre plus grand que O(n 1/2 ). Cette précision est souvent insuffisante (c est à dire entrainant des erreurs d estimations importantes) même dans des cas aussi simple qu un intervalle bilatéral (ou unilatéral) pour le paramètre d une loi binomiale. Or de telles situations sont courantes en pratiques, notamment en statistique biomédicale. Pour améliorer la construction de ces régions de confiance J. Rousseau a utilisé des corrections de continuité permettant d obtenir des développements asymptotiques à des ordres supérieurs (O(n 1 ), O(n 3/2 ) voire plus). Cette étude a par ailleurs permit de comparer les régions de confiance fréquentistes et bayésiennes et de construire des lois a priori de concordance, qui sont particulièrement utiles lorsque la connaissance a priori sur le modèle n est pas suffisante pour construire une loi a priori subjective. J. Rousseau (2000). Coverage properties of one-sided intervals in the discrete case and applications to matching priors, Annals of the Institute of statistical mathematics. J. Rousseau (2000) : Coverage properties of HPD regions in the discrete case, en révision. b. Données à mémoire longue Des observations sont dites à mémoire longue lorsque la corrélation décroît lentement (entre deux observations de plus en plus éloignées dans le temps). Ce genre de phénomènes apparait notamment en hydrologie, télétrafique et autre. Dans la mesure où les développements asymptotiques au premier ordre sont souvent imprécis pour ce genre de modèle, au sens où il faut un très grand nombre d observations pour pouvoir considérer que l approximation est bonne, les développements à des ordres supérieurs sont particulièrement utiles. Dans ce but J. Rousseau, en collaboration avec O. Lieberman et D. Zucker, a étudié les développements d Edgeworth pour les statistiques du maximum de vraisemblance et du rapport de vraisemblance, permettant ainsi de construire un certain nombre de régions de confiance. O. Lieberman, J. Rousseau, D. Zucker (2000). Small-sample Likelihood-based inference in the ARFIMA model. Econometric theory, 16, O. Lieberman, J. Rousseau, D. Zucker (2000). Valid asymptotic expansions for the maximum likelihood estimator of the parameter of a stationary, Gaussian, strongly dependent process, en révision. Parallèlement, J. Rousseau, en collaboration avec A. Philippe a étudié les développements asymptotiques Bayésiens, permettant de construire de manière précise des régions de confiance

15 Bayésiennes. Cette étude a permis aussi de construire des lois a priori de concordance pour de tels modèles. A. Philippe, J. Rousseau (2000) : Non-informative priors for Gaussian long-memory processes, soumis. 6 Histoire des Sciences : fondements probabilistes des méthodes de la statistique: Certaines parmi les méthodes statistiques développées actuellement ont des origines lointaines, souvent mal connues, et un retour aux sources permet alors de porter sur elles un nouveau regard qui permet à la fois d en relativiser la nouveauté et de progresser plus rapidement dans sa mise au point. B. Bru, par son immense culture dans le domaine de l Histoire des Sciences, apporte à l équipe, et en particulier à cet axe de recherche, son concours éclairé sur les points déjà mentionnés ci-dessus dans le rapport, mais aussi par le grand nombre de domaines des Probabilités et de la Statistique dans lesquels il intervient, comme le démontre son rapport d activité reproduit ci-dessous. 1. Séminaires, colloques, diffusion des sciences. Bernard Bru est coresponsable du Séminaire d histoire du calcul des probabilités et de la statistique de l EHESS et du Centre Koyré, du Séminaire d Histoire des Mathématiques et du Séminaire de Statistique Médicale de l Université Paris 5. Organisateur de la Journée d histoire du calcul des probabilités, (EHESS, IHP) mars 1995, de la Journée Bienaymé, le 21 juin 1996, (EHESS, Centre Koyré, Fédération française des Sociétés d Assurance), de la Journée Descartes (Université René Descartes), le 10 décembre 1996 et de la journée Probabilités et Physique, octobre 1998 (Association Science-Méditerranée). Conférences dans des colloques internationaux : - Journée Bienaymé, Paris, juin Journées de l Observatoire de Paris et du Bureau des longitudes sur l actualité de l Exposition du système du monde, octobre Colloque Probabilités et physique, Marseille, octobre Journées Karl Pearson, Paris 5, mai Exposés divers à Besançon, Lille, Lyon, Paris. Participation de Bernard Bru à des projets de diffusion et de vulgarisation des Sciences : France-Culture, Université inter IREM, numéro spécial de Pour la science. 2. Encadrement de recherche et collaborations scientifiques de Bernard Bru. Directions de thèses en histoire des sciences et en statistique médicale: Thèses soutenues ( ) : À l Université Paris : Denis Nguyen, médecin-conseil à l Administration de l Assistance Publique. Analyse démographique des personnels de l APHP : Anne-Marie Décaillot, maître de conférences à l Université Paris 5. Édouard Lucas ( ) : le parcours original d un scientifique français dans la seconde moitié du XIX e siècle. À l EHESS, en codirection, dans le cadre du séminaire d histoire du calcul des probabilités :

16 : Olivier Martin, maître de conférences à l Université Paris 5. La mesure de l intelligence : Jean-Marc Rohrbasser, chargé de recherches àl INED. L arithmétique de la Providence. le pasteur Süssmilch : démographie et physico-théologie. Thèses en cours, sous la direction de Bernard Bru : À l Université Paris 5 -Malika Bouchoul, maître-assistant à l Université de Constantine. Statistique multivariée en variables binaires. Soutenance prévue, courant Bernard Locker, assistant à l Université Paris 5. L intégrale stochastique de Lévy. Soutenance prévue, premier semestre Fouad Rahmani, maître-assistant à l Université de Constantine. Etude statistique des populations à deux types, applications au SIDA. Soutenance prévue, courant À l EHESS : -Mustapha Louanchi, maître-assistant à l Université de Blida. L oeuvre probabiliste de S. Bernstein. Soutenance prévue, courant François Patte, assistant à l Université Paris 5. Mathématiques indiennes : traduction et édition de textes sanscrits traditionnels. Soutenance prévue, janvier Mémoires soutenus sous la direction de Bernard Bru : -Ariane Ickovic: Classification et analyse de données cliniques d épilepsies infantiles. (contrat Hôpital Saint Vincent de Paul). École Centrale de Lyon, Éric Henninger : Comparaison de méthodes d analyse de données en vue d identification génétique (contrat Généthon). DEA Santé Publique, Université Paris XI, Contacts internationaux et activités éditoriales : -Dans le cadre de l EHESS, invitation et accueil de chercheurs étrangers: Ted Porter UCLA (département d histoire), Stephen Stigler, Université de Chicago (département de statistique), Eugene Seneta, Université de Sydney (département de statistique) et Sandy Zabell, Université Northwestern (département de statistique), -éditeur de la revue Archive for History of Exact Sciences, membre du comité de lecture de la Revue d histoire des mathématiques et de Mathématiques, Informatique et Sciences humaines.

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Résumé des communications des Intervenants

Résumé des communications des Intervenants Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

MODELES DE DUREE DE VIE

MODELES DE DUREE DE VIE MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance Auteur Laure de Montesquieu Responsable Centre

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

MCMC et approximations en champ moyen pour les modèles de Markov

MCMC et approximations en champ moyen pour les modèles de Markov MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Incertitude et variabilité : la nécessité de les intégrer dans les modèles Incertitude et variabilité : la nécessité de les intégrer dans les modèles M. L. Delignette-Muller Laboratoire de Biométrie et Biologie Evolutive VetAgro Sup - Université de Lyon - CNRS UMR 5558 24 novembre

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Soutenance de stage Laboratoire des Signaux et Systèmes

Soutenance de stage Laboratoire des Signaux et Systèmes Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud

Plus en détail

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation Laurent Denis STATXPERT Journée technologique "Solutions de maintenance prévisionnelle adaptées à la production" FIGEAC,

Plus en détail

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé

Plus en détail

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Application des courbes ROC à l analyse des facteurs pronostiques binaires Application des courbes ROC à l analyse des facteurs pronostiques binaires Combescure C (1), Perneger TV (1), Weber DC (2), Daurès J P (3), Foucher Y (4) (1) Service d épidémiologie clinique et Centre

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Echantillonnage Non uniforme

Echantillonnage Non uniforme Echantillonnage Non uniforme Marie CHABERT IRIT/INP-ENSEEIHT/ ENSEEIHT/TéSASA Patrice MICHEL et Bernard LACAZE TéSA 1 Plan Introduction Echantillonnage uniforme Echantillonnage irrégulier Comparaison Cas

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d Laboratoire de Mécanique et Ingénieriesnieries EA 3867 - FR TIMS / CNRS 2856 ER MPS Modélisation stochastique d un d chargement d amplitude variable à partir de mesures Application à l approche fiabiliste

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT) OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT) LAGGOUNE Radouane 1 et HADDAD Cherifa 2 1,2: Dépt. de G. Mécanique, université de Bejaia, Targa-Ouzemour

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

Docteur José LABARERE

Docteur José LABARERE UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Prédiction et Big data

Prédiction et Big data Prédiction et Big data Mitra Fouladirad Institut Charles Delaunay - UMR CNRS 6281 Université de Technologie de Troyes 29 avril 2015 1 1 Sujet Motivation Le pronostic ou la prédiction du comportement futur

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7 Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Modélisation géostatistique des débits le long des cours d eau.

Modélisation géostatistique des débits le long des cours d eau. Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des

Plus en détail

Équation de Langevin avec petites perturbations browniennes ou

Équation de Langevin avec petites perturbations browniennes ou Équation de Langevin avec petites perturbations browniennes ou alpha-stables Richard Eon sous la direction de Mihai Gradinaru Institut de Recherche Mathématique de Rennes Journées de probabilités 215,

Plus en détail

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Le montant des garanties constituées aux fins du STPGV est-il excessif?

Le montant des garanties constituées aux fins du STPGV est-il excessif? Le montant des garanties constituées aux fins du STPGV est-il excessif? Kim McPhail et Anastasia Vakos* L e système canadien de transfert des paiements de grande valeur (STPGV) sert à effectuer les paiements

Plus en détail

Une étude de différentes analyses réalisées par le BIT

Une étude de différentes analyses réalisées par le BIT Association internationale de la sécurité sociale Quinzième Conférence internationale des actuaires et statisticiens de la sécurité sociale Helsinki, Finlande, 23-25 mai 2007 Comparaison des hypothèses

Plus en détail

Introduction à la théorie des files d'attente. Claude Chaudet Claude.Chaudet@enst.fr

Introduction à la théorie des files d'attente. Claude Chaudet Claude.Chaudet@enst.fr Introduction à la théorie des files d'attente Claude Chaudet Claude.Chaudet@enst.fr La théorie des files d'attente... Principe: modélisation mathématique de l accès à une ressource partagée Exemples réseaux

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Mesure et gestion des risques d assurance

Mesure et gestion des risques d assurance Mesure et gestion des risques d assurance Analyse critique des futurs référentiels prudentiel et d information financière Congrès annuel de l Institut des Actuaires 26 juin 2008 Pierre THEROND ptherond@winter-associes.fr

Plus en détail

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos. Master Mathématiques et Applications Spécialité : Ingénierie mathématique et modélisation Parcours : Mathématique et Informatique : Statistique, Signal, Santé (MI3S) 2015-2016 RÉSUMÉ DES COURS : (dernière

Plus en détail

Raisonnement probabiliste

Raisonnement probabiliste Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte

Plus en détail

Économétrie, causalité et analyse des politiques

Économétrie, causalité et analyse des politiques Économétrie, causalité et analyse des politiques Jean-Marie Dufour Université de Montréal October 2006 This work was supported by the Canada Research Chair Program (Chair in Econometrics, Université de

Plus en détail

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,

Plus en détail

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modèles à Événements Discrets. Réseaux de Petri Stochastiques Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés

Plus en détail

Débouchés professionnels

Débouchés professionnels Master Domaine Droit, Economie, Gestion Mention : Monnaie, Banque, Finance, Assurance Spécialité : Risque, Assurance, Décision Année universitaire 2014/2015 DIRECTEUR de la spécialité : Monsieur Kouroche

Plus en détail

Jean-Baptiste AUBIN Maître de Conférence en Statistique

Jean-Baptiste AUBIN Maître de Conférence en Statistique Jean-Baptiste AUBIN Maître de Conférence en Statistique Coordonnées Professionnelles : Coordonnées Personnelles : INSA-Lyon et ICJ 26, Cours de la République Bat. Léonard de Vinci 69100 Villeurbanne 20,

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Intérêt du découpage en sous-bandes pour l analyse spectrale

Intérêt du découpage en sous-bandes pour l analyse spectrale Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,

Plus en détail

Économetrie non paramétrique I. Estimation d une densité

Économetrie non paramétrique I. Estimation d une densité Économetrie non paramétrique I. Estimation d une densité Stéphane Adjemian Université d Évry Janvier 2004 1 1 Introduction 1.1 Pourquoi estimer une densité? Étudier la distribution des richesses... Proposer

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

I Stabilité, Commandabilité et Observabilité 11. 1 Introduction 13 1.1 Un exemple emprunté à la robotique... 13 1.2 Le plan... 18 1.3 Problème...

I Stabilité, Commandabilité et Observabilité 11. 1 Introduction 13 1.1 Un exemple emprunté à la robotique... 13 1.2 Le plan... 18 1.3 Problème... TABLE DES MATIÈRES 5 Table des matières I Stabilité, Commandabilité et Observabilité 11 1 Introduction 13 1.1 Un exemple emprunté à la robotique................... 13 1.2 Le plan...................................

Plus en détail

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

Nathalie Bulle (1998), Compte-rendu de Rainer Hegselmann, Ulrich Mueller, Klaus G. Troitzsch (eds.).- Modelling and simulation in the social sciences

Nathalie Bulle (1998), Compte-rendu de Rainer Hegselmann, Ulrich Mueller, Klaus G. Troitzsch (eds.).- Modelling and simulation in the social sciences Nathalie Bulle (1998), Compte-rendu de Rainer Hegselmann, Ulrich Mueller, Klaus G. Troitzsch (eds.).- Modelling and simulation in the social sciences from the philosophy of science point of view. - Dordrecht/

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Classe de première L

Classe de première L Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous

Plus en détail

Introduction : Essais de phase I

Introduction : Essais de phase I Schéma de recherche de dose dans les essais de phase I : comparaison par simulations dans un cadre temporel A Doussau 1,2, MC Le Deley 3, B Asselain 1, G Vassal 3, X Paoletti 1 1 - Institut Curie, 2 -

Plus en détail

MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année 2012-2013

MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année 2012-2013 MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année 2012-2013 [version du 29 juin 2012] 2 Table des matières 1 Master 2, Spécialité

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

CarrotAge, un logiciel pour la fouille de données agricoles

CarrotAge, un logiciel pour la fouille de données agricoles CarrotAge, un logiciel pour la fouille de données agricoles F. Le Ber (engees & loria) J.-F. Mari (loria) M. Benoît, C. Mignolet et C. Schott (inra sad) Conférence STIC et Environnement, Rouen, 19-20 juin

Plus en détail

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Validation probabiliste d un Système de Prévision d Ensemble

Validation probabiliste d un Système de Prévision d Ensemble Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

ANALYSE DU RISQUE DE CRÉDIT

ANALYSE DU RISQUE DE CRÉDIT ANALYSE DU RISQUE DE CRÉDIT Banque & Marchés Cécile Kharoubi Professeur de Finance ESCP Europe Philippe Thomas Professeur de Finance ESCP Europe TABLE DES MATIÈRES Introduction... 15 Chapitre 1 Le risque

Plus en détail