Modélisation hiérarchique spatiotemporelle de données alignées d incidence de cancers
|
|
- Constance Dumont
- il y a 8 ans
- Total affichages :
Transcription
1 Modélisation hiérarchique spatiotemporelle de données alignées d incidence de cancers Erik A. Sauleau, Arnaud Etienne et Antoine Buemi Registre des Cancers du Haut-Rhin, 9 Rue du Dr Mangeney, BP 1370, F Mulhouse 1 Résumé Dans un modèle de Poisson modélisant le nombre de cas de cancers, on introduit une somme d effets et d interactions. Sur des données de registre des cancers, différents modèles hiérarchiques sont testés, tous intégrant une variabilité spatiale sous la forme d une autocorrélation (processus conditionnel autorégressif) et d une hétérogénéité (loi normale). Les effets du sexe, du temps et leur interaction sont ensuite introduits. L effet spatial est peu important comparé aux autres effets principaux. C est l autocorrélation qui emporte l essentiel de l effet par rapport à l hétérogénéité résiduelle. Comparé au sexe, le temps a un effet majeur mais il ne semble pas y avoir d évolution d incidence. Mots-clés : Modèle de Poisson, modèles temporospatiaux, modèles hiérarchiques, CAR, DIC, interaction. 2 Summary In the Poisson model for cases of cancer, we add some main effects and their interactions. Based on a cancer registry database, different hierarchical models are tested. All of these models contain spatial variability modeled as the sum of CAR and heterogeneity components. Then sex, time and their interaction are introduced. Spatial effect is weak with respect to other main effects. Autocorrelation component is dominant over heterogeneity. Compared with sex, time has a major effect, without trend. Keywords: Poisson models, time-space models, hierarchical models, CAR, DIC, interaction. 3 Introduction Le nombre de données indexées sur l espace et le temps augmente rapidement. Par exemple les registres des cancers français ont, pour les plus anciens, un recul de recueil de 1
2 l ordre de 20 ans avec une notion annuelle des cas à l échelon de la commune de résidence. Le découpage communal change peu et les données sont donc dites alignées car la résolution du recueil est la même que celle de l analyse. Le modèle le plus utilisé de distribution des cas observés est le modèle poissonnien (dans le cas de maladies non transmissibles). Dans l unité géographique i (commune), la strate j (âge et/ou sexe) et au temps t (période triennale ou année), les cas observés, Y ijt, par approximation de la loi binomiale, suivent une loi de Poisson de paramètre n ijt p ijt (Clayton et Kaldor, 1987), où n ijt est le nombre de personnes à risque et p ijt le risque de maladie. Si µ ijt est le logarithme du risque standardisé par p, risque global de maladie (standardisation interne ou externe), et si le nombre de cas attendus E ijt est calculé par n ijt p, la formulation est Y ijt P (E ijt e µ ijt ). L intérêt est alors de modéliser µ ijt. L approche bayésienne hiérarchique (Banerjee et al., 2004) trouve alors tout son intérêt car elle permet de modéliser une variabilité aléatoire extrapoissonnienne. De plus, dans l hypothèse d une autocorrélation spatiale (entre unités géographiques), elle permet de lisser les incidences brutes Y ijt /E ijt. Dans le log-risque µ, différents effets principaux vont apparaître. On sait combien certaines covariables, telles que le sexe ou différentes expositions, interviennent sur l incidence du cancer. Knorr-Held et Rainer (2001); Bray (2002) notamment, ont bien montré, dans les modèles âge-périodecohorte, l importance des effets du temps et de l âge sur l incidence. Classiquement, la variabilité géographique est décomposée en deux éléments : φ, l autocorrélation (clustering) entre unités proches, modélisée par un processus autorégressif conditionnel (Besag et al., 1991; Mollié, 1996) et θ, l hétérogénéité résiduelle entre unités géographiques (modélisée par une loi normale). Ces modèles peuvent poser des problèmes de convergence car assez peu identifiés (les données n apportent de l information que sur la somme θ + φ). Par contre la spécification d a priori différents permet de séparer les effets. La difficulté est ensuite de prendre en compte les différentes interactions envisageables entre ces trois facteurs (covariables, espace et temps). Par exemple, dans Waller et al. (1997), µ ijt est la somme d effets principaux (sexe, race, combinaison des deux, temps, espace par association d hétérogénéité et autocorrélation) et d un effet temps emboîté dans l espace : des θ it d hétérogénéité sont des normales de précision 1/τ t et des φ it d autocorrélation sont des processus autorégressifs conditionnels de paramètre λ t. Notre objectif est de mesurer sur les données du registre les effets respectifs du temps, du sexe et de l espace sur l incidence des cancers. 4 Méthode Même si l incidence dans certains sites de cancer ne diffère pas selon le sexe, il est habituel de systématiquement distinguer homme et femme. L effet du temps sur l incidence est connu. Il sera envisagé comme une tendance linéaire ou sans forme particulière. La modélisation de l effet spatial sous la forme θ +φ ne se justifie que par l absence de covariables 2
3 explicatives de cet effet. L interaction entre le sexe et le temps semble reconnue. Elle devrait permettre, en plus de la progression différente des incidences selon les sexes, un niveau de base différent. Au contraire, une interaction entre le sexe et l espace ne semble pas se justifier. L intérêt de ne pas utiliser d interaction espace-temps est aussi que les paramètres restent facilement interprétables. Finalement, ce sont six modèles hiérarchiques à trois niveaux qui seront comparés. Dans une unité géographique i, pour le sexe j et au cours de la période t, le premier niveau du modèle consiste à dire que les cas observés suivent une loi de Poisson : Y ijt P (E ijt e µ ijt ) où E ijt sont les cas attendus et µ ijt est le log-risque correspondant, qui se décompose par somme en plusieurs effets. Ce qui est commun à tous les modèles est l effet spatial en deux composantes : θ i + φ i (hétérogénéité et autocorrélation). Les autres effets sont différents selon les modèles : effet du temps, sans structure, on ajoute α t tendance linéaire, on ajoute αt (M2), (modèle M1) ou sous forme d une effet du sexe, on ajoute β j (M3), effets du sexe et du temps, α t + β j (M4), effets du sexe, du temps et interaction avec temps sans structure, α t + β j + γ jt (M5) ou tendance linéaire, α j t + β j (M6). Le second niveau correspond aux priors des différents paramètres. Les θ i suivent une N(0, 1/τ). Les φ i sont des CAR(λ) dont le poids est la matrice d adjacence des communes. Les α, β et γ des différents modèles suivent des lois normales, de moyenne nulle et de précision vague (0.005), puisqu ils sont identifiés par la vraisemblance. Enfin, le troisième niveau précise les hyperparamètres des priors. Les τ et λ suivent des lois Γ(a, b) et Γ(c, d). Le choix des hyperparamètres a, b, c et d s est fait selon Bernardinelli et al. (1995) qui suggère que la précision sur l hétérogénéité doit être de l ordre de 70% de celle sur l autocorrélation, ce qui revient à λ τ, où m est le nombre moyen de voisins de 2 m chaque commune (en l occurrence 5.5). L ensemble de la modélisation a été réalisée avec le logiciel WinBUGS (Spiegelhalter et al., 2003). Une première série d itérations a permis de noter l étendue des estimations des paramètres pour déterminer des points initiaux "dispersés" de cinq chaînes, en imposant la contrainte que λ = τ/10. Pour chaque modèle, la longueur de la phase de burn-in est décidée sur le diagnostic de Gelman-Rubin modifié (Brooks et Gelman, 1998) et sur les autocorrélations des estimations des paramètres. Un nombre 10 fois plus important d itérations est ensuite utilisé pour l estimation du modèle. Les modèles sont comparés entre eux par le "Deviance Information Criterion" (Spiegelhalter et al., 2002) (DIC), décomposé en une mesure d adéquation et une mesure de complexité. 3
4 5 Matériel Des données du registre, on extrait par sexe les cas observés de cancers par commune, en distinguant , , et (publications triennales des données). Dans les cas, on ne tient pas compte des tumeurs bénignes ni des carcinomes cutanés basocellulaires. L Institut National de la Statistique et des Études Économiques fournit des chiffres communaux de population lors des recensements (1990 et 1999). Les populations de 1990 sont appliquées entre 1988 et 1991 et celle de 1999 entre 1998 et Des interpolations linéaires en 1993 et 1996 sont appliquées entre, respectivement, 1992 et 1994 et entre 1995 et Les populations sont ensuite sommées pour correspondre aux regroupements d années des cas. Les incidences annuelles par tranche d âge sont appliquées aux populations pour calculer des effectifs attendus communaux sur chacune des quatre périodes. L Institut Géographique National fournit pour chaque commune ses coordonnées géographiques et on a construit une matrice d adjacence où deux communes sont considérées comme voisines si elles partagent une frontière. 6 Résultats Un burn-in de itérations (400 itérations de chacune des 5 chaînes) est nécessaire pour obtenir la convergence des estimations. En règle général, les paramètres θ convergent moins bien mais le diagnostic de Gelman-Rubin reste près de la valeur 1 de convergence. Ce sont ensuite itérations qui sont monitorées. L effet de l autocorrélation spatiale est très faible : de l ordre de 10 2, quelque soit le modèle, en moyenne de médianes sur l ensemble des 377 communes. L hétérogénéité est encore plus faible (de l ordre de 10 4 ). Ceci signifie que, dans le risque de la maladie, la variabilité géographique n intervient quasiment pas (exp( ) 1). La variabilité de l autocorrélation parmi la variabilité spatiale est entre 0,70 et 0,80 selon les modèles. Le DIC le plus bas des différents modèles, malgré un nombre de paramètres effectifs élevé (169), est celui du modèle M4, intégrant les effets du temps sans structure et du sexe, sans interaction. Dans ce modèle, l estimateur de l effet du temps, en médiane, est quasiment constant sur les quatre périodes. Converti en risque relatif, sa valeur varie de 1,87 à 1,81. L effet du sexe, faible, est le même pour les deux sexes (risques relatifs à 0,30). Lorsque le temps est seul dans les effets principaux (modèle M1), son effet est quasiment constant sur les quatres périodes (en risque relatif, la valeur varie de 0,92 à 0,95). L effet du sexe sans notion de temps (modèle M3) est de 0,94. Lorsqu on ajoute une interaction sexe-temps (modèle M5), elle se manifeste surtout lors de la dernière période (risque relatif à 36 pour l homme et 16 pour la femme), alors que l effet principal du temps devient 0,18 et l effet du sexe 0,12 pour l homme et 0,34 pour la femme. Le modèle avec la simple tendance linéaire (M2) donne une pente très basse et les risques sont très légèrement décroissants de 0,98 à 0,92. L introduction de l effet du sexe en plus de la tendance (modèle M6) ne modifie pas les paramètres. L ordonnée à l origine est la même 4
5 pour les deux sexes. 7 Discussion On retrouve dans les résultats des constatations connues ou explicables. L hétérogénéité spatiale est d autant plus faible que la variabilité aléatoire spatiale est prise en charge par le processus autorégressif (Waller et al., 1997). Le temps a un effet fort mais constant sur l incidence alors que le sexe ne semble pas avoir d effet. La forte interaction au cours de la dernière période entre les sexes est peut être le signe du début de dissociation des incidences entre hommes (diminution des cancers ORL, faible augmentation des cancers bronchopulmonaires) et femmes (augmentation des cancers du sein et bronchopulmonaires). En tous cas, il est maintenant primordial de mener l analyse en différenciant les sites de cancer. Il est de plus important de vérifier par une analyse de sensibilité l impact du choix des lois a priori sur les distributions a posteriori. Un écueil essentiel à toute modélisation utilisant un échelon géographique fin est la difficulté de déterminer la population de cet échelon à un moment donné (Benhamou et Laplanche, 1991). Le problème est de déterminer les populations communales entre les recensements, notamment par tranche d âge. Les communes, surtout lorsqu elles sont petites, sont sujettes à de très fortes et très brutales variations. L échantillonneur de Gibbs n est pas la meilleure solution pour estimer les modèles hiérarchiques temporospatiaux car peu de distributions conditionnelles complètes ont une forme standard. L algorithme de Metropolis serait plus efficace notamment en permettant la mise à jour en un bloc des θ i et des φ i. Ce qui ralentit fortement la convergence c est que ces paramètres sont faiblement identifiés : les données n apportent de l information que sur la somme des deux effets et leur identification ne se fait que par la spécification des lois a priori. Effectivement en utilisant l échantillonneur de Gibbs, la convergence de nos estimations ne semblait pas acceptable avant itérations et la réalisation (avec monitoring) des itérations demandait plusieurs heures. Le poids de chaque observation dans les processus CAR repose sur une matrice d adjacence. Mais l utilisation des distances géographiques entre communes (Cressie et Chan, 1989; Devine et al., 1994) permettrait peut être une meilleure efficience du processus. Pour ce qui est de l épidémiologie, des études cas-témoins sont sûrement à préférer aux études d observation. Les résultats de ces dernières, c est à dire l interprétation des modèles temporospatiaux, servent à justifier de la nécessité de réaliser des études analytiques mais ne constituent pas une fin en soi. References S. Banerjee, BP. Carlin et AE. Gelfan. Hierarchical modeling and analysis for spatial data, volume 101 of Monographs on statistics and applied probability. Chapman and 5
6 Hall/CRC, Boca Raton, E. Benhamou et A. Laplanche. Estimation de la population à risque entre deux recensements pour le calcul d un taux d incidence ou de mortalité par cancer. Revue Epidémiologie et Santé Publique, 39:71 7, L. Bernardinelli, D. Clayton et C. Montomoli. Bayesian estimates of disease maps: how important are priors? Statistics in Medicine, 14: , J. Besag, J. York et A. Mollié. Bayesian image restoration, with two applications in spatial statistics (with discussion). Annals of the Institute of Statistical Mathematics, 43:1 59, I. Bray. Application of markov chain monte carlo methods to projecting cancer incidence and mortality. Journal of the Royal Statistical Society, Series C: Applied Statistics, 51: , SP. Brooks et A. Gelman. Alternative methods for monitoring convergence of iterative simulations. Journal of Computational and Graphical Statistics, 7:434 55, D. Clayton et J. Kaldor. Empirical bayes estimates of age-standardized relative risks for use of disease mapping. Biometrics, 43:671 81, NAC. Cressie et NH. Chan. Spatial modeling of regional variables. Journal of the American Statistical Association, 84: , OJ. Devine, TA. Louis et ME. Halloran. Empirical bayes estimators for spatially correlated incidence rates. Environmetrics, 5:381 98, L. Knorr-Held et E. Rainer. Projections of lung cancer mortality in west germany: a case study in bayesian prediction. Biostatistics, 2(1):109 29, A. Mollié. Bayesian mapping of disease. In WR. Gilks, S. Richardson et JC. Wakefield, editors, Markov Chain Monte Carlo in practice, pages Chapman and Hall, New York, DJ. Spiegelhalter, N. Best, BP. Carlin et A. Van der Linde. Bayesian measures of model complexity and fit (with discussion). Journal of the Royal Statistical Society, Series B, 64: , DJ. Spiegelhalter, A. Thomas, N. Best et D. Lunn. WinBUGS Version 1.4 user manual. Institute of Public Health, Cambridge, Janvier LA. Waller, BP. Carlin, H. Xia et AE. Gelfand. Hierarchical spatio-temporal mapping of disease rates. Journal of the American Statistical Association, 92:607 17,
Modélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Plus en détailCancer bronchique primitif: données épidémiologiques récentes
Cancer bronchique primitif: données épidémiologiques récentes Pr Jean Trédaniel Service de pneumologie et oncologie thoracique Groupe Hospitalier Paris Saint Joseph Université Paris Descartes Sources Données
Plus en détailModèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes
de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailApproche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
Plus en détailRésumé des communications des Intervenants
Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailDe la mesure à l analyse des risques
De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailConstruction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012
Construction de bases biométriques pour l assurance dépendance SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance Auteur Laure de Montesquieu Responsable Centre
Plus en détailTRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN
TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN Marie Cottrell, Smaïl Ibbou, Patrick Letrémy SAMOS-MATISSE UMR 8595 90, rue de Tolbiac 75634 Paris Cedex 13 Résumé : Nous montrons
Plus en détailInférence d un réseau bayésien augmenté visant à confronter :
Inférence d un réseau bayésien augmenté visant à confronter : un modèle complexe d analyse quantitative du risque microbiologique des données de vieillissement Clémence RIGAUX (1) En collaboration avec
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailREMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION
REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION THÈSE N O 2388 (2001) PRÉSENTÉE AU DÉPARTEMENT D'INFORMATIQUE ÉCOLE POLYTECHNIQUE FÉDÉRALE
Plus en détailMéthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailData issues in species monitoring: where are the traps?
Data issues in species monitoring: where are the traps? French breeding bird monitoring : Animations locales : - dealing with heterogenous data - working with multi-species multi-sites monitoring schemes
Plus en détailIntérêt du découpage en sous-bandes pour l analyse spectrale
Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,
Plus en détailMCMC et approximations en champ moyen pour les modèles de Markov
MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailHealth Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation
Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation Laurent Denis STATXPERT Journée technologique "Solutions de maintenance prévisionnelle adaptées à la production" FIGEAC,
Plus en détailMortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine
Mortalité observée et mortalité attendue au cours de la vague de chaleur de uillet en France métropolitaine FOUILLET A 1, REY G 1, JOUGLA E, HÉMON D 1 1 Inserm, U75, Villeuif, France. Inserm CépiDc, IFR9,
Plus en détailAICp. Vincent Vandewalle. To cite this version: HAL Id: inria-00386678 https://hal.inria.fr/inria-00386678
Sélection prédictive d un modèle génératif par le critère AICp Vincent Vandewalle To cite this version: Vincent Vandewalle. Sélection prédictive d un modèle génératif par le critère AICp. 41èmes Journées
Plus en détailConstruction bayésienne de prévisions probabilistes à partir des sorties d'un modèle déterministe pluie-débit
Construction bayésienne de prévisions probabilistes à partir des sorties d'un modèle déterministe pluie-débit Marie Courbariaux, Éric Parent & Pierre Barbillon INRA/AgroParisTech, UMR518 MIA, 75231 Paris,
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailÉconométrie, causalité et analyse des politiques
Économétrie, causalité et analyse des politiques Jean-Marie Dufour Université de Montréal October 2006 This work was supported by the Canada Research Chair Program (Chair in Econometrics, Université de
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailFIMA, 7 juillet 2005
F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation
Plus en détailPIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.
PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée. Il y a trois approches possibles du produit intérieur brut : Optique de la production Optique
Plus en détailI. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):
Master Chimie Fondamentale et Appliquée : spécialité «Ingénierie Chimique» Examen «Programmation, Simulation des procédés» avril 2008a Nom : Prénom : groupe TD : I. Programmation I. 1 Ecrire un programme
Plus en détailMéthodes d apprentissage statistique «Machine Learning»
Méthodes d apprentissage statistique «Machine Learning» Fabrice TAILLIEU, Sébastien DELUCINGE, Rémi BELLINA Le marché de l assurance a rarement été marqué par un environnement aussi difficile qu au cours
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailModélisation géostatistique des débits le long des cours d eau.
Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des
Plus en détailUne méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données
Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion marc.boulle@orange-ftgroup.com,
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailCNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité
1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :
Plus en détailRégionalisation des régimes de perturbations et implications pour l aménagement dans un contexte de changement climatique
Régionalisation des régimes de perturbations et implications pour l aménagement dans un contexte de changement climatique Sylvie Gauthier, Chercheuse scientifique, successions forestières RNCan-SCF-CFL
Plus en détailPrédiction et Big data
Prédiction et Big data Mitra Fouladirad Institut Charles Delaunay - UMR CNRS 6281 Université de Technologie de Troyes 29 avril 2015 1 1 Sujet Motivation Le pronostic ou la prédiction du comportement futur
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailTests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Plus en détailProgramme «maladie» - Partie II «Objectifs / Résultats» Objectif n 2 : développer la prévention
Programme «maladie» - Partie II «Objectifs / Résultats» Objectif n 2 : développer la prévention Indicateur n 2-3 : Indicateurs sur le dépistage du cancer 1 er sous-indicateur : taux de participation au
Plus en détailChristophe SANNIER christophe.sannier@sirs-fr.com
Systèmes d Information à Référence Spatiale Utilisation d un Estimateur de Régression avec des Données Landsat pour l Estimation de l Etendu et des Changements du Couvert Forestier du Gabon de 1990 à 2010
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailSoutenance de stage Laboratoire des Signaux et Systèmes
Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailDétection spatiale de données aberrantes. Application à la surveillance de la qualité de l'air.
Détection spatiale de données aberrantes. Application à la surveillance de la qualité de l'air. Michel Bobbia 1 & Michel Misiti 2 & Yves Misiti 2 & Jean-Michel Poggi 3 & Bruno Portier 4 1 Air Normand,
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailANALYSE QUANTITATIVE DE RISQUE MICROBIOLOGIQUE EN ALIMENTATION
ANALYSE QUANTITATIVE DE RISQUE MICROBIOLOGIQUE EN ALIMENTATION QUAND LE GESTIONNAIRE DE LA SECURITE ALIMENTAIRE A-T-IL BESOIN D UTILISER UNE APPROCHE ANALYSE DE RISQUE? En concertation avec le groupe de
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailLaboratoire 4 Développement d un système intelligent
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement
Plus en détailPREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,
Plus en détailFace Recognition Performance: Man vs. Machine
1 Face Recognition Performance: Man vs. Machine Andy Adler Systems and Computer Engineering Carleton University, Ottawa, Canada Are these the same person? 2 3 Same person? Yes I have just demonstrated
Plus en détailRETOUR D EXPÉRIENCE SUR LA CANICULE DE JUILLET 2006
RETOUR D EXPÉRIENCE SUR LA CANICULE DE JUILLET 2006 A. Fouillet 1, G. Rey 1,2, P. Bessemoulin 3, P. Frayssinet 3, E. Jougla 2, D. Hémon 1 (1) Inserm U4 IFR6 Epidémiologie environnementale des cancers,
Plus en détailDétection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique
Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique Denis Brazey & Bruno Portier 2 Société Prynɛl, RD974 290 Corpeau, France denis.brazey@insa-rouen.fr 2 Normandie Université,
Plus en détailchargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d
Laboratoire de Mécanique et Ingénieriesnieries EA 3867 - FR TIMS / CNRS 2856 ER MPS Modélisation stochastique d un d chargement d amplitude variable à partir de mesures Application à l approche fiabiliste
Plus en détailCaroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1
Trajectoires individuelles d'exposition aux psychotropes au cours de la grossesse et partitionnement en fonction du profil d'exposition : utilisation des K-means pour données longitudinales Caroline Hurault-Delarue
Plus en détailSolvabilité II Les impacts sur la tarification et l offre produit
Solvabilité II Les impacts sur la tarification et l offre produit Colloque du CNAM 6 octobre 2011 Intervenants OPTIMIND Gildas Robert actuaire ERM, senior manager AGENDA Introduction Partie 1 Mesures de
Plus en détailBIG Data et R: opportunités et perspectives
BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,
Plus en détailOPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)
OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT) LAGGOUNE Radouane 1 et HADDAD Cherifa 2 1,2: Dépt. de G. Mécanique, université de Bejaia, Targa-Ouzemour
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailIncertitude et variabilité : la nécessité de les intégrer dans les modèles
Incertitude et variabilité : la nécessité de les intégrer dans les modèles M. L. Delignette-Muller Laboratoire de Biométrie et Biologie Evolutive VetAgro Sup - Université de Lyon - CNRS UMR 5558 24 novembre
Plus en détailIBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
Plus en détailStatistique Bayésienne
Statistique Bayésienne Éléments de Culture Générale Lionel RIOU FRANÇA INSERM U669 Mai 2009 Lionel RIOU FRANÇA (INSERM U669) Statistique Bayésienne Mai 2009 1 / 139 Sommaire Sommaire 1 Approche Bayésienne
Plus en détailGestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE
Gestion du niveau de la franchise d un contrat avec bonus-malus Pierre THEROND & Stéphane BONCHE SOMMAIRE 1. Réduction de franchise en l absence de système bonus-malus A - Bonnes propriétés du modèle collectif
Plus en détailCONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»
CONFERENCE PALISADE Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design» 1 SIGMA PLUS Logiciels, Formations et Etudes Statistiques
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailDirection des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Plus en détailRaisonnement probabiliste
Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte
Plus en détailBaccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé
Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H
Plus en détailRNV3P Recherche de pathologies émergentes
EPSP Ecole Doctorale Ingénierie Santé Cognition Environnement RNV3P Recherche de pathologies émergentes V Bonneterre, L Faisandier, DJ Bicout, R De Gaudemaris pour les membres du RNV3P Laboratoire Environnement
Plus en détailBourses d excellence pour les masters orientés vers la recherche
Masters de Mathématiques à l'université Lille 1 Mathématiques Ingénierie Mathématique Mathématiques et Finances Bourses d excellence pour les masters orientés vers la recherche Mathématiques appliquées
Plus en détailChief William Bratton, Los Angeles Police Department. Predictive Policing. jean-luc.besson@inhesj.com. 4 février 2015
Very soon, we will be moving to a predictive policing model where, by studying real time crime patterns, we can anticipate where a crime is likely to occur. Chief William Bratton, Los Angeles Police Department
Plus en détailFrequently Asked Questions
GS1 Canada-1WorldSync Partnership Frequently Asked Questions 1. What is the nature of the GS1 Canada-1WorldSync partnership? GS1 Canada has entered into a partnership agreement with 1WorldSync for the
Plus en détailÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE
ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE ANALYSIS OF THE EFFICIENCY OF GEOGRIDS TO PREVENT A LOCAL COLLAPSE OF A ROAD Céline BOURDEAU et Daniel BILLAUX Itasca
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailT.P. FLUENT. Cours Mécanique des Fluides. 24 février 2006 NAZIH MARZOUQY
T.P. FLUENT Cours Mécanique des Fluides 24 février 2006 NAZIH MARZOUQY 2 Table des matières 1 Choc stationnaire dans un tube à choc 7 1.1 Introduction....................................... 7 1.2 Description.......................................
Plus en détailEvidence-based medicine en français
Evidence-based medicine en français MÉDECINE FACTUELLE (Office de la langue française) Médecine fondée sur des faits démontrés Médecine fondée sur des preuves Médecine fondée sur des données probantes
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailLa demande Du consommateur. Contrainte budgétaire Préférences Choix optimal
La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal
Plus en détailProduction des Services d Assurance non-vie selon le SCN 2008
REPUBLIQUE DU CAMEROUN Paix - Travail Patrie ---------- INSTITUT NATIONAL DE LA STATISTIQUE ---------- REPUBLIC OF CAMEROON Peace - Work Fatherland ---------- NATIONAL INSTITUTE OF STATISTICS ----------
Plus en détailÉtude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux?
Étude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux? Roel PLANT 1,2 ; Pierre-André PISSARD 1 1 UMR TETIS / Irstea Montpellier 2 Institute for Sustainable Futures /
Plus en détailRÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile
RÉSUMÉ DE THÈSE L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile avec des estimations de deux projets sur trois peinent à donner un résultat satisfaisant (Nelson,
Plus en détailAPPROCHE DE MODELISATION DE LA PROPAGATION DE L INCENDIE DANS UN EDIFICE ET SON INTEGRATION DANS UN SYSTEME DECISIONNEL
APPRCHE DE MDELISATIN DE LA PRPAGATIN DE L INCENDIE DANS UN EDIFICE ET SN INTEGRATIN DANS UN SYSTEME DECISINNEL Sanae KHALI ISSA (*), Abdellah AZMANI (*), Karima ZEJLI (**) sanaeissa@gmail.com, abdellah.azmani@gmail.com,
Plus en détailMETHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES
Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé
Plus en détailpour la soumission de demandes d approbation d adaptations tarifaires en assurance-maladie complémentaire
GUIDE PRATIQUE pour la soumission de demandes d approbation d adaptations tarifaires en assurance-maladie complémentaire Edition du 18 juin 2015 But Le présent guide pratique est un simple instrument de
Plus en détail4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Plus en détailSommaire Chapitre 1 Chapitre 2 Chapitre 3 Chapitre 4 Chapitre 5 Chapitre 6 Chapitre 7. ARC EPS Eco-microbiologie Prévisionnelle Statistique
ARC EPS Eco-microbiologie Prévisionnelle Statistique 1 Objectifs de l ARC EPS 2 Partenaires 3 Moyens 4 Problématique Microbiologique 5 Démarche et Résultats 6 Perspectives 7 Valorisation LES OBJECTIFS
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailValue at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061
Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain
Plus en détailLe management des risques de l entreprise Cadre de Référence. Synthèse
Le management des risques de l entreprise Cadre de Référence Synthèse SYNTHESE L incertitude est une donnée intrinsèque à la vie de toute organisation. Aussi l un des principaux défis pour la direction
Plus en détailTownship of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs
Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs Project Introduction and Stakeholder Consultation Introduction du projet et consultations publiques Agenda/Aperçu
Plus en détail