Le modèle de Poisson avec sur-représentation de zéros Une application démographique. Rencontres méthodes et recherche UNIL - FORS



Documents pareils
Données longitudinales et modèles de survie

PHOTO ROYAUME DE BELGIQUE /KINDOM OF BELGIUM /KONINKRIJK BELGIE. Données personnelles / personal data

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

Exemple PLS avec SAS

Data issues in species monitoring: where are the traps?

UNIVERSITE DE YAOUNDE II

ROYAUME DE BELGIQUE / KINGDOM OF BELGIUM / KONINKRIJK BELGIE

Frank LASCK. Courriel : f.lasch@montpellier-bs.com Fonction : Professeur. Biographie

I. COORDONNÉES PERSONNELLES / PERSONAL DATA

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

DÉTERMINANTS COMPORTEMENTAUX DE LA SANTÉ SEXUELLE ET REPRODUCTIVE DES JEUNES EN MILIEU URBAIN

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

Cours de didactique du français langue étrangère (*) French as a foreign language (*)

NON-LINEARITE ET RESEAUX NEURONAUX

Instaurer un dialogue entre chercheurs et CÉR: pourquoi? Me Emmanuelle Lévesque Centre de génomique et politiques Université McGill

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

MEMORANDUM POUR UNE DEMANDE DE BOURSE DE RECHERCHE DOCTORALE DE LA FONDATION MARTINE AUBLET

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Application Form/ Formulaire de demande

Bologne à l EPFL. Réforme de Bologne Implications pour l EPFL. Prof. Dominique Bonvin, Doyen Bachelor-Master

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

DOSSIER DE CANDIDATURE APPLICATION FORM

Université de XY University of XY. Faculté XY Faculty of XY

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Program

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

SAS ENTERPRISE MINER POUR L'ACTUAIRE

INSCRIPTION MASTER / MASTER S APPLICATION

Population responses to environmental forcing : approaches to model and monitor habitat characteristics

Régression linéaire. Nicolas Turenne INRA

Introduction à l approche bootstrap

Économétrie, causalité et analyse des politiques

MEM vs entrevues traditionnelles pour l admission en médecine :

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

Eric BARGET, MCF à la Faculté des sports de Poitiers CEREGE (Centre de Recherche en Gestion), IAE de Poitiers

MEMORANDUM POUR UNE DEMANDE DE BOURSE DE RECHERCHE DOCTORALE DE LA FONDATION MARTINE AUBLET

TABLE DES MATIERES. C Exercices complémentaires 42

The assessment of professional/vocational skills Le bilan de compétences professionnelles

Karine Côté, Ph.D. Professeure adjointe

Summer School * Campus d été *

Philosophie de l esprit L esprit des animaux non humains

FORMULAIRE DE STATISTIQUES

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Lean approach on production lines Oct 9, 2014

L assurance dans la planification de la retraite

Les doutes et les questions des économistes face au système des brevets

F-7a-v3 1 / Bourses de mobilité / Mobility Fellowships Formulaire de demande de bourse / Fellowship Application Form

Ingénierie et gestion des connaissances

Evaluation et gestion du risque des champs radiofréquences: Une perspective de l'oms

Demande d inscription aux cours IB pour septembre 2012

Public and European Business Law - Droit public et européen des affaires. Master I Law Level

Docteur José LABARERE

Chapitre 3. Les distributions à deux variables

Sub-Saharan African G-WADI

Théorie Financière

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Venez tourner aux Gobelins

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Fiche produit ifinance v4

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

MASSEY COLLEGE & UNIVERSITY OF TORONTO

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

REVITALIZING THE RAILWAYS IN AFRICA

QUEL AVENIR POUR LA PHARMACIE HOSPITALIERE EN SUISSE?

Application des courbes ROC à l analyse des facteurs pronostiques binaires

BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION

BNP Paribas Personal Finance

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

L évaluation de la qualité d un dispositif d apprentissage en ligne. Quelles traces mobiliser? Comment les interpréter?

Institut français des sciences et technologies des transports, de l aménagement

Projet du service «ON DEMAND BUS» à Kashiwa (Japon)

Défis de l interdisciplinarité. Professeur Roderick J. Lawrence Université de Genève

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

McGILL UNIVERSITY MARTLET CLASSIC UNIVERSITE McGILL CLASSIQUE MARTLET

Evaluation générale de la qualité des données par âge et sexe

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

FOURTH SESSION : "MRP & CRP"

Théorie des sondages : cours 5

REVISION DE LA DIRECTIVE ABUS DE MARCHE

Les Entretiens Jacques Cartier. Session 1 : De la naissance du connectivisme à la satisfaction des besoins éducatifs

Modélisation des risques

tablissement public à caractère administratif).

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Evolution séculaire de la taille, du poids et de la composition corporelle à Jászság (Hongrie)

Lycée Français de Hong Kong French International School

The UNITECH Advantage. Copyright UNITECH International Society All rights reserved. Page 1

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

Une Perspective Intentionnelle de d Information

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Au-delà du coalescent : quels modèles pour expliquer la di

Gestion de Portefeuille. Mesures de Performance Ajustées du Risque

Moments des variables aléatoires réelles

Dan Bar-On. Dialog as a means of dealing with conflicts Le dialogue comme modèle pour surmonter les conflits

La Routine Quotidienne. Le docteur se lave les mains

Transcription:

Le modèle de Poisson avec sur-représentation de zéros Une application démographique Rencontres méthodes et recherche UNIL - FORS Institut d études démographiques et du parcours de vie, Université de Genève 27 septembre 2011

plan introduction 1 introduction 2 3 4

introduction présentation basée sur une contribution au XVe Colloque national de démographie 2010 (Conférence universitaire de démographie et d étude des populations - CUDEP) objectif : proposer un outil statistique pour détecter un comportement fécond particulier : le comportement d arrêt de la fécondité (birth stopping) dans une population transitionnelle cette présentation focalise sur les modèles de comptage et le problème de surdispersion

qu est-ce qu un taux démographique? le taux est un terme à significations diverses : taux de chômage : proportion taux de change : rapport, ratio taux d inflation : variation en démographie : rapport entre un nombre d événements (démographiques) et un nombre d unités de temps exposées au risque de l événement ( occurence/exposure rate ) le taux démographique mesure l intensité d un événement, fréquence relative compte tenu de la durée d exposition 6 naissances de 10 femmes observées pendant 2 ans = 3 naissances de 10 femmes observées pendant 1 an = 3 naissances de 5 femmes observées pendant 2 ans < 3 naissances de 5 femmes observées pendant 1 an = 3 naissances de 10 femmes observées pendant 6 mois

notion de taux introduction la période de risque souvent délimitée par d autres événements le risque d une naissance limité aux femmes en âge de procréer (en démographie : 15-49) le risque d une 2e naissance limité aux mères d un enfant le risque d un divorce limité aux personnes mariées on peut distinguer différents types d événement : événement fatal décès événement non fatal mariage, divorce, naissance... événement unique décès, 1er mariage, 1ère naissance... événement répétable naissance, mariage, divorce...

analyse démographique longitudinale trois perspectives d analyse longitudinale en démographie : calendrier des événements (timing when?) analyse de survie (time to occurrence) ordre des événements (sequencing in which order?) analyse des sequences (event sequences) fréquence des événements (quantum how many?) analyse des taux (occurrene/exposure, count models) la fréquence des événements est souvent modélisée par un modèle de Poisson

distribution de Poisson la loi de Poisson décrit la distribution d événements (rares) survenant dans un intervalle de temps ou dans une unité de surface de façon aléatoire et indépendante P(y µ) = e µ µ y y! µ est la moyenne de la distribution µ est aussi la variance : Var(y) = µ equidispersion souvent Var(y) > µ surdispersion quand µ augmente, P(y = 0) diminue le nombre de 0 souvent plus important que prédit

le modèle de Poisson introduction modèle de comptage (count model) modèle linéaire généralisé (GLM) avec distribution de probabilité : Poisson fonction de lien : log E(Y) = µ = exp(xβ) E(y i X i ) = µ i = exp(x i β) ln y i = k β kx ki = β 0 + β 1 X 1i + β 2 X 2i +... ŷ i = exp ( k β kx ki ) exp β = IRR

le modèle de Poisson avec offset modéliser des taux plutôt que des fréquences : pondérer les nombres d événements par la durée d exposition au risque en définissant un offset : µ i = t i λ i ln(λ i ) = ln ( yi t i ln(y i ) = ln(t i ) } {{ } offset + k ) = k β kx ki β k X ki } {{ } ln(λ i ) t i durée d exposition au risque λ i taux ln(t i ) offset (pondération) = variable dont coefficient fixé à 1

problème de surdispersion surdispersion (overdispersion) : Var(Y ) > µ causes : hétérogénéité non observée, sur-représentation de zéros conséquences : sous-estimation des erreurs standars, problèmes d inférence (cf. hétéroscedasticité) solutions : régression binomiale négative (NBR1 et 2) hurdle models : logit + Poisson tronqué (ZTP) : zéros et nombres non nuls générés par processus distincts régression de Poisson avec sur-représentation de zéros (Zero Inflated Poisson) : zéros générés par processus distincts

modèle de Poisson avec sur-représentation de zéros le modèle ZIP suppose la présence de groupes latents : 1. groupe A : toujours 0 2. groupe A : ne pas toujours 0 le modèle estime simultanément l appartenance au groupe A (µ i = 0) par un modèle binaire (logit ou probit) et le nombre d événements (µ i 0) pour les membres du groupe A par un modèle de Poisson P(A i = 1) = φ i P(A i = 0) = 1 φ i P(Y i = 0 A i = 1, X, Z) = 1 P(Y i = 0 A i = 0, X, Z) = e µ i µ 0 i 0!

application du modèle ZIP : détecter des sous-groupes pratiquant le comportement d arrêt de la fécondité dans la population genevoise du 19e siècle modéliser conjointement, à chaque parité de naissance atteinte, la probabilité d appartenir au groupe A des contracepteurs et l intensité de la fécondité dans le groupe A analyse des taux de fécondité légitime par classe d âge quinquennale et par rang de naissance atteint

some background information la première transition de la fécondité européenne résulte du passage d un comportement reproductif indépendant du rang de naissance atteint vers un comportement dépendant du nombre d enfants déjà nés de la fécondité naturelle à la fécondité dirigée [Henry 1961a, Henry 1961b] from non-parity related to parity related fertility control [Coale 1986] from birth spacing to birth stopping [Guinnane et al. 1994, Knodel 1987]

la transition des comportements reproductifs

détecter des comportements d arrêt [van Bavel 2004b] modèle de Coale et Trussell : calendrier par âge [Coale et Trussell 1974, Coale et Trussell 1978] modèle de Page : calendrier par âge et durée de mariage [Page 1977, Rodriguez et Cleland 1988] modèle de McDonald : démarrage, espacement, arrêt [McDonald 1984] l analyse des parités des cohortes (CPA) : répartition par parité [David et al. 1988] l analyse démographique des biographies : analyse multivariée des intervalles intergénésiques [Alter 1988, Gutmann et Alter 1993]

critique des méthodes classiques confusion des effets de comportements d espacement et des effets de comportements d arrêt [Okun 1994] limitation aux histoires génésiques complètes confusion des effets d intensité et de calendrier difficulté d identifier les sous-groupes pratiquant la contraception d arrêt dans une population transitionelle [Schumacher 2010] proposition d une alternative : analyse des taux de fécondité par âge et par parité atteinte à l aide d un modèle de Poisson avec sur-représentation des zéros

exemple d application : Genève au 19e siècle contexte démographique particulier : déclin précoce de la fécondité dès la fin du 17e siècle au sein de l élite [Henry 1956] diffusion du contrôle de la fécondité des classes supérieures aux classes ouvrières dès la 2ème moitié du 18e siècle [Perrenoud 1990] recomposition importante de la population au 19e siècle en raison de flux migratoires soutenus [Schumacher 2010] échantillon alphabétique de plus de 2000 histoires génésiques (complètes ou tronquées à gauche) couples mariés à Genève entre 1800 et 1880 distinction de trois classes sociales et trois groupes d origine

résultats : parité 2 introduction facteur poisson logit classe sociale classe supérieure classe moyenne ref ref classe ouvrière origine couples natifs couples mixtes ref ref couples immigrés naissances : 2050, femmes-années : 17 688 coefficients ajustés pour l âge (classes d âge quinquennales) erreurs standards robustes pour données hiérarchiques

résultats : parité 3 introduction facteur poisson logit classe sociale classe supérieure classe moyenne ref ref classe ouvrière origine couples natifs couples mixtes ref ref couples immigrés naissances : 1188, femmes-années : 10 600 coefficients ajustés pour l âge (classes d âge quinquennales) erreurs standards robustes pour données hiérarchiques

résultats : parité 4 introduction facteur poisson logit classe sociale classe supérieure classe moyenne ref ref classe ouvrière origine couples natifs couples mixtes ref ref couples immigrés naissances : 683, femmes-années : 5896 coefficients ajustés pour l âge (classes d âge quinquennales) erreurs standards robustes pour données hiérarchiques

conclusion et discussion résultats retard dans l adoption du nouveau comportement reproductif parmi les ouvriers et les immigrés persistance de l ancien comportement d espacement chez les ouvriers, pas (moins) d espacement chez les immigrés apports du ZIP adapté aux populations hétérogènes et aux histoires génésiques tronquées (populations mobiles) moindre risque de confondre stopping et spacing faiblesses du ZIP ne mesure pas l intensité du birth stopping multiplie les coefficients à estimer à faire tester la validité du modèle avec données DHS

conclusion et discussion merci!

références Alter, George (1988). Family and female life course. The women of Verviers, Belgium 1849-1880. Madison : The University of Wisconsin Press. Bongaarts, John et Robert C. Potter (1983). Fertility, biology and behaviour. New York : Academic Press. Coale, Ansley J. (1986). The decline of fertility in Europe since the 18th century as a chapter in demographic history. In Coale, Ansley J. et Susan C. Watkins (eds.). The decline of fertility in Europe. Princeton : Princeton University Press, 1-30. Coale, Ansley J. et James T. Trussell (1974). Model fertility schedules : variations in the age structure of childbearing in human populations. Population Index 40(2) : 185-258. Coale, Ansley J. et James T. Trussell (1978). Technical note : finding the two parameters that specify a model schedule of marital fertility. Population Index 44(2) : 203-213. David, Paul A., Mroz, Thomas A., Sanderson, Warren C., Wachter, Kenneth W. et David R. Weir (1988). Cohort parity analysis. Statistical estimates of the extent of fertility control. Demography 25() : 163-188. Guinnane, Timothy W., Okun, Barbara S. et James Trussell (1994). What do we know about the timing of fertility transitions in Europe? Demography 31(1) : 1-20. Gutmann, Myron P. et George Alter (1993). Family reconstitution as event-history analysis. In Reher, David et Roger Schofield (eds.). Old and new methods in historical demography. Oxford : Clarendon Press, 159-177. Henry, Louis (1956). Anciennes familles genevoises. Etude démographique, 16-20e siècle. Paris : PUF.

références Henry, Louis (1961a). La fécondité naturelle. Observation - théorie - résultats. Population 4(4) : 625-636. Henry, Louis (1961b). Some data on natural fertility. Eugenics Quarterly 8(2) : 81-91. Knodel, John (1987). Starting, stopping and spacing during the early stages of fertility transition : the experience of German village populations in the 18th and 19th centuries. Demography 24(2) :143-162 Leridon, Henry (1989). Fécondité naturelle et espacement des naissances. Annales de démographie historique 1988 : 21-33. Long, Scott J. et Jeremy Freese (2006). Regression models for categorical dependent variables using Stata. 2nd edition. College Station, TX : Stata Press. McDonald, P. (1984). Nuptiality and completed fertility : a study of starting, stopping and spacing behavior. Voorburg,NL : International Statistical Institute. Okun, Barbara S. (1994). Evaluating methods for detecting fertility control : Coale and Trussell s model and cohort parity analysis. Population Studies 48(2) : 193-222. Perrenoud, Alfred (1990). Aspects of fertility decline in an urban setting : Rouen and Geneva. In van de Woude, Ad, de Vries, Jan et Akira Hayami (eds). Urbanization in history. A process of dynamic interactions. Oxford : Oxford University Press, 243-263. Page, Hillary J. (1977). Patterns underlying fertility schedules : a decomposition by both age and marriage duration. Population Studies 31(1) : 85-106.

références Rodriguez, German et John Cleland (1988). Modelling marital fertility by age and duration : an empirical appraisal of the Page model. Population Studies 42(2) : 241-257. Santow, Gigi (1995). Coitus interruptus and the control of natural fertility. Population Studies 49(1) : 19-43. Schoumaker, Bruno (2004). Une approche personnes-périodes pour l analyse des histoires génésiques. Population 59(5) : 783-796. Schumacher, Reto (2010). Structures et comportements en transition. La reproduction démographique à Genève au 19e siècle. Collection Population, famille et société vol. 12. Berne : Peter Lang. van Bavel, Jan (2004a). Deliberate birth spacing before the fertility transition in Europe : evidence from nineteenth-century Belgium. Population Studies 58(1) :95-107 van Bavel, Jan (2004b). Distinguer contraception d arrêt et contraception d espacement. Revue des méthodes en démographie historique. Population 59(1) :119-132.