GLM - GEE - GLMM Modèles de régression pour variables réponses discrètes et continues asymétriques

Dimension: px
Commencer à balayer dès la page:

Download "GLM - GEE - GLMM Modèles de régression pour variables réponses discrètes et continues asymétriques"

Transcription

1 GLM - GEE - GLMM Modèles de régression pour variables réponses discrètes et continues asymétriques Eva Cantoni Department of Econometrics University of Geneva Eva.Cantoni@unige.ch Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

2 Sommaire Sommaire Jeux de données et leur nature (1) Jeux de données et leur nature (2) Jeux de données et leur nature (3) Limitations du modèle linéaire Jeux de données et leur nature : réponses binaires, comptages, réponses positives. (GLM) pour réponses indépendantes Exemples Extension aux données Exemple Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

3 Sommaire Jeux de données et leur nature (1) Jeux de données et leur nature (2) Jeux de données et leur nature (3) Limitations du modèle linéaire Variables réponses Y 1,...,Y n indépendantes continues, covariées x i = (1,x i1,...,x ip ) T. Modèle : Y i = β 0 + β 1 x i β p x ip + ǫ i = x T i β + ǫ i Hypothèses : ǫ i suit une distribution continue avec E(ǫ i ) = 0 et V ar(ǫ i ) = σ 2 (ou ǫ i N(0,σ 2 )). Estimation : par maximum de vraisemblance ou moindres carrés (revient au même si hypothèse de normalité). Inférence basée sur la vraisemblance (distribution asymptotique de l estimateur, differentes statistiques de test). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

4 Jeux de données et leur nature (1) Sommaire Jeux de données et leur nature (1) Jeux de données et leur nature (2) Jeux de données et leur nature (3) Limitations du modèle linéaire CARDIA study (Coronary Artery Risk Development in young Adults) Réf. : Preisser, Galecki, Lohman and Wagenknecht (2000) Analysis of smoking trends with incomplete longitudinal binary responses, JASA (http ://lib.stat.cmu.edu/) individus (18-30 ans) mesurés sur 4 vagues : 1986, 1988, 1991 et Variable réponse : ne fume pas (0) / fume (1) (binomiale). Covariées : age cohorte de naissance ( , ) niveau d éducation (high school or less, some college, college degree) race-sexe (hommes noirs, femmes noires, hommes blancs, femmes blanches) Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

5 Jeux de données et leur nature (2) Sommaire Jeux de données et leur nature (1) Jeux de données et leur nature (2) Jeux de données et leur nature (3) Limitations du modèle linéaire NMMAPS : National Morbidity, Mortality and Air Pollution Study Database ( ) (Réf. : http :// pour 88 grandes villes des Etats Unis. Variable réponse : nombre de morts par jour (Poisson). Covariées : particules fines en mg/m 3 (moins de 10 µ de diamètre) (moyenne tronquée (10%) sur toutes les stations de la county ) (pm10tmean) temperature moyenne sur 24 heures (tmean) date (day) temperature à l aube (dptp) jour de la semaine (dow : 1=Sat, 2=Sun,...) Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

6 Jeux de données et leur nature (3) Sommaire Jeux de données et leur nature (1) Jeux de données et leur nature (2) Jeux de données et leur nature (3) Limitations du modèle linéaire Hospitalisation pour problèmes de dos (APDRG 243) au Centre Hospitalier Universitaire Vaudois (CHUV) à Lausanne en 1999 (Réf. : Marazzi et Yohai (2004) Adaptively truncated maximum likelihood regression with asymmetric errors, Journal of Stat. Planning and Inference.) 100 patients. Variable réponse : coûts d hospitalisation (). Covariées : durée du séjour (LOS, en jour) type d admission (Typadm : 0=planifiée, 1=urgence) type d assurance (TypAss : 0=base, 1=privée) age en année (age) sexe (Sexe : 0=femme, 1=homme) destination (dest : 1=domicile, 0=autre établissement) Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

7 Limitations du modèle linéaire Sommaire Jeux de données et leur nature (1) Jeux de données et leur nature (2) Jeux de données et leur nature (3) Limitations du modèle linéaire CARDIA : restriction à l intervalle [0, 1], asymétrie. NMMPAS : positif, discret, asymétrie. Coûts hospitaliers : asymétrie, évtl. étalement à droite. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

8 généralisé (1) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Variables réponses Y 1,...,Y n indépendantes, covariées x i = (1,x i1,...,x ip ) T. Le modèle linéaire peut s écrire : Modèle GLM : Y i = x T i β + ǫ i ou E(Y i ) = µ i = x T i β. g(e(y i )) = β 0 + β 1 x i β p x ip = x T i β où g est appelée fonction lien. Possibilité (comme dans le modèle linéaire) de considérer des transformations dans les covariées (termes quadratiques, p. ex.) Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

9 généralisé (2) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Hypothèses : Y i suit une distribution discrète ou continue dans la famille exponentielle (contient : binomiale, Poisson, exponentielle, ) avec E(Y i ) = µ i et V ar(y i ) = v(µ i ). Estimation : par maximum de vraisemblance. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

10 généralisé (2) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Hypothèses : Y i suit une distribution discrète ou continue dans la famille exponentielle (contient : binomiale, Poisson, exponentielle, ) avec E(Y i ) = µ i et V ar(y i ) = v(µ i ). Estimation : par maximum de vraisemblance. Validation du modèle : inspection des résidus. Inférence basée sur la vraisemblance (ou déviance) : distribution asymptotique de l estimateur (et donc variance) comparaison de modèles emboîtés (type test de rapport de vraisemblance, distribution χ 2 ) critère d Akaike (AIC) Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

11 binaires généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Si Y i = 0 ou 1, alors E(Y i ) = µ i = p i = P(Y i = 1) et V ar(y i ) = p i (1 p i ). Il y a différentes possibilités pour g : lien logit : log( p i 1 p i ) = x T i β lien probit : Φ(p i ) = x T i β lien c-loglog : log( log(1 p i )) = x T i β Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

12 binaires généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Si Y i = 0 ou 1, alors E(Y i ) = µ i = p i = P(Y i = 1) et V ar(y i ) = p i (1 p i ). Il y a différentes possibilités pour g : lien logit : log( p i 1 p i ) = x T i β lien probit : Φ(p i ) = x T i β lien c-loglog : log( log(1 p i )) = x T i β Si Y i est Bin(n i,p i ), on travaille avec les proportions Y i /n i. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

13 Poisson et réponses généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Si Y i P(λ i ), alors E(Y i ) = λ i et V ar(y i ) = λ i. Fonction lien logarithmique : log(λ i ) = x T i β Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

14 Poisson et réponses généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Si Y i P(λ i ), alors E(Y i ) = λ i et V ar(y i ) = λ i. Fonction lien logarithmique : log(λ i ) = x T i β Si Y i (µ i,φ), alors E(Y i ) = µ i et V ar(y i ) = µ 2 i /φ. Fonction lien logarithmique : log(λ i ) = x T i β (ou fonction lien inverse : 1/λ i = x T i β). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

15 Poisson et réponses généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Si Y i P(λ i ), alors E(Y i ) = λ i et V ar(y i ) = λ i. Fonction lien logarithmique : log(λ i ) = x T i β Si Y i (µ i,φ), alors E(Y i ) = µ i et V ar(y i ) = µ 2 i /φ. Fonction lien logarithmique : log(λ i ) = x T i inverse : 1/λ i = x T i β). β (ou fonction lien Attention : pas équivalent à transformer la réponse en log! Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

16 1986 (1) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles glm(formula = smoke ~ age + factor(birth) + factor(education) + factor(racesex), family = binomial, data = CARDIA.wave1) oefficients: Estimate Std. Error z value Pr(> z ) (Intercept) * age * factor(birth) factor(birth) factor(education) e-14 *** factor(education) < 2e-16 *** factor(racesex) factor(racesex) factor(racesex) Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for binomial family taken to be 1) Null deviance: on 3692 degrees of freedom Residual deviance: on 3684 degrees of freedom AIC: Number of Fisher Scoring iterations: 4 Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

17 1986 (2) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Résidus : Residuals Std. deviance resid Residuals vs Fitted Predicted values Scale Location Predicted values Std. deviance resid. Std. deviance resid Normal Q Q Theoretical Quantiles Residuals vs Leverage Cook s distance Leverage Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

18 1986 (3) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Interprétation : Effet d une variable (toute chose étant égale par ailleurs) : p i log( ) = x T i 1 p β et donc p i = exp(x T i i 1 p β). i On interprète sur l échelle des cotes (odds). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

19 1986 (3) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Interprétation : Effet d une variable (toute chose étant égale par ailleurs) : p i log( ) = x T i 1 p β et donc p i = exp(x T i i 1 p β). i On interprète sur l échelle des cotes (odds). Une année (age) supplémentaire augmente la cote de fumer de 6.6% (car exp( ) = 1.066) Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

20 1986 (3) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Interprétation : Effet d une variable (toute chose étant égale par ailleurs) : p i log( ) = x T i 1 p β et donc p i = exp(x T i i 1 p β). i On interprète sur l échelle des cotes (odds). Une année (age) supplémentaire augmente la cote de fumer de 6.6% (car exp( ) = 1.066) Le fait d avoir un diplôme universitaire (education=3, par rapport un niveau de formation non-universitaire) diminue la cote de 86% (car exp( 1.939) = 0.144) Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

21 (n = 1986) (1) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles glm(formula = death ~ pm10tmean + tmean + day + dptp + factor(dow), family = poisson, data = sanf) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) 2.283e e < 2e-16 *** pm10tmean 1.733e e ** tmean e e * day e e e-05 *** dptp e e factor(dow) e e factor(dow) e e factor(dow) e e factor(dow) e e factor(dow) e e factor(dow) e e Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for poisson family taken to be 1) Null deviance: on 1985 degrees of freedom Residual deviance: on 1975 degrees of freedom (13356 observations deleted due to missingness) AIC: Number of Fisher Scoring iterations: 4 Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

22 (n = 1986) (2) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Résidus : Residuals Std. deviance resid Residuals vs Fitted Predicted values Scale Location Predicted values Std. deviance resid. Std. deviance resid Normal Q Q Theoretical Quantiles Residuals vs Leverage Cook s distance Leverage Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

23 (n = 1986) (3) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Interprétation : Effet d une variable (toute chose étant égale par ailleurs) : log(λ i ) = x T i β et donc µ i = λ i = exp(x T i β). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

24 (n = 1986) (3) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Interprétation : Effet d une variable (toute chose étant égale par ailleurs) : log(λ i ) = x T i β et donc µ i = λ i = exp(x T i β). Une augmentation de 10 mg/m 3 de particules fines augmente le nombre de morts de 1.7% (exp( ) = 1.017). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

25 (n = 1986) (3) généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles Interprétation : Effet d une variable (toute chose étant égale par ailleurs) : log(λ i ) = x T i β et donc µ i = λ i = exp(x T i β). Une augmentation de 10 mg/m 3 de particules fines augmente le nombre de morts de 1.7% (exp( ) = 1.017). Un degré (temperature) supplémentaire réduit le nombre de morts de 0.5% (car exp( 0.005) = 0.995). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

26 Problèmes possibles généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles sur/sous dispersion : pour la binomiale et la Poisson, l hypothèse sur la variance n est pas satisfaite. Solution : modèle de type quasi-poisson (Hyp. : V ar(y i ) = φv(µ i ) et estimation par quasi-vraisemblance). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

27 Problèmes possibles généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles sur/sous dispersion : pour la binomiale et la Poisson, l hypothèse sur la variance n est pas satisfaite. Solution : modèle de type quasi-poisson (Hyp. : V ar(y i ) = φv(µ i ) et estimation par quasi-vraisemblance). pic en zéro : excès de zéros dans les comptages (Poisson) ou pic en zéro pour les données continues. Solution : modèle de type zero-inflated (e.g. ZIP) ou two-step/hurdle. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

28 Problèmes possibles généralisé (1) généralisé (2) binaires Poisson et réponses 1986 (1) 1986 (2) 1986 (3) (n = 1986) (1) (n = 1986) (2) (n = 1986) (3) Problèmes possibles sur/sous dispersion : pour la binomiale et la Poisson, l hypothèse sur la variance n est pas satisfaite. Solution : modèle de type quasi-poisson (Hyp. : V ar(y i ) = φv(µ i ) et estimation par quasi-vraisemblance). pic en zéro : excès de zéros dans les comptages (Poisson) ou pic en zéro pour les données continues. Solution : modèle de type zero-inflated (e.g. ZIP) ou two-step/hurdle. Valeurs aberrantes : valeurs extrêmes qui influencent grandement l estimation. Solution : statistique robuste. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

29 Extensions aux données Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Variables réponses Y 1 = (Y 11,...,Y 1ni ) T,...,Y n = (Y n1,...,y nni ) T, covariées x it = (1,x it1,...,x itp ) T pour t = 1,...,n i. Les Y i sont indépendants, mais pour chaque i, les Y it pour t = 1,...,n i ne le sont pas. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

30 Extensions aux données Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Variables réponses Y 1 = (Y 11,...,Y 1ni ) T,...,Y n = (Y n1,...,y nni ) T, covariées x it = (1,x it1,...,x itp ) T pour t = 1,...,n i. Les Y i sont indépendants, mais pour chaque i, les Y it pour t = 1,...,n i ne le sont pas. Deux façons d intégrer cette hypothèse : 1. GEE (generalized estimating equations) : modéliser la corrélation directement. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

31 Extensions aux données Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Variables réponses Y 1 = (Y 11,...,Y 1ni ) T,...,Y n = (Y n1,...,y nni ) T, covariées x it = (1,x it1,...,x itp ) T pour t = 1,...,n i. Les Y i sont indépendants, mais pour chaque i, les Y it pour t = 1,...,n i ne le sont pas. Deux façons d intégrer cette hypothèse : 1. GEE (generalized estimating equations) : modéliser la corrélation directement. 2. GLMM (generalized linear mixed models) : ajouter des effets aléatoires au modèle. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

32 GEE en détail Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Hypothèses : E(Y it ) = µ it, V ar(y it ) = φv(µ it ) et Corr(Y it,y it ) = r(α). Choix pour r(α) : échangeable, AR(1), libre,... Modèle : g(µ it ) = x T itβ Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

33 GEE en détail Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Hypothèses : E(Y it ) = µ it, V ar(y it ) = φv(µ it ) et Corr(Y it,y it ) = r(α). Choix pour r(α) : échangeable, AR(1), libre,... Modèle : g(µ it ) = x T itβ Equations d estimation : n i=1 D T i (A 1/2 i R i (α)a 1/2 i ) 1 (Y i µ i ) = 0, avec D i = dµ i /dβ et A i = diag(φv(µ it )). Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

34 GEE en détail Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Hypothèses : E(Y it ) = µ it, V ar(y it ) = φv(µ it ) et Corr(Y it,y it ) = r(α). Choix pour r(α) : échangeable, AR(1), libre,... Modèle : g(µ it ) = x T itβ Equations d estimation : n i=1 D T i (A 1/2 i R i (α)a 1/2 i ) 1 (Y i µ i ) = 0, avec D i = dµ i /dβ et A i = diag(φv(µ it )). Diagnostic des résidus possible. Inférence : distribution asymptotique connue. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

35 GLMM en détail Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Covariées pour les effets aléatoires : z it = (1,z it1,...,z itq ) T pour t = 1,...,n i. Hypothèses : - γ i indépendants selon N(0, Ψ) - Y it γ i, t = 1,...,n i indépendants selon une distribution de la famille exponentielle. - E(Y it γ i ) = µ it et V ar(y it γ i ) = φv(µ it ). Modèle : g(e(y it γ i )) = g(µ it ) = x T itβ + z T itγ i avec fonction lien g. Estimation par maximum de vraisemblance : L(β,φ, Ψ) = n i=1 ni t=1 f(y it γ i,β,φ)f(γ i φ, Ψ)dγ i. Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

36 GEE vs GLMM Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM GEE pas de vraisemblance, mais équations d estimation aujstement facile inference de type population average GLMM vraisemblance calcul de la vraisemblance compliqué inference de type subject-specific Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

37 CARDIA - GEE (1) Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM GEE: GENERALIZED LINEAR MODELS FOR DEPENDENT DATA gee S-function, version 4.13 modified 98/01/27 (1998) Model: Link: Logit Variance to Mean Relation: Binomial Correlation Structure: AR-M, M = 1 Coefficients: Estimate Naive S.E. Naive z Robust S.E. Robust z (Intercept) age factor(birth) factor(birth) factor(education) factor(education) factor(racesex) factor(racesex) factor(racesex) Estimated Scale Parameter: Number of Iterations: 2 Working Correlation [,1] [,2] [,3] [,4] [1,] [2,] [3,] [4,] Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

38 CARDIA - GEE (2) Résidus : Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM residuals Index Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

39 CARDIA - GLMM Extensions aux données GEE en détail GLMM en détail GEE vs GLMM CARDIA - GEE (1) CARDIA - GEE (2) CARDIA - GLMM Linear mixed-effects model fit by maximum likelihood Random effects: Formula: ~1 id (Intercept) Residual StdDev: Variance function: Structure: fixed weights Formula: ~invwt Fixed effects: smoke ~ age + factor(birth) + factor(education) + factor(racesex) Value Std.Error DF t-value p-value (Intercept) age factor(birth) factor(birth) factor(education) factor(education) factor(racesex) factor(racesex) factor(racesex) Standardized Within-Group Residuals: Min Q1 Med Q3 Max Number of Observations: Number of Groups: 3693 Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

40 Extra CHUV (1) CHUV (2) Extra Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

41 CHUV (1) Extra CHUV (1) CHUV (2) glm(formula = CouTot ~ log(los) + Typadm + Typass + age + Sexe + dest, family = (link = log), data = MYdata) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** log(los) < 2e-16 *** Typadm e-05 *** Typass age Sexe dest Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for family taken to be ) Null deviance: on 99 degrees of freedom Residual deviance: on 93 degrees of freedom AIC: Number of Fisher Scoring iterations: 5 Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

42 CHUV (2) Extra CHUV (1) CHUV (2) Residuals Residuals vs Fitted Std. deviance resid Normal Q Q Predicted values Theoretical Quantiles Std. deviance resid Scale Location Std. deviance resid Residuals vs Leverage Cook s 63 distance Predicted values Leverage Eva Cantoni Colloque d Epidémiologie Clinique et Biostatistique (HUG) - 9 juin / 28

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

SAS ENTERPRISE MINER POUR L'ACTUAIRE

SAS ENTERPRISE MINER POUR L'ACTUAIRE SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Modèle GARCH Application à la prévision de la volatilité

Modèle GARCH Application à la prévision de la volatilité Modèle GARCH Application à la prévision de la volatilité Olivier Roustant Ecole des Mines de St-Etienne 3A - Finance Quantitative Décembre 2007 1 Objectifs Améliorer la modélisation de Black et Scholes

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

Imputation du salaire d ego dans TeO

Imputation du salaire d ego dans TeO Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Cancer bronchique primitif: données épidémiologiques récentes

Cancer bronchique primitif: données épidémiologiques récentes Cancer bronchique primitif: données épidémiologiques récentes Pr Jean Trédaniel Service de pneumologie et oncologie thoracique Groupe Hospitalier Paris Saint Joseph Université Paris Descartes Sources Données

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Econométrie et applications

Econométrie et applications Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet (nicolas.jacquemet@univ-paris1.fr) Université Paris 1 & Ecole d Economie de Paris

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Statistique de l assurance

Statistique de l assurance Statistique de l assurance Arthur Charpentier To cite this version: Arthur Charpentier. Statistique de l assurance. 3ème cycle. Université de Rennes 1 et Université de Montréal, 2010, pp.133.

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Modélisation géostatistique des débits le long des cours d eau.

Modélisation géostatistique des débits le long des cours d eau. Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des

Plus en détail

L approche de régression par discontinuité. Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011

L approche de régression par discontinuité. Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011 L approche de régression par discontinuité Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011 Plan de la présentation L approche de régression par discontinuité (RD) Historique

Plus en détail

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Application des courbes ROC à l analyse des facteurs pronostiques binaires Application des courbes ROC à l analyse des facteurs pronostiques binaires Combescure C (1), Perneger TV (1), Weber DC (2), Daurès J P (3), Foucher Y (4) (1) Service d épidémiologie clinique et Centre

Plus en détail

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce

Plus en détail

Modélisation des risques

Modélisation des risques 2 Modélisation des risques 2. Introduction L objectif de ce chapitre est de présenter les modèles de base utilisés pour décrire le comportement aléatoire d un risque en actuariat pour une période xe. Les

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

Analyse des durées de vie avec le logiciel R

Analyse des durées de vie avec le logiciel R Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger

Plus en détail

La méthode de régression par discontinuité et l évaluation des politiques de l emploi

La méthode de régression par discontinuité et l évaluation des politiques de l emploi La méthode de régression par discontinuité et l évaluation des politiques de l emploi Thomas Lemieux University of British Columbia Le 24 novembre 2009 Plan de la présentation La méthode de régression

Plus en détail

Risque et assurance. Arthur Charpentier. Université Rennes 1. arthur.charpentier@univ-rennes1.fr http ://freakonometrics.blog.free.

Risque et assurance. Arthur Charpentier. Université Rennes 1. arthur.charpentier@univ-rennes1.fr http ://freakonometrics.blog.free. Risque et assurance Arthur Charpentier Université Rennes 1 arthur.charpentier@univ-rennes1.fr http ://freakonometrics.blog.free.fr/ Journées d Études Statistique, Luminy, Novembre 2010. 1 1 Prise en compte

Plus en détail

i ANALYSE STATISTIQUE DES TARIFS DES GARANTIES DOMMAGES EN ASSURANCES AUTOMOBILE : CAS DE CHANAS ASSURANCES S.A Mémoire Par : LELE SIAKA HERNANDEZ

i ANALYSE STATISTIQUE DES TARIFS DES GARANTIES DOMMAGES EN ASSURANCES AUTOMOBILE : CAS DE CHANAS ASSURANCES S.A Mémoire Par : LELE SIAKA HERNANDEZ i ANALYSE STATISTIQUE DES TARIFS DES GARANTIES DOMMAGES EN ASSURANCES AUTOMOBILE : CAS DE CHANAS ASSURANCES S.A Mémoire présenté et soutenu en vue de l obtention du Diplôme de Master de Statistique Appliquée.

Plus en détail

de calibration Master 2: Calibration de modèles: présentation et simulation d

de calibration Master 2: Calibration de modèles: présentation et simulation d Master 2: Calibration de modèles: présentation et simulation de quelques problèmes de calibration Plan de la présentation 1. Présentation de quelques modèles à calibrer 1a. Reconstruction d une courbe

Plus en détail

Commande Prédictive des. Convertisseurs Statiques

Commande Prédictive des. Convertisseurs Statiques Commande Prédictive des Convertisseurs Statiques 1 Classification des méthodes de commande pour les convertisseurs statiques Commande des convertisseurs Hystérésis MLI Cde Linéaire Fuzzy Logic Sliding

Plus en détail

Modèle de calcul des paramètres économiques

Modèle de calcul des paramètres économiques Modèle de calcul des paramètres économiques selon norme SIA 480 Calcul de rentabilité pour les investissements dans le bâtiment Version 3.2 1. Introduction 1.1 Version Excel Le modèle de calcul a été développé

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

MCMC et approximations en champ moyen pour les modèles de Markov

MCMC et approximations en champ moyen pour les modèles de Markov MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:

Plus en détail

Cours de didactique du français langue étrangère (*) French as a foreign language (*)

Cours de didactique du français langue étrangère (*) French as a foreign language (*) FORMULAIRE DESTINE AUX DEMANDES DE BOURSE DURANT L ETE FORM TO BE USED FOR APPLICATIONS FOR A SUMMER SCHOLARSHIP Wallonie-Bruxelles International Service des Bourses d études 2, Place Sainctelette 1080

Plus en détail

L olivier Assurances Licence 3 Econométrie Lyon II

L olivier Assurances Licence 3 Econométrie Lyon II 15 novembre 2013 L olivier Assurances Licence 3 Econométrie Lyon II Pascal Gonzalvez 1 L olivier Assurances et le Groupe Admiral Segmentation et tarification en assurance auto Autres applications de la

Plus en détail

Echantillonnage Non uniforme

Echantillonnage Non uniforme Echantillonnage Non uniforme Marie CHABERT IRIT/INP-ENSEEIHT/ ENSEEIHT/TéSASA Patrice MICHEL et Bernard LACAZE TéSA 1 Plan Introduction Echantillonnage uniforme Echantillonnage irrégulier Comparaison Cas

Plus en détail

Evaluation des modèles non-linéaires à effets mixtes

Evaluation des modèles non-linéaires à effets mixtes Evaluation des effets mixtes INSERM UMR738 GDR Statistiques et Santé, 20 octobre 2009 Pharmacométrie Définition modélisation des données obtenues lors d essais cliniques sur des médicaments développement

Plus en détail

LECTURE CRITIQUE 1 ER PAS

LECTURE CRITIQUE 1 ER PAS 1 LECTURE CRITIQUE D UN ARTICLE SCIENTIFIQUE 1 ER PAS FORUM PCI 20,05,14 MJ Thévenin / Inf. EPIAS/ SMPH BUTS ET ORGANISATION DE LA PRÉSENTATION Utiliser une grille de lecture critique d un article Comprendre

Plus en détail

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples, Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia. Medication Management Ability Assessment (MMAA) Patterson TL, Lacro J, McKibbin CL, Moscona S, Hughs T, Jeste DV. (2002) Medication management ability assessment: results from a performance based measure

Plus en détail

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains. Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Modèles et Méthodes de Réservation

Modèles et Méthodes de Réservation Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Le point de vue d une administration hospitalière Inka Moritz, Secrétaire générale

Le point de vue d une administration hospitalière Inka Moritz, Secrétaire générale Spécialistes en santé publique? Le point de vue d une administration hospitalière Inka Moritz, Secrétaire générale Le CHUV est l employeur de 10 000 personnes Budget 1,4 milliard de frs 2 1 des 5 Hôpitaux

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Mémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form M / Mr Mme / Mrs Nom Last name... Nom de jeune fille Birth

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

Étude des flux d individus et des modalités de recrutement chez Formica rufa

Étude des flux d individus et des modalités de recrutement chez Formica rufa Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt

Plus en détail

NanoSense. Protocole Modbus de la sonde Particules P4000. (Version 01F)

NanoSense. Protocole Modbus de la sonde Particules P4000. (Version 01F) NanoSense 123 rue de Bellevue, 92100 Boulogne Billancourt France Tél : 33-(0) 1 41 41 00 02, fax : 33-(0) 1 41 41 06 72 Protocole Modbus de la sonde Particules P4000 (Version 01F) Ver V01A V01B V01C V01D

Plus en détail

QUEL AVENIR POUR LA PHARMACIE HOSPITALIERE EN SUISSE?

QUEL AVENIR POUR LA PHARMACIE HOSPITALIERE EN SUISSE? QUEL AVENIR POUR LA PHARMACIE HOSPITALIERE EN SUISSE? Regard critique sur nos filières de formation Symposium GSASA, Berne, 12 mai 2009 André Pannatier 1 PLAN 1. Les filières de formation de base et postdiplôme

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

MODELES DE DUREE DE VIE

MODELES DE DUREE DE VIE MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

21 mars 2012. Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

21 mars 2012. Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire. de 21 mars 2012 () 21 mars 2012 1 / 6 de 1 2 3 4 5 () 21 mars 2012 2 / 6 1 de 2 3 4 5 () 21 mars 2012 3 / 6 1 2 de 3 4 5 () 21 mars 2012 4 / 6 1 2 de 3 4 de 5 () 21 mars 2012 5 / 6 de 1 2 3 4 5 () 21 mars

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

1 Recherche en table par balayage

1 Recherche en table par balayage 1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément

Plus en détail

L Econométrie des Données de Panel

L Econométrie des Données de Panel Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire

Plus en détail

MATHS FINANCIERES. Mireille.Bossy@sophia.inria.fr. Projet OMEGA

MATHS FINANCIERES. Mireille.Bossy@sophia.inria.fr. Projet OMEGA MATHS FINANCIERES Mireille.Bossy@sophia.inria.fr Projet OMEGA Sophia Antipolis, septembre 2004 1. Introduction : la valorisation de contrats optionnels Options d achat et de vente : Call et Put Une option

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail