SEMIN- Introduction au modèle linéaire mixte. Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS

Dimension: px
Commencer à balayer dès la page:

Download "SEMIN- Introduction au modèle linéaire mixte. Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS"

Transcription

1 SEMIN- Introduction au modèle linéaire mixte Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS SEMIN-R du MNHN 18 Décembre 2008

2 Introduction au modèle linéaire mixte Sébastien Ballesteros UMR 7625 Ecologie Evolution Équipe Eco-Evolution mathématique ENS Ulm, UPMC 18/12/2008 / Semin-R MNHN

3 Lignes directrices 1 Introduction Une longue introduction Une courte introduction 2 Applications Retour sur les rails Split-plot Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesures répétées et structure de correlation (exemple rats)

4 Une longue introduction Lignes directrices 1 Introduction Une longue introduction Une courte introduction 2 Applications Retour sur les rails Split-plot Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesures répétées et structure de correlation (exemple rats)

5 Une longue introduction Un premier exemple : data Rail (nlme) Mesure du temps de voyage d ultrasons le long de rails 4 3 Rail 6 mesure sur 6 rails 1 5 chaque rail est testé 3 fois Zero force travel time (nanoseconds) Question temps de voyage moyen pour un rail typique variation entre les rails variation au sein d un rail

6 Une longue introduction Un premier exemple : data Rail (nlme) Mesure du temps de voyage d ultrasons le long de rails 4 3 Rail 6 mesure sur 6 rails 1 5 chaque rail est testé 3 fois Zero force travel time (nanoseconds) Question temps de voyage moyen pour un rail typique variation entre les rails variation au sein d un rail

7 Une longue introduction Un premier modèle Y ij = µ + E ij, E ij N (0, σ 2 ) indépendants > model <- lm(travel~1,data=rail) > summary(model) Call : lm(formula = travel ~ 1, data = Rail)... Coefficients : Estimate Std. Error t value Pr(> t ) (Intercept) e-09 *** -- Signif. codes : 0 *** ** 0.01 * Residual standard error : on 17 degrees of freedom

8 Une longue introduction Un premier modèle Y ij = µ + E ij, E ij N (0, σ 2 ) indépendants > model <- lm(travel~1,data=rail) > summary(model) Call : lm(formula = travel ~ 1, data = Rail)... Coefficients : Estimate Std. Error t value Pr(> t ) (Intercept) e-09 *** -- Signif. codes : 0 *** ** 0.01 * Residual standard error : on 17 degrees of freedom

9 > model <- lm(travel~1,data=rail) Une longue introduction Un premier modèle Y ij = µ + E ij, E ij N (0, σ 2 ) indépendants residuals rail La variabilité entre les rails augmentent artificiellement la variabilité intra rail

10 Une longue introduction Prise en compte de l effet rail : ANOVA Y ij = µ i + E ij, E ij N (0, σ 2 ) indépendants > model2 <- lm(travel~rail-1, data=rail) Coefficients : Rail2 Rail5 Rail1 Rail6 Rail3 Rail Call : lm(formula = travel ~ Rail - 1, data = Rail)... Residual standard error : on 12 degrees of freedom Multiple R-squared : , Adjusted R-squared : F-statistic : on 6 and 12 DF, p-value : 2.971e-15

11 Une longue introduction Prise en compte de l effet rail : ANOVA Y ij = µ i + E ij, E ij N (0, σ 2 ) indépendants > model2 <- lm(travel~rail-1, data=rail) Coefficients : Rail2 Rail5 Rail1 Rail6 Rail3 Rail Call : lm(formula = travel ~ Rail - 1, data = Rail)... Residual standard error : on 12 degrees of freedom Multiple R-squared : , Adjusted R-squared : F-statistic : on 6 and 12 DF, p-value : 2.971e-15

12 Une longue introduction Prise en compte de l effet rail : ANOVA Y ij = µ i + E ij, E ij N (0, σ 2 ) indépendants residuals rail residus OK, on prend bien en compte l effet rails limite On ne considère que l échantillon spécifique de rails utilisés pour cette expérience alors que notre intérêt principale porte sur la population de rails dont est extrait notre échantillon. Par contre intéressant pour classer les rails.

13 Une longue introduction Prise en compte de l effet rail : ANOVA Y ij = µ i + E ij, E ij N (0, σ 2 ) indépendants residuals rail residus OK, on prend bien en compte l effet rails limite On ne considère que l échantillon spécifique de rails utilisés pour cette expérience alors que notre intérêt principale porte sur la population de rails dont est extrait notre échantillon. Par contre intéressant pour classer les rails.

14 Une longue introduction Modèle à effet aléatoire Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 ) A i échantillonné au hasard dans la population considérée les mesures faite sur le même rail partagent le même effet aléatoire, elles sont donc corrélées. > library(nlme) > model3 <- lme(travel ~ 1, data=rail, random= ~1 Rail) > summary(model3) Linear mixed-effects model fit by REML... Random effects : Formula : ~1 Rail (Intercept) Residual StdDev : Fixed effects : travel ~ 1 Value Std.Error DF t-value p-value (Intercept)

15 Une longue introduction Modèle à effet aléatoire Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 ) A i échantillonné au hasard dans la population considérée les mesures faite sur le même rail partagent le même effet aléatoire, elles sont donc corrélées. > library(nlme) > model3 <- lme(travel ~ 1, data=rail, random= ~1 Rail) > summary(model3) Linear mixed-effects model fit by REML... Random effects : Formula : ~1 Rail (Intercept) Residual StdDev : Fixed effects : travel ~ 1 Value Std.Error DF t-value p-value (Intercept)

16 Une longue introduction Modèle à effet aléatoire Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 ) A i échantillonné au hasard dans la population considérée les mesures faite sur le même rail partagent le même effet aléatoire, elles sont donc corrélées. > library(nlme) > model3 <- lme(travel ~ 1, data=rail, random= ~1 Rail) > summary(model3) Linear mixed-effects model fit by REML... Random effects : Formula : ~1 Rail (Intercept) Residual StdDev : Fixed effects : travel ~ 1 Value Std.Error DF t-value p-value (Intercept)

17 Une longue introduction Résultats > intervals(model3) Approximate 95% confidence intervals Fixed effects : lower est. upper (Intercept) attr(,"label") [1] "Fixed effects :" Random Effects : Level : Rail lower est. upper sd((intercept)) Within-group standard error : lower est. upper On a bien la variabilité inter σ 2 a et intra rail σ 2.

18 Une longue introduction Modèle à effet aléatoire : interprétation Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 )

19 Une courte introduction Lignes directrices 1 Introduction Une longue introduction Une courte introduction 2 Applications Retour sur les rails Split-plot Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesures répétées et structure de correlation (exemple rats)

20 Une courte introduction Modèle linéaire avec mesures non indépendantes modèle linéaire classique : Y N n (XΘ, σ 2 I) on relaxe l hypothèse d indépendance : Y N n (XΘ, Σ) σ 2 1 σ 12 σ 1n σ 21 σ2 2 σ 2n Σ = σ n1 σ n2 σn 2

21 Une courte introduction Modèle linéaire avec mesures non indépendantes modèle linéaire classique : Y N n (XΘ, σ 2 I) on relaxe l hypothèse d indépendance : Y N n (XΘ, Σ) σ 2 1 σ 12 σ 1n σ 21 σ2 2 σ 2n Σ = σ n1 σ n2 σn 2

22 Retour sur les rails Lignes directrices 1 Introduction Une longue introduction Une courte introduction 2 Applications Retour sur les rails Split-plot Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesures répétées et structure de correlation (exemple rats)

23 Retour sur les rails Modèle à effet aléatoire : quelques calculs Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 ) E[Y ij ] = µ E[Y ij A i ] = µ + A i V [Y ij ] = σ 2 a + σ 2 V [Y ij A i ] = σ 2 Cov[Y ij, Y ij ] = Cov[A i + E ij, A i + E ij ] = σ 2 a Cor[Y ij, Y ij ] = ρ = σ2 a σ 2 a+σ 2

24 Retour sur les rails Modèle à effet aléatoire : quelques calculs Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 ) E[Y ij ] = µ E[Y ij A i ] = µ + A i V [Y ij ] = σ 2 a + σ 2 V [Y ij A i ] = σ 2 Cov[Y ij, Y ij ] = Cov[A i + E ij, A i + E ij ] = σ 2 a Cor[Y ij, Y ij ] = ρ = σ2 a σ 2 a+σ 2

25 Retour sur les rails Modèle à effet aléatoire : quelques calculs Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 ) E[Y ij ] = µ E[Y ij A i ] = µ + A i V [Y ij ] = σ 2 a + σ 2 V [Y ij A i ] = σ 2 Cov[Y ij, Y ij ] = Cov[A i + E ij, A i + E ij ] = σ 2 a Cor[Y ij, Y ij ] = ρ = σ2 a σ 2 a+σ 2

26 Retour sur les rails Modèle à effet aléatoire : quelques calculs Y ij = µ + A i + E ij ; A i N (0, σ 2 a), E ij N (0, σ 2 ) E[Y ij ] = µ E[Y ij A i ] = µ + A i V [Y ij ] = σ 2 a + σ 2 V [Y ij A i ] = σ 2 Cov[Y ij, Y ij ] = Cov[A i + E ij, A i + E ij ] = σ 2 a Cor[Y ij, Y ij ] = ρ = σ2 a σ 2 a+σ 2 Y N n (µ1 n, Σ) avec, P 1 ρ ρ Σ = (σ 2 + σa) 2..., P = ρ 1 ρ P ρ ρ 1

27 Retour sur les rails Prédiction Pour l ANOVA classique,en prenant contraintes naturelles ( α i = 0) on a ˆα i = Y i Y Donc naturellement on aurait tendance à prendre  i = Y i Y mais... rappel ( ) (( ) ( )) A µa σ 2 Si N B 2, A σ AB µ B σ AB σb 2 alors, E(A B) = µ A + σ AB (B µ σb 2 B ) Y i N (µ, σ 2 a + σ2 J ) A i N (0, σ 2 a) donc E[A i Y i ] = On a donc Âi = σ2 a σa+σ 2 2 /J (Y i µ) ˆσ2 a ˆσ a+ˆσ 2 2 /J (Y i Y )

28 Retour sur les rails Prédiction Pour l ANOVA classique,en prenant contraintes naturelles ( α i = 0) on a ˆα i = Y i Y Donc naturellement on aurait tendance à prendre  i = Y i Y mais... rappel ( ) (( ) ( )) A µa σ 2 Si N B 2, A σ AB µ B σ AB σb 2 alors, E(A B) = µ A + σ AB (B µ σb 2 B ) Y i N (µ, σ 2 a + σ2 J ) A i N (0, σ 2 a) donc E[A i Y i ] = On a donc Âi = σ2 a σa+σ 2 2 /J (Y i µ) ˆσ2 a ˆσ a+ˆσ 2 2 /J (Y i Y )

29 Retour sur les rails Prédiction Pour l ANOVA classique,en prenant contraintes naturelles ( α i = 0) on a ˆα i = Y i Y Donc naturellement on aurait tendance à prendre  i = Y i Y mais... rappel ( ) (( ) ( )) A µa σ 2 Si N B 2, A σ AB µ B σ AB σb 2 alors, E(A B) = µ A + σ AB (B µ σb 2 B ) Y i N (µ, σ 2 a + σ2 J ) A i N (0, σ 2 a) donc E[A i Y i ] = On a donc Âi = σ2 a σa+σ 2 2 /J (Y i µ) ˆσ2 a ˆσ a+ˆσ 2 2 /J (Y i Y )

30 Retour sur les rails BLUP Best Linear Unbiased Predictor  i = ˆσ2 a ˆσ a+ˆσ 2 2 /J (Y i Y ) ˆσ a 2 ˆσ a+ˆσ 2 2 /J < 1 shrinkage > random.effects(model3) (Intercept)

31 Split-plot Lignes directrices 1 Introduction Une longue introduction Une courte introduction 2 Applications Retour sur les rails Split-plot Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesures répétées et structure de correlation (exemple rats)

32 Split-plot Essai en champs sur des variétés d avoine 6 blocks, 3 variétés d avoines et 4 concentrations d azote

33 Split-plot Une ANOVA classique Y ijk = µ + α i + β j + (αβ) ij + γ k + (αγ) ik + (βγ) jk + E ijk. E ijk N (0, σ 2 ) > model <- aov(yield~block + Variety + Block :Variety + nitro + Block :nitro + Variety :nitro, data=oats) > summary(model) Df Sum Sq Mean Sq F value Pr(>F) Block e-10 *** Variety ** nitro e-14 *** Block :Variety ** Block :nitro Variety :nitro Residuals probleme : les effets block et variétés sont divisé par SCR alors qu ils se manifestent au niveau de la parcelle

34 Split-plot Une ANOVA classique Y ijk = µ + α i + β j + (αβ) ij + γ k + (αγ) ik + (βγ) jk + E ijk. E ijk N (0, σ 2 ) > model <- aov(yield~block + Variety + Block :Variety + nitro + Block :nitro + Variety :nitro, data=oats) > summary(model) Df Sum Sq Mean Sq F value Pr(>F) Block e-10 *** Variety ** nitro e-14 *** Block :Variety ** Block :nitro Variety :nitro Residuals probleme : les effets block et variétés sont divisé par SCR alors qu ils se manifestent au niveau de la parcelle

35 Split-plot Une ANOVA classique Y ijk = µ + α i + β j + (αβ) ij + γ k + (αγ) ik + (βγ) jk + E ijk. E ijk N (0, σ 2 ) > model <- aov(yield~block + Variety + Block :Variety + nitro + Block :nitro + Variety :nitro, data=oats) > summary(model) Df Sum Sq Mean Sq F value Pr(>F) Block e-10 *** Variety ** nitro e-14 *** Block :Variety ** Block :nitro Variety :nitro Residuals probleme : les effets block et variétés sont divisé par SCR alors qu ils se manifestent au niveau de la parcelle

36 Split-plot Avec modèle mixte Y ijk = µ + A i + β j + F ij + γ k + (βγ) jk + E ijk A i N (0, σ1 2), F ij N (0, σ2 2), E ijk N (0, σ 2 ) en R dispositif équilibré : aov sinon : lme

37 Split-plot Avec modèle mixte Y ijk = µ + A i + β j + F ij + γ k + (βγ) jk + E ijk A i N (0, σ1 2), F ij N (0, σ2 2), E ijk N (0, σ 2 ) en R dispositif équilibré : aov sinon : lme

38 Split-plot Fonction aov Y ijk = µ + A i + β j + F ij + γ k + (βγ) jk + E ijk A i N (0, σ 2 1 ), F ij N (0, σ 2 2 ), E ijk N (0, σ 2 ) > model <- aov(yield~nitro*variety +Error(Block/Variety), data=oats) > summary(model) Error : Block Df Sum Sq Mean Sq F value Pr(>F) Residuals Error : Block :Variety Df Sum Sq Mean Sq F value Pr(>F) Variety Residuals Error : Within Df Sum Sq Mean Sq F value Pr(>F) nitro e-14 *** nitro :Variety Residuals

39 Split-plot Fonction lme (library(nlme)) Y ijk = µ + A i + β j + F ij + γ k + (βγ) jk + E ijk A i N (0, σ 2 1 ), F ij N (0, σ 2 2 ), E ijk N (0, σ 2 ) > model <- lme(yield~nitro*variety, data=oats, random=~1 Block/Variety) > anova(model) numdf dendf F-value p-value (Intercept) <.0001 nitro <.0001 Variety nitro :Variety On a bien les bons degrès de libertés

40 Facteurs emboîtés et comparaison de modèles (exemple chiens) Lignes directrices 1 Introduction Une longue introduction Une courte introduction 2 Applications Retour sur les rails Split-plot Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesures répétées et structure de correlation (exemple rats)

41 Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesure d un traceur au cours du temps dans les ganglions lymphatiques de 10 Chiens >xyplot(pixel~day Dog) #library(lattice) pixel chiens testé 2 ganglions lymphatiques (gauche et droit) testé par chien mesures de la concentration d un traceur aucours du temps day

42 Facteurs emboîtés et comparaison de modèles (exemple chiens) Le modèle : lme Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + C ij + E ijt > model <- lme(pixel~day +I(day^2), data=pixel, random=list(dog=~day, Side=~1)) > summary(model) Linear mixed-effects model fit by REML Random effects : Formula : ~day Dog Structure : General positive-definite, Log-Cholesky parametrization StdDev Corr (Intercept) (Intr) day Formula : ~1 Side %in% Dog (Intercept) Residual StdDev : Fixed effects : pixel ~ day + I(day^2) Value Std.Error DF t-value p-value (Intercept) day I(day^2)

43 Facteurs emboîtés et comparaison de modèles (exemple chiens) Le modèle : lme Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + C ij + E ijt > model <- lme(pixel~day +I(day^2), data=pixel, random=list(dog=~day, Side=~1)) > summary(model) Linear mixed-effects model fit by REML Random effects : Formula : ~day Dog Structure : General positive-definite, Log-Cholesky parametrization StdDev Corr (Intercept) (Intr) day Formula : ~1 Side %in% Dog (Intercept) Residual StdDev : Fixed effects : pixel ~ day + I(day^2) Value Std.Error DF t-value p-value (Intercept) day I(day^2)

44 Facteurs emboîtés et comparaison de modèles (exemple chiens) Remarque : Maximum de vraisemblance restreint Y N n (XΘ, Σ) ˆΘ maximum de vraisemblance mais il faut estimer Σ Le probleme de l estimateur du maximum de vraisemblance de Σ est qu il est biaisé à cause de l estimation de Θ. On s arrange pour ne pas estimer Θ dans un premier temps maximum de vraisemblance restreint (ReML) Conséquence ReML pour comparaison de modèles ne comparer des modèles par test de modèle emboîté ou AIC...que pour des modèles ayant les même effets fixes sinon utiliser le ML (method= ML )

45 Facteurs emboîtés et comparaison de modèles (exemple chiens) Remarque : Maximum de vraisemblance restreint Y N n (XΘ, Σ) ˆΘ maximum de vraisemblance mais il faut estimer Σ Le probleme de l estimateur du maximum de vraisemblance de Σ est qu il est biaisé à cause de l estimation de Θ. On s arrange pour ne pas estimer Θ dans un premier temps maximum de vraisemblance restreint (ReML) Conséquence ReML pour comparaison de modèles ne comparer des modèles par test de modèle emboîté ou AIC...que pour des modèles ayant les même effets fixes sinon utiliser le ML (method= ML )

46 Facteurs emboîtés et comparaison de modèles (exemple chiens) Remarque : Maximum de vraisemblance restreint Y N n (XΘ, Σ) ˆΘ maximum de vraisemblance mais il faut estimer Σ Le probleme de l estimateur du maximum de vraisemblance de Σ est qu il est biaisé à cause de l estimation de Θ. On s arrange pour ne pas estimer Θ dans un premier temps maximum de vraisemblance restreint (ReML) Conséquence ReML pour comparaison de modèles ne comparer des modèles par test de modèle emboîté ou AIC...que pour des modèles ayant les même effets fixes sinon utiliser le ML (method= ML )

47 Facteurs emboîtés et comparaison de modèles (exemple chiens) Test de modèles emboîtés modèle 1 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + C ij + E ijt On enlève au modèle 1 l effet aleatoire coté au sein de chaque chien modèle 2 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + E ijt On enlève au modèle 1 l effet aléatoire sur la pente par chien modèle 3 : Y ijt = µ + A i + β 1 d it + β 2 d 2 it + C ij + E ijt > model1 <- lme(pixel~day +I(day^2), data=pixel, random=list(dog=~day, Side=~1)) > model2 <- lme(pixel~day +I(day^2), data=pixel, random= ~day Dog) > model3 <- lme(pixel~day +I(day^2), data=pixel, random=~1 Dog/Side) > anova(model1,model2) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001 > anova(model1,model3) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001

48 Facteurs emboîtés et comparaison de modèles (exemple chiens) Test de modèles emboîtés modèle 1 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + C ij + E ijt On enlève au modèle 1 l effet aleatoire coté au sein de chaque chien modèle 2 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + E ijt On enlève au modèle 1 l effet aléatoire sur la pente par chien modèle 3 : Y ijt = µ + A i + β 1 d it + β 2 d 2 it + C ij + E ijt > model1 <- lme(pixel~day +I(day^2), data=pixel, random=list(dog=~day, Side=~1)) > model2 <- lme(pixel~day +I(day^2), data=pixel, random= ~day Dog) > model3 <- lme(pixel~day +I(day^2), data=pixel, random=~1 Dog/Side) > anova(model1,model2) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001 > anova(model1,model3) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001

49 Facteurs emboîtés et comparaison de modèles (exemple chiens) Test de modèles emboîtés modèle 1 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + C ij + E ijt On enlève au modèle 1 l effet aleatoire coté au sein de chaque chien modèle 2 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + E ijt On enlève au modèle 1 l effet aléatoire sur la pente par chien modèle 3 : Y ijt = µ + A i + β 1 d it + β 2 d 2 it + C ij + E ijt > model1 <- lme(pixel~day +I(day^2), data=pixel, random=list(dog=~day, Side=~1)) > model2 <- lme(pixel~day +I(day^2), data=pixel, random= ~day Dog) > model3 <- lme(pixel~day +I(day^2), data=pixel, random=~1 Dog/Side) > anova(model1,model2) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001 > anova(model1,model3) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001

50 Facteurs emboîtés et comparaison de modèles (exemple chiens) Test de modèles emboîtés modèle 1 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + C ij + E ijt On enlève au modèle 1 l effet aleatoire coté au sein de chaque chien modèle 2 : Y ijt = µ + A i + β 1 d it + B i d it + β 2 d 2 it + E ijt On enlève au modèle 1 l effet aléatoire sur la pente par chien modèle 3 : Y ijt = µ + A i + β 1 d it + β 2 d 2 it + C ij + E ijt > model1 <- lme(pixel~day +I(day^2), data=pixel, random=list(dog=~day, Side=~1)) > model2 <- lme(pixel~day +I(day^2), data=pixel, random= ~day Dog) > model3 <- lme(pixel~day +I(day^2), data=pixel, random=~1 Dog/Side) > anova(model1,model2) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001 > anova(model1,model3) Model df AIC BIC loglik Test L.Ratio p-value model model vs <.0001

51 Facteurs emboîtés et comparaison de modèles (exemple chiens) Fit (modèle 1) >plot(augpred(model1)) /L 7/L 8/L 9/L 10/L /L 2/L 3/L 4/L 5/L Pixel intensity /R 7/R 8/R 9/R 10/R /R 2/R 3/R 4/R 5/R Time post injection (days)

52 Mesures répétées et structure de correlation (exemple rats) Lignes directrices 1 Introduction Une longue introduction Une courte introduction 2 Applications Retour sur les rails Split-plot Facteurs emboîtés et comparaison de modèles (exemple chiens) Mesures répétées et structure de correlation (exemple rats)

53 Mesures répétées et structure de correlation (exemple rats) Prise de poids de rats en fonction du régime alimentaire >results <- groupeddata(poids~temps rat,outer=~regime,data) >plot(results,outer=true) fort moyen poids atemoin faible rats testé 5 rat par traitement (4 traitement) 10 mesures, 1 par semaine sur chaque rat temps

54 Mesures répétées et structure de correlation (exemple rats) Le modèle : lme Y ijt = µ + α i + B ij + γ t + (αγ) ik + E ijt B ij N (0, σ 2 B ), E ijt N (0, σ 2 ) > model3 <- lme(poids~regime*as.factor(temps),data=results, random=~1 rat) > summary(model3) Linear mixed-effects model fit by REML Random effects : Formula : ~1 rat (Intercept) Residual StdDev : > anova(model3) numdf dendf F-value p-value (Intercept) <.0001 regime as.factor(temps) <.0001 regime :as.factor(temps)

55 Mesures répétées et structure de correlation (exemple rats) Correlations... P Σ = (σ 2 + σb 2)..., un block P (10*10) (10 temps) P par rat. 1 ρ ρ. P = ρ ρ ρ ρ 1 Toutes les mesures prises sur le même rat sont également corrélées Cor[Y ijt, Y ijt ] = ρ = σ2 B σ 2 B +σ2 On peut améliorer avec par exemple : Cor[Y ijt, Y ijt ] = ρ t t

56 Mesures répétées et structure de correlation (exemple rats) Structure de correlation et lme Cor[Y ijt, Y ijt ] = ρ t t > model4 <- lme(poids~regime*as.factor(temps),data=results, random=~1 rat, correlation=corar1()) Random effects : Formula : ~1 rat (Intercept) Residual StdDev : Correlation Structure : AR(1) Formula : ~1 rat Parameter estimate(s) : Phi comparaison de modèles > AIC(model3,model4) df AIC model model

57 Références Mixed-Effects Models in S ans S-PLUS ; José C. Pinheiro, Douglas M. Bates Modern Applied Statistics with S Fourth edition ; W. N. Venables and B. D. Ripley Statistical Methods for the Analysis of Repeated Measurements ; Charles S. Davis Ecological Models and data in R ; Benjamin M. Bolker The R book Michael J. Crawley Models for Ecological Data ; James S. Clark Statistique inférentielle Idée, démarche, exemples ; Jean-Jacques Daudin, Stéphane Robin, Colette Vuillet

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Étude des flux d individus et des modalités de recrutement chez Formica rufa

Étude des flux d individus et des modalités de recrutement chez Formica rufa Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas Fiche TD avec le logiciel : tdr335 Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas F. Menu, A.B. Dufour, E. Desouhant et I. Amat La fiche permet de se familiariser

Plus en détail

Exemples d Analyses de Variance avec R

Exemples d Analyses de Variance avec R Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)

Plus en détail

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. 1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels

Plus en détail

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R

INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R Y. BROSTAUX (1) RÉSUMÉ Cette note constitue une introduction au langage et à l'environnement de programmation 5 dans sa version 1.4.1 pour

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

4. Résultats et discussion

4. Résultats et discussion 17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

La méthode de régression par discontinuité et l évaluation des politiques de l emploi

La méthode de régression par discontinuité et l évaluation des politiques de l emploi La méthode de régression par discontinuité et l évaluation des politiques de l emploi Thomas Lemieux University of British Columbia Le 24 novembre 2009 Plan de la présentation La méthode de régression

Plus en détail

Modèles Estimés sur Données de Panel

Modèles Estimés sur Données de Panel Modèles Estimés sur Données de Panel Introduction Il est fréquent en économétrie qu on ait à composer avec des données à deux dimensions : - une dimension chronologique - une dimension spatiale Par exemple,

Plus en détail

INTRODUCTION AU LOGICIEL R

INTRODUCTION AU LOGICIEL R INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver

Plus en détail

C algèbre d un certain groupe de Lie nilpotent.

C algèbre d un certain groupe de Lie nilpotent. Université Paul Verlaine - METZ LMAM 6 décembre 2011 1 2 3 4 Les transformations de Fourier. Le C algèbre de G/ Z. Le C algèbre du sous-groupe G 5 / vect{u,v }. Conclusion. G un groupe de Lie, Ĝ l ensemble

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

BIG Data et R: opportunités et perspectives

BIG Data et R: opportunités et perspectives BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,

Plus en détail

Notes de cours Statistique avec le logiciel R

Notes de cours Statistique avec le logiciel R Notes de cours Statistique avec le logiciel R Shuyan LIU Shuyan.Liu@univ-paris1.fr http ://samm.univ-paris1.fr/shuyan-liu-enseignement Année 2013-2014 Chapitre 1 Introduction L objectif de ce cours est

Plus en détail

Imputation du salaire d ego dans TeO

Imputation du salaire d ego dans TeO Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont

Plus en détail

Statistique de l assurance

Statistique de l assurance Statistique de l assurance Arthur Charpentier To cite this version: Arthur Charpentier. Statistique de l assurance. 3ème cycle. Université de Rennes 1 et Université de Montréal, 2010, pp.133.

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

Modèle GARCH Application à la prévision de la volatilité

Modèle GARCH Application à la prévision de la volatilité Modèle GARCH Application à la prévision de la volatilité Olivier Roustant Ecole des Mines de St-Etienne 3A - Finance Quantitative Décembre 2007 1 Objectifs Améliorer la modélisation de Black et Scholes

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

Chapitre 4 : Régression linéaire

Chapitre 4 : Régression linéaire Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est

Plus en détail

Master 2: Econométrie 2

Master 2: Econométrie 2 Master 2: Econométrie 2 Partie 1 Michel BEINE michel.beine@uni.lu Université du Luxembourg Master 2: Econométrie 2 p. 1/22 Manuel La partie économétrique du cours est basé sur le livre Introductory Econometrics,

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

Statistiques descriptives

Statistiques descriptives Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Modèles bi-dimensionnels de coques linéairement élastiques: Estimations de l écart entre leurs solutions.

Modèles bi-dimensionnels de coques linéairement élastiques: Estimations de l écart entre leurs solutions. Problèmes mathématiques de la mécanique/mathematical problems in Mechanics Modèles bi-dimensionnels de coques linéairement élastiques: Estimations de l écart entre leurs solutions. Cristinel Mardare Laboratoire

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Régression logistique. Benoit Crabbé

Régression logistique. Benoit Crabbé Plan 1 Modèles linéaires généralisés 2 multinomiale 3 Modèles à effets aléatoires 4 Predicting the dative alternation Modèle A (les variables corrélées) Modèle A (variabilité des sujets) Modèle B (variabilité

Plus en détail

Projet de thèse. Intitulé de la thèse. Spécialité du doctorat. Problématique scientifique générale

Projet de thèse. Intitulé de la thèse. Spécialité du doctorat. Problématique scientifique générale Projet de thèse Intitulé de la thèse Détection automatisée de signaux en pharmacovigilance : Exploitation conjointe de données de notifications spontanées et médico- administratives. Spécialité du doctorat

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

TP de Statistiques: Utilisation du logiciel R

TP de Statistiques: Utilisation du logiciel R TP de Statistiques: Utilisation du logiciel R Année 2006-2007 2 Table des matières Introduction i 1 Premiers pas avec R 1 1.1 R est une calculatrice............................................. 1 1.2 R

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains. Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Examen de Logiciels Statistiques

Examen de Logiciels Statistiques G. Hunault Angers, mai 2011 Licence MEF Examen de Logiciels Statistiques On s intéresse ici au dossier EAEF01 qui contient un extrait des données du recensement américain. On trouvera ces données et leur

Plus en détail

Data mining II. Modélisation Statistique & Apprentissage

Data mining II. Modélisation Statistique & Apprentissage Publications du Laboratoire de Statistique et Probabilités Data mining II. Modélisation Statistique & Apprentissage Philippe BESSE Version janvier 2003 mises à jour : www.lsp.ups-tlse.fr/besse Laboratoire

Plus en détail

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercice : la frontière des portefeuilles optimaux sans actif certain Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué

Plus en détail

Econométrie et applications

Econométrie et applications Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet (nicolas.jacquemet@univ-paris1.fr) Université Paris 1 & Ecole d Economie de Paris

Plus en détail

Modélisation géostatistique des débits le long des cours d eau.

Modélisation géostatistique des débits le long des cours d eau. Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des

Plus en détail

L Econométrie des Données de Panel

L Econométrie des Données de Panel Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire

Plus en détail

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061 Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Evaluation des modèles non-linéaires à effets mixtes

Evaluation des modèles non-linéaires à effets mixtes Evaluation des effets mixtes INSERM UMR738 GDR Statistiques et Santé, 20 octobre 2009 Pharmacométrie Définition modélisation des données obtenues lors d essais cliniques sur des médicaments développement

Plus en détail

1 Recherche en table par balayage

1 Recherche en table par balayage 1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément

Plus en détail

Révision des équations hédoniques relatives aux prix des ordinateurs

Révision des équations hédoniques relatives aux prix des ordinateurs Révision des équations hédoniques relatives aux prix des ordinateurs Fred Barzyk Division des prix Statistique Canada Immeuble Jean-Talon, 13-C2, Ottawa K1A 0T6 Télécopieur : (613) 951-2848 Téléphone :

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Statistique Bayésienne

Statistique Bayésienne Statistique Bayésienne Éléments de Culture Générale Lionel RIOU FRANÇA INSERM U669 Mai 2009 Lionel RIOU FRANÇA (INSERM U669) Statistique Bayésienne Mai 2009 1 / 139 Sommaire Sommaire 1 Approche Bayésienne

Plus en détail

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette

Plus en détail

Le signal GPS. Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz

Le signal GPS. Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz Le signal GPS Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz Deux signaux en sont dérivés: L1 (fo x 154) = 1.57542 GHz, longueur d onde = 19.0 cm

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria-00386678 https://hal.inria.fr/inria-00386678

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria-00386678 https://hal.inria.fr/inria-00386678 Sélection prédictive d un modèle génératif par le critère AICp Vincent Vandewalle To cite this version: Vincent Vandewalle. Sélection prédictive d un modèle génératif par le critère AICp. 41èmes Journées

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

(Customer Relationship Management, «Gestion de la Relation Client»)

(Customer Relationship Management, «Gestion de la Relation Client») (Customer Relationship Management, «Gestion de la Relation Client») Les Banques et sociétés d assurance sont aujourd'hui confrontées à une concurrence de plus en plus vive et leur stratégie " clientèle

Plus en détail

Apprentissage non paramétrique en régression

Apprentissage non paramétrique en régression 1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE MICHÈLE PICARD FLIBOTTE EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE Essai-stage présenté à la Faculté des études supérieures de l Université Laval dans le cadre

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail