Analyse des données longitudinales

Dimension: px
Commencer à balayer dès la page:

Download "Analyse des données longitudinales"

Transcription

1 Analyse des données longitudinales EA Sauleau SémStat 03/10/2006 Table des matières 1 Introduction Généralités La structure des données Exemple Des impasses (M)ANOVA Quelques rappels ANOVA-R MANOVA Nouvelle formulation de l ANOVA Modèle linéaire Spécification Estimation Les matrices de covariance Les cas particuliers L analyse des profils dans les groupes parallèles Paramétrisation des tendances temporelles dans les groupes parallèles 14 4 LMM Introduction Spécifications du modèle Les cas particuliers Exemple Orthodont data. 19 1

2 6 GL(M)M Modèles marginaux GLMM Modèles de transition Lequel choisir? Conclusion 24 1 Introduction 1.1 Généralités Définitions Données longitudinales Etudes dans lesquelles les sujets sont mesurés plusieurs fois au cours du temps Terme plus ancien : mesures répétées Intérêts Vision des changements Même(s) variable(s) répétée(s) plusieurs fois dans des conditions identiques Corrélation (positive) entre les mesures Certains types de corrélation Caractéristiques La variable résultats peut être continue, binaire, compte Les données peuvent être incomplètes Deux grands types Design parallèle Chaque sujet appartient à un groupe défini par un traitement ou une exposition L objectif est de comparer les réponses entre les groupes Design en crossover Chaque sujet subit plusieurs traitements ou exposition L objectif est de comparer les réponses d un même sujet sous différentes conditions 2

3 1.2 La structure des données Cas général y ij = mesure du sujet i au temps j Temps 1 2 p Sujets 1 y 11 y 12 y 1p 2 y 21 y 22 y 2p n y n1 y n2 y np Cas particuliers Deux groupes parallèles Temps 1 2 p Groupe Sujets 1 1 y 11 y 12 y 1p m y m1 y m2 y mp 2 m + 1 y m+1,1 y m+1,2 y m+1,p n y n1 y n2 y np Crossover Traitement Placebo 1 2 Sujets 1 y 11 y 12 y 13 2 y 21 y 22 y 23 n y n1 y n2 y n3 Crossover : traitements A et B 3

4 Temps 1.. q q p Groupe Sujets AB 1 y 11(A).. y 1q(A) y 1,q+1,(B).. y 1p(B).. m y m1(a).. y mq(a) y m,q+1,(b).. y mp(b) BA m + 1 y m+1,1(b).. y m+1,q(b) y m+1,q+1,(a).. y m+1,p(a).. n y n,1(b).. y n,q(b) y n,q+1,(a).. y n,p(a) 1.3 Exemple Un exemple très simple Orthodont data (package nlme de R) 27 enfants (16 garçons, 11 filles) dont on mesure tous les deux ans entre 8 et 14 ans la distance (en millimètre, sur un cliché radio) entre l hypophyse et la fente pterygomaxillaire cf. figure (1) Age Sujets Sexe 1 M 26,0 25,0 29,0 31,0 2 M 21,5 22,5 23,0 26,5 27 F 24,5 25,0 28,0 28,0 1.4 Des impasses Je passe sous silence Analyses non longitudinales : Approches descriptives Recherche de points de rupture De nombreux modèles L inférence bayésienne (si, c est possible) Les données manquantes 2 Approche ANOVA et données répétées 2.1 Quelques rappels ANOVA simple a un facteur 4

5 (a) Data (b) Régressions Fig. 1 Orthodont dataset Notation p groupes (mesures) n sujets par groupe (sujets) N = p k=1 n (total des mesures) Mesure du sujet i dans le groupe j : y ij Somme des mesures dans le groupe j : T (g)j = n Facteur de correction : F C = (P n i=1 P p j=1 yij)2 N i=1 y ij Somme des carrés des mesures : SY 2 = n i=1 p j=1 y2 ij Table d ANOVA Source Somme P carrés ddl Test p j=1 Facteur T 2 (g)j n P F C p 1 p Résiduelle SY 2 j=1 T 2 (g)j n N p Totale SY 2 F C N ANOVA pour données répétées ANOVA adaptée aux données répétées Principe Deux sources de variabilité dans l ANOVA simple : facteur et résiduelle Dans l ANOVA pour données répétées, on isole de la résiduelle une source inter-sujet 5

6 Notation additionnelle Somme des mesures pour le sujet i : T (s)i = p j=1 y ij Table d ANOVA-R Source Somme carrés ddl Test P p j=1 Facteur SC F = T 2 j P n F C p 1 n i=1 Inter-sujet SC S = T 2 (s)i p F C n 1 Résiduelle SC R = SC T SC F SC S (p 1)(n 1) Totale SC T = SY 2 F C N 1 Conditions d application de l ANOVA-R Deux conditions Sphéricité Egalité des variances des mesures entre les temps Egalité des covariances des mesures entre les différents temps Statistique ɛ de Greenhouse-Geisser (test à 1) En cas de violation 1. Adapter les ddl de l ANOVA-R (F de Greenhouse-Geisser, très conservatif) 2. Utiliser une MANOVA Normalité des mesures Test non paramétrique de Friedman pour échantillon indépendant si condition violée 12 Np(p+1) 2.3 MANOVA Principe p j=1 ( n i=1 r ij) 2 3N(p + 1) χ 2 p 1 ddl y ij = mesure du sujet i au temps j Temps 1 2 p Sujets 1 y 11 y 12 y 1p 2 y 21 y 22 y 2p n y n1 y n2 y np 6

7 Le modèle Y i = (y i1 y i2 y ip ) Y i = µ + ɛ i, Y N µ 1 µ 2 µ p, Σ Tests Test de µ j µ p à 0 : T 2 de Hotelling Test de changement au cours du temps : Λ de Wilks, trace de Pillai, trace de Hotelling 2.4 Nouvelle formulation de l ANOVA Limites de l approche ANOVA-R / MANOVA Différents soucis Problème de représentation du temps Problème d extension à des designs plus complexes Régression multiple avec des variables indicatrices ANOVA simple a un facteur Variable indicatrice x ijk, valant 1 si la mesure j du sujet i est au niveau (temps) k et 0 sinon Temps de référence : p y ij = β 0 + p 1 µ 1 = β 0 + β 1 µ 2 = β 0 + β 2 µ p = β 0 Orthodont data Présentation initiale k=1 β kx ijk Age Sujets Sexe 1 M 26,0 25,0 29,0 31,0 2 M 21,5 22,5 23,0 26,5 27 F 24,5 25,0 28,0 28,0 Réorganisation 7

8 Sujet Temps y x.1 x.2 x , , , , , , , , Cas général ANOVA simple a un facteur On ordonne les n p mesures en un vecteur Y y i = β 0 + p 1 j=1 β jx ij + ɛ i x ij vaut 1 si l observation i a été recueillie au temps j et 0 sinon Pas de prise en compte de la corrélation entre les mesures et donc nécessité de modifier le modèle Orthodont data Covariance entre les mesures Age ,017 2,292 3,629 1, ,292 4,563 2,194 2, ,629 2,194 7,032 3, ,613 2,810 3,241 4,349 Corrélation entre les mesures Age ,4374 0,5579 0, , ,3873 0, ,5579 0, , ,3152 0,6309 0,

9 3 Approche par modèle linéaire 3.1 Spécification Modèle linéaire multiple Spécification plus élaborée Corrélation entre les mesures d un sujet y ij = β 0 + β 1 x ij1 + + β p 1 x ij,p 1 + ɛ ij = X ij β + ɛ ij Cov(ɛ ij, ɛ ij ) 0 Hypothèses Les observations de sujets différents sont indépendantes Les observations d un même sujet ne sont pas indépendantes Les vecteurs Y i = (y i1,, y ip ) ont une distribution normale multivariée de moyennes µ i = X i β et de variance-covariance Σ Les éléments de Σ sont σ jj 3.2 Estimation Les moindres carrés généralisés Cas régressif simple Y = Xβ ˆβ = (X X) 1 X Y Données corrélées Moindres carrés généralisés : ˆβ = (X Σ 1 X) 1 X Σ 1 Y et Cov(ˆβ) = (X Σ 1 X) 1 Mais la matrice Σ est inconnue. On la remplace alors par son estimateur (maximum de vraisemblance par algorithmes numériques) Propriétés des estimateurs GLS Ca c est bien Si on connaît Σ, ˆβ est sans biais : E(ˆβ) = β Si Σ = σ 2 I, les GLS sont les OLS On peut construire des tests de Wald sur des contrastes sur des éléments de β Des tests de rapport des vraisemblances (LRT) permettent de comparer des modèles emboîtés Ca c est moins bien L estimateur ML ˆΣ est biaisé pour les petits échantillons 9

10 Estimateurs du maximum de la vraisemblance restreinte Idée générale des REML Eliminer β de la vraisemblance de telle manière qu elle ne dépende que de Σ Estimer β par OLS puis ne travailler qu avec les résidus A noter : avec la technique REML On peut comparer différents modèles de covariances (cf. plus loin) On ne peut pas comparer différents modèles de régression (terme de pénalité) La technique REML plus spécifiquement L estimateur GLS de β maximisait : n 2 log ( Σ ) 1 2 (Y Xβ) Σ 1 (Y Xβ) L estimateur REML de Σ maximise : n 2 log ( Σ ) 1 2 (Y X ˆβ OLS ) Σ 1 (Y X ˆβ OLS ) 1 2 log ( X Σ 1 X ) 1. Y X ˆβ OLS sont les résidus de la régression OLS log ( X Σ 1 X ) est un terme de pénalité L estimateur GLS de β devient : ˆβ = (X ˆΣ 1 REMLX) 1 X ˆΣ 1 REMLY 3.3 Les matrices de covariance La corrélation des mesures Rappel cor(x, Y ) = cov(x,y ) σ X σ Y Les covariances homogènes les plus courantes Compound symmetry : cor(ɛ ij, ɛ ij ) = ρ Générale : cor(ɛ ij, ɛ ij ) = ρ jj ARMA(p,q) Le plus souvent AR(1) cor(ɛ ij, ɛ ij ) = ρ j j La corrélation décroît avec le temps 1, ρ, ρ 2, Bien pour les mesures également espacées, dans le cas contraire : cor(ɛ ij, ɛ ij ) = ρ tj t j 10

11 Sélection des modèles de covariance Deux méthodes Modèles emboîtés : test du rapport des vraisemblances Modèles emboîtés ou non : critères d information (AIC, BIC) Problème avec le LRT Test d hypothèse en limite du domaine des valeurs des paramètres (variance à zero) Conditions d application des LRT peuvent ne pas être remplies Le LRT est alors plutôt un mélange de Chi2 Emboîtement des modèles de covariance Quelques relations simples Compound symmetry et AR(1) emboîtées dans générale Compound symmetry et AR(1) non emboîtées Indépendance emboîtée dans compound symmetry et dans AR(1) 3.4 Les cas particuliers Le crossover à deux traitements Le design Un traitement A et un placebo P Chaque sujet reçoit aléatoirement A puis P ou P puis A Le modèle Les variables Mesure du sujet i au temps j : y ij Temps correspondant à y ij : t ij Traitement correspondant à y ij : T ij Modèle sans carry-over 1 : y ij = β 0 + β 1 t ij + β 2 T ij + ɛ ij Le carry-over Traitement donné à la période précédente : C ij = 1 Modèle avec carry-over : y ij = β 0 + β 1 t ij + β 2 T ij + β 3 C ij + ɛ ij Les groupes parallèles Le design Des groupes de sujets sont définis au préalable et chaque sujet sont mesurés plusieurs fois Caractéristiques des groupes 1. Observation : âge, sexe, baseline de la quantité mesurée, 2. Randomisation : traitements 1 Persistance de l effet d un traitement sur la période suivante 11

12 L analyse Le but est de caractériser des formes de changement et de vérifier s ils diffèrent entre les groupes Deux techniques 1. Analyse des profils 2. Paramétrisation des courbes de tendance temporelle 3.5 L analyse des profils dans les groupes parallèles Au moins trois hypothèses possibles Hypothèse 1 Absence d interaction groupe-temps Figures (2a) vs (2d) Hypothèse 2 Absence d effet groupe Figure (2a) vs (2b) Hypothèse 3 Absence d effet temps Figure (2c) vs (2a) Le modèle Le modèle linéaire y i = X i β + ɛ i y i n 1 Mesures du sujet i X i n p Design matrice pour les effets β p 1 Paramètres pour les effets ɛ i n 1 Résidus ɛ i N ( 0, σ 2 I n ) Les notations dans les matrices indicatrices X Mesure de i prise au temps j : X (1) ij = 1 Mesure de i au temps j dans le groupe 1 : X (2) ij = 1 Interaction : X (3) ij = X (1) ij X(2) ij Le nouveau modèle linéaire (2 groupes) p 1 y ij = β 0 + β k X (1) ik + β p 1 px (2) i + β p+k X (2) i X (1) ik + ɛ ij k=1 k=1 12

13 (a) Pas d effet groupe (b) Effet groupe (c) Pas d effet groupe ni temps (d) Interaction Fig. 2 Profils dans deux groupes Un exemple Le design Deux traitements (A et B) et trois mesures à t 1, t 2 et t 3 Les variables indicatrices 1. X (1).1 = 1 si mesure à t 1 et X (1).2 = 1 si t 2 2. X. (2) = 1 quand le sujet est dans le groupe du traitement A 3. X (3).1 = X(1).1 X(2). et X (3).2 = X(1).2 X(2). Le modèle est E(y ij ) = β 0 + β 1 X (1) i1 + β 2X (1) i2 + β 3X (2) i + β 4 X (1) i1 X(2) i + β 5 X (1) i2 X(2) i Les moyennes Traitement t 1 t 2 t 3 A β 0 + β 1 + β 3 + β 4 β 0 + β 2 + β 3 + β 5 β 0 + β 3 B β 0 + β 1 β 0 + β 2 β 0 13

14 3.6 Paramétrisation des tendances temporelles dans les groupes parallèles Trois types de tendance Tendance linéaire Changement des mesures linéaires avec le temps E(y ij ) = β 0 + β 1 t j + β 2 T i + β 3 t j T i 1. Temps à la mesure j : t j 2. Traitement du sujet i : T i Un modèle linéaire avec interaction 1. Groupe 0 : E(y ij ) = β 0 + β 1 t j 2. Groupe 1 : E(y ij ) = (β 0 + β 2 ) + (β 1 + β 3 )t j Tendance quadratique E(y ij ) = β 0 + β 1 t j + β 2 t 2 j + β 3T i + β 4 t j T i + β 5 t 2 j T i 1. Groupe 0 : E(y ij ) = β 0 + β 1 t j + β 2 t 2 j 2. Groupe 1 : E(y ij ) = (β 0 + β 3 ) + (β 1 + β 4 )t j + (β 2 + β 5 )t 2 j Segments de droites Segments de droites entre des noeuds Noeuds fixés a priori aux points de rupture de pente Exemple de deux segments de droite Hypothèse Un segment avant un temps t donné et un segment après t Le modèle Avant t, tendance linéaire β 0 + β 1 t j + β 2 T i + β 3 t j T i t j t E(y ij ) = (β 0 + β 1 t ) + β 2 T i + β 3 t T i +β 4 (t j t ) + β 4 (t j t )T i t j > t { β0 + β 1. Groupe 0 : E(y ij ) = 1 t j t j t (β 0 + β 1 t ) + β 4 (t j t ) t j > t { (β0 + β 2. Groupe 1 : E(y ij ) = 2 ) + (β 1 + β 3 )t j t j t (β 0 + β 2 ) + (β 1 + β 3 )t + (β 4 + β 5 )(t j t ) t j > t 14

15 Pros and Cons de la paramétrisation des tendances Petit nombre de paramètre pour les effets traitement et temps t j repère le temps (et non un numéro de mesure ou une variable indicatrice) et donc chaque sujet peut avoir un nombre de mesures différents et des mesures à des temps différents Extension à des formes cubiques ou d autres formes aisée La modélisation des tendances peut ne pas coller aux données Ces modèles sont inclus dans les modèles saturés utilisés dans l analyse des profils et donc peuvent être jugés par LRT 4 Approche par modèle linéaire mixte 4.1 Introduction Idée phare On suppose que chaque sujet a un certain niveau de réponse sous-jacent qui persiste On distingue désormais deux sources de variations aléatoires 1. Entre les sujets : b 2. Variations des mesures par sujet : w Si on suppose que var(b i ) = σ 2 b et var(w i) = σ 2 w, on retrouve la matrice covariance compound symmetry Intérêt des modèles mixtes Avantages sur la MANOVA pour données répétées Modélisation explicite du changement individuel au cours du temps Nombre de mesures différent par sujet Temps de mesures différents par sujet Temps continu Spécification flexible de la structure de covariance, notamment comme fonction continue du temps Domaine des modèles multi-niveaux (individus en clusters) Covariables dépendantes ou non du temps Données manquantes Extension généralisée 4.2 Spécifications du modèle Modèle à deux niveaux Le modèle linéaire y i = X i β + ɛ i 15

16 y i n 1 Mesures du sujet i X i n p Design matrice pour les effets β p 1 Paramètres pour les effets ɛ i n 1 Résidus ɛ i N ( 0, σ 2 I n ) Les notations y i = X i β + Z i b i + w i y i n i 1 Mesures du sujet i X i n i p Design matrice pour les effets fixes β p 1 Paramètres pour les effets fixes Z i n i r Design matrice pour les effets aléatoires b i r 1 Paramètres pour les effets aléatoires w i n i 1 Résidus w i N (0, R i ) et b i N (0, Σ b ) Le modèle le plus simple Modèle d ordonnée à l origine aléatoire y ij = (β 0 + b i ) + β 1 t ij + w ij var(b i ) = σ 2 b var(w ij ) = σ 2 w Matrice de covariance de la forme compound symmetry La matrice de covariance compound symmetry σb 2 + σ2 w σb 2 σb 2 σb 2 σb 2 + σ2 w σb 2 σb 2 σb 2 σb 2 + σ2 w LE modèle mixte Peut être le plus courant Modèle à ordonnée à l origine et pente aléatoires Modèle à temps continu y ij = (β 0 + b i0 ) + (β 1 + b i1 )t ij + w ij var(w ij ( ) = σw 2 et donc ) R i = σwi 2 pi g11 g Σ b = 12 g 12 g 11 cov(y ij, y ij ) = g 11 + (t ij + t ij )g 12 + g 22 t ij t ij, donc fonction du temps var(y i ) = var(z i b i )+var(w i ) = Z i Σ b Z i +R i, ici g 11 +2t ij g 12 +g 22 t 2 ij + σw 2 16

17 La covariance des mesures R i = var(w i ) est la covariance des mesures du sujet i Hypothèse R i = σ 2 wi pi d indépendance conditionnelle Hypothèse alternative de structure autre des R i : ARMA(p,q), générale, Toeplitz,, structures non homogènes 4.3 Les cas particuliers Modèles pour deux groupes parallèles Le problème Deux groupes : placebo (G=0) et traitement (G=1) Trois modèles 1. Ordonnée par groupe 2. Ordonnée et pente par groupe 3. Inflation de variance Trois modèles de complexité croissante Le modèle 1 : figure (3a) y ij = β 0 + β 1 t + β 2 G + b 0i + w ij G = 0 G = 1 y = β 0 + β 1 t + b 0i y = (β 0 + β 2 ) + β 1 t + b 0i Le modèle 2 : figure (3b) y ij = β 0 + β 1 t + β 2 G + b 0i + w ij +β 3 tg G = 0 G = 1 y = β 0 + β 1 t + b 0i y = (β 0 + β 2 ) + (β 1 + β 3 )t + b 0i Le modèle 3 : figure (3c) 17

18 (a) Modèle 1 (b) Modèle 2 (c) Modèle 3 Fig. 3 LMM pour deux groupes y ij = β 0 + β 1 t + β 2 G + b 0i + w ij +β 3 tg + b 1i t G = 0 G = 1 y = β 0 + β 1 t + (b 0i + b 1i t) y = (β 0 + β 2 ) + (β 1 + β 3 )t + (b 0i + b 1i t) Le crossover à deux traitements Le modèle fixe Sans carry-over y ij = β 0 + β 1 t ij + β 2 T ij + ɛ ij Avec carry-over y ij = β 0 + β 1 t ij + β 2 T ij + β 3 C ij + ɛ ij Traitement au moment de la mesure y ij : T ij Variable indicatrice du carry-over : C ij = 1 si le traitement avec persistance est donné à la période avant j 18

19 Le modèle mixte sans carry-over à compound symmetry y ij = β 0 + β 1 t ij + β 2 T ij + b i + w ij var(b i ) = σ 2 b et var(w i) = σ 2 w var(y ij ) = σ 2 b + σ2 w et cov(y ij, y ij ) = σ 2 b 5 Exemple 5.1 Orthodont data Un premier LMM pour les filles Modèle à ordonnée aléatoire et pente commune 1 8 ( ) 1 y i = 1 10 β β 1 1 b i + w i var(w i ) = σw 2 et var(b i ) = σb 2 Résultats partie fixe ˆσ w = 0, 78 Valeur Ecart-type ddl Valeur t p ˆβ 0 17,4 0, ,23 0 ˆβ 1 0,48 0, ,12 0 Régression linéaire simple : mêmes estimations ponctuelles de β 0 et β 1 mais écarts-type de 1,7 et 0,15 Résultats partie aléatoire ˆσ b = 2, 07 ˆb i permettent de calculer l ordonnée pour chaque sujet β 0 + b i Sujet β 0 β 0 + b i β 1 F10 17,4 13,4 0,48 F11 17,4 21,0 0,48 Un second LMM pour les filles Modèle à ordonnée et pente aléatoires 1 8 ( ) 1 8 y i = 1 10 β β var(w i ) = σw 2 et var(b i ) = Σ b Résultats partie fixe ˆσ w = 0, 67 (0,78 pour LMM1) ( bi0 b i1 ) + w i 19

20 Fig. 4 Orthodont dataset : LMM Valeur Ecart-type ddl Valeur t p ˆβ 0 17,4 0, ,84 0 ˆβ 1 0,48 0, ,24 0 Mêmes estimations ponctuelles de β 0 et β 1 que LMM1 Résultats partie aléatoire ˆσ b0 = 1, 88 et ˆσ b1 = 0, 16 Ordonnée à l origine pour chaque sujet : β 0 + b i0 Pente pour chaque sujet : β 1 + b i1 Sujet β 0 β 0 + b i0 β 1 β 1 + b i1 F10 17,4 14,5 0,48 0,38 F11 17,4 19,1 0,48 0,65 Comparaison des LMM pour les filles Avec le MLE et non le REML Modèle ddl AIC BIC LogVrais. LRT p-value LMM1.F 4 149,2 156,2-70,7 LMM2.F 6 149,4 159,9-68,7 3,79 0,150 Par parcimonie, on préfère le modèle avec pente commune et ordonnée à l origine aléatoire 20

21 Comparaison des LMM pour les garçons Comparaison des deux mêmes LMM Modèle ddl AIC BIC LogVrais. LRT p-value LMM1.G 4 281,5 290,0-136,7 LMM2.G 6 285,1 297,9-136,6 0,31 0,586 Par parcimonie, on préfère, comme pour les filles, le modèle avec pente commune et ordonnée à l origine aléatoire (ouf!) Une série de troisièmes LMM Modèle à ordonnée, pente aléatoires et effet sexe Modèle 31 : y ij = β 0 + β 1 t + β 2 sexe + b 0i + ɛ ij Modèle 32 : modèle 31 +β 3 t sexe Modèle 33 : modèle 32 +b 1i t Modèle 0 : y ij = β 0 + β 1 t + b 0i + ɛ ij Comparaison des modèles (MLE) Modèle ddl AIC BIC LogVrais. LRT p-value LMM ,4 462,1-221,7 LMM ,9 458,3-217, LMM ,6 456,7-214, LMM ,8 465,3-213, Le troisième LMM Le modèle y ij = β 0 + β 1 t + β 2 sexe + β 3 t sexe + b 0i + w ij sexe = 0 (filles) : y = (β 0 + b 0i ) + β 1 t sexe = 1 (garçons) : y = (β 0 + β 2 + b 0i ) + (β 1 + β 3 )t Résultats partie fixe Valeur Ecart-type ddl Valeur t p ˆβ 0 16,3 0, ,65 0 ˆβ 1 0,78 0, ,06 0 ˆβ 2 1,03 1, ,67 0,508 ˆβ 3-0,30 0, ,50 0,0147 Les modèles par sexe Filles : y = 16, 3 + 0, 78t + b 0i Garçons : y = 17, 3 + 0, 48t + b 0i Différence de pente par sexe plus que d ordonnée à l origine 21

22 Les matrices de corrélation Comparaison des modèles de corrélation Modèle ddl AIC BIC LogVrais. LRT p-value CS 6 440,6 456,7-214,3 Générale ,2 477,4-210,6 7,404 0,2851 AR(1) 7 442,5 461,3-214,2 Générale ,2 477,4-210,6 7,249 0,2028 Par parcimonie, on préfère garder le modèle avec compound symmetry 6 Approche par modèle linéaire généralisé (mixte) Introduction GLM pour données longitudinales Des mesures continues aux mesures discrètes (comptes ou binaires) Trois extensions des GLM 1. Modèles marginaux 2. GLMM 3. Modèles de transition 6.1 Modèles marginaux L extension des GLM Le modèle Modèles pour la moyenne et pour la covariance spécifiés séparément 1. La moyenne : g(µ) = Xβ 2. La variance : var(y) = φv(µ) 3. La covariance : cov = h(µ, α) Exemple des données de compte 1. Régression de Poisson : log(µ) = Xβ 2. Surdispersion : var(y) = φµ 3. Corrélation compound symmetry : corr(y ij, y ij ) = α 22

23 L inférence sur β Pas de MLE Pas de fonction de vraisemblance utilisable Pas d estimateur du maximum de vraisemblance Equations d estimation généralisées (GEE, Liang et Zeger, 1986) Bonnes propriétés de l estimateur des β Estimation de la variance de ˆβ par estimateur sandwich Les GEE Introduire la matrice de covariance Solution de D V 1 (Y µ) = 0 1. D dépend de β : D = µ β 2. V est une matrice de covariance de travail, dependant de β et α : V = φtr(v(µ)) 1/2 R(α)tr(v(µ)) 1/2 Estimation en deux étapes itératives 1. Sachant α et φ, estimer β des GEE 2. Sachant β, estimer α et φ par minimisation des résidus standardisés 6.2 GLMM La généralisation des LMM Spécification facile LMM : E(y i b i ) = X i β + Z i b i GLMM : g(e(y i b i )) = X i β + Z i b i Estimation par intégration de Monte Carlo (solutions analytiques rares) Exemple du modèle de compte Modèle : log(e(y i b i )) = X i β + Z i b i Ordonnée et pente aléatoire : X i = Z i = [1 t i ] b i N (0, Σ b ) 6.3 Modèles de transition La spécification Idées phares Modèles de séries chronologiques Response à un moment donné sous une forme explicite des réponses antérieures La réponse y ij dépend de l ensemble H ij = {y i1,, y i,j 1 } Estimation par vraisemblance conditionnelle Exemple du modèle généralisé autorégressif g(e(y i H i )) = X i β + s r=1 α rf r (H i ) Fonctions f r (.) connues : f 1 (H ij ) = y i,j 1, f 2 (H ij ) = y i,j 2 Modèle de Markov d ordre q : les y ij dépendent des q précédentes 23

24 6.4 Lequel choisir? Laquelle des trois extensions choisir? Ca dépend Comparaison de groupes modèle marginal Intérêt sur effet intra-sujet : GLMM Connaissance du lien passé-présent : modèle de transition 7 Conclusion En résumé La succession des modèles 1. Réponse continue ANOVA à un facteur Modèle linéaire : β, Σ Modèle linéaire et structure de la matrice de covariance Modèle mixte = souplesse et temps continu 2. Réponse discrète Généralisation des modèles linéaires Modèle mixte Les GLMM et plus Peut être souci logiciel R : packages nlme (Pinheiro et Bates) et repeated SAS SPSS : non Stata : package gllamm (linear latent and mixed models) GAMM (nombre de mesures suffisant) Temps en continu si assez de mesures ou également espacées sinon variables indicatrices mais GLMM quand même! Les modèles hiérarchiques Le lien entre les deux Les modèles longitudinaux sont clusterisés par essence (plusieurs mesures par sujet) Les modèles hiérarchiques sont clusterisés Tout ce qui précède : modèles hiérarchiques à deux niveaux Orthodont data Présentation initiale 24

25 Age Sujets Sexe 1 M 26,0 25,0 29,0 31,0 2 M 21,5 22,5 23,0 26,5 27 F 24,5 25,0 28,0 28,0 Réorganisation Sujet Temps y x.1 x.2 x , , , , , , , , Présentation à deux niveaux Niveau 1 Niveau 2 Mesure , , , , , , , ,5 Un exemple à trois niveaux Les données 1. (top niveau) Médecin : 1,, k,, K 2. Sujet : 1,, j,, J k 25

26 3. Mesure : 1,, i,, I j Le modèle y ijk = X ijk β + Z (1) ijk b(1) k + Z (2) ijk b(2) jk + w ijk 26

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Modèles et Méthodes de Réservation

Modèles et Méthodes de Réservation Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire FFA Jean-Paul LAURENT Professeur à l'isfa jean-paul.laurent@univ-lyon1.fr http://laurent.jeanpaul.free.fr/ 0 De la la mesure à l analyse des risques! Intégrer

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012. FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE

Plus en détail

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria-00386678 https://hal.inria.fr/inria-00386678

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria-00386678 https://hal.inria.fr/inria-00386678 Sélection prédictive d un modèle génératif par le critère AICp Vincent Vandewalle To cite this version: Vincent Vandewalle. Sélection prédictive d un modèle génératif par le critère AICp. 41èmes Journées

Plus en détail

4. Résultats et discussion

4. Résultats et discussion 17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les

Plus en détail

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

de calibration Master 2: Calibration de modèles: présentation et simulation d

de calibration Master 2: Calibration de modèles: présentation et simulation d Master 2: Calibration de modèles: présentation et simulation de quelques problèmes de calibration Plan de la présentation 1. Présentation de quelques modèles à calibrer 1a. Reconstruction d une courbe

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Soutenance de stage Laboratoire des Signaux et Systèmes

Soutenance de stage Laboratoire des Signaux et Systèmes Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

SAS ENTERPRISE MINER POUR L'ACTUAIRE

SAS ENTERPRISE MINER POUR L'ACTUAIRE SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

TP N 57. Déploiement et renouvellement d une constellation de satellites

TP N 57. Déploiement et renouvellement d une constellation de satellites TP N 57 Déploiement et renouvellement d une constellation de satellites L objet de ce TP est d optimiser la stratégie de déploiement et de renouvellement d une constellation de satellites ainsi que les

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d Laboratoire de Mécanique et Ingénieriesnieries EA 3867 - FR TIMS / CNRS 2856 ER MPS Modélisation stochastique d un d chargement d amplitude variable à partir de mesures Application à l approche fiabiliste

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Table des matières. Avant-propos. Chapitre 2 L actualisation... 21. Chapitre 1 L intérêt... 1. Chapitre 3 Les annuités... 33 III. Entraînement...

Table des matières. Avant-propos. Chapitre 2 L actualisation... 21. Chapitre 1 L intérêt... 1. Chapitre 3 Les annuités... 33 III. Entraînement... III Table des matières Avant-propos Remerciements................................. Les auteurs..................................... Chapitre 1 L intérêt............................. 1 1. Mise en situation...........................

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES

Plus en détail

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE MICHÈLE PICARD FLIBOTTE EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE Essai-stage présenté à la Faculté des études supérieures de l Université Laval dans le cadre

Plus en détail

2 TABLE DES MATIÈRES. I.8.2 Exemple... 38

2 TABLE DES MATIÈRES. I.8.2 Exemple... 38 Table des matières I Séries chronologiques 3 I.1 Introduction................................... 3 I.1.1 Motivations et objectifs......................... 3 I.1.2 Exemples de séries temporelles.....................

Plus en détail

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal

Plus en détail

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE LA PHYSIQUE DES MATERIAUX Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE Pr. A. Belayachi Université Mohammed V Agdal Faculté des Sciences Rabat Département de Physique - L.P.M belayach@fsr.ac.ma 1 1.Le réseau

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales

Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales Pierre Thomas Léger IEA, HEC Montréal 2013 Table des matières 1 Introduction 2 2 Spécifications

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Statistiques descriptives

Statistiques descriptives Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives

Plus en détail

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercice : la frontière des portefeuilles optimaux sans actif certain Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Correction du baccalauréat ES/L Métropole 20 juin 2014

Correction du baccalauréat ES/L Métropole 20 juin 2014 Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone... Liste des notes techniques.................... xxi Liste des encadrés....................... xxiii Préface à l édition internationale.................. xxv Préface à l édition francophone..................

Plus en détail

Feuille d exercices 2 : Espaces probabilisés

Feuille d exercices 2 : Espaces probabilisés Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur

Plus en détail

Programmation Linéaire - Cours 1

Programmation Linéaire - Cours 1 Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.

Plus en détail