Séminaire d Epidémiologie Animale Analyse de données en présence de clusters

Dimension: px
Commencer à balayer dès la page:

Download "Séminaire d Epidémiologie Animale Analyse de données en présence de clusters"

Transcription

1 Analyse de données en présence de clusters Notion de clusters Conséquences de la non prise en compte des clusters Un exemple, une structure hiérarchique Elevage > Animal Le facteur d inflation de la variance La prise en compte des clusters Le modèle Subject Specific Le modèle Population Averaged Différences entre les modèles Subject Specific et Population Averaged Un modèle marginal particulier, le modèle G.E.E /09/2011 Service Biométrie (CL)

2 Analyse de données en présence de clusters Le modèle G.E.E., application à l étude FCO Le modèle G.E.E. : Étude FCO, les résultats Qualités du modèle G.E.E /09/2011 Service Biométrie (CL)

3 Séminaire d Epidémiologie Animale Notion de clusters Environnement commun aux individus statistiques Animaux dans des élevages, élevages dans des petites régions agricoles, animaux notés par des pointeurs Succession d observations sur un même individu Pesées successives sur un même animal pendant la période d engraissement, suivi des performances de reproduction sur une cohorte d élevages plusieurs années de suite Une structure hiérarchique des données Régions > Élevages > Animaux > mesures successives Spatial Conduite génétique (milieu) 28-30/09/2011 Service Biométrie (CL) 3

4 Notion de clusters Notion de clusters synonyme de données corrélées Ce que certaines données ont en commun se traduit par une structure de corrélation sur ces données. Les élevages d une région données se ressemblent car ils sont soumis à un même environnement. Les animaux d un même élevage sont tous soumis à des caractéristiques spécifiques à l élevage dans lequel ils se trouvent (conduite ). Les mesures successives sur un même animal sont naturellement corrélées (autocorrélations) 28-30/09/2011 Service Biométrie (CL) 4

5 Séminaire d Epidémiologie Animale Notion de clusters Le contexte Une variable privilégiée Y à décrire en fonction de variables explicatives X (facteurs de risque, de confusion ) Exemple Dans l étude FCO on dispose pour chaque élevage de deux années de suivi sur la mortalité des veaux pendant la période juillet à décembre. On dispose également pour chaque élevage de variables X sur les caractéristiques des élevages (variable taille retenue dans l analyse). Les variables X peuvent varier d une année à l autre ou changer d une année à l autre (variables «temps dépendantes»). Elles peuvent caractériser l élevage ou les animaux (hiérarchie sur les variables explicatives) /09/2011 Service Biométrie (CL) 5

6 Conséquences de la non prise en compte des clusters La non prise en compte de la structure en clusters biaise les effets. Les variances des paramètres β qui mesurent les effets des variables explicatives X sur la réponse sont sous-estimées si on néglige la structure en clusters. Les degrés de liberté des tests sont majorés à tort. Au final les tests sont faux!! Dans le cas de réponses discrètes (binaires, dénombrement ) les estimations des paramètres β sont biaisées /09/2011 Service Biométrie (CL) 6

7 Exemple : une structure hiérarchique Élevage > Animal K Élevages n animaux(élevage) Y, variable mesurée sur les n * K animaux, = moyenne des n * K animaux La variance d une donnée individuelle y est composée de deux variances : y variance(y) =? σ = variance 'Elevage' ; σ = variance animal(elevage) 2 2 E ( ) variance Y = σ = σ + σ T E 28-30/09/2011 Service Biométrie (CL) 7

8 Exemple : une structure hiérarchique Élevage > Animal K Élevages n animaux(élevage) σ σ + σ σ σ variance (y) = = ; variance(y) = + N T E E n* K n* K K n* K La première expression (variance naïve ) est celle que l on calcule lorsque l on néglige l effet cluster (=Élevage). Elle sous-estime la vraie variance (seconde formule) /09/2011 Service Biométrie (CL) 8

9 Exemple : une structure hiérarchique Élevage > Animal On a le résultat suivant : ( ) où ρ est le coefficient de corrélation intra-classe : 2 2 ( σe + σ ) * ( * ) variance y = 1 + ρ (n 1) ρ = σ n* K σ 2 E 2 2 E + σ ρ mesure la part de la variabilité des données individuelles y imputable à un effet Elevage. Cette quantité est comprise entre 0 (pas d effet Elevage) et 1 (pas de variabilité entre animaux intra élevage). Elle s interprète aussi comme une mesure de la corrélation entre les animaux d un même élevage (supposée ici ne pas dépendre des élevages...) /09/2011 Service Biométrie (CL) 9

10 Exemple : une structure hiérarchique Élevage > Animal ( ) 2 2 ( σe + σ ) * ( * ) var y = 1 + ρ (n 1) n* K La quantité (1 + ρ * (n-1)) est appelé le facteur d inflation de la variance ( Variance inflation factor ). Elle mesure l accroissement de l imprécision sur la moyenne des données y dû à l existence d une corrélation des données intra élevage (effet Elevage). Elle devrait être utilisée dans le calcul du nombre de données nécessaires en préalable aux tests statistiques. Ainsi dans cet exemple le nombre de n animaux par élevage amène autant d information que n* = n/ (1 + ρ * (n-1)) données indépendantes /09/2011 Service Biométrie (CL) 10

11 Le facteur d inflation de la variance n = 20 animaux(élevage) ρ= 0,20 Facteur multiplicateur = 4,8 20 données corrélées (ρ= 0,20) équivalent à 4 données indépendantes. n ρ ,0 1,0 1,0 1,0 1,0 1,0 0,05 1,5 2,0 2,5 3,5 6,0 11,0 0,10 1,9 2,9 3,9 5,9 10,9 20,9 0,15 2,4 3,9 5,4 8,4 15,9 30,9 0,20 2,8 4,8 6,8 10,8 20,8 40,8 0,25 3,3 5,8 8,3 13,3 25,8 50,8 0,30 3,7 6,7 9,7 15,7 30,7 60,7 0,35 4,2 7,7 11,2 18,2 35,7 70,7 0,40 4,6 8,6 12,6 20,6 40,6 80,6 0,45 5,1 9,6 14,1 23,1 45,6 90,6 0,50 5,5 10,5 15,5 25,5 50,5 100,5 0,55 6,0 11,5 17,0 28,0 55,5 110,5 0,60 6,4 12,4 18,4 30,4 60,4 120,4 0,65 6,9 13,4 19,9 32,9 65,4 130,4 0,70 7,3 14,3 21,3 35,3 70,3 140,3 0,75 7,8 15,3 22,8 37,8 75,3 150,3 0,80 8,2 16,2 24,2 40,2 80,2 160,2 0,85 8,7 17,2 25,7 42,7 85,2 170,2 0,90 9,1 18,1 27,1 45,1 90,1 180,1 0,95 9,6 19,1 28,6 47,6 95,1 190,1 0,99 9,9 19,8 29,7 49,5 99,0 198, /09/2011 Service Biométrie (CL) 11

12 Séminaire d Epidémiologie Animale Prise en compte des clusters On prend en compte les clusters dans les modèles en introduisant une variable codant les différents clusters parmi les variables explicatives de la réponse Y ou en modélisant la structure de corrélation intra cluster. Particularité, on ne dispose que d une partie des clusters. Une partie des élevages, des animaux, des mesures intra-animal La variable Cluster est un facteur à effets aléatoires ( Random effects ) Condition nécessaire : les niveaux (modalités) du facteur Clusters sont représentatifs de la totalité des niveaux. Représentativité des élevages, des animaux de l enquête Deux types de modèles possibles 28-30/09/2011 Service Biométrie (CL) 12

13 Prise en compte des clusters : le modèle initial Le modèle initial(sans prise en compte de l effet Élevage ) ( ) ( ij ) E Y x = β + β x ij 0 1 * ij var Y x Le modèle a deux composantes: = 2 εij N 0 ; σ i=1,... K ; j=1,... n (nanimauxparélevage (j); Kélevages(i)) - La partie déterministe (prédicteur), E(Yij x) = β0 + β1 * xij, qui décrit le lien entre la moyenne de la variable-réponse Y et les variables explicatives X (ici une seule) - Les écarts εij sont normalement distribués autour d une moyenne nulle avec une variance σ 2 quantifiant les écarts des données aux prédictions du modèle. (écarts εij = écarts résiduels, erreurs ) 28-30/09/2011 Service Biométrie (CL) 13

14 Le modèle Subject Specific Le modèle Subject Specific On rajoute un effet élevage représenté par des écarts γi à la moyenne générale des yij ( ) E y x, γ = β + β ij i 0 1 * ij i x + γ 2 ε ij N 0 ; σ i=1,... K ; j=1,... n Les écarts γi sont supposés être normalement distribués autour d une moyenne nulle avec une variance σ 2 E quantifiant la variance des élevages (1). Si σ 2 E est nul les écarts γi sont tous nuls. L effet Elevage est nul. On revient sur le modèle initial. (1) Ilfautaussisupposerl indépendanceentreles γietles εij γ i 2 N 0 ; σ E i=1,... K 28-30/09/2011 Service Biométrie (CL) 14

15 Le modèle Population Averaged Le modèle Population Averaged L effet Elevage n apparaît pas explicitement dans le modèle mais on en tient compte en supposant les écarts résiduels εij corrélés et en posant un modèle de corrélation sur les εij. ( ) ij [ ] E Y x = β + β x ij 0 1 * ij ε N 0 ; R La matrice R, de dimension égale au nombre total de données, contient l information modélisant les corrélations entre les écarts résiduels. Les modèles Populations Averaged sont des modèles marginaux dans la mesure où les paramètres β quantifient des effets moyens sur l ensemble des clusters de la population des clusters /09/2011 Service Biométrie (CL) 15

16 Séminaire d Epidémiologie Animale Le modèle Population Averaged Le modèle Population Averaged On dispose de nombreux modèle de corrélation des données intra cluster. Détails cf. Laird, Ware(1982), Verbeke, Molenbergh(2000) entre autres On peut citer deux types de structures de corrélation importants 1. Le modèle de symétrie«composée» ( Compound Symmetry ) CS 2. Le modèle autorégressif LemodèleCS Ce modèle suppose que la corrélation est la même entre tous les couples d individus au sein d un même cluster. Le modèle de corrélation dépend de deux paramètres, la variance cluster σ 2 c et la variance individuelle intra cluster σ /09/2011 Service Biométrie (CL) 16

17 Le modèle Population Averaged Le modèle Population Averaged Le modèle CS(suite) La corrélation est alors quantifiée par la corrélation intra classe : ρ = σ 2 σ c 2 2 c + σ Ce modèle est particulièrement adapté dans le cas de structures hiérarchiques : {Elevages > Animaux(Elevage]} σ 2 c est alors la variance Élevage, σ 2 est la variance intra élevage /09/2011 Service Biométrie (CL) 17

18 Le modèle Population Averaged Le modèle Population Averaged Le modèle autorégressif Ce modèle de corrélation s applique particulièrement lorsque la structure hiérarchique est temporelle (mesures successives sur un même individu). Il dépend également de deux paramètres : 1. La corrélation entre deux mesures successives : ρ 2. La variance individuelle à un temps t : σ 2 La corrélation entre deux mesures y effectuées à des temps t1 et t2 (t1 < t2) est alors : (t2 t 1) ρ 28-30/09/2011 Service Biométrie (CL) 18

19 Différence entre les modèles Subject- Specific et Population Averaged Le modèle Subject Specific est posé lorsque l on s intéresse principalement aux clusters. L étude des effets des variables X est relativement secondaire. C est le cas par exemple lorsque les clusters sont des animaux sur lesquels on dispose de mesures répétées au cours du temps (pesées). On s intéresse plus aux trajectoires individuelles des animaux qu aux trajectoires moyennes conditionnellement aux variables X. A contrario le modèle Population averaged est posé lorsque l objet de l étude est l estimation et le test des effets des variables X. Les effets des clusters sont estimés afin d obtenir des estimations sans biais et des tests corrects des effets étudiés /09/2011 Service Biométrie (CL) 19

20 Différence entre les modèles Subject Specific et Population Averaged Une différence importante lorsque la variable-réponse Y est discrète Lorsque la variable-réponse Y est continue avec une distribution Normale. Les paramètres β mesurant les effets des variables X du modèle Subject-Specific (β SS ) sont des estimations sans biais des effets fixes X sur Y. On peut donc utiliser un modèle Subject-pecific à la fois pour étudier les effets aléatoires (le cluster ici) et les effets fixes des variables X. Ce n est plus le cas lorsque la variable-réponse Y est discrète. Le modèle Subject Specific fournit alors des estimations des effets fixes pour les clusters particuliers de l étude et pour eux seuls!! Seuls les paramètres β du modèle Population Averaged (β PA ) fournissent des estimations sans biais des effets fixes des variables X pour l ensemble des tous les clusters, ceux qui sont présents dans l étude mais aussi les autres 28-30/09/2011 Service Biométrie (CL) 20

21 Différence entre les modèles Subject Specific et Population Averaged Les estimations du modèle Population Averaged sont bornées supérieurement par les estimations du modèle Subject Specific. 0 PA SS < β < β On dispose d une formule approchée dans le cas où la réponse Y est une variable binaire (modèle Logistique). β β ,346 * σc PA SS * où σ 2 c est alors la variance Cluster /09/2011 Service Biométrie (CL) 21

22 Un modèle marginal particulier : le modèle G.E.E. Une méthode particulièrement intéressante a été proposée, Liang et Zeger (1986), qui permet de poser des modèles marginaux sur des données binaires corrélées. La méthode, Generalized Estimating Equations (G.E.E.) estime les moyennes marginales conditionnelles aux effets fixes X posés dans le modèle en utilisant une matrice de corrélation sur les données intra cluster dite matrice de corrélation de travail ( Working correlation matrix ). Cette matrice dépend de la structure hiérarchique des données. Un type de structure très utilisé dans le cas de hiérarchies du genre : {Elevages > Animaux(Elevage]} est le type Compound Symmetry (aussi appelé Exchangeable ). D autres matrices sont possibles (cf. Liang et Zeger (1986)) 28-30/09/2011 Service Biométrie (CL) 22

23 le modèle G.E.E., application à l étude FCO LemodèleG.E.E.aétéutilisédanslecasdel étudefco. Les données de mortalité des veaux étaient disponibles en 2006 et 2007 pour les élevages de l enquête. Un modèle de régression a été posé sur le nombre de veaux de moins de un mois morts dans chaque élevage en fonction de l année, de la taille de l élevage et de la caractérisation de l élevage en cas ou témoin selon qu au moins un cas de FCO a été détecté dans l élevage entre juillet et décembre Le nombre de veaux * jours à risque a été utilisé comme OFFSET. Les trois effets principaux, taille, année et FCO, les trois interactions d ordre un et l interaction d ordre deux ont été introduits dans le modèle (modèle complet). Une distribution Binomiale Négative a été posée sur les données conditionnellement aux effets fixes. Une corrélation de type CS a été posée supposée la même dans tous les élevages. La corrélation entre années intra élevage est estimée à 0, /09/2011 Service Biométrie (CL) 23

24 le modèle G.E.E. : Étude FCO, les résultats Elevages témoins Estimation des taux d incidence 1. Avec correction de la sur-dispersion 2. Avec prise en compte d un effet Elevage par un modèle marginal (méthode G.E.E.) témoins Taille n λ(année 1) λ(année 2) IR(An 2/1) ,174 0,120 0,687 [0,094; 0,324] [0,062; 0,231] [0,279; 1,695] ,145 0,125 0,862 [0,114; 0,184] [0,098; 0,160] [0,613; 1,212] ,098 0,109 1,111 [0,087; 0,110] [0,098; 0,122] [0,945; 1,306] Total ,135 0,118 0,870 [0,108; 0,170] [0,093; 0,149] [0,628; 1,205] témoins Taille n λ(année 1) λ(année 2) IR(An 2/1) ,169 0,122 0,720 [0,089; 0,322] [0,067; 0,221] [0,308; 1,681] ,141 0,123 0,871 [0,114; 0,175] [0,101; 0,149] [0,659; 1,152] ,098 0,109 1,112 [0,089; 0,107] [0,100; 0,119] [0,994; 1,243] Total ,133 0,118 0,887 [0,106; 0,167] [0,095; 0,145] [0,657; 1,197] 28-30/09/2011 Service Biométrie (CL) 24

25 le modèle G.E.E. : Étude FCO, les résultats Elevages cas Estimation des taux d incidence 1. Avec correction de la sur-dispersion 2. Avec prise en compte d un effet Elevage par un modèle marginal (méthode G.E.E.) Cas Taille n λ(année 1) λ(année 2) IR(An 2/1) ,277 0,188 0,678 [0,101; 0,760] [0,069; 0,515] [0,163; 2,825] ,115 0,225 1,955 [0,086; 0,154] [0,178; 0,285] [1,350; 2,833] ,073 0,125 1,713 [0,067; 0,080] [0,116; 0,136] [1,512; 1,940] Total ,133 0,174 1,315 [0,093; 0,189] [0,123; 0,247] [0,803; 2,152] Cas Taille n λ(année 1) λ(année 2) IR(An 2/1) ,251 0,173 0,687 [0,082; 0,770] [0,080; 0,371] [0,160; 2,950] ,113 0,222 1,971 [0,090; 0,141] [0,185; 0,266] [1,507; 2,577] ,073 0,125 1,709 [0,068; 0,079] [0,117; 0,133] [1,562; 1,869] Total ,127 0,169 1,323 [0,087; 0,187] [0,130; 0,219] [0,807; 2,169] 28-30/09/2011 Service Biométrie (CL) 25

26 Séminaire d Epidémiologie Animale le modèle G.E.E. : Étude FCO, les résultats Les résultats des modèles (i) Avec correction de la sur-dispersion (ii) Avec prise en compte d une corrélation intra élevage par une G. E. E. Sont comparables /09/2011 Service Biométrie (CL) 26

27 Qualités du modèle G.E.E. Le modèle G.E.E. est relativement robuste par rapport au choix de la matrice de travail. Les estimations des effets β sont asymptotiquement sans biais. Dans le cas d une réponse Y binaire (modèle logistique) une méthode alternative à la modélisation d une structure de corrélation sur les données consiste à définir l association entre les couples de données intra cluster par le log du odds ratio entre les deux résultats du couple, Carey, V. etal. (1993). C est l Alternating Logistic Regression (ALR) Dans le cas de l étude FCO si au lieu de modéliser le nombre de veaux morts on modélise la probabilité d avoir au moins un veau mort on peut poser un modèle ALR en utilisant comme mesure d association intra élevage : ψ odds(y ) odds(y ) ( ) i2 i = Loge loge ORi = i1 où yi1, yi2 désigne l indicatrice d au moins un mort les années 1 et 2 dans l élevage i /09/2011 Service Biométrie (CL) 27

28 Séminaire d Epidémiologie Animale Éléments de bibliographie Carey, V., Zeger, S. L., and Diggle, P. (1993), Modelling Multivariate Binary Data with Alternating Logistic Regressions, Biometrika, 80, Diggle, P. J., Liang, K. Y., and Zeger, S. L. (1994), Analysis of Longitudinal Data, Oxford: Clarendon Press. Dohoo, I., Martin, W., Stryhn, H. : Veterinary Epidemiologic Research 2003 AVC Inc. Laird, N. M. and Ware, J. H. (1982), "Random-Effects Models for Longitudinal Data," Biometrics, 38, Liang, K.Y. and Zeger, S.L. (1986), "Longitudinal Data Analysis Using Generalized Linear Models," Biometrika, 73, Verbeke, G. and Molenberghs, G. (2000), Linear Mixed Models for Longitudinal Data, Berlin- Heidelberg-New York: Springer-Verlag /09/2011 Service Biométrie (CL) 28

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercice : la frontière des portefeuilles optimaux sans actif certain Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet

Plus en détail

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading PROJET DE GESTION PORTEFEUILLE Evaluation d une Stratégie de Trading Encadré par M. Philippe Bernard Master 1 Economie Appliquée-Ingénierie Economique et Financière Taylan Kunal 2011-2012 Sommaire 1) Introduction

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014 Attitude des ménages face au risque - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014 Plan du cours 1. Introduction : demande de couverture et comportements induits pa 2. Représentations

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

Docteur José LABARERE

Docteur José LABARERE UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

UNIVERSITÉ PARIS VI PIERRE ET MARIE CURIE

UNIVERSITÉ PARIS VI PIERRE ET MARIE CURIE UNIVERSITÉ PARIS VI PIERRE ET MARIE CURIE ECOLE DOCTORALE : SANTÉ PUBLIQUE ET SCIENCES DE L INFORMATION BIOMÉDICALE THÈSE pour l obtention du titre de DOCTEUR DE L UNIVERSITÉ PARIS VI Présentée par : Basile

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident?

Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident? Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident? Nathalie LEPINE GREMAQ, Université de Toulouse1, 31042 Toulouse, France GRAPE, Université Montesquieu-Bordeaux

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Le théorème des deux fonds et la gestion indicielle

Le théorème des deux fonds et la gestion indicielle Le théorème des deux fonds et la gestion indicielle Philippe Bernard Ingénierie Economique& Financière Université Paris-Dauphine mars 2013 Les premiers fonds indiciels futent lancés aux Etats-Unis par

Plus en détail

Quelles sont les entreprises qui ont recours au commerce électronique?

Quelles sont les entreprises qui ont recours au commerce électronique? Nicolas POUSSING Anne-Sophie GENEVOIS octobre 2003 Quelles sont les entreprises qui ont recours au commerce électronique? Dans le cadre du projet «eeurope 2002», une enquête communautaire intitulée «E-commerce

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Modélisation des carrières salariales. dans Destinie

Modélisation des carrières salariales. dans Destinie INSTITUT NATIONAL DE LA STATISTIQUE ET DES ÉTUDES ÉCONOMIQUES Série des documents de travail de la Direction des Etudes et Synthèses Économiques G 990 Modélisation des carrières salariales dans Destinie

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures? Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures? Benoît Pagès 1, Valérie Leveau 1 1 ARVALIS Institut du

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Produits de crédit en portefeuille

Produits de crédit en portefeuille Chapitre 6 Produits de crédit en portefeuille et défauts corrélés Dans ce chapitre, on étudie des produits financiers de crédit en portfeuille, notamment k th -to-default swap et CDOs (voir 1.2 pour une

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012. FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

L impact de la sinistralité passée sur la sinistralité future : Approche empirique en assurance automobile

L impact de la sinistralité passée sur la sinistralité future : Approche empirique en assurance automobile ARTICLES ACADÉMIQUES ACADEMIC ARTICLES Assurances et gestion des risques, vol. 78(1-2), avril-juillet 2010, 71-91 Insurance and Risk Management, vol. 78(1-2), April-July 2010, 71-91 L impact de la sinistralité

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

Avant-après, amont-aval : les couples de tableaux totalement appariés

Avant-après, amont-aval : les couples de tableaux totalement appariés ADE-4 Avant-après, amont-aval : les couples de tableaux totalement appariés Résumé La fiche décrit les méthodes d analyse des couples de tableaux complètement appariés (mêmes individus, mêmes variables).

Plus en détail

Gestion obligataire passive

Gestion obligataire passive Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES

TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES Coût de revient du produit + Marge du fabricant = Prix de vente HT au distributeur Prix d'achat HT du distributeur + Marge du distributeur =

Plus en détail

Exercices & cours de Gestion en vidéo - BTS MUC. Liste des formules. (Consultez également «Liste des tableaux»)

Exercices & cours de Gestion en vidéo - BTS MUC. Liste des formules. (Consultez également «Liste des tableaux») Liste des formules (Consultez également «Liste des tableaux») Table des matières LES CALCULS COMMERCIAUX... 4 Le coefficient multiplicateur... 4 Montant de TVA... 4 TVA collectée... 4 TVA déductible...

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q

Plus en détail

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,

Plus en détail

Cours d initiation à la programmation en C++ Johann Cuenin

Cours d initiation à la programmation en C++ Johann Cuenin Cours d initiation à la programmation en C++ Johann Cuenin 11 octobre 2014 2 Table des matières 1 Introduction 5 2 Bases de la programmation en C++ 7 3 Les types composés 9 3.1 Les tableaux.............................

Plus en détail

Modèles et Méthodes de Réservation

Modèles et Méthodes de Réservation Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

Evaluer l ampleur des économies d agglomération

Evaluer l ampleur des économies d agglomération Pierre-Philippe Combes GREQAM - Université d Aix-Marseille Ecole d Economie de Paris CEPR Janvier 2008 Supports de la présentation Combes, P.-P., T. Mayer et J.-T. Thisse, 2006, chap. 11. Economie Géographique,

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

COMPLEMENT D AVIS de l Agence nationale de sécurité sanitaire de l alimentation, de l environnement et du travail

COMPLEMENT D AVIS de l Agence nationale de sécurité sanitaire de l alimentation, de l environnement et du travail Saisine n 2010-SA-0215 Le directeur général Maisons-Alfort, le 11 août 2011 COMPLEMENT D AVIS de l Agence nationale de sécurité sanitaire de l alimentation, de l environnement et du travail relatif à la

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE

Plus en détail

Comment bien régresser: La statistique peut-elle se passer d artefacts?

Comment bien régresser: La statistique peut-elle se passer d artefacts? Comment bien régresser: La statistique peut-elle se passer d artefacts? Jean-Bernard Chatelain To cite this version: Jean-Bernard Chatelain. Comment bien régresser: La statistique peut-elle se passer d

Plus en détail

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction

Plus en détail

Expérience 3 Formats de signalisation binaire

Expérience 3 Formats de signalisation binaire Expérience 3 Formats de signalisation binaire Introduction Procédures Effectuez les commandes suivantes: >> xhost nat >> rlogin nat >> setenv DISPLAY machine:0 >> setenv MATLABPATH /gel/usr/telecom/comm_tbx

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Valorisation d es des options Novembre 2007

Valorisation d es des options Novembre 2007 Valorisation des options Novembre 2007 Plan Rappels Relations de prix Le modèle binomial Le modèle de Black-Scholes Les grecques Page 2 Rappels (1) Définition Une option est un contrat financier qui confère

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

Les Notes de l Institut d émission

Les Notes de l Institut d émission Les Notes de l Institut d émission Établissement public Dotation - SIRET 78 APE 65 A Siège social : 5 rue Roland Barthes 75598 Paris cedex Tél. : + 5 Fax : + 87 99 6 Croissance de la masse monétaire et

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Exercices Corrigés Premières notions sur les espaces vectoriels

Exercices Corrigés Premières notions sur les espaces vectoriels Exercices Corrigés Premières notions sur les espaces vectoriels Exercice 1 On considére le sous-espace vectoriel F de R formé des solutions du système suivant : x1 x 2 x 3 + 2x = 0 E 1 x 1 + 2x 2 + x 3

Plus en détail

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives ************* ************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio Exercices : Martine Quinio Exo7 Probabilité conditionnelle Exercice 1 Dans la salle des profs 60% sont des femmes ; une femme sur trois porte des lunettes et un homme sur deux porte des lunettes : quelle

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

(Customer Relationship Management, «Gestion de la Relation Client»)

(Customer Relationship Management, «Gestion de la Relation Client») (Customer Relationship Management, «Gestion de la Relation Client») Les Banques et sociétés d assurance sont aujourd'hui confrontées à une concurrence de plus en plus vive et leur stratégie " clientèle

Plus en détail

PROJET MODELE DE TAUX

PROJET MODELE DE TAUX MASTER 272 INGENIERIE ECONOMIQUE ET FINANCIERE PROJET MODELE DE TAUX Pricing du taux d intérêt des caplets avec le modèle de taux G2++ Professeur : Christophe LUNVEN 29 Fevrier 2012 Taylan KUNAL - Dinh

Plus en détail

Économétrie, causalité et analyse des politiques

Économétrie, causalité et analyse des politiques Économétrie, causalité et analyse des politiques Jean-Marie Dufour Université de Montréal October 2006 This work was supported by the Canada Research Chair Program (Chair in Econometrics, Université de

Plus en détail

Dérivés Financiers Contrats à terme

Dérivés Financiers Contrats à terme Dérivés Financiers Contrats à terme Mécanique des marchés à terme 1) Supposons que vous prenez une position courte sur un contrat à terme, pour vendre de l argent en juillet à 10,20 par once, sur le New

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,

Plus en détail

Algebra & Trigonometry High School Level Glossary English / French

Algebra & Trigonometry High School Level Glossary English / French Algebra & Trigonometry High School Level Glossary / Algebra 2 and Trigonometry Problem Solving algebraically alternate approach collaborate constraint critique equivalent evaluate explain formulate generalization

Plus en détail