Introduction aux modèles mixtes Comparaison de k moyennes à partir d échantillons non indépendants. 27 mai 2009 Pierre INGRAND

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Introduction aux modèles mixtes Comparaison de k moyennes à partir d échantillons non indépendants. 27 mai 2009 Pierre INGRAND"

Transcription

1 Introduction aux modèles mixtes Comparaison de k moyennes à partir d échantillons non indépendants 27 mai 2009 Pierre INGRAND

2 Position du problème. Exemple On cherche à comparer la réponse pharmacologique à 3 molécules A, B, C. En raison d une forte variabilité inter-individuelle de la réponse, le schéma expérimental retenu consiste à administrer les 3 molécules à un même échantillon de 30 individus dans un ordre réparti au hasard. La réponse est mesurée par une variable quantitative. On veut tester l hypothèse d égalité des moyennes des réponses aux 3 traitements. H0 : µ A =µ B =µ C

3 L analyse de variance à un facteur n est pas appropriée Les conditions d application de l Anova simple à un facteur ne sont pas réunies. En effet, même si l on considère que la réponse est distribuée selon une loi une normale et que les variances de la réponse sont homogènes avec les trois traitements, La condition d indépendance n est pas satisfaite. Chaque individu contribuant à trois valeurs de la réponse, une pour chaque molécule administrée, Il serait absurde de supposer l indépendance entre trois valeurs d une variable recueillies chez le même individu, (même si les conditions sont différentes). Leur corrélation est vraisemblablement non nulle (positive?)

4 L approche classique : Anova à 2 facteurs Les blocs complets Pour rendre compte d une deuxième source de variation contrôlée, en plus du traitement, on peut réaliser une analyse de variance à deux facteurs : traitement et sujet Avec k traitements et n individus, on dispose de kn observations X ij Modèle : X ij = µ+β j +τ i +ε ij Avec µ moyenne globale (espérance mathématique) β j écart moyen dû au traitement j (j=1, k) τ i écart moyen dû au sujet i (i=1, n) ε ij terme d erreur résiduelle (conditions de distribution)

5 Exemple de blocs complets 3 traitements ont été administrés à 7 sujets Chacun des 7 sujets a reçu chacun des trois traitemesnts La mesure de la réponse est une variable quantitative Analysis Variable : mesure trt N Mean Std Dev Minimum Maximum c i n

6 Exemple de blocs complets : GLM On propose dans un premier temps une anova à 2 facteurs : traitement et sujet proc GLM data=bce; class sujet trt; model mesure=trt sujet;

7 Exemple de blocs complets : résultats GLM The GLM Procedure Dependent Variable: mesure Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE mesure Mean Source DF Type I SS Mean Square F Value Pr > F trt sujet Source DF Type III SS Mean Square F Value Pr > F trt sujet

8 Exemple de blocs complets : MIXED On propose dans un deuxième temps une anova mixte à un facteur fixe : traitement et un facteur aléatoire : sujet proc MIXED data=bce; class sujet trt; model mesure=trt; random sujet;

9 Exemple de blocs complets : résultats MIXED (1) Model Information Data Set WORK.BCE Dependent Variable mesure Covariance Structure Variance Components Estimation Method REML Residual Variance Method Profile Fixed Effects SE Method Model-Based Degrees of Freedom Method Containment Class Level Information Class Levels Values sujet trt 3 c i n Dimensions Covariance Parameters 2 Columns in X 4 Columns in Z 7 Subjects 1 Max Obs Per Subject 21

10 Exemple de blocs complets : résultats MIXED (2) Number of Observations Number of Observations Read 21 Number of Observations Used 21 Number of Observations Not Used 0 Iteration History Iteration Evaluations -2 Res Log Like Criterion Convergence criteria met. Covariance Parameter Estimates Cov Parm Estimate sujet Residual

11 Exemple de blocs complets : résultats MIXED (3) The Mixed Procedure Fit Statistics -2 Res Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) Type 3 Tests of Fixed Effects Num Den Effect DF DF F Value Pr > F trt Les deux approches par GLM, ou par MIXED, conduisent ici au même résultat

12 Exemple 2 : blocs incomplets Une expérimentation a été organisée pour comparer 15 traitements. 4 traitements parmi les 15 à l étude ont été administrés à un échantillon de 15 sujets. Chaque traitement a été administré à 4 sujets Chaque sujet a reçu 4 traitements Les deux modalités d analyse (GLM et MIXED) vont être à nouveau conduites afin de comparer leurs résultats.

13 Exemple 2 blocs incomplets : moyennes trt N Mean Std Dev Minimum Maximum

14 Exemple 2 blocs incomplets : GLM The GLM Procedure Dependent Variable: mesure Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE mesure Mean Source DF Type I SS Mean Square F Value Pr > F sujet trt Source DF Type III SS Mean Square F Value Pr > F sujet trt Relever la différence entre les sommes de carrés de Type I et Type III

15 Exemple 2 blocs incomplets : MIXED (1) Class Level Information Class Levels Values sujet trt Dimensions Covariance Parameters 2 Columns in X 16 Columns in Z 15 Subjects 1 Max Obs Per Subject 60 Iteration History Iteration Evaluations -2 Res Log Like Criterion Convergence criteria met.

16 Exemple 2 blocs incomplets : MIXED (2) The Mixed Procedure Covariance Parameter Estimates Cov Parm Estimate sujet Residual Fit Statistics -2 Res Log Likelihood 52.0 AIC (smaller is better) 56.0 AICC (smaller is better) 56.3 BIC (smaller is better) 57.4 Type 3 Tests of Fixed Effects Num Den Effect DF DF F Value Pr > F trt

17 Que tirer de ces deux exemples? 1. Blocs Complets: les deux approches par GLM, ou par MIXED, conduisent au même résultat 2. Blocs incomplets : GLM et MIXED conduisent à des résultats différents Ce n est pas la nature du problème, mais sa formulation qui est en cause GLM ne conduit à des résultats valides (tests, estimations par intervalles) que dans le cas équilibré Dans un plan équilibré au départ, un déséquilibre peut être produit par des données manquantes Recommandation : utiliser un modèle mixte

18 Modèles mixtes : terminologie Modèles mixtes : dont les effets sont mixtes Mixte signifie «qui associe effets fixes et effets aléatoires» La variable dépendante (variable expliquée) est toujours par définition une variable aléatoire. Ce n est pas elle qui constitue un effet aléatoire. Quand les niveaux d une variable sont fixés a priori, par nature ou par choix arbitraire, on dit que cette variable est contrôlée. Elle constitue un effet fixe. Les effets aléatoires dépendent de l échantillon. Ils déterminent la structure des corrélations. Une fois modélisée la covariance des effets aléatoires, les résidus sont indépendants.

19 Modèles mixtes : retour aux exemples Dans nos deux exemples, le traitement est un effet fixe, il est contrôlé (ce qui n implique pas que tous les traitements possibles soient testés) L individu est un effet aléatoire aucune inférence n est attendue ici sur l effet sujet les sujets participants constituent un échantillon de sujets parmi une population plus vaste un autre échantillon conduirait à d autres observations, mais celles-ci suivraient la même distribution

20 Modèles mixtes et analyse de variance L analyse de variance a été conçue pour des schémas équilibrés. Les estimations basées sur la méthode des moindres carrés posent problème en présence de données manquantes, de données fortement déséquilibrées, voire de combinaisons absentes de niveaux des variables : en particulier pour l estimation de termes d interaction. Dans ces situations, les programmes d anova classiques (proc GLM) conduisent à des résultats erronés (erreurs standards, intervalles de confiance, tests) Les modèles mixtes font appel à des méthodes d estimation différentes, plus fiables, basées sur les moindres carrés généralisés : REML restricted maximum likelihood (distribution normale)

21 Modèles mixtes et données répétées Modèles pour données répétées : le même individu contribue à plusieurs observations (dans le temps, dans l espace) Les modèles mixtes sont également souvent qualifiés de modèles pour données corrélées : adaptés aux données groupées (échantillonnages en clusters) Intérêt : définir une covariance traduisant la nature des corrélations au niveau des effets aléatoires Possibilité de tester si un modèle de corrélation comportant davantage de paramètres améliore le modèle. Test du rapport de vraisemblance.

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Analyse des données individuelles groupées

Analyse des données individuelles groupées Analyse des données individuelles groupées Analyse des Temps de Réponse Le modèle mixte linéaire (L2M) Y ij, j-ième observation continue de l individu i (i = 1,, N ; j =1,, n) et le vecteur des réponses

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés M1 MLG Année 2012 2013 Feuille de TP N 3 : Modèle log-linéaire - Travail guidé 1 Cancers : modèle log-linéaire à deux facteurs croisés Ce premier exercice reprend l exercice 1 de la feuille de TD n 3.

Plus en détail

SEMIN- Introduction au modèle linéaire mixte. Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS

SEMIN- Introduction au modèle linéaire mixte. Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS SEMIN- Introduction au modèle linéaire mixte Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS SEMIN-R du MNHN 18 Décembre 2008 Introduction au modèle linéaire

Plus en détail

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Cours 7 : Exemples I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de

Plus en détail

EXEMPLE : FAILLITE D ENTREPRISES

EXEMPLE : FAILLITE D ENTREPRISES EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : «Applied Multivariate Statistical

Plus en détail

La régression logistique généralisée avec la procédure LOGISTIC

La régression logistique généralisée avec la procédure LOGISTIC La régression logistique généralisée avec la procédure LOGISTIC 1 Sommaire I / Régression logistique généralisée 3 a. Introduction 3 b. Présentation de l exemple à étudier 3 II / Modélisation avec la proc

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Sélection de modèles avec l AIC et critères d information dérivés

Sélection de modèles avec l AIC et critères d information dérivés Sélection de modèles avec l AIC et critères d information dérivés Renaud LANCELOT et Matthieu LESNOFF Version 3, Novembre 2005 Ceci n est pas une revue exhaustive mais une courte introduction sur l'utilisation

Plus en détail

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : Applied Multivariate Statistical Analysis»,

Plus en détail

Le modèle linéaire généralisé avec R : fonction glm()

Le modèle linéaire généralisé avec R : fonction glm() SEMIN- Le modèle linéaire généralisé avec R : fonction glm() Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Ecole Normale Supérieure 46 rue d'ulm F-75230 Paris Cedex 05 sebastien.ballesteros@biologie.ens.fr

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Validation des modèles statistiques dans l analyse de données longitudinales

Validation des modèles statistiques dans l analyse de données longitudinales Validation des modèles statistiques dans l analyse de données longitudinales C. Lopez (Institut de l Elevage) Service Biométrie (CL) 1 Quels modèles? Service Biométrie (CL) 2 Les outils diagnostics (modèles

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

REGRESSION LOGISTIQUE ASSURES BELGES

REGRESSION LOGISTIQUE ASSURES BELGES REGRESSION LOGISTIQUE ASSURES BELGES Cte étude concerne l assurance automobile. L échantillon est constitué de 1106 assurés belges observés en 1992 répartis en deux groupes. Les assurés qui n ont eu aucun

Plus en détail

Création de typologie sous SPSS

Création de typologie sous SPSS Création de typologie sous SPSS À Propos de ce document... 1 Introduction... 1 La démarche à suivre sous SPSS... 2 1. «Iterate»... 2 2. «Save»... 2 3. «Options»... 3 Analyse des résultats... 3 1. Historique

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

TABLE DES MATIÈRES. 1. Concepts de base et ANOVA. 3. 2. L approche processus et l analyse statistique.. 8 3. STATISTICA.. 12

TABLE DES MATIÈRES. 1. Concepts de base et ANOVA. 3. 2. L approche processus et l analyse statistique.. 8 3. STATISTICA.. 12 2 TABLE DES MATIÈRES 1. Concepts de base et ANOVA. 3 2. L approche processus et l analyse statistique.. 8 3. STATISTICA.. 12 4. Modèles linéaires statistiques.... 15 5. ANOVA avec un facteur 20 6. Analyse

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

Économétrie 2 : données qualitatives, probit et logit

Économétrie 2 : données qualitatives, probit et logit URCA Hugo Harari-Kermadec 2008-2009 harari@ecogest.ens-cachan.fr Économétrie 2 : données qualitatives, probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours

Plus en détail

Normalité des rendements?

Normalité des rendements? Normalité des rendements? Daniel Herlemont 31 mars 2011 Table des matières 1 Introduction 1 2 Test de Normalité des rendements 2 3 Graphiques quantile-quantile 2 4 Estimation par maximum de vraisemblance

Plus en détail

Marketing quantitatif M2-MASS

Marketing quantitatif M2-MASS Marketing quantitatif M2-MASS Francois.Kauffmann@unicaen.fr UCBN 2 décembre 2012 Francois.Kauffmann@unicaen.fr UCBN Marketing quantitatif M2-MASS 2 décembre 2012 1 / 61 Première partie I Analyse Analyse

Plus en détail

Données qualitatives, modèles probit et logit

Données qualitatives, modèles probit et logit Données qualitatives, modèles probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours de Christophe Hurlin. On est confronté à des données qualitatives en micro-économie

Plus en détail

Cours 6 : Les statistiques avec R. XVII- Généralités XVIII- Les formules XIX- Les sorties

Cours 6 : Les statistiques avec R. XVII- Généralités XVIII- Les formules XIX- Les sorties Cours 6 : Les statistiques avec R XVII- Généralités XVIII- Les formules XIX- Les sorties XX- Les fonctions génériques XVII- Généralités Fonctions d analyse statistique disponibles Package «stats» : contient

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Analyse des données longitudinales

Analyse des données longitudinales Analyse des données longitudinales EA Sauleau SémStat 03/10/2006 Table des matières 1 Introduction 2 1.1 Généralités 2 1.2 La structure des données.. 3 1.3 Exemple.. 4 1.4 Des impasses.. 4 2 (M)ANOVA 4

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Exemples d application

Exemples d application Institut National Agronomique Paris - Grignon Exemples d application du modèle linéaire E Lebarbier, S Robin Département OMIP 12 février 2007 Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Le provisionnement en assurance non-vie prise en compte de la dépendance

Le provisionnement en assurance non-vie prise en compte de la dépendance Le provisionnement en assurance non-vie prise en compte de la dépendance Arthur Charpentier http://freaconometrics.blog.free.fr Séminaire interne Desjardins Assurances Générales, février 2011 Les provisions

Plus en détail

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE Les résultats donnés par R et SAS donnent les valeurs des tests, la valeur-p ainsi que les intervalles de confiance. TEST DE COMPARAISON

Plus en détail

La régression logistique PLS

La régression logistique PLS La régression logistique PLS Michel Tenenhaus Groupe HEC, 78351 Jouy-en-Josas 1 Introduction La régression PLS permet de relier une ou plusieurs variables de réponse y àun ensemble de variables prédictives

Plus en détail

B/. 1 1 fr -I- 2 f", I! Méthode de prise en compte de la consanguinité dans un modèle simple de simulation de performances

B/. 1 1 fr -I- 2 f, I! Méthode de prise en compte de la consanguinité dans un modèle simple de simulation de performances NOTE Méthode de prise en compte de la consanguinité dans un modèle simple de simulation de performances J.-L. FOULLEY C. CHEVALET LN.R.A., Station de Génétique quantitative et appliquée, Centre de Recherches

Plus en détail

Imputation multiple pour variables qualitatives par analyse des correspondances multiples

Imputation multiple pour variables qualitatives par analyse des correspondances multiples Imputation multiple pour variables qualitatives par analyse des correspondances multiples Vincent Audigier & François Husson & Julie Josse Laboratoire de mathématiques appliquées, Agrocampus Ouest 65 rue

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Questionnaires de satisfaction Résultats et présentation de différentes méthodes d analyse statistique

Questionnaires de satisfaction Résultats et présentation de différentes méthodes d analyse statistique Questionnaires de satisfaction Résultats et présentation de différentes méthodes d analyse statistique SOMMAIRE 1. Création de la base de données 2 Deux types de codage possibles Codages alternatifs 2.

Plus en détail

Le pire des cas dans le choix de la copule

Le pire des cas dans le choix de la copule Comment éviter le pire Département de Mathématique Université de Bretagne Occidentale 29200 Brest Solvency 2 impose aux assureurs une analyse des risques accumulés sur plusieurs produits d assurances.

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Actuariat de l Assurance Non-Vie # 5 A. Charpentier (UQAM & Université de Rennes 1)

Actuariat de l Assurance Non-Vie # 5 A. Charpentier (UQAM & Université de Rennes 1) Actuariat de l Assurance Non-Vie # 5 A. Charpentier (UQAM & Université de Rennes 1) ENSAE ParisTech, Octobre 2015 - Janvier 2016. http://freakonometrics.hypotheses.org @freakonometrics 1 Surdispersion?

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Dossier / TD Econométrie Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Source : Greene "Econometric Analysis" Prentice Hall International, 4 ème édition, 2000 Council

Plus en détail

Analyse de variance à un facteur Tests d hypothèses Analyse de variance à deux facteurs. Analyse de la variance ANOVA

Analyse de variance à un facteur Tests d hypothèses Analyse de variance à deux facteurs. Analyse de la variance ANOVA Analyse de la variance ANOVA Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3 Exemple. Analyse

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

ANALYSE BAYESIENNE : QU EST-IL POSSIBLE DE FAIRE AVEC SAS?

ANALYSE BAYESIENNE : QU EST-IL POSSIBLE DE FAIRE AVEC SAS? ANALYSE BAYESIENNE : QU EST-IL POSSIBLE DE FAIRE AVEC SAS? L analyse bayésienne est une partie de la statistique moderne non paramétrique permettant d utiliser les probabilités conditionnelles et ainsi

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

Modèles de prévision Partie 2 - séries temporelles

Modèles de prévision Partie 2 - séries temporelles Modèles de prévision Partie 2 - séries temporelles Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 Plan du cours Motivation et introduction aux séries temporelles

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Modèles de prévision Partie 2 - séries temporelles # 2

Modèles de prévision Partie 2 - séries temporelles # 2 Modèles de prévision Partie 2 - séries temporelles # 2 Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Été 2014 Plan du cours Motivation et introduction aux séries temporelles

Plus en détail

Les variables indépendantes catégorielles

Les variables indépendantes catégorielles Les variables indépendantes catégorielles Jean-François Bickel Statistique II SP08 Jusqu à maintenant, nous avons considéré comme variables indépendantes uniquement des variables intervalles (âge) ou traitées

Plus en détail

Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure

Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure Marie Verbanck Laboratoire de Mathématiques Appliquées, Agrocampus OUEST Soutenance de thèse - 4 septembre

Plus en détail

Application des modèles linéaires généralisés mixtes à un problème forestier

Application des modèles linéaires généralisés mixtes à un problème forestier Application des modèles linéaires généralisés mixtes à un problème forestier Présenté par Oumar Samba LY Sous la direction de Christian GENEST Et la codirection de Michèle BERNIER-CARDOU REMERCIEMENTS

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

TD2 Gestion de la relation clientèle

TD2 Gestion de la relation clientèle TD2 Gestion de la relation clientèle Prof. Christophe Sempels Contexte Année 1980 27 modèles de voitures analysés Caractéristiques spécifiées : CV, prix, cylindrée, puissance, vitesse, longueur, prime

Plus en détail

ANTICOSTI SEPT-ÎLES / SEVEN ISLANDS. Sept-Îles / Seven Islands. Gaspé. Îles-de-la-Madeleine / Magdalen Islands

ANTICOSTI SEPT-ÎLES / SEVEN ISLANDS. Sept-Îles / Seven Islands. Gaspé. Îles-de-la-Madeleine / Magdalen Islands Annexe 1. Zones de gestion de la pêche à la crevette dans l estuaire et le golfe du Saint- Laurent. Appendix 1. Shrimp fishery management areas of the Estuary and Gulf of St. Lawrence. ESTUAIRE / ESTUARY

Plus en détail

Initiation à l'analyse statistique des données PASEC sous le logiciel STATA

Initiation à l'analyse statistique des données PASEC sous le logiciel STATA Initiation à l'analyse statistique des données PASEC sous le logiciel STATA Introduction Ce document est un support de formation pour un atelier d'une durée de 4 jours réalisé lors de l'atelier international

Plus en détail

Méthode de prise en compte de la consanguinité dans un modèle simple de simulation de performances

Méthode de prise en compte de la consanguinité dans un modèle simple de simulation de performances Méthode de prise en compte de la consanguinité dans un modèle simple de simulation de performances J.-L. Foulley, C. Chevalet To cite this version: J.-L. Foulley, C. Chevalet. Méthode de prise en compte

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MOBILE Gaël Crochet 1 & Gilles Santini 2 1 Médiamétrie, 70 rue Rivay, 92532 Levallois-Perret, France, gcrochet@mediametrie.fr 2 Vintco SARL, 8 rue Jean

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Les données manquantes en statistique

Les données manquantes en statistique Les données manquantes en statistique N. MEYER Laboratoire de Biostatistique -Faculté de Médecine Dép. Santé Publique CHU - STRASBOURG Séminaire de Statistique - 7 novembre 2006 Les données manquantes

Plus en détail

Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional

Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional Enseignant : As. Pr. Marie-Noelle Duquenne I. Les Méthodes factorielles La question traitée dans ce document porte

Plus en détail

BIG Data et R: opportunités et perspectives

BIG Data et R: opportunités et perspectives BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,

Plus en détail

Contrôle sur machine (avec solution)

Contrôle sur machine (avec solution) DEA Analyse et Modélisation des Systèmes Biologiques Introduction au logiciel R - 2000/2001 Contrôle sur machine (avec solution) D. Chessel & J. Thioulouse 1. Questions Récupérer les fichiers wormshab.txt,

Plus en détail

Les échanges bilatéraux entre les nations : Une approche linéaire mixte des modèles gravitationnels* Kamel Ghaddab 1

Les échanges bilatéraux entre les nations : Une approche linéaire mixte des modèles gravitationnels* Kamel Ghaddab 1 Les échanges bilatéraux entre les nations : Une approche linéaire mixte des modèles gravitationnels* Kamel Ghaddab 1 Ahmed Silem 2 Introduction Dans le cadre de la détermination empirique de la composition

Plus en détail

Analyses statistiques avec

Analyses statistiques avec Analyses statistiques avec Introduction et éléments de base M. Bailly-Bechet, adapté de J. R. Lobry, adapté de Deepayan Sarkar Biostatistiques & Bioinformatique (L2) Table des matières Premiers pas en

Plus en détail

Imputation du salaire d ego dans TeO

Imputation du salaire d ego dans TeO Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

3 e Atelier des Étudiants Gradués en Actuariat et Mathématiques Financières. 3 rd Graduate Students Workshop on Actuarial and Financial Mathematics

3 e Atelier des Étudiants Gradués en Actuariat et Mathématiques Financières. 3 rd Graduate Students Workshop on Actuarial and Financial Mathematics 3 e Atelier des Étudiants Gradués en Actuariat et Mathématiques Financières 3 rd Graduate Students Workshop on Actuarial and Financial Mathematics Résumé-Abstracts Organization: Ghislain Léveillé Co-organization:

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Exemple 3.4 : Modélisation MCO incluant plusieurs variables explicatives quantitatives (reprise de l étude du jugement des enseignants)

Exemple 3.4 : Modélisation MCO incluant plusieurs variables explicatives quantitatives (reprise de l étude du jugement des enseignants) Exemple 3.4 : Modélisation MCO incluant plusieurs variables explicatives quantitatives (reprise de l étude du jugement des enseignants) GET FILE='C:\Users \Desktop\donnees stats\jugement.sav'. Indique

Plus en détail

Analyse de variance à 2 facteurs imbriqués sur données de comptage - Application au contrôle de

Analyse de variance à 2 facteurs imbriqués sur données de comptage - Application au contrôle de Analyse de variance à 2 facteurs imbriqués sur données de comptage - Application au contrôle de qualité Florence Loingeville 1,2,3, Julien Jacques 1,2, Cristian Preda 1,2, Philippe Guarini 3 & Olivier

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,

Plus en détail

Projetde SériesTemporelles

Projetde SériesTemporelles COMMUNAUTE ECONOMIQU E ET MONETAIRE DE L AFRIQUE CENTRALE (CEMAC) INSTITUT SOUS REGIONAL DE STATISTIQUES ET D ECONOMIE APPLIQUEE (ISSEA) Projetde SériesTemporelles MODELISATION DE LA RENTABILITE DE L INDICE

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

UNIVERSITE PARIS VIII ECOLE DOCTORALE COGNITION, LANGAGE, INTERACTION. Thèse de Doctorat en psychologie clinique et psychopathologie

UNIVERSITE PARIS VIII ECOLE DOCTORALE COGNITION, LANGAGE, INTERACTION. Thèse de Doctorat en psychologie clinique et psychopathologie UNIVERSITE PARIS VIII ECOLE DOCTORALE COGNITION, LANGAGE, INTERACTION Thèse de Doctorat en psychologie clinique et psychopathologie Présentée et soutenue publiquement par Rébecca Shankland Née le 9 août

Plus en détail

Contribution à la conception par la simulation en électronique de puissance : application à l onduleur basse tension

Contribution à la conception par la simulation en électronique de puissance : application à l onduleur basse tension Contribution à la conception par la simulation en électronique de puissance : application à l onduleur basse tension Cyril BUTTAY CEGELY VALEO 30 novembre 2004 Cyril BUTTAY Contribution à la conception

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

Calibration de systèmes de levé mobiles

Calibration de systèmes de levé mobiles 1/30 Calibration de systèmes de levé mobiles S. Levilly, N. Seube ENSTA Bretagne Brest, FRANCE et CIDCO Rimouski Qc, CANADA Journées AFHy, Juin 2014 Les systèmes mobiles Ils sont généralement constitués

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

TD 4 : HEC 2001 épreuve II

TD 4 : HEC 2001 épreuve II TD 4 : HEC 200 épreuve II Dans tout le problème, n désigne un entier supérieur ou égal à 2 On dispose de n jetons numérotés de à n On tire, au hasard et sans remise, les jetons un à un La suite (a, a 2,,

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

MAT7381 Chapitre 7 Comparaisons multiples

MAT7381 Chapitre 7 Comparaisons multiples MAT7381 Chapitre 7 Comparaisons multiples Supposons qu'on veuille tester plusieurs hypothèses, H 1 ;... ; H k. Si on effectue un test pour chacune des hypothèses, chacun au niveau, la conclusion finale

Plus en détail

avec Multivariate Adaptative Regression Splines Bernard CLÉMENT, PhD Copyright Génistat Conseils Inc., 2014, Montréal, Canada

avec Multivariate Adaptative Regression Splines Bernard CLÉMENT, PhD Copyright Génistat Conseils Inc., 2014, Montréal, Canada avec Multivariate Adaptative Regression Splines Bernard CLÉMENT, PhD 1 Data Mining DÉFINITIONS du DATA MINING fouille de données, extraction de connaissances KDD = Knowledge Data Discovery est un nouveau

Plus en détail

La mutualisation des fonctions supports

La mutualisation des fonctions supports La mutualisation des fonctions supports Rappel des objectifs des expérimentations de mutualisation Expérimenter un traitement mutualisé de l assistance technique à la gestion du SNV2, des achats, de la

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Chapitre 1. Risque et assurance. Arthur Charpentier. 1.1 Prise en compte de la dynamique en assurance

Chapitre 1. Risque et assurance. Arthur Charpentier. 1.1 Prise en compte de la dynamique en assurance Chapitre 1 Risque et assurance Arthur Charpentier Dans ce chapitre, nous allons présenter quelques modèles utilisés par les assureurs afin de quantifier les risques pris. Nous insisterons sur deux risques

Plus en détail

Mémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des

Plus en détail