Les modèles d équations structurelles à variables latentes Applications et exercices



Documents pareils
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Logiciel XLSTAT version rue Damrémont PARIS

données en connaissance et en actions?

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

IBM SPSS Regression 21

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Introduction à l approche bootstrap

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

1 Complément sur la projection du nuage des individus

TABLE DES MATIERES. C Exercices complémentaires 42

Découvrez le portefeuille de produits IBM SPSS

Relation entre deux variables : estimation de la corrélation linéaire

Exemple PLS avec SAS

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Continuité et dérivabilité d une fonction

Outils pour les réseaux de neurones et contenu du CD-Rom

Limites finies en un point

Complet Intuitif Efficace. Références

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

INTRODUCTION AU DATA MINING

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Équations non linéaires

Théorème du point fixe - Théorème de l inversion locale

«Cours Statistique et logiciel R»

aux différences est appelé équation aux différences d ordre n en forme normale.

Probabilités Loi binomiale Exercices corrigés

SPHINX Logiciel de dépouillement d enquêtes

Traitement des données avec Microsoft EXCEL 2010

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

MODELE A CORRECTION D ERREUR ET APPLICATIONS

LE PROCESSUS ( la machine) la fonction f. ( On lit : «fonction f qui à x associe f (x)» )

Filtrage stochastique non linéaire par la théorie de représentation des martingales

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Évaluation de la régression bornée

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Correction du baccalauréat ES/L Métropole 20 juin 2014

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Sites web éducatifs et ressources en mathématiques

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Cycle de formation certifiante Sphinx

1 Modélisation d être mauvais payeur

Chapitre 6. Fonction réelle d une variable réelle

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

DIOGENE. Un logiciel de Génétique & Amélioration des Plantes

Guide de l utilisateur du Système central IBM SPSS Statistics 20

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Programmation Linéaire - Cours 1

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Analyse prédictive. L essor et la valeur de l analyse prédictive dans la prise de décisions

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Résolution d équations non linéaires

Master MPS LE MANAGEMENT DE LA QUALITÉ DANS LES SERVICES N 2 MURIEL JOUGLEUX 2014/2015

Critères de validation des modèles internes en assurance vie :

R01 Import de données

Nombre dérivé et tangente

Arbres binaires de décision

Cinq impératifs prédictifs pour maximiser la valeur client Utilisation des analyses prédictives pour améliorer la gestion de la relation client

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

PROBABILITES ET STATISTIQUE I&II

Table des matières. I Mise à niveau 11. Préface

STATISTIQUES. UE Modélisation pour la biologie

satisfaction client Relation client : satisfaction? fidélisation?

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

Formation au logiciel SAS Statistical Analysis System

FONCTION EXPONENTIELLE ( ) 2 = 0.

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Tableaux de bord de gestion du risque Rapport d audit permanent

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Tâche complexe produite par l académie de Clermont-Ferrand. Mai 2012 LE TIR A L ARC. (d après une idée du collège des Portes du Midi de Maurs)

Optimisation, traitement d image et éclipse de Soleil

Gestion obligataire passive

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Séminaire CRM Les directions de recherche et les perspectives du Customer Relationship Management 1

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Lagrange, où λ 1 est pour la contrainte sur µ p ).

Document d accompagnement. de la 1 re à la 8 e année. Exemples de tâches et corrigés. 1 re année Tâche Corrigé... 7 Tâche Corrigé...

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Cours d Analyse. Fonctions de plusieurs variables

VIPE CNAM 6 mars Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

MRK A : Méthodes d Analyse de Données en Marketing Automne 2010

SAN07 IBM Social Media Analytics:

Interception des signaux issus de communications MIMO

Exercices Corrigés Premières notions sur les espaces vectoriels

MODERATOR EFFECT OF CONGRUENCE ON THE TRANSFER IMAGE: THE CASE OF PARTICIPATION SPONSORSHIP AND CREATION SPONSORSHIP

BONUS MALUS. Voici, la façon de calculer la prime : Le montant de la prime à acquitter est égale à : P = PB. C où : P

L'analyse des données à l usage des non mathématiciens

Développements limités, équivalents et calculs de limites

Extraction d informations stratégiques par Analyse en Composantes Principales

Apprentissage Automatique

Transcription:

Les modèles d équations structurelles à variables latentes Applications et eercices Emmanuel Jakobowicz Addinsoft XLSTAT 30 mars 2011 Cours de Statistique Multivariée Approfondie 1

Le modèle structurel δ 11 11 y 31 ε 31 δ 12 12 ξ 1 ζ 3 y 32 ε 32 δ 13 13 η 3 y 33 ε 33 y 34 ε 21 y 21 ε 34 η 2 y 35 ε 35 ε 22 y 22 ζ 2 y 36 ε 36 Eq. du modèle structurel Eq. du modèle de mesure Cours de Statistique Multivariée Approfondie 2

Démonstration: La méthode LISREL Nous utiliserons les logiciels AMOS (aujourd hui SPSS) et LISREL Ce sont les 2 principau logiciels de traitement de la méthode LISREL Nous utiliserons un modèle très simple (3 Variables Latentes et 9 Variables Manifestes) AMOS 19.0 est disponible avec IBM SPSS. LISREL 8.8 est disponible à l essai 15 jours ou il eiste une version étudiants gratuite avec une limite dans le taille du modèle www.ssicentral.com/lisrel/downloads.html Cours de Statistique Multivariée Approfondie 3

Le modèle V1 V2 V3 L1 L3 V7 V8 V9 L2 V4 V5 V6 Cours de Statistique Multivariée Approfondie 4

AMOS: Les étapes Étapes dans l étude d un modèle structurel avec Amos Graphics: 1. Obtenir un jeu de données sans données manquantes avec si possible des données multinormales 2. Vérifier l unidimensionnalité des blocs de variables 3. Charger les données (Files Data Files ) 4. Dessiner le modèle LISREL avec les variables latentes (ellipses), les variables manifestes (rectangles) et les erreurs de mesure (cercles) 5. Modifier les paramètres d estimation si nécessaire (View/Set Analysis Propreties ) 6. Estimer le modèle en utilisant la commande (Model Fit Calculate Estimates) 7. Étudier les coefficients obtenus sur le modèle et les tableau de sortie dans (View/Set Table output) Cours de Statistique Multivariée Approfondie 5

LISREL: Les étapes Étapes dans l étude d un modèle structurel avec LISREL: 1. Obtenir un jeu de données avec si possible des données multinormales 2. Compléter les données manquantes et obtenir la matrice de covariance (*.cov) ou les données en format (*.psf) grâce au logiciel PRELIS intégré dans LISREL 3. Vérifier l unidimensionnalité des blocs de variables 4. Paramétriser le modèle LISREL en utilisant le langage SIMPLIS 5. Donner les paramètres d estimation si nécessaire 6. Estimer le modèle en utilisant la commande L 7. Étudier les coefficients obtenus sur le modèle et les tableau de sortie (transformation possible en LaTEX) Cours de Statistique Multivariée Approfondie 6

LISREL: Eemple de commande Analyse de la structure de covariance du modèle à 3 variables manifestes Observed Variables V1 V2 V3 V4 V5 V6 V7 V8 V9 Définition des variables manifestes Raw data from file \eemple.psf' Sample Size = 1000 Latent Variables L1 L2 L3 Définition du fichier de données Définition des variables latentes Relationships V1 V2 V3= L1 V4 V5 V6= L2 V7 V8 V9 = L3 L2 = L1 L3 = L1 L2 Path Diagram End of Problem Relations du modèle de mesure Relations du modèle interne Affichage du modèle graphique Cours de Statistique Multivariée Approfondie 7

LISREL: Eemple de sortie Cours de Statistique Multivariée Approfondie 8

Les données manquantes en LISREL Délétion par listes, Délétion par paires, Imputation de la moyenne, Imputation multiple par algorithme EM (Epectation Maimization) Une méthode spécifique: Full Information Maimum Likelihood Méthode prenant en compte uniquement les données disponibles sans mécanisme de complétion dans le calcul de la matrice de covariance. Cette méthode maimise la vraisemblance casewise des données observées. C est la méthode qui obtient en général les meilleurs résultats en terme de biais des estimations. Cours de Statistique Multivariée Approfondie 9

Démonstration: L approche PLS Nous utiliserons le logiciel XLSTAT 2011 Nous utiliserons les données de Russett du dernier cours (Instabilité Politique) XLSTAT est disponible à l essai durant 30 jours sur www.lstat.com. Le module PLSPM est le plus abouti du marché en terme d application de l approche PLS. Cours de Statistique Multivariée Approfondie 10

Le modèle Inégalité agricole (ξ 1 ) GINI FARM RENT GNPR LABO + + + + ξ 1 ξ 2 + ξ 3 + ++ + + INST ECKS DEAT D STB D INS DICT Développement industriel (ξ 2 ) Instabilité politique (ξ 3 ) Cours de Statistique Multivariée Approfondie 11

XLSTAT PLSPM: Les étapes Étapes dans l étude d un modèle structurel avec XLSTAT PLSPM : 1. Ouvrir les données dans Ecel. 2. Charger le logiciel. 3. Créer un nouveau projet PLSPM. 4. Copier les données dans la feuille D1. 5. Dessiner le modèle PLS avec les variables latentes (ellipses) dans la feuille PLSPMGraph. 6. Cliquer sur les variables latentes et sélectionner les variables manifestes à partir des données. 7. Lancer les calculs. 8. Étudier les sorties dans la feuille PLSPM générée. Cours de Statistique Multivariée Approfondie 12

XLSTAT PLSPM : La standardisation des VM Plusieurs méthodes de standardisation des variables manifestes eistent: Cours de Statistique Multivariée Approfondie 13

XLSTAT PLSPM : Les sorties Cours de Statistique Multivariée Approfondie 14

Étude du petit questionnaire distribué Image Satisfaction Engagement Variables de groupe Cours de Statistique Multivariée Approfondie 15

Étude du petit questionnaire distribué Image générale Perception autour de vous Qualité de formation Utilité de formation Image du Cnam Satisfaction des auditeurs Engagement des auditeurs Parrainage Réinscription Cours de Statistique Multivariée Approfondie 16

Étude du petit questionnaire distribué Aucune identification n est possible avec la méthode LISREL En raison de la faible taille de l échantillon. Avec l approche PLS, l algorithme converge et on peut ainsi analyser les résultats. Cours de Statistique Multivariée Approfondie 17

Étude du petit questionnaire distribué 2010 2011 N = 26 Cours de Statistique Multivariée Approfondie 18

Étude du petit questionnaire distribué 2009 2010 N = 17 Cours de Statistique Multivariée Approfondie 19

Étude du petit questionnaire distribué 2007 2008 N = 19 Cours de Statistique Multivariée Approfondie 20

Étude du petit questionnaire distribué 2006 2007 N = 20 Cours de Statistique Multivariée Approfondie 21

Étude du petit questionnaire distribué 2005 2006 N = 24 Cours de Statistique Multivariée Approfondie 22

Étude du petit questionnaire distribué L utilisation de méthodes de bootstrap nous permettent d obtenir des intervalles de confiance. Ainsi, en 2010 2011, mise à part la relation image fidélité, les autres relations sont significatives. Les R 2 pour 2010 2011 sont très bas, les résultats sont peu significatifs. Il y a de faibles différences entre 2010 et les 4 années précédentes. Ces résultats montre une forte influence de la satisfaction sur l engagement des auditeurs. L image du CNAM a une influence non significative sur l engagement. Ces résultats nous permettent de conseiller au CNAM d améliorer la qualité de ces formations afin d obtenir plus de nouveau inscrits. Comment améliorer ces résultats: augmenter la taille de l échantillon, ajouter des variables manifestes afin d améliorer le modèle de mesure. Cours de Statistique Multivariée Approfondie 23

Quelques problèmes associés au modèles d équations structurelles à variables latentes Résultats des eercies distribués Cours de Statistique Multivariée Approfondie 24

Modélisation graphique LISREL 1 ξ = 0, 7ξ + 0,3 1 1 = 0, 4ξ + 0,5 2 1 = 0,7ξ + 0, 2 3 2 = 0,5ξ + 0,1 4 2 = 0,6ξ + 0, 4 2 1 δ 1 δ 2 ε 3 ε 4 0,3 0,5 0,2 1 2 3 0,7 0,4 0,7 ξ 1 ξ 2 0,6 0,1 4 0,4 0,5 ζ 2 Cours de Statistique Multivariée Approfondie 25

Modélisation graphique LISREL 2 δ 1 δ 2 ε 3 ε 4 1 2 3 4 ξ 1 ξ 2 ζ 2 ζ 3 1 1 1 1 5 ξ 3 6 7 ξ 4 8 ζ 4 ε 5 ε 6 ε 7 ε 8... = π ξ + δ = πξ+ δ 2 2 1 2 = πξ + ε 3 3 2 3 = πξ + ε 4 4 2 4 = πξ + ε 5 5 3 5 ξ = β ξ + β ξ + ζ 2 12 1 32 3 2 ξ = β ξ + ζ 3 13 1 3 ξ = β ξ + β ξ + β ξ + ζ 4 14 1 24 2 34 3 4 Cours de Statistique Multivariée Approfondie 26

Modélisation graphique PLS 1 = 0, 7ξ + 0,3 1 1 = 0, 4ξ + 0,5 2 1 = 0,7ξ + 0, 2 3 2 = 0,5ξ + 0,1 4 2 = 0, 4ξ + 0, 2 5 3 = 0,3ξ + 0,3 6 3 ξ = 0, 2ξ + 0, 4 2 1 ξ = 0,6ξ + 0, 4ξ + 0,1 3 1 2 1 2 3 4 0,7 0,4 0,7 0,5 ξ 1 ξ 2 0,6 0,4 0,2 ξ 5 3 0,3 0,4 6 Cours de Statistique Multivariée Approfondie 27

Modélisation graphique PLS 2 ξ = 0,7 + 0,3 + 0,6 + 0, 4 1 1 3 4 ξ = 0, 4 + 0,5 + 0,3 + 0,1 2 2 5 6 ξ = 0,7 + 0, 2 + 0, 2 3 7 8 ξ = 0,5 + 0,1 + 0,1 4 9 10 ξ = 0, 2ξ + 0,1 2 1 ξ = 0,6ξ + 0, 4ξ + 0, 2ξ + 0,1 4 1 2 3 1 3 2 5 0,7 0,3 4 0,6 0,4 0,5 6 0,3 ξ 1 ξ 2 0,2 0,4 0,6 0,7 ξ 7 3 0,2 0,2 8 0,5 ξ 9 4 0,1 10 Cours de Statistique Multivariée Approfondie 28

Quelques problèmes associés au modèles d équations structurelles à variables latentes Cours de Statistique Multivariée Approfondie 29

Quelques problèmes associés au modèles d équations structurelles à variables latentes Cas1 Analyse sensorielle Une solution possible serait la suivante: Caractéristiques Bloc 1 Juges bloc 1 Caractéristiques Bloc 2 Juges bloc 2 Caractéristiques Bloc 3 Juges bloc 3 avec l approche PLS et certaines variables formatives et d autres réflectives Cours de Statistique Multivariée Approfondie 30

Quelques problèmes associés au modèles d équations structurelles à variables latentes Cas 2 Satisfaction R 2 =.243 Customer Epectation.493 (.000).066 (.314) Image.037 (.406).153 (.006).212 (.002).466 (.000) R 2 =.432 Loyalty Les valeurs entre parenthèses sont les p valeurs (le poids associé est significatif si la p valeur<0,05).545 (.000) Perceived quality.540 (.000) Perceived value.544 (.000).200 (.000) Customer satisfaction R 2 =.335 R 2 =.672.540 (.000).05 (.399) Complaint R 2 =.297 R 2 =.292 Le principal levier de la fidélité (loyalty) est la satisfaction des clients. Il faudra donc appuyer sur cette satisfaction et sur la qualité perçue qui est le principal levier de la satisfaction. Cours de Statistique Multivariée Approfondie 31

Quelques problèmes associés au modèles d équations structurelles à variables latentes Cas 3 Ce modèle est bien défini et chaque coefficient est significatif, ainsi chaque relation peut être étudiée. On se rend compte que l utilisation de l ordinateur a un effet négatif sur l attitude face à l ordinateur alors qu elle a un effet positif sur la confiance. D autres remarques simples peuvent être faites en lisant le modèle. Cours de Statistique Multivariée Approfondie 32

Orienté vers la prédiction des variables manifestes et latentes (basé sur la variance) Modèle eterne réflectif et formatif Sans distribution Les observations peuvent être dépendantes Chaque VL est une combinaison linéaire de ces propres VM Consistance au sens large Prédiction optimale Évaluation de la qualité de prévision par jackknife (Q 2 ) Meilleur modèle de mesure car les VL sont estimées dans l espace de leur propres VM Rappel: PLS vs LISREL PLS est lié à LISREL de la même façon que l ACP à l analyse factorielle Orienté vers l estimation des paramètres (basé sur la covariance) Modèle eterne réflectif Hypothèses de distribution Les observations doivent être indépendantes Les facteur ne sont pas estimés L estimation des VL est faite sur l ensemble des VM Estimations consistantes Paramètres optimau Évaluation du modèle par tests d hypothèse (N doit être grand) Meilleur modèle structurel car les VL sont estimées sans restriction d espace Cours de Statistique Multivariée Approfondie 33