Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple

Dimension: px
Commencer à balayer dès la page:

Download "Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple"

Transcription

1 Analyse simultanée de variables quantitatives et qualitatives à l aide de l analyse factorielle multiple Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus France

2 Analyse Factorielle Multiple (AFM) Un ensemble d individus décrit par plusieurs groupes de variables Exposé en deux étapes ) Un groupe de variables incluant à la fois des variables quantitatives et qualitatives 2) Plusieurs groupes de variables, quantitatives, qualitatives ou des deux types (données mixtes) 2

3 Données K variables quantitatives (centrées réduites) Q variables qualitatives k K q Q Individus i x ik x iq I 3

4 Données K variables quantitatives (centrées réduites) Q variables qualitatives =K 2 indicatrices (codage disjonctif complet) q Q k q K 2 k K k q K q Individus i x ik x ikq I 4

5 Objectifs Mettre en œuvre une analyse factorielle dans laquelle les deux types de variables jouent un rôle actif Solution classique Diviser l intervalle de variation des variables quantitatives Coder les variables quantitatives en qualitatives Mettre en œuvre une Analyse des Correspondances Multiples (ACM) Benzécri J.-P., Cazes P., Lebart L., etc. Excellente solution en pratique Deux cas «limite» I petit Q <<K 5

6 Autres solutions, moins connues Introduction de variables quantitatives en ACM Via un codage particulier B. Escofier CAD 979 (PUR 2003) Introduction d indicatrices dans une ACP via une métrique particulière G. Saporta in Revue Soc. ital. de stat. 990 AFM de données mixtes B. Escofier & J. Pagès (Dunod ) J. Pagès RSA 2002 idée : une variable = un groupe Abascal E. et al. Carme

7 Représentation des variables dans R I Variables quantitatives en ACP normée R I k O 7

8 Représentation des variables dans R I Variables qualitatives en ACM R I E q O E q sous-espace engendré par les indicatrices de la variable q L inertie des indicatrices de la variable q est égale à dans toutes les directions de E q 8

9 Critère Cas de l ACP normée R I k 2 cos θ kv r 2 ( k, v) k k v O θ kv 9

10 Critère Cas de l ACM R I q 2 cos θ qv η 2 ( qv, ) q v E q O θ qv 0

11 Méthode proposée par B. Escofier (979) Critère R I k cos θ + cos 2 2 kv q θ qv k v E q θ kv O θ qv

12 Méthode proposée par B. Escofier (979) En pratique Les variables quantitatives sont codées par deux colonnes et juxtaposées au tableau disjonctif complet L ensemble est traité par ACM K variables quantitatives (centrées réduites) Q variables qualitatives = K 2 indicatrices (codage disjonctif complet) q Q k K k q k q K q K 2 i I x ik + x ik 2 2 x ik q 2

13 Méthode proposée par G. Saporta (990) Critère k 2 2 r k v + η q v (, ) (, ) q En pratique Les indicatrices sont juxtaposées aux variables quantitatives L ensemble est traité par une ACP avec une métrique particulière Même méthode vue dans le cadre de l ACM (B. Escofier) dans le cadre de l ACP (G. Saporta) Analyse factorielle de données mixtes (AFDM) 3

14 AFDM à l aide d une ACP Codage des indicatrices pour garder, en ACP, leurs propriétés en ACM Q variables qualitatives = K 2 indicatrices q i k q K k q K q x ik p q k q I p kq fréquence de la modalité k de la variable q 4

15 Représentations fournies par l AFDM F2 F2 k individu modalité k 3 i2 i F C A B F k 2 5

16 AFM appliquée à plusieurs groupes de variables : quantitatifs, qualitatifs ou mixtes J groupes quantitatifs J 2 groupes qualitatifs (codage disjonctif complet) Groupes j J j J 2 Var. kk j q Q j k K q Ind. i x ik x ik I 6

17 Données : exemple Perception de 5 outils pédagogiques par des étudiants Cours en ligne : Livres ) texte 4) cours 2) animations 5) exercices 3) film sur logiciels Chaque outil est noté par chaque étudiant sur une échelle en 5 points de = inutile à 5 = très utile Tableau : 25 étudiants x 5 outils avec x ik la note donnée par l étudiant i à l outil k Analyse exploratoire Les variables peuvent être considérées comme quantitatives (ACP) ou qualitatives (ACM) Double objectif Comparaison ACP - ACM Introduction des deux points de vue dans une analyse unique 7

18 Données : exemple 5 outils = variables quantitatives (centrées-réduites) 5 outils = 25 indicatrices (codage disjonctif complet) q 5 k 25 k 5 k 5 Individus i x ik x ik I 8

19 Pondération des groupes de variables Plusieurs groupes de variables actives dans une analyse unique Question Comment équilibrer leur influence? 9

20 Pondération des groupes de variables Exemple de référence : deux groupes de variables quantitatives R I groupe : 2 var. groupe 2 : 3 var. 20

21 Pondération des groupes de variables ACP des 5 variables, sans considérer les groupes R I ère composante principale Groupe : 2 var. Groupe 2 : 3 var. 2

22 Exemple de référence Pondération des groupes dans l AFM Equilibrer l inertie axiale maximum R I.5.5 Groupe : 2 var. Groupe 2 : 3 var. Chaque variable du groupe j est pondérée par /λ j λ j : ère valeur propre de l ACP séparée du groupe j. 22

23 Le cœur de l AFM est une analyse factorielle de tous les groupes actifs Les groupes de variables peuvent être : quantitatifs (centrés-réduits ou non) qualitatifs mixtes Critère (cas de 2 groupes : K variables quantitatives + Q 2 variables qualitatives) r ( k, v) + η ( q, v) λ k K λq 2 q Q 2 Equivalences en AFM quand chaque groupe contient une seule variable Variables quantitatives Variables qualitatives Données mixtes ACP normée ACM AFDM 23

24 Le cœur de l AFM est une analyse factorielle de tous les groupes actifs L AFM fournit : ) : les résultats classiques de l analyse factorielle Soit, pour chaque axe : Coordonnées, contributions et Cos² des individus Coefficient de corrélation entre facteurs et variables continues Coordonnées des modalités (au barycentre de leurs individus) F2 F2 k individu modalité k 3 i2 i F C A B F k 2 24

25 Valeurs propres des analyses séparées F F2 F3 F4 F5 MCA 0,637 0,67 0,454 0,48 0,369 PCA 2,837,870 0,48 0,08 0,063 Valeurs propres des analyses séparées (% cumulés) F F2 F3 F4 F5 MCA 5,92 3,33 42,68 53,2 62,35 PCA 56,75 94,6 97,2 98,74 00,00 Décomposition de l inertie dans l AFM F F2 F3 F4 F5 MFA,942,455 0,826 0,694 0,62 24,4% 8,09% 0,27% 8,63% 7,6% MCA 0,950 0,864 0,78 0,689 0,597 PCA 0,992 0,59 0,045 0,005 0,05 25

26 F % Les 25 étudiants 2 i2 i3 i4 i5 i8 i9 i3 i5 i4 i6i7 i9 0 i i20 F % i0 i8 i2 - i22 i7 i24 i25 i23-2 i6 i i

27 F % Films sur logiciels Animations F % Texte Livre d exercices Livre du cours 27

28 .50 F % 0.75 Lco Lex Fil3 Tex3 Ani3 Lex2 Lco2 0 Tex2 Ani2 Lex3 Films sur logiciels Lco3 Tex4 Fil4 Ani4 F % Texte Fil2 Fil Fil Tex animations Lco4 Livre cours Lex4 Livre exercices Ani5 Tex5 Ani -.50 Lco5 Lex

29 Axes des analyses séparées F % ACMF ACPF2 0.4 F % Films logiciels Animations ACPF Texte ACMF Livre exercices Livre cours 29

30 Représentation globale des groupes de variables j J i K K j K J i i j i J I R K i N I j R K j i j N I j R K J N I J i J N I j : nuage partiel (des individus ; associé au groupe j) 30

31 6. Représentation des groupe Etudier les ressemblances globales entre les N j i? R K R Kj N I j N I j R K J N I J i i j i J j J l I l I l I i W (i,l) i W j (i,l) i W J (i,l) I I I matrices des produits scalaires entre individus pour chaque groupe j Wj = X jx j 3

32 Données Produits scalaires K j l I i i x ik W j (i,l) I I R I R I² N K j W j N J 32

33 N J : nuage des groupes R I² W j N J Etudier le nuage N J Méthode de référence : STATIS (Escoufier Y., Lavit C.) Axes principaux de N J Interprétation de ces axes difficile 33

34 Etudier N J avec l AFM Données Produits scalaires K j l I i i x ik W j (i,l) I I R I R I² N K j W j w s v s N J w s : W associé à v s inertie de N K j projeté sur v s coordonnée de W j sur w s 34

35 Carré des liaisons Lg ( v, K j ) groupe K j K j quantitatif 0 0 Lg ( v, K j ) Lg v K = r k v 2 ( s, j) (, ) j s λ k K K j qualitatif Lg v K = q v 2 ( s, j) η (, ) j s λq 2 q Q 2 35

36 .00 F % 0.75 Livre cours (quali.) Livre exercices(quali.) Livre cours (quanti.) Livre exercices (quanti.) Group (ACM) Group 2 (ACP) 0.50 Texte (quali.) 0.25 Animations (quali.) Films logiciels (quali.) 0 Animations (quanti.) Films logiciels (quanti.) F % Texte (quanti.)

37 Conclusion L AFM est une méthode factorielle dédiée aux tableaux multiples dans lesquels Un groupe d individus est décrit par plusieurs groupes de variables Les groupes de variables peuvent être quantitatifs, qualitatifs ou mixtes Le cœur de la méthode est une analyse factorielle pondérée ; elle fonctionne comme une ACP pour les variables quantitatives comme une ACM pour les variables qualitatives Elle fournit des résultats classiques de l analyse factorielle représentation des individus, des variables, etc. spécifiques de la structure des variables en groupes représentation des groupes, des axes des analyses séparées, etc. 37

38 Ces analyses sont disponibles dans Un package R dédié à l analyse exploratoire des données 38

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET EXEMPLE D APPLICATION Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus, 35042 Rennes cedex email : pages@agrorennes.educagri.fr Résumé

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

Analyse multidimensionnelle de données longitudinales

Analyse multidimensionnelle de données longitudinales Analyse multidimensionnelle de données longitudinales Ndèye Niang Conservatoire National des Arts et Métiers Plan Introduction Terminologie-Notations Méthodes directes Coefficient d association vectorielle

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 31 Quel type de données? L ACP s intéresse à des tableaux

Plus en détail

3. ACM Analyse des Correspondances Multiples

3. ACM Analyse des Correspondances Multiples 3. ACM Analyse des Correspondances Multiples Analyse des Correspondances Multiples - ACM 1 Plan 1. Exemples, problématique 2. Le tableau de données étudié 3. Principe d une ACM 4. L ajustement des deux

Plus en détail

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE Elisabeth Morand & Jérôme Pagès Agrocampus Rennes Laboratoire de mathématiques appliquées CS 425 3542 Rennes cedex Résumé Pour comparer deux nuages de points

Plus en détail

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité Introduction à l analyse des données Analyse des Données () Le but de l analyse de données est de synthétiser, structurer l information contenue dans des données multidimensionnelles Deux groupes de méthodes

Plus en détail

Analyse de données avec Complémentarité des méthodes d analyse factorielle et de classification

Analyse de données avec Complémentarité des méthodes d analyse factorielle et de classification Analyse de données avec Complémentarité des méthodes d analyse factorielle et de classification François Husson & Julie Josse Laboratoire de mathématiques appliquées Agrocampus Rennes husson@agrocampus-ouest.fr

Plus en détail

Analyse factorielle des correspondances de Benzécri

Analyse factorielle des correspondances de Benzécri Analyse factorielle des correspondances de Benzécri One Pager Décembre 2013 Vol. 8 Num. 011 Copyright Laréq 2013 http://www.lareq.com Analyse Factorielle des Correspondances de Benzécri Une illustration

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Plan du cours Analyse en Composantes Principales Introduction Les données Leurs représentations La méthode Modèle Interprétation statistique Espace principal Composantes Principales Représentations Graphiques

Plus en détail

Analyse de données avec R Complémentarité des méthodes d'analyse factorielle et de classification. 2 L'analyse de données avec R

Analyse de données avec R Complémentarité des méthodes d'analyse factorielle et de classification. 2 L'analyse de données avec R Analyse de données avec R Complémentarité des méthodes d'analyse factorielle et de classification François Husson, Julie Josse & Jérôme Pagès Laboratoire de mathématiques appliquées - 65 rue de St-Brieuc

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Université de Rennes 2 Statistiques des données M1-GEO Ouvrages recommandés Analyse en composantes principales Ces livres sont à la BU. Pour les acheter, venir au bureau A-240 ou envoyer un mail : nicolas.jegou@uhb.fr

Plus en détail

De nouvelles macros SAS d'analyse des données à l'insee : comment réaliser une analyse factorielle multiple

De nouvelles macros SAS d'analyse des données à l'insee : comment réaliser une analyse factorielle multiple De nouvelles macros SAS d'analyse des données à l'insee : comment réaliser une analyse factorielle multiple Brigitte Gelein (*), Olivier Sautory (**) (*) Insee Poitou-Charentes (**) Cepe - Insee L analyse

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE Plan du cours Qu est-ce que le data mining? À quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Une extension de l analyse factorielle multiple pour des groupes de variables mixtes : MFAmix

Une extension de l analyse factorielle multiple pour des groupes de variables mixtes : MFAmix Une extension de l analyse factorielle multiple pour des groupes de variables mixtes : MFAmix Amaury Labenne 1,2, Marie Chavent 2,3, Vanessa Kuentz-Simonet 1, Tina Rambonilaza 1 & Jérôme Saracco 2,3 1

Plus en détail

Analyse des Correspondances Multiples (ACM)

Analyse des Correspondances Multiples (ACM) Analyse des Correspondances Multiples (ACM) Compléments Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus, Rennes. 1 Analyse des Correspondances Multiples (ACM) 1. Données, notations 1:16

Plus en détail

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED SEMIN Analyses factorielles avec R Elisabeth MORAND INED SEMIN R du MNHN 10 Décembre 2009 E. Morand 10 Décembre 2009 INED 1 / 42 Part I Analyse en Composantes Principales : ACP 2 / 42 Sommaire 1 Introduction

Plus en détail

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC)

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC) L3 Géographie UE Méthodologie Statistiques COURS 1 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Analyse multivariée approfondie

Analyse multivariée approfondie Analyse multivariée approfondie Enseignants: NIANG N. et RUSSOLILLIO G. Maître de conférences Statistique Appliquée Laboratoire CEDRIC CNAM http://www.cnam.fr et d autres intervenants extérieurs au Cnam

Plus en détail

ANALYSE FACTORIELLE MULTIPLE DE DONNEES MIXTES :

ANALYSE FACTORIELLE MULTIPLE DE DONNEES MIXTES : ANALYSE FACTORIELLE MULTIPLE DE DONNEES MIXTES : APPLICATION A LA COMPARAISON DE DEUX CODAGES Jérôme Pagès & Sergio Camiz Laboratoire de mathématiques appliquées Agrocampus Rennes rue de Saint Brieuc CS

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

Une extension de l analyse factorielle multiple pour des groupes de variables mixtes : MFAmix

Une extension de l analyse factorielle multiple pour des groupes de variables mixtes : MFAmix Une extension de l analyse factorielle multiple pour des groupes de variables mixtes : MFAmix Amaury Labenne 1,2, Marie Chavent 2,3, Vanessa Kuentz-Simonet 1, Tina Rambonilaza 1 & Jérôme Saracco 2,3 1

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

Analyse factorielle multiple intra-tableaux. Application à l analyse simultanée de plusieurs questions ouvertes.

Analyse factorielle multiple intra-tableaux. Application à l analyse simultanée de plusieurs questions ouvertes. Analyse factorielle multiple intra-tableaux. Application à l analyse simultanée de plusieurs questions ouvertes. Mónica Bécue-Bertaut (1) et Jérôme Pagès (2) (1 ) Universitat Politècnica de Catalunya.

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

L analyse des correspondances et ses applications en recherche marketing. MONSUG mai 2015

L analyse des correspondances et ses applications en recherche marketing. MONSUG mai 2015 L analyse des correspondances et ses applications en recherche marketing MONSUG mai 2015 Contenu Mise en contexte et exemple d application L analyse des correspondances multiples (ACM) L ACM et la segmentation

Plus en détail

Tableaux multiples et données évolutives. N. Niang Keita Gilbert Saporta

Tableaux multiples et données évolutives. N. Niang Keita Gilbert Saporta Tableaux multiples et données évolutives N. Niang Keita niang@cnam.fr Gilbert Saporta gilbert.saporta@cnam.fr 1 2 Plan 1. Généralités 2. Double ACP 3. STATIS 4. AFM 3 1 Généralités Suite de tableaux individusxvariablesxtemps

Plus en détail

Analyse en Composantes. Principales

Analyse en Composantes. Principales AgroParisTech Analyse en Composantes Principales C Duby, S Robin Table des matières Introduction 3 2 Tableau de données 4 3 Choix d une distance 6 4 Choix de l origine 7 5 Moments d inertie 9 5 Inertie

Plus en détail

Analyse factorielle de données de catégorisation

Analyse factorielle de données de catégorisation Analyse factorielle de données de catégorisation Application aux données sensorielles Soutenance de thèse de Marine Cadoret Préparée au Laboratoire de mathématiques appliquées Agrocampus Ouest 30 août

Plus en détail

Séance 10 : Analyse factorielle des correspondances

Séance 10 : Analyse factorielle des correspondances Séance 10 : Analyse factorielle des correspondances Sommaire Proc CORRESP : Analyse de tableaux d effectifs... 2 Exemple 1 :... 6 L analyse en composantes principales traite des variables quantitatives.

Plus en détail

Illustration sur un exemple de diverses procédures graphiques et quantitatives.

Illustration sur un exemple de diverses procédures graphiques et quantitatives. Au-delà de l'analyse des correspondances multiples : Illustration sur un exemple de diverses procédures graphiques et quantitatives Yannick Savina Jean-Marc Bernard Laboratoire de Psychologie Environnementale

Plus en détail

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R? Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

Didacticiel - Études de cas

Didacticiel - Études de cas 1 Objectif Analyse factorielle des données mixtes Comparaison des logiciels Tanagra et R. Habituellement, on utilise l analyse en composantes principales (ACP) lorsque toutes les variables actives sont

Plus en détail

Introduction à l analyse des correspondances et à la classification

Introduction à l analyse des correspondances et à la classification Introduction à l analyse des correspondances et à la classification Bertrand Iooss Véronique Verrier EDF R&D Département Management des Risques Industriels Cours IUP SID Toulouse - M1-17/10/2011 14/10/2011

Plus en détail

Classification de variables qualitatives pour la compréhension de la prise en compte de l'environnement par les agriculteurs

Classification de variables qualitatives pour la compréhension de la prise en compte de l'environnement par les agriculteurs Classification de variables qualitatives pour la compréhension de la prise en compte de l'environnement par les agriculteurs Vanessa KUENTZ-SIMONET, Sandrine LYSER, Jacqueline CANDAU, Philippe DEUFFIC,

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

Laboratoire 2 Extraction des caractéristiques

Laboratoire 2 Extraction des caractéristiques Laboratoire 2 Extraction des caractéristiques L objectif de l extraction et de la sélection de caractéristiques est d identifier les caractéristiques importantes pour la discrimination entre classes. Après

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

Tableaux multiples et données évolutives

Tableaux multiples et données évolutives Tableaux multiples et données évolutives N. Niang Keita niang@cnam.fr Gilbert Saporta gilbert.saporta@cnam.fr mai 2011 1 Suite de tableaux individusxvariablesxtemps temps discret 1,2,.. t,... T «données

Plus en détail

Analyse des correspondances avec colonne de référence

Analyse des correspondances avec colonne de référence ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Analyse des données M1 Miage et SCA

Analyse des données M1 Miage et SCA Analyse des données M1 Miage et SCA Matthieu Barrandon, Marco Dozzi Février 2009 Matthieu Barrandon, Marco Dozzi () Février 2009 1 / 26 1. Analyse factorielle des correspondances L analyse factorielle

Plus en détail

TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM

TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM Emmanuel Rachelson and Matthieu Vignes 9 octobre 2013, SupAero - ISAE 1 Présidentielles 2008 - AFC Récupérer les données,

Plus en détail

Statistiques COURS 5. Salle 125. L3 Géographie UE Méthodologie. Intervenants : Année

Statistiques COURS 5. Salle 125. L3 Géographie UE Méthodologie. Intervenants : Année L3 Géographie UE Méthodologie Statistiques COURS 5 Salle 125 Intervenants : Nadège Martiny & Julien Crétat Année 2010-2011 2011 UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Analyse factorielle multiple avec R

Analyse factorielle multiple avec R Analyse factorielle multiple avec R Jérôme Pagès Analyse factorielle multiple avec R Jérôme Pagès Analyse factorielle multiple avec R ISBN : 978-2-7598-0963-9 c 2013, EDP Sciences, 17, avenue du Hoggar,

Plus en détail

Analyse des données - Logiciel R

Analyse des données - Logiciel R Université de Strasbourg Analyse des données Master de Sciences, Spécialité Statistique 2012/13 Master Actuariat Emmanuel Périnel Analyse des données - Logiciel R TP n 2. L Analyse en Composantes Principales

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Analyses statistiques multivariées. Béatrice de Tilière

Analyses statistiques multivariées. Béatrice de Tilière Analyses statistiques multivariées Béatrice de Tilière 23 novembre 2009 ii Table des matières 1 La Statistique 1 1.1 Généralités.................................. 1 1.2 Un peu de vocabulaire............................

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

Construction à partir d une régression logistique

Construction à partir d une régression logistique Construction à partir d une régression logistique Ricco RAKOTOMALALA Université Lumière Lyon 2 Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 1 PLAN 1. Position du problème Grille de score?

Plus en détail

Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc.

Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc. [Statomique] 15 mai 2012 Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc. D Laloë & B Salmi Analyses multivariées: - Analyse factorielle

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

L'AFC pour les nuls. Mise à jour du 21 janvier 2010. Dernière version des diapos disponible ici : analyse factorielle des composantes

L'AFC pour les nuls. Mise à jour du 21 janvier 2010. Dernière version des diapos disponible ici : analyse factorielle des composantes L'AFC pour les nuls Mise à jour du 21 janvier 2010 Dernière version des diapos disponible ici : analyse factorielle des composantes Source des images indiquées au-dessous ou en cliquant sur l image Cours

Plus en détail

Analyse Factorielle des Correspondances (AFC)

Analyse Factorielle des Correspondances (AFC) Analyse Factorielle des Correspondances (AFC) Jérôme Pagès (& François Husson) Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr / 43 Analyse Factorielle des Correspondances

Plus en détail

Session 1 durée 3 heures

Session 1 durée 3 heures Université de Nantes Mai 27 Master MIM Examen d'analyse de données Session durée 3 heures Les documents sont interdits. Les calculatrices sont autorisées. Exercice : - Etude d un tableau à l aide d une

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL LINF 2275 Stat. explor. multidim. 1 A.C.P.: Analyse en Composantes Principales Analyse de la structure de la matrice

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr LES TYPOLOGIES DE PARCOURS METHODES ET USAGES Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr 1 PLAN Première partie : un exemple traité «en vraie grandeur» : les 26500 jeunes

Plus en détail

Les macros SAS. d'analyse des données

Les macros SAS. d'analyse des données INSTITUT NATIONAL DE LA STATISTIQUE ET DES ÉTUDES ÉCONOMIQUES DIRECTION GÉNÉRALE 18, boulevard Adolphe Pinard - 75675 PARIS CEDEX 14 Les macros SAS d'analyse des données Document n F 9405 15 mars 1994

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Le programme de mathématiques Classes de première STI2D STL

Le programme de mathématiques Classes de première STI2D STL Journée de l inspection 15 avril 2011 - Lycée F. BUISSON 18 avril 2011 - Lycée J. ALGOUD 21 avril 2011 - Lycée L. ARMAND Le programme de mathématiques Classes de première STI2D STL Déroulement de la journée

Plus en détail

L ACP sous SPSS. À Propos de ce document. Introduction

L ACP sous SPSS. À Propos de ce document. Introduction L ACP sous SPSS À Propos de ce document... Introduction... La démarche à suivre sous SPSS.... «Descriptives».... «Extraction».... «Rotation».... «Scores».... «Options»... Analyse des résultats.... Les

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

L analyse en composantes principales

L analyse en composantes principales L analyse en composantes principales 1 La méthode 1 Les données, les objectifs de la méthode L Analyse en Composantes Principales (ACP) est la méthode adaptée à l exploration synthétique de l information

Plus en détail

Cours de terminale S Suites numériques

Cours de terminale S Suites numériques Cours de terminale S Suites numériques V. B. et S. B. Lycée des EK 13 septembre 2014 Introduction Principe de récurrence Exemple En Mathématiques, un certain nombre de propriétés dépendent d un entier

Plus en détail

Le Multidimensional Scaling et la cartographie des préférences

Le Multidimensional Scaling et la cartographie des préférences Le Multidimensional Scaling et la cartographie des préférences Gilbert Saporta Conservatoire National des Arts et Métiers http://cedric.cnam.fr/~saporta Avril 2014 Multidimensional scaling Egalement appelé

Plus en détail

R, Logiciel libre Présentation Importation Manipulation Description graphique Traitements automatiques. Découverte de

R, Logiciel libre Présentation Importation Manipulation Description graphique Traitements automatiques. Découverte de Découverte de David Causeur Laboratoire de Mathématiques Appliquées Agrocampus Ouest IRMAR CNRS UMR 6625 http://www.agrocampus-ouest.fr/math/causeur/ Plan du cours 1 R, Logiciel libre 2 Présentation 3

Plus en détail

Didacticiel - Études de cas. Mettre en œuvre l analyse des correspondances multiples (ACM) avec TANAGRA.

Didacticiel - Études de cas. Mettre en œuvre l analyse des correspondances multiples (ACM) avec TANAGRA. Objectif Mettre en œuvre l analyse des correspondances multiples (ACM) avec TANAGRA. L analyse des correspondances multiples (ou analyse factorielle des correspondances multiples AFCM) est une technique

Plus en détail

PLAN DE COURS Nº 1 FINANCE 1

PLAN DE COURS Nº 1 FINANCE 1 PLAN DE COURS Nº 1 FINANCE 1 (410-540-90) (2-1-3) Département de techniques et sciences administratives Professeur : Bureau : Tél. : Session : PRÉALABLE Le cours de comptabilité 2 (410-210-90) est préalable

Plus en détail

Installation de la librairie VISP et création du projet

Installation de la librairie VISP et création du projet ESIR3-IN Travaux Pratiques VO 2012-2013 PREAMBULE Copier les données des TPs 1. créez un répertoire VO dans votre homedir cd ~/ mkdir VO cd VO 2. copier le dossier contenant toutes les données pour les

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Sommaire. ISBN Presses universitaires de Rennes, 2013,

Sommaire. ISBN Presses universitaires de Rennes, 2013, Sommaire 1 Analyse en Composantes Principales (ACP) 1 1.1 Données - notations - exemples.................... 1 1.2 Objectifs................................. 2 1.2.1 Étude des individus......................

Plus en détail

REVUE DE STATISTIQUE APPLIQUÉE

REVUE DE STATISTIQUE APPLIQUÉE REVUE DE STATISTIQUE APPLIQUÉE J. PAGÈS Analyse factorielle multiple appliquée aux variables qualitatives et aux données mixtes Revue de statistique appliquée, tome 50, n o 4 (2002), p. 5-37

Plus en détail

Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching

Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching Joseph Gergaud 30 novembre 5 Exemples d application 1/ 25 1 Inertie Variables Individus Calculs 2 ACP Variables nominales supplémentaires

Plus en détail

1 Notion d espace vectoriel

1 Notion d espace vectoriel Arnaud de Saint Julien - MPSI Lycée La Merci 2014-2015 1 Résumé de cours sur les espaces vectoriels et les applications linéaires Les vecteurs du plan, les nombres réels, et les polynômes à coefficients

Plus en détail

Analyse des données et Data Mining

Analyse des données et Data Mining Analyse des données et Data Mining Analyse en composantes principales utc sy09 1 Objectif des méthodes factorielles Visualiser, traiter des données multidimensionnelles Problème difficile Information apportée

Plus en détail

CH1 : Introduction à l Analyse Des Données (ADD) B- Les données et leurs caractéristiques C- Grandeurs associées aux données

CH1 : Introduction à l Analyse Des Données (ADD) B- Les données et leurs caractéristiques C- Grandeurs associées aux données CH1 : Introduction à l Analyse Des Données (ADD) A- Introduction A- Introduction B- Les données et leurs caractéristiques C- Grandeurs associées aux données A-1 Les méthodes Lors de toute étude statistique,

Plus en détail

Didacticiel - Études de cas

Didacticiel - Études de cas 1 Objectif Classification automatique sur données mixtes (mélange de variables qualitatives et quantitatives). Utilisation des facteurs de l analyse factorielle de données mixtes. La classification automatique

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

PLAN DE COURS Nº 2 FINANCE 1

PLAN DE COURS Nº 2 FINANCE 1 PLAN DE COURS Nº 2 FINANCE 1 (410-540-90) (2-1-3) Département de techniques et sciences administratives Professeur : Bureau : Tél. : Session : PRÉALABLE Le cours de comptabilité 2 (410-210-90) est préalable

Plus en détail

LA CLAIRVOYANCE NORMATIVE : UNE QUESTION D INTELLIGENCE? PAR

LA CLAIRVOYANCE NORMATIVE : UNE QUESTION D INTELLIGENCE? PAR LA CLAIRVOYANCE NORMATIVE : UNE QUESTION D INTELLIGENCE? PAR DANIEL PASQUIER, CABINET AVENIR & ENTREPRISE, SAINT-JEAN DE BRAYE LABORATOIRE P.R.I.S., ROUEN & PATRICK VALÉAU, UNIVERSITE DE SAINT-DENIS DE

Plus en détail

UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION

UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION Economie quantitative Master 2-ECOSMA Etudes et COnseil en Stratégie et MArketing Analyse des données Polycopié 1 : Méthodes factorielles

Plus en détail

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand Service méthodes statistiques Institut National d Etudes Démographiques (Ined)

Plus en détail