L ACP sous SPSS. À Propos de ce document. Introduction



Documents pareils
La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

Université de Montréal. département de sociologie. L'analyse factorielle et l'analyse de fidélité. notes de cours et exemples

Extraction d informations stratégiques par Analyse en Composantes Principales

ACP Voitures 1- Méthode

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

APPROCHER LA RICHESSE DES MENAGES : INDICE DES ACTIFS ou DEPENSE DE CONSOMMATION?

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Modèles pour données répétées

L'analyse des données à l usage des non mathématiciens

Logiciel XLSTAT version rue Damrémont PARIS

Signature plume. Matériel : une plume ou un crayon. Ouvrir PhotoFiltre. Ouvrir votre image plume dans PhotoFiltre

Statistique Descriptive Multidimensionnelle. (pour les nuls)

PROGRAMME (Susceptible de modifications)

Lire ; Compter ; Tester... avec R

Initiation à l analyse en composantes principales

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

1 Complément sur la projection du nuage des individus

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

TP Protocoles SMTP et POP3 avec Pratiquer l algorithmique

Tutoriel première utilisation ICEM-CFD. Couche limite et modification du maillage en 2D

ISFA 2 année Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

Excel 2007 Niveau 3 Page 1

ESIEA PARIS

Notice d utilisation

Créer sa première base de données Access Partie 3/4 - Création d un formulaire

Section Configuration

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

SAS de base : gestion des données et procédures élémentaires

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Analyse en Composantes Principales

AGASC / BUREAU INFORMATION JEUNESSE Saint Laurent du Var - E mail : bij@agasc.fr / Tel : CONSIGNE N 1 :

TUTORIEL IMPRESS. Ouvrir Impress cocher «présentation vierge», «suivant» cocher «écran», «suivant» cocher «standard», «créer»

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

12 Tableaux croisés dynamiques

Commencer avec Allplan Exchange. Nemetschek Allplan Systems GmbH, Munich. All rights reserved. Enregistrement

Styler un document sous OpenOffice 4.0

Traitement des données avec Microsoft EXCEL 2010

Comment obtenir un identifiant PIC? Mode d emploi

1 Presentation du bandeau. 2 Principe de création d un projet : C2 industrialisation Apprendre Gantt project Ver 2.6 planifier

SOMMAIRE 1 INTRODUCTION 3 2 CONTACTER VOTRE SUPPORT 3 3 ESPACE DE GESTION DES CARTES 4 4 CONFIGURER UNE CARTE 5

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

Utilisation du Logiciel de statistique SPSS 8.0

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

L importance des caractéristiques extrinsèques des médicaments génériques sur la prescription médicale

Volet de visualisation

Utiliser le service de messagerie électronique de Google : gmail (1)

Localisation des fonctions

Fonctionnement du courrier électronique

Petit guide d utilisation Prezi

Ecran principal à l ouverture du logiciel

F.A.Q 1.0 Designer 3D Atex System

Avant-après, amont-aval : les couples de tableaux totalement appariés

MO-Call pour les Ordinateurs. Guide de l utilisateur

Publier dans la Base Documentaire

GUIDE D UTILISATION DE I-PHOTO

Plus petit, plus grand, ranger et comparer

Faire un semi variograme et une carte krigée avec surfer

COMMENT TROUVER VOS FUTURS CLIENTS À L INTERNATIONAL? 05/03/2015 Creditsafe France

DOCM Solutions officielles = n 2 10.

Comment insérer une image de fond?

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

Séminaire d information MIGRATION WINDOWS 7 ET OFFICE 2010

Le réseau et les tables virtuelles Synapse

PLAN. Ricco Rakotomalala Tutoriels Tanagra - 2


les Formulaires / Sous-Formulaires Présentation Créer un formulaire à partir d une table...3

Relation entre deux variables : estimation de la corrélation linéaire

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Audio and Web Conferencing mémo guide d utilisation du service

Chess Arbiter Pro (version Dames) Notice d utilisation

Ne tombez pas dans les pièges tendus par

Étape 1 : Création d une adresse courriel GMAIL

Plateforme de support en ligne. Guide d utilisation

INSCRIPTION EN LIGNE COMMENT ÇA MARCHE?

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Articulation entre mesures sociales du casino et lieux d aide spécialisés lors des mesures de limitation et d exclusion Lisiane SCHÜRMANN

SOMMAIRE GUIDE D UTILISATION DU WEBMAIL. vous guide

BIENVENUE A MOLENE BIENVENUE AU KASTELL AN DAOL

Introduction à MATLAB R

Créer une page Google+ Pro internet.com

Comment utiliser la feuille de style «CMLF2010.dot»

Structure financière et performance économique des PME : Étude empirique sur les entreprises belges

BIRT (Business Intelligence and Reporting Tools)

Ricco.Rakotomalala

point On obtient ainsi le ou les points d inter- entre deux objets».


1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Logistique. My Post Business Mode d emploi

Manuel d utilisation

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Petit memo rapide pour vous guider dans la gestion des engagements de vos compétitions FFM

Table des matières. Réclamation Guide d apprentissage I. I. Configuration d un dossier de réclamation... 2 A. Assignation d un plan...

Créer un sondage sous Magento

Régression linéaire. Nicolas Turenne INRA

Bibliothèque Numérique de l INSA de Toulouse Mode d emploi des livres électroniques NUMILOG

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse des correspondances avec colonne de référence

Transcription:

L ACP sous SPSS À Propos de ce document... Introduction... La démarche à suivre sous SPSS.... «Descriptives».... «Extraction».... «Rotation».... «Scores».... «Options»... Analyse des résultats.... Les données sont-elles factorisables?.... Combien de facteurs retenir?.... Interprétation des résultats... 6 À Propos de ce document Ce document a été créé dans le but d aider toute personne qui débute dans SPSS, logiciel trè puissant mais très peu sympathique. Ce document se base sur la version.0 Base de SPSS, en version anglaise. La plupart des exemples sont issus des dictatiels du programme SPSS en lui-même. Toutes les remarques, tant sur le fond que sur la forme, sont les bienvenues. N hésitez pas à me contacter à l adresse suivante : <lemoal@lemoal.org> ou à venir visiter mon site internet : http://www.lemoal.org/spss/ Merci. Introduction L Analyse en Composante Principale (ACP) fait partie des analyses descriptives multivariées. Le but de cette analyse est de résumer le maximum d informations possibles en en perdant le moins possible pour : Faciliter l interprétation d un grand nombre de données initiales Donner plus de sens aux données réduites L ACP permet donc de réduire des tableaux de grandes tailles en un petit nombre de variables ( ou généralement) tout en conservant un maximum d information. Les variables de départ sont dites métriques.

La démarche à suivre sous SPSS Aller dans Analyze > Data Reduction > Factor La boîte de dialogue suivante apparaît alors : On choisit les variables qui nous paraissent les mieux adaptées à l analyse en les sélectionnant dans la partie de droite puis en cliquant sur la flèche qui pointe vers la droite. Cinq boites de dialogue d options s offrent maintenant à nous :. Descriptives. Extraction. Rotation. Scores. Options que nous allons maintenant examiner une à une.. «Descriptives» La boîte de dialogue «Factor Analysis : Descriptives» apparaît. Dans «Correlation Matrix», cliquer sur «Coefficients» et «KMO and Bartlett s test of sphericity».. «Extraction» La boîte de dialogue «Factor Analysis : Extraction» apparaît.

Cliquer sur «Scree Plot» (Graphique des valeurs propres). Ne pas toucher aux autres options.. «Rotation» La boîte de dialogue «Factor Analysis : Rotation» apparaît. Pour l instant, il ne faut rien toucher dans «Method». L option «Varimax» pourra être choisie si les résultats ne sont pas suffisants dans un premier temps. Par contre, cocher l option «Loading plot(s)» (Carte(s) factorielle(s)). Cette option permet d avoir une représentation des différents axes.. «Scores» La boîte de dialogue «Factor Analysis : Factor Scores» apparaît. Pour l instant, il ne faut toucher à rien. L option «Save as variables» (enregistrer dans des variables) permettra d attribuer à chaque individu ses coordonnées factorielles une fois l analyse terminée.

. «Options» La boîte de dialogue «Factor Analysis : Options» apparaît. Choisir l option «Sorted by size» (Classement des variables par taille) dans Affichage des projections. Analyse des résultats Analyser les résultats d une ACP, c est répondre à trois questions :. Les données sont-elles factorisables?. Combien de facteurs retenir?. Comment interpréter les résultats?. Les données sont-elles factorisables? Pour répondre à cette question, dans un premier temps, il convient d observer la matrice des corrélations («Correlation Matrix»). Si plusieurs variables sont corrélées (> 0.), la factorisation est possible. Si non, la factorisation n a pas de sens et n est donc pas conseillée. Correlation Matrix Correlation Vehicle type Price in thousands Engine size Horsepower Wheelbase Width Length Curb weight Fuel capacity Price in Vehicle type thousands Engine size Horsepower Wheelbase Width Length Curb weight Fuel capacity,000 -,00,68,0,9,,,,99 -,00,000,6,88,06,,0,6,,68,6,000,86,70,688,7,760,667,0,88,86,000,8,6,87,60,0,9,06,70,8,000,68,80,6,6,,,688,6,68,000,709,7,68,,0,7,87,80,709,000,67,6,,6,760,60,6,7,67,000,86,99,,667,0,6,68,6,86,000 Dans notre exemple, plusieurs variables sont correllées entre elles : Dans un deuxième temps, il faut observer l indice de KMO (Kaiser-Meyer-Olkin) qui doit tendre vers. si ce n est pas le cas, la factorisation n est pas conseillée. Pour juger de l indice de KMO, on peut utiliser l échelle suivante : 0,0 et moins est misérable entre 0,60 et 0,70, c est médiocre entre 0,70 et 0,80 c est moyen entre 0,80 et 0,90 c est méritoire et plus 0,9 c est merveilleux.

Enfin, on utilise le test de sphéricité de Bartlett. : si la signification (Sig.) tend vers 0.000, c est très significatif, inférieur à 0.0 significatif, entre 0.0 et 0.0 acceptable et au dessus de 0.0, on rejette. KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy.,80 Bartlett's Test of Sphericity Approx. Chi-Square df Sig.,8 8,000 Si l ACP satisfait à au moins deux de ces trois conditions, on peut continuer.. Combien de facteurs retenir? Trois règles sont applicables : ere règle : la règle de Kaiser qui veut qu on ne retienne que les facteurs aux valeurs propres supérieures à. eme règle : on choisit le nombre d axe en fonction de la restitution minimale d information que l on souhaite. Par exemple, on veut que le modèle restitue au moins 80% de l information. Pour ces deux premières règles, on examine le tableau «Total Variance Explained». Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Component Total % of Variance Cumulative % Total % of Variance Cumulative %, 6,008 6,008, 6,008 6,008,0 8,87 8,88,0 8,87 8,88,96 6,0 89,087,8,00 9,87,,79 9,980 6,,77 97,76 7,, 99,69 8 6,6E-0,8 00,000 Extraction Method: Principal Component Analysis. eme méthode : le «Scree-test» ou test du coude. On observe le graphique des valeurs propres et on ne retient que les valeurs qui se trouvent à gauche du point d inflexion. Graphiquement, on part des composants qui apportent le moins d information (qui se trouvent à droite), on relie par une droite les points presque alignés et on ne retient que les axes qui sont au dessus de cette ligne.

6 Scree Plot Eigenvalue 0 6 7 8 Component Number Dans notre exemple, nous ne retenons que les deux premiers axes.. Interprétation des résultats C est la phase la plus délicate de l analyse. On donne un sens à un axe grâce à une recherche lexicale (ou recherche de mots) à partir des coordonnées des variables et des individus. Ce sont les éléments extrêmes qui concourent à l élaboration des axes. Curb weight Engine size Fuel capacity Width Horsepower Length Wheelbase Price in thousands Component Matrix a Component,9 -,7E-0,878,6,87 -,09,8 -,,77,,760 -,87,7 -,69,606,7 Extraction Method: Principal Component Analysis. a. components extracted. Dans notre exemple, ce sont les variables «Curb Weight» et «Engine Size» qui concoure le plus à la construction de l axe. Si la recherche lexicale à partir des variables ne donne rien, il faut alors donner un sens à l axe en s appuyant là aussi aux individus qui ont les coordonnées extrêmes. Note : Des axes peuvent très bien ne pas avoir de sens, auquel cas il ne faut pas les retenir. Si la variance expliquée est trop faible, on peut choisir d exclure certaines variables. Pour choisir les variables à éliminer, on observe leur qualité de représentation : plus la valeur associée à la ligne «Extraction» est faible, moins la variable explique la variance. 6

Communalities Initial Extraction Price in thousands,000,879 Engine size,000,8 Horsepower,000,90 Wheelbase,000,87 Width,000,79 Length,000,8 Curb weight,000,8 Fuel capacity,000,79 Extraction Method: Principal Component Analysis. Il faut également tenir compte du positionnement de chaque variable sur chaque axe : les variables à éliminer sont les variables qui sont Soit proches du centre sur l ensemble des axes retenus. Soit au milieu d un quart de cercle sur les axes retenus. Soit les variables qui forment un axe à elles toute seule. 7