Création de typologie sous SPSS



Documents pareils
Exemple PLS avec SAS

Calculation of Interest Regulations. Règlement sur le calcul des intérêts CONSOLIDATION CODIFICATION. Current to August 4, 2015 À jour au 4 août 2015

BIG Data et R: opportunités et perspectives

Utilisation du Logiciel de statistique SPSS 8.0

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Once the installation is complete, you can delete the temporary Zip files..

Logiciel XLSTAT version rue Damrémont PARIS

DOCUMENTATION - FRANCAIS... 2

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

Credit Note and Debit Note Information (GST/ HST) Regulations

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

LOI SUR LA RECONNAISSANCE DE L'ADOPTION SELON LES COUTUMES AUTOCHTONES ABORIGINAL CUSTOM ADOPTION RECOGNITION ACT

Form of Deeds Relating to Certain Successions of Cree and Naskapi Beneficiaries Regulations

Le Product Backlog, qu est ce c est?

Règlement sur le télémarketing et les centres d'appel. Call Centres Telemarketing Sales Regulation

Improving the breakdown of the Central Credit Register data by category of enterprises

Phone Manager Soutien de l'application OCTOBER 2014 DOCUMENT RELEASE 4.1 SOUTIEN DE L'APPLICATION

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

SERVEUR DÉDIÉ DOCUMENTATION

calls.paris-neuroscience.fr Tutoriel pour Candidatures en ligne *** Online Applications Tutorial

Modèles pour données répétées

Private banking: après l Eldorado

P R E T S P R E F E R E N T I E L S E T S U B V E N T I O N S D I N T E R Ê T S

Préparer un état de l art

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

WEB page builder and server for SCADA applications usable from a WEB navigator

DECLARATION DE BRUXELLES

APPENDIX 6 BONUS RING FORMAT

Resident Canadian (Insurance Companies) Regulations. Règlement sur les résidents canadiens (sociétés d assurances) CONSOLIDATION CODIFICATION

Exercices sur SQL server 2000

TABLE DES MATIERES A OBJET PROCEDURE DE CONNEXION

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Paxton. ins Net2 desktop reader USB

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Manuels numériques et bibliothèque Didier Guide pratique

This is a preview - click here to buy the full publication NORME INTERNATIONALE INTERNATIONAL STAN DARD. Telecontrol equipment and systems

IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board

THE LAW SOCIETY OF UPPER CANADA BY-LAW 19 [HANDLING OF MONEY AND OTHER PROPERTY] MOTION TO BE MOVED AT THE MEETING OF CONVOCATION ON JANUARY 24, 2002

Gestion des prestations Volontaire

Disclosure on Account Opening by Telephone Request (Trust and Loan Companies) Regulations

Tutoriel de formation SurveyMonkey

Swap: Utilisation et risques Approche de gestion pour les consommateurs

Internet Group Management Protocol (IGMP) Multicast Listener Discovery ( MLD ) RFC 2710 (MLD version 1) RFC 3810 (MLD version 2)

Disclosure on Account Opening by Telephone Request (Retail Associations) Regulations

Material Banking Group Percentage Regulations. Règlement fixant le pourcentage (groupe bancaire important) CONSOLIDATION CODIFICATION

Flexible Identity. authentification multi-facteurs. authentification sans token. Version 1.0. Copyright Orange Business Services mai 2014.

Interest Rate for Customs Purposes Regulations. Règlement sur le taux d intérêt aux fins des douanes CONSOLIDATION CODIFICATION

Règlement relatif à l examen fait conformément à la Déclaration canadienne des droits. Canadian Bill of Rights Examination Regulations CODIFICATION

Guide rapide fournisseurs Auto-enregistrement

La classification automatique de données quantitatives

Manuel de l utilisateur à l intention des candidats externes

Confirmation du titulaire de la carte en cas de contestation de transaction(s) Cardholder s Certification of Disputed Transactions

Innovation in Home Insurance: What Services are to be Developed and for what Trade Network?

POLICY: FREE MILK PROGRAM CODE: CS-4

Life Companies Borrowing Regulations. Règlement sur les emprunts des sociétés d assurance-vie CONSOLIDATION CODIFICATION

Avis certifiant que des pays accordent les avantages du droit d auteur. Certification of Countries Granting Equal Copyright Protection Notice

Le No.1 de l économie d énergie pour patinoires.

HSCS 6.4 : mieux appréhender la gestion du stockage en environnement VMware et service de fichiers HNAS Laurent Bartoletti Product Marketing Manager

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Support Orders and Support Provisions (Banks and Authorized Foreign Banks) Regulations

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

Stratégie d externalisation des services pour les établissements

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

DOCUMENTATION - FRANCAIS... 2

Order Binding Certain Agents of Her Majesty for the Purposes of Part 1 of the Personal Information Protection and Electronic Documents Act

Borrowing (Property and Casualty Companies and Marine Companies) Regulations

Air Transportation Tax Order, Décret de 1995 sur la taxe de transport aérien CONSOLIDATION CODIFICATION

Archived Content. Contenu archivé

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

ONTARIO Court File Number. Form 17E: Trial Management Conference Brief. Date of trial management conference. Name of party filing this brief

Phone Manager Soutien de l'application OCTOBER 2014 DOCUMENT RELEASE 4.1 SOUTIEN DE L'APPLICATION

Direction générale statistique et information économique. Manuel d usage : l application web pour l enquête sur la structure des entreprises

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

esms Desktop Guide de l utilisateur

Railway Operating Certificate Regulations. Règlement sur les certificats d exploitation de chemin de fer CODIFICATION CONSOLIDATION

GLSE301 - TP séance 7 : Travail collaboratif à distance

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

Get your ticket to innovation!

OUVRIR UN COMPTE CLIENT PRIVÉ

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

03/2013. Mod: WOKI-60IP/TR. Production code: DTWIC 6000

Grandes tendances et leurs impacts sur l acquisition de produits et services TI.

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1

Short-term Pooled Investment Fund Regulations. Règlement sur le fonds commun de placement à court terme CONSOLIDATION CODIFICATION

Ships Elevator Regulations. Règlement sur les ascenseurs de navires CODIFICATION CONSOLIDATION. C.R.C., c C.R.C., ch. 1482

General Import Permit No. 13 Beef and Veal for Personal Use. Licence générale d importation n O 13 bœuf et veau pour usage personnel CONSOLIDATION

CONTINUING CONSOLIDATION OF STATUTES ACT LOI SUR LA CODIFICATION PERMANENTE DES LOIS. 1 In this Act,

Forthcoming Database

ASSEMBLY INSTRUCTIONS DIRECTIVES POUR L'ASSEMBLAGE ombre pendant lamp lampe suspendue à tons dégradés, chocolat

How to Login to Career Page

ASSEMBLY INSTRUCTIONS DIRECTIVES POUR L'ASSEMBLAGE luster chandelier lamp chandelier à trois branches en verre lustré

ACP Voitures 1- Méthode

Scénario: Données bancaires et segmentation de clientèle

Discours du Ministre Tassarajen Pillay Chedumbrum. Ministre des Technologies de l'information et de la Communication (TIC) Worshop on Dot.

Guide de configuration. Logiciel de courriel

API SMS HTTP REST. Intégrer facilement le service Envoyer SMS Pro avec votre application métier. Version : Révision : 03/09/2014 Page 1/31

Transcription:

Création de typologie sous SPSS À Propos de ce document... 1 Introduction... 1 La démarche à suivre sous SPSS... 2 1. «Iterate»... 2 2. «Save»... 2 3. «Options»... 3 Analyse des résultats... 3 1. Historique des itérations :... 3 2. Nombre d observations dans chaque classe :... 4 3. Analyse de la variance... 5 4. Centre de classes finaux... 6 À Propos de ce document Ce document a été créé dans le but d aider toute personne qui débute dans SPSS, logiciel trè puissant mais très peu sympathique. Ce document se base sur la version 11.0 Base de SPSS, en version anglaise. La plupart des exemples sont issus des dictatiels du programme SPSS en lui-même. Toutes les remarques, tant sur le fond que sur la forme, sont les bienvenues. N hésitez pas à me contacter à l adresse suivante : <lemoal@lemoal.org> ou à venir visiter mon site internet : http://www.lemoal.org/spss/ Merci. Introduction Les méthodes de classification sont très utilisées en marketing. Ce sont notamment grâce à elles qu une entreprise peut segmenter son marché, selon des critères quantitatifs. Deux types de classification sont possibles : la «Nuées dynamiques (K-Means Cluster Analysis)» ou la «classification hiérarchique (Hierarchical Cluster Analysis)». Si le nombre d observations est supérieure à 100, il est recommandé d utiliser les nuées dynamiques. C est d ailleurs la plus couramment utilisé en marketing et celle que nous étudierons ici. La classification hiérarchique est trop longue au delà de 100 individus (et plus exigeante en terme de mémoire pour le PC) et ne sera pas traitée ici. Important : Il faut noter que la classification en nuées dynamiques nécessitent des données quantitatives. Si vous possédez des données qualitatives, l analyse ne sera pas possible, à moins de passer par une Analyse en Composante Multiple (ACM). Il est recommandé d utiliser des données centrées et réduites pour l analyse. 1

La démarche à suivre sous SPSS Aller dans Analyse > Classify > K-Means Clusters. La boîte de dialogue suivante apparaît alors : On choisit les variables qui nous paraissent les mieux adaptées à la création de typologies en les sélectionnant dans la partie de droite puis en cliquant sur la flèche qui pointe vers la droite. Dans «Number of Clusters» (nombre de classes), indiquer le nombre de classes qu on a à priori repéré dans l analyse multi-variée (ACP, AFC ou AFCM) qui aura précédé. Il est recommandé de rajouter une classe supplémentaire, au cas où (quitte à en enlever une par la suite). Au niveau de la méthode, il convient de choisir «Iterate and classify» (Itérer et classer) Plusieurs options sont maintenant possibles : 1. Iterate 2. Save 3. Options 1. «Iterate» Cliquer sur «Itérate». La boîte de dialogue «K-Means Cluster Analysis : Iterate» apparaît alors. Cette boîte de dialogue sert à indiquer le nombre maximum d itération. Au départ, il ne faut toucher à rien et laisser la valeur par défaut (10). Si, lors de l anlyse des résultats, le nombre d itérations s avert insuffisant, c est ici qu il faudra changer la valeur. 2. «Save» Cliquer sur «Save». La boîte de dialogue «K-Means Cluster : Save New Variables» apparaît alors. 2

Deux cases à cocher sont possibles : Classe d affectation (c est-à-dire le groupe) : si on veut donner à chaque individu sa classe d affectation. Il faut le faire une fois qu on est satisfait du résultat obtenu mais pas avant. Distance au centre de la classe : pour mesurer la distance du centre Pour une première analyse, il n est pas utile de cocher ces options. 3. «Options» Cliquer sur «Options». La boîte de dialogue «K-Means Cluster Analysis : Options» apparaît alors. Plusieurs changements sont à opérer : Dans «Statistics», cliquer sur «ANOVA Table». Cela sert à déterminer quelles sont les variables les plus discriminantes dans la constitution des groupes et ne pas conserver «Centres de classe initiaux» Dans «Massing Values» (Valeurs manquantes), choisir «Exclude cases pairwises» (exclure seulement les classes non valides). Analyse des résultats L analyse des résultats commence par valider l analyse en elle-même. Cette première phase passe par l observation de l historique des itérations et du nombre d observations dans chaque classe. L analyse en elle-même peut ensuite se poursuivre. 1. Historique des itérations : Dans la plupart des cas, les classes convergent avant la dixième itération. Il n est donc pas nécessaire de recommencer l analyse. Par contre, dans le cas suivant, le nombre d itérations initiales est trop faible (10). Aucune classe ne converge. Il y a convergence quand,000 est atteint dans chacune des classes identifiées. Dans le cas présent, il faut donc recommencer l analyse avec un nombre de classe plus importante. 3

Iteration 1 2 3 4 5 6 7 8 9 10 Iteration History a Change in Cluster Centers 1 2 3 3,298 3,590 3,491 1,016,427,931,577,320,420,240,180,195,119,125,108 9,282E-02 8,262E-02 2,654E-02 6,882E-02 9,375E-02 3,196E-02 5,858E-02 5,080E-02 1,817E-02 3,461E-02 8,501E-02 6,318E-02 2,489E-02,359,333 a. Iterations stopped because the maximum number of iterations was performed. Iterations failed to converge. The maximum distance by which any center has changed is,188. The current iteration is 10. The minimum distance between initial centers is 6,611. 2. Nombre d observations dans chaque classe : Number of Cases in each Cluster Cluster Valid Missing 1 2 3 232,000 288,000 480,000 1000,000,000 Il est recommandé de ne garder que les classes qui représentent 10% ou plus des observations. Dans le cas présent, chaque classe représente plus de 10% des personnes interrogées. Il n y a pas lieu de recommencer l analyse. Si par exemple, le groupe 1 n aurait eu que 96 individus, l analyse aurait dû être recommencée avec un groupe de moins, c est-à-dire 2. Cette méthode permet également de quantifier chaque segment. 4

3. Analyse de la variance ANOVA log-long distance log-toll free log-equipment log-calling card log-wireless multiple lines voice mail paging internet call waiting call forwarding 3-way calling electronic billing Cluster Mean Square df Error Mean Square 16,843 2,968 997 17,395,000 45,470 2,812 472 56,027,000 103,643 2,464 383 223,367,000 5,726 2,986 675 5,808,003 52,747 2,647 293 81,554,000 41,641 2,918 997 45,337,000 249,971 2,501 997 499,383,000 295,683 2,409 997 723,187,000 122,869 2,756 997 162,626,000 282,576 2,435 997 649,371,000 303,329 2,394 997 770,805,000 282,978 2,434 997 651,501,000 111,455 2,778 997 143,180,000 df F Sig. The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal. Le F sert à identifier les variables qui sont utiles pour l identification des différents segments. Attention à ne pas interpréter la signification de F qui, le cas présent, n est pas très utile. Les variables avec les plus grands F sont les variables les plus discriminantes des groupes entre eux. Dans notre exemple, les variables les plus discriminantes sont les variables «call forwarding» et «paging». 5

4. Centre de classes finaux Final Cluster Centers log-long distance log-toll free log-equipment log-calling card log-wireless multiple lines voice mail paging internet call waiting call forwarding 3-way calling electronic billing Cluster 1 2 3,06,25 -,18,23,13-1,07,79 -,08 -,76,14,05 -,17,40 -,68-1,20,52 -,23 -,11 1,28 -,27 -,46 1,40 -,36 -,46,82 -,55 -,06,72,72 -,78,76,74 -,81,69,75 -,78,72 -,60,01 La lecture des centres de classes finaux permet de donner une signification aux différents groupes déterminés. L analyse en elle-même se passe comme pour une analyse multivariée, c est-à-dire par recherche lexicale à partir des opposés. Par exemple, la classe 1 se caractérise par les variables «paging» et «voice mail». Les méthodes de classification peuvent donner des résultats très différents suivants les variables utilisées ou les méthodes utilisées. Pour s assurer de résultats pertinents, il convient de tester plusieurs typologies. pour choisir la meilleure, il convient d effectuer une analyse discriminante pour chaque typologie créée et ne retenir que celle qui possède le meilleur pouvoir de reclassement. Pour cela, et pour chaque typologie retenue, il faut enregistrer les classes d affectation pour chaque individu, en recommençant l analyse et en cochant «Classes d affectation» dans «Enregistrer» 6