79, avenue de la République - 75543 PARIS CEDEX 11 - Tél. : 01.49.23.20.00. I&OM Information & Operations Management



Documents pareils
TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

IBM SPSS Regression 21

Traitement des données avec Microsoft EXCEL 2010

TRANSPORT ET LOGISTIQUE :

«Cours Statistique et logiciel R»

Activité 11 : Nuage de points ou diagramme de dispersion

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Arbres binaires de décision

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

données en connaissance et en actions?

Microsoft Excel : tables de données

Leçon N 4 : Statistiques à deux variables

IBM SPSS Statistics Base 20

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

Optimisation des ressources des produits automobile première

Outils pour les réseaux de neurones et contenu du CD-Rom

Utilisation de l outil lié à MBKSTR 9

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Logiciel XLSTAT version rue Damrémont PARIS

Lire ; Compter ; Tester... avec R

Installation et utilisation de Cobian Backup 8

Guide d installation du logiciel HI Version 2.7. Guide d installation du logiciel HI Version 9.4

Régression linéaire. Nicolas Turenne INRA

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

TABLE DES MATIERES. C Exercices complémentaires 42

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Installation et utilisation

!: cette mise à jour est à réaliser sur un seul poste de travail, si vous avez installé WICTOP 3D en réseau.

NON-LINEARITE ET RESEAUX NEURONAUX

Module 24 : Analyse de scénarios

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Bases de données. Table des matières. Introduction. (ReferencePlus.ca)

Statistique : Résumé de cours et méthodes

GUIDE «TELECHARGER LA CLE PUBLIQUE DE SON CERTIFICAT» 1. DEFINITION ET UTILISATION DE LA CLE PUBLIQUE P2

SOMMAIRE. 1. Préambule Le calendrier Trajectoire d un objet lancé Régression linéaire...9

Procédure de restauration F8. Série LoRdi 2012 à Dell V131 V3360 L3330

Génie Logiciel LA QUALITE 1/5 LA QUALITE 3/5 LA QUALITE 2/5 LA QUALITE 4/5 LA QUALITE 5/5

Modèle GARCH Application à la prévision de la volatilité

Utilisation du logiciel MOVITOOLS MotionStudio

EXCEL et base de données

INTRODUCTION AU DATA MINING

SPHINX Logiciel de dépouillement d enquêtes

Utilisation avancée de SugarCRM Version Professional 6.5

1. Vocabulaire : Introduction au tableau élémentaire

e-frontech v3.0 Intranet JUSTIME Gestion administrative

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

TwinCAT Backup. Mise en œuvre rapide

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Évaluation de la régression bornée

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Température corporelle d un castor (une petite introduction aux séries temporelles)

Travaux Pratiques d Optique

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

La place de SAS dans l'informatique décisionnelle

Coup de Projecteur sur les Réseaux de Neurones

SIG ET ANALYSE EXPLORATOIRE

Note technique AbiFire5.2 Export/Import des codes incidents dans AbiDispatch

PROCEDURE D EXPORT-IMPORT DU CERTIFICAT InVS INTERNET EXPLORER

Gestion des données avec R

BIRT (Business Intelligence and Reporting Tools)

MUNIA Manuel de l'utilisateur

Installation et configuration du serveur syslog sur Synology DSM 4.0

Relation entre deux variables : estimation de la corrélation linéaire

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

Guide d implémentation. Paiement par identifiant Fichier des cartes arrivant à expiration

Master Marketing et Pratiques Commerciales parcours Management de la marque et communication Apprentissage Master 1

BC9000-BK9000. Paramétrage et configuration de l adresse IP

1 Modélisation d être mauvais payeur

Statistiques descriptives

Stages de Formation en Statistique Appliquée et Logistique

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Connexions à un projet CVS via Eclipse en accès local et distant. 15 Mai 2007

L allocataire dans un couple : l homme ou la femme?

Choisir le mode d envoi souhaité. Option 1 : Envoyer un SMS à un nombre réduit de numéros (0 10 )

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Services en ligne de l'oeb

Abonnement DreamSpark Premium

GUIDE D UTILISATION 1

Mise à jour d avast! et de vos logiciels Ciel

SOMMAIRE. Page 2 sur 15

1 Importer et modifier des données avec R Commander

Menu Fédérateur. Procédure de réinstallation du logiciel EIC Menu Fédérateur d un ancien poste vers un nouveau poste

Table des matières. I Mise à niveau 11. Préface

Exercice interactif : hotpotatoes.

Chapitre 3. Les distributions à deux variables

IBM SPSS Forecasting. Créez des prévisions d'expert en un clin d'œil. Points clés. IBM Software Business Analytics

Manuel M O D U L E D I M P O R T A T I O N

J'ai changé d'ordinateur, comment sauvegarder mon certificat?

Manuel Utilisateur MISE A JOUR DU CLIENT SOFIE VERS LA VERSION 5. v0.99

Europresse.com. Pour bibliothèque d enseignement Pour bibliothèque publique. Consulter facilement la presse. Guide version 1.

Les systèmes de gestion de version

Paramétrage d une Gestion de Production

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Exercice sur la planification de l élaboration d un programme TPMDidacticiel de MS Project pour la planification de projets

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Page Paragraphe Modification Mise en page du document Le bouton "Format de page" est maintenant "Page"

Transcription:

79, avenue de la République - 75543 PARIS CEDEX 11 - Tél. : 01.49.23.20.00 Département : I&OM Information & Operations Management Cours : Statistique et Analyse de Données pour le Management Titre du document : Guide SPSS Auteurs du document : Agathe Guilloux Responsable du cours : Corinne HAHN Année 2012-2013 LA DIFFUSION DE CE DOCUMENT EST STRICTEMENT RESERVEE A ESCP-Europe 1

2

SOMMAIRE 1. Comment réaliser une régression multiple avec SPSS... 4 1.1 Ouvrir le fichier de données... 4 1.2 Vérifier la nature du lien entre Y et chaque variable explicative... 5 1.3 Régression multiple... 6 1.4 Diagnostics sur les observations et les résidus... 7 1.5 Choix d un modèle : sélection de variables... 8 2. Comment réaliser une régression logistique avec SPSS... 9 2.1 Ouvrir le fichier de données... 9 2.2 Régression logistique... 9 2.3 Diagnostics sur les observations... 10 2.4 Choix d un modèle : sélection de variables... 10 2.5 Sauvegarder les prévisions, résidus, etc dans la table initiale.... 11 3

1. Comment réaliser une régression multiple avec SPSS 1.1 Ouvrir le fichier de données Tout d abord il faut ouvrir le fichier contenant les données sur lesquelles on souhaite effectuer la régression. Pour cela, choisir l option «Ouvrir une source de données existante» puis cliquer sur «Ok». On peut donc parcourir les répertoires et sélectionner les données qui nous intéressent. De plus, on peut utiliser SPSS pour travailler avec la plupart des fichiers de données, notamment les fichiers Excel et.csv (comma separated value) mais aussi les fichiers d autres logiciels de statistique. Il est possible de n afficher que les fichier d un certain type. Les données SPSS sont stockées sous le type.sav. 4

1.2 Vérifier la nature du lien entre Y et chaque variable explicative Une fois que le fichier de données est ouvert, et avant de se lancer dans une régression multiple, il est conseillé de tracer des nuages de points (Y,X_j) pour vérifier l existence d une relation linéaire entre Y et chacune des variables explicatives. Pour cela, on fait un scatterplot en suivant les étapes suivantes. 1. Choix du type de graphique 2. Choix du sous-type (on peut choisir Dispersion simple et faire les graphiques (Y,X_j) pour chaque X_j séparément) 5

3. Choix des variables à croiser 1.3 Régression multiple Une fois que l on a vérifié la linéarité (approchée) des liens entre Y et les variables explicatives, on peut analyser le jeu de données via un modèle de régression multiple. On choisit alors la méthode de régression à appliquer, dans notre cas il s agit de la régression linéaire. 6

À présent il faut spécifier le modèle, c est à dire choisir la variable dépendante (Y) que l on va expliquer ainsi que les variables indépendantes (les X_i). Les options de la régression permettent de configurer les tableaux réalisés par le logiciel. On peut choisir le niveau des intervalles de confiance, effectuer un diagnostic des observations 1.4 Diagnostics sur les observations et les résidus Une fois un modèle estimé via SPSS, il faut vérifier que les hypothèses du modèle de la régression multiple sont vérifiées. En particulier, on recherchera les individus aberrants. 7

Enfin, on peut réaliser des diagrammes permettant l évaluation des résidus, en particulier les diagrammes de répartition gaussien des résidus dans lesquels on compare la distribution des résidus à la distribution gaussienne. 1.5 Choix d un modèle : sélection de variables Pour choisir automatiquement les variables explicatives ayant une influence sur Y, en choisissant une option «pas à pas» dans «Méthode». 8

2. Comment réaliser une régression logistique avec SPSS 2.1 Ouvrir le fichier de données cf. 1.1 2.2 Régression logistique Pour analyser le jeu de données via un modèle de régression logistique. On choisit alors la méthode de régression à appliquer : À présent il faut spécifier le modèle, c est à dire choisir la variable dépendante (Y) que l on va expliquer ainsi que les variables indépendantes (les X_i). ATTENTION ici Y doit être binaire (dichotomique). 9

2.3 Diagnostics sur les observations On peut, comme en régression multiple, spécifier des options pour obtenir des diagnostics sur les individus. 2.4 Choix d un modèle : sélection de variables Pour choisir automatiquement les variables explicatives ayant une influence sur Y, en choisissant une option «Descendant LR» ou «Descendant Wald» dans «Méthode». 10

2.5 Sauvegarder les prévisions, résidus, etc dans la table initiale. Pour sauvergarder les prévisions, résidus, etc dans la table initiale, on choisit l option «Enregistrer» puis on indique ce que l on veut enregistrer : 11