IBM SPSS Statistics Base 20

Documents pareils

IBM SPSS Direct Marketing 21

Logiciel XLSTAT version rue Damrémont PARIS

IBM SPSS Regression 21

IBM SPSS Modeler Social Network Analysis 15 Guide de l utilisateur

Traitement des données avec Microsoft EXCEL 2010

Travailler avec les télécommunications

TABLE DES MATIERES. C Exercices complémentaires 42

Guide de l utilisateur du Système central IBM SPSS Statistics 20

Annexe commune aux séries ES, L et S : boîtes et quantiles

IBM SPSS Direct Marketing

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Séries Statistiques Simples

Guide abrégé d IBM SPSS Statistics 21

données en connaissance et en actions?

Statistiques Descriptives à une dimension

1. Vocabulaire : Introduction au tableau élémentaire

Guide d exploration de base de données de IBM SPSS Modeler 15

Pour plus d informations sur les logiciels SPSS, visitez notre site Web à l adresse suivante : ou contactez

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

«Manuel Pratique» Gestion budgétaire

Un logiciel de statistiques complet

Evaluation de la variabilité d'un système de mesure

Statistique Descriptive Élémentaire

Analyse de donnés sur les ménages à l aide de SPSS pour Windows

Infolettre #18 : Les graphiques avec Excel 2010

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Analyse et interprétation des données

3. Caractéristiques et fonctions d une v.a.

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Service On Line : Gestion des Incidents

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Représentation d une distribution

Système de Gestion Informatisée des. Exploitations Agricoles Irriguées avec Contrôle de l Eau

Statistique : Résumé de cours et méthodes

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

Guide de l utilisateur du Centre de gestion des licences en volume LICENCES EN VOLUME MICROSOFT

Classe de première L

Guide de l utilisateur de Cisco Unified Communications Manager Assistant pour Cisco Unified Communications Manager 6.0

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

Manuel de System Monitor

Smart Pix SOFTWARE. Manuel d utilisation

IBM SPSS Forecasting. Créez des prévisions d'expert en un clin d'œil. Points clés. IBM Software Business Analytics

Utiliser un tableau de données

Introduction aux Statistiques et à l utilisation du logiciel R

Créer le schéma relationnel d une base de données ACCESS

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Ouvrir le compte UQÀM

SPHINX Logiciel de dépouillement d enquêtes

Introduction : présentation de la Business Intelligence

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

SAP BusinessObjects Web Intelligence (WebI) BI 4

Guide de l utilisateur de IBM SPSS Modeler 15

Your Detecting Connection. Manuel de l utilisateur. support@xchange2.net

Module 1 : Tableau de bord Excel * 2010 incl.*

12 Tableaux croisés dynamiques

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

GUIDE D UTILISATION DU BROWSER DE BEYOND 20/20

Biostatistiques : Petits effectifs

Introduction à l approche bootstrap

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

Guide utilisateur i-milo >> Décisionnel

Chess Arbiter Pro (version Dames) Notice d utilisation

Résumé du Cours de Statistique Descriptive. Yves Tillé

Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1

Localisation des fonctions

Créer et partager des fichiers

Gérer les règles de prix catalogue sur Magento

Exercice sur la planification de l élaboration d un programme TPMDidacticiel de MS Project pour la planification de projets

Windows Internet Name Service (WINS)

Solutions en ligne Guide de l utilisateur

EXCEL TUTORIEL 2012/2013

Instructions d installation de IBM SPSS Statistics pour Windows (mono-utilisateur)

Relation entre deux variables : estimation de la corrélation linéaire

claroline classroom online

INF6304 Interfaces Intelligentes

Activité 11 : Nuage de points ou diagramme de dispersion

Principe d un test statistique

Logiciels de gestion FAC. Analyste AgExpert. Guide de démarrage rapide 2014

Business Intelligence simple et efficace

GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)

Groupe Eyrolles, 2003, ISBN : X

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE LA FORMATION PROFESSIONNELLE. Microsoft. Excel XP

Manuel d utilisation de la plate-forme de gestion de parc UCOPIA. La mobilité à la hauteur des exigences professionnelles

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Guide de l utilisateur. Faites connaissance avec la nouvelle plateforme interactive de

FORMULAIRE DE STATISTIQUES

Formation. Module WEB 4.1. Support de cours

SYSTRAN 7 Guide de démarrage

Découvrez Windows NetMeeting

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Transcription:

IBM SPSS Statistics Base 20

Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS Statistics 20 et à toutes les publications et modifications ultérieures jusqu à mention contraire dans les nouvelles versions. Les captures d écran des produits Adobe sont reproduites avec l autorisation de Adobe Systems Incorporated. Les captures d écran des produits Microsoft sont reproduites avec l autorisation de Microsoft Corporation. Matériel sous licence - Propriété d IBM Copyright IBM Corporation 1989, 2011. Droits limités pour les utilisateurs au sein d administrations américaines : utilisation, copie ou divulgation soumise au GSA ADP Schedule Contract avec IBM Corp.

Préface IBM SPSS Statistics est un système complet d analyse de données. Le module complémentaire facultatif Base fournit les techniques d analyse supplémentaires décrites dans ce manuel. Le module complémentaire Base doit être utilisé avec le système central SPSS Statistics auquel il est entièrement intégré. A propos de IBM Business Analytics Le logiciel IBM Business Analytics offre des informations complètes, cohérentes et précises permettant aux preneurs de décision d améliorer leurs performances professionnelles. Un portefeuille complet de solutions de business intelligence, d analyses prédictives, de performance financière et de gestion de la stratégie, et d applications analytiques permet une connaissance claire et immédiate et offre des possibilités d actions sur les performances actuelles et la capacité de prédire les résultats futurs. En combinant des solutions du secteur, des pratiques prouvées et des services professionnels, les entreprises de toute taille peuvent générer la plus grande productivité, automatiser les décisions en toute confiance et apporter de meilleurs résultats. Dans le cadre de ce portefeuille, le logiciel IBM SPSS Predictive Analytics aide les entreprises à prédire des événements futurs et à agir de manière proactive en fonction de ces prédictions pour apporter de meilleurs résultats. Des clients dans les domaines commerciaux, gouvernementaux et académiques se servent de la technologie IBM SPSS comme d un avantage concurrentiel pour attirer ou retenir des clients, tout en réduisant les risques liés à l incertitude et à la fraude. En intégrant le logiciel IBM SPSS à leurs opérations quotidiennes, les entreprises peuvent effectuer des prévisions, et sont capables de diriger et d automatiser leurs décisions afin d atteindre leurs objectifs commerciaux et d obtenir des avantages concurrentiels mesurables. Pour plus d informations ou pour contacter un représentant, visitez le site http://www.ibm.com/spss. Support technique Un support technique est disponible pour les clients du service de maintenance. Les clients peuvent contacter l assistance technique pour obtenir de l aide concernant l utilisation des produits IBM Corp. ou l installation dans l un des environnements matériels pris en charge. Pour contacter l assistance technique, visitezlesiteibmcorp.àl adressehttp://www.ibm.com/support. Votre nom, celui de votre société, ainsi que votre contrat d assistance vous seront demandés. Support technique pour les étudiants Si vous êtes un étudiant qui utilise la version pour étudiant, personnel de l éducation ou diplômé d un produit logiciel IBM SPSS, veuillez consulter les pages Solutions pour l éducation (http://www.ibm.com/spss/rd/students/) consacrées aux étudiants. Si vous êtes un étudiant utilisant une copie du logiciel IBM SPSS fournie par votre université, veuillez contacter le coordinateur des produits IBM SPSS de votre université. Copyright IBM Corporation 1989, 2011. iii

Service clients Si vous avez des questions concernant votre livraison ou votre compte, contactez votre bureau local. Veuillez préparer et conserver votre numéro de série à portée de main pour l identification. Séminaires de formation IBM Corp. propose des séminaires de formation, publics et sur site. Tous les séminaires font appel à des ateliers de travaux pratiques. Ces séminaires seront proposés régulièrement dans les grandes villes. Pour plus d informations sur ces séminaires, accédez au site http://www.ibm.com/software/analytics/spss/training. Documents supplémentaires Les ouvrages SPSS Statistics : Guide to Data Analysis, SPSS Statistics : Statistical Procedures Companion, et SPSS Statistics : Advanced Statistical Procedures Companion, écrits par Marija Norušis et publiés par Prentice Hall, sont suggérés comme documentation supplémentaire. Ces publications présentent les procédures statistiques des modules SPSS Statistics Base, Advanced Statistics et Regression. Que vous soyez novice dans les analyses de données ou prêt à utiliser des applications plus avancées, ces ouvrages vous aideront à exploiter au mieux les fonctionnalités offertes par IBM SPSS Statistics. Pour obtenir des informations supplémentaires y compris le contenu des publications et des extraits de chapitres, visitez le site web de l auteur : http://www.norusis.com iv

Contenu 1 Livre de codes 1 OngletRésultatsdulivredescodes... 3 OngletStatistiquesdulivredescodes... 5 2 Effectifs 8 Statistiquesdesfréquences... 9 Diagrammes desfréquences...11 Format des fréquences...12 3 Descriptives 13 OptionsDescriptives...14 FonctionnalitéssupplémentairesdelacommandeDESCRIPTIVES...16 4 Explorer 17 Statistiquesd Explorer...18 Diagrammesd Explorer...19 Transformationsdel exposantd Explorer...20 Optionsd Explorer...20 FonctionnalitéssupplémentairesdelacommandeEXAMINE...21 5 Tableaux croisés 22 Stratesdetableauxcroisés...23 Diagrammesenbâtonsjuxtaposésdetableauxcroisés...24 Tableaux croisés affichant les variables de strate dans des strates de tableau............... 24 Statistiquesdetableauxcroisés...25 Affichagedecellules(cases)detableauxcroisés...28 Formatdetableaucroisé...30 v

6 Récapituler 31 OptionsdeRécapituler...33 Récapitulerlesstatistiques...33 7 Moyennes 36 Moyennes:Options...38 8 Cubes OLAP 41 CubesOLAP:Statistiques...43 CubesOLAP:Différences...45 CubesOLAP:Titre...46 9 TestsT 47 Test T pour échantillons indépendants............................................. 47 Définir Groupes Test T pour Echantillons Indépendants............................. 49 Options Test T pour Echantillons Indépendants................................... 49 Test T pour échantillons appariés................................................. 50 Options test T pour échantillons appariés....................................... 51 Test T pour échantillon unique................................................... 52 Options Test T pour échantillon unique......................................... 53 FonctionnalitéssupplémentairesdelacommandeT-TEST...53 10 ANOVA à 1 facteur 54 ContrastesANOVAà1facteur...55 TestsPostHocANOVAà1facteur...56 OptionsANOVAà1facteur...58 FonctionnalitéssupplémentairesdelacommandeONEWAY...59 vi

11 Analyse GLM Univarié 60 ModèleGLM...62 Termesconstruits...62 Sommedescarrés...63 ContrastesGLM...64 Typesdecontraste...64 DiagrammesdeprofilsGLM...65 ComparaisonsposthocGLM...66 EnregistrementGLM...68 OptionsGLM...70 FonctionnalitéssupplémentairesdelacommandeUNIANOVA...71 12 Corrélations bivariées 73 Options decorrélationsbivariées...75 Propriétés supplémentaires des commandes CORRELATIONS et NONPAR CORR............. 75 13 Corrélations partielles 76 OptionsCorrélationspartielles...77 FonctionnalitéssupplémentairesdelacommandePARTIALCORR...78 14 Distances 79 Distances:Mesuresdedissimilarité...80 Indices:Mesuresdesimilarité...81 FonctionnalitéssupplémentairesdelacommandePROXIMITIES...82 15 Modèles linéaires 83 Pourobtenirunmodèlelinéaire...84 Objectifs...85 Bases...86 Choixdumodèle...87 vii

Ensembles...89 Avancé...90 Optionsdemodèle...90 Récapitulatifdemodèle...91 Préparationautomatiquedesdonnées...92 Importancedesvariablesprédites...93 Valeursprévuesenfonctiondesvaleursobservées...94 Résidus...95 Valeurséloignées...96 Effets...97 Coefficients...98 Moyennesestimées... 100 Récapitulatifdecréationdemodèle... 101 16 Régression linéaire 102 Méthodesdesélectiondesvariablesderégressionlinéaire... 104 Régressionlinéaire:Définirlarègle... 105 Diagrammesderégressionlinéaire... 105 Régressionlinéaire:Enregistrerdenouvellesvariables... 107 Statistiquesderégressionlinéaire... 109 Régressionlinéaire:Options... 111 FonctionnalitéssupplémentairesdelacommandeREGRESSION... 112 17 Régression ordinale 113 Régressionordinale:Options... 114 Régressionordinale:Résultat... 115 Régressionordinale:Emplacement... 117 Termesconstruits... 118 Régressionordinale:Echelle... 118 Termesconstruits... 118 FonctionnalitéssupplémentairesdelacommandePLUM... 119 viii

18 Ajustement de fonctions 120 Modèlesd ajustementdefonctions... 122 Enregistrementdel ajustementdefonctions... 122 19 Régression des moindres carrés partiels 124 Modèle... 126 Options... 127 20 Analyse du voisin le plus proche 129 Voisins... 133 Descriptives... 135 Partitions... 136 Enregistrer... 138 Résultats... 139 Options... 140 Vuedumodèle... 141 Espacedesdescriptives... 142 Importancedesvariables... 146 Pairs... 147 Distancesduvoisinleplusproche... 147 Cartedesquadrants... 148 Journald erreurdesélectiondesdescriptives... 149 Journald erreurdelasélectiondek... 150 Journald erreurdesélectiondeketdesdescriptives... 151 Letableaudeclassification... 152 Récapitulatifd erreur... 152 21 Analyse discriminante 153 Définitiond intervallespourl analysediscriminante... 155 Sélectiondesobservationspourl analysediscriminante... 155 Statistiquesdel analysediscriminante... 156 Méthodepasàpasdel analysediscriminante... 157 Analysediscriminante:Classement... 158 ix

Enregistrementdel analysediscriminante... 160 FonctionnalitéssupplémentairesdelacommandeDISCRIMINANT... 160 22 Analyse factorielle 161 Sélectiondesobservationspourl analysefactorielle... 162 Descriptivesd analysefactorielle... 163 Extractiond analysefactorielle... 164 Rotationd analysefactorielle... 166 Scoresd analysefactorielle... 167 Optionsd analysefactorielle... 168 FonctionnalitéssupplémentairesdelacommandeFACTOR... 168 23 Choix d une procédure de classification 169 24 Analyse TwoStep Cluster 170 Optionsdelaprocédured analysetwostepcluster... 173 Résultatsdel analysetwostepcluster... 175 Leviewerdeclasses... 176 Viewerdeclasses... 177 Navigationdansleviewerdeclasses... 186 Filtragedesenregistrements... 187 25 Classification hiérarchique 189 Méthodedeclassificationhiérarchique... 190 Statistiquesdelaclassificationhiérarchique... 191 Diagrammes(graphiques)declassificationhiérarchique... 192 Sauvegarde des nouvelles variables de classification hiérarchique...................... 193 Fonctionnalités supplémentaires de la syntaxe de commande CLUSTER................... 193 x

26 Nuées dynamiques 194 Efficacitédelaclassificationennuéesdynamiques... 196 Itérationdelaclassificationennuéesdynamiques... 196 Enregistrementdesanalysesdeclassesdenuéesdynamiques... 197 Optionsd analysesdesclassesdenuéesdynamiques... 197 FonctionnalitéssupplémentairesdelacommandeQUICKCLUSTER... 198 27 Tests non paramétriques 199 Tests non paramétriques à un échantillon.......................................... 199 Obtenir des tests non paramétriques à un échantillon............................. 200 OngletChamps... 200 Onglet Paramètres... 201 Testsnonparamétriquespouréchantillonsindépendants... 206 Obtenir des tests non paramétriques pour échantillons indépendants................. 207 Onglet Champs... 208 OngletParamètres... 208 Tests nonparamétriquespouréchantillonsliés... 211 Obtenir des tests non paramétriques pour échantillons liés......................... 212 OngletChamps... 213 OngletParamètres... 213 Vuedumodèle... 218 Récapitulatifd hypothèses... 219 Récapitulatif de l intervalle de confiance....................................... 220 Test à un échantillon...................................................... 221 Testpouréchantillonsliés... 225 Testpouréchantillonsindépendants... 232 Informationssurleschampsqualitatifs... 240 Informationssurleschampscontinus... 241 Comparaisonsparpaire... 242 Sous-ensembleshomogènes... 243 FonctionssupplémentairesdelacommandeNPTESTS... 244 Boîtesdedialogueancienneversion... 244 TestduKhi-deux... 244 Test binomial... 262 Suitesenséquences... 264 Test Kolmogorov-Smirnov pour un échantillon................................... 266 Testspourdeuxéchantillonsindépendants... 268 Testspourdeuxéchantillonsliés... 271 xi

Testspourplusieurséchantillonsindépendants... 273 Testspourplusieurséchantillonsliés... 276 Testbinomial... 262 Suitesenséquences... 264 Test Kolmogorov-Smirnov pour un échantillon................................... 266 Testspourdeuxéchantillonsindépendants... 268 Testspourdeuxéchantillonsliés... 271 Testspourplusieurséchantillonsindépendants... 273 Testspourplusieurséchantillonsliés... 276 28 Analyse des réponses multiples 279 Définitiondevecteursmultiréponses... 280 Tableauxdefréquencesdesréponsesmultiples... 281 Tableauxcroisésdesréponsesmultiples... 283 DéfinirIntervallesTableauxcroisésDeréponsesmultiples... 284 OptionsTableauxcroisésderéponsesmultiples... 285 FonctionnalitéssupplémentairesdelacommandeMULTRESPONSE... 286 29 Tableaux de Résultats 287 Tableauxdebordenlignes... 287 Pour obtenirunrapportrécapitulatif:récapitulatifsenlignes... 288 Format des Colonnes de données/ventilations des Tableaux de bord.................. 289 Fonctions récapitulatives des Tableaux pour/fonctions récapitulatives Finales.......... 289 OptionsdeVentilationdeTableaudeBord... 290 OptionsduTableaudebord... 291 PrésentationduTableaudebord... 291 TitresduTableaudebord... 293 Tableauxdebordencolonnes... 293 Pour obtenir un rapport récapitulatif : Récapitulatifs en colonnes.................... 294 FonctionrécapitulativedesColonnesdedonnées... 295 Fonction élémentaire des Colonnes de Données pour colonne de total................ 296 FormatdesColonnesduTableaudebord... 297 TableauxdebordenColonnes:OptionsdeVentilation... 297 OptionsdesTableauxdebordenColonnes... 298 PrésentationduTableaudebordenColonnes... 298 FonctionnalitéssupplémentairesdelacommandeREPORT... 298 xii

30 Analyse de fiabilité 300 Statistiques de l analyse de fiabilité.............................................. 301 FonctionnalitéssupplémentairesdelacommandeRELIABILITY... 303 31 Positionnement multidimensionnel 304 Formedesdonnéesdupositionnementmultidimensionnel... 306 Positionnementmultidimensionnel:créerunemesure... 306 Modèledepositionnementmultidimensionnel... 307 Positionnementmultidimensionnel:Options... 308 FonctionnalitéssupplémentairesdelacommandeALSCAL... 309 32 Statistiques de ratio 310 Statistiquesderatio... 311 33 Courbes ROC 313 CourbeROC:Options... 315 Annexe A Remarques 316 Index 319 xiii

Livre de codes Chapitre 1 Le livre des codes indique les informations du dictionnaire, telles que les noms de variables, les étiquettes de variables, les étiquettes de valeurs, les valeurs manquantes, ainsi que les statistiques récapitulatives de toutes les variables (ou celles spécifiées) et les vecteurs multiréponses dans l ensemble de données actif. Pour les variables ordinales et nominales ainsi que pour les vecteurs multiréponses, les statistiques récapitulatives comprennent les effectifs et les pourcentages. Pour les variables d échelle, les statistiques récapitulatives comprennent la moyenne, l écart-type et les quartiles. Remarque : Le livre des codes ignore l état de fichier scindé. Ceci comprend les groupes de fichiers scindés crées pour l imputation multiple de valeurs manquantes (disponible dans l option complémentaire Valeurs manquantes). Pour obtenir un livre des codes E A partir des menus, sélectionnez : Analyse > Rapports > Livre de codes E Cliquez sur l onglet Variables. Copyright IBM Corporation 1989, 2011. 1

2 Chapitre 1 Figure 1-1 Boîte de dialogue Livre des codes, onglet Variables E Sélectionnez une ou plusieurs variables et/ou des vecteurs multiréponses. Sinon, vous pouvez : Contrôlez les informations de variables affichées. Contrôlez les statistiques affichées (ou excluez toutes les statistiques récapitulatives). Contrôlez l ordre d affichage des variables et des vecteurs multiréponses. Modifiez le niveau de mesure de toute variable dans la liste source afin de modifier les statistiques récapitulatives affichées. Pour plus d'informations, reportez-vous à la section Onglet Statistiques du livre des codes sur p. 5. Modification des niveaux de mesure Vous pouvez modifier temporairement le niveau de mesure des variables. (Vous ne pouvez pas modifier celui des vecteurs multiréponses. Ils sont toujours traitées comme nominaux.) E E Cliquez avec le bouton droit sur une variable dans la liste source. Dans le menu contextuel, sélectionnez un niveau de mesure. Ceci permet de modifier temporairement le niveau de mesure. Concrètement, cela n est utile que pour les variables numériques. Le niveau de mesure des variables de chaîne est limité aux variables nominales ou ordinales qui sont traitées de la même façon par la procédure du livre des codes.

3 Livre de codes Onglet Résultats du livre des codes L onglet Résultats contrôle les informations de variables disponibles pour chaque variable et vecteurs multiréponses, leur ordre d affichage et le contenu de la table d informations des fichiers en option. Figure 1-2 Boîte de dialogue Livre des codes, onglet Résultats Informations sur les variables Ceci permet de contrôler les informations du dictionnaire affichées pour chaque variable. Position. Un nombre entier qui représente la position de la variable dans l ordre des fichiers. Non disponible pour les vecteurs multiréponses. Etiquette. L étiquette descriptive associée à la variable ou au vecteur multiréponses. Type. Type de données fondamental. Est Numérique, Chaîne, ouvecteur multiréponses. Format. Le format d affichage de la variable, tel que A4, F8.2 ou DATE11. Non disponible pour les vecteurs multiréponses. Niveau de mesure. Les valeurs possibles sont Nominale, Ordinale, Echelle et Inconnue. La valeur affichée est le niveau de mesure stocké dans le dictionnaire et elle n est pas affectée par tout remplacement de niveau de mesure temporaire spécifié en changeant le niveau de mesure dans la liste de variable source de l onglet Variables. Non disponible pour les vecteurs multiréponses.

4 Chapitre 1 Remarque : Le niveau de mesure des variables numériques peut être «inconnu» avant le premier passage de données lorsque le niveau de mesure n a pas été explicitement défini, par exemple pour la lecture de données à partir d une source externe ou des variables récemment créées. Rôle. Certaines boîtes de dialogue prennent en charge la fonction de présélection de variables pour une analyse basée sur des rôles définis. Etiquettes de valeurs. Etiquettes descriptives associées à des valeurs de données spécifiques. Si l option Effectif ou Pourcentage est sélectionnée dans l onglet Statistiques, les étiquettes de valeurs définies sont comprises dans les résultats même si vous ne sélectionnez pas Etiquettes de valeur ici. Pour les vecteurs de dichotomies multiples, les «étiquettes de valeur» sont les étiquettes des variables élémentaires du vecteur soit les étiquettes des valeurs comptées, selon la définition du vecteur. Valeurs manquantes. Valeurs manquantes définies par l utilisateur. Si l option Effectif ou Pourcentage est sélectionnée dans l onglet Statistiques, les étiquettes de valeurs définies sont comprises dans les résultats même si vous ne sélectionnez pas Valeurs manquantes ici. Non disponible pour les vecteurs multiréponses. Attributs Personnalisés. Attributs de variable personnalisés. Les résultats comprennent à la fois les noms et les valeurs pour tout attribut de variables personnalisé associé à chaque variable. Non disponible pour les vecteurs multiréponses. Attributs réservés. Attributs de variables système réservés. Vous pouvez afficher les attributs système, mais vous ne devez pas les modifier. Les noms des attributs système commencent par un signe dollar ($). Les attributs hors affichage, avec les noms qui commencent par «@» ou «$@», ne sont pas inclus. Les résultats comprennent à la fois les noms et les valeurs pour tout attribut systèmeassociéàchaquevariable.nondisponible pour les vecteurs multiréponses. Informations sur les fichiers La table d informations de fichiers en option peut comprendre l un des attributs de fichiers suivants : Nom de fichier. Nom du fichier de données IBM SPSS Statistics. Si l ensemble de données n a jamais été enregistré au format SPSS Statistics, aucun nom de fichier de données n est disponible. (Si aucun nom de fichier n est affiché dans la barre de titre de la fenêtre Editeur de données, l ensemble de données actif ne comporte pas de nom de fichier). Emplacement. Emplacement du répertoire (dossier) du fichier de données SPSS Statistics. Si l ensemble de données n a jamais été enregistré au format SPSS Statistics, aucun n emplacement n est disponible. Nombre d observations. Nombre d observations dans l ensemble de données actif. Ceci est le nombre total d observations, y compris celles qui peuvent être exclues des statistiques récapitulatives en raison des conditions de filtrage. Etiquette. Ceci est le fichier d étiquette (si disponible) défini par la commande FILE LABEL. Documents. Texte de document de fichier de données.

5 Livre de codes Etat de la pondération : Si la pondération est activée, le nom de la variable de pondération est affiché. Attributs Personnalisés. Attributs de fichiers de données personnalisés définis par l utilisateur. Attributs de fichiers de données définis avec la commande DATAFILE ATTRIBUTE. Attributs réservés. Attributs de fichiers de données système réservés. Vous pouvez afficher les attributs système, mais vous ne devez pas les modifier. Les noms des attributs système commencent par un signe dollar ($). Les attributs hors affichage, avec les noms qui commencent par «@» ou «$@», ne sont pas inclus. Les résultats incluent les noms et les valeurs pour tout attribut de fichiers de données système. Ordre d affichage des variables Les alternatives suivantes sont disponibles pour contrôler l ordre d affichage desvariableset des vecteurs multiréponses : Alphabétique. Ordre alphabétique par nom de variable. Fichier. L ordre d affichage des variables dans l ensemble de données (leur ordre d affichage dans l Editeur de données). Dans l ordre croissant, les vecteurs multiréponses sont affichés en dernier, après toutes les variables sélectionnées. Niveau de mesure. Trier par niveau de mesure. Ceci crée quatre groupes de tri : nominal, ordinal, échelle et inconnu. Les vecteurs multiréponses sont traités comme nominaux Remarque : Le niveau de mesure des variables numériques peut être «inconnu» avant le premier passage de données lorsque le niveau de mesure n a pas été explicitement défini, par exemple pour la lecture de données à partir d une source externe ou des variables récemment créées. Liste des variables. L ordre d affichage des variables et des vecteurs multiréponses dans la liste des variables sélectionnées de l onglet Variables. Nom d attribut personnalisé. La liste des options d ordre de tri comprend aussi le nom des attributs de variables personnalisés définis par l utilisateur. Dans l ordre croissant, les variables dont le tri des attributs ne figure pas en haut, puis celles dont la valeur n est pas définie pour l attribut, puis celles avec des valeurs définies pour l attribut dans l ordre alphabétique des valeurs. Nombre maximal de catégories Si les résultats comprennent les étiquettes de valeurs, les effectifs, ou les pourcentages pour chaque valeur unique, vous pouvez supprimer ces informations de la table si le nombre de valeurs dépasse la valeur indiquée. Par défaut, ces informations sont supprimées si le nombre de valeurs uniques de la variable dépasse 200. Onglet Statistiques du livre des codes L onglet Statistiques permet de contrôler les statistiques récapitulatives comprises dans les résultats, ou de supprimer entièrement l affichage des statistiques récapitulatives.

6 Chapitre 1 Figure 1-3 Boîte de dialogue Livre des codes, onglet Statistiques Nombres et pourcentages Pour les variables nominales et ordinales, les vecteurs multiréponses et les valeurs d étiquette des variables d échelle, les statistiques disponibles sont : Effectif. Effectif ou nombre d'observations possédant chaque valeur (ou plage de valeurs) d'une variable. Pourcentage. Pourcentage d'observations ayant une valeur particulière. Tendance et dispersion centrales Pour les variables d échelle, les statistiques disponibles sont : Moyenne. Mesure de la tendance centrale. Moyenne arithmétique ; somme divisée par le nombre d'observations. Ecart type. Mesure de dispersion par rapport à la moyenne. Dans le cas d'une distribution normale, 68 % des observations se situent à l'intérieur d'un écart-type de la moyenne et 95 % se situent à l'intérieur de deux écarts-types. Par exemple, si la moyenne d'âge est de 45 avec un écart-type égal à 10, une distribution normale verra 95 % des observations se situer entre 25 et 65. Quartiles. Valeurs correspondant aux 25ème, 50ème et 75ème centiles.

7 Livre de codes Remarque : vous pouvez modifier temporairement le niveau de mesure associé à une variable (et par conséquent modifier les statistiques récapitulatives affichées pour cette variable) dans la liste de variables source de l onglet Variables.

Effectifs Chapitre 2 La procédure Fréquences permet d obtenir des affichages statistiques et graphiques qui servent à décrire de nombreux types de variables. La procédure Fréquences peut jouer un rôle lorsque vous prenez connaissance de vos données. Pour obtenir un rapport des fréquences et un diagramme en bâtons, vous pouvez trier les différentes valeurs par ordre croissant ou décroissant, ou bien classer les modalités en fonction de leurs fréquences. Le rapport de fréquences peut être supprimé lorsqu une variable a plusieurs valeurs distinctes. Vous pouvez étiqueter les diagrammes avec des fréquences (par défaut) ou des pourcentages. Exemple : Quelle est la répartition de la clientèle d une société selon le type d industrie dont elle fait partie? Le résultat pourrait vous apprendre que votre clientèle est composée à 37,5 % d organismes d état, à 24,9 % de sociétés commerciales, à 28,1 % d établissements universitaires et à 9,4 % du secteur de la santé. Pour des données continues et quantitatives, comme par exemple les revenus des ventes, vous pourriez constater que la moyenne de vente par produit est de 3 576 avec un écart-type de 1 078. Diagrammes et statistiques : Effectifs de fréquence, pourcentages, pourcentages cumulés, moyenne, médiane, mode, somme, écart-type, variance, intervalle, valeurs minimale et maximale, erreur standard de la moyenne, asymétrie et aplatissement (avec leurs erreurs standard), quartiles, centiles choisis par l utilisateur, diagrammes en bâtons, diagrammes en secteurs et histogrammes. Données. Utilisez des codes numériques ou alphanumériques pour coder les variables qualitatives (mesures de niveau nominal ou ordinal). Hypothèses : Les tabulations et les pourcentages fournissent une description utile sur les données de n importe quelle distribution, particulièrement pour les variables disposant de modalités triées ou non. Certaines des statistiques récapitulatives facultatives, telles que la moyenne et l écart-type, sont fondées sur la théorie de normalité et sont appropriées pour des variables quantitatives avec une distribution symétrique. Les statistiques de base, telles que la médiane, les quartiles et les centiles, sont appropriées pour les variables quantitatives, qu elles répondent ou non au critère de normalité. Pour obtenir des tableaux de fréquences E A partir des menus, sélectionnez : Analyse > Statistiques descriptives > Effectifs Copyright IBM Corporation 1989, 2011. 8

9 Effectifs Figure 2-1 BoîtededialogueFréquencescomplexes E Sélectionnez une ou plusieurs variables qualitatives ou quantitatives. Sinon, vous pouvez : Cliquer sur Statistiques pour obtenir des statistiques descriptives pour des variables quantitatives. Cliquer sur Diagrammes pour obtenir des diagrammes en bâtons, des diagrammes en secteurs ou des histogrammes. Cliquer sur Format pour définir l ordre de présentation des résultats. Statistiques des fréquences Figure 2-2 Boîte de dialogue Fréquences : Statistiques

10 Chapitre 2 Fractiles : Valeurs d une variable quantitative qui divisent les données triées en classes par centième. Les quartiles (25ième, 50ième et 75ième centiles) divisent les observations en quatre classes de taille égale. Si vous souhaitez un nombre égal de classes différent de quatre, sélectionnez Partition en n classes égales. Vous pouvez également spécifier des centiles particuliers (par exemple, le 95ième centile, valeur au-dessus de 95 % des observations). Tendance centrale : Les statistiques décrivant la position de la distribution comprennent la Moyenne, la Médiane, le Mode et la Somme de toutes les valeurs. Moyenne. Mesure de la tendance centrale. Moyenne arithmétique ; somme divisée par le nombre d'observations. Médiane. Valeur au dessus ou au dessous de laquelle se trouvent la moitié des observations ; 50e centile. Si le nombre d'observations est pair, la médiane correspond à la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordre croissant ou décroissant. La médianeestunemesuredetendancecentraleetellen'estpas,àl'inversedelamoyenne, sensible aux valeurs éloignées. Mode. Valeur qui revient le plus fréquemment. Si plusieurs valeurs partagent la plus grande fréquence d'occurrence, chacune d'elles constitue un mode. La procédure Effectifs ne rend compte que du plus petit mode. Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas de valeur manquante. Dispersion : Les statistiques mesurant la variance ou la dispersion dans les données, comprennent l écart-type, la variance, l intervalle, le minimum, le maximum et l erreur standard (ES) de la moyenne. Ecart type. Mesure de dispersion par rapport à la moyenne. Dans le cas d'une distribution normale, 68 % des observations se situent à l'intérieur d'un écart-type de la moyenne et 95 % se situent à l'intérieur de deux écarts-types. Par exemple, si la moyenne d'âge est de 45 avec un écart-type égal à 10, une distribution normale verra 95 % des observations se situer entre 25 et 65. Variance. Mesure de dispersion autour de la moyenne, égale à la somme des carrés des écarts par rapport à la moyenne, divisée par le nombre d'observations moins un. La variance se mesure en unités, qui sont égales au carré des unités de la variable. Intervalle. Différence entre la valeur maximale et la valeur minimale d'une variable numérique (maximum minimum). Minimum. Valeur la plus petite d'une variable numérique. Maximum. Plus grande valeur d'une variable numérique. ES Moyenne. Mesure du degré de variation de la moyenne d'un échantillon à l'autre au sein d'une même distribution. Cette mesure permet de comparer approximativement la moyenne observée avec une valeur hypothétique (autrement dit, vous pouvez conclure que ces deux valeurs sont différentes si le rapport de la différence avec l'erreur standard est inférieur à -2 ou supérieur à +2). Distribution : L Asymétrie et l Aplatissement sont des statistiques qui décrivent la forme et la symétrie de la distribution. Ces statistiques sont présentées avec leurs erreurs standard.