Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP



Documents pareils
INITIATION AU LOGICIEL SAS

L export de SAS vers Excel expliqué à ma fille

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

TP SAS initiation IUP MIAGE L3

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

ODS : organiser et diffuser des sorties

SAS de base : gestion des données et procédures élémentaires

1 Imputation par la moyenne

Exemple PLS avec SAS

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Approche Contract First

Mémo d utilisation de ADE-4

Langage propre à Oracle basé sur ADA. Offre une extension procédurale à SQL

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

TD d économétrie appliquée : Introduction à STATA

BIRT (Business Intelligence and Reporting Tools)

M2-Images. Rendu Temps Réel - OpenGL 4 et compute shaders. J.C. Iehl. December 18, 2013

Le No.1 de l économie d énergie pour patinoires.

Le Système SAS et les accès via OLE DB : une introduction

Présentation Windows Azure Hadoop Big Data - BI

Allo Support et services électroniques

Algorithmique et Programmation, IMA

LES ACCES ODBC AVEC LE SYSTEME SAS

1 Modélisation d être mauvais payeur

Formation au logiciel SAS Statistical Analysis System

Exercices sur SQL server 2000

Crédit Scoring. Master 2 SRO. Année scolaire 2009/2010. Professeur : RICHARD EMILION. Réalisé par : MAHAMAT OUMAR ALHABO et OULD EL HADDAD CHEIKH

REPORTING MÉTIERS SAS APPLICATIONS AVEC. Mettre en forme et diffuser vos résultats avec SAS 9 et SAS 9 BI. Olivier Decourt. Préface de Philippe Letren

Les Triggers SQL. Didier DONSEZ. Université de Valenciennes Institut des Sciences et Techniques de Valenciennes

Module Administration BD Chapitre 1 : Surcouche procédurale dans les SGBDS

Cours d algorithmique pour la classe de 2nde

Cours Bases de données 2ème année IUT

Configurer la supervision pour une base MS SQL Server Viadéis Services

Évolu>on et maintenance

SAS base Introduction à SAS SQL SAS IML

Web Mining. YOUSSOUF Kamal LACHAAL Rafik. [Tapez le résumé du document ici. Il s agit généralement d une courte synthèse du document.

TP JAVASCRIPT OMI4 TP5 SRC

I. Gchart, Gplot avec les données des départements. Nuages de points, courbes: Histogramme simple: Avec controle des centres des classes :

Partie I : Créer la base de données. Année universitaire 2008/2009 Master 1 SIIO Projet Introduction au Décisionnel, Oracle

Utilisation du Logiciel de statistique SPSS 8.0

Rappel. Analyse de Données Structurées - Cours 12. Un langage avec des déclaration locales. Exemple d'un programme

Laboratoires de bases de données. Laboratoire n 6. Programmation SQL. par Danièle BAYERS et Louis SWINNEN

EPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE

Modernisation, développement d applications et DB2 sous IBM i Technologies, outils et nouveautés Volubis.fr

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Gestion mémoire et Représentation intermédiaire

Mesures de temps de propagation de groupe sur convertisseurs de fréquence sans accès aux OL

Projet de programmation (IK3) : TP n 1 Correction

Practice Direction. Class Proceedings

TP base de données SQLite. 1 Différents choix possibles et choix de SQLite : 2 Définir une base de donnée avec SQLite Manager

Durée estimée :1 journée Date de la réalisation : Description Fournisseur Référence Nombre PU HT LM35CZ, LM35AZ LM35DZ

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

Organigramme / Algorigramme Dossier élève 1 SI

td3a correction session7az

Lesson Plan Physical Descriptions. belle vieille grande petite grosse laide mignonne jolie. beau vieux grand petit gros laid mignon

TP1 : Initiation à Java et Eclipse

TP D AUTOMATISME TS2 CIRA (première partie)

Introduction à EasyLanguage

Knowledge Management D. Chauvel, 13 Novembre Journée Mondiale de la Qualité Université Aix Marseille

Environnements informatiques

ARDUINO DOSSIER RESSOURCE POUR LA CLASSE

Scénario: Score d appétence de la carte visa premier

Attaques applicatives

Vue d ensemble de Windows PowerShell

Ordonnance sur le paiement à un enfant ou à une personne qui n est pas saine d esprit. Infant or Person of Unsound Mind Payment Order CODIFICATION

OPTIMISEZ LES PERFORMANCES DE TRAITEMENT DE VOS DONNEES AVEC SAS/ACCESS. Sommaire

Cours 1 : Introduction Ordinateurs - Langages de haut niveau - Application

1/24. I passer d un problème exprimé en français à la réalisation d un. I expressions arithmétiques. I structures de contrôle (tests, boucles)

Le contrôle fiscal anno 2013

Changer la source d'une requête dans SAS Enterprise Guide. Ce document explique comment changer la table source de la tâche Filtre et requêtes.

Qu est ce qu une PME? 4. Pourquoi investir dans une PME? 6. Comment investir en direct dans une PME? 10

Algorithmique des Systèmes Répartis Protocoles de Communications

DOCUMENTATION KAPTravel Module de gestion des appels de disponibilité

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Un regard neuf sur le document. Didier Delhaye. CDS Marketing Manager.

Nuxeo 5.4 : les nouveautés

Travaux pratiques avec RapidMiner

Introduction au logiciel SAS François-Xavier LEJEUNE

Master4Light. Caractérisation Optique et Electrique des Sources Lumineuses. Equipement 2-en-1 : source de courant et spectrophotomètre

AVIS A MANIFESTATION D INTERET N 017/MPT/2013/UCP/CAB

INTRASTAT No ce explica ve Merkbla

1. SAS FEDERATION SERVER - POINT D'ACCES UNIQUE ET SECURISE AUX DONNEES DE L'ENTREPRISE

Bases de Données Avancées PL/SQL

Devoir Data WareHouse

Comment développer et intégrer un module à PhpMyLab?

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

La place de SAS dans l'informatique décisionnelle

calls.paris-neuroscience.fr Tutoriel pour Candidatures en ligne *** Online Applications Tutorial

OpenPaaS Le réseau social d'entreprise

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Gestion de base de données

Travaux Pratiques de Commande par ordinateur 1 TRAVAUX PRATIQUES

KL5121. Pour activer des sorties en fonction de la position d'un codeur

Licence de MIDO - 3ème année Spécialités Informatique et Mathématiques Appliquées

Transcription:

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP IMPORTATION, PRÉPARATION DES DONNÉES, RAPPORTS ET MISE EN FORME

Objectifs de la séance 1. Présenter un exemple de théma3que qui pourrait être traitée dans le cadre du travail que l on vous demande de réaliser à la fin de ce cours. 2. Aborder les aspects techniques qui précédent la mise en œuvre des méthodes d analyses vues au cours théorique : la phase de prépara3on des données dans le logiciel SAS.

Exemple de thématique Variables d intérêt : l importance que l individu accorde au fait de vivre dans un pays démocra3que (IMPLVDM) et la manière dont il évalue le fonc3onnement de la démocra3e dans son pays (DMCNTOV). Explica4ves socio- démographiques : La région du pays (REGION) On se limite à un seul pays, dans ce cas, la Belgique. Le genre du répondant (GNDR) Son âge (AGEA) Son niveau d éduca3on (EISCED) Son statut occupa3onnel (MNACTIC) Son niveau d aisance financière (HINCFEL) Explica4ves «théma4ques» : Son intérêt pour la poli3que (POLINTR) Le fait qu il appar3enne ou non à une minorité ethnique (BLGETMG) Sa posi3on sur l échelle gauche- droite (LRSCALE) La place qu il es3me occuper dans la société (PLINSOC)

Critères pour le choix des variables INTÉRÊT «SOCIOLOGIQUE»!!! ADÉQUATION PAR RAPPORT AUX MÉTHODES o Choisir une ou deux variable(s) d intérêt (rela3ves à une même théma3que) présentant suffisamment de niveaux (par exemple : échelle de Likert de 0 à 10). o Travailler sur un seul pays (au choix) et faire éventuellement des comparaisons inter- régionales o Prendre un nombre suffisant de variables explica3ves (pour la sélec3on des modèles) o Ne pas sélec3onner uniquement des explica3ves socio- démographiques (intérêt sociologique limité) mais cibler aussi des variables liées à la théma3que suscep3bles d apporter un éclairage intéressant. o Avoir au moins une variable con3nue (l âge dans l ESS est l une des seules disponibles)

Phase de préparation des données: Exercice à réaliser 1. Télécharger la base de données ESS2012 depuis le site de l ESS et l importer dans SAS 2. Le nouveau data set doit contenir uniquement : Les réponses des 1869 Belges Les variables DMCNTOV (variable d intérêt), REGION, EISCED, HINCFEL, AGEA (explica3ves socio- démo), POLINTR, PLINSOC, BLGETMG (explica3ves théma3ques) 3. Assigner si nécessaire des labels aux variables et des formats aux valeurs afin d aider à l interpréta3on des sor3es. 4. Réaliser un premier rapport en format pdf reprenant la table des fréquences des 8 variables retenues avec des 3tres explicites et certains critères de mise en forme (style, format, pas de date, etc.). 5. Créer de nouvelles variables (versions recodées des variables ini3ales) et définir leurs labels. 6. Réaliser un second rapport en format pdf présentant les tables de con3ngence pour chaque croisement 2 à 2 entre les variables explica3ves (recodées ou formatées) et la variable réponse (binarisée). Interpréter les premières tendances. 7. Créer un nouveau data set SAS reprenant les fréquences absolues de la variable réponse en fonc3on du niveau d éduca3on et l imprimer dans la fenêtre de sor3e.

Instructions «Data step» DATA output- SAS- data- set; LENGTH new- variable(s) $ length; SET input- SAS- data- set; WHERE where- expression; KEEP variable- list ; IF expression THEN statement ; ELSE IF expression THEN statement ; LABEL variable = label variable = label variable = label ; FORMAT variable(s) format; /* Sélec3on des observa3ons */ /* Sélec3on des variables */ /* Créa3on des nouvelles variables */

Procédures PROC CONTENTS DATA = SAS- data- set <varnum>; /* varnum = op3on de procédure pour lister les variables dans l ordre où elles apparaissent dans le data set plutôt que par ordre alphabé3que (par défaut) */ PROC PRINT DATA = SAS- data- set; VAR variable(s); PROC FORMAT; VALUE format- name range1 = label range2 = label. ; VALUE format- name range1 = label range2 = label. ; /*Défini3on de formats (! Avant l assigna3on dans le code!) */ /* NB : Le nom du format commence par un $ pour les valeurs caractères*/

Procédures (suite) PROC FREQ DATA = SAS- data- set < op3on(s) > ; TABLES variable(s) </op3on(s)>; PROC FREQ DATA = SAS- data- set < op3on(s) >; TABLES variable1*variable2 </op3on(s)>; rows columns /*one- way frequency table */ /* two way frequency table */ PROC FREQ Op3ons : - NLEVELS (affiche un résumé du nombre de niveaux pour chaque variable listée dans TABLES) - ORDER = DATA FORMATTED FREQ INTERNAL TABLES Statement Op3ons : - NOPERCENT, NOROW, NOCOL - OUT = SAS- data- set

Instructions globales Assigner une librairie : LIBNAME libref chemin du folder ; /*libref : max 8 caractères, commence par une le~re ou un underscore*/ Ensuite, pour stocker les datasets dans la librairie permanente : les appeler par «libref.filename» Diriger les sor3es vers une fichier pdf TITLEn text ; ODS pdf file = chemin\nom_du_fichier.pdf < style = journal > ; SAS code to generate a report(s) ODS pdf close; OPTIONS nodate nonumber center ;!!! Caractéris3ques des instruc3ons globales : elles restent d applica3on jusqu à ce qu elles soient modifiées, supprimées ou que l on me~e fin à la session SAS.

Structure du programme SAS ESS6e02_1_F1.sas LIBNAME LIBRARY chemin vers le dossier des<né à stocker les formats ; LIBNAME OUT chemin vers le dossier des<né à stocker la base de donnée ; PROC FORMAT LIBRARY=LIBRARY ; /*Défini3on de formats stockés dans la librairie permanente LIBRARY */ VALUE format- name range1 = label range2 = label. ; DATA OUT. ESS6e02_1_F1; INFILE chemin vers le fichier txt\ess6e02_1_f1.txt ; INPUT variables- names <$> column_start- column_stop; FORMAT variable(s) format; /*Assigna3on des formats de manière permanente*/ LABEL variable = label variable = label ; IF variable = value THEN variable = value ; /*Modifica3on des valeurs pour les NSP REFUS MISSING*/