Premier contact avec SAS



Documents pareils
INITIATION AU LOGICIEL SAS

SAS de base : gestion des données et procédures élémentaires

EXCEL et base de données

BIRT (Business Intelligence and Reporting Tools)

2. Cliquez Contact Directory of Public Administration. 5. Tapez le mot de passe - Hello (pour OFPA). Changez le mot de passe en cas de

SAS base Introduction à SAS SQL SAS IML

Guide de l usager - Libre-service de bordereaux de paie en ligne

Descriptif des fonctionnalités de notre site professionnel. Page 1 sur 13

CAPTURE DES PROFESSIONNELS

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

Netstorage et Netdrive pour accéder à ses données par Internet

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

A C T I V I T É S CE QUE JE CONNAIS CONTEXTE PROFESSIONNEL. Quel est l élément essentiel du poste informatique? ...

Manuel d utilisation

Procédure d installation

A.-M. Cubat PMB - Import de lecteurs - Généralités Page 1 Source :

AIDE MEMOIRE. Forprev. De l habilitation à la gestion de sessions. Page 1 sur 55

10 mn pour se connecter à un fichier Excel. Pas à Pas.

TD d économétrie appliquée : Introduction à STATA

Créer son questionnaire en ligne avec Google Documents

LES ACCES ODBC AVEC LE SYSTEME SAS

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

Retour table des matières

Logiciel photothèque professionnel GUIDE D UTILISATION - 1 -

Manuel de l utilisateur Solwatt du service extranet.

Programmation Web TP1 - HTML

Manuel d utilisation du site web de l ONRN

1 Modélisation d être mauvais payeur

TABLEAU CROISE DYNAMIQUE

TP 1. Prise en main du langage Python

5. Excel 2010, le tableur collaboratif. a. Concevez des tableaux lisibles

Installation et utilisation de Cobian Backup 8

Manuel d utilisation du logiciel

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

Tutoriel : Utilisation du serveur de calcul à distance de PSE

CREATION DMP En Accès Web

Introduction à Eclipse

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

COURS EN LIGNE DU CCHST Manuel du facilitateur/de l administrateur

HEITZ X Pro GESTION CLIENTÈLE

Travaux pratiques avec RapidMiner

1. Utilisation du logiciel Keepass

Gestion des données avec R

Le cas «BOURSE» annexe

Gestion des documents avec ALFRESCO

Principe de fonctionnement du lanceur d'application "AdisTlsStartCfgLotus"

L export de SAS vers Excel expliqué à ma fille

Cours 1 : introduction

Première étape : créer le fichier de données - extraire les données de PMB et les transférer dans Excel

1 Imputation par la moyenne

GUIDE D UTILISATION 1

Access 2010 Entraînement 1 Garage Renault Dossier 24 MCD

PRÉSENTÉ PAR : NOVEMBRE 2007

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

COMPRENDRE LES DIFFERENTS TYPES DE CONNEXION LORS DE LA

Gestionnaire de Réservations Guide Utilisateur

HighPush. document /06/2009 Révision pour version /11/2008 Revision pour la /10/2008 Documentation initiale.

GUIDE MEMBRE ESPACE COLLABORATIF. Février 2012

Guide explicatif de l utilisation. de la plateforme d éducation en ligne (e-learning)

La Gestion Électronique de Documents spécialement conçue pour les Experts Comptables

TP 1 Prise en main de l environnement Unix

Jérôme FESSY. IUT de Paris 5. Base de Données. Cours Introductif. Base de Données

Guide d'utilisation du téléphone IP Thomson ST-2030 G

SAS Foundation Installation sous Windows

TP1 - Prise en main de l environnement Unix.

Les ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel

Jexcel. V1.1.4 Manuel d'utilisation. modifié le 16 nov. 2004

Securexam Consignes pour l EFU Les 2, 3 et 4 juin 2015

ANNEXE 8 : Le Mailing

Prise en main. août 2014

FEN FICHE EMPLOIS NUISANCES

Portail de saisie en ligne

Cyberclasse L'interface web pas à pas

DU Endoscopie. Guide d utilisation. chirurgicale. Diplôme Universitaire d Endoscopie Chirurgicale

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

INTRODUCTION AU DATA MINING

Créer un site Internet dynamique

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail

Guichet ONEGATE COLLECTE XBRL SOLVABILITE II (S2P) Manuel d utilisateur VERSION /04/2014 ORGANISATION ET INFORMATIQUE SDESS.

Gestion des références bibliographiques. Comment simplifier la gestion des références bibliographiques?

8. Gestionnaire de budgets

Guide de l enseignant. pour le Passeport Sécurité. Mise à jour : 10 août 2015

MO-Call pour les Ordinateurs. Guide de l utilisateur

Le cas «BOURSE» annexe

TP Bases de données réparties

Mode d emploi du Bureau Virtuel (BV) à destination des étudiants en Formation À Distance (FAD)

GUIDE POUR PAYER LES COTISATIONS DU ZONTA INTERNATIONAL EN LIGNE

Le Système SAS et les accès via OLE DB : une introduction

Notice d utilisation

Comment se connecter au VPN ECE sous vista

Le langage C. Séance n 4

Modifications aux logiciels DCision ERP 11. Table des matières

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Mode operatoire Reseau pedagogique

Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1

Service d information pour remise de paiement de factures Scotia

WINSCOP. De créer des factures, et de les faire contrôler et valider à distance. De créer des devis, des notes de frais (achats et kilométriques).

Comment sélectionner des sommets, des arêtes et des faces avec Blender?

Les accès à Admission-Postbac

ENVOI EN NOMBRE DE SMS

Transcription:

Université de Montpellier 2 M2 MASS TP1 : Introduction au logiciel SAS Analyse statistique d une variable Premier contact avec SAS 1. Lancez le logiciel sous Windows. Vous voyez apparaître les fenêtres Editor (Editeur), Output (Sortie), Log (Journal) et Explore (Explorateur). 2. Dans la fenêtre SAS : Program Editor, entrez le programme suivant : DATA TP1; /* creation d une table provisoire */ INPUT Taille Poids Sexe $; CARDS; 174 65 M 169 56 F 166 48 F 181 80 M 168 53 F 176 76 M 190 77 M 159 70 F 162 60 F 164 51 F 160 73 F PROC PRINT; 3. Sauvegardez le fichier prog1.sas dans votre répertoire de travail. 4. Exécutez le programme : onglet run puis submit (soumettre) ou le petit bonhomme qui court. 5. On peut vérifier le contenu de la table créée TP1 dans la librairie Work (par défaut) en utilisant l Explorateur. Remarques importantes SAS ne différencie pas les majuscules et les minuscules. Par exemple, on peut écrire PRINT DATA=tp1 pour visualiser les données contenues dans la table TP1. Ne pas oublier les ; à la fin chaque instruction. En cas d erreur après avoir exécuté le programme, TOUJOURS vérifier la fenêtre SAS : Log. Le signe $ dans la déclaration des variables indique que la variable précédant le $ est de type chaîne de caractères (qualitative). Dans un programme SAS, tout ce qu on écrit entre /*... */ ne sera pas pris en compte pen- dant l exécution du programme. Ceci permet d inclure de commentaires pour une meilleure compréhension du programme. Sauvegardez toujours votre programme avant de le soumettre.

Des petits trucs à savoir... 6. Création d une librairie de travail. Par défaut, les tables créées dans SAS sont enregistrées dans la librairie Work qui est vidée lorsque l on quitte le logiciel. Pour conserver les données, il est recommandé de créer une librairie (un répertoire de travail personnel) qui sera conservée entre différentes sessions SAS. Pour cela il suffit de créer un répertoire mestpsas dans l Explorateur. Pour que la table SAS TP1 du programme prog1.sas soit bien créée dans la librairie mestpsas, il faut ajouter une instruction dans le programme prog1.sas : LIBNAME mestpsas???/mestpsas ; où??? désigne le chemin qui mène au répertoire mestpsas. Cette instruction n est réalisée qu une fois au début de la session. Pour indiquer à SAS que l on souhaite enregistrer les données dans cette librarie il faut précéder le nom des tables par mestpsas. comme suit : la ligne DATA TP1 ; du programme prog1.sas deviendra alors DATA mestpsas.tp1 ; Si, au cours d une session, le préfixe mestpsas est omis, les données seront enregistrées dans la librairie par défaut Work. 7. Il est souvent difficile de lire le rapport d erreur qui apparait dans la fenêtre LOG lorsque les rapports d erreur s accumulent. Pour éviter ce problème, on peut simplement aller dans Edit > Clear All dans la fenêtre LOG. 8. Vous aurez sans doute remarqué le nombre grandissant de fenêtres. Pour retrouver rapidement vos fenêtres LOG, Editor et Output, les touches F. peuvent vous aider : F5= Editor, F6=LOG et F7=Output qui sont des raccourcis. Sinon, on peut toujours choisir dans le menu View > {Editor, Log, Output}. Lectures de données à partir d un fichier externe Les données sont maintenant disponibles dans un fichier externe qui se nomme ici individus.txt. La première chose à faire est de bien identifier le type de fichier à lire (tabulaire ou délimité, et si c est le cas, par quel délimiteur). Il faut aussi savoir quelles sont les données contenues et quels sont les formats associés. Ce fichier est extrait d un tableur du type excel. Le fichier texte est d un format particulier : Tab delimited file. Le programme suivant permet de lire le fichier externe individus.txt et de créer la table SAS tableindiv : DATA tableindiv; INFILE individus.txt DSD DLM= 09 x TRUNCOVER; INPUT prenom $ nom $ sexe $ anniversaire : DDMMYY10. age ville $10.; FORMAT sexe $1. anniversaire : DDMMYY10. age 2. ville $15.; PROC PRINT DATA = tableindiv; L option DSD est là pour prévenir les données manquantes et l option TRUNCOVER permet de lire des lignes non complètes sans passer automatiquement à la ligne suivante. Ici, Londres n occupe pas 10 caractères, et sans TRUNCOVER, SAS serait tenté d aller à la ligne suivante. Il est donc conseillé d associer l option TRUNCOVER à l instruction INFILE. Manipulation de tables 9. Fusion verticale de tables La fusion verticale consiste à empiler les données de plusieurs tables SAS. Elle est réalisée dans une étape DATA avec l instruction SET. Dans ce type de fusion, on a généralement des ensembles de données avec des variables communes.

DATA tablefusv; SET TableLue1 TableLue2...tableLuen; Les données sont empilées dans la table résultante mais s il existe des doublons dans les données, ils ne sont pas pour autant éliminés. On appelle doublon la répétition d un individu avec les mêmes caractéristiques. Afin d éliminer les doublons, il faut utiliser la procédure SORT avec l option NODUPRECS. PROC SORT DATA=combine NODUPRECS; BY prenom age; PROC PRINT DATA=combine; 10. Fusion horizontale de tables Pour réaliser la fusion horizontale de tables SAS, ces tables doivent posséder au moins une variable commune qui servira à recoller les données. Attention, avant d effectuer une fusion horizontale de plusieurs tables, les données de chaque table doivent être triées selon la (les) variable(s) de recollement. La procédure SORT permet de trier des tables : PROC SORT DATA = tablelue; BY Var1 Var2... Varp; La fusion horizontale est réalisée dans une étape DATA avec l instruction MERGE. Il faut indiquer à SAS, avec l instruction BY, quelles sont les variables de recollement. DATA tablefush; MERGE Tablelue1 Tablelue2; BY Var1 Var2... Varp; Par exemple, la fusion des tables table1 et table2 en une troisième table combine selon la variable de recollement prenom est obtenue avec le programme suivante : DATA table1; DATA table2; INPUT prenom $ age; INPUT prenom $ sexe $; Chris 36 Tom M Jane 21 Chris M Tom 30 Jane F Joe 49 Joe M ; ; PROC SORT DATA=table1; PROC SORT DATA=table2; DATA combine;

MERGE table1 table2; PROC PRINT DATA=combine; Création et sélection de variables utiles On peut rajouter de nouvelles variables à l intťerieur d une étape DATA en les définissant directement, par exemple dans le code suivant : DATA Tablenouv; SET Tablelue; NouvelleVar = Var1 + Var2; Var1 et Var2 sont des variables de Tablelue et la table Tablenouv contient la variable NouvelleVar en plus de toutes les variables de Tablelue. Il est possible, au sein d une étape DATA de supprimer certaines variables au moyen de l option DROP = Var1. On peut aussi utiliser l ption KEEP=Var1... VarN qui permet de ne garder que certaines des variables de la table. Par exemple, DATA Tablenouv ; SET Tablelue (KEEP = Var2); On peut aussi supprimer certaines observations à l aide de l instruction WHERE, comme l illustre l exemple suivant. La table Homme est construite à partir de la table Indiv en ne conservant que les individus de sexe masculin. DATA Indiv; INPUT prenom $ sexe $; Chris M Jane F Tom M Joe M ; DATA Homme; SET Indiv (WHERE = (sexe = M )); PROC PRINT DATA = Indiv; PROC PRINT DATA = Homme;

Exercice 1 Le tableau suivant donne le nom des dernières familles qui ont emménagé dans la Résidence des chênes. Ce tableau nous informe de leur date d emménagement, du numéro de leur appartement, du nombre d enfants dans cette famille et du département où ils vivaient précédemment. Famille Date d arrivée n o d appart. nb d enfants Ancien département Durant 11/02/2005 10 2 Aube Martin 18/12/2008 3 3 Haute-Marne Lefevre 05/07/2006 5 1 Vosges Dupont 30/05/2007 11 3 Yonne Barraux 15/06/2006 7 2 Essonne François 19/09/2008 13 4 Calvados 1. Créer une table Table1 contenant les informations excepté la date d arrivée, pour les trois premières familles en entrant les données dans le programme. 2. Reprendre la question 1 en supposant que le nombre d enfants pour la famille Martin et l ancien département de la famille Durant sont inconnus. La table créée sera appelée Table1bis. 3. Créer la table Table2 contenant toutes les informations pour les trois premières familles. Vérifier son contenu grâce à l instruction CONTENTS. De même, créer la table Table3 contenant toutes les informations pour les trois dernières familles. 4. Créer la table Tablefinale en fusionnant les tables Table2 et Table3. 5. Ces données sont disponibles dans le fichier externe nouveauxhabitants.txt. Construire la table Tablefinale2 en lisant les données dans le fichier externe (utiliser les informats). Construire la table Tablefinale3 en donnant un label à chaque variable.