Initiation à SAS Statistical Analysis System



Documents pareils
SAS de base : gestion des données et procédures élémentaires

Initiation au logiciel SAS(9) pour Windows

Formation au logiciel SAS Statistical Analysis System

INITIATION AU LOGICIEL SAS

Exemples d application

ODS : organiser et diffuser des sorties

Introduction au logiciel SAS François-Xavier LEJEUNE

L export de SAS vers Excel expliqué à ma fille

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Gnuplot. Chapitre Lancer Gnuplot. 3.2 Options des graphes

SHERLOCK 7. Version du 01/09/09 JAVASCRIPT 1.5

Crédit Scoring. Master 2 SRO. Année scolaire 2009/2010. Professeur : RICHARD EMILION. Réalisé par : MAHAMAT OUMAR ALHABO et OULD EL HADDAD CHEIKH

TP SAS initiation IUP MIAGE L3

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

1. Qu'est-ce que SQL? La maintenance des bases de données Les manipulations des bases de données... 5

Séance 11 : Typologies

Exemple PLS avec SAS

REPORTING MÉTIERS SAS APPLICATIONS AVEC. Mettre en forme et diffuser vos résultats avec SAS 9 et SAS 9 BI. Olivier Decourt. Préface de Philippe Letren

Approche Contract First

Le Langage De Description De Données(LDD)

Langage SQL : créer et interroger une base

1 Imputation par la moyenne

LES ACCES ODBC AVEC LE SYSTEME SAS

BIRT (Business Intelligence and Reporting Tools)

Convertisseur BBAN/IBAN

Note de cours. Introduction à Excel 2007

Lire ; Compter ; Tester... avec R

Procédures Stockées WAVESOFT ws_sp_getidtable Exemple : ws_sp_getnextsouche Exemple :... 12

M2-Images. Rendu Temps Réel - OpenGL 4 et compute shaders. J.C. Iehl. December 18, 2013

Cours iguess. inotes v10.1

Rappel. Analyse de Données Structurées - Cours 12. Un langage avec des déclaration locales. Exemple d'un programme

Le langage SQL pour Oracle - partie 1 : SQL comme LDD

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ;

LES TYPES DE DONNÉES DU LANGAGE PASCAL

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Logiciel XLSTAT version rue Damrémont PARIS

Architecture de la plateforme SBC

Les ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel

données en connaissance et en actions?

Utilisation du Logiciel de statistique SPSS 8.0

Logiciel : GLPI Version : SYNCRHONISATION DE GLPI AVEC ACTIVE DIRECTORY. Auteur : Claude SANTERO Config. : Windows 2003.

Sauvegarde et Restauration d un environnement SAS

TP 1. Prise en main du langage Python

SAS base Introduction à SAS SQL SAS IML

Séance 0 : Linux + Octave : le compromis idéal

HMI target Visu / PLC HMI. Pour réaliser une interface homme machine avec PLC control

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Modèles pour données répétées

Phone Manager Soutien de l'application OCTOBER 2014 DOCUMENT RELEASE 4.1 SOUTIEN DE L'APPLICATION

Compléments de documentation Scilab : affichage de texte et formatage de nombres

ContactForm et ContactFormLight - Gestionnaires de formulaire pour Prestashop Edité par ARETMIC S.A.

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan

EPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE

Cours de C. Petits secrets du C & programmation avancée. Sébastien Paumier

Le langage C. Séance n 4

La place de SAS dans l'informatique décisionnelle

Sébastien Ringuedé. Sébastien Ringuedé. 3 e édition. édition. Ressources en ligne. Couvre le programme de la certification Base Programming for SAS 9

Guide d utilisation commandes des pièces de rechange Rev.1.0.3

Ordonnance sur le paiement à un enfant ou à une personne qui n est pas saine d esprit. Infant or Person of Unsound Mind Payment Order CODIFICATION

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Mémo d utilisation de ADE-4

Interest Rate for Customs Purposes Regulations. Règlement sur le taux d intérêt aux fins des douanes CONSOLIDATION CODIFICATION

Microsoft Excel. Tableur

Règlement relatif à l examen fait conformément à la Déclaration canadienne des droits. Canadian Bill of Rights Examination Regulations CODIFICATION

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Cycle de Découverte n 1 VISUALISER Créer la prochaine application innovante

Présentation des CMS au CIFOM-EAA

Air Transportation Tax Order, Décret de 1995 sur la taxe de transport aérien CONSOLIDATION CODIFICATION

Le Système SAS et les accès via OLE DB : une introduction

Allo Support et services électroniques

Olivier Mondet

Planifier les rapports d

MEDIAplus elearning. version 6.6

EXCEL et base de données

Introduction à MATLAB R


Le cas «BOURSE» annexe

Thank you for choosing the Mobile Broadband USB Stick. With your USB Stick, you can access a wireless network at high speed.

Préface Pearson Education France SAS, 2e édition Sébastien Ringuedé

SQL Limitations Mémoire

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES

Mysql. Les requêtes préparées Prepared statements

WHS ProRealTime. édition

COMPRENDRE LES DIFFERENTS TYPES DE CONNEXION LORS DE LA

Manuel de formation Spaceman 1 ère journée

Initiation à la programmation en Python

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Importer un fichier CSV

Le cas «BOURSE» annexe

calls.paris-neuroscience.fr Tutoriel pour Candidatures en ligne *** Online Applications Tutorial

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

Création de Sous-Formulaires

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

GUIDE PRATIQUE déplacements professionnels temporaires en France et à l étranger

Transcription:

Initiation à SAS Statistical Analysis System Christian Longhi LATAPSES IDEFI.

Base de Données Logiciel d'étude de données individuelles CRÉER, MANIPULER et GERER UTILISER TABLEAUX SAS

SAS : ENSEMBLE DE MODULES. SAS/FSP SAS/ETS SAS/AF SAS DE BASE SAS DE BASE... SAS/GRAPH SAS/STAT

Programmes SAS Suite d Etapes Ensemble d Instructions. Instruction = Mot clef. TOUTES LES INSTRUCTIONS SE TERMINENT PAR UN POINT VIRGULE

ETAPES : Définition tableaux et Procédures Statistiques, Graphiques DATA PROC

Programmes SAS Instructions d étape DATA et PROC, et Instructions de programmation. Les étapes DATA préparent les tableaux SAS. Les étapes PROC exploitent les tableaux SAS. Dans chaque instruction, on trouve des informations sur la tache à effectuer, le nom du tableau à créer, ou le nom de la procédure à effectuer, le nom du tableau à utiliser Toute instruction peut s accompagner d OPTIONS.

Fichiers FICHIERS SAS (SAS Data Sets). Les tableaux SAS sont : TEMPORAIRES OU PERMANENTS Définition de «LIBRARY». FICHIERS WINDOWS. Program Editor (*.sas) Log Output (*.lst)

Définitions TABLEAUX SAS VARIABLES SAS Nom, Type (caractère ou numérique), Longueur. Observations NOMS SAS PROGRAMMES SAS OPTIONS SAS

Etape DATA : Création d un tableau SAS Données sur support externe DATA CARDS INFILE IMPORT

UTPUT OUT= Etape DATA : Création d un tableau SAS A partir de tableaux SAS SET DATA MERGE UPDATE

Instruction INPUT Mode LISTE de Input : INPUT nom de la 1 variable... nom de la nième variable; Mode COLONNE de Input : INPUT nom de variable [$] colonne début [-colonne fin] [.décimale]; Dessin d Enregistrement Mode FORMAT de Input : INPUT [pointeur] nom de variable [$] format d'entrée...;

Instruction SET libname b 'c:\tableaux'; data b.tab2; set b.tab1; 1. Assignation, Fonction 2. Instructions 3. Instructions de contrôle, expressions logiques 4. Concaténation

Instruction MERGE data three; merge one (in=inone) two (in=intwo); run; Instructions BY (Proc Sort)

LABEL : Variables. FORMAT : Modalités des variables.

Variables Machines SAS _N_ IN = _ERROR_ _TYPE_, _FREQ_ FIRST.variable, LAST.variable

data t1;input x y z $ @@; id=_n_; cards; 11 3 AA 12 4 EE 12 3 ZZ 13 2 EE 13 3 ER 14 9 RT 14 8 YT 14 3 ER 11 4 BB 11 2 CV 13 5 RT 13 4 AZ 12 6 EF 12 8 ED ; run; proc sort data=t1; by x; run; data t2; set t1; by x; if FIRST.x = 1 or LAST.x = 1; run; proc print data=t2; run;

Instruction ARRAY

Généralités sur les PROCEDURES LES PROCEDURES OPERENT SUR LES TABLEAUX SAS FORME GENERALE : PROC nom de procédure Options; Instructions particulières / options; Instructions particulières / options;...; RUN;

Généralités sur les PROCEDURES Les options de PROC et les instructions particulières dépendent de la procédure. Eventuellement, des instructions propres à la procédure peuvent avoir leurs propres options: celles-ci sont alors placées derrière un /. MAIS certaines options de PROC et certaines instructions sont communes à la quasi-totalité des procédures.

Généralités sur les PROCEDURES Option: DATA = nom de tableau; Définit le nom du tableau SAS en entrée Exemple: PROC CORR DATA = B.FIC; Si l'option DATA = nom est absente, la procédure travaille par défaut sur le dernier tableau créé dans les étapes en amont Instruction BY (Fichiers stratifiés SORT) Instruction VAR (Variables actives) Instruction ID (Identificateur)

Procédure SORT OBJET: Trier les observations d'un tableau SAS selon les valeurs d'une ou plusieurs variables, ce qui permettra par exemple de les interclasser, de traiter les données en sous-population SYNTAXE: PROC SORT options; BY liste de variables critères de tri; RUN; Options DE PROC SORT: DATA = nom du tableau à trier, par défaut le dernier tableau crée. OUT = nom de tableau trié, par défaut le même nom que le tableau d'entrée. TRI PAR ORDRE DECROISSANT: Dans BY, faire précéder chaque variable concernée du mot clé DESCENDING.

Procédure CONTENTS Proc contents data= nom de tableau ; Run;

Procédure PRINT Proc print data= nom de tableau (obs=n); Title 'Titre'; Title2 Sous-Titre'; Var liste de variables; Id variables ; By variables ; Pageby variables ; Sum variables ; Run;

Procédure MEANS PROC MEANS DATA = Tableau SAS Options; VAR variables; CLASS variables; BY variables; FREQ variable; WEIGHT variable; OUTPUT OUT = tableau SAS mot-clé=noms de variables...; RUN;

Procédure MEANS LISTE DES STATISTIQUES DISPONIBLES : N, NMISS, MEAN, STD, VAR, MIN, MAX, RANGE, SUM, USS, CSS, CV, STDERR, T, PRT, SUMWGT Si aucune statistique n'est demandée, sortent par défaut celles qui sont soulignées. INSTRUCTION BY : Elle permet de sortir les statistiques demandées pour chaque modalité de la variable-by.le tableau doit avoir été trié avant. INSTRUCTION CLASS : Elle a le même rôle qu'une instruction BY. Seule change la présentation des résultats. De plus, le tableau n'a pas à être trié. INSTRUCTION FREQ : Chaque observation du tableau d'entrée représente n observations, si n est la valeur de la variable-freq. INSTRUCTION WEIGHT : Les moyennes et les variances sont pondérées par les valeurs de la variable de pondération. INSTRUCTION OUTPUT : Les mots-clés disponibles sont : N, NMISS, MEAN, STD, VAR, MIN, MAX, RANGE, SUM, USS, CSS, CV, STDERR, T, PRT, SUMWGT On a autant d'observations dans le tableau de sortie que de groupes BY ou CLASS (une seule s'il n'y a ni BY ni CLASS).

Procédure UNIVARIATE PROC UNIVARIATE DATA= PLOT NORMAL; VAR variables ; ID variable; RUN;!!! Toutes les statistiques univariées.

Procédure FREQ PROC FREQ Options; TABLES Demandes/Options; WEIGHT Variable; FORMAT Variables et Formats; BY Variables ; TITLE 'Titre'; WHERE Condition Logique; RUN; (Tables x y x*y x*y*z x*(y z))

Procédure CORR PROC CORR <option(s)>; BY <DESCENDING> variable-1<...; FREQ frequency-variable; PARTIAL variable(s); VAR variable(s); WEIGHT weight-variable; WITH variable(s); RUN;

Procédure PLOT PROC PLOT DATA = Tableau SAS Options; PLOT demande / options; BY variables; RUN; Un graphique se demande par : variable verticale * variable horizontale Exemple: PLOT Y*X; Y définit l'axe vertical et X l'axe horizontal

Procédure PLOT QUELQUES OPTIONS DE LA PROCEDURE - DATA= nom du tableau de données. -UNIFORM: pour conserver une échelle identique si on utilise un BY, les graphiques par strates sont donc directement comparables. -NOLEGEND: pour supprimer la légende en tête de graphique - VPERCENT = Valeur - HPERCENT = Valeur : pour éditer plusieurs graphiques par page OPTION DE L'INSTRUCTION PLOT - OVERLAY : Les graphiques de l'instruction sont superposés PLOT X*Y A*B/OVERLAY;

Procédure CHART PROC CHART DATA = nom; BY variables de stratification; FORMAT variable format variable format...; HBAR variables / options; VBAR variables / options; PIE variables / options; STAR variables / options; BLOCK variables / options; RUN;

Procédure CHART OPTIONS COMMUNES AUX INSTRUCTIONS HBAR, VBAR, PIE, STAR, BLOCK MISSING : Les données manquantes entrent dans l'histogramme, sinon elles sont ignorées. DISCRETE : Précise que la variable numérique indiquée est discrète, et que chaque valeur est une modalité, sinon SAS découpe en tranches. FREQ = variable : Nomme une variable dans le tableau permettant de pondérer les observations. SUMVAR = variable :Précise une variable du tableau d'entrée dont on veut le résumé numérique, qui servira à déterminer la taille des barres, blocs, tranches... Le type de résumé est précisé par l'option TYPE =. Exemple : STAR A / SUMVAR = X AXIS = 100 200; LEVELS = n : Pour les variables numériques, impose le nombre de tranches à effectuer, c'est à dire le nombre de barres, blocs... OPTIONS PARTICULIERES A INSTRUCTIONS HBAR, VBAR, BLOCK GROUP = variable : Produit dansle graphique des histogrammes pour chaque modalité de la variable GROUP, y compris pour les valeurs manquantes. SUBGROUP = variable : La contribution de chaque modalité de la variable SUBGROUP est représentée dans les barres ou blocs d'histogrammes.

Procédure REG PROC REG Options; MODEL var. dépendantes=var. indépendantes/options; VAR variables; OUTPUT OUT = nom tableau résultats ; RESTRICT équation,...; TEST équation,...; MTEST équation,...; ID variable ; WEIGHT variable ; FREQ variable ; BY variables ; PLOT y-variable*x-variable='symbol'/options

Procédure REG PROC REG < options > ; < label: > MODEL dependents=<regressors> < / options > ; BY variables ; FREQ variable ; ID variables ; VAR variables ; WEIGHT variable ; ADD variables ; DELETE variables ; < label: > MTEST <equation,...,equation> < / options > ; OUTPUT < OUT=SAS-data-set > keyword=names <... keyword=names > ; PAINT <condition ALLOBS> < / options > < STATUS UNDO> ; PLOT <yvariable*xvariable> <=symbol> <...yvariable*xvariable> <=symbol> < / options > ; REFIT; RESTRICT equation,...,equation ; REWEIGHT <condition ALLOBS> < / options > < STATUS UNDO> ; < label: > TEST equation,<,...,equation> < / option > ;

Procédure REG OPTIONS DE L'INSTRUCTION MODEL P CLM CLI R SELECTION=option [FORWARD (or F), BACKWARD (or B), STEPWISE, MAXR, MINR, RSQUARE, ADJRSQ, CP, or NONE] INCLUDE= n STOP= s, START=s..