Exemple PLS avec SAS



Documents pareils
Improving the breakdown of the Central Credit Register data by category of enterprises

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

WEB page builder and server for SCADA applications usable from a WEB navigator

Instructions Mozilla Thunderbird Page 1

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

APPENDIX 6 BONUS RING FORMAT

Gestion des prestations Volontaire

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

Application Form/ Formulaire de demande

La solution idéale de personnalisation interactive sur internet

Contrôle d'accès Access control. Notice technique / Technical Manual

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

FOURTH SESSION : "MRP & CRP"

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Tammy: Something exceptional happened today. I met somebody legendary. Tex: Qui as-tu rencontré? Tex: Who did you meet?

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Eléments de statistique

Exercices sur SQL server 2000

ONTARIO Court File Number. Form 17E: Trial Management Conference Brief. Date of trial management conference. Name of party filing this brief

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Credit Note and Debit Note Information (GST/ HST) Regulations

Once the installation is complete, you can delete the temporary Zip files..

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Data issues in species monitoring: where are the traps?

Règlement sur le télémarketing et les centres d'appel. Call Centres Telemarketing Sales Regulation

PROJET DE LOI. An Act to Amend the Employment Standards Act. Loi modifiant la Loi sur les normes d emploi

Support Orders and Support Provisions (Banks and Authorized Foreign Banks) Regulations

VTP. LAN Switching and Wireless Chapitre 4

Forthcoming Database

Stakeholder Feedback Form January 2013 Recirculation

CONVENTION DE STAGE TYPE STANDART TRAINING CONTRACT

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

How to Login to Career Page

Editing and managing Systems engineering processes at Snecma

THE SUBJUNCTIVE MOOD. Twenty-nineth lesson Vingt-neuvième leçon

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

Notice Technique / Technical Manual

COPYRIGHT Danish Standards. NOT FOR COMMERCIAL USE OR REPRODUCTION. DS/EN 61303:1997

Interest Rate for Customs Purposes Regulations. Règlement sur le taux d intérêt aux fins des douanes CONSOLIDATION CODIFICATION

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Cedric Dumoulin (C) The Java EE 7 Tutorial

LOI SUR LA RECONNAISSANCE DE L'ADOPTION SELON LES COUTUMES AUTOCHTONES ABORIGINAL CUSTOM ADOPTION RECOGNITION ACT

Cité du design - Concours d entrée Sadrine Binoux

EN UNE PAGE PLAN STRATÉGIQUE

Tex: The book of which I'm the author is an historical novel.

Règlement relatif à l examen fait conformément à la Déclaration canadienne des droits. Canadian Bill of Rights Examination Regulations CODIFICATION

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

Edna Ekhivalak Elias Commissioner of Nunavut Commissaire du Nunavut

EU- Luxemburg- WHO Universal Health Coverage Partnership:

PHOTO ROYAUME DE BELGIQUE /KINDOM OF BELGIUM /KONINKRIJK BELGIE. Données personnelles / personal data

IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board

UNIVERSITE DE YAOUNDE II

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Module Title: French 4

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

WINTER BOAT STORAGE SYSTEM SYSTÈME DE REMISAGE HIVERNAL POUR BATEAU

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

General Import Permit No. 13 Beef and Veal for Personal Use. Licence générale d importation n O 13 bœuf et veau pour usage personnel CONSOLIDATION

Material Banking Group Percentage Regulations. Règlement fixant le pourcentage (groupe bancaire important) CONSOLIDATION CODIFICATION

Cette Leçon va remplir ces attentes spécifiques du curriculum :

Institut français des sciences et technologies des transports, de l aménagement

This is a preview - click here to buy the full publication NORME INTERNATIONALE INTERNATIONAL STAN DARD. Telecontrol equipment and systems

INSERTION TECHNIQUES FOR JOB SHOP SCHEDULING

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

MANUEL MARKETING ET SURVIE PDF

Discours du Ministre Tassarajen Pillay Chedumbrum. Ministre des Technologies de l'information et de la Communication (TIC) Worshop on Dot.

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

Life Companies Borrowing Regulations. Règlement sur les emprunts des sociétés d assurance-vie CONSOLIDATION CODIFICATION

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

1.The pronouns me, te, nous, and vous are object pronouns.

ANGULAR JS AVEC GDE GOOGLE

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

APPENDIX 2. Provisions to be included in the contract between the Provider and the. Holder

Modèles pour données répétées

Export Permit (Steel Monitoring) Regulations. Règlement sur les licences d exportation (surveillance de l acier) CONSOLIDATION CODIFICATION

DOCUMENTATION - FRANCAIS... 2

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

Get Instant Access to ebook Cest Maintenant PDF at Our Huge Library CEST MAINTENANT PDF. ==> Download: CEST MAINTENANT PDF

et Active Directory Ajout, modification et suppression de comptes, extraction d adresses pour les listes de diffusion

L industrie pharmaceutique et la grippe aviaire

BNP Paribas Personal Finance

CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009

Borrowing (Property and Casualty Companies and Marine Companies) Regulations

Innovation in Home Insurance: What Services are to be Developed and for what Trade Network?

: Machines Production a créé dès 1995, le site internet

INSTRUCTIONS. Comment compléter le formulaire. How to complete this form. Instructions

TABLE DES MATIERES A OBJET PROCEDURE DE CONNEXION

Project 1 Experimenting with Simple Network Management Tools. ping, traceout, and Wireshark (formerly Ethereal)

Compléter le formulaire «Demande de participation» et l envoyer aux bureaux de SGC* à l adresse suivante :

Dans une agence de location immobilière...

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

Transcription:

Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that are biologically active. Testing a compound for biological activity is an expensive procedure, so it is useful to be able to predict biological activity from cheaper chemical measurements. In fact, computational chemistry makes it possible to calculate certain chemical measurements without even making the compound. These measurements include size, lipophilicity, and polarity at various sites on the molecule. The following statements create a data set named pentatrain, which contains these data. You would like to study the relationship between these measurements and the activity of the compound, represented by the logarithm of the relative Bradykinin activating activity (log_rai). Notice that these data consist of many predictors relative to the number of observations. Partial least squares is especially appropriate in this situation as a useful tool for finding a few underlying predictive factors that account for most of the variation in the response. Typically, the model is fit for part of the data (the "training" or "work" set), and the quality of the fit is judged by how well it predicts the other part of the data (the "test" or "prediction" set). For this example, the first 15 observations serve as the training set and the rest constitute the test set (refer to Ufkes et al. 1978; Ufkes et al. 1982). When you fit a PLS model, you hope to find a few PLS factors that explain most of the variation in both predictors and responses. Factors that explain response variation provide good predictive models for new responses, and factors that explain predictor variation are well represented by the observed values of the predictors. The following statements fit a PLS model with two factors and save predicted values, residuals, and other information for each data point in a data set named outpls.

PROGRAMME SAS options ls=64 ps=80 nodate nonumber; data pentatrain; input obsnam $ S1 L1 P1 S2 L2 P2 S3 L3 P3 S4 L4 P4 S5 L5 P5 log_rai @@; n = _n_; datalines; VESSK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701 1.9607-1.6324 0.5746 1.9607-1.6324 0.5746 2.8369 1.4092-3.1398 0.00 VESAK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701 1.9607-1.6324 0.5746 0.0744-1.7333 0.0902 2.8369 1.4092-3.1398 0.28 VEASK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701 0.0744-1.7333 0.0902 1.9607-1.6324 0.5746 2.8369 1.4092-3.1398 0.20 VEAAK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701 2.8369 1.4092-3.1398 0.51 VKAAK -2.6931-2.5271-1.2871 2.8369 1.4092-3.1398 2.8369 1.4092-3.1398 0.11 VEWAK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701-4.7548 3.6521 0.8524 0.0744-1.7333 0.0902 2.8369 1.4092-3.1398 2.73 VEAAP -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701-1.2201 0.8829 2.2253 0.18 VEHAK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701 2.4064 1.7438 1.1057 0.0744-1.7333 0.0902 2.8369 1.4092-3.1398 1.53 VAAAK -2.6931-2.5271-1.2871 0.0744-1.7333 0.0902 2.8369 1.4092-3.1398-0.10 GEAAK 2.2261-5.3648 0.3049 3.0777 0.3891-0.0701 2.8369 1.4092-3.1398-0.52 LEAAK -4.1921-1.0285-0.9801 3.0777 0.3891-0.0701 2.8369 1.4092-3.1398 0.40 FEAAK -4.9217 1.2977 0.4473 3.0777 0.3891-0.0701 2.8369 1.4092-3.1398 0.30 VEGGK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701 2.2261-5.3648 0.3049 2.2261-5.3648 0.3049 2.8369 1.4092-3.1398-1.00 VEFAK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701-4.9217 1.2977 0.4473 0.0744-1.7333 0.0902 2.8369 1.4092-3.1398 1.57 VELAK -2.6931-2.5271-1.2871 3.0777 0.3891-0.0701-4.1921-1.0285-0.9801 0.0744-1.7333 0.0902 2.8369 1.4092-3.1398 0.59 ; proc reg data=pentatrain; model log_rai = S1-S5 L1-L5 P1-P5; run; ods graphics on; proc pls data=pentatrain; model log_rai = S1-S5 L1-L5 P1-P5; run; proc pls data=pentatrain nfac=2 plot=(parmprofiles VIP); model log_rai = S1-S5 L1-L5 P1-P5; run; ods graphics off;

Dans cette première partie la procédure REG est utilisée. Nous constatons un certain nombre de problèmes dus au fait de disposer de seulement de 15 observations pour un modèle construit à partir de 15 variables explicatives : TABLEAU 1 : Procédure REG Modèle : MODEL1 Variable dépendante : log_rai Nombre d'observations lues 15 Nombre d'observations utilisées 15 Analyse de variance Somme des Moyenne Source DDL carrés quadratique Modèle 11 11.39423 1.03584 Erreur 3 0.10141 0.03380 Total sommes corrigées 14 11.49564 Analyse de variance Valeur Source F Pr > F Modèle 30.64 0.0084 Erreur Total sommes corrigées Root MSE 0.18385 R carré 0.9912 Moyenne dépendante 0.45200 R car. ajust. 0.9588 Coeff Var 40.67543 NOTE: Model is not full rank. Least-squares solutions for the parameters are not unique. Some statistics will be misleading. A reported DF of 0 or B means that the estimate is biased. NOTE: The following parameters have been set to 0, since the variables are a linear combination of other variables as shown. L5 = 1.04118 * Intercept + 0.12973 * S5 P2 = -4.53088 * Intercept + 1.7768 * S2-2.58979 * L2 P4 = 0.22776 * Intercept + 0.25198 * S4 + 0.09018 * L4 P5 = 0.6118 * Intercept - 1.32243 * S5 Valeurs estimées des paramètres Valeur estimée Erreur Valeur Variable DDL des paramètres type du test t Pr > t Intercept B 0.44572 4.15207 0.11 0.9213 S1 1 0.12634 1.05805 0.12 0.9125 S2 B 0.24757 0.15668 1.58 0.2122 S3 1-0.04959 0.04761-1.04 0.3741 S4 B -0.11379 0.09455-1.20 0.3151 S5 B 0.03536 0.05320 0.66 0.5538 L1 1 0.26808 1.17196 0.23 0.8338

Procédure REG Modèle : MODEL1 Variable dépendante : log_rai Valeurs estimées des paramètres Valeur estimée Erreur Valeur Variable DDL des paramètres type du test t Pr > t L2 B -0.15081 0.17790-0.85 0.4589 L3 1 0.36201 0.08500 4.26 0.0237 L4 B -0.08741 0.09185-0.95 0.4114 L5 0 0... P1 1-0.44236 1.22959-0.36 0.7429 P2 0 0... P3 1 0.11778 0.24916 0.47 0.6687 P4 0 0... P5 0 0... TABLEAU 2: The PLS Procedure Data Set WORK.PENTATRAIN Factor Extraction Method Partial Least Squares PLS Algorithm NIPALS Number of Response Variables 1 Number of Predictor Parameters 15 Missing Value Handling Exclude Number of Factors 15 Number of Observations Read 15 Number of Observations Used 15 On constate que la première composante PLS explique 16,9% de la variation des 15 prédicteurs mais dispose d un R2 de 89,63% avec la variable à expliquer. Les deux premières composantes PLS expliquent 29,67% de la variation des 15 prédicteurs, pour un R2 avec la variable à expliquer de 97,47%. Les valeurs affichées dans le tableau ci-dessous sont illustrées par le graphique qui suit. Variation en pourcentage expliquée par Partial Least Squares Factors Nombre de Variables facteurs Effets du modèle dépendantes extraits Actuel Total Actuel Total 1 16.9014 16.9014 89.6399 89.6399 2 12.7721 29.6735 7.8368 97.4767 3 14.6554 44.3289 0.4636 97.9403 4 11.8421 56.1710 0.2485 98.1889 5 10.5894 66.7605 0.1494 98.3383 6 5.1876 71.9481 0.2617 98.6001 7 6.1873 78.1354 0.2428 98.8428 8 7.2252 85.3606 0.1926 99.0354 9 6.7285 92.0891 0.0725 99.1080 10 7.9076 99.9967 0.0000 99.1080 11 0.0033 100.0000 0.0099 99.1179 12 0.0000 100.0000 0.0000 99.1179 13 0.0000 100.0000 0.0000 99.1179 14 0.0000 100.0000 0.0000 99.1179 15 0.0000 100.0000 0.0000 99.1179