Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.



Documents pareils
L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Conférence Bales II - Mauritanie. Patrick Le Nôtre. Directeur de la Stratégie - Secteur Finance Solutions risques et Réglementations

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Installer Enterprise Miner 5.1 en SAS environnement Windows

1 Modélisation d être mauvais payeur

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

Comment valoriser votre patrimoine de données?

Hervé Couturier EVP, SAP Technology Development

Entreprise et Big Data

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Exemple PLS avec SAS

Agenda de la présentation

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

données en connaissance et en actions?

Formations Techniques : Infrastructures Janvier - Mars 2009

Introduction à la B.I. Avec SQL Server 2008

IBM Cognos Enterprise

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

PROPOSITION DE FORMATION DE GREGOIRE DE LASSENCE A EPITA VERSION 1.0

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

Conclusion. Rôle du géodécisionnel dans une organisation gouvernementale Contexte organisationnel à Infrastructure Canada Le projet Les résultats

L Art d être Numérique. Thierry Pierre Directeur Business Development SAP France

Spécificités, Applications et Outils

CALENDRIER DES FORMATIONS

Application Form/ Formulaire de demande

Didier MOUNIEN Samantha MOINEAUX

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

BI = Business Intelligence Master Data-Science

SQL SERVER 2008, BUSINESS INTELLIGENCE

Business Intelligence

SERVEUR DÉDIÉ DOCUMENTATION

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

SAP Runs SAP Reporting Opérationnel & BI avec HANA et SAP Analytics. Pierre Combe, Enterprise Analytics Juin, 2015

MSDN Academic Alliance Département SRC Vichy

Les marchés Security La méthode The markets The approach

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Business Intelligence avec Excel, Power BI et Office 365

ATELIER. QUASAR OBILOG BI (Décisionnel) ATELIER > PROJET BI

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' /0 / * 0 4 * 0 6! "##$ % &!

La rencontre du Big Data et du Cloud

SQL Server 2012 et SQL Server 2014

Valorisez vos actifs logiciels avec Rational Asset Manager. Jean-Michel Athané, Certified IT Specialist IBM Rational Software

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

ZENworks de Novell Gestion des technologies mobiles

Analyse comparative entre différents outils de BI (Business Intelligence) :

Modéliser et déployer des processus d entreprise avec Biztalk 2006

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

Exercices sur SQL server 2000

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

Jean-Philippe VIOLET Solutions Architect

SAS Foundation Installation sous Windows

Développer une stratégie SIG Entreprise efficace avec ESRI et ArcGIS

GIGABIT PCI DESKTOP ADAPTER DGE-530T. Quick Installation Guide+ Guide d installation+

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Skills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT

KEYRUS FRANCE CATALOGUE DE FORMATIONS 2014

Oracle Database SQL Developer Guide D'Installation Release 4.0 E

Guide d exploration de base de données de IBM SPSS Modeler 15

SCOM 2012 (System Center Operations Manager) De l'installation à l'exploitation, mise en oeuvre et bonnes pratiques

Domaines d intervention

* Intégration de Solutions * Gestion de Contrats Outsourcing * Solutions Web * Sécurité Electronique * Formation & Certification

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

CATALOGUE DE FORMATIONS

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

Catalogue Formation «Vanilla»

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Formations. Esprit de service, Exigence technologique

HUAWEI TECHNOLOGIES CO., LTD. channelroad. A better way. Together.

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Programme national de Certification des compétences. Cursus de formation Certifiante

F-7a-v3 1 / Bourses de mobilité / Mobility Fellowships Formulaire de demande de bourse / Fellowship Application Form

RMLL Présentation Activité Pentaho

2 Serveurs OLAP et introduction au Data Mining

Le No.1 de l économie d énergie pour patinoires.

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

Business Process Management

Toni Lazazzera Tmanco is expert partner from Anatole ( and distributes the solution AnatoleTEM

SQL Server SQL Server Implémentation d une solution. Implémentation d une solution de Business Intelligence.

VTP. LAN Switching and Wireless Chapitre 4

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Galigeo Location Intelligence Solutions Galigeo Solution

Théories de la Business Intelligence

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

1. Formation F5 - Local Traffic Manager Configuring (LTM)

Moteurs de recherche: origines, évolution et perspectives Aissam Mezhoud, Search Advertising Lead, Microsoft

Notes de mise à jour. 4D v11 SQL Release 3 (11.3) Notes de mise à jour

Transcription:

Grégoire de Lassence 1

Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic

SAS dans le monde 1976 : Création en Caroline du Nord Société privée CA 2006 : 1,9 milliards $ 10 100 employés 24 % du CA réinvesti en R&D SAS en France 280 collaborateurs

SAS Academic Le programme SAS Academic développe des partenariats forts avec les universités et les grandes écoles. Il a pour objectif de : former les étudiants aux solutions SAS, fournir des compétences métier reconnues par les entreprises Son leitmotiv : Créer le lien entre le monde académique et celui de l entreprise. 4

Services SAS Academic Cours Développement de programmes, études de cas, support pédagogique Experts SAS, e-learning, Certification SAS Club SAS Academic Universities du Décisionnel SAS (Paques, été, Noël) SAS pendant le stage : «CPQ» Licence Gratuite à Domicile Offres de stage et d embauche de nos clients Divers Newsletter Internationale Student Ambassador Competition / Papiers SFF Recherche & Chaires Evènements & Sponsoring academic@fra.sas.com http://www.sas.com/offices/europe/france/academic/index.html

Pré requis Les langages SAS, SQL, MDX et Java Site Web : http://www.sas.com/ http://support.sas.com/onlinedoc/913/docmainpage.jsp http://www.eisti.fr/~dsi/ http://www.eisti.fr/~info/ www.bettermanagement.com http://decisio.info/ http://www.sas.com/apps/whitepapers/whitepaper.jsp http://www.stat.ucl.ac.be/cours/stat2020/documents/ma nuels_logiciels/sasv9-preudhomme.pdf http://data.mining.free.fr/ http://www.lsp.ups-tlse.fr/besse/ 6

Bibliographie 7

Programmes de Certification SAS Généraliste Spécialiste Data Warehouse O1 SAS Certified Base Programmer O2 SAS Certified Advanced Programmer O3 SAS Certified Warehouse Development E1 SAS Base Programming* SAS E2 Advanced Programming** SAS E5 Warehouse Development Specialist Concepts SAS E4 Warehouse Technology SAS E3 Applications Development Concepts *Cours pré-requis : BAS, AVC1 **Cours pré-requis : AVC2, EFFI, SQL, MAC O4 SAS Certified Application Developer Spécialiste Développement d'applications

Plateforme décisionnelle 9

Quel projet décisionnel? Descriptif Business Intelligence? 10

Prédictif Analytique

Le décisionnel au cœur des processus de l entreprise Copyright 2004, 2006, SAS Institute Inc. All rights reserved. 13

Client Tier SAS ETL Studio SAS OLAP Cube Studio SAS Management Console SAS Information Map Studio SAS Enterprise Guide SAS Add-In for Microsoft Office SAS Web Report Studio SAS Information Delivery Portal Middle Tier HTTP Server webdav Server SDK Java Servlet Container Web Infrastructure Kit Server Tier SAS 9 Foundation Workspace Server Metadata Server Stored Process Server SAS/CONNECT Server OLAP Server

Le Data Mining avec Enterprise Miner

Le data mining aujourd hui Ces techniques ne sont pas toutes récentes (années 60-70 s) Ce qui est nouveau, ce sont surtout : quantité des données disponibles la puissance de calcul des machines le retour sur investissement qui peut être considérable

Définition Les 2 familles de techniques de DM Les techniques descriptives :» segmentation («clustering»)» Recherche d associations (séquences)» Algorithmes génétiques (SAS OR) Les techniques prédictives :» régression» arbres de décision» réseaux de neurones» Raisonnement à base de cas» SVM Autres choses Traitement de gros volumes et intégration du DM dans les processus de production

Les 10 étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage et mise en forme des données Constitution de la base d analyse Mise en œuvre des algorithmes (segmentation, scoring ) - Elaboration des modèles Validation et choix d un modèle Déclaration à la CNIL Déploiement du modèle Formation des utilisateurs Analyse des retours de l action et suivi des outils Source http://data.mining.free.fr/

Les données utilisées en Data Mining A partir des données opérationnelles : Où ( lieux géographiques, Internet, ) Quand ( Fréquence, récence, ) Comment ( mode de payement, ) Combien ( nombre de TE, ) Quoi ( Produit, ) Source http://data.mining.free.fr/

Segmentation RFM Nombre de commandes Récence 4 3 2 1 T 1 T 2 1111 1110 1101 1011 0111 1100 1010 1001 0110 0101 1000 0100 T 3 0011 0010 0001 T - 4

Distribution du prénom Charlotte http://www.meilleursprenoms.com

Nuggets If you ve got terabytes of data, and you re relying on data mining to find interesting things in there for you, you ve lost before you ve even begun. Herb Edelstein

Missing Value Imputation Inputs? Cases????????

Model Complexity Too flexible Not flexible enough

Overfitting Training Set Test Set 19 e = 90 % 49 e = 75 %

Better Fitting Training Set Test Set 34 e = 83% 43 e =78%

The Right-Sized Tree Stunting Pruning 27

A Field Guide to Tree Algorithms AID THAID CHAID ID3 C4.5 C5.0 CART 28

Measurement: unary - one value for example, a variable with a particular value that was used to create a data subset binary - two values for example, the variable MARITAL that contains No or Yes nominal - more than two non-numeric values, but no implied order for example, STATECOD that contains AK, AL, AR, AZ, etc. ordinal - more than two but not more than ten numeric values, with implied order for example, NUMCARS that contains values from 0 to 3 interval - more than ten numeric values for example, AMOUNT that contains many different dollar values 29

Artificial Neural Networks Neuron Hidden Unit 30

Multilayer Perceptron Hidden Layers Input Layer Output Layer Hidden Unit 31

INPUT HIDDEN OUTPUT AGE COMBINATION ACTIVATION ß 1 + ß 2 AGE+ ß 3 INC tanh(ß 1 + ß 2 AGE+ ß 3 INC) =A INCOME COMBINATION ß 4 + ß 5 AGE+ ß 6 INC ACTIVATION tanh(ß 4 + ß 5 AGE+ ß 6 INC) =B COMBINATION ß 10 +ß 11 A+ ß 12 B+ß 13 C COMBINATION ACTIVATION ß 7 + ß 8 AGE+ ß 9 INC tanh(ß 7 + ß 8 AGE+ ß 9 INC) =C 32

Activation Function Input Layer 33

Universal Approximator 6+A-2B+3C A B C 34

Training Error Function Iterative Optimization Algorithm Parameter 1 Parameter 2 35

Association Rules A B C A C D B C D A D E B C E Rule A D C A A C B & C D Support 2/5 2/5 2/5 1/5 Confidence 2/3 2/4 2/3 1/3

Copyright 2006, 2003, SAS Institute Inc. All rights reserved. 37