Objectifs des entrepôts de données



Documents pareils
Les SGBDs Décisionnels

Bases de Données Avancées

Les SGBDs Décisionnels

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

Les Entrepôts de Données

Hervé Couturier EVP, SAP Technology Development

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

ETL Extract - Transform - Load

La diffusion du Registre du Commerce et des Sociétés en France

Support Orders and Support Provisions (Banks and Authorized Foreign Banks) Regulations

La rencontre du Big Data et du Cloud

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

SAP Runs SAP Reporting Opérationnel & BI avec HANA et SAP Analytics. Pierre Combe, Enterprise Analytics Juin, 2015

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

Bases de Données OLAP

Business Intelligence : Informatique Décisionnelle

Credit Note and Debit Note Information (GST/ HST) Regulations

ILM ou Archivage Une démarche Métier

Le No.1 de l économie d énergie pour patinoires.

Entrepôt de données 1. Introduction

Conférence Bales II - Mauritanie. Patrick Le Nôtre. Directeur de la Stratégie - Secteur Finance Solutions risques et Réglementations

Tier 1 / Tier 2 relations: Are the roles changing?

Application Form/ Formulaire de demande

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BNP Paribas Personal Finance

Data gouvernance autour d'une solution d'archivage de données structurées et non structurées IBM Corporation

Disclosure on Account Opening by Telephone Request (Trust and Loan Companies) Regulations

L impact des délais de paiement et des solutions appropriées. Dominique Geenens Intrum Justitia

Calculation of Interest Regulations. Règlement sur le calcul des intérêts CONSOLIDATION CODIFICATION. Current to August 4, 2015 À jour au 4 août 2015

THE LAW SOCIETY OF UPPER CANADA BY-LAW 19 [HANDLING OF MONEY AND OTHER PROPERTY] MOTION TO BE MOVED AT THE MEETING OF CONVOCATION ON JANUARY 24, 2002

Business & High Technology

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

Les Grandes Tendances d Investissement Informatique en 2011/ Rachel Hunt

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

BI = Business Intelligence Master Data-ScienceCours 3 - Data

LOI SUR LA RECONNAISSANCE DE L'ADOPTION SELON LES COUTUMES AUTOCHTONES ABORIGINAL CUSTOM ADOPTION RECOGNITION ACT

Les entrepôts de données

(télécopieur / fax) (adresse électronique / address)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

EN UNE PAGE PLAN STRATÉGIQUE

General Import Permit No. 13 Beef and Veal for Personal Use. Licence générale d importation n O 13 bœuf et veau pour usage personnel CONSOLIDATION

AVOB sélectionné par Ovum

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Interest Rate for Customs Purposes Regulations. Règlement sur le taux d intérêt aux fins des douanes CONSOLIDATION CODIFICATION

Restaurant Application Quick Reference Guide

PRESENTATION. CRM Paris - 19/21 rue Hélène Boucher - ZA Chartres Est - Jardins d'entreprises GELLAINVILLE

BIRT (Business Intelligence and Reporting Tools)

Disclosure on Account Opening by Telephone Request (Retail Associations) Regulations

PART II / PARTIE II Volume 31, No. 11 / Volume 31, n o 11

Improving the breakdown of the Central Credit Register data by category of enterprises

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

The impacts of m-payment on financial services Novembre 2011

Data Governance et. Optim / FileNet. La synergie entre le structuré et le non structuré IBM Corporation

Groupe Altran Retour d expérience Oracle BI Pilotage stratégique d entreprise & mobilité. Septembre 2014

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Le MDM (Master Data Management) Pierre angulaire d'une bonne stratégie de management de l'information

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

La Poste choisit l'erp Open Source Compiere

FOURTH SESSION : "MRP & CRP"

et les Systèmes Multidimensionnels

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Package Contents. System Requirements. Before You Begin

Input Tax Credit Information (GST/HST) Regulations

Name Use (Affiliates of Banks or Bank Holding Companies) Regulations

Exemple PLS avec SAS

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

Loi sur l aide financière à la Banque Commerciale du Canada. Canadian Commercial Bank Financial Assistance Act CODIFICATION CONSOLIDATION

TRAVAUX DE RECHERCHE DANS LE

Chapitre 9 : Informatique décisionnelle

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

Ordonnance sur le paiement à un enfant ou à une personne qui n est pas saine d esprit. Infant or Person of Unsound Mind Payment Order CODIFICATION

How to Login to Career Page

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

Règlement relatif à l examen fait conformément à la Déclaration canadienne des droits. Canadian Bill of Rights Examination Regulations CODIFICATION

INDIVIDUALS AND LEGAL ENTITIES: If the dividends have not been paid yet, you may be eligible for the simplified procedure.

POLICY: FREE MILK PROGRAM CODE: CS-4

Afin de valider votre inscription merci de bien veiller à :

Instructions Mozilla Thunderbird Page 1

Audit Automation. Belgian master pack Bulletin d'information.

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Railway Operating Certificate Regulations. Règlement sur les certificats d exploitation de chemin de fer CODIFICATION CONSOLIDATION

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Sagemcom EDI with Suppliers

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

"Les outils de planification adaptés à la maîtrise d'un environnement incertain»

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*

Lean approach on production lines Oct 9, 2014

CRM Company Group lance l offre volontaire de rachat en espèces des OC 1 restant en circulation.

Les Entrepôts de Données. (Data Warehouses)

Transcription:

de données 2-1 Objectifs du cours Comprendre l importance de l information dans les métiers Analyser les limites des systèmes de production existants pour les besoins en traitement de l information Introduire le concept d entrepôt de données comme une solution alternative Introduire les propriétés des entrepôts 2-2

Structure du cours Importance de l information Inadéquation des systèmes OLTP Concept d entrepôt propriétés d un entrepôt Comparaisons entrepôt/production 2-3 L enjeu de l information L information occupe un rôle croissant dans tous les métiers qualité de service traitement personnalité des clients, offres compétitives Gestion réduction des coûts, gestion des profits Prospective analyse des comportements des clients, du marché Communication informer les individus 2-4

Aide à la décision L information est à la base du cycle information - analyse - prise de décision La prise de décision nécessite une information précise fiable actualisée pertinente 2-5 Information vs données Données montant total des ventes pour région Paris vendeur ayant réalisé le meilleur chiffre ce mois Information évolution des ventes pour région Paris au cours des 5 dernières années sur quels produits faire des offres promotionnelles quelle est la profitabilité d une activité Quelles differences voyez vous? 2-6

Gestion des données Systèmes «Online Transaction Processing» (OLTP) comptabilité, achats, réservation, télécommunications, systèmes stratégiques, haute performance et disponibilité Multitude de systèmes spécialisés fichiers Excel, bases personnelles, documents, systèmes autonomes, non stratégiques 2-7 Systèmes OLTP Priorities Processor Use Response Time Data Store Data Content Nature of Data Processing End Users Performance, high availability Predictable Sub-seconds to seconds Hierarchical, network, relational, flat files Organized by application Dynamic, constantly changing, current state of the business Highly structured, repetitive Clerks, data entry, administrators 2-8

Limites des systèmes OLTP Les systèmes OLTP sont mal adaptés à la gestion d information pour l aide à la décision Problèmes : Accès aux données difficile Extractions de données non productives qualité des données incertaine 2-9 Accès aux données Données structurées pour applications tables normalisées (performance transactionnelle) valeurs d attributs codées attributs spécifiques pour la production Données dans des systèmes indépendants systèmes hétérogènes (protocoles réseau, systèmes de gestion, modèles de données) Requêtes simples incompatibilité (performances) avec requêtes décisionnelles 2-10

Exemple OLTP : base de données TPC-C Application: gestion, vente et distribution de produits ou services (www.tpc.org/bench.descrip.html) Company Warehouse-1 Warehouse-W District-1 District-2 District-10 1 2 3k 30k Customers 2-11 Vue d ensemble du schéma Warehouse W 10 District W*10 3K 100K Stock W*100K Item W 100K (fixed) Legend Table Name one-to-many <cardinality> relationship secondary index Customer W*30K 1+ 1+ Order W*30K+ 10-1515 0-1 New-Order W*5K History W*30K+ Order-Line W*300K+ 2-12

Une vue détaillée du schéma CUSTOMER ORDER C_ID C_D_ID C_W_ID C_FIRST C_MIDDLE C_LAST C_STREET_1 C_STREET_2 C_CITY C_STATE C_ZIP C_PHONE C_SINCE C_CREDIT C_CREDIT_LIM C_DISCOUNT C_BALANCE C_YTD_PAYMENT C_PAYMENT_CNT ORDER-LINE C_DELIVERY_CNT OL_AMOUNT C_DATA OL_DIST_INFO 2-13 O_ID O_D_ID O_W_ID O_C_ID O_ENTRY_D O_CARRIER_ID O_OL_CNT O_OL_CNT O_ALL_LOCAL OL_O_ID OL_D_ID OL_C_ID OL_NUMBER OL_I_ID OL_SUPPLY_W_ID OL_DELIVERY_D OL_QUANTITY Transactions et requêtes Transactions TPC-C : New-order: enter a new order from a customer Payment: update customer balance to reflect a payment Delivery: deliver orders (done as a batch transaction) Order-status: retrieve status of customer s most recent order Stock-level: monitor warehouse inventory Exercice : exprimer des requêtes décisionnelles sur ce schéma et discuter les problèmes rencontrés 2-14

Requêtes décisionnelles Extraites de TPC-D: Retrieve the 10 unshipped orders with the highest value. report the amount of business that was billed, shipped, and returned. determines how well the order priority system is working and gives an assessment of customer satisfaction. That is, count the number of orders ordered in a given quarter of a given year in which at least one lineitem was shipped by the customer later than its committed date. The query lists the count of such orders for each order priority sorted in ascending priority order. 2-15 Extraction de données Extraire les données pour applis décisionnelles problèmes duplication d effort dans extractions multiples versions incohérentes, obsolètes systèmes opérationels Extractions décideurs 2-16

Exemple d extraction : TPC-D schema Customer SF*150K Nation 25 Region 5 Order SF*1500K Supplier SF*10K Part SF*200K Time 2557 LineItem SF*6000K PartSupp SF*800K Legend: Arrows point in the direction of one-to-many relationships. The value below each table name is its cardinality. SF is the Scale Factor. 2-17 Vue détaillée du schéma CUSTOMER (C_) LINEITEM (L_) ORDERS (O_) CUSTKEY ORDERKEY ORDERKEY NAME PARTKEY CUSTKEY ADDRESS SUPPKEY ORDERSTATUS NATIONKEY LINENUMBER TOTALPRICE PHONE QUANTITY ORDERDATE ACCTBAL EXTENDEDPRICE ORDER-PRIORITY MKTSEGMENT DISCOUNT CLERCK COMMENT TAX SHIP-PRIORITY RETURNFLAG COMMENT NATION (N_) LINESTATUS SHIPDATE CUSTKEY COMMITDATE NAME RECEIPTDATE REGION (R_) REGIONKEY SHIPINSTRUCT REGIONKEY COMMENT SHIPMODE NAME COMMENT COMMENT 2-18

Analyse du schéma Quelles informations ont été extraites de TPC-C, quelles transformations ont été apportées? Comparer l expression des requêtes décisionnelles précédentes avec TPC-C Que peut-on dire de ce schéma pour les applications décisionnelles? 2-19 Qualité des données L intégration de données extraites de sources multiples et hétérogènes pose des problèmes de qualité des données absence de clé universelle standardisation limitée données de saisie libre champs à valeurs hétérogènes Quelles notions de «qualité» sont affectées? 2-2020

Concept d entrepôt de données Vaste collection centralisée de données thématiques historisées datées intégrées qui offre un niveau de qualité suffisant aux applis décisionnelles 2-2121 Données thématiques Les données sont organisées par sujets métier et non par application de production Exemples : client (contrats assurance, prêts, comptes, plans d etc.) produit (gamme, ventes, achats, coûts de production, etc.) 2-2222

Données intégrées Toutes les données relatives à un sujet métier sont présentées de façon pertinente, cohérente et non redondante L intégration s effectue via des processus de transformation des données : consolidation agrégation interprétation Ces processus doivent être documentés (via métadonnées) 2-2323 Données datées Les données de l entrepôt représentent des clichés successifs du monde réel. granularité de temps granularité de rafraîchissement cohérence des clichés 2-2424

Données historisées Les données résident dans l entrepôt pour une large période de temps. Ajout successif d incréments de données mises à jour ou suppression rares chargements successifs archivage des données trop anciennes 2-2525 Clichés vs séries chronologiques Les systèmes opérationnels donnent des clichés successifs. Les entrepôts offrent une série chronologique. T1 T2 T3 T4 Time 2-2626 T5 T6

OLTP vs entrepôt Property Operational Warehouse Response Time Sub seconds Seconds, to to seconds hours Operations DML Read only Nature of Data 30-60 days Historical 2-10 years Data Organization Application Subject, time Size Small to Large to very large large Data Sources Operational, Operational, Internal Internal, External Activities Processes Analysis 2-2727