Entrepôt de données (ED) Exercice traité en cours



Documents pareils
Entrepôt de Données. Jean-François Desnos. ED JFD 1

25/01/05 TD Entrepôt de données IHS / Master ICA

Les Entrepôts de Données

Entrepôt de données 1. Introduction

et les Systèmes Multidimensionnels

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

LES ENTREPOTS DE DONNEES

Introduction à la B.I. Avec SQL Server 2008

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Evry - M2 MIAGE Entrepôt de données

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Bases de données multidimensionnelles et mise en œuvre dans Oracle

SWISS ORACLE US ER GRO UP. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Les entrepôts de données

Urbanisation des SI-NFE107

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Dossier I Découverte de Base d Open Office

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

La problématique. La philosophie ' ) * )

Département Génie Informatique

SYNTHÈSE DOSSIER 1 Introduction à la prospection

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

FreeAnalysis. Schema Designer. Cubes

Fouille de Données : OLAP & Data Warehousing

et les Systèmes Multidimensionnels

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE

Evry - M2 MIAGE Entrepôts de Données

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Méthodologie de conceptualisation BI

HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.

QU EST-CE QUE LE DECISIONNEL?

TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

BUSINESS INTELLIGENCE

Business Intelligence : Informatique Décisionnelle

Le concept de Data Warehouse a été formalisé pour la première fois en 1990.

ETL Extract - Transform - Load

Bases de Données OLAP

Projet Business Object

BI2 : Un profil UML pour les Indicateurs Décisionnels

Rejoignez la Communauté

INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES. 2. Les questions sont indépendantes les unes des autres.

Business Intelligence avec SQL Server 2012

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Information utiles. webpage : Google+ : digiusto/

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Bases de Données Avancées

SQL Server 2012 et SQL Server 2014

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE. Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP

Module BDR Master d Informatique (SAR)

Les Entrepôts de Données. (Data Warehouses)

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

La place de la Géomatique Décisionnelle dans le processus de décision

Big Data On Line Analytics

Les entrepôts de données et l analyse de données

Présentation du module Base de données spatio-temporelles

Business & High Technology

A QUOI SERVENT LES BASES DE DONNÉES?

2 Serveurs OLAP et introduction au Data Mining

Introduction à la modélisation dimensionnelle

SQL SERVER 2008, BUSINESS INTELLIGENCE

Techniques d optimisation des requêtes dans les data warehouses

Business Intelligence avec SQL Server 2012

Encryptions, compression et partitionnement des données

TP base de données SQLite. 1 Différents choix possibles et choix de SQLite : 2 Définir une base de donnée avec SQLite Manager

Guide de référence pour l achat de Business Analytics

Comprendre Merise et la modélisation des données

Bases de données avancées Introduction

Bases de données cours 1

JEDOX FACTSHEETS SELF-SERVICE BUSINESS INTELLIGENCE, ANALYTICS & PERFORMANCE MANAGEMENT

CESI Bases de données

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Bases de Données. Plan

Introduction au domaine du décisionnel et aux data warehouses

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Introduction à Business Objects. J. Akoka I. Wattiau

NF26 Data warehouse et Outils Décisionnels Printemps 2010

1 Modélisation d une base de données pour une société de bourse

Les bases de données

Bases de Données Avancées

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Transcription:

Enoncé Entrepôt de données (ED) Exercice traité en cours Une grande entreprise à succursales multiples veut rassembler toutes les nuits dans un entrepôt de données des informations sur les s du jour afin de dresser des tableaux de bord sur les s. L entreprise dispose d un système d information complexe, constitué des éléments suivants : - des applications et bases de données éparses et hétérogènes sur les produits qu elle vend, - des applications et BD, également variées, sur les clients, - idem sur les personnels de l entreprise. L ED à modéliser doit pouvoir fournir le chiffre d affaires des s d un produit, par date, client, et vendeur, ainsi que toutes les sommations possibles de chiffre d affaires. Une correspond à un produit et un seul, Les produits sont regroupés par famille de produits. La est effectuée par l un des vendeurs du service de spécialisé dans le produit. La semaine de est le numéro de semaine dans l année. 1. Modélisation de base La table principale de la base de données «entrepôt de données» sera alors la suivante : VENTE Code client Montant de la Figure 1 : VENTE En grisé clair, apparaît la clé multiple de l enregistrement, constitué de 4 éléments : date, code produit, code vendeur, code client En grisé foncé, figure la variable à mesurer, appelée indicateur : montant de la 1

Cette table VENTE pourrait suffire à faire des sommations de chiffre d affaires, si l on se contentait des codes sur les éditions. C est la table fondamentale d un ED. On l appelle : table de faits En fait, la plupart du temps, chacun des éléments de la clé multiple de la table de faits renvoie à un certain nombre d attributs. Ici, par exemple, le code produit sera utilement complété par : libellé du produit code famille de produit libellé famille (nombreuses informations complémentaires possibles) On fait alors une jointure entre la table de faits et une table dite table de dimension, selon le schéma suivant : PRODUIT code produit libellé du produit code famille de produit libellé famille VENTE Code client Montant de la Figure 2 : de faits + 1 table de dimension La table de dimension PRODUIT n a pas d indicateur, elle comporte seulement des attributs du produit. La clé «code produit» correspond à l élément «code produit» de la clé multiple de VENTE. De la même manière, les autres éléments de la clé multiple renvoient en général chacun à une table de dimension, selon le schéma suivant : 2

PRODUIT code produit libellé du produit code famille de produit libellé famille VENDEUR code vendeur nom du vendeur code service de nom service VENTE Code client Montant de la TEMPS date nom du jour de la semaine n semaine nom du mois année CLIENT code client nom du client code type de client libellé type Figure 3 : de faits + 4 tables de dimensions Ce schéma, avec au centre la table de faits, et autour les tables de dimension jointes, s appelle : schéma en étoile Ce schéma est caractéristique de la modélisation dimensionnelle (du nom des dimensions) la plupart du temps mise en œuvre dans la conception d un ED. Un schéma en étoile peut également être représenté sous forme de cube de données A partir de la base de données relationnelle figurée par notre schéma en étoile, il est possible de développer un logiciel simple (à base de SQL par exemple) qui édite des sommes de «montant de la», ou chiffres d affaires (CA). 3

Dans le tableau ci-dessous, les éléments sont les totaux des montants vendus toutes dates et clients confondus. Vendeur / produit Produit : ski Vendeur : Dupont 10500 Le vendeur Dupont a vendu pour 10500 de skis sur la période considérée Figure 4 tableau à 2 dimensions Ce tableau peut également être produit pour une date donnée (sélection sur la clé date). L empilement de ces tableaux par date peut être figuré par le cube ci-dessous vu en perspective : Vendeur Produit Jour J1 Figure 5 : cube de données à 3 dimensions Lorsque le nombre de dimensions est de 3, la base de données peut être représentée par un cube. Lorsqu il est supérieur à 3, comme c est le cas dans l exemple (qui comporte 4 dimensions), c est un hypercube. Pour simplifier, on parle dans tous les cas d un cube de données 4

2. Coupes Dans l exemple traité, et représenté par le schéma en étoile (Figure 3), le cube de données est un hypercube à 4 dimensions : produit, client, vendeur, date. Graphiquement, on peut dessiner en perspective 4 types de cubes à 3 dimensions : A. client, vendeur, date (pour chaque valeur de produit) B. produit, vendeur, date (pour chaque valeur de client) C. produit, client, date (pour chaque valeur de vendeur) D. produit, client, vendeur (pour chaque valeur de date) Dans chaque cube, l élément de base est l indicateur «montant de la». Tracé de cube D : Montant de la produit vendeur client Figure 6 : un des types de cubes à 3 dimensions On peut tracer autant de cubes D qu il y a de valeurs pour la variable date. Un cube D représente une coupe de l hypercube à 4 dimensions, selon une valeur de la variable date. De même, on peut faire des coupes du cube D pour toutes les valeurs de produit, par exemple. On obtient alors autant de tableaux à 2 dimensions (client, vendeur) qu il y a de valeurs à produit. A partir de D, on peut faire 3 types de tableaux à 2 dimensions : (client, vendeur), (produit, vendeur), (client, produit) A partir de l ensemble A, B, C, D, on peut faire en plus les 3 coupes qui gardent date (client, date), (produit, date), (vendeur, date), donc en tout 6 types de tableaux à 2 dimensions. 5

3. Agrégats Le but d un entrepôt de données est la présentation de tableaux de bord. On a compris dans ce qui précède que lorsque le nombre de dimensions du cube de données est n, avec n supérieur à 2, il faut faire des coupes (en anglais slice and dice) en fixant les valeurs de n-2 dimensions, pour se ramener à un tableau à 2 dimensions, donc affichable. Plutôt que de couper, on peut aussi agréger les données, c'est-à-dire présenter un tableau à 2 dimensions en sommant les valeurs de certaines (voire toutes) des n-2 dimensions restantes. C est le cas du tableau vendeur produit de la figure 4. Lorsqu on crée dans la base de données une table enregistrant ces sommations, on parle de table d agrégat. PRODUIT VENDEUR AGREGAT date-client VENTE Code client Montant de la TEMPS CLIENT Montant cumulé des s par produit et par vendeur tous clients et dates confondus Indicateur de la table d agrégat Figure 7 : création d une table d agrégat date-client La création de tables d agrégats a pour inconvénients : sur le plan conceptuel, de compliquer le modèle dimensionnel sur le plan technique, de multiplier l espace de stockage sur disque En revanche, le résultat d une requête d un cumul est obtenu plus rapidement lorsque la table d agrégats existe. 6

4. Analyse multi-dimensionnelle Reprenons la figure 4, où les éléments sont les totaux des montants vendus toutes dates et clients confondus, avec en lignes les vendeurs et en colonnes les produits. produit vendeur Figure 8 : tableau vendeur / produit Il est indiqué dans l énoncé qu un produit appartient à une famille de produits, et un vendeur à un service de. Il est donc légitime de vouloir éditer ce tableau en sommant les éléments par famille et/ou service Famille produit famille vendeur AA service service 9A 9B Figure 9 : sommations famille / service 9C Les dimensions vendeur et produit sont dites hiérarchiques, car elles peuvent se recomposer en service et famille respectivement. Les variables service et famille, quant à elles, se décomposent. Lorsqu on va du tableau 8 au tableau 9A (respectivement 9B, 9C), on fait de l analyse ascendante sur la dimension produit (respectivement vendeur, vendeur et produit) Losqu on part d un des tableaux 9 pour éditer le tableau 8, on fait de l analyse descendante. L analyse ascendante/descendante est appelée analyse multi-dimensionnelle. 7

Un cube D comme celui de la figure 6 peut donc représenter une multitude de possibilités de sommations, compte tenu des dimensions hiérarchiques et des possibilités d agrégats : Produit ou Famille Montant de la - toutes dates confondues - par jour - par semaine - par mois Vendeur Ou service client Figure 10 : autres possibilités de cubes D 8