Eric Tremblay Spécialiste Oracle www.data-warehouse.ca eric.tremblay@data-warehouse.ca

Documents pareils
Les Entrepôts de Données. (Data Warehouses)

Entrepôt de données 1. Introduction

Les entrepôts de données et l analyse de données

Introduc;on à l intelligence d affaires et aux entrepôts de données

Plan de cours. 1. Mise en contexte. 2. Place du cours dans le programme. 3. Descripteur du cours

BI = Business Intelligence Master Data-ScienceCours 3 - Data

LES ENTREPOTS DE DONNEES

Business Intelligence : Informatique Décisionnelle

Chapitre 9 : Informatique décisionnelle

Bases de Données Avancées

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Les entrepôts de données

Théories de la Business Intelligence

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Présentation du module Base de données spatio-temporelles

Introduction au domaine du décisionnel et aux data warehouses

Papier n : 4 Présentation : 17 juin 2004

Eduardo Almeida. Master Alma Université de Nantes

Catalogue Formation «Vanilla»

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Urbanisation des SI-NFE107

La problématique. La philosophie ' ) * )

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Les bases de données

Entrepôt de Données. Jean-François Desnos. ED JFD 1

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Alfresco Guide Utilisateur

Business & High Technology

Rejoignez la Communauté

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Skills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT

et les Systèmes Multidimensionnels

2 Serveurs OLAP et introduction au Data Mining

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

25/05/2012. Business Intelligence. Plan de Présentation

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Didacticiel PowerAMC 11.0 MPD

BUSINESS INTELLIGENCE

Département Génie Informatique

Architecture des entrepôts de données

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

CRM & DATA SOLUTIONS VENTES SFA & MARKETING

PROPOSITION DE FORMATION DE GREGOIRE DE LASSENCE A EPITA VERSION 1.0

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Déroulement de la présentation

Entreprise et Big Data

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

Intelligence Economique - Business Intelligence

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

ETL Extract - Transform - Load

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Big Data On Line Analytics

Introduction à la B.I. Avec SQL Server 2008

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

La place de la Géomatique Décisionnelle dans le processus de décision

molis result portal Description fonctionnelle La structure système Configuration système requise Architecture du système

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Le modèle de données

FreeAnalysis. Schema Designer. Cubes

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

27 janvier Issam El Hachimi Ludovic Schmieder

Bases de Données. Plan

HARMONISEZ VOTRE. Insidjam ERP

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

Groupe d usagers SharePoint Québec

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

Accélérateur de votre RÉUSSITE

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

MYXTRACTION La Business Intelligence en temps réel

Bases de Données Avancées

I. Instalation de l environnement JDK et JRE : II. Configuration outil Reporting : Pentaho... 4

SGBD et aide à la décision, Aide à la décision

Business Intelligence

BD51 BUSINESS INTELLIGENCE & DATA WAREHOUSE

IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!

CHAPITRE 1. Introduction aux bases de données

Application web de gestion de comptes en banques

Business Intelligence avec Excel, Power BI et Office 365

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Atelier Symposium MicroStrategy

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

Implémentation des SGBD

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

Didier MOUNIEN Samantha MOINEAUX

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Table des matières. Avant-propos

Mise en place d'un data mart concernant la paie du personnel de l'etat MEMOIRE DE FIN D'ETUDE. présenté et soutenu publiquement pour l'obtention du

SQL Server 2012 et SQL Server 2014

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

et les Systèmes Multidimensionnels

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes

Les PGI. A l origine, un progiciel était un logiciel adapté aux besoins d un client.

Transcription:

Concept: Entrepôt de données Eric Tremblay Spécialiste Oracle www.data-warehouse.ca eric.tremblay@data-warehouse.ca

Objectif Décrire les principales étapes et approches de conception d'un entrepôt de données (Data Warehouse) et de présenter les techniques de son exploitation ainsi que les principaux défis liés à son implantation.

Définition

Définition «Un entrepôt de données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le processus de décision.» --- Bill Inmon

Les objectifs d un entrepôt de données

Les objectifs d un entrepôt de données Accès aux informations de l entreprise Les informations de l entreprise sont cohérentes Une vue consistante, globale et unifiée de l entreprise Les données publiées sont entreposées pour la consultation rapide de l entreprise

Les objectifs d un entrepôt de données Qualité de l information d un entrepôt de données Les outils de présentation d informations font partie de l entrepôt de données Supporte des applications de type informationnel comme, les applications d aide à la décision

Concept d intelligence d affaire Décisions Action Valeur d'affaires Collection Intégration Analyse Connaissance Information Données

Besoin d affaires Modèlisation dimensionnel Conception technique d'architecture Planification et gestion de projet Conception Physique Besoin d'affaires Entretien et croissance Conception Data Staging Planification déploiement Spécifications application utilisateur

Comment construire une entrepôt de données Identifiez les problèmes et les processus d'affaires Identifiez le grain Identifiez les dimensions Identifiez les faits

Étapes pour construire un entrepôt de données Conception technique d'architecture Sélection et installation de produits Planification de projet Définition des besoins d'affaires Modèlisation dimensionnel Conception physique Data staging & développement Déploiement Entretien et croissance Spécifications d'application analytiques Développement d'applicaiton analytique Gestion de projet

Éléments d'un entrepôt de données DONNÉES SOURCES ENTREPÔT DE DONNÉES OUTILS D'ACCÈS DE DONNÉES Requête Rapport Analyse Forage

Éléments de base d'un entrepôt de données Système source opérationnel Extraction Data staging area Chargement Entrepôt de données Accès Outils d'accès

Éléments de base d'un entrepôt de données Système source opérationnel Extraction Data staging area Chargement Entrepôt de données Accès Outils d'accès Flux d'information circulant dans un entrepôt de données

Extraction Source Staging

Transformation Staging Transformation Staging

Staging Chargement

Dimension & Table de faits

Table de dimension

Table de dimension Clef primaire simple Attributs textuels riches et adaptés à l'utilisateur Rapports hiérarchiques Peu de codes; des codes devraient être décodés selon des descriptions Relativement petit

Dimension Province Client Location Région Ville 3-Chiffres Code Postal 6-Chiffres Code Postal Adresse Clef d'entrepôt Grain de dimension

Année Fiscale Dimension Calendrier Calendrier Année Quart Fiscal Calendrier Quart Mois Fiscal Calendrier Mois Calendrier Semaine Jour Clef d'entrepôt Grain de dimension

Modèles multidimensionnels Schéma étoile et flocon

Table de faits Clef primaire composé La date/heure est presque toujours une clef Les faits sont habituellement numériques Les faits sont en général additifs

Table de faits Schéma étoile

Table de faits Schéma étoile Dimension promotion promotion_clef (PK) promotion_nom Dimension calendrier calendrier_clef (PK) jour_de_semaine mois quart année Dimension magasin Ventes Table de faits promotion_clef (FK) calendrier_clef (FK) produit_clef (FK) magasin_clef (FK) client_clef (FK) dollars_vendu dollars_coût unités_vendu Dimension produit produit_clef (PK) SKU description marque catégorie Dimension client magasin_clef (PK) magasin_id magasin_nom adresse client_clef (PK) client_id client_nom adresse

Table de faits Schéma étoile Dimension promotion promotion_clef (PK) promotion_nom Dimension calendrier calendrier_clef (PK) jour_de_semaine mois quart année Dimension magasin Ventes Table de faits promotion_clef (FK) calendrier_clef (FK) produit_clef (FK) magasin_clef (FK) client_clef (FK) dollars_vendu dollars_coût unités_vendu Dimension produit produit_clef (PK) SKU description marque catégorie Dimension client magasin_clef (PK) magasin_id magasin_nom adresse client_clef (PK) client_id client_nom adresse

Dimension Temps temps_clef (PK) date_sql jour_de_semaine numéro_semaine mois Dimension Cours cours_clef (PK) nom département niveau cours_numéro laboratoire Table de faitsdimension Étudiant Schéma étoile Présence d'étudiant Table de faits temps_clef (FK) étudiant_clef (FK) cours_clef (FK) professeur_clef (FK) local_clef (FK) présence = 1 étudiant_clef (PK) étudiant_id nom adress inscrit Dimension Local local_clef (PK) type endroit département nombre de sièges taille Dimension Professeur professeur_clef (PK) employé_id nom adress département titre

Table de faits Dimension Temps Dimension Étudiant temps_clef (PK) date_sql jour_de_semaine numéro_semaine mois Dimension Cours cours_clef (PK) nom département niveau cours_numéro laboratoire Schéma étoile Présence d'étudiant Table de faits temps_clef (FK) étudiant_clef (FK) cours_clef (FK) professeur_clef (FK) local_clef (FK) présence = 1 étudiant_clef (PK) étudiant_id nom adress inscrit Quelle classe était la plus fortement occupée? Dimension Local local_clef (PK) type endroit département nombre de sièges taille Dimension Professeur professeur_clef (PK) employé_id nom adress département titre

Table de faits Dimension Temps Dimension Étudiant temps_clef (PK) date_sql jour_de_semaine numéro_semaine mois Dimension Cours cours_clef (PK) nom département niveau cours_numéro laboratoire Schéma étoile Présence d'étudiant Table de faits temps_clef (FK) étudiant_clef (FK) cours_clef (FK) professeur_clef (FK) local_clef (FK) présence = 1 étudiant_clef (PK) étudiant_id nom adress inscrit Quelle classe était la plus fortement occupée? Quelle classe était la moins occupée? Dimension Local local_clef (PK) type endroit département nombre de sièges taille Dimension Professeur professeur_clef (PK) employé_id nom adress département titre

Table de faits Dimension Temps Dimension Étudiant temps_clef (PK) date_sql jour_de_semaine numéro_semaine mois Dimension Cours cours_clef (PK) nom département niveau cours_numéro laboratoire Schéma étoile Présence d'étudiant Table de faits temps_clef (FK) étudiant_clef (FK) cours_clef (FK) professeur_clef (FK) local_clef (FK) présence = 1 étudiant_clef (PK) étudiant_id nom adress inscrit Quelle classe était la plus fortement occupée? Quelle classe était la moins occupée? Quel professeur a enseigné à plus d'étudiants? Dimension Local local_clef (PK) type endroit département nombre de sièges taille Dimension Professeur professeur_clef (PK) employé_id nom adress département titre

Table de faits Dimension Temps Dimension Étudiant temps_clef (PK) date_sql jour_de_semaine numéro_semaine mois Dimension Cours cours_clef (PK) nom département niveau cours_numéro laboratoire Schéma étoile Présence d'étudiant Table de faits temps_clef (FK) étudiant_clef (FK) cours_clef (FK) professeur_clef (FK) local_clef (FK) présence = 1 étudiant_clef (PK) étudiant_id nom adress inscrit Quelle classe était la plus fortement occupée? Quelle classe était la moins occupée? Quel professeur a enseigné à plus d'étudiants? Dimension Local local_clef (PK) type endroit département nombre de sièges taille Dimension Professeur Quel professeur a enseigné des cours dans des professeur_clef (PK) employé_id nom adress département titre classes appartenant à d'autres départements?

Dimension calendrier calendrier_clef (PK) mois_clef (FK) année Table de faits Schéma flocon Dimension produit produit_clef (PK) SKU description marque_clef (FK) catégorie mois_clef (PK) année année_clef (PK) Ventes Table de faits calendrier_clef (FK) produit_clef (FK) magasin_clef (FK) client_clef (FK) dollars_vendu dollars_coût unités_vendu marque_clef (PK) marque_description Dimension magasin Dimension client magasin_clef (PK) magasin_id magasin_nom adresse client_clef (PK) client_id client_nom adresse

Dimensions changeant graduellement

Dimensions changeant graduellement Type 1: Recouvrez l'attribut changé. Un fait est associé seulement à la valeur courante d'une colonne de dimension. Type 2: Ajoutez le nouveau record de dimension. Un fait est associé seulement à la valeur originale d'une colonne de dimension. Type 3: Employez un champ pour la vieille valeur. Un fait est associé à la valeur originale et à la valeur courante d'une colonne de dimension.

Dimensions changeant graduellement Type 1: Recouvrez l'attribut changé. Un fait est associé seulement à la valeur courante d'une colonne de dimension. Type 2: Ajoutez le nouveau record de dimension. Un fait est associé seulement à la valeur originale d'une colonne de dimension. Type 3: Employez un champ pour la vieille valeur. Un fait est associé à la valeur originale et à la valeur courante d'une colonne de dimension.

Dimensions changeant graduellement Type 1: Recouvrez l'attribut changé. Un fait est associé seulement à la valeur courante d'une colonne de dimension. Type 2: Ajoutez le nouveau record de dimension. Un fait est associé seulement à la valeur originale d'une colonne de dimension. Type 3: Employez un champ pour la vieille valeur. Un fait est associé à la valeur originale et à la valeur courante d'une colonne de dimension.

Dimensions changeant graduellement Scénario : Le dernier nom du client change de Pharand à Smith : Mise à jour Cust.Lname

Dimensions changeant graduellement

Dimensions changeant graduellement

Normalisation

Normalisation 3FN

Normalisation 3FN

Normalisation Simplicité de la requête Performance de la requête Économie mineure d'espace disque Ralentit les utilisateurs

Normalisation Simplicité de la requête Performance de la requête Économie mineure d'espace disque Ralentit les utilisateurs

Normalisation Simplicité de la requête Performance de la requête Économie mineure d'espace disque Ralentit les utilisateurs

Normalisation Simplicité de la requête Performance de la requête Économie mineure d'espace disque Ralentit les utilisateurs

La différence ERD Schéma étoile (Star Schema)

La différence Base de données Réel Interne Isolé Transactions Normalisé Sale Détaillé Entrepôt de données Historique Interne et externe Intégré Analyse Dimensionnel Propre et conforme Détaillé et sommaire

Requête Ad Hoc & Analyse Analyse avancée Rapport d entreprise

Éléments d'un entrepôt de données DONNÉES SOURCES PRÉPARATION DE DONNÉES OUTILS D'ANALYSE DE DONNÉES OUTILS D'ACCÈS DE DONNÉES BD transactionnel Données ERP Données de département Extraction Filtrer Nettoyer Transformer Chargement Portal Forage de données OLAP Rapport Affichage Graphique Pivot Forage Distribuer

Ralph Kimball Gourou de l entrepôt de données www.rkimball.com