et les Systèmes Multidimensionnels



Documents pareils
et les Systèmes Multidimensionnels

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Les Entrepôts de Données

LES ENTREPOTS DE DONNEES

Urbanisation des SI-NFE107

Entrepôt de données 1. Introduction

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Bases de Données Avancées

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Le concept de Data Warehouse a été formalisé pour la première fois en 1990.

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Les entrepôts de données

Introduction à la B.I. Avec SQL Server 2008

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Chapitre 9 : Informatique décisionnelle

Business Intelligence : Informatique Décisionnelle

L information et la technologie de l informationl

Méthodologie de conceptualisation BI

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Entrepôt de Données. Jean-François Desnos. ED JFD 1

Didier MOUNIEN Samantha MOINEAUX

AXIAD Conseil pour décider en toute intelligence

Intégration de données hétérogènes et réparties. Anne Doucet

Les Entrepôts de Données. (Data Warehouses)

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BUSINESS INTELLIGENCE

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

ETL Extract - Transform - Load

Evry - M2 MIAGE Entrepôt de données

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Business & High Technology

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

BI = Business Intelligence Master Data-Science

République Algérienne Démocratique et Populaire

La problématique. La philosophie ' ) * )

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

MyReport, LE REPORTING SOUS EXCEL

UE 8 Systèmes d information de gestion Le programme

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

Théories de la Business Intelligence

MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE. Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP

SWISS ORACLE US ER GRO UP. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

Présentation du module Base de données spatio-temporelles

FreeAnalysis. Schema Designer. Cubes

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ici, le titre de la. Tableaux de bords de conférence

Introduction au domaine du décisionnel et aux data warehouses

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Domaines d intervention

Module BDR Master d Informatique (SAR)

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

La place de la Géomatique Décisionnelle dans le processus de décision

QU EST-CE QUE LE DECISIONNEL?

La Business Intelligence en toute simplicité :

Fouille de Données : OLAP & Data Warehousing

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Information utiles. webpage : Google+ : digiusto/

Techniques d optimisation des requêtes dans les data warehouses

Business Intelligence avec Excel, Power BI et Office 365

2 Serveurs OLAP et introduction au Data Mining

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

JEDOX FACTSHEETS SELF-SERVICE BUSINESS INTELLIGENCE, ANALYTICS & PERFORMANCE MANAGEMENT

Intelligence Economique - Business Intelligence

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

Les PGI. A l origine, un progiciel était un logiciel adapté aux besoins d un client.

La Suite Décisionnelle (Data Warehousing / Data Mining)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Progiciel K. Parce que chaque K est unique (c) K-all

CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE. présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M.

Bases de données Cours 1 : Généralités sur les bases de données

MANAGEMENT DES SERVICES INFORMATIQUES

Solutions IT pour libérer le potentiel de votre Business

Intégration de systèmes client - serveur Des approches client-serveur à l urbanisation Quelques transparents introductifs

Base de données clients outil de base du CRM

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Rappel sur les bases de données

Conception des bases de données : Modèle Entité-Association

Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui

.id. _la solution de pilotage de votre entreprise ERP / CRM / BPM. informatique & développement

Technologie data distribution Cas d usage.

Bases de Données OLAP

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

MYXTRACTION La Business Intelligence en temps réel

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

Transcription:

Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d un processus d aide à la décision (Inmon, 94). Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 2

1. Définition d un Data warehouse 1. 1 Données orientées sujet Données structurées par thèmes (sujets majeurs de l entreprise) et non suivant les processus fonctionnels. Le sujet est transversal aux structures fonctionnelles et organisationnelles de l entreprise. On peut accéder aux données utiles sur un sujet. L intégration des différents sujets se fait dans une structure unique. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 3 1. Définition d un Data warehouse 1. 1 Données orientées sujet Il n y a pas de duplication des informations communes à plusieurs sujets. La base de données est construite selon les thèmes qui touchent aux métiers de l entreprise (clients, produits, risques, rentabilité, ). Les données de base sont toutefois issues des Systèmes d Information Opérationnels (SIO). Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 4

1. Définition d un Data warehouse 1. 2. Données intégrées Les données, issues de différentes applications de production, peuvent exister sous toutes formes différentes. Il faut les intégrer afin de les homogénéiser et de leur donner un sens unique, compréhensible par tous les utilisateurs. Elle doivent posséder un codage et une description unique. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 5 1. Définition d un Data warehouse 1. 2 Données intégrées La phase d intégration est longue et pose souvent des problèmes de qualification sémantique des données à intégrer (synonymie, homonymie, etc ). Ce problème est amplifié lorsque des données externes sont à intégrer avec les données du SIO. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 6

1. Définition d un Data warehouse 1. 3 Données non-volatiles Une information est considérée volatile quand les données sont régulièrement mises à jour comme dans les Systèmes d Information Opérationnels. Dans un SIO, les requêtes portent sur les données actuelles. Il est difficile de retrouver un ancien résultat. Dans un DW, il est nécessaire de conserver l historique de la donnée. Ainsi, une même requête effectuée à deux mois d intervalle en spécifiant la date de référence de la donnée, donnera le même résultat. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 7 1. Définition d un Data warehouse 1. 4 Données historisées Dans un SIO, les transactions se font en temps réel, et les données sont mises à jour constamment. L historique des valeurs de ces données n est généralement pas conservé car il est inutile. Dans un DW, la donnée n est jamais mise à jour. Les données du DW s ajoutent aux données déjà engrangées.=> ajout de couches de données successives, à la manière des strates géologiques Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 8

1. Définition d un Data warehouse 1. 4 Données historisées Le DW stocke donc l historique des valeurs que la donnée aura prises au cours du temps. Un référentiel de temps est alors associé à la donnée afin d être capable d identifier une valeur particulière dans le temps. Les utilisateurs possèdent un accès aux données courantes ainsi qu à des données historisées. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 9 1. Définition d un Data warehouse 1. 5 Support d un processus d aide à la décision Un DW est un système d information dédié aux applications décisionnelles dont les principales contraintes sont : des requêtes complexes à plusieurs niveaux d agrégation la nécessité de disposer d informations synthétiques («reporting» de gestion, analyse des ventes, gestion de la masse salariale, etc) le stockage des données sous une forme multidimensionnelle des mises à jour périodiques Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 10

2. Objectifs d un Data warehouse permet le développement d applications décisionnelles et de pilotage de l entreprise et de ses processus joue un rôle de référentiel pour l entreprise puisqu il permet de fédérer des données souvent éparpillées dans différentes bases de données offre une vision globale et orientée métier de toutes les données que manipule l entreprise permet de faire face aux changements du marché et de l entreprise offre une information compréhensible, utile, rapide et à jour Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 11 3. Architecture d un Data warehouse Bases de production Extraction Transformation Chargement Rafraîchissement Bases externes Dictionnaire Data Warehouse Bases multidimensionnelles Datamarts Outils d administration Outil ROLAP Outils multidimensionnels MOLAP Requeteur ou tableau Outil frontal OLAP Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 12

3. Architecture d un Data warehouse 3. 1 Les Bases de Données Bases de données internes: Bases de production de l entreprise Bases créées par les utilisateurs Bases de données externes à l entreprise qui nécessitent leur identification, leur rapatriement et leur intégration. Données achetées à des fournisseurs de données (Nielsen, INSEE, ) Données récupérées sur Internet Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 13 3. Architecture d un Data warehouse 3. 2 Opérations sur les données EXTRACTION Extraire les données de leur environnement d origine (bases de données relationnelles, fichiers plats, ). Utiliser une technique appropriée pour n extraire que les données nécessaires : données créées ou modifiées depuis la dernière opération d extraction. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 14

3. Architecture d un Data warehouse 3. 2 Opérations sur les données TRANSFORMATION Une même donnée peut avoir une structure ou une valeur différente en fonction de la base (production, externe, utilisateurs) dont elle provient. On peut être confronté à des redondances (un même client peut apparaître avec différents attributs et propriétés selon la source consultée). Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 15 3. Architecture d un Data warehouse 3. 2 Opérations sur les données TRANSFORMATION Il faut supprimer certaines données aberrantes qui risqueraient de fausser les analyses. Il faut donc épurer et transformer les données. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 16

3. Architecture d un Data warehouse 3. 2 Opérations sur les données CHARGEMENT/RAFRAICHISSEMENT Effectuer sur les données des opérations de calcul et d agrégation. Remplacer certaines bases si aucune solution d extraction satisfaisante n est possible. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 17 3. Architecture d un Data warehouse 3. 2 Opérations sur les données CHARGEMENT/RAFRAICHISSEMENT Mettre en place des procédures de chargement et de restauration (en cas de problème). Typiquement, la fréquence du chargement est quotidienne et il est effectué en tout début de matinée. Si la disponibilité du système ne peut être interrompue, envisager la mise en place de systèmes redondants. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 18

3. Architecture d un Data warehouse 3. 2 Opérations sur les données LES OUTILS On peut automatiser tout ou partie des opérations décrites. Des outils sont disponibles : Extract d ETI, Genio de Leonard s Logic, SAS/Warehouse Administrator de SAS Le développement d outils spécifiques est envisageable mais risque d alourdir les tâches. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 19 3. Architecture d un Data warehouse 3. 3 Dictionnaire de Données Le dictionnaire de données regroupe les méta-données. Une méta-donnée représente une donnée sur les données. Il s agit de l ensemble des informations qui permettent de qualifier une donnée, notamment par sa sémantique, sa règle de calcul, sa provenance, sa qualité, etc les méta-données permettent de préciser de quelle table provient la donnée, à quelles dates et heures elle en a été extraite, l état de la base à cet instant, etc... Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 20

3. Architecture d un Data warehouse 3. 3 Dictionnaire de Données Une méta-donnée permet de «remonter la chaîne» et de reconstituer l ensemble d événements et données qui ont servi à obtenir l information associée. Le dictionnaire de données contient toutes les informations permettant d exploiter les données. C est un référentiel destiné aux utilisateurs et à l administrateur du DW. A ce jour, il n existe pas de normes en ce qui concerne la structure et la gestion des dictionnaires de données. Chaque outil propose sa solution et son approche. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 21 3. Architecture d un Data warehouse 3. 4 Les Data Marts Un data mart (magasin de données) est un DW focalisé sur un sujet particulier, souvent au niveau départemental ou métier. C est donc un mini DW lié à un métier particulier de l entreprise (finance, commercial, ). Un DW est souvent volumineux (plusieurs centaines de Go voire quelques To ) avec des performances inappropriées (temps de réponse trop longs). Un Data mart, quant à lui, comporte moins de 50 Go, ce qui permet des performances acceptables. La création d un data mart peut être un moyen de débuter un projet de DW (projet pilote). Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 22

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.1 Les modèles de données Modèles de présentation Modèles de diffusion Modèles d intégration Bases de données opérationnelles Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 23 3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.1 Les modèles de données Le modèle d intégration unifie les données opérationnelles. Le modèle de diffusion représente le modèle conceptuel des données. Il correspond aux bases multidimensionnelles (serveur OLAP). Le modèle de présentation est un complément au modèle conceptuel. C est à travers ce modèle que l utilisateur voit les données. Il correspond à différents outils physiques : les tableurs, les requêteurs, les outils clients OLAP, etc... Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 24

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.2 Les outils OLAP (On-Line Analytical Processing) OLAP caractérise l architecture nécessaire à la mise en place d un système d information décisionnel (SID). OLAP s oppose à OLTP (On-Line Transactional Processing) qui caractérise les SIO. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 25 3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.2 Les outils OLAP (On-Line Analytical Processing) OLAP constitue l ensemble des outils multidimensionnels nécessaires à l accès, stockage et à la manipulation des données utiles pour un SIAD ou pour un EIS. OLAP désigne les outils d analyse s appuyant sur les bases de données multidimensionnelles. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 26

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.3 Les 12 règles de E.F. CODD (1993) Vue multidimensionnelle : Les données sont structurées en dimensions métiers. Transparence : L utilisateur doit pouvoir utiliser les logiciels habituels (tableurs, ) sans percevoir la présence d un outil OLAP. Accessibilité : L outil doit se charger d accéder aux données stockées dans n importe quel type de bases de données (interne + externe) et le faire simultanément. Performance continue dans les restitutions : A mesure que le nombre de dimensions ou la taille de la base augmente, l utilisateur ne doit pas subir de baisse sensible de performance. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 27 3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.3 Les 12 règles de E.F. CODD (1993) Architecture client-serveur : Tout produit OLAP doit fonctionner en mode C/S avec une répartition des traitements. Dimension générique : Chaque dimension (avec l analyse) doit être équivalent aux autres à la fois dans sa structure et dans ses capacités opérationnelles. Une seule structure logique dans l ensemble des dimensions. Gestion dynamique des matrices creuses : OLAP doit gérer les cellules non renseignées de manière optimale. Support multi-utilisateurs : OLAP doit assurer un accès simultané aux données, gérer l intégrité et la sécurité de ces données. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 28

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.3 Les 12 règles de E.F. CODD (1993) Opérations entre les dimensions : OLAP doit gérer des calculs associés entre les dimensions sans faire appel à l utilisateur pour définir le contenu de ces calculs Manipulation intuitive : Minimiser le recours à des menus ou les allers et retours avec l interface utilisateur Flexibilité des restitutions : convivialité des états de gestion ou des états de sortie - ergonomie Nombre de dimensions et niveaux de hiérarchie illimité : l outil doit gérer au moins quinze dimensions et ne pas limiter le nombre de niveaux hiérarchiques. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 29 3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.4 Fast Analysis of Shared Multidimensional Information (FASMI) Analyse : fournir des possibilités d analyse (statistiques et autres) Rapide : l essentiel des réponses doit être rendu dans un délai de moins de cinq secondes Information : accéder à l ensemble des données indépendamment de leur localisation Multidimensionnelle :fournir une vue conceptuelle multidimensionnelle Partagée : être accessible à un grand nombre d utilisateurs et ne pas limiter le nombre de niveaux hiérarchiques. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 30

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.5 Les outils relationnels OLAP Outils relationnels : requêteurs, infocentres, jointures complexes exemple : Business Objects (anciennes versions) Hypercubes relationnels : les données sont stockées dans une BD relationnelle, mais avec une structure adaptée aux données multidimensionnelles exemple : SGBD relationnels OLAP relationnel (ROLAP) : ces outils utilisent directement le modèle relationnel. Au travers des méta-données, ils permettent de transformer l analyse multidimensionnelle en requêtes SQL : distinguent les axes d analyse et les faits à observer (modèles en étoile ou en flocon) Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 31 3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.5 Les outils relationnels OLAP Interface de présentation Hypercube virtuel Base de données relationnelle Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 32

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.6 Intégration Infocentre Hypercube Principe proche de l OLAP relationnel Intégration d un outil d infocentre et d un outil d analyse multidimensionnelle dans une même interface située sur le poste client L outil d infocentre assure la gestion d un référentiel commun, la sélection des données et leur valorisation L outil multidimensionnel assure la création d un hypercube, l implémentation des fonctionalités OLAP (consolidation, zoom avant, glisser-déplacer, gestion des seuils, etc.) Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 33 3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.6 Intégration Infocentre Hypercube Hypercubes clients Table de dimension Table de Faits Table de dimension Table de dimension Serveur relationnel Table de dimension Table de dimension Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 34

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.7 Les outils multidimensionnels MOLAP Les BD multidimensionnelles sont propriétaires (pas de standard) Les données sont dynamiquement structurées et compressées (optimisation de l espace disque) Les données sont organisées en dimensions et hiérarchies Les formules de calcul sont généralement complexes Les temps de réponse sont constants Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 35 3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.7 Les outils multidimensionnels MOLAP Interface de présentation Serveur matriciel Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 36

3. Architecture d un Data warehouse 3. 5 Les bases multidimensionnelles et les outils OLAP 3.5.7 Les outils multidimensionnels MOLAP La constitution de la base se fait selon le processus suivant extraction des données provenant des SGBD ou fichiers décomposition des données en dimensions, attributs et variables calcul des consolidations chargement de l hypercube selon la structure dimensionnelle choisie L interrogation de la base possède les caractéristiques suivantes : interface graphique (drill down, slice and dice, etc) gestion des seuils et des alertes (codage couleurs) temps de réponse court et constant SQL non implémenté Exemple : Oracle Express Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 37 3. Architecture d un Data warehouse 3. 6 Les limites du multidimensionnel Format et langage propriétaire Structure figée (l hypercube doit être construit à chaque modification) Accès au détail difficile Peu d outils disponibles Outils d administration insuffisants Difficulté de réaliser des sélections sur un hypercube Pas de standard ni pour la structure physique ni pour l interrogation Manque de souplesse et absence de gestion de méta-données Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 38

3. Architecture d un Data warehouse 3. 7 Conclusion Un marché florissant nombreux outils (ROLAP,MOLAP,..) concentration du nombre d éditeurs de logiciels Nécessité de méthodologie de conception démarche modélisation conceptuelle et logique implication des utilisateurs Un avenir réel l informatique opérationnelle est mature la demande des utilisateurs est importante la technologie est disponible. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 39 4. Le Marché du Data warehouse Le marché du décisionnel regroupe une trentaine d acteurs Les éditeurs peuvent être regroupés en quatre catégories solutions applicatives bases de données multidimensionnelles client ROLAP client OLAP Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 40

4. Le Marché du Data warehouse 4. 1 Les solutions applicatives L offre la plus ancienne l offre verticale (spécialisée dans un secteur tel que la banque ou la grande distribution) l offre horizontale (consacrée à une fonction précise) l offre fondée sur un progiciel l éditeur intègre généralement dans sa solution une base de données multidimensionnelle Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 41 4. Le Marché du Data warehouse 4. 1 Les solutions applicatives exemples de produits : Editeur Produit Fonction Comshare Boost sales and marging planning Prévision, planification Boost sales analysis Analyse des ventes Commander budget Elaboration budgétaire Commander FDC Reporting, consolidation Hyperion Software Hyperion entreprise Reporting, consolidation Hyperion Pilar Elaboration budgétaire Oracle Oracle financial analyser Elaboration budgétaire Oracle sales analyser Analyse des ventes SAS Institute CFO Vision Reporting Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 42

4. Le Marché du Data warehouse 4. 2 Bases de données multidimensionnelles Quatre acteurs principaux répartis en deux catégories : les spécialistes qui fournissent une technologie multidimensionnelle performante les fournisseurs de solutions complètes capables de fournir en plus de la base de données, un environnement de développement, d interrogation et d administration. Catégorie Editeur Produit Spécialistes Autres (environnement intégré) Arbor Software Aplix Oracle Gentia Software Essbase TMI Express Gentia Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 43 4. Le Marché du Data warehouse 4. 3 Client ROLAP Offre la plus récente sur le marché l information est stockée dans une base de données relationnelle et un dictionnaire permet de faire apparaître l information sous forme multidimensionnelle l administrateur offre à l utilisateur un point de vue multidimensionnel sur une base relationnelle les principaux acteurs sont : Editeur Produit Business Objects Microstrategy Information Advantage Informix Platinum Technology Business Objects DSS Agent Decision Suite MetaCube Info Beacon Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 44

4. Le Marché du Data warehouse 4. 4 Client OLAP Utilisation d un outil d infocentre pour interroger les données relationnelles, puis représenter l information récupérée sous forme multidimensionnelle solution proposée par les éditeurs d infocentre deux outils sont utilisés : l analyse multidimensionnelle et l infocentre relationnel inconvénients : pour alimenter l outil multidimensionnel, il faut rapatrier un volume de données important de la base relationnelle vers l outil le stockage physique des données multidimensionnelles s effectue sur le poste de travail, ce qui entraîne une redondance des données Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 45 4. Le Marché du Data warehouse 4. 4 Client OLAP ces systèmes sont appelés DOLAP, pour Desktop OLAP principaux acteurs : Editeur Editeur Fonction Andyne Cognos GQL Pablo Impromptu Powerplay Requêteur Analyse OLAP Requêteur Analyse OLAP Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 46

5. Développement d un Data warehouse 5. 1 Introduction 5.1.1 Caractéristiques d un data warehouse à prendre en compte 4 caractéristiques du data warehouse jouent un rôle fondamental dans les projets de ce type: Les évolutions technologiques: client-serveur et systèmes ouverts permettent de construire le data warehouse par intégration des composants les + adaptés. Le lien implicite à la stratégie de l entreprise: data warehouses + proches de la stratégie de l entreprise que les systèmes transactionnels. Une logique d amélioration continue (évolution des demandes des utilisateurs, nouveaux objectifs de l entreprise) Un niveau de maturité (acquis décisionnel) différent selon les entreprises. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 47 5. Développement d un Data warehouse 5. 1 Introduction 5.1.2 Phases du processus de développement Démarche proposée=démarche incrémentale: le data warehouse est construit application par application (décomposition en sousprojets ou «initiatives»). 3 grandes phases dans un projet de data warehouse: «Découvrir et définir les initiatives»: niveau entreprise; distinction de 2 sous-phases: étude stratégique et élaboration du plan d action. Définition de l infrastructure technique et organisationnelle du data warehouse, conduite du changement: niveau entreprise. Mise en œuvre incrémentale des applications: niveau projet. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 48

5. Développement d un Data warehouse 5. 2 Phase 1: découvrir et définir les initiatives 5.2.1 Etude stratégique Rôle fondamental. Etape 1: sensibilisation, «sponsorship», préparation au changement. Chaque acteur doit être convaincu de la nécessité et de l importance du projet de data warehouse, et de la nécessité de son implication. Rôle du sponsor du projet. Etape 2: identification des objectifs métier/entreprise assignés au data warehouse. Effectuée par collaboration entre management, équipes opérationnelles et équipes informatiques. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 49 5. Développement d un Data warehouse 5. 2 Phase 1: découvrir et définir les initiatives 5.2.1 Etude stratégique Etape 3: identification des sous-projets (initiatives) permettant d atteindre les objectifs précédemment identifiés. Les initiatives sont ordonnancées par priorité. Les initiatives sont indépendantes, bien délimitées, et leur mise en œuvre est relativement courte (moins de 6 mois en général). Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 50

5. Développement d un Data warehouse 5. 2 Phase 1: découvrir et définir les initiatives 5.2.2 Elaboration du plan d action Etape 1: étude de faisabilité (existence et qualité des données, contraintes techniques et organisationnelles). Etape 2: analyse coûts/bénéfices. Exemples: coût de développement, coût du matériel et du logiciel Estimations ne sont pas détaillées. Estimations sont de moins en moins détaillées selon le niveau de priorité de l initiative. Etape 3: séquencement et planification des projets. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 51 5. Développement d un Data warehouse 5. 3 Phase 2: définition de l infrastructure 5.3.1 Infrastructure technique Choix du ou des fournisseur(s) de technologies: choix entre un unique fournisseur et plusieurs fournisseurs Choix des outils: construire, acheter ou faire avec l existant? Choix de l architecture du data warehouse: centralisée/distribuée/répliquée, Intranet Choix de la structure de stockage: relationnelle, multidimensionnelle Choix du matériel Choix des infrastructures destinées à l administration des systèmes, à la gestion de la sécurité Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 52

5. Développement d un Data warehouse 5. 3 Phase 2: définition de l infrastructure 5.3.2 Infrastructure organisationnelle Organisation typique des équipes de développement et d exploitation: Un 1er centre de compétences responsable de l alimentation du data warehouse à partir des systèmes de production. Un second centre de compétences responsable de la gestion et du support du data warehouse proprement dit. Rôle des administrateurs de bases de données. Un 3è centre de compétences responsable des flux d informations entre les utilisateurs et leur poste de travail d une part, et le data warehouse d autre part. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 53 5. Développement d un Data warehouse 5. 3 Phase 2: définition de l infrastructure 5.3.3 Conduite du changement Rôle de la formation. Rôle des sponsors. Il est souvent souhaitable d identifier un sponsor par initiative, chaque sponsor étant généralement associé à une entité opérationnelle (marketing, finance, ressources humaines ). Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 54

5. Développement d un Data warehouse 5. 4 Phase 3: mise en œuvre des applications 5.4.1 Les 5 étapes Etape 1: étude préalable Définition et planification des étapes suivantes de manière plus précise et détaillée que dans les phases précédentes. Analyse de l existant Etude des besoins. Etape 2: étude détaillée (cf. parties 6 et 7 + loin) Modélisation conceptuelle des données Modélisation logique multidimensionnelle Modélisation mathématique: définition des agrégations et des formules. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 55 5. Développement d un Data warehouse 5. 4 Phase 3: mise en œuvre des applications 5.4.1 Les 5 étapes Etape 3: réalisation Définition de l interface homme-machine Implémentation physique Intégration. Etape 4: déploiement Etape 5: mesures Bilan de la mise en œuvre de l application de data warehouse (capitalisation d expérience) Mesures doivent être effectuées régulièrement. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 56

5. Développement d un Data warehouse 5. 4 Phase 3: mise en œuvre des applications 5.4.2 Démarche itérative Mise en œuvre des applications peut s effectuer selon une approche itérative, de type RAD (Rapid Application Development). Phase de mise en œuvre des applications découpée en deux sous-phases, avec déroulement des 5 étapes à chaque fois: Développement d un prototype (pilote) Déploiement, généralisation du pilote. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 57 5. Développement d un Data warehouse 5. 5 Conclusion: schéma général du processus d entreprise Vision Vision PI P2 P3 Projet 1 (pilote) Projet 2 (pilote) Projet 3 (pilote) Itérative inter-projets Itérative inter-projets Itérative inter-projets Vision projet Projet 1 (déploiement) Projet 2 (déploiement) Projet 3 (déploiement) d entreprise Copyright J. Akoka - I. Comyn-Wattiau - N.Prat Incrémentale : multi projet 58

6. Modélisation des données d un Data warehouse 6. 1 Introduction 6.1.1 Nécessité de techniques de modélisation spécifiques Système transactionnel Data warehouse Redondances Mises à jour A minimiser pour préserver la fiabilité et la cohérence du système (normalisation). Oui Autorisées. Non. Pas de mises à jour en ligne. Mise à jour dans la phase de chargement/ rafraîchissement. Modèle de données Utilisateur n accède pas directement au modèle de données. Utilisateur a un accès direct au modèle de données. Volumes de données Nombre de tables manipulées dans les requêtes Résultats des transactions : volumes limités. Faible en général Requêtes manipulent souvent de gros volumes de données. Elevé en général. Requêtes prévisibles Oui Non dans de nombreux cas. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 59 6. Modélisation des données d un Data warehouse 6. 1 Introduction 6.1.2 Modèle multidimensionnel 3 concepts fondamentaux: Les faits mesurent l activité. Les faits sont toujours numériques. Les faits les plus importants et les plus utiles sont valorisés de façon continue et additifs. Les dimensions sont les axes d analyse. Elles peuvent être organisées en hiérarchies telles que la géographie, le temps Les attributs des dimensions qualifient celles-ci. Typiquement, les attributs sont textuels et discrets (par opposition aux faits). Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 60

6. Modélisation des données d un Data warehouse 6. 1 Introduction 6.1.2 Modèle multidimensionnel Opérations fondamentales sur des bases multidimensionnelles: Drill-down (une donnée agrégée est visualisée à un niveau de détail plus fin) et consolidation (les données sont visualisées à un niveau plus agrégé). Le drill-down et la consolidation se fondent sur l utilisation des hiérarchies entre dimensions, et des fonctions agrégées (somme, nombre, min, max, moyenne). Slicing and dicing: visualisation des données selon différentes perspectives. Copyright J. Akoka - I. Comyn-Wattiau - N.Prat 61 6. Modélisation des données d un Data warehouse 6. 1 Introduction 6.1.2 Modèle multidimensionnel DIMENSION Attribut de dimension Fait CA ANNEE TRIMESTRE MOIS JOUR PRODUIT - libellé - prix unitaire VILLE - nombre d habitants -pouvoir d achat moyen REGION -taux de chômage Copyright J. Akoka - I. Comyn-WattiauTYPE - N.Prat DE PRODUIT 62 Un cube d analyse des ventes