Évolution de modèle dans les entrepôts de données : existant et perspectives



Documents pareils
Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Evolution et personnalisation des analyses dans les entrepôts

Personnalisation collaborative pour l enrichissement des analyses dans les entrepôts de données complexes

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Généralisation contextuelle de mesures dans les entrepôts de données

Bases de Données Avancées

Entrepôt de données 1. Introduction

Les Entrepôts de Données. (Data Warehouses)

Gestion et analyse personnalisées des demandes marketing : cas de LCL-Le Crédit Lyonnais

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

La place de la Géomatique Décisionnelle dans le processus de décision

Atelier aide à la Décision à tous les Etages (AIDE)

Les entrepôts de données

Évolution de schémas dans les entrepôts de données : mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Urbanisation des SI-NFE107

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

Entreposage de données complexes pour la médecine d anticipation personnalisée

Rejoignez la Communauté

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

et les Systèmes Multidimensionnels

Introduction au domaine du décisionnel et aux data warehouses

Département Génie Informatique

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Entrepôt de Données. Jean-François Desnos. ED JFD 1

Business Intelligence : Informatique Décisionnelle

LES ENTREPOTS DE DONNEES

Big Data On Line Analytics

BI2 : Un profil UML pour les Indicateurs Décisionnels

SQL SERVER 2008, BUSINESS INTELLIGENCE

AVERTISSEMENT. D autre part, toute contrefaçon, plagiat, reproduction illicite de ce travail expose à des poursuites pénales.

Introduction à la B.I. Avec SQL Server 2008

Business & High Technology

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Techniques d optimisation des requêtes dans les data warehouses

Théories de la Business Intelligence

SQL Server 2012 et SQL Server 2014

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Les Entrepôts de Données

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G.

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Approche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées

Datawarehouse and OLAP

L information et la technologie de l informationl

et les Systèmes Multidimensionnels

Décisionnel & Reporting

Problèmes d additivité dus à la présence de hiérarchies

Evry - M2 MIAGE Entrepôt de données

L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

PF-ETL : vers l'intégration de données massives dans les fonctionnalités d ETL

Business Intelligence avec SQL Server 2012

La problématique. La philosophie ' ) * )

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Les entrepôts de données pour les nuls... ou pas!

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Bases de Données OLAP

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Didier MOUNIEN Samantha MOINEAUX

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes

17/07/2013. Décisionnel dans le Nuage. Laboratoire ERIC. Section 1. Équipe d Accueil Décisionnel dans le Nuage.

Analyse comparative entre différents outils de BI (Business Intelligence) :

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Tout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

Comment réussir son projet de Master Data Management?

Introduction aux entrepôts de données (2)

Technologie data distribution Cas d usage.

Ici, le titre de la. Tableaux de bords de conférence

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Qualité des données sur la chaine de valeur globale du reporting réglementaire, du Pilier 1 au Pilier 3 de Solvabilité 2

Titre : La BI vue par l intégrateur Orange

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

Intelligence Economique - Business Intelligence

QU EST-CE QUE LE DECISIONNEL?

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

D AIDE À L EXPLOITATION

BUSINESS INTELLIGENCE

IFT2255 : Génie logiciel

MYXTRACTION La Business Intelligence en temps réel

Le cycle de vie d'un projet en intelligence d'affaires

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Chapitre 9 : Informatique décisionnelle

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Spécificités, Applications et Outils

Jedox rafraîchit les rapports du fabricant de boissons MBG

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

Guillaume Garbey (Consultant sécurité) Contributeurs: Gilles Morieux, Ismaël Cisse, Victor Joatton

Transcription:

EDA'07 3èmes journées francophones sur les Entrepôts de Données et l'analyse en ligne Poitiers, 7 et 8 Juin 2007 Évolution de modèle dans les entrepôts de données : existant et perspectives Cécile Favre, Fadila Bentayeb, Omar Boussaid Laboratoire ERIC Université Lumière Lyon 2

Contexte et objectif (1/2) Entrepôt de données : consolidation de données provenant de sources de données hétérogènes réponse à des besoins d analyse en vue d une prise de décision, en offrant une modélisation multidimensionnelle des données Approche mixte de conception prenant en compte : des sources de données des besoins d analyse EDA 07 C. Favre et al. 2/17

Contexte et objectif (2/2) Évolution des sources de données et/ou des besoins d analyse Nécessité de faire évoluer le modèle de l entrepôt de données Différentes solutions proposées dans la littérature : comparaison de celles-ci et perspectives de recherche qui en découlent EDA 07 C. Favre et al. 3/17

Plan Exemple Évolution de modèle Évolution de schéma Évolution de données Cohérence des analyses Travaux existants : Mise à jour de modèle Modélisation temporelle Discussion Critères de comparaison Étude comparative Perspectives de recherche EDA 07 C. Favre et al. 4/17

Exemple Schéma multidimensionnel : analyse du NBI EDA 07 C. Favre et al. 5/17

Évolution de schéma Évolutions liées aux concepts (structure) : Ajout / Suppression d une dimension Ajout / Suppression d une mesure Ajout / Suppression d un niveau de granularité Enrichissement ou appauvrissement des possibilités d analyse Cohérence des analyses assurée EDA 07 C. Favre et al. 6/17

Évolution de données Insertion / modification / suppression (instances) Non-volatilité des données (Inmon, 2002) : en théorie ni modification, ni suppression : une requête émise sur les mêmes données à différents moments doit donner le même résultat Mais évolution : des mesures (Rizzi et Golfarelli, 2006) des dimensions et de leurs hiérarchies (non indépendance des dimensions avec la dimension temps) EDA 07 C. Favre et al. 7/17

Cohérence des analyses «Slowly Changing Dimension» (Kimball,1996) : Écraser l ancienne valeur Créer un enregistrement valide pour une période donnée Créer un attribut de plus pour conserver l ancienne valeur EDA 07 C. Favre et al. 8/17

Travaux existants (1/3) Mise à jour de modèle application des évolutions sans garder trace du précédent modèle Opérateurs d évolution (Blaschka et al. 1999, Hurtado et al. 1999, Benitez-Guerrero 2002) Enrichissement de hiérarchie (Mazon et Trujillo 2006, Favre et al. 2007) Maintenance de vues matérialisées (Bellahsene, 2002) EDA 07 C. Favre et al. 9/17

Travaux existants (2/3) Modélisation temporelle : recours à des extensions temporelles pour garder trace des évolutions avec des labels de validité sur : Instances : schéma en étoile temporel (Bliujute et al., 1998) Liens d agrégation : modèle qui gère l évolution des chemins d agrégation (Mendelzon et Vaisman, 2000) Versions : gestion de différentes versions d un modèle (nombreux travaux) EDA 07 C. Favre et al. 10/17

Travaux existants (3/3) Versionnement : Modèle (Eder et Koncilia, 2000 ; Ravat et al., 2006 ; ) Analyse avec choix d une version (Body et al., 2002-2003) «what-if analysis» (Bebel et al., 2004) Analyse à travers les versions (Morzy et Wrembel, 2004 ; Golfarelli et al., 2006) EDA 07 C. Favre et al. 11/17

Critères de comparaison Caractéristiques ristiques des approches Historisation des dimensions Cohérence des analyses Approche orientée utilisateur Mise en place Lors de la conception Complexité Performances Stockage Temps de réponse aux analyses EDA 07 C. Favre et al. 12/17

Étude comparative EDA 07 C. Favre et al. 13/17

Perspectives de recherche (1/3) Cadre formel général pour l évolution de modèle : lien avec les sources et les besoins d analyse S l ensemble des sources de données B l ensemble des besoins d analyse M une structure multidimensionnelle Cadre formel : f ( S, B) = M où f représente notre cadre formel Prise en compte de l évolution grâce à : f S ou B M? EDA 07 C. Favre et al. 14/17

Perspectives de recherche (2/3) Évolution de l architecture décisionnelle : Au-delà de l évolution du modèle, impact sur les autres composants de l architecture décisionnelle : paradigme du «workflow» (Bouzeghoub et al., 1999) Processus ETL Magasin de données Structures redondantes d optimisation (index, vues) Requêtes (reporting, requêtes «presse-bouton», ) EDA 07 C. Favre et al. 15/17

Perspectives de recherche (3/3) Évolution de la charge de requêtes Au-delà de la maintenance des structures redondantes d optimisation Évolution de la stratégie d optimisation Propager l évolution du modèle (schéma et données) sur la charge de requêtes des utilisateurs qui sert dans le choix de l optimisation (choix d index, de vues à matérialiser) EDA 07 C. Favre et al. 16/17

Résumé Évolution de modèle dans les entrepôts Problème de la cohérence des analyses Travaux existants : mise à jour de modèle modélisation temporelle Critères de comparaison et étude comparative Perspectives de recherche EDA 07 C. Favre et al. 17/17

EDA'07 3èmes journées francophones sur les Entrepôts de Données et l'analyse en ligne Poitiers, 7 et 8 Juin 2007 MERCI DE VOTRE ATTENTION Contacts : Cécile Favre : cecile.favre@univ-lyon2.fr Fadila Bentayeb : bentayeb@eric.univ-lyon2.fr Omar Boussaid : omar.boussaid@univ-lyon2.fr