Matérialisation des vues dans un modèle multidimensionnel contraint
|
|
- Basile Beauchamp
- il y a 8 ans
- Total affichages :
Transcription
1 Matérialisation des vues dans un modèle multidimensionnel contraint Faïza Ghozzi Université Paul Sabatier - IRIT 118, Route de Narbonne Toulouse cedex 04 {ghozzi.@irit.fr} RÉSUMÉ. Les bases de données multidimensionnelles (BDM) ont émergé pour répondre aux besoins spécifiques des analyses OLAP. Les données des BDM sont visualisées au travers des cubes. Le cube a été introduit pour pré-calculer des vues agrégées, appelées vues matérialisées, dans le but d améliorer le temps d interrogation. Dans cet article, nous proposons une modélisation en constellation des BDM organisant les données en faits analysées selon différentes dimensions. Notre modèle permet d exprimer un ensemble de contraintes sémantique intra et inter dimensions. Afin d assurer la cohérence des données et d améliorer le processus de matérialisation des vues, nous intégrons ces contraintes lors de la construction du treillis multidimensionnel. Notre proposition est validée par le prototype GEDOOH qui permet d exprimer ces contraintes et de les intégrer dans l algorithme de construction du treillis. ABSTRACT. Multidimensional databases (MDB) were emerged to meet specific OLAP needs. Data in MDB were displayed using cube. Cube was introduced to pre-compute aggregate views, called materialised views, in order to improve response time of OLAP query. In this paper, we define a MDB model which organises data in a constellation of facts and multiple hierarchy dimensions. The model we describe provides a set of semantic intra- and interdimension constraints. In order to insure data consistence and to improve view materialisation process, we integrate these constraints during the multidimensional lattice construction. We validate our proposal by the prototype GEDOOH which can express these constraints into MDB model and integrate them in the lattice construction algorithm. MOTS-CLÉS : modèle multidimensionnel, contraintes, vue matérialisée, treillis multidimensionnel. KEYWORDS : multidimensional model, constraints, materialised view, multidimensional lattice.
2 1. Introduction Les entrepôts de données se sont développés afin de fournir aux décideurs des systèmes dédiés à l analyse des données et de pallier les insuffisances des systèmes transactionnels (OLTP OnLine Transactionnel Processing). Pour faciliter l accès aux données, plusieurs entrepôts ont adopté l approche des bases de données multidimensionnelles (BDM). Les BDM ont donc émergé pour répondre aux besoins spécifiques d analyse multidimensionnelle (OLAP On-Line Analytical Processing) (Codd, 1993). Les BDM sont généralement décrites selon un schéma multidimensionnel comportant des faits (regroupant les mesures d activité) et différents axes appelés dimensions (Kimball, 1996). Les dimensions regroupent les paramètres d analyse organisés selon des hiérarchies. Une hiérarchie décrit différents niveaux de granularité entre les paramètres. Cette structure hiérarchique permet d analyser les données au travers du cube multidimensionnel (Gray et al., 1996). Le cube comporte les valeurs des mesures d activités agrégées suivant les différentes combinaisons de paramètres. L agrégation de données provenant des différentes sources intégrées présente un coût très important qui diminue les performances du système OLAP. Ainsi, l interrogation du cube est souvent améliorée par la matérialisation des vues (Gupta et al., 1999). Contrairement à une vue classique qui est calculée à chaque consultation à partir de la base, une vue matérialisée est une vue dont les données sont stockées dans la base. Le choix de ces vues présente un problème ; une vue matérialisée permet de diminuer le temps d interrogation mais elle nécessite un coût de rafraîchissement et de stockage. L'objet de notre article est de fournir un modèle de représentation des données OLAP intégrant un ensemble de contraintes sémantiques pouvant être exploitées lors du calcul des pré-agrégats afin d éliminer des combinaisons incohérentes et ainsi réduire le coût de construction et de maintenance des bases multidimensionnelles. 1.1 Exemple et problématique Une société commerciale souhaite analyser ses ventes en tenant compte des points de vente, des produits et du temps. Ce besoin se traduit par la modélisation d'une BDM contenant un sujet d'analyse (fait VENTES) et trois axes d'analyses (dimensions TEMPS, PRODUITS et MAGASINS). En respectant le formalisme défini par (Golfarelli et al., 1998), nous obtenons le schéma suivant ; All Annee Mois Jour IdT TEMPS fait mesures hiérarchie VENTES Division Category Rayon Subcategory IdP PRODUITS dimension montant bénéfice Dept_n Dept lib Region attribut faible paramètre IdM All MAGASINS State Pays All ZoneG RaisonS Figure 1 Représentation graphique d'une BDM (Golfarelli et al., 1998).
3 Un cube multidimensionnel (Gray et al., 1996) permet de visualiser les données d une BDM. Il présente les mesures de l analyse agrégées en fonction des différentes combinaisons des paramètres des dimensions. Il peut être représenté par un treillis (Harinarayan et al., 1996). Chaque nœud du treillis est une combinaison de paramètres des dimensions. Chaque lien pointe du nœud i vers le nœud j si j peut être calculé à partir de i. Par exemple, à partir d un nœud regroupant les ventes par magasin et par produit (IdM, IdP) nous pouvons calculer le nœud qui regroupe les ventes par magasin (IdM) (figure 2). All IdM IdT IdP IdM,IdT IdM, IdP IdM, IdT, IdP IdT, IdP Figure 2 Treillis du fait VENTES (Harinarayan et al, 1996) La construction de ce treillis est une étape préliminaire qui permet par la suite de sélectionner l ensemble des vues à matérialiser (Harinarayan et al., 1996) (Baralis et al., 1997). Dans notre exemple, la dimension MAGASINS est organisée selon trois hiérarchies ; "h_zone", "h_géo_fr" et "h_géo_us". La dimension PRODUITS est organisée en deux hiérarchies "h_nom_fr" et "h_nom_us" décrivant respectivement la nomenclature des produits français et celle des produits américains. La combinaison de ces deux dimensions hiérarchisées permet de construire un treillis qui combine deux à deux les hiérarchies des deux dimensions (Gupta et al., 1997) (Harinarayan et al., 1996). Cette combinaison donnera lieu à la définition de vues matérialisées incohérentes tel que la vue combinant le paramètre SubCategory caractérisant les produits américains et le paramètre Département caractérisant un magasin français. A notre connaissance, ce problème n a pas été traité par aucun des travaux antérieurs. 1.2 Travaux existants Dans le cadre de la modélisation des BDM, plusieurs travaux ont proposé des schémas multidimensionnels qui se basent sur les concepts de fait et de dimension (Kimball, 1996). Les faits sont composés de mesures d'activité et les dimensions comportent des paramètres organisés en hiérarchies. Certains modèles intègrent une représentation explicite des hiérarchies (Li et al., 1996) (Lehner, 1998). D'autres modèles prennent en compte des objets à structures complexes avec des hiérarchies multiples (OOLAP) (Pedersen et al., 1999) et intègrent la gestion du temps (Mendelzon et al., 2000). Cependant, aucun de ces modèles ne gèrent les incohérences qui peuvent survenir sur les données de la BDM. A notre connaissance, seul (Hurtabo et al., 02) propose d intégrer un ensemble de contraintes entre les hiérarchies d une même dimension résolvant partiellement le problème des incohérences qui peuvent exister entre les hiérarchies de différentes dimensions.
4 Au niveau de l implantation des BDM, plusieurs travaux se focalisent sur le problème de sélection des vues matérialisées. (Harinarayan et al., 1996) propose un algorithme qui sélectionne un ensemble de vues à matérialiser dans le but de minimiser le coût total d interrogation. Il introduit la notion de treillis multidimensionnel. (Gupta et al., 1999) étend ces travaux par l introduction des index qui permettent d optimiser le calcul des requêtes. (Baralis et al., 1997) propose un algorithme qui intègre explicitement la structure hiérarchique des dimensions. (Theodoratos et al., 1999) suggère d intégrer les facteurs de qualité dans le processus de construction des BDM. (Kotidis et al, 2001) propose le système Dynamat qui sélectionne dynamiquement l'ensemble optimal des vues à matérialiser. L évolution de ces vues est en fonction des requêtes OLAP et de l espace disponible. 1.3 Contributions et organisation de l article Notre contribution est structurée en deux points : l extension de la définition du schéma multidimensionnel en intégrant l expression des contraintes sémantiques afin d offrir une information fiable aux décideurs manipulant la BDM (Hurtabo et al., 2002) (Ghozzi et al., 2003), l intégration de ces contraintes dans le processus de sélection des vues matérialisées afin de ne garder dans le processus de sélection que les vues cohérentes qui ne violent pas l intégrité des contraintes sémantiques exprimées dans le modèle. Cet article s articule autour de trois sections. Une première section présente les concepts inhérents à notre modèle multidimensionnel et les contraintes sémantiques intégrées dans ce modèle. Une deuxième section présente l approche des vues matérialisées basée sur le concept de treillis multidimensionnel ainsi que l intégration des contraintes sémantiques dans le processus de construction de ce treillis. Une dernière section présente notre implantation du modèle multidimensionnel contraint et l apport de l intégration des contraintes sémantiques dans la construction du treillis. 2. Modèle multidimensionnel contraint Nous avons proposé un modèle multidimensionnel conceptuel à contraintes dans le cadre d un schéma en constellation (Ghozzi et al., 2003). Une constellation regroupe plusieurs sujets d'analyse (faits) étudiés selon différents axes d'analyses (dimensions) éventuellement partagés. Notre schéma en constellation intègre l expression de contraintes sémantiques inhérentes au modèle multidimensionnel.
5 2.1 Concepts de base Dans ce paragraphe, nous rappelons brièvement les définitions des concepts de base de notre modèle multidimensionnel. Définition.1 Une constellation C est définie par (N C, F C, D C, Star C, Cons C ) où N C est le nom de la constellation, F C est un ensemble de faits, D C est un ensemble de dimensions, Star C : F C 2 DC est une fonction associant les faits aux dimensions afin de spécifier les sujets d'analyses et les axes d'étude associés, Cons C représente l ensemble des contraintes associées à la constellation. L exemple de la figure 1 présente une constellation comportant un seul fait VENTES analysé selon trois dimensions : TEMPS, MAGASINS et PRODUITS. Définition.2 Un fait F est défini par (N F, M F, I F ) où N F est le nom du fait, M F est un ensemble de mesures, I F est l'ensemble des instances de F. Une instance est définie par le n-uplet [a 1 :v 1, a 2 :v 2,, a w :v w ] où k [1..w], a k M F v k est une valeur. Dans notre exemple, le fait VENTES regroupe les mesures d activité montant et bénéfice. Définition 3. Une dimension D est définie par (N D, P D, H D, I D ) où N D est le nom de la dimension, P D est un ensemble de paramètres, H D est un ensemble de hiérarchies et I D est l'ensemble des instances de D. Une instance est définie par le n- uplet [a 1 :v 1, a 2 :v 2,, a u :v u ] tel que k [1..u], a k P D v k est une valeur. Nous pouvons compléter la représentation graphique de la dimension MAGASINS (figure 1), par la définition suivante (schéma et 2 instances) : ( MAGASINS, {IdM, Dept_n, Dept_lib, Region, State, Pays, ZoneG, RaisonS, All}, {h_geo_fr, h_geo_us, h_zone}, {I MAGASINS 1, I MAGASINS 2}) avec I MAGASINS 1=[IdM : oid2, Dept_n : 31, Dept_lib : Hte-Garonne, Region : Midi- Pyrénées, State : NULL, Pays : France, ZoneG : SO, RaisonS : magasin 1, All : all ], I MAGASINS 2=[IdM : oid7, Dept_n : NULL, Dept_lib : NULL, Region : NULL, State : Texas, Pays : USA, ZoneG : SE, RaisonS : magasin 2, All : all ]. Définition 4. Une hiérarchie h D i est un chemin élémentaire acyclique débutant par Id et se terminant par All et se définit par (N h, Param h, Suppl h, Cond h ) où N h est le nom de la hiérarchie, Param h : P P (P P D ) est une fonction décrivant la hiérarchie des attributs, Suppl h : P 2 PD-P est une fonction décrivant l'ensemble des attributs faibles associés à chaque paramètre, Cond h est une expression booléenne définissant la condition d'appartenance des instances de la dimension à une hiérarchie. Les trois hiérarchies de la dimensions MAGASINS sont définies ainsi : h_geo_fr=( géo. française, (Param h_geo_fr (IdM) = Dept_n, Param h_geo_fr (Dept_n) = Region, Param h_geo_fr (Region) = Pays, Param h_geo_fr (Pays) = All),
6 (Suppl h_geo_fr (IdM) = {RaisonS}, Suppl h_geo_fr (Dept_n) = {Dept_lib}), dom(pays) { France }), h_geo_us=( géo. américaine, (Param h_geo_us (IdM) = State, Param h_geo_us (State) = Pays, Param h_geo_us (Pays) = All), (Suppl h_geo_us (IdM) = {RaisonS}), dom(pays) { USA }), h_zone=( géo. en zones, (Param h_zone (IdM) = ZoneG, Param h_zone (ZoneG) = Pays, Param h_zone (Pays) = All), (Suppl h_zone (IdM) = {RaisonS}), dom(zoneg) {'S', 'E', 'O', 'N', 'C', 'SO', 'SE', 'NO', 'NE'}). La spécificité de multi-instanciation de notre modèle réside dans l intégration d une condition d appartenance des instances de la dimension aux hiérarchies. Ainsi, l instance {I MAGASINS 1} appartient à "h_geo_fr" tandis que {I MAGASINS 2} appartient à "h_geo_us" et {I MAGASINS 1, I MAGASINS 2} appartiennent à "h_zone". 2.2 Contraintes multidimensionnelles Dans le cadre des BDM, plusieurs types de contraintes peuvent êtres identifiés ; les contraintes de démarche, les contraintes d accès, les contraintes syntaxiques et sémantiques liées au modèle. Cet article se focalise sur les contraintes sémantiques. Ces contraintes agissent sur les processus d interrogation et de manipulation des données. Les contraintes sémantiques sont liées à la structure hiérarchique des dimensions et au contexte d analyse. Ces contraintes sont définies lors de la construction d un modèle multidimensionnel. Nous définissons deux familles de contraintes sémantiques selon la portée de ces contraintes : Contraintes sur les instances d une dimension : Contrainte d exclusion : L'exclusion entre deux hiérarchies h 1 et h 2 de D traduit qu'une instance de D appartenant à h 1 n'appartient pas à h 2 et réciproquement. Exemple: L exclusion entre les hiérarchies "h_géo_us" et "h_géo_fr", implique que les instances de la dimension MAGASINS appartenant à la première hiérarchie ne vérifient pas la condition d appartenance à "h_géo_fr". Contrainte d inclusion : L'inclusion d'une hiérarchie h 1 de D dans h 2 de D indique que toutes les instances de h 1 appartiennent à h 2. Exemple: L inclusion de la hiérarchie "h_géo_fr" dans "h_zone", indique que toute les instances vérifiant la condition d appartenance à "h_géo_fr" sont impérativement des instances de la hiérarchie "h_zone". Contrainte de totalité : La totalité entre deux hiérarchies h 1 et h 2 de D traduit qu'une instance de D appartient à h 1 ou à h 2. (Ou inclusif). Elle indique que toutes les instances de la dimension sont des instances de l une des hiérarchies. Exemple: La totalité entre les hiérarchies "h_géo_us" et "h_géo_fr", implique que l union des instances de ces deux hiérarchies forment la totalité des instances de la dimension MAGASINS.
7 Contrainte de partition : La partition entre deux hiérarchies h 1 et h 2 de D traduit qu'une instance de D appartient obligatoirement soit à h 1 soit à h 2. (Ou exclusif). L obligation traduit une contrainte de totalité puisque toutes les instances de la dimension appartiennent à l une des deux hiérarchies. Exemple: Une contrainte de partition entre les hiérarchies "h_géo_us" et "h_géo_fr", implique que l intersection des instances des deux hiérarchies est vide (exclusion) et que l union de ces instances forme la totalité des instances de la dimension MAGASINS (totalité). Contraintes sur les instances du fait : Contrainte d exclusion : L'exclusion entre deux hiérarchies h 1 d'une dimension D 1 et h 2 d'une dimension D 2 indique qu'une instance du fait (relié à D 1 et à D 2 ) ne peut être associée simultanément aux instances de h 1 et h 2. Exemple : L exclusion entre les hiérarchies "h_nom_us" et "h_géo_fr", implique que les instances du fait VENTES reliées à la première hiérarchie ne sont pas en relation avec les instances de la hiérarchie "h_géo_fr". Contrainte d inclusion : L inclusion d une hiérarchie h 1 d'une dimension D 1 dans une hiérarchie h 2 de D 2 indique que les instances du fait (relié à D 1 et D 2 ) manipulées au travers de h 1 sont un sous-ensemble des instances du fait associées à h 2. Exemple : L inclusion de la hiérarchie "h_nom_us" dans la hiérarchie "h_zone", implique que les instances du fait VENTES reliées à la première hiérarchie sont en relation avec les instances de la hiérarchie "h_zone". Contrainte de totalité : La totalité entre deux hiérarchies h 1 d'une dimension D 1 et h 2 d'une dimension D 2 indique que chaque instance du fait (relié à D 1 et à D 2 ) est associée aux instances de h 1 ou à celles de h 2 (ou inclusif). Exemple : La contrainte totalité entre la hiérarchie "h_nom_us" et la hiérarchie "h_géo_fr, implique que l union des instances du fait VENTES reliées à la première hiérarchie et celles reliées à la deuxième hiérarchie représente la totalité des instances du fait. Contrainte de partition : La partition entre deux hiérarchies h 1 d'une dimension D 1 et h 2 d'une dimension D 2 indique que chaque instance du fait est associée soit aux instances de h 1 soit à celles de h 2 (ou exclusif). Une contrainte de partition est l union des deux contraintes exclusion et totalité. Exemple : Entre les hiérarchies "h_nom_us" et "h_géo_fr", nous avons défini deux contraintes d exclusion et de totalité. Ces deux contraintes réunies expriment une contrainte de partition. 3. Treillis multidimensionnel et contraintes Une vue est une relation dérivée (virtuelle) construite à partir d autres relations de la base de données. Une vue définie ainsi est calculée à chaque fois qu elle est
8 appelée. Une vue matérialisée est une vue dont les données sont stockées dans la base. Dans nos travaux, l objectif d une vue matérialisée est d effectuer un calcul de pré agrégats afin d obtenir de meilleures performances en matière de temps de réponse. Une gestion dynamique de ces vues permet d ajouter ou d enlever des vues matérialisées ; leur stockage est temporaire en fonction de l évolution de l analyse. Un treillis de type ET, défini sur l ensemble des vues V, est un graphe acyclique dont les nœuds sont les vues v de V. Un Lien part de l ensemble des nœuds v 1, v 2, v n, vers le nœud v i si v i peut être calculé à partir de l ensemble v 1, v 2, v n et cette dépendance est présentée par un demi-cercle à travers les liens (v i, v 1 ), (v i, v 2 ) (v i, v n ), appelée arc ET. Un treillis de type ET-OU, est un graphe acyclique dont les nœuds sont les vues v de V. Chaque nœud peut avoir un ou plusieurs Arc ET qui le relie aux autres nœuds à partir des quels il peut être calculé. 3.1 Treillis multidimensionnel Soit V l ensemble des vues possibles en combinant les paramètres des dimensions d un fait. Pour chaque fait de notre constellation, nous pouvons définir un treillis multidimensionnel de vues v V de type ET-OU. Nous proposons de construire le treillis en se basant sur la structure hiérarchique (Harinarayan et al., 1996) afin d inclure la sémantique des hiérarchies. La construction du treillis multidimensionnel est basée sur la notion de dépendance fonctionnelle (DF) entre les paramètres d une hiérarchie. En effet, si nous considérons deux attributs ai et aj et que aj dépend fonctionnellement de ai, notée ai aj, (ai détermine aj) alors le regroupement des données selon ai donne le même résultat que le regroupement selon le couple (ai, aj). Par exemple, regrouper les ventes par région et par pays donne le même résultat qu un regroupement par région puisque une région détermine le pays. Ainsi, un nœud du treillis est défini comme suit : Définition 5 Un nœud N P appartenant au treillis multidimensionnel, représentant une vue v, est défini par l ensemble de ses paramètres P comportant les attributs de regroupement de la vue v et tel qu il n existe pas de dépendance fonctionnelle entre les paramètres de P. En se basant sur cette définition, l algorithme de construction du treillis simplifie les nœuds combinant des attributs de la même hiérarchie. Algorithme ConstructionTreillis Entrée : Ax : un nœud du treillis Avec : Structure Nœud : Racine : liste des paramètres, LFils = liste des fils du nœud. LPere_ET : pères reliés par un arc ET. ListeNoeud : Liste des nœuds déjà construits. Sortie : Liste des nœuds du treillis construit Pour chaque Pi Ax.Racine Faire Lp Ax.Racine - {Pi}; Lp Lp + Param (Pi) ; Lp Epurer (Lp) ; Az ChercheNoeud (Lp,ListeNœud) Si (Az= nul) Alors
9 Az.Racine Lp ; ListeNœud ListeNœud + Az ; ListeNœud ConstructionTreillis (Az, ListeNœud); FinSi Ax.LFils Ax.LFils +Az ; Retourner (ListeNœud) FinConstructionTreillis Param (Paramètre : p) récupère la partie droite des dépendances fonctionnelles p a. ChercheNoeud (Lp, ListeNœud) Cherche le nœud de racine Lp dans ListeNœud Algorithme Epurer Entrée : Liste de paramètres. Sortie : Liste de paramètres épurés. Pour chaque Pi Lp Faire Pour chaque Pj Lp- Pi Faire Si (Pj Dépend(Pi)) Alors Lp Lp Pi ; Retourner (Lp) ; FinEpurer Dépend(Pi) récupère les paramètres qui dépendent fonctionnellement de Pi. Figure 3 Algorithme de création d un treillis sans contrainte Dans l exemple de la figure 1, nous avons combiné les paramètres de la dimension MAGASINS. Le treillis généré sans intégration des contraintes (Baralis et al., 1997) est présenté par la figure 4. Dans ce treillis, la combinaison entre les différents paramètres pour réaliser les vues multidimensionnelles ne tient pas compte des contraintes entre les hiérarchies. Les vues visualisant les ventes selon les paramètres Depart et State ou Région et State ne peuvent pas exister car une contrainte d exclusion est définie entre la hiérarchie de la géographie française et celle de la géographie américaine. Région Depart Depart, Zone_G Région, Zone_G All Pays State Depart, State IdM Région, State Depart, State, Zone_G Zone_G State, Zone_G Région, State, Zone_G Figure 4 Treillis des Ventes selon la dimension Magasin (Baralis et al, 1997 En outre, la vue qui décrit les montants des ventes pour chaque pays peut être extraite à partir des vues matérialisées regroupant les montants des ventes par région, état ou zone géographique. Sans considération des contraintes entre les instances des hiérarchies, nous n aurons pas d informations sur la complétude de cette vue. En effet, regrouper les montants des ventes par pays à partir du paramètre région ne donne qu une partie des instances de la dimension, puisque le paramètre région ne concerne que les ventes réalisées en France. Par contre, le passage du paramètre zone vers pays permet de calculer les montants des ventes pour toutes les instances de la dimension MAGASINS. L introduction des contraintes sur les instances de la dimension permet d enlever cette ambiguïté.
10 3.2 Intégration des contraintes Pour intégrer les contraintes, nous modifions l algorithme de construction de treillis en validant chaque nœud avant de l insérer dans le treillis. La validation est basée sur les contraintes définies sur les instances des faits et des dimensions. Définition 6. Un Nœud N P est Valide en considérant l ensemble des contraintes C, s il n existe pas un couple de paramètres (pi, pj) appartenant à P x P qui sont en exclusion. Définition 7. Deux paramètres Pi et Pj P sont en exclusion si toutes les hiérarchies h n passant par Pi sont en exclusion (ou en partition) avec toutes les hiérarchies h m passant par Pj. Algorithme ValiderNœud Entrée : Un nœud Ax Sortie : Vraie si le nœud est valide, sinon faux. Lp Ax.Racine ; Valide Vraie ; i 0 ; Tant que Valide et i< taille (Lp) Faire Pi Lp[i]; j i+1 ; Tant que (Valide et j< taille(lp)) Faire Pj Lp[j] ; Valide ExclusionP (Pi, Pj); Retourner (Valide) ; FinValiderNœud Algorithme ExclusionP Entrée : Deux paramètres Pi et Pj Sortie : Vraie si Pi et Pj sont en exclusion, sinon faux. Vraie ou faux. Lhi les hiérarchies passant par Pi ; Lhj les hiérarchies passant par Pj ; p 0 ; Valide = Faux ; Tantque non Valide et p< taille (Lhi) Faire hp Lhi [p] ; q 0 ; Tant que non Valide et q <taille (Lhj) Faire hq Lhj [q] ; Si ((Exclusion(hq, hp)) = Faux) Alors Valide Vraie; retourner (Valide) ; FinExclusionP Figure 5 Algorithme de validation des contraintes des nœuds du treillis Ce premier algorithme (figure 5) permet d enlever de "ListeNoeud" les nœuds représentant des vues qui ne respectent pas les contraintes de validité. Dans l exemple que nous avons présenté, nous proposons de modifier le treillis afin de tenir compte des contraintes sur les instances de la dimension MAGASINS. Pour obtenir le treillis valide, il faut enlever les liens vers les nœuds fils supprimés du treillis et les remplacer par des liens qui pointent vers des nœuds fils valides.
11 Algorithme ValiderLiens Entrée : Liste des nœuds du treillis Sortie : Treillis avec des liens valides. Pour chaque nœud Ax ListeNœud Faire Pour chaque nœud Af Ax.LFils Faire Si Af ListeNœud Alors Ax.LFils Ax.LFils Af ; Ax.LFils Ax.LFils + Af.LFils ; FinSi Pour chaque nœud Ax ListeNœud Faire Pour chaque Af1 Ax.LFils Faire Pour chaque Af2 Ax.LFils Af1 Faire Si Af2 petitfils(af1) Alors Ax.LFils Ax.LFils Af2; Si Af1 petitfils(af2) Alors Ax.LFils Ax.LFils Af1; //Construction des arcs ET. Pour chaque Ap1 Pere(Ax) Faire Pour chaque Ap2 Pere(Ax) Ap1 Faire Si (ExclusionN(Ap1, Ap2) ) Alors Ajouter {Ap1, Ap2} à Ax.LPere_ET; FinSi FinValiderLiens Algorithme ExclusionN Entrée : Deux nœuds Ni et Nj. Sortie : Vraie si Ni et Nj sont en exclusion, sinon faux. Li Ni.Racine ; Lj Nj.Racine ; Valide Vraie ; i 0 ; Tant que Valide et i< taille(li) Faire Pi Li[i] ; j 0 ; Tant que Valide et j< taille (Lj) Faire Pj Lj[j]; Valide ExclusionP (Pi, Pj); Retourner(Valide) ; FinExclusionN petitfils(af) : récupère les petits fils du nœud Af dans le treillis. Pere(Ax) :récupère les nœuds pères de Ax. Figure 6 Algorithme de reconstruction des liens intégrant les contraintes Le deuxième algorithme (figure 6) permet de reconstruire les liens entre les nœuds valides du treillis multidimensionnel et d ajouter les arcs ET. La figure 7 décrit les différentes étapes du reconstruction des liens par cet algorithme. All Pays All Pays All Pays Région State Zone_G ET Depart Région, Zone_G Région, State State, Zone_G Région State Zone_G Région State Zone_G Depart, Zone_G Depart, State Région, State, Zone_G Depart Région, Zone_G State, Zone_G Depart Région, Zone_G State, Zone_G Depart, State, Zone_G Depart, Zone_G Depart, Zone_G IdM IdM IdM Figure 7 Treillis de la dimension MAGASIN intégrant les contraintes
12 La vue regroupant les ventes par pays est calculée soit à partir de la vue regroupant les ventes par ZoneG soit à partir de l union des ventes par State et par Région. La notation ET indique que l union de ces deux vues permet de retrouver la vue globale regroupant les ventes par pays. Ce treillis intègre la contrainte d exclusion entre les hiérarchies Géographique américaines et française, ainsi, il ne combine pas les deux paramètres State et Depart en une seule vue (de même pour State et Région). La combinaison entre les paramètres Depart et ZoneG, d un coté, et State et ZoneG, de l autre, est permise donnant lieu à deux nouvelles vues possibles pour les ventes. Le traitement que nous avons réalisé au niveau d une seule dimension est applicable au niveau d un fait entre les hiérarchies de différente dimensions. Dans notre exemple (figure 1), deux contraintes d exclusion sont définies entre les hiérarchies h_nom_fr et h_géo_us, d une part, et les hiérarchies h_nom_us et h_géo_fr, d autre part. L intégration de ces contraintes dans le treillis des ventes selon les dimensions MAGASINS et PRODUITS permet d enlever 92 nœuds invalides (voir figure 9). 4. Implantation du treillis multidimensionnel Le problème fondamental de la sélection des vues est de trouver l ensemble des vues à matérialiser qui maximise les performances de la bases de données multidimensionnelles lors de l interrogation. Le but de cette analyse est de comparer le résultat réalisé en construisant le treillis de vues à matérialiser sans considération des contraintes sémantiques avec celui obtenu en intégrant ces contraintes. En effet, les vues qui ne satisfont pas les contraintes sémantiques du modèle multidimensionnel n apportent pas de gain au temps d interrogation des requêtes OLAP. Prenons l exemple de la vue v combinant les ventes par département français et états américains. En respectant la contrainte d exclusion entre la hiérarchie de la géographie française et celle de la géographie américaine, la vue v est vide. Supposons que cette vue contient des données, alors la BDM est incohérente car la contraintes d exclusion n est pas satisfaite. L élimination de ces vues réduit considérablement la taille du treillis multidimensionnel sur lequel se base les techniques d optimisation de la sélection des vues matérialisées (Baralis et al., 1997) (Gupta et al., 1999) et de réécriture de requêtes OLAP (Park et al., 2001). La taille du treillis T dépend du nombre d attributs dans les dimensions et plus particulièrement dans les hiérarchies. Sans considération des contraintes T est calculée comme suit : T = Π h i=1 n i Avec n i le nombre d attributs dans la hiérarchie i et h le nombre de hiérarchies combinées dans le treillis. L intégration des contraintes réduit cette taille en enlevant les combinaisons incohérentes.
13 4.1 Implantation des contraintes Afin de valider nos propositions, nous avons développé un prototype, appelé GEDOOH. Il comporte une interface graphique qui permet à l administrateur de définir les schémas des BDM et produit automatiquement au travers du générateur les scripts de création et d alimentation de ces BDM. Pour ce faire, l ensemble des définitions sont entreposées dans un référentiel de méta-données. Après avoir défini les composants d un schéma de la BDM, l administrateur peut spécifier les contraintes intra- et/ou inter-dimensions. Cette définition est réalisée en sélectionnant l option de création d une contrainte afin d obtenir la boîte de dialogue de la figure 8 ; l administrateur doit sélectionner ensuite les hiérarchies et la contrainte appliquée. Figure 8 Interface de définition d'une contrainte d'exclusion intra-dimension La définition d une contrainte sur les hiérarchies induit une mise à jour du référentiel et une vérification des conflits possibles entre les contraintes ; cette vérification permet par exemple d interdire la création d une contrainte d exclusion et d une contrainte d inclusion entre les mêmes hiérarchies. 4.2 Treillis multidimensionnel intégrant les contraintes Le prototype intègre les contraintes sémantiques, stockées dans le référentiel de méta données, dans l algorithme de construction du treillis multidimensionnel. Nous avons pris l exemple de la BDM exposée dans la figure 1. Dans cet exemple, nous avons construit les treillis multidimensionnels en combinant les différentes dimensions sans intégrer les contraintes afin de relever le nombre de vues de chaque treillis. Puis, nous avons intégré les contraintes à l aide de notre interface et nous avons construit de nouveau l ensemble des treillis possibles (voir figure 9). Taille du treillis multi dimensionnel PRODUITS MAGASINS TEMPS PRODUITS, MAGASINS PRODUITS, TEMPS MAGASINS, TEMPS PRODUITS, MAGASINS, TEMPS Sans contraintes Avec contraintes Figure 9 Tableau comparatif de la taille du treillis multidimensionnel.
14 La diminution du nombre de vues dans le treillis multidimensionnel simplifie sa manipulation. La recherche d un nœud représentant une vue à matérialiser devient moins coûteux et plus facile. Si nous reprenons l exemple du treillis combinant les ventes selon les dimensions PRODUITS et MAGASINS, nous passerons d un treillis de 140 nœuds sans considérer les contraintes (figure 10 (a)) vers un treillis de 48 nœuds après intégration des contraintes sémantiques (figure 10 (b)). (a) avant intégration des contraintes (b) après intégration des contraintes Figure 10 Treillis combinants les dimensions PRODUITS et MAGASINS
15 5. Conclusion Cet article étudie l intégration des contraintes sémantiques dans les treillis multidimensionnels. Ces contraintes sont définies dans un modèle de données en constellation qui assure une plus grande cohérence des données par sa propriété de multi-instanciation. Nous distinguons les contraintes intra-dimension qui portent sur les hiérarchies d une même dimension, des contraintes inter-dimensions qui s appliquent entre les hiérarchies de dimensions distinctes. L intégration de ces contraintes dans le processus de construction des treillis multidimensionnels permet d enlever toutes les vues incohérentes, ne satisfaisant pas les contraintes, et de réduire la taille de ces treillis. L intégration de ces contraintes dans le modèle multidimensionnel est réalisée à l aide de notre prototype GEDOOH, développé au sein de notre équipe. Une extension de ce prototype a permis d utiliser les contraintes lors de la construction des treillis multidimensionnels. L intégration des contraintes a permis de tenir compte de la sémantique de la BDM et de réduire la taille de ces treillis. Nous envisageons de poursuivre cette étude en analysant l implication des contraintes dans le processus d interrogation des requêtes OLAP. Pour cela nous envisageons de proposer un ensemble d opérateurs multidimensionnels qui intègrent la sémantique des contraintes et d utiliser le treillis multidimensionnel pour répondre à ces requêtes. 6. Bibliographie (Baralis et al, 1997) Baralis E., Paraboschi S., Teniente E., «Materialized Views Selection in a Multidimensional Database», Proceedings of the 23rd VLDB Conference Athens, Greece, (Codd, 1993) Codd E.F., «Providing OLAP (on-line analytical processing) to user-analysts : an IT mandate», Technical Report, E.F. Codd and Associates, (Ghozzi et al, 2003)Ghozzi F., Ravat F., Teste O., Zurfluh G., «Modèle Multidimensionnel à Contraintes», Revue des Sciences et Technologies de l'information, Série RIA-ECA, Volume 17, n1-2-3/2003. (Golfarelli et al, 1998) Golfarelli M., Maio D., Rizzi S., «Conceptual design of Data Warehouse from E/R Schemas», Proceeding of the 31 st Hawaii International Conference on System Sciences, Kona (Hawaii, USA), (Gray et al, 1996) Gray J., Bosworth A., Layman A., Pirahesh H., «Datacube: A Relational Operator Generalizing Group-By, Cross-Tab and Sub-Total», Proceeding of the 12 International Conference on Data Engineering, pp , (Gupta et al, 1997) Gupta H., Harinarayan V, Rajaraman A., «Index selection for OLAP», 13th International Conference on Data Engineering Birmingham, U.K April 07-11,
16 (Gupta et al, 1999) Gupta H., Mumick I., S., «Selection of view to materialize under a maintenance cost constraint», 7th International Conference Database Theory - ICDT '99, Jerusalem, Israel, January 10-12, (Harinarayan et al, 1996) Harinarayan V., Rajaraman A., Ullman J. «Implementing Data Cubes Efficiently» Proceedings of the 1996 ACM SIGMOD Conference, Monreal (Hurtabo et al, 2002) Hurtado C., Mendelzon A., «OLAP Dimension Constraints», PODS 2002, Madison, June 2002 (Kimball, 1996) Kimball R., «The data warehouse toolkit», John Wiley and Sons, (Kotidis et al, 2001) Kotidis Y., Roussopoulos N., «A case for dynamic view management», Database Systems journal, volume 26 n 4, p , (Lehner, 1998) Lehner W., «Modeling Large Scale OLAP Scenarios», 6th International Conference on Extending Database Technology (EDBT'98), Valence (Espagne), Mars (Li et al, 1996) Li C., Wang X. S., «A Data Model for Supporting On-Line Analytical Processing», 5th International Conference on Information and Knowledge Management -ACM CIKM'96, Novembre (Mendelzon et al, 2000) Mendelzon A, Vaisman A., «Temporal Queries in OLAP», VLDB 2000, Caire (Egypte), Septembre (Park et al, 2001) Park C. S., Kim M. H., Lee Y. J. «Rewriting OLAP Queries Using Materialized Views and Dimension Hierarchies in Data Warehouses», 17th International Conference on Data Engineering, April 02-06, 2001 Heidelberg, Germany. (Pedersen et al, 1999) Pedersen T. B., Jensen C. S., «Multidimensional Data Modeling for Complex Data», ICDE' 99. (Theodoratos et al, 1999) Theodoratos D., Bouzeghoub M., «Data Currency Quality Factors in Data Warehouse Design», Proceedings of the International Workshop on Design and Management of Data Warehouses (DMDW 99), Heidelberg, Germany,
Fouille de Données : OLAP & Data Warehousing
Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de
Plus en détailDatawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani
Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Plus en détailEntrepôts de données multidimensionnelles NoSQL
Entrepôts de données multidimensionnelles NoSQL Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, Ronan Tournier Université de Toulouse, IRIT UMR 5505, Toulouse, France http://www.irit.fr
Plus en détailAlgèbre OLAP et langage graphique
Algèbre OLAP et langage graphique Franck Ravat, Olivier Teste, Gilles Zurfluh To cite this version: Franck Ravat, Olivier Teste, Gilles Zurfluh. Algèbre OLAP et langage graphique. Congrès Informatique
Plus en détailEntrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016
Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques
Plus en détailBases de données multidimensionnelles et mise en œuvre dans Oracle
Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailLes Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Plus en détailTechniques d optimisation des requêtes dans les data warehouses
Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données
Plus en détailDémarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G.
Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles F.Atigui, F.Ravat, O.Teste, G.Zurfluh IRIT (SIG/ED) Université Paul Sabatier 118 route de Narbonne 31062
Plus en détailApproche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées
Approche de modélisation multidimensionnelle des données complexes : Application aux données médicales Sid Ahmed Djallal Midouni, Jérôme Darmont, Fadila Bentayeb To cite this version: Sid Ahmed Djallal
Plus en détailETL Extract - Transform - Load
ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus
Plus en détailLamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013
Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,
Plus en détailEntreposage de données complexes pour la médecine d anticipation personnalisée
Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée
Plus en détailGénéralisation contextuelle de mesures dans les entrepôts de données
Généralisation contextuelle de mesures dans les entrepôts de données Application aux entrepôts de données médicales Yoann Pitarch* Cécile Favre** Anne Laurent* Pascal Poncelet* * LIRMM, UMR 5506 161, Rue
Plus en détailHervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
Plus en détailCours Base de données relationnelles. M. Boughanem, IUP STRI
Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),
Plus en détailRapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON
Rapport de DEA Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP Anne-Muriel ARIGON LIRIS INSA de Lyon Bâtiment 501 69621 Villeurbanne, France Encadré
Plus en détailConstruction graphique d entrepôts et de magasins de données
Construction graphique d entrepôts et de magasins de données Frédéric Bret, Olivier Teste IRIT (Institut de Recherche en Informatique de Toulouse), équipe SIG, Université Toulouse III, 118, Route de Narbonne
Plus en détailC-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes
C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes Khaled Dehdouh Fadila Bentayeb Nadia Kabachi Omar Boussaid Laboratoire ERIC, Université de Lyon 2 5 avenue Pierre Mendes-France,
Plus en détailSystèmes d information et bases de données (niveau 1)
Systèmes d information et bases de données (niveau 1) Cours N 1 Violaine Prince Plan du cours 1. Bibliographie 2. Introduction aux bases de données 3. Les modèles 1. Hiérarchique 2. Réseau 3. Relationnel
Plus en détailÉvolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses
Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique
Plus en détailProblèmes d additivité dus à la présence de hiérarchies
Problèmes d additivité dus à la présence de hiérarchies complexes dans les modèles multidimensionnels : définitions, solutions et travaux futurs Marouane Hachicha, Jérôme Darmont To cite this version:
Plus en détailOracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK
Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP
Plus en détailSQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste
Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en
Plus en détailExemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions
Exemple accessible via une interface Web Une base de données consultable en ligne : Bases de données et systèmes de gestion de bases de données The Trans-atlantic slave trade database: http://www.slavevoyages.org/tast/index.faces
Plus en détailBI = Business Intelligence Master Data-ScienceCours 3 - Data
BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage
Plus en détailChapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
Plus en détailSQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
Plus en détailLES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas
Plus en détailLa place de la Géomatique Décisionnelle dans le processus de décision
Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres
Plus en détail4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Plus en détailDatawarehouse and OLAP
Datawarehouse and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today architecture ETL refreshing warehousing projects architecture architecture
Plus en détailUrbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Plus en détailModélisation d objets mobiles dans un entrepôt de données
Tao Wan, Karine Zeitouni Laboratoire PRISM, Université de Versailles 45, avenue des Etats-Unis, 78035 Versailles Cedex, France Tao.Wan@prism.uvsq.fr, Karine.Zeitouni@prism.uvsq.fr http://www.prism.uvsq.fr/users/karima/
Plus en détailBases de Données. Plan
Université Mohammed V- Agdal Ecole Mohammadia d'ingénieurs Rabat Bases de Données Mr N.EL FADDOULI 2014-2015 Plan Généralités: Définition de Bases de Données Le modèle relationnel Algèbre relationnelle
Plus en détailEvolution et personnalisation des analyses dans les entrepôts
Evolution et personnalisation des analyses dans les entrepôts de données Une approche orientée utilisateur Cécile Favre Fadila Bentayeb Omar Boussaid Laboratoire ERIC Université de Lyon - Campus Porte
Plus en détailBases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
Plus en détailSQL Server 2012 et SQL Server 2014
SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation
Plus en détailLes Entrepôts de Données. (Data Warehouses)
Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage
Plus en détailBusiness Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailORACLE TUNING PACK 11G
ORACLE TUNING PACK 11G PRINCIPALES CARACTÉRISTIQUES : Conseiller d'optimisation SQL (SQL Tuning Advisor) Mode automatique du conseiller d'optimisation SQL Profils SQL Conseiller d'accès SQL (SQL Access
Plus en détailSGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Plus en détailOPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE
OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE «Journée Open Data» 5 Novembre 2013 Présenté par : Imen Megdiche Directeur de thèse : Pr. Olivier Teste (SIG-IRIT) Co-directeur de thèse : Mr. Alain
Plus en détailMéthodes d évolution de modèle produit dans les systèmes du type PLM
Résumé de thèse étendu Méthodes d évolution de modèle produit dans les systèmes du type PLM Seyed Hamedreza IZADPANAH Table des matières 1. Introduction...2 2. Approche «Ingénierie Dirigée par les Modèles»
Plus en détailPlan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation
Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions
Plus en détailAVERTISSEMENT. D autre part, toute contrefaçon, plagiat, reproduction illicite de ce travail expose à des poursuites pénales.
AVERTISSEMENT Ce document est le fruit d un long travail approuvé par le jury de soutenance et mis à disposition de l ensemble de la communauté universitaire élargie. Il est soumis à la propriété intellectuelle
Plus en détailIntelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Plus en détailCONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS
CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes
Plus en détailAlimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS
Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS John Samuel LIMOS (Laboratoire d Informatique, de Modélisation et d Optimisation
Plus en détailPersonnalisation collaborative pour l enrichissement des analyses dans les entrepôts de données complexes
Personnalisation collaborative pour l enrichissement des analyses dans les entrepôts de données complexes Cécile Favre, Fadila Bentayeb, Omar Boussaid Université de Lyon (ERIC Lyon 2) 5 av. Pierre Mendès-France
Plus en détailBUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
Plus en détailModélisation Multidimensionnelle des Tableaux de Bord Prospectifs
Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs Zaia Alimazighi (*), Nazih Selmoune (*) (Alimazighi, Selmoune)@wissal.dz (*) Laboratoire des systèmes informatiques (LSI), Faculté d Electronique
Plus en détailLA GESTION DES VUES 1. INTRODUCTION
LA GESTION DES VUES 1. INTRODUCTION Pourquoi des vues? Elles permettent de réaliser, dans le monde des SGBD relationnels, le niveau externe des SGBD selon l architecture ANSI/SPARC. Rappelons que le niveau
Plus en détailMathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans
Mathématique et Automatique : de la boucle ouverte à la boucle fermée Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans Maitine.Bergounioux@labomath.univ-orleans.fr Plan 1. Un peu de
Plus en détailUNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur
UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications
Plus en détailPlan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse
Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailIntroduction à Business Objects. J. Akoka I. Wattiau
Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états
Plus en détailCompétences Business Objects - 2014
Compétences Business Objects - 2014 «Mars-Juin 2014. Réf : Version 1 Page 1 sur 34 Sommaire CONTEXTE DE LA REMISE A NIVEAU EN AUTOFORMATION... 3 1. MODELISATION... 4 1.1 DESCRIPTION FONCTIONNEL DE L'APPLICATION
Plus en détailPlan. Exemple: Application bancaire. Introduction. OCL Object Constraint Language Le langage de contraintes d'uml
OCL Object Constraint Language Le langage de contraintes d'uml Plan 1. Introduction 2. Les principaux concepts d'ocl Object Constraint Language 1 Object Constraint Language 2 Exemple: une application bancaire
Plus en détailUne proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes
303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire
Plus en détailUML (Diagramme de classes) Unified Modeling Language
UML (Diagramme de classes) Unified Modeling Language Sommaire Introduction Objectifs Diagramme de classes Classe (Nom, attribut, opération) Visibilité et portée des constituants d une classe Association
Plus en détailBases de Données OLAP
Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre
Plus en détailBases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS
Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions
Plus en détailBI = Business Intelligence Master Data-Science
BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)
Plus en détailLe Guide Pratique des Processus Métiers
Guides Pratiques Objecteering Le Guide Pratique des Processus Métiers Auteur : Version : 1.0 Copyright : Softeam Equipe Conseil Softeam Supervisée par Philippe Desfray Softeam 21 avenue Victor Hugo 75016
Plus en détailIFT2255 : Génie logiciel
IFT2255 : Génie logiciel Chapitre 6 - Analyse orientée objets Section 1. Introduction à UML Julie Vachon et Houari Sahraoui 6.1. Introduction à UML 1. Vers une approche orientée objet 2. Introduction ti
Plus en détail2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Plus en détailMaster Exploration Informatique des données DataWareHouse
Master Exploration Informatique des données DataWareHouse Binôme Ahmed BENSI Enseignant tahar ARIB SOMMAIRE I. Conception...1 1. Contexte des contrats...1 2. Contexte des factures...1 II. Modèle physique...2
Plus en détailBases de données. Chapitre 1. Introduction
Références : Bases de données Pierre Wolper Email : pw@montefiore.ulg.ac.be URL : http : //www.montefiore.ulg.ac.be/~pw/ http : //www.montefiore.ulg.ac.be/ ~pw/cours/bd.html Henry F. Korth, Abraham Silberschatz,
Plus en détailDéfinition et diffusion de signatures sémantiques dans les systèmes pair-à-pair
Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux
Plus en détailOASIS www.oasis-open.org/committees/xacml/docs/docs.shtml Date de publication
Statut du Committee Working Draft document Titre XACML Language Proposal, version 0.8 (XACML : XML Access Control Markup Language) Langage de balisage du contrôle d'accès Mot clé Attestation et sécurité
Plus en détailLa rencontre du Big Data et du Cloud
La rencontre du Big Data et du Cloud Libérez le potentiel de toutes vos données Visualisez et exploitez plus rapidement les données de tous types, quelle que soit leur taille et indépendamment de leur
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles
Plus en détailA QUOI SERVENT LES BASES DE DONNÉES?
BASE DE DONNÉES OBJET Virginie Sans virginie.sans@irisa.fr A QUOI SERVENT LES BASES DE DONNÉES? Stockage des informations : sur un support informatique pendant une longue période de taille importante accès
Plus en détailUne méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,
Plus en détailStructuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,
Plus en détailDéveloppement d un interpréteur OCL pour une machine virtuelle UML.
ObjeXion Software Prototyping made easy SA au capital de 500 000 F Siret 421 565 565 00015 APE 722Z Téléphone : 03 89 35 70 75 Télécopie : 03 89 35 70 76 L embarcadère 5, rue Gutemberg 68 800 Vieux-Thann,
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailarxiv:0707.1288v1 [cs.db] 9 Jul 2007
Une approche de construction d espaces de représentation multidimensionnels dédiés à la visualisation Riadh Ben Messaoud, Kamel Aouiche, Cécile Favre arxiv:0707.1288v1 [cs.db] 9 Jul 2007 Laboratoire ERIC,
Plus en détailTout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander
Tout ce que vous avez toujours voulu savoir sur SAP HANA Sans avoir jamais osé le demander Agenda Pourquoi SAP HANA? Qu est-ce que SAP HANA? SAP HANA pour l intelligence d affaires SAP HANA pour l analyse
Plus en détailLe "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
Plus en détailLes bases de données Page 1 / 8
Les bases de données Page 1 / 8 Sommaire 1 Définitions... 1 2 Historique... 2 2.1 L'organisation en fichier... 2 2.2 L'apparition des SGBD... 2 2.3 Les SGBD relationnels... 3 2.4 Les bases de données objet...
Plus en détailINTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES
INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et
Plus en détailLes entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
Plus en détailBusiness & High Technology
UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...
Plus en détailBases de données - Modèle relationnel
Bases de données - Modèle relationnel Introduction SITE :http://www.univ-orleans.fr/lifo/members/mirian.halfeld/ BD - Mírian Halfeld-Ferrari p. 1 Les bases de données - Bibliographie Ullman and Widom,
Plus en détailL information et la technologie de l informationl
L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements
Plus en détailEcole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales
Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire
Plus en détailInformation utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/
Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/
Plus en détailWorkflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1
Workflow/DataWarehouse/DataMining 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 plan Workflow DataWarehouse Aide à la décision DataMinig Conclusion 14-09-98 LORIA
Plus en détailTP 2 Réseaux. Adresses IP, routage et sous-réseaux
TP 2 Réseaux Adresses IP, routage et sous-réseaux C. Pain-Barre INFO - IUT Aix-en-Provence version du 24/2/2 Adressage IP. Limites du nombre d adresses IP.. Adresses de réseaux valides Les adresses IP
Plus en détailTechniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication
Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete
Plus en détailLangage SQL : créer et interroger une base
Langage SQL : créer et interroger une base Dans ce chapitre, nous revenons sur les principales requêtes de création de table et d accès aux données. Nous verrons aussi quelques fonctions d agrégation (MAX,
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailUniversité de Bangui. Modélisons en UML
Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et
Plus en détailIntroduction au Système de Gestion de Base de Données et aux Base de Données
Introduction au Système de Gestion de Base de Données et aux Base de Données Formation «Gestion des données scientifiques : stockage et consultation en utilisant des bases de données» 24 au 27 /06/08 Dernière
Plus en détail