Mise à jour incrémentale des agrégats

Dimension: px
Commencer à balayer dès la page:

Download "Mise à jour incrémentale des agrégats"

Transcription

1 Mise à jour incrémentale des agrégats Cas des indicateurs ROLAP dans les entrepôts de données Mohamed Badri*, Véronique Heiwy* et Faouzi Boufarès** * CRIP5, IUT de Paris Descartes Département informatique 143 Avenue de Versailles Paris ** LIPN, IUT de Villetaneuse Département informatique 99, avenue Jean-Baptiste Clément VILLETANEUSE 143 Avenue de Versailles Paris {badri, heiwy}@univ-paris5.fr ; boufares@iutv.univ-paris13.fr Sections de rattachement : 27 Secteur : Tertiaire RÉSUMÉ. Les entrepôts de données subissent continuellement des mises à jour afin d intégrer de nouvelles données, ce qui implique l actualisation de son contenu et également celle des indicateurs qui sont gérés par des vues matérialisées. Les outils de gestion des entrepôts offrent des performances limitées en matière de maintenance des agrégats. Dans cet article, nous présentons une méthode de calcul incrémentale pour l actualisation des indicateurs décisionnels (agrégats) ROLAP stockés dans les vues matérialisées. ABSTRACT. The data warehouses are often updated to integrate new data wich implies aggregates updating. These aggregates are managed by materialized views. Warehouses tools offer limited performance in maintaining aggregates. In this paper, we present a method for incremental maintenance of ROLAP indicators (aggregates) stored in materialized views. MOTS-CLÉS : Maintenance incrémentale, indicateurs ROLAP, agrégats, entrepôt de données KEYWORDS: Incremental maintenance, ROLAP indicators, aggregates, data warehouse

2 1. Introduction Aujourd hui avec la mondialisation des marchés et des économies l entreprise évolue dans un environnement de plus en plus vaste, de plus en plus concurrentiel et doit faire face à des risques et des contraintes toujours plus grands. L entreprise collecte en permanence de nouvelles données, toujours en quête de nouvelles études et analyses. Toute cette masse de données est produite quotidiennement que ce soit par l entreprise elle même ou par son environnement. Pour aider et assister les décideurs dans leur processus de prise de décision, l entrepôt de données (ED) constitue de nos jours un élément incontournable. L objectif d un ED est d assembler toutes les "parties" qui constituent le système d information pour former ainsi une seule structure (masse) de données plus facile à manipuler, à exploiter et à gérer. L entrepôt est au coeur du système d information (SI) décisionnel [RAV 01]. L ED est une entité vivante, son contenu doit être alimenté et raffraîchi en continu. L actualisation des indicateurs d analyse est un facteur crucial pour la prise de décision. Dans certains domaines d application, des analyses sont réalisées plusieurs fois par semaine voire par jour. Où parfois un détail, une information donnée ou l évolution d un critère d analyse peut pèser sur la prise de décision (exemple de crise boursière ou de tension politique dans une région du monde). La maintenance a donc une place stratégique dans le dispositif de SI décisionnel, c est aussi un critère de performance pour un ED. En raison de l énorme masse de données manipulée et du temps de calcul important, dans ce type d application, la maintenance des ED est réalisée en mode différé (batch), généralement le soir ou pendant les week-ends. La lenteur du traitement est en réalité due à la méthode employée par les outils de gestion des entrepôts de données. En effet, l intégration de nouvelles données dans l ED est réalisée grâce à un recalcul complet de tous les indicateurs. Dans cet article, nous présentons une méthode de calcul incrémentale qui, à la suite à une mise à jour d un ED, permet de retrouver la nouvelle valeur d un indicateur sans avoir à le recalculer entièrement. Cette méthode a un côut moindre et s utilise à tout moment pour intégrer les flux de données entrant et actualiser en temps réel les indicateurs d analyse. Nous présentons vers la fin du papier des mesures de performance réalisées sur plusieurs instances d ED. Notre méthode de maintenance est comparée à celle du SGBD-OLAP Oracle 10g. 2. Les indicateurs dans les entrepôts de données Les indicateurs sont des instruments de mesure définis par l entreprise pour observer l évolution d un fait (prix de vente, prix de revient, cours d action, frais de mission, etc...) par rapport à un ensemble de dimensions (clients, produits, temps, magasins, fournisseurs, marchés, lieux, contrats, laboratoies, etc...). Dans le domaine des bases de données et des entrepôts de données, les indicateurs sont assimilés à des agrégats. Leur gestion est assurée par la couche (dite aussi moteur) OLAP (On-Line Analytical Processing) du système mis en place. Il peut s agir du ROLAP (Relational OLAP) où les agrégats sont alors stockés dans des relations appelées généralement vues matérialisées (VM) ou dans des tables spécifiques appelées Automatic Summary Tables (AST) dans certains systèmes (e.g. DB2 d IBM). Comme il peut s agir d une couche MOLAP (Multidimensional OLAP) où les agrégats sont stockés dans des structures 2

3 multidimentionnelles (hypercubes). A noter que d autres techniques existent aussi comme le H-OLAP (Hybrid-OLAP) ou le S-OLAP (Spatial-OLAP). Nous invitons le lecteur à voir [THO 02] pour plus de détails. Nous nous intéressons dans le cadre de ce travail au cas ROLAP. Un système décisionnel OLAP est constitué d un entrepôt de données et d une couche d analyse OLAP. Les mises à jour apparues au niveau source sont transférées vers l ED qui met à jour son contenu. Cette mise à jour de l entrepôt est par la suite véhiculée vers la couche OLAP où les indicateurs sont actualisés. Dans le cas du ROLAP, cette maintenance d indicateurs revient à maintenir les vues matérialisées. Ces structures sont largement utilisées dans les systèmes décisionnels relationnels aussi bien pour le stockage des données au niveau entrepôt que pour le stockage des indicateurs au niveau OLAP [BAD 06a, HAM 07]. La méthode présentée dans cet article porte sur la maintenance des indicateurs. Ces indicateurs OLAP sont généralement présentés graphiquement aux décideurs sous forme de tableaux à deux dimensions ou de cubes multidimentionnels. Ceci n a pas d incidence sur leur maintenance. 3. Calcul incrémental des fonctions d agrégats 3.1. Notions Les fonctions d agrégats appartiennent à des catégories différentes et ne sont pas toutes actualisées de la même manière. Dans la littérature [PAL 02, CHO 04] les auteurs les classent en trois groupes : - Les fonctions d agrégats distributives : Une fonction f est distributive si pour un groupe G, f(g) peut être calculée à partir des valeurs de f(g s ) où les groupes G s sont des sous-groupes de G. Exemple de fonctions distributives : COUNT ALL, MAX, MIN, SUM. - les fonctions d agrégats algébriques : Une fonction f est algébrique si pour un groupe G, f(g) peut être calculée à partir d un nombre connu d agrégats intermédiaires établis sur les sous-groupes G s. Dans les systèmes relationnels, les données supplémentaires sont généralement stockées dans des vues auxiliaires. Exemple de fonctions algébriques : AVG (Moyenne), VARIANCE, STDDEV (écart type). - et les fonctions d agrégats holistiques : Le nombre d agrégats intermédiaires n est pas connu. Et il n existe aucune méthode pour calculer ces agrégats de manière incrémentale. La seule méthode possible est celle qui explore les lignes de données. Ce type de fonction ne sera pas étudié dans le cadre de ce travail. Exemple de fonctions hotlistiques : COUNT DISTINCT, RANK (rang). En effet, étant donné deux ensembles A et B de valeurs entières la moyenne(a B) moyenne(moyenne(a), moyenne(b)) alors que max(a B) = max(max(a), max(b)). Notre objectif est de montrer comment réaliser certains calculs pour retrouver le résultat d une fonction d agrégats. Etant donnée un entrepôt de données w issu d une ou de plusieurs sources de données DB s avec s [1..b], soit T une serie de mises à jour provonant d une ou de plusieurs sources. Les composants de l ED (c 1, c 2,..., c n ) sont répartis sur une ou plusieurs relations (faits et dimensions) obtenus par notre algorithme de génération d ED [HAM 07]. L application de cet algorithme sur T donne w. Il s agit de la mise à jour de l entre- 3

4 pôt. Soit w t (respectivement w t) une version (respectivement la mise à jour) de l ED w à un instant t donné. L actualisation d un ED consiste à calculer un nouvel entrepôt (une nouvelle version) : w t = w t 1 w t. Les schémas logiques de l ED et de son évolution sont : w(c 1, c 2,..., c n ) et w (c 1, c 2,..., c n ). Considérons qu une vue matérialisée v, définie sur l entrepôt w, soit le résultat d une fonction de calcul d agrégats (i.e. indicateurs) sur w avec v = f(w). On peut donc calculer v (la VM issue de w ) de la même manière : v = f(w ). Soient : W = {w i, i 1} l ensemble des entrepôts calculés et V = {v i, i 1} celui de toutes les vues matérialisées calculées à partir de W. V A V est l ensemble de toutes les vues matérialisées appelées vues auxilaires. Soit f une fonction d agrégats définie par : f : W V ; f(w t ) = v t Sachant que : w t = w t 1 w t ; on peut donc écrire f(w t ) = f(w t 1 w t) = v t Selon les définitions données plus haut on peut écrire : - Il existe pour toute fonction distributive f : une fonction h : V V V ; h(v t 1, v t) = v t tel que f(w t 1 w t) = h(f(w t 1 ), f(w t)) f(w t ) = f(w t 1 w ) = h(f(w t 1 ), f(w t)) = h(v t 1, v t) = v t - Il existe pour toute fonction algébrique f : une fonction d agrégats g A : W V A ; g A (w t ) = vt A et une fonction h : V A V A V avec h(vt 1, A v t A ) = v t tel que f(w t 1 w t) = h A (g(w t 1 ), g(w t)) f(w t ) = f(w t 1 w ) = h(g A (w t 1 ), g A (w t)) = h(vt 1, A v t A ) = v t Dans la suite, nous démontrons ces égalités et donnons pour chaque opérateur d agrégat (comptage, moyenne, max, min, variance, etc...) la méthode de calcul incrémentale correspondante (c est-à-dire les fonctions g A et h) Calcul des fonctions Soit un ensemble E i d éléments discrets tel que : E i = {x i1, x i2, x i3,..., x ipi } avec E i = p i sa cardinalité et X i sa moyenne arithmétique. n n n Et soit l ensemble E = E i, avec E i = et E = p i = P. f f(e) f(w t ) = h(f(w t 1 ), f(w t )) = h(v t 1, v t ) Count Count(E) = count(e i ) Count(w t ) = Sum(Count(w t 1 ), Count(w t )) = Sum(v t 1.a count, v t.a count) Min Min(E) = Min n (Min(E i)) Min(w t ) = Min(Min(w t 1 ), Min(w t )) (or Max) = Min(v t 1.a Min, v t.a Min ) Sum Sum(E) = Sum(E i ) Sum(w t ) = Sum(Sum(w t 1 ), Sum(w t )) Tableau 1. Exemples de calcul de fonctions distributives = Sum(v t 1.a Sum, v t.a Sum ) 4

5 f(e) Avg(E) = Sum(E i) count(e i ) V ar(e) = Count(E i) (V ar(e i) + Avg(E i) 2 ) Count(E i) 0 12 Sum(E i ) C A Count(E i) f(w t) = h(g A (w t 1), g A (w t )) = h(va t 1, v A t ) Avg(w t) = Sum(Sum(w t 1), Sum(w t )) Sum(Count(w t 1 ), Count(w t )) = Sum(vA t 1.a sum, v A t.a sum) Sum(vt 1 A.a count, v t A.a count) V ar(w t) = X «2 1 X3 X 2 X 4 where : X 1 = Sum(Count(w t 1 )(V ar(w t 1 ) + Avg(w t 1 ) 2 ), Count(w t )(V ar((w t )) + Avg(w t )2 )) = Sum(v A t 1.acount(vA t 1.avar + va t 1.a2 avg ), v A t.a count(v A t.a var + v A t.a2 avg )) X 2 = Sum(Count(w t 1 ), Count(w t )) = Sum(v A t 1.a count, v A t.a count) X 3 = Sum(Sum(w t 1), Sum(w t )) = Sum(v A t 1.asum, v A t.asum) X 4 = Sum(Count(w t 1), Count(w t )) = Sum(v A t 1.a count, v A t.a count) Tableau 2. Exemples de calcul de fonctions algébriques 4. Expérimentations Nous avons utilisé Oracle 10g sous Linux Ubuntu 7.10 sur une machine AMD Athlon XP 1500 Mhz 512 Mo de RAM. D abord sans aucun chemin d accès rapide aux données, puis en créant des index (bitmap et b-tree) et des partitions horizontales Exemple d application : L entrepôt Gescom Etant données les deux sources d une entreprise de distribution pour sa gestion commerciale : Gescom1 une base de données relationnelle gérée avec le SGBD DB2 et Gescom2 une BD relationnelle-étendue gérée avec Oracle. Elles sont décrites par les schémas relationnels ci-dessous. Remarquons que les types de données ne sont pas les mêmes et que l attribut catégorie du client n existe pas dans Gescom2. Gescom1 : PRODUITS(REFART,NOMART,PVART,QTSTKART); CLIENTS(CODCLI,CIVCLI,CATCLI,ADNCLI,ADRCLI,CPCLI,VILCLI,PAYSCLI); COMMANDES(NUMCOM,#CODCLI,#CODSITE,DATCOM); LIGNE_CDE(NUMCOM,REFART,QTCOM,PUART,REMISE); SITES(CODSITE,ADRSITE,VILLESITE,PAYSSITE); 5

6 Gescom2 : ARTICLES(REFART,NOMART,PVART); CLIENTS(CODCLI,CIVCLI,NOMCLI,PRENCLI,ADNCLI,ADRCLI,ADVCLI); COMMANDES(NUMCOM,#CODCLI,#CODMAG,DATCOM); DETAILCOM(NUMCOM,REFART,QTCOM,PUART); MAGASINS(CODMAG,NOMMAG,ADNMAG,ADRMAG,ADVMAG); L ED devra permettre d analyser les ventes (chiffre d affaires, nombre d articles, Quantités vendues, moyenne,...) par catégorie de clients, par ville et par période. Les composants de l ED sont CATEGORIE, VILLE, PAYS, NOMARTICLE, FAMILLEART, DATCOM, SEMAINE, MOIS, ANNEE, QUANTITE, PRIXU. Les clés primaires et étrangères (CODCLI, REFART, NUMCOM) sont implicites. L objectif étant de faire de l analyse multi-dimentionnelle. Le script de création de l ED, produit par l algorithme ConstruitVue de notre prototype HDI (Heterogeneous Data Integration) présenté dans [HAM 07], donne le schéma relationnel ci-dessous. Les tables de dimensions : W_D_CLIENTS (CODCLI, CATEGORIE, VILLE, PAYS) W_D_ARTICLES (REFART, NOMART, FAMILLEART) W_D_COMMANDES (NUMCOM, DATCOM, SEMAINE, MOIS, ANNEE). La table de faits : W_F_VENTE (CODCLI,REFART,NUMCOM,QUANTITE,PRIXU) Création des VM Nous avons créé plusieurs vues matérialisées avec différentes expressions de regroupement en utilisant Group by Cube, Group by Rollup et Group by Grouping sets. Dans le cadre de ce papier nous ne présentons que les résultats du calcul la VM Group by Cube. Les fonctions suivantes ont été calculées et stockées dans cette VM : Sum, Avg, Min, Max, Variance, Stddev, Count. Vue matérialisée d agrégats gérée par Oracle : CREATE MATERIALIZED VIEW VM_ORA REFRESH COMPLETE ON DEMAND as SELECT CATEGORIE, VILLE, K.ANNEE, SUM(QUANTITE*PRIXU) SOMME, AVG(QUANTITE*PRIXU) MOY, MIN(QUANTITE*PRIXU) MINI, MAX(QUANTITE*PRIXU) MAXI, VARIANCE(QUANTITE*PRIXU) VARIANCE_PU, stddev(quantite*prixu) ECART_TYPE_PU, COUNT(all K.NUMCOM) C_ALL FROM W_D_CLIENTS C, W_D_COMMANDES K, W_F_VENTE F WHERE C.CODCLI = F.CODCLI AND K.NUMCOM = F.NUMCOM GROUP BY CUBE(CATEGORIE, VILLE, K.ANNEE); Table d agrégats gérée par notre outil HDI : CREATE TABLE VM_HDI as SELECT ID- CATEGORIE VILLE ANNEE as CLE, CATEGORIE, VILLE, ANNEE, SUM(QUANTITE*PRIXU) SOMME, AVG(QUANTITE*PRIXU) MOY, MIN(QUANTITE*PRIXU) MINI, MAX(QUANTITE*PRIXU) MAXI, VARIANCE(QUANTITE*PRIXU) VARIANCE_PU, stddev(quantite*prixu) ECART_TYPE_PU, COUNT(all F.NUMCOM) C_ALL, COUNT(*) N FROM W_D_CLIENTS C, W_D_COMMANDES K, W_F_VENTE F WHERE C.CODCLI = F.CODCLI AND K.NUMCOM = F.NUMCOM GROUP BY CUBE(CATEGORIE, VILLE, ANNEE); Notre table d agrégats est équivalente à la VM d Oracle. Nous calculons en plus des agrégats demandés, des valeurs intérmédiaires nécessaires à notre méthode incrémentale (e.g. pour calculer la moyenne on a besoin de connaître la somme et le compte). Nous intégrons un identifiant pour chaque ligne composé des valeurs de l expression 6

7 de regroupement. Cet identifiant sera utilisé au niveau de la jointure entre v et v-prim Les VM ont été créées à partir de deux instances différentes de l ED W_Gescom. Une première avec 1 million de lignes (faits) et une autre avec 7 millions. Les mêmes VM et les mêmes tests ont été réalisés sur les deux instances pour évaluer les résultats. Les mesures de performance sont représentées par les courbes des figures 1 et Mise à jour des VM Les mises à jour sources sont répercutées au niveau de l entrepôt selon notre algorithme ConstuitVue [HAM 07]. Ainsi un "nouvel" entrepôt, issu de ces mises à jour, est construit : w-prim. Ce dernier est calculé à partir des tables/fichiers-log qui constituent les mises à jour. Par la suite, et à partir de cet entrepôt, la vue v-prim est créée. Les deux vues v et v-prim contiennent des agrégats intermédiaires calculés respectivement à partir de w et de w-prim. Ces calculs serviront dans la mise à jour des agrégats de la VM v à l aide des formules présentées dans la section 3. Notre démarche a été comparée à celle du SGBD Oracle (10g) qui ne propose qu un rafraîchissement complet et sur demande. Les limites de la maintenance des VM sous Oracle sont détaillées dans [BAD 06b]. Les mises à jour que nous avons traités (de jusqu à 1 million de lignes) montrent que notre démarche incrémentale est beaucoup plus performante (c.f. figures 1 et 2). Exemple A : Démarche de rafraîchissement sous Oracle. Le rafraîchissement de la vue est fait quel que soit le nombre de lignes sources mises à jour avec la procédure prédéfinie : dbms_mview.refresh( VM_ORA ). Exemple B : Démarche de maintenance avec notre outil HDI. Suite à la mise à jour de l entrepôt W nous calculons v-prim à partir de w-prim comme suit : CREATE TABLE VM_HDI_PRIM as SELECT ID- CATEGORIE VILLE ANNEE as CLE, COUNT(*) N CATEGORIE, VILLE, ANNEE, SUM(QUANTITE*PRIXU) SOMME, AVG(QUANTITE*PRIXU) MOY, MIN(QUANTITE*PRIXU) MINI, MAX(QUANTITE*PRIXU) MAXI, VARIANCE(QUANTITE*PRIXU) VARIANCE_PU, stddev(quantite*prixu) ECART_TYPE_PU, COUNT(all F.NUMCOM) C_ALL FROM W_D_CLIENTS_PRIM C, W_D_COMMANDES_PRIM K, W_F_VENTE_PRIM F WHERE C.CODCLI = F.CODCLI AND K.NUMCOM = F.NUMCOM GROUP BY CUBE(CATEGORIE, VILLE, ANNEE); Nous pouvons maintenant procéder aux calculs des nouvelles valeurs des agrégats de VM_HDI. La jointure gauche externe (full outer join) donne la possibilité de prendre en compte toutes les valeurs de v et celles correspondantes de v [PAL 02]. Cependant, le calcul des agrégats basé sur les valeurs de faits associées à de nouvelles valeurs de dimensions n est pas pris en compte. Prenons un exemple : si dans une des sources, une nouvelle catégorie de client a été enregistrée, alors elle sera répercutée sur w en calculant w w. Par contre la jointure externe gauche ne prendra pas en compte cette nouvelle donnée et la valeur de l agrégat correspondant ne sera pas intégrée à la vue matérialisée. En appliquant les formules présentées dans la section 3 nous obtenons : CREATE MATERIALIZED VIEW VM_NEW as SELECT decode(v.cle,null,v_prim.cle,v.cle) as CLE, decode(v.cat,null, V_PRIM.CAT, V.CAT) as CAT, decode(v.vil,null,v_prim.vil,v.vil) as VIL, decode(v.d,null,v_prim.d,v.d) as D, decode(v.maxi,null,v_prim.maxi, decode(v_prim.maxi,null,v.maxi, decode(abs(v_prim.maxi-v.maxi), 7

8 V_PRIM.Maxi-V.Maxi, V_PRIM.Maxi, V.Maxi))) as Maxi, decode(v_prim.moy,null,v.moy, decode(v.moy,null,v_prim.moy, (V_PRIM.S + V.S)/(V_PRIM.N + V.N))) as Moy, from VM_HDI full V outer join VM_HDI_PRIM V_PRIM on V.CLE=V_PRIM.CLE; Temps (s) Maintenance de VM calculee sur un ED de 1 million de lignes Oracle HDI Temps (s) Maintenance de VM calculee sur un ED de 1 million de lignes Oracle HDI Taille des mises a jour (Nombre de lignes) Taille des mises a jour (Nombre de lignes) Figure 1. Maintenance d une VM issue d un DW à 1 million de lignes 5. Conclusion Figure 2. Maintenance d une VM issue d un DW à 7 millions de lignes Dans le cadre de travaux réalisés par les étudiants de l IUT de Paris et de Paris 13, nous avons réalisé des tests sur plusieurs VM issues de différentes instances de BD. La maintenance incrémentale de ces VM selon notre méthode donne des résultats nettement plus performants que le rafraîchissement proposé par Oracle 10g. Nous travaillons actuellement sur l impact de la mise à jour des structures de l ED sur la gestion des agrégats. La partie implentation de ces travaux fait l objet d un projet pluridisciplinaire (PPD) au sein de l IUT de Paris. L intégration d autres structures de données pour gérer les VM ainsi que leur mise à jour constituent nos travaux futurs. 6. Bibliographie [BAD 06a] BADRI M., BOUFARÈS F., DUCATEAU C., HAMDOUN S., «Maintenance des entrepôts de données hétérogènes», MCSEAI 9th Maghrebian Conference on Software Engineering and Artificial Intelligence, décembre 2006, p [BAD 06b] BADRI M., BOUFARÈS F., DUCATEAU C., NEFOUSSI R., «Maintenance des vues matérialisées hétérogènes sous Oracle», Workshop SID Systèmes d Information Décisionnels, dans INFORSID 2006, june 2006, p [CHO 04] CHOU P., ZHANG X., «Computing Complex Iceberg Cubes by Multiway Aggregation and Bounding», DaWaK, 2004, p [HAM 07] HAMDOUN S., BOUFARÈS F., BADRI M., «Construction et maintenance des entrepôts de données hétérogènes», Revue e-ti,, n o 4, [PAL 02] PALPANAS T., SIDLE R., COCHRANE R., PIRAHESH H., «Incremental Maintenance for Non-Distributive Aggregate Functions.», VLDB, 2002, p [RAV 01] RAVAT F., TESTE O., ZURFLUH G., «Modélisation multidimensionnelle des systèmes décisionnels», EGC, 2001, p [THO 02] THOMSEN E., OLAP Solutions Building Multidimensional Information Systems, Wiley, second édition,

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Fouille de Données : OLAP & Data Warehousing

Fouille de Données : OLAP & Data Warehousing Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

ISC21-1 --- Système d Information Architecture et Administration d un SGBD Compléments SQL

ISC21-1 --- Système d Information Architecture et Administration d un SGBD Compléments SQL ISC21-1 --- Système d Information Architecture et Administration d un SGBD Compléments SQL Jean-Marie Pécatte jean-marie.pecatte@iut-tlse3.fr 16 novembre 2006 ISIS - Jean-Marie PECATTE 1 Valeur de clé

Plus en détail

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

FreeAnalysis. Schema Designer. Cubes

FreeAnalysis. Schema Designer. Cubes FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt

Plus en détail

Master Exploration Informatique des données DataWareHouse

Master Exploration Informatique des données DataWareHouse Master Exploration Informatique des données DataWareHouse Binôme Ahmed BENSI Enseignant tahar ARIB SOMMAIRE I. Conception...1 1. Contexte des contrats...1 2. Contexte des factures...1 II. Modèle physique...2

Plus en détail

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Bases de Données OLAP

Bases de Données OLAP Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre

Plus en détail

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Avant de commencer à travailler avec le produit, il est nécessaire de comprendre, à un haut niveau, les problèmes en réponse desquels l outil a été

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs Zaia Alimazighi (*), Nazih Selmoune (*) (Alimazighi, Selmoune)@wissal.dz (*) Laboratoire des systèmes informatiques (LSI), Faculté d Electronique

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

TP Bases de données réparties

TP Bases de données réparties page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

Techniques d optimisation des requêtes dans les data warehouses

Techniques d optimisation des requêtes dans les data warehouses Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données

Plus en détail

Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G.

Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G. Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles F.Atigui, F.Ravat, O.Teste, G.Zurfluh IRIT (SIG/ED) Université Paul Sabatier 118 route de Narbonne 31062

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

Cours 4 : Agrégats et GROUP BY

Cours 4 : Agrégats et GROUP BY Cours 4 : Agrégats et GROUP BY Agrégat Fonction qui effectue un calcul sur l ensemble des valeurs d un attribut pour un groupe de lignes Utilisation dans une clause SELECT ou dans une clause HAVING 3 types

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

Les entrepôts de données et l analyse de données

Les entrepôts de données et l analyse de données LOG660 - Bases de données de haute performance Les entrepôts de données et l analyse de données Quelques définitions Entreposage de données (data warehousing): «La copie périodique et coordonnée de données

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

1 Introduction et installation

1 Introduction et installation TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications

Plus en détail

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

Les Entrepôts de Données. (Data Warehouses)

Les Entrepôts de Données. (Data Warehouses) Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage

Plus en détail

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ... Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média

Plus en détail

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes Khaled Dehdouh Fadila Bentayeb Nadia Kabachi Omar Boussaid Laboratoire ERIC, Université de Lyon 2 5 avenue Pierre Mendes-France,

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des

Plus en détail

Cours 3. Développement d une application BD. DBA - Maîtrise ASR - Université Evry

Cours 3. Développement d une application BD. DBA - Maîtrise ASR - Université Evry Cours 3 Développement d une application BD 1 Plan du cours Gestion de la sécurité des données Optimisation des schémas de bases via la dénormalisation Utilisation de vues Placement du code applicatif dans

Plus en détail

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications

Plus en détail

BI = Business Intelligence Master Data-Science

BI = Business Intelligence Master Data-Science BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre Bases de Données Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre Synthèse : conception de BD langage de modélisation famille de SGBD SGBD Analyse du

Plus en détail

Les bases de données

Les bases de données Les bases de données Introduction aux fonctions de tableur et logiciels ou langages spécialisés (MS-Access, Base, SQL ) Yves Roggeman Boulevard du Triomphe CP 212 B-1050 Bruxelles (Belgium) Idée intuitive

Plus en détail

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse Pascale Borla-Salamet Consultante Avant Vente Oracle France Oracle Exadata Performance et Optimisation de votre Datawarehouse Agenda Les nouveaux challenges Exadata Storage Server Oracle Database Machine

Plus en détail

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1) Introduction à lʼinformatique Décisionnelle et la «Business Intelligence» (1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013

Plus en détail

Entrepôts de données : Systèmes OLAP : ROLAP, MOLAP et OLAP (5) 1 Introduction aux systèmes

Entrepôts de données : Systèmes OLAP : ROLAP, MOLAP et OLAP (5) 1 Introduction aux systèmes Entrepôts de données : Systèmes : R, M et H (5) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Introduction aux systèmes Systèmes

Plus en détail

Langage SQL : créer et interroger une base

Langage SQL : créer et interroger une base Langage SQL : créer et interroger une base Dans ce chapitre, nous revenons sur les principales requêtes de création de table et d accès aux données. Nous verrons aussi quelques fonctions d agrégation (MAX,

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel Mémoire de fin d études Pour l obtention du diplôme d Ingénieur d Etat en Informatique Option : Systèmes d information Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système

Plus en détail

1 Modélisation d une base de données pour une société de bourse

1 Modélisation d une base de données pour une société de bourse IN306 : Corrigé SID Christophe Garion 18 octobre 2010 Ce document est un corrigé succinct de l examen du module IN306. 1 Modélisation d une base de données pour une société de bourse Une

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 Workflow/DataWarehouse/DataMining 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 plan Workflow DataWarehouse Aide à la décision DataMinig Conclusion 14-09-98 LORIA

Plus en détail

Entrepôts de données multidimensionnelles NoSQL

Entrepôts de données multidimensionnelles NoSQL Entrepôts de données multidimensionnelles NoSQL Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, Ronan Tournier Université de Toulouse, IRIT UMR 5505, Toulouse, France http://www.irit.fr

Plus en détail

Modélisation d objets mobiles dans un entrepôt de données

Modélisation d objets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni Laboratoire PRISM, Université de Versailles 45, avenue des Etats-Unis, 78035 Versailles Cedex, France Tao.Wan@prism.uvsq.fr, Karine.Zeitouni@prism.uvsq.fr http://www.prism.uvsq.fr/users/karima/

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

17/07/2013. Décisionnel dans le Nuage. Laboratoire ERIC. Section 1. Équipe d Accueil 3083. Décisionnel dans le Nuage.

17/07/2013. Décisionnel dans le Nuage. Laboratoire ERIC. Section 1. Équipe d Accueil 3083. Décisionnel dans le Nuage. Master 2 FDGC-ECD Année 203-204 Laboratoire ERIC Équipe d Accueil 3083 et Jérôme Darmont eric.univ-lyon2.fr/~jdarmont/ Section Décisionnel dans le Nuage 2 Le meilleur des mondes Du décisionnel à papa datawarehousing0.wikispaces.com

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer Bases de Données Réparties Définition Architectures Outils d interface SGBD Réplication SGBD répartis hétérogènes BD réparties Principe : BD locales, accès locaux rapides accès aux autres SGBD du réseau

Plus en détail

Structure fonctionnelle d un SGBD

Structure fonctionnelle d un SGBD Fichiers et Disques Structure fonctionnelle d un SGBD Requetes Optimiseur de requetes Operateurs relationnels Methodes d acces Gestion de tampon Gestion de disque BD 1 Fichiers et Disques Lecture : Transfert

Plus en détail

LA GESTION DES VUES 1. INTRODUCTION

LA GESTION DES VUES 1. INTRODUCTION LA GESTION DES VUES 1. INTRODUCTION Pourquoi des vues? Elles permettent de réaliser, dans le monde des SGBD relationnels, le niveau externe des SGBD selon l architecture ANSI/SPARC. Rappelons que le niveau

Plus en détail

Evry - M2 MIAGE Entrepôts de Données

Evry - M2 MIAGE Entrepôts de Données Evry - M2 MIAGE Entrepôts de Données Modélisation décisionnelle D. Ploix - M2 MIAGE - Conception EDD 1 Plan Construction de l entrepôt : les faits et les dimensions Préparation de l analyse : Les agrégats

Plus en détail

Administration des bases de données. Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/

Administration des bases de données. Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/ Administration des bases de données Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/ Administration des bases de données II Objets avancés dans les bases de données OBJECTIFS 2.1. NOTIONS 2.1.1.

Plus en détail

Approche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées

Approche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées Approche de modélisation multidimensionnelle des données complexes : Application aux données médicales Sid Ahmed Djallal Midouni, Jérôme Darmont, Fadila Bentayeb To cite this version: Sid Ahmed Djallal

Plus en détail

Eduardo Almeida. Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr}

Eduardo Almeida. Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr} Data Warehouse - OLAP Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr} Objectif Présenter les concepts de base d'un Data Warehouse (DW) et On Line Analytical Processing (OLAP). Présenter

Plus en détail

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence L offre décisionnel IBM Patrick COOLS Spécialiste Business Intelligence Le marché du Business Intelligence L enjeux actuel des entreprises : devenir plus «agiles» Elargir les marchés tout en maintenant

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1 Entrepôt de Données Jean-François Desnos Jean-Francois.Desnos@grenet.fr ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,

Plus en détail

Datawarehouse and OLAP

Datawarehouse and OLAP Datawarehouse and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today architecture ETL refreshing warehousing projects architecture architecture

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/62 Bases de Données Avancées Introduction & Rappel Conception et Modélisation Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

Quelques aspects du Relationnel-Objet du SGBD Oracle

Quelques aspects du Relationnel-Objet du SGBD Oracle Département informatique de l IUT (de l université) de Bordeaux Cours de Bases de Données : présentation partielle d un SGBD RO 12 août 2015 Olivier Guibert Quelques aspects du Relationnel-Objet du SGBD

Plus en détail

OpenPaaS Le réseau social d'entreprise

OpenPaaS Le réseau social d'entreprise OpenPaaS Le réseau social d'entreprise Spécification des API datastore SP L2.3.1 Diffusion : Institut MinesTélécom, Télécom SudParis 1 / 12 1OpenPaaS DataBase API : ODBAPI...3 1.1Comparaison des concepts...3

Plus en détail

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON Rapport de DEA Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP Anne-Muriel ARIGON LIRIS INSA de Lyon Bâtiment 501 69621 Villeurbanne, France Encadré

Plus en détail

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité Les capitalistes sociaux sur Twitter : détection via des mesures de similarité Nicolas Dugué, Anthony Perez LIFO - Université d Orléans rue Léonard de Vinci B.P. 6759 F-45067 ORLEANS Cedex 2 FRANCE RÉSUMÉ.

Plus en détail

Evolution et personnalisation des analyses dans les entrepôts

Evolution et personnalisation des analyses dans les entrepôts Evolution et personnalisation des analyses dans les entrepôts de données Une approche orientée utilisateur Cécile Favre Fadila Bentayeb Omar Boussaid Laboratoire ERIC Université de Lyon - Campus Porte

Plus en détail

CHAPITRE 1 ARCHITECTURE

CHAPITRE 1 ARCHITECTURE 07/04/2014 Université des sciences et de la Technologie Houari Boumediene USTHB Alger Département d Informatique ADMINISTRATION ET TUNING DE BASES DE DONNÉES CHAPITRE 1 ARCHITECTURE RESPONSABLE DR K. BOUKHALFA

Plus en détail

IBM Tivoli Monitoring, version 6.1

IBM Tivoli Monitoring, version 6.1 Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

palais des congrès Paris 7, 8 et 9 février 2012

palais des congrès Paris 7, 8 et 9 février 2012 palais des congrès Paris 7, 8 et 9 février 2012 Analysis Services 2012 BI Personnelle, couche sémantique, cube, quelle(s) solution(s) pour un nouveau projet décisionnel? 08/02/2012 Aurélien KOPPEL Microsoft

Plus en détail

DEMANDE D INFORMATION RFI (Request for information)

DEMANDE D INFORMATION RFI (Request for information) DOD SEICAM RFI Demande d information EVDEC Réf. : RFI_EVDEC- GT5_Outil_reporting_BI_v4.doc Page 1/11 DEMANDE D INFORMATION RFI (Request for information) OUTIL INTÉGRÉ DE REPORTING ET D ANALYSE DÉCISIONNELLE

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail