Bases de données multidimensionnelles et mise en œuvre dans Oracle

Dimension: px
Commencer à balayer dès la page:

Download "Bases de données multidimensionnelles et mise en œuvre dans Oracle"

Transcription

1 Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou transactionnels) qui constituent ce qu on appelle les systèmes OLTP (On-Line Transactional Processing). Ces bases de données sont destinées à des systèmes effectuant de nombreuses requêtes pas très complexes et très répétitives touchant une quantité faible de données (en nombre de tables), par exemple pour gérer un stock. De très nombreux opérateurs ont alors accès à ces requêtes de mise à jour (par exemple l ensemble des employés du magasin dont on gère le stock). Ces systèmes de production ne permettent pas d effectuer efficacement des analyses de données. On distingue alors ces premiers sytèmes OLTP des stystèmes OLAP (On-Line Analytical Processing) proposés par Codd (1993) qui sont eux destinés à peu de personnes (dirigeants, analystes) effectuant de manière moins fréquente des requêtes complexes d analyse mettant en jeu de très gros volumes de données stockés dans des entrepôts de données. Ces analyses sont dites multidimensionnelles puisqu elles permettent l analyse d un fait (par exemple les ventes) en fonction de dimensions (par exemple la ville, le produit et le mois de vente). Si les systèmes relationnels sont efficaces pour l OLTP (robustes, performants et sécurisés), ils se sont révélés insuffisants pour les systèmes OLAP. Se sont alors développés des systèmes de gestion de bases de données multidimensionnelles. Cependant, ces systèmes ne permettaient pas de gérer de très gros volumes de données de manière aussi efficace que les SGBD classiques relationnels, on se dirige donc maintenant de plus en plus vers des systèmes relationnels-olap. Pour résumer : OLTP OLAP (transactions) (analyse) Taille des données concernées faible (quelques n-uplets) importante (millions de n-uplets) Fréquence des requêtes souvent peu souvent Utilisateurs agents opérationnels (nombreux) analystes/décideurs (peu nombreux) Granularité détail résumé Requêtes simples et répétitives complexes et non prévisibles Accès lecture/écriture lecture Optique production et mise à jour optique décisionnelle Le lien entre OLTP et OLAP se fait dans le processus général de vie des données. Les requêtes OLAP se font sur les données stockées (dans l entrepôt de données) alimentées par des données sources produites par des requêtes OLTP, comme le montre la figure 1. Les outils E.T.L. correspondent à: Extract : accès aux données sources. Le langage de requêtes est différent selon le type de données (données structurées BD relationnelles, non structurées, semi-structurées XML). Transform : transformation pour homogénéiser (formatage, nettoyage des données, par exemple pour exprimer toutes les distances dans la même unité) 1

2 Figure 1: Processus complet. OLTP-OLAP Load : chargement dans l entropôt La mise à jour de l entropôt (refresh) est coûteuse et se fait de manière régulière, par exemple toutes les nuits. Elle peut être incrémentale ou nécessiter le recalcul de tout l entrepôt. On appelle magasin de données un sous-ensemble de données sur un sujet particulier. Par exemple, si l entrepôt de données décrit l ensemble des données d une entreprise, on pourra proposer un magasin pour le service facturation, un pour le service du personnel, etc. Ces magasins servent à analyser les données à travers différents techniques, comme par exemple le reporting (édition de rapports d analyses statistiques), la fouille de données (data mining), la visualisation, ou encore les requêtes what if qui décrivent ce qui se passerait si telle ou telle action était entreprise (par exemple si on augmentait les salaires de 2%). Quand Codd a proposé le modèle OLAP (1993), il a décrit règles qu un tel système soit permettre : 1. modèle (multi)dimensionnel 2. transparence du serveur pour l utilisateur 3. accessibilité des données 4. performances d accès stables 5. architecture client-serveur 6. dimensionnalité générique 7. gestion des données éparses 8. multi-utilisateurs 9. opérations sur les dimensions 2

3 10. manipulation intuitive des données 11. souplesse d affichage et d édition. dimensions et niveaux multiples Cependant, ces règles sont faussées par le fait que Codd travaillait pour un éditeur de système OLAP et qu elle décrivent donc ce système commercial! On peut donc se référer au modèle FASMI : Fast Analysis of Shared Multidimensional Information. Les réponses doivent donc être rapides, le système doit fournir des outils d analyse numériques et statistiques, l architecture doit être multi-utilisateurs et offrir une vue multidimensionnelle des données, quels que soient leur volume et leur mode de stockage. Jusqu à présent, il n existe aucun consensus, pas de modèle ou de langage standard. Bibliographie : Codd, Providing OLAP (On-Line Analytical Processing) to User-Analysts: An IT Mandate, Arbor Software White Paper, R. Kimball, The Datawarehouse Toolkit, John Wiley & Sons, Entrepôts de données Pour Inmon, un entrepôt de données (Data Warehouse - DW) est : subject-oriented, integrated, time-variant, and non volatile collection of data in support of management decision making process. Les données sont donc historisées, maintenues et matérialisées (stockées physiquement). Cette collection de données constitue un ensemble homogène (à partir de données hétérogènes, très nombreuses et distribuées), exploitable (pour un processus de décision). Pour R. Kimball, un entrepôt de données est a copy of transaction data specifically structured for query and analysis. Il existe deux schémas principaux possibles pour la modélisation de l entrepôt : le schéma en étoile et le schéma en flocon. Quel que soit le modèle considéré, on distinguera la table des faits qui contient l information à analyser (par exemple les ventes) des tables de dimensions qui contiennent les informations sur les dimensions d analyse (par exemple le lieu, le temps, la description du produit). 2.1 Schéma étoile (Star Schema) Ce type de schéma est décrit sur la figure 2. La table des faits contient les clés étrangères vers les tables de dimension. L ensemble de ces clés étrangères forment la clé primaire, la table des faits étant en BCNF. Les tables de dimension quant à elles ne sont pas normalisées. Un exemple est donné sur la figure Schéma en flocon (Snowflake Schema) Dans ce modèle, les tables de dimensions sont normalisées pour constituer une structure hiérarchique (c.f. figure 4). Ceci a pour avantage de faciliter la maintenance des tables de dimension et de réduire la redondance, cependant il faudra calculer des jointures coûteuses. Un exemple est donné sur la figure 5. 3

4 Figure 2: Schéma en étoile Figure 3: Schéma en étoile : exemple 4

5 Figure 4: Schéma en flocon 5

6 Figure 5: Schéma en flocon : exemple 6

7 Figure 6: Cube de données 3 Cubes de données Figure 7: Hiérarchies simple et multiple Le modèle multidimensionnel sur lequel s appuie OLAP permet la définition d hypercubes de données (appelés cubes par abus de langage) afin de faire valoir la représentation dimensionnelle des données. À partir des schémas étoile et flocon, on construit les cubes de données, comme indiqué figure 6. Pour des raisons évidentes de visualisation, cet hypercube n a que trois dimensions, il faut l imaginer en k dimensions. Une base de données multidimensionnelle est un ensemble d hypercubes définis le long de dimensions. Ces dimensions peuvent être munies de hiérarchies. On distingue alors les hiérachies simples des hiérarchies multiples, comme indiqué sur la figure 7. Le niveau ALL correspond à l agrégation totale, comme illustré sur la figure 8. La mesure désigne le contenu des cellules de l hypercube. La mesure peut être additive, semi-additive ou non additive : Mesure non additive : on ne peut pas sommer les valeurs des cellules en conservant un sens. Par exemple, si le cube contient des moyennes de ventes par mois, produit et ville, il n y a pas de sens à sommer les valeurs des cellules des villes pour les regrouper en départements. 7

8 Figure 8: Hiérarchies : niveau ALL Figure 9: Treillis des cuboïdes pour les 4 dimensions A, B, C, D Mesure semi-additive : on peut sommer sur certaines dimensions en gardant un sens mais pas sur toutes. Par exemple, si on considère un cube décrivant l état des stocks par ville, produit et mois, il est possible de faire la somme sur les dimensions ville et produit pour connaître l état global des stocks pour toutes les villes ou pour tous les produits, mais il n y a aucun sens à sommer sur la dimension temporelle des mois. Mesure additive : on peut sommer sur toutes les dimensions tout en conservant un sens. Par exemple, si l on considère les sommes des ventes par produits, villes et mois, on peut faire la somme des valeurs des cellules tout en conservant un sens aux données. La construction des hypercubes nécessite : le choix des dimensions d analyse, le choix de la fonction d agrégation, et la définition de la requête. On parle du treillis des cuboïdes pour décrire l ensemble des cubes qu il est possible de construire à partir d un modèle ayant plusieurs dimensions. La figure 9 décrit l ensemble des hypercubes qu il est possible de construire à partir de quatre dimensions A, B, C et D. La fonction d agrégation pour la construction des cubes est l une des fonctions classiques comme AVG, SUM, MIN, MAX,... Le niveau d agrégation doit être soigneusement déterminé. En effet, il indique le niveau de détail auquel les utilisateurs pourront accéder sans qu il soit nécessaire de réaccéder aux données sources. Mais un niveau trop détaillé entraîne un cube volumineux. La requête de construction est de la forme suivante : 8

9 select dim1,..., dimk, AGREGATION from table_faits, table_dim1,..., table_dimk where [jointure] Group By dim1,..., dimk [Having...] ; Par exemple, la construction du cube de la figure 6 serait la suivante : select Mois, Ville, Produit, SUM(Quantite) from vente, TMois, TLieu, TProduit where Vente.IDProduit = TProduit.IDProduit AND Vente.IDLieu = TLieu.IDLieu AND Vente.IDDate = TMois.IDDate Group By Mois, Ville, Produit ; 4 Opérations sur les cubes de données Les hypercubes sont munis de différentes opérations réparties selon qu elles ont trait à : la visualisation des données (aucune modification sur le contenu), la navigation le long des hiérarchies de dimensions, la sélection des données On rappelle qu il n existe pas de modèle consensuel et donc pas d ensemble d opérations défini pour tous les systèmes. Cependant, il existe un certain nombre d opérations couramment admises comme étant essentielles décrites ci-dessous. 4.1 Visualisation des données On considère ici les deux opérations principales : la rotation et l inversion. La rotation (rotate/pivot) permet d examiner le cube selon un autre angle (voir figure 10)). Un cube de dimension n a n(n 1) vues. Par exemple un cube de dimension 3 a 6 faces. PIVOT/ROTATE (rotation) Figure 10: rotation L inversion (switch) consiste à inverser l ordre de certaines valeurs (figure 11). Certaines informations se retrouvent alors placées l une à côté de l autre, ce qui facilite la découverte d un phénomène. 9

10 SWITCH (inversion) Figure 11: Inversion 4.2 Navigation le long des hiérarchies La généralisation (roll-up décrite figure revient à généraliser les valeurs d un attribut à des concepts de niveau supérieur (passage au granule supérieur). On peut par exemple calculer la moyenne sur plusieurs valeurs de dimensions. Le roll-up(*) ou roll-up global calcule l agrégation sur toutes les valeurs, on n a plus qu une cellule contenant, par exemple, la moyenne générale 1. La spécification (drill-down), à l inverse du roll-up, est une opération de spécialisation (passage au granule inférieur) ROLL-UP 21 17,7 20 (generalisation) 21 17,7 20 Figure : Roll Up 4.3 Sélection Il existe deux types de sélection : sur les cellules et sur les dimensions Sélection sur les cellules (Slice) La restriction (figure 13) consiste à extraire de l information résumée pour une certaine dimension. On ne retient alors que les valeurs correspondant à un certain critère, par exemple toutes les valeurs inférieures à Sélection sur les dimensions (Dice) Il s agit d une restriction sur les dimensions et non plus par rapport à un critère sur la mesure (voir figure 14). 1 La fonction d agrégation peut tout aussi bien être la somme, la médiane... ou une fonction plus complexe 10

11 SLICE (restriction) Stockage physique Figure 13: Sélection sur les cellules 3 DICE (projection) Figure 14: Sélection sur les dimensions Le principal problème posé pour le stockage des cubes de données est leur nature peu dense, éparse (sparsity), de très nombreuses cellules étant vides. Il existe trois stratégies de stockage physique : le stockage sous la forme relationnelle (ROLAP), sous la forme multidimensionnelle (MOLAP) ou une solution hybride (HOLAP) combinant ces deux première approches. 5.1 ROLAP On nomme ROLAP l approche Relationnel OLAP. Les données sont stockées sous la forme de tables relationnelles. Elles sont modélisées sous la forme de schémas en étoile ou flocon. Les requêtes multidimensionnelles doivent alors être traduites en requêtes relationnelles (SQL). Ce modèle est excellent vis à vis de la capacité de stockage, mais les requêtes sont difficiles à définir et à mettre en œuvre et sont coûteuses. 5.2 MOLAP On nomme MOLAP l approche Multidimensionnelle OLAP. La technologie de stockage est multidimensionnelle. Les données sont stockées sous la forme de tableaux multidimensionnels, des index multidimensionnels sont définis. Cette tecnologie de stockage nécessite donc des techniques de compression face à la faible densité des données (sparsity). La taille des données pouvant être ainsi stockées est faible par rapport à la solution ROLAP. Cependant, les requêtes sont écrites de manière intuitive et efficace. Toutefois, il faut redéfinir un langage de manipulation des données alors qu il n existe aucun consensus ni technologie reconnue et vraiment établie. 5.3 HOLAP On nomme HOLAP l approche Hybride OLAP. Cette technologie combine les deux solutions précédentes. Les données détaillées sont stockées dans une base de données relationnelle, et les données agrégées dans une base multidimensionnelle

12 5.4 Systèmes commerciaux Produit Editeur Type Essbase Arbor Software MOLAP DB2 OLAP Server IBM ROLAP/MOLAP Metacube Informix ROLAP SQL Server (2000) Microsoft ROLAP Express Server Oracle MOLAP 9i OLAP Oracle ROLAP/MOLAP 5.5 Précalcul des agrégats Il est possible, selon les systèmes, de calculer les agrégats à différents niveaux de granularié dans les hypercubes. Ne rien précalculer constitue bien évidemment un gain de place mais réduit considérablement les performances. A l inverse, tout stocker rend le système performant mais nécessite un espace de stockage très important. Un stockage partiel peut alors être envisagé, mais il pose le problème du choix judicieux des précalculs à effectuer. 6 Mise en œuvre dans Oracle Historiquement, Oracle s est lancé dans les systèmes OLAP à travers le logiciel ORACLE Express suite au rachat d Hyperion. Ce système, très orienté MOLAP et externe au noyau oracle 8i, a nécessité la définition d un langage de définition, d un langage de manipulation et d un système de stockage multidimensionnel. Des outils d analyse et de programmation étaient fournis. Même si la manipulation des données était facile et efficace, Oracle Express ne permettait le stockage de données volumineuses. Avec la version Oracle 9i, Oracle a décidé d intégrer les fonctionnalités OLAP au sein du noyau du SGBD. Des fonctionnalités liées aux entrepôts de données (vues matérialisées de gros volumes de données modélisés sous la forme d un schéma en étoile ou flocon) sont présentes. Il est possible de créer des dimensions, des cubes. Ces cubes sont interrogés entre autres via un langage de manipulation OLAP propriétaire (OLAP DML). Les bases de données multidimensionnelles sont des Analytic Workspaces qui contiennent un ou plusieurs cubes, des méta-données (dimensions, hiérarchies),... Les cubes y sont persistants ou calculés seulement pour la durée d une session. Les informations sont stockées dans le OLAP CATALOG. L accès aux données multidimensionnelles est possible via SQL à travers des vues, via le langage OLAP DML, ou via la Java OLAP API. Les clauses GROUP BY CUBE, GROUP BY GROUPING SETS et GROUP BY ROLLUP permettent de construire des cubes en ayant le détail des agrégats. La fonction SUM est utilisée pour agréger les données. SELECT... GROUP BY... {CUBE ROLLUP GROUPING SETS} (dimension_column) ; ROLLUP calcule des sous-totaux ainsi que le total général, toutes données confondues. Il est possible d effectuer des ROLLUP partiels. GROUP BY expr1, ROLLUP(expr2, expr3); CUBE calcule tous les sous-totaux des combinaisons possibles des colonnes. Si n attributs sont spécifiés dans la clause CUBE, il y aura 2 n combinaisons de sous-totaux calculés. CUBE calcule plus de sous-totaux que ROLLUP. De même que précédemment, il est possible d effectuer un GROUP BY CUBE partiel.

13 GROUP BY expr1, CUBE(expr2, expr3) La fonction RATIO TO REPORT calcule le ratio d une valeur par rapport à une somme d un ensemble de valeurs. Une valeur NULL est traitée comme un zéro pour le calcul de la somme. RATIO_TO_REPORT ( expr ) OVER ( [query_partition_clause] ) Exemple : SELECT ch.channel_desc, TO_CHAR(SUM(amount_sold), 9,999,999 ) AS SALES, TO_CHAR(SUM(SUM(amount_sold)) OVER (), 9,999,999 ) AS TOTAL_SALES, TO_CHAR(RATIO_TO_REPORT(SUM(amount_sold)) OVER (), ) AS RATIO_TO_REPORT FROM sales s, channels ch WHERE s.channel_id=ch.channel_id AND s.time_id=to_date( 11-OCT-2000 ) GROUP BY ch.channel_desc; CHANNEL_DESC SALES TOTAL_SALE RATIO_ Direct Sales 14,447 23, Internet , Partners 8,391 23, Les fonctions RANK et DENSE RANK permet de retourner le rang d une valeur parmi une liste de valeurs. On peut alors par exemple retourner les n meilleurs (requêtes Top-N) ou les n moins bons (requêtes Bottom-N). La différence entre RANK et DENSE RANK est que DENSE RANK ne laisse pas de trous dans les rangs quand il y a des ex-aequo. RANK ( ) OVER ( [query_partition_clause] order_by_clause ) DENSE_RANK ( ) OVER ( [query_partition_clause] order_by_clause ) Exemple : SELECT channel_desc, TO_CHAR(SUM(amount_sold), 9,999,999,999 ) SALES$, RANK() OVER (ORDER BY SUM(amount_sold)) AS rang, FROM sales, products, customers, times, channels, countries WHERE... [jointure]... GROUP BY channel_desc; CHANNEL_DESC SALES$ RANG Direct Sales 2,443,392 3 Partners 1,365,963 2 Internet 467,478 1 Il est possible de créer des vues matérialisées : CREATE MATERIALIZED VIEW [schema.]materialized_view options [USING INDEX index_options] [REFRESH [refresh_options]] [FOR UPDATE] [{ENABLE DISABLE} QUERY REWRITE] 13

14 Les options de rafraîchissement permettent de définir si le rafraîssement se fait ou non automatiquement, et s il se fait automatiquement à quels moments il doit s effectuer. Par exemple : CREATE MATERIALIZED VIEW Vue_OLAP REFRESH START WITH SYSDATE NEXT SYSDATE+1 ENABLE QUERY REWRITE AS SELECT..., COUNT(*) FROM... WHERE... GROUP BY... ; On force le rafraîchissement de la manière suivante : begin dbms_mview.refresh( olapv_emp ); end; / La création de dimensions est possible : CREATE DIMENSION [schema.]dimension level_clause(s) [hierarchy_clause(s) attribute_clause(s)]; Il doit y avoir au moins une clause hiérarchie ou attribut. La clause LEVEL a la forme suivante : LEVEL level IS (table.column,...) La clause hiérarchie a la forme suivante : HIERARCHY hier (child_level CHILD OF parent_level,... [join_clause]) La clause attribut a la forme suivante : ATTRIBUTE level DETERMINES (dependent_column,...) La clause join a la forme suivante : JOIN KEY (child_key_column,...) REFERENCES parent_level Par exemple : CREATE DIMENSION customers_dim LEVEL customer IS (customers.cust_id) LEVEL city IS (customers.cust_city) LEVEL state IS (customers.cust_state_province) LEVEL country IS (countries.country_id) LEVEL subregion IS (countries.country_subregion) LEVEL region IS (countries.country_region) HIERARCHY geog_rollup ( customer CHILD OF city CHILD OF state CHILD OF 14

15 country CHILD OF subregion CHILD OF region JOIN KEY (customers.country_id) REFERENCES country ) ATTRIBUTE customer DETERMINES (cust_first_name, cust_last_name, cust_gender, cust_marital_status, cust_year_of_birth, cust_income_level, cust_credit_limit) ATTRIBUTE country DETERMINES (countries.country_name) ; On peut vérifier la validité de la dimension créée : EXEC DBMS_OLAP.validate_dimension( customers_dim,user,false,false); SELECT table_name, dimension_name, relationship, bad_rowid FROM mview$_exceptions; 15

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Sommaire. Introduction. Opérations typiques. Langages. Architectures

Sommaire. Introduction. Opérations typiques. Langages. Architectures OLAP IED 2006-2007 Sommaire Introduction Opérations typiques Langages Architectures Introduction Contexte un entrepôt de données offre des données - nombreuses - homogènes - exploitables - multidimensionnelles

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II 1ère génération 13 2ème génération : Entrepôt de données / Magasin de données 15 3ème génération OLAP 16 Références Bibliographiques 18 A. 1ère génération Infocentre Tableur Base de données Infocentre

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP BI = Business Intelligence Master Data-Science Cours 4 - OLAP UPMC 15 février 2015 Plan Vision générale ETL Datawarehouse OLAP Reporting Data Mining Entrepôt de données Les entrepôts de données (data warehouse)

Plus en détail

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 8 Introduction à OLAP 8.1. Présentation de la semaine Le modèle OLAP (Online Analytical Processing) est un modèle quasiomniprésent en intelligence

Plus en détail

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing Bases de données multidimensionnelles OLAP OnLine Analytical Processing OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour la mise en place d'un Système d'information décisionnel

Plus en détail

Datawarehouse. C. Vangenot

Datawarehouse. C. Vangenot Datawarehouse C. Vangenot Plan Partie 1 : Introduction 1. Objectifs 2. Qu'est ce qu'un datawarehouse? 3. Pourquoi ne pas réutiliser les BD? Partie 2 : Implémentation d'un datawarehouse ROLAP MOLAP HOLAP

Plus en détail

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Système OLAP Fresqueau

Système OLAP Fresqueau Système OLAP Fresqueau Kamal BOULIL Journées 20 mars Strasbourg Réunion plénière -Fresqueau 07-08 octobre 2013 1 Plan 1. Introduction 1. Projet ANR Fresqueau 2. Systèmes OLAP 2. Système OLAP Fresqueau

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1 JASPERSOFT ET LE PAYSAGE ANALYTIQUE Jaspersoft et le paysage analytique 1 Ce texte est un résumé du Livre Blanc complet. N hésitez pas à vous inscrire sur Jaspersoft (http://www.jaspersoft.com/fr/analyticslandscape-jaspersoft)

Plus en détail

F. Opérations multidimensionnelles

F. Opérations multidimensionnelles F. Opérations multidimensionnelles Roll up (drill-up)/drill down (roll down) Roll up (drill-up) : résumer, agréger des données en montant dans une hiérachie ou en oubliant une dimension Drill down (roll

Plus en détail

Bases de données multidimensionnelles OLAP

Bases de données multidimensionnelles OLAP Bases de données multidimensionnelles OLAP OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour l analyse multidimensionnelle. Les données sont historisées, résumées, consolidées.

Plus en détail

Bases de données multimédias Bases de données multidimensionnelles

Bases de données multimédias Bases de données multidimensionnelles Bases de données multimédias Bases de données multidimensionnelles Contenu BD Multimédia : Caractéristiques Modélisation Interrogation Architectures des SGBD multimédias BD Multidimensionnelles Motivations

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II A. 1ère génération Infocentre L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes Définition L'infocentre est une collection de données orientées sujet, intégrées,

Plus en détail

Fouille de Données : OLAP & Data Warehousing

Fouille de Données : OLAP & Data Warehousing Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle Principes et mise en œuvre du modèle OLAP -1 ère Partie- La modélisation multidimensionnelle 1 Le modèle multidimensionnel (1) Le modèle multidimensionnel est bien adapté pour représenter des données qui

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

ISC21-1 --- Système d Information Architecture et Administration d un SGBD Compléments SQL

ISC21-1 --- Système d Information Architecture et Administration d un SGBD Compléments SQL ISC21-1 --- Système d Information Architecture et Administration d un SGBD Compléments SQL Jean-Marie Pécatte jean-marie.pecatte@iut-tlse3.fr 16 novembre 2006 ISIS - Jean-Marie PECATTE 1 Valeur de clé

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 5 - MDX

BI = Business Intelligence Master Data-ScienceCours 5 - MDX BI = Business Intelligence Master Data-Science Cours 5 - MDX UPMC 23 février 2015 Plan Vision générale ETL Datawarehouse OLAP Reporting Data Mining Définition OLAP En informatique, et plus particulièrement

Plus en détail

Web dynamique. Techniques, outils, applications. (Partie C)

Web dynamique. Techniques, outils, applications. (Partie C) Web dynamique Techniques, outils, applications (Partie C) Nadir Boussoukaia - 2006 1 SOMMAIRE 1. MySQL et PHP (20 min) 2. SQL (petits rappels) (20 min) 2 MySQL et PHP Synthèse 3 MySQL et PHP SGBD MySQL

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Prototype SOLAP appliqué sur des champs continus en mode raster

Prototype SOLAP appliqué sur des champs continus en mode raster Session démos 24 novembre 2014 Prototype SOLAP appliqué sur des champs continus en mode raster Analyse de hot spots de criminalité Jean-Paul Kasprzyk, doctorant Introduction 2 L informatique décisionnelle

Plus en détail

A QUOI SERVENT LES BASES DE DONNÉES?

A QUOI SERVENT LES BASES DE DONNÉES? BASE DE DONNÉES OBJET Virginie Sans virginie.sans@irisa.fr A QUOI SERVENT LES BASES DE DONNÉES? Stockage des informations : sur un support informatique pendant une longue période de taille importante accès

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité Établissement chargé de réaliser l inventaire permanent du patrimoine forestier sur tout le territoire métropolitain indépendamment de toute question de propriété. Parmi ces objectifs: Connaissance de

Plus en détail

h3870 Entrepôts de données

h3870 Entrepôts de données h3870 Entrepôts de données Date de publication : 10/02/5 Par : Claude CHRISMENT Professeur à l'université Toulouse-3 Geneviève PUJOLLE Maître de conférences à l'université Toulouse-1 Franck RAVAT Maître

Plus en détail

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL RHONE-ALPES CENTRE D'ENSEIGNEMENT DE GRENOBLE UE ENG111 - Epreuve TEST Travail d'etude et de Synthèse Technique en INFORMATIQUE CAPACITE CARTOGRAPHIQUE

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

Contexte général de l étude

Contexte général de l étude 1 2 Contexte général de l étude Les entrepôts de données associés à des outils d analyse On Line Analytical Processing (OLAP), représentent une solution effective pour l informatique décisionnelle (Immon,

Plus en détail

Master Exploration Informatique des données DataWareHouse

Master Exploration Informatique des données DataWareHouse Master Exploration Informatique des données DataWareHouse Binôme Ahmed BENSI Enseignant tahar ARIB SOMMAIRE I. Conception...1 1. Contexte des contrats...1 2. Contexte des factures...1 II. Modèle physique...2

Plus en détail

SQL : création et mises-à-jour de schémas et de données

SQL : création et mises-à-jour de schémas et de données SQL : création et mises-à-jour de schémas et de données Commandes de définition de données (DDL) Commandes de mise-à-jour de données (DML) Vues SQL-MAJ, vues-1 / 33 Exemple Définition de la relation

Plus en détail

Fiche de lecture OLAP

Fiche de lecture OLAP Fiche de lecture OLAP NFE107 Urbanisation des Systèmes d Information Karim Sekri Informatique décisionnelle BI, Business Intelligence Système interprétant des données complexes permettant aux dirigeants

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

Indépendance données / applications

Indépendance données / applications Vues 1/27 Indépendance données / applications Les 3 niveaux d abstraction: Plusieurs vues, un seul schéma conceptuel (logique) et schéma physique. Les vues décrivent comment certains utilisateurs/groupes

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

Les bases de données

Les bases de données Les bases de données Introduction aux fonctions de tableur et logiciels ou langages spécialisés (MS-Access, Base, SQL ) Yves Roggeman Boulevard du Triomphe CP 212 B-1050 Bruxelles (Belgium) Idée intuitive

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Chap. 5 : Langage SQL (Structured Query Language) Pr. : Mohamed BASLAM Contact : baslam.med@gmail.com Niveau : S4 BCG Année : 2014/2015 1

Chap. 5 : Langage SQL (Structured Query Language) Pr. : Mohamed BASLAM Contact : baslam.med@gmail.com Niveau : S4 BCG Année : 2014/2015 1 Chap. 5 : Langage SQL (Structured Query Language) Pr. : Mohamed BASLAM Contact : baslam.med@gmail.com Niveau : S4 BCG Année : 2014/2015 1 Plan Généralités Langage de Définition des (LDD) Langage de Manipulation

Plus en détail

Top_Keyword: Agrégation de motsclefs dans un environnement OLAP

Top_Keyword: Agrégation de motsclefs dans un environnement OLAP SIG/ED Top_Keyword: Agrégation de motsclefs dans un environnement OLAP Franck Ravat, Olivier Teste, Ronan Tournier, Gilles Zurfluh. IRIT: Institut de Recherche en Informatique de Toulouse. tournier@irit.fr

Plus en détail

-Les Vues, Les Déclencheurs, Les vues matérialisées. et Les Clichés-

-Les Vues, Les Déclencheurs, Les vues matérialisées. et Les Clichés- -Les Vues, Les Déclencheurs, Les vues matérialisées et Les Clichés- Les vues : 1. Définition et intérêts : Une Vue est une table logique pointant sur une ou plusieurs tables ou vues et ne contient physiquement

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Thibault Denizet. Introduction à SSIS

Thibault Denizet. Introduction à SSIS Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...

Plus en détail

Informatique décisionnelle (Première partie) Emmanuelle Cravoisier

Informatique décisionnelle (Première partie) Emmanuelle Cravoisier Informatique décisionnelle (Première partie) Emmanuelle Cravoisier Informatique décisionnelle Concepts Présentation de Business Objects Conception d un univers Business Objects Structure générale d une

Plus en détail

Informatique Initiation aux requêtes SQL. Sommaire

Informatique Initiation aux requêtes SQL. Sommaire cterrier.com 1/14 04/03/2008 Informatique Initiation aux requêtes SQL Auteur : C. Terrier ; mailto:webmaster@cterrier.com ; http://www.cterrier.com Utilisation : Reproduction libre pour des formateurs

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu

Plus en détail

FONCTIONS DE TRAITEMENT} COUNT

FONCTIONS DE TRAITEMENT} COUNT Nom Prénom Promotion Date Buhl Damien Année 1 Groupe 2 21 Janvier 2007 CER Prosit n 22 Mots-Clés : - Requête/Langage SQL Le langage SQL (Structured Query Language) est un langage de requêtes, il permet

Plus en détail

BUSINESS OBJECTS V5 / V6

BUSINESS OBJECTS V5 / V6 BUSINESS OBJECTS V5 / V6 Durée Objectif 2 jours L objectif de ce cours est de savoir utiliser le logiciel BUSINESS OBJECTS pour faire des interrogations multi - dimensionnelles sur les univers BO et de

Plus en détail

Créer le modèle multidimensionnel

Créer le modèle multidimensionnel 231 Chapitre 6 Créer le modèle multidimensionnel 1. Présentation de SSAS multidimensionnel Créer le modèle multidimensionnel SSAS (SQL Server Analysis Services) multidimensionnel est un serveur de bases

Plus en détail

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes Langage SQL (1) Sébastien Limet Denys Duchier IUT Orléans 4 septembre 2007 Notions de base qu est-ce qu une base de données? SGBD différents type de bases de données quelques systèmes existants Définition

Plus en détail

Les entrepôts de données pour les nuls... ou pas!

Les entrepôts de données pour les nuls... ou pas! Atelier aideà la Décision à tous les Etages AIDE@EGC2013 Toulouse Mardi 29 janvier 2013 Cécile Favre Fadila Bentayeb Omar Boussaid Jérôme Darmont Gérald Gavin Nouria Harbi Nadia Kabachi Sabine Loudcher

Plus en détail

Kit de survie sur les bases de données

Kit de survie sur les bases de données Kit de survie sur les bases de données Pour gérer un grand nombre de données un seul tableau peut s avérer insuffisant. On représente donc les informations sur différentes tables liées les unes aux autres

Plus en détail

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1 LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1 SAS Cost and Profitability Management, également appelé CPM (ou C&P), est le nouveau nom de la solution SAS Activity-Based Management. Cette version

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

BDMD NI248. Exercice 1 : Cube

BDMD NI248. Exercice 1 : Cube Nom : Prénom : Page 1 Université Pierre et Marie Curie Paris 6 Master d'informatique BDMD NI248 23 mars 2011 Documents autorisés - 2h Exercice 1 : Cube 5 pts Soit une table Ventes (Magasin, Produit, Couleur,

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

Introduction aux S.G.B.D.

Introduction aux S.G.B.D. NFE113 Administration et configuration des bases de données - 2010 Introduction aux S.G.B.D. Eric Boniface Sommaire L origine La gestion de fichiers Les S.G.B.D. : définition, principes et architecture

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

Techniques d implémenta3on d OLAP

Techniques d implémenta3on d OLAP Techniques d implémenta3on d OLAP Introduc3on On a vu qu il existait 2 grandes alterna3ves : MOLAP = structure de données adhoc, pour le mul3dimensionnel. ROLAP = implémenta3on à l aide d un SGBD rela3onnel

Plus en détail

Plan. Bases de données. Cours 1 : Généralités & rappels. But du cours. Organisation du cours. Polytech Paris-Sud. Apprentis 4 ème année

Plan. Bases de données. Cours 1 : Généralités & rappels. But du cours. Organisation du cours. Polytech Paris-Sud. Apprentis 4 ème année Plan Bases de données Polytech Paris-Sud Apprentis 4 ème année Cours 1 : Généralités & rappels 1.1 Avant-propos 1.2 Algèbre relationnelle kn@lri.fr http://www.lri.fr/~kn 2/18 But du cours Organisation

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP... Table des matières CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2 Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...6 OPÉRATIONS SUR LES CUBES...7 Exemple

Plus en détail

Optimisation des bases de données

Optimisation des bases de données Optimisation des bases de données Mise en œuvre sous Oracle Laurent Navarro Avec la contribution technique d Emmanuel Lecoester Pearson Education France a apporté le plus grand soin à la réalisation de

Plus en détail

Datawarehousing and OLAP

Datawarehousing and OLAP Datawarehousing and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today introduction definition data integration model Introduction introduction

Plus en détail

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence L offre décisionnel IBM Patrick COOLS Spécialiste Business Intelligence Le marché du Business Intelligence L enjeux actuel des entreprises : devenir plus «agiles» Elargir les marchés tout en maintenant

Plus en détail

Bases de Données OLAP

Bases de Données OLAP Bases de Données OLAP Hiver 013/014 Melanie Herschel melanie.herschel@lri.fr Université Sud, Groupe Bases de Données, LRI Systèmes Opérationnels vs. Entrepôts de Données Requêtes Requêtes BD opérationnelles

Plus en détail

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI 5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI Un SI : et pour faire quoi? Permet de stocker de manière définitive des informations volatiles provenant d autre BD.

Plus en détail

11. MySQL. Cours Web. MySQL. 11. MySQL. 11. MySQL. Structured Query Language. Lionel Seinturier. Université Pierre & Marie Curie

11. MySQL. Cours Web. MySQL. 11. MySQL. 11. MySQL. Structured Query Language. Lionel Seinturier. Université Pierre & Marie Curie Cours Web Lionel Seinturier Université Pierre & Marie Curie Lionel.Seinturier@lip6.fr Structured Query Language Langage de manipulation des données stockées dans une base de données interrogation/insertion/modification/suppression

Plus en détail

Evry - M2 MIAGE Entrepôt de données

Evry - M2 MIAGE Entrepôt de données Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration

Plus en détail

Bases de données. Modèle décisionnel. Jérôme Rocheteau. Lecture 8. Institut Catholique d Arts et Métiers Site de Nantes

Bases de données. Modèle décisionnel. Jérôme Rocheteau. Lecture 8. Institut Catholique d Arts et Métiers Site de Nantes Bases de données Lecture 8 1 / 25 Bases de données Modèle décisionnel Jérôme Rocheteau Institut Catholique d Arts et Métiers Site de Nantes Lecture 8 Bases de données Lecture 8 2 / 25 1 Structure multidimensionnelle

Plus en détail

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc

Plus en détail

BDWA EXAMEN - 27 MARS 2006 Documents autorisés. Exercice 1. Requêtes décisionnelles

BDWA EXAMEN - 27 MARS 2006 Documents autorisés. Exercice 1. Requêtes décisionnelles Nom : Prénom : Page 1 Université Pierre et Marie Curie Paris 6 BDWA EXAMEN - 27 MARS 2006 Documents autorisés Master d'informatique Exercice 1. Requêtes décisionnelles On considère une base de données

Plus en détail

Entrepôt de données (ED) Exercice traité en cours

Entrepôt de données (ED) Exercice traité en cours Enoncé Entrepôt de données (ED) Exercice traité en cours Une grande entreprise à succursales multiples veut rassembler toutes les nuits dans un entrepôt de données des informations sur les s du jour afin

Plus en détail