Système OLAP Fresqueau



Documents pareils
Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Les Entrepôts de Données

Urbanisation des SI-NFE107

2 Serveurs OLAP et introduction au Data Mining

La place de la Géomatique Décisionnelle dans le processus de décision

Les entrepôts de données

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel.

Introduction à la B.I. Avec SQL Server 2008

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

LES ENTREPOTS DE DONNEES

Bases de données multidimensionnelles et mise en œuvre dans Oracle

FreeAnalysis. Schema Designer. Cubes

et les Systèmes Multidimensionnels

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.

Entrepôt de données 1. Introduction

Présentation du module Base de données spatio-temporelles

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

BI2 : Un profil UML pour les Indicateurs Décisionnels

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Business Intelligence : Informatique Décisionnelle

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Big Data On Line Analytics

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Catalogue Formation «Vanilla»

ETL Extract - Transform - Load

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

25/05/2012. Business Intelligence. Plan de Présentation

ÉVALUATION DES PRODUITS COMMERCIAUX OFFRANT DES CAPACITÉS

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Intégration de données hétérogènes et réparties. Anne Doucet

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Fouille de Données : OLAP & Data Warehousing

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

SQL SERVER 2008, BUSINESS INTELLIGENCE

Techniques d optimisation des requêtes dans les data warehouses

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

La problématique. La philosophie ' ) * )

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

SWISS ORACLE US ER GRO UP. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

Didier MOUNIEN Samantha MOINEAUX

SQL Server 2012 et SQL Server 2014

OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Analyse comparative entre différents outils de BI (Business Intelligence) :

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Les entrepôts de données et l analyse de données

Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières

et les Systèmes Multidimensionnels

Entrepôt de Données. Jean-François Desnos. ED JFD 1

Fonctionnalités des différentes éditions de SQL Server 2012

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Département Génie Informatique

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE. Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP

Entrepôts de Données

DEMARREZ RAPIDEMENT VOTRE EVALUATION

XCube XML For Data Warehouses

Les Entrepôts de Données. (Data Warehouses)

L information et la technologie de l informationl

République Algérienne Démocratique et Populaire

Datawarehouse and OLAP

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

SQL Server SQL Server Implémentation d une solution. Implémentation d une solution de Business Intelligence.

SSLL du groupe UMANIS

Bases de données Cours 1 : Généralités sur les bases de données

INTRODUCTION A LA B.I AVEC PENTAHO BUSINESS ANALYTICS Formation animée par

Déroulement de la présentation

REQUEA. v PD 20 mars Mouvements d arrivée / départ de personnels Description produit

Exploration de problèmes de performance d un entrepôt de données. par. Louisa Demmou

Suite Jedox La Business-Driven Intelligence avec Jedox

Business Intelligence avec Excel, Power BI et Office 365

Introduction aux entrepôts de données (2)

Introduction au domaine du décisionnel et aux data warehouses

ArcGIS for INSPIRE SIG RAIL 2011

JEDOX FACTSHEETS SELF-SERVICE BUSINESS INTELLIGENCE, ANALYTICS & PERFORMANCE MANAGEMENT

QU EST-CE QUE LE DECISIONNEL?

Business Intelligence

Bases de Données OLAP

CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE. présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M.

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

DESCRIPTIF DE MODULE S5 GSI

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Le concept de Data Warehouse a été formalisé pour la première fois en 1990.

Bases de Données Avancées

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

Mémoire. En vue de l obtention du diplôme de Magister en Informatique. Option : SIC (Systèmes d Information et de Connaissances)

Transcription:

Système OLAP Fresqueau Kamal BOULIL Journées 20 mars Strasbourg Réunion plénière -Fresqueau 07-08 octobre 2013 1

Plan 1. Introduction 1. Projet ANR Fresqueau 2. Systèmes OLAP 2. Système OLAP Fresqueau 1. Architecture 2. Cube physico-chimie 3. Cube hydrobiologie 3. Analyses OLAP 4. Conclusion 18/05/12 2

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Projet ANR Fresqueau 1. Une grosse base de données intégrée 5 thèmes majeurs : (1) paramètres de la qualité de l eau (physico-chimiques, hydrobiologiques, ), (2) stations de mesure, (3) réseaux hydrographiques, (4) activités humaines (ex. stations d épuration), (5) variables de contexte (climat, hydroécorégions, ) 16 sources de données: agences de l eau, ONEMA, IGN, UR, ministères d agriculture et d écologie, IRSTEA, EEA, Météo France, etc. 2. Système OLAP pour l exploration interactive, multidimensionnelle et multi-échelle des données de qualité de l eau 3. Système de fouille de données (algorithmes) pour la découverte de nouvelles connaissances (par ex. corrélations et relations entre paramètres de la qualité de l eau) 3

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Systèmes OLAP : Définitions Systèmes d aide à la décision permettant une exploration interactive des données suivant une approche multidimensionnelle et à plusieurs niveaux de granularité Structures de données spécifiques Cube, Mesure, Dimension, Hiérarchie de dimension, Operateurs OLAP (Roll-up, Drill-down, Slice, ) Fonctions d agrégation (Moyenne, Maximum, ) Visualisations interactives (tableaux croisées, diagrammes statistiques, cartes, ) 4

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Systèmes OLAP : Architecture BD opérationnelles Métadonnées Sources internes ETL Entrepôt de Données (ED) Sources externes Magasins de données Cubes de données Affichages interactifs Sources de données Couche ETL Couche d entreposage Serveur OLAP Client OLAP 5

Système OLAP Fresqueau 6

Cube physico-chimie : Dimensions et Mesures 7

Cube physico-chimie : Dimension Paramètres 8

Cube physico-chimie : Dimension Temps 9

Cube physico-chimie : Dimension Stations 10

Cube physico-chimie : Indicateurs 11

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Cube hydrobiologie : Dimensions et Mesures 12

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Cube hydrobiologie : Dimension Indices 13

Cube hydrobiologie : Indicateurs de note 14

Analyses thématiques multi-échelles (1/2) 15

Analyses thématiques multi-échelles (2/2) 16

Analyses temporelles multi-échelles (1/2) 17

Analyses temporelles multi-échelles (2/2) 18

Analyses spatiales multi-échelles (1/2) 19

Analyses spatiales multi-échelles (2/2) 20

Analyses spatio-temporelles multi-échelles 21

Système OLAP Fresqueau Analyse rapide de gros volumes de données physico-chimiques et hydrobiologiques de la qualité de l eau De nombreux indicateurs d analyse ( ex. moyenne des valeurs des paramètres physicochimiques, moyenne des notes, ) Différents types d analyses multidimensionnelles et multi-échelles dynamiques (thématiques, temporelles, spatiales et comparatives ) Différents types de visualisations (tableaux croisés dynamiques, diagrammes statistiques (ex. histogrammes, camembert, ), diagrammes en araignée, etc.) Extensibilité Définition d autres cubes (ex. débits, données morphologiques) Jointures de cubes pour croiser les données de différents cubes (par ex. comparer l évolution des indices biologiques par rapport à l évolution des paramètres physico-chimiques) 22

EN PLUS : Tailles des BD Base Fresqueau intégrée Taille : 2,6 GO 101 tables et 452 colonnes Base magasins de données Taille : 8400 MB 15 tables Table de fait des résultats physico-chimiques : 14 602 580 lignes Table de fait des résultats hydrobiologiques : 34 415 lignes 23

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Projet ANR Fresqueau Système Fresqueau pour l analyse des données de qualité de l eau BD publiques BD spécifiques OLAP BD de recherche ETL Base de données intégrée Fresqueau ETL Data mining Sources de données 24

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Systèmes OLAP : Implémentation 1. ROLAP (Relational OLAP) : basés sur une BD Relationnelle 2. MOLAP (Multidimensionnal OLAP) : basés sur une BD multidimensionnelle 3. HOLAP (Hybrid OLAP) : combinaison du ROLAP et MOLAP Volumes de données Chargement de données ROLAP MOLAP HOLAP gros volumes petits volumes volumes moyens les plus efficaces les moins efficaces modérés Requêtage les plus lents les plus rapides modérés Passage à l échelle les meilleurs les plus faibles modérés 25

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Systèmes OLAP : Implémentation 1. ROLAP (Relational OLAP) : basés sur une BD Relationnelle ED : (PostgreSQL) Serveur ROLAP : (Mondrian) Client ROLAP (Jrubik) Schéma ED (SQL) Schéma OLAP (XML) Vue multidimensionnelle Fichier de configuration 26

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Systèmes OLAP : Implémentation 1. Schéma en étoile (Star schema) Une table de fait qui référence des tables de dimension : une table de dimension par dimension conceptuelle Temps de réponse plus court Mais Espace de stockage moins optimisé 2. Schéma en flocons de neige (Snow-flake schema) Une table de fait qui référence des tables de dimension : une table de dimension par niveau hiérarchique Espace de stockage plus optimisé Mais Temps de réponse plus lent 3. Schéma hybride (Star-flake schema) Une table de fait qui référence des tables de dimension : une table de dimension peut correspondre à un niveau, plusieurs niveaux ou une dimension Espace et temps de réponse moyens 27

Cube physico-chimie : Granularité des faits 28

Cube physico-chimie : Dimension Supports 29

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Cube physico-chimie : Dimension Remarques 30

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Cube physico-chimie : Dimension Préleveurs 31

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Cube hydrobiologie : Granularité des faits 32

1.Introduction 2.Système OLAP Fresqueau 3.Analyses OLAP 4.Conclusion Cube hydrobiologie : Dimension Notes 33

Cube hydrobiologie : Indicateurs d abondance 34

Cube hydrobiologie : Indicateurs de variété taxonomique 35

Cube hydrobiologie : Indicateurs GFI 36

Analyses thématiques multi-échelles (2/3) 37

Analyses thématiques multi-échelles (1/4) 38

Analyses temporelles multi-échelles (1/2) 39

Analyses temporelles multi-échelles (2/2) 40

Analyses spatio-temporelles multi-échelles (1/2) 41

Analyses spatio-temporelles multi-échelles (2/3) 42

Analyses spatio-temporelles multi-échelles (3/3) 43