Les SGBDs Décisionnels
|
|
|
- Francis Sergerie
- il y a 10 ans
- Total affichages :
Transcription
1 Les SGBDs Décisionnels Didier DONSEZ Université Joseph Fourier (Grenoble 1) IMA IMAG/LSR/ADELE
2 2 Plan Limites du SQL en décisionnel Nouvelles fonctions et types de données Aspect Systèmes Index Bitmap RAID Benchmarks
3 Limites du SQL et des SGBDs «Transactionnels» 3 orienté vers le OLTP Interface Manque d expressivité des requêtes SQL pour l OLAP Système Structures et Algorithmes inadaptées à la charge de travail de l OLAP
4 4 Systèmes MOLAP SGBD Spécialisé ROLAP SGBD Relationnel H-OLAP SGBD Relationnel avec des opérateurs et algorithmes adéquats StarJoin, Index Bitmap,... GROUP BY CUBE,
5 Nouvelles Fonctions 5 BREAK BY (SAS) RANK Rang d une ligne par rapport à un agrégat TOP / BOTTOM Requête de type «Top Ten» Les 10 meilleurs / Les 10 moins bons Echantillonnage (Informix Online XPS) Requête effectuée sur un échantillon de données tiré aléatoirement (preview) Limite de temps de calcul pour une approximation du résultat Extension du Group By (SQL99) Grouping Sets, Rollup, Cube Fenêtre mouvante pour les agrégat : Windows Exemple : moyenne et déviance sur le jour courant et les 3 jours précédents
6 6 GROUP BY GROUPING SETS Partitionnement selon plusieurs dimensions Exemple SELECT #Client, #Produit, SUM(Montant) FROM Ventes GROUP BY GROUPING SETS ((#Client), (#Produit)) est équivalent à (SELECT #Client, NULL, SUM(Montant) FROM Ventes GROUP BY #Client) UNION (SELECT NULL, #Produit, SUM(Montant) FROM Ventes GROUP BY #Produit)
7 GROUP BY ROLLUP 7 Réduire progressivement Exemple SELECT #Client, #Produit, SUM(Montant) FROM Ventes GROUP BY ROLLUP (#Client, #Produit) est équivalent à SELECT #Client, #Produit, SUM(Montant) FROM Ventes GROUP BY GROUPING SETS ((#Client,#Produit), (#Client), ()) est équivalent à (SELECT #Client, #Produit, SUM(Montant) FROM Ventes GROUP BY #Client, #Produit) UNION (SELECT #Client, NULL, SUM(Montant) FROM Ventes GROUP BY #Client) UNION (SELECT NULL, NULL, SUM(Montant) FROM Ventes)
8 8 GROUP BY ROLLUP SELECT MONTH(SALES_DATE), REGION, SALES_MGR, SUM(SALES) FROM SALES WHERE YEAR(SALES_DATE) = 1996 GROUP BY ROLLUP (MONTH(SALES_DATE), REGION, SALES_MGR) MONTH REGION SALES_MANAGER SUM(SALES) April Central Chow April Central Smith April Central April North April North April May Central Chow May Central May North Smith May North May
9 GROUP BY CUBE 9 Partitionnement selon tous les sous-ensembles possibles de Grouping Sets SELECT #Client, #Produit, #Fournisseur, SUM(Montant) FROM Ventes GROUP BY CUBE (#Client, #Produit, #Fournisseur) est équivalent à SELECT #Client, #Produit, SUM(Montant) FROM Ventes GROUP BY GROUPING SETS ( (), -- total des ventes (#Client), -- total des ventes par Client (#Fournisseur), -- total des ventes par Forunisseur (#Produit), -- total des ventes par Produit (#Client, #Fournisseur) -- total des ventes par Client et par Fournisseur (#Client, #Produit), -- total des ventes par Client et par Produit (#Produit, #Fournisseur), -- total des ventes par Produit et par Fournisseur (#Client, #Produit, #Fournisseur) -- total des ventes par Client, Produit et Fournisseur )
10 10 Fenêtre glissante But: cumul, moyenne, dérivation sur une fenêtre glissante du temps SELECT Sf.Region, Sf.Month, Sf.Sales, AVG (Sf.Sales) OVER ( PARTITION BY Sf.Region ORDER BY Sf.Month ASC ROWS 1 PRECEDING ) AS Moving_avg FROM SalesFact AS Sf ORDER BY Sf.Month ASC; Region Month Sales Moving_Avg Eastern Oct, Eastern Nov, Eastern Dec, Eastern Jan, Eastern Feb, Eastern Mar, Mid Atlantic Oct, Mid Atlantic Nov, Mid Atlantic Dec, Mid Atlantic Jan, Mid Atlantic Feb, Mid Atlantic Mar,
11 MS MDX (Multidimensional Expression) 12 Langage d expression OLAP pour MS SQL Server Exemples SELECT NON EMPTY {[Time].[1997], [Time].[1998]} ON COLUMNS, [Promotion Media].[Media Type].Members ON ROWS FROM Sales SELECT {[Measures].[Unit Sales]} ON COLUMNS, ORDER( EXCEPT( [Promotion Media].[Media Type].members, { [Promotion Media].[Media Type].[No Media]}),[Measures].[Unit Sales], DESC) ON ROWS FROM Sales
12 13 ADT Séries Temporelles (Time Series) Définition Suite de couple (Valeur, estampille de temps) Applications Finance (stock value), Santé (épidémiologie),... Type calendar,... Opérations Index par rapport au temps
13 ADT Séries Temporelles 14
14 ADT Séries Temporelles 15
15 Architecture des SGBD décisionnels et des infocentres 16 Chargement de travail Requêtes complexes (nombreuses jointures + aggrégats) Très gros volumes de données Réponses SGBD Parallèles sur machines parallèles (SMP,Cluster, ) RAID et SAN (Storage Area Networks) Index Bitmaps, algorithme
16 17 Aspects Systèmes Stockage Tables de fait Append only (RID Timekey) Ligne de fait clés et mesures de type de taille fixe enregistrement de taille fixe (accès aléatoire) Jointure en Etoiles Star Query Index Binaire (Bitmap)
17 Jointure en Etoile (Star Join) 18 Exemple de Data Warehouse SGBD classique 2 stratégies Agrégation NM= NM Temps time_key day_of_week month quarter year holiday_flag NP=NP FaitVente Produit Magasin Fait de Vente time_key product_key store_key dollars_sold units_sold dollars_cost Agrégation NP=NP Produit product_key description brand category Magasin store_key store_name address floor_plan_type NM=NM FaitVente Magasin Produit
18 19 Jointure en Etoile (Star Join) Opérateur de jointure n-aire Star Join 1 source : la table de fait 1 à N sources : les tables de dimension Agrégation FaitVente NM=NM et NP=NP Produit Magasin
19 20 Index Binaire (Bitmap) Rappel sur les index B-Tree couple <Valeur Attribut, Pointeur d enregistrement> Index K Q Fichier R R
20 21 Index Binaire (Bitmap) Une chaîne de bits par valeur ou groupe de Valeur ou sur un prédicat (E)urope Index des Régions (A)sie (P)roche Orient Fichier Index des Couleurs Opérations logiques OR, AND, NOT E A Asie OR Europe j E v E b E r A r E b A j P b P (r)ouge (b)leu E Not (R OR B) Jaune AND Europe
21 22 Optimisation des Index Binaires Compression doit permettre les comparaisons Hiérarchisation multi-niveau ratio entre niveaux (ex 1:32) (E)urope (A)sie (P)roche Orient Index R non hiérarchisé Index R hiérarchisé (ratio 1:2) N0 N1 N bits stockés N0 N1 N bits stockés N0 N1 N bits stockés
22 23 Index Bitmap Indexation de la table de fait sur les valeurs des tables de dimension associées Cardinalité faible des attributs de la dimension Tables de dimension à faible évolution Exemple CREATE BITMAP INDEX sales_region_ix ON sales(region); Jointure en étoile (Star query) 2 étapes : Sélection des faits et Sélection des dimensions index bitmap pour les faits Jointure en étoile Parallélisation balayages // dans les étapes 1 et 2
23 Index Bitmap 24 Compression du bitmap Informix Online XPS, Oracle 8,... Indexation bitmap partielle Informix Online XPS Indexation bitmap de colonnes virtuelles Colonne calculée Vente.Profit = Vente.Prix_Vente - Produit.Prix_Conseillé Bibliographie "Star Query Processing in the Oracle7 Server," Oracle White Paper, March O'Neil, P. E., Graefe, G., "Multiple-table joins through bitmapped join indexes," SIGMOD Record, Vol. 24, No. 3, September 1995.
24 25 Performance des Index BitMap Pour les tables Append Only Éviter l OLTP (modification des attributs) Domaine de cardinalité faible faible nombre de valeurs différentes
25 25/01/ Occupation des Index BitMap n tuples tuples B+ Tree B+ Tree BitMap BitMap
26 27 Autres techniques Cache (de calcul) d agrégats Conserve et réutilise les tables temporaires issues de calculs d agrégat précédents Vue matérialisée (SNAPSHOT) Recalcul incrémental de la vue
27 28 Chargement de l entrepôt À partir des bases de productions Outils Extracteurs Journaux des images, Déclencheurs, Requetages, Purifieur Transformateur Format pivot : de + et + XML Chargeur
28 RAID Redundant Array of Inexpensive Disks [Patterson 88] 29 En 1988 SLED : Single Large Expensive Disk RAID vs SLED 64 * 100MB 7 500MB 64 MB/s 3 MB/s RAID : Redundant Array of Inexpensive Disks tableau de disques peu coûteux pour améliorer les débits I/O cependant il faut introduit de la redondance à cause de la MTBF qui suit une loi de poisson
29 Niveaux de fonctionnement des RAID 30 Redondance Niveau 1 : Les Disques Mirroirs TANDEM Mirrored Disks Niveau 2 : Code de Hamming pour ECC CM2 DataVault Niveau 3 : Un Seul Disque de Contrôle par Groupe de Disque Niveau 4 : Lectures et Ecritures indépendantes Niveau 5 : Contrôle réparti sur les disques du Groupe Sans redondance Niveau 0 : Stripping répartition des blocs contigus d'un fichier entre les disques mais pas de redondance (ie AID)
30 Redondance et Balayage (scan) parallèle RAID 0 répartit les données sur plusieurs disques pour améliorer les performances. RAID 1 effectue des copies miroirs de disques pour survivre aux pannes. RAID 5 utilise la correction d erreur et la répartition des données pour fournir performance et sécurité de manière économique et efficace. La correction est basée sur la propriété du XOR ( ) : ( X Y ) Y = X A E I B F J RAID 0 disque D0 disque D1 disque D2 disque D3 disque D0 = mirroir D1 A E I C G K A B C D G J disque D1 =mirroir D0 C G K A E I A D E F H K RAID 1 RAID 5 disque D0 disque D1 disque D2 disque D3 C G K disque D2 =mirroir D3 B F J D H L B E G H I L D H L disque D3 =mirroir D2 D H L B F J C F I J K L 31
31 Nouveaux Niveaux de fonctionnement des RAID 32 Redondance Niveau 0/1 ou «10» : Stripping sur des disques mirroirs Niveau 6 : Contrôle redondant Remarque 2,3,4,5 ne resiste qu à la panne d un seul disque dans le groupe Le niveau 6 ajoute du contrôle pour la redondance Plusieurs propositions N+Q : autre fonction que XOR 2D» Soit une matrice de disques» les lignes forment des groupes RAID5» les colonne forment des groupes RAID5
32 33 Contrôleur RAID Caractéristiques Niveaux de RAID géré 0, 1, 5, 0/1 Hot Sparing : Secours permutable (disques de réserve) Hot Swapping : Echange à chaud (par un opérateur humain) Contrôleur RAID actuel 30 disques Hot Plug 1 Go par groupe de 5 pour du RAID niveau 0,1,5 Configuration en 1996 : des disques SCSI de 1 à 4 Go (organisés par groupe de 5 pour RAID 5) Interfaces Low Cost : PCI + Disques SCSI UW-SCSI FiberChannel (25 Mo/s) pour des Architectures en Clusters
33 34 SAN (Storage Area Network) Réseau de stockage et d archivage haute performance Clusters de machines partageant des clusters de RAID
34 35 Standardisation Trop souvent propriétaire Standardisation du Référentiel Echec de AD/Cycle et Metadata Coalition OIM Open Information Model MS avec TI et Platinium Technology OLE for OLAP PLATO: Surcouche multidimensionnelle d SQL Server
35 Benchmarks (Banc de Performances) 36 Mesurer les performances d un système (matériel / logiciel) sous une charge de travail caractérisant une application type d infocentre. Objectif comparer les produits entre eux (avec d acheter) dimensionner son système en fonction de ses besoins Les benchmarks DW du TPC TPC-D : BD Décisionnelles (InfoCentre) Obsolète TPC Benchmark H (TPC-H) ad-hoc, decision support benchmark TPC Benchmark R (TPC-R) business reporting, decision support benchmark
36 TPC-D : BD Décisionnelles (InfoCentre) 37 Data Warehouse & Data Mining SF : Scale Factor 1,10,30,100,300,1000,3000,10000 soient des BDs de 1 Go à 10 To Modèle de données du TPC-D Part SF*200K PartSupp SF*800K LineItem SF*6000K Supplier SF*10K Customer SF*150K Order SF*1500K Nation 25 Region 5 Time 2557 D après [Bes97]
37 38 Modèle de données du TPC-D H R 8 tables PART (P_) SF*200,000 PARTKEY PARTSUPP (PS_) SF*800,000 PARTKEY LINEITEM (L_) SF*6,000,000 ORDERKEY ORDERS (O_) SF*1,500,000 ORDERKEY NAME SUPPKEY PARTKEY CUSTKEY MFGR AVAILQTY SUPPKEY ORDERSTATUS BRAND SUPPLYCOST LINENUMBER TOTALPRICE TYPE COMMENT QUANTITY ORDERDATE SIZE CONTAINER RETAILPRICE COMMENT SUPPLIER (S_) SF*10,000 SUPPKEY NAME ADDRESS NATIONKEY PHONE ACCTBAL COMMENT CUSTOMER (C_) SF*150,000 CUSTKEY NAME ADDRESS NATIONKEY PHONE ACCTBAL MKTSEGMENT COMMENT NATION (N_) 25 NATIONKEY NAME REGIONKEY COMMENT EXTENDEDPRICE DISCOUNT TAX RETURNFLAG LINESTATUS SHIPDATE COMMITDATE RECEIPTDATE SHIPINSTRUCT SHIPMODE COMMENT REGION (R_) 5 REGIONKEY NAME COMMENT ORDER- PRIORITY CLERK SHIP- PRIORITY COMMENT D après TPC
38 TPC Benchmark 39 decision support benchmark The TPC Benchmark H (TPC-H) ad-hoc suite de requêtes ad-hoc (orienté business) et de modifications concurrentes large volumes of data, queries with high degree of complexity Mesure TPC-H Composite Query-per-Hour Performance Metric (QphH@Size) The TPC Benchmark R (TPC-R) business reporting, decision support benchmark Similaire au TPC-H, mais permet des optimisations sur les requêtes complexes. Mesure TPC-R Composite Query-per-Hour Performance Metric (QphR@Size) Taille des bases SF (Scaling Factor)=1 (~1Go), 10, 30, 100, 300, 1,000, 3,000, 10,000
39 Suite de Requêtes du TPC-H & R 40 Pricing Summary Report Query (Q1) Minimum Cost Supplier Query (Q2) Shipping Priority Query (Q3) Order Priority Checking Query (Q4) Local Supplier Volume Query (Q5) Forecasting Revenue Change Query (Q6) Volume Shipping Query (Q7) National Market Share Query (Q8) Product Type Profit Measure Query (Q9) Returned Item Reporting Query (Q10) Important Stock Identification Query (Q11) Shipping Modes and Order Priority Query (Q12) Customer Distribution Query (Q13) Promotion Effect Query (Q14) Top Supplier Query (Q15) Parts/Supplier Relationship Query (Q16) Small-Quantity-Order Revenue Query (Q17) Large Volume Customer Query (Q18) Discounted Revenue Query (Q19) Potential Part Promotion Query (Q20) Suppliers Who Kept Orders Waiting Query (Q21) Global Sales Opportunity Query (Q22) New Sales Refresh Function (RF1) Old Sales Refresh Function (RF2)
40 Exemple de résultats Exercice : quelle configuration choisir pour un niveau de perf =2800 QphH 41 HP TPC-H Results - Revision 1.X - 300GB Scale Factor Company 01/2001 System SF QphH Price Perf.($/QphH) Total Sys. Cost NetServer LXr US $ Compaq ProLiant P US $ AlphaServer ES40 Compaq Model 6/ US $ Currency Database Software Microsoft SQL Server 2000 Microsoft SQL Server 2000 Informix XPS 8.31 FD1 Microsoft Windows 2000 Microsoft Windows 2000 Compaq Tru64 UNIX V5.1 Operating System IBM NUMA-Q US $ IBM DB2 UDB 7.1 DYNIX/ptx AlphaServer Informix XPS 8.30 Compaq Tru64 Compaq GS320 Model 6/ US $ FC3 UNIX V5.1 IBM NUMA-Q US $ IBM DB2 UDB 7.1 DYNIX/ptx IBM NUMA-Q US $ IBM DB2 UDB 7.1 DYNIX/ptx CPU Type Intel Pentium III Xeon 700MHz Intel Pentium III Xeon 700MHz Alphachip N 8 N 667 MHz 16 Y Intel Pentium III Xeon 700MHz AlphaChip 21264A 731 MHz Intel Pentium III Xeon 700MHz Intel Pentium III Xeon 700MHz 32 N 32 N 48 N 64 N # CPU's
41 42 Bibliographie - Livre Rob Mattison, Data Warehousing -Strategies, Technologies and Technics, IEEE Computer Society 1996, ISBN Michael J. Corey, Michael Abbey, Ian Abramson and Ben Taub, «Oracle8 Data Warehousing», Ed Mc Graw Hill, ISBN: , 686 pages Chris Date, «Introduction aux Bases de Données», 7ème édition, Chapitre 21.
42 43 Bibliographie - Articles CACM, «Industrial-Strength Data Warehousing» Vol. 41, No. 9 September, SQL99 On-Line Analytical Processing (SQL/OLAP) ISO/IEC /Amd1:2001
43 44 Bibliographie - Articles Tips OLAP de SQL Server Magazine Intelligent Enterprise. Parts de marché des outils OLAP
Les SGBDs Décisionnels
http://www-adele.imag.fr/users/didier.donsez/cours Les SGBDs Décisionnels Didier DONSEZ Université Joseph Fourier - Grenoble 1 PolyTech Grenoble LIG/ADELE [email protected], [email protected] Thierry
2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Les Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Bases de données multidimensionnelles et mise en œuvre dans Oracle
Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou
C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes
C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes Khaled Dehdouh Fadila Bentayeb Nadia Kabachi Omar Boussaid Laboratoire ERIC, Université de Lyon 2 5 avenue Pierre Mendes-France,
Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016
Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques
Fouille de Données : OLAP & Data Warehousing
Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de
Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK
Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP
Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse
Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu
Bases de Données OLAP
Bases de Données OLAP Hiver 2013/2014 Melanie Herschel [email protected] Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
LES ENTREPOTS DE DONNEES
Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des
SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
BD51 BUSINESS INTELLIGENCE & DATA WAREHOUSE
BD51 BUSINESS INTELLIGENCE & DATA WAREHOUSE Document de synthèse de projet Développement d un système décisionnel pour la gestion des ventes par magasin pour la base de données EMODE. VINCENT Jérémy Roussel
<Insert Picture Here> Exadata Storage Server et DB Machine V2
Exadata Storage Server et DB Machine V2 Croissance de la Volumétrie des Données Volumes multipliés par 3 tous les 2 ans Evolution des volumes de données 1000 Terabytes (Données) 800
Présentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre [email protected] Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Les entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Hervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
Bases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani
Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................
L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence
L offre décisionnel IBM Patrick COOLS Spécialiste Business Intelligence Le marché du Business Intelligence L enjeux actuel des entreprises : devenir plus «agiles» Elargir les marchés tout en maintenant
Entrepôts de données : Systèmes OLAP : ROLAP, MOLAP et OLAP (5) 1 Introduction aux systèmes
Entrepôts de données : Systèmes : R, M et H (5) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Introduction aux systèmes Systèmes
Techniques d optimisation des requêtes dans les data warehouses
Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE [email protected] Résumé Un entrepôt de données
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant
Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse
Pascale Borla-Salamet Consultante Avant Vente Oracle France Oracle Exadata Performance et Optimisation de votre Datawarehouse Agenda Les nouveaux challenges Exadata Storage Server Oracle Database Machine
SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
Master Exploration Informatique des données DataWareHouse
Master Exploration Informatique des données DataWareHouse Binôme Ahmed BENSI Enseignant tahar ARIB SOMMAIRE I. Conception...1 1. Contexte des contrats...1 2. Contexte des factures...1 II. Modèle physique...2
SQL Server 2012 et SQL Server 2014
SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation
Tout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander
Tout ce que vous avez toujours voulu savoir sur SAP HANA Sans avoir jamais osé le demander Agenda Pourquoi SAP HANA? Qu est-ce que SAP HANA? SAP HANA pour l intelligence d affaires SAP HANA pour l analyse
ETL Extract - Transform - Load
ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus
SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste
Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en
Bases de Données. Stella MARC-ZWECKER. [email protected]. Maître de conférences Dpt. Informatique - UdS
Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS [email protected] 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions
Introduction à l Informatique Décisionnelle - Business Intelligence (7)
Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence
Urbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Performances. Gestion des serveurs (2/2) Clustering. Grid Computing
Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des
ORACLE EXADATA DATABASE MACHINE X2-8
ORACLE EXADATA DATABASE MACHINE X2-8 CARACTERISTIQUES ET AVANTAGES CARACTERISTIQUES 128 cœurs de CPU et 2 TO de mémoire pour le traitement des bases de données 168 cœurs de CPU pour le traitement du stockage
Les entrepôts de données et l analyse de données
LOG660 - Bases de données de haute performance Les entrepôts de données et l analyse de données Quelques définitions Entreposage de données (data warehousing): «La copie périodique et coordonnée de données
Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création
Construction d un EDD avec SQL 2008 R2 Plan Analyse du DW construit Construction de la base DW dans SQL 2008 Construction des tables de faits et dimensions Injection des données Étapes de l injection des
Cours 13. RAID et SAN. 2004, Marc-André Léger
Cours 13 RAID et SAN Plan Mise en contexte Storage Area Networks Architecture Fibre Channel Network Attached Storage Exemple d un serveur NAS EMC2 Celerra Conclusion Démonstration Questions - Réponses
Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
ORACLE EXADATA DATABASE MACHINE X2-2
ORACLE EXADATA DATABASE MACHINE X2-2 CARACTERISTIQUES ET AVANTAGES CARACTERISTIQUES Jusqu à 96 cœurs de CPU et 768 GO de mémoire pour le traitement des bases de données Jusqu à 168 cœurs de CPU pour le
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...
Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média
Les bases de données
Les bases de données Introduction aux fonctions de tableur et logiciels ou langages spécialisés (MS-Access, Base, SQL ) Yves Roggeman Boulevard du Triomphe CP 212 B-1050 Bruxelles (Belgium) Idée intuitive
La problématique. La philosophie ' ) * )
La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse
OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- [email protected] Flavien Bouillot
OLAP : Mondrian + Pentaho Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- [email protected] Flavien Bouillot Outils Open Source Mondrian : serveur OLAP JFreeReport : ou9l de «Repor9ng» KeHle
Datawarehouse and OLAP
Datawarehouse and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today architecture ETL refreshing warehousing projects architecture architecture
Guide pour l Installation des Disques Durs SATA et la Configuration RAID
Guide pour l Installation des Disques Durs SATA et la Configuration RAID 1. Guide pour l Installation des Disques Durs SATA... 2 1.1 Installation de disques durs Série ATA (SATA)... 2 2. Guide de Configurations
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012
Business Intelligence, Etat de l art et perspectives ICAM JP Gouigoux 10/2012 CONTEXTE DE LA BI Un peu d histoire Premières bases de données utilisées comme simple système de persistance du contenu des
StruxureWare Power Monitoring v7.0. La nouvelle génération en matière de logiciel de gestion complète d énergie
StruxureWare Power Monitoring v7.0 La nouvelle génération en matière de logiciel de gestion complète d énergie Évolution des deux plate-formes originales Power Monitoring v7.0 SMS ION Enterprise 2012 Struxureware
Les Bases de Données et l Objet Introduction
Les Bases de Données et l Objet Introduction Didier DONSEZ Université de Valenciennes Institut des Sciences et Techniques de Valenciennes [email protected] Plan Définitions d un Objet Propriétés
SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features
SWISS ORACLE US ER GRO UP www.soug.ch Newsletter 5/2014 Sonderausgabe OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features 42 TIPS&TECHNIQUES Alexandre Tacchini, Benjamin Gaillard, Fabien
Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows 2000. W2K pro: configuration.
Windows 2000: Introduction W2K: Architecture Système d'exploitation multitâche multithread 32 bits à architecture SMP. Multiplateforme: intel x86, Compaq Alpha Jusqu'à 64 Go de mémoire vive Système d'exploitation
Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales
Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire
1 Introduction et installation
TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on
Business Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
Fonctionnalités des différentes éditions de SQL Server 2012
Fonctionnalités des différentes éditions de SQL Server 2012 Cette rubrique décrit les s prises en charge par les versions de SQL Server 2012. Toutes les s de SQL Server 2008 R2 sont disponibles dans les
CHAPITRE 1 ARCHITECTURE
07/04/2014 Université des sciences et de la Technologie Houari Boumediene USTHB Alger Département d Informatique ADMINISTRATION ET TUNING DE BASES DE DONNÉES CHAPITRE 1 ARCHITECTURE RESPONSABLE DR K. BOUKHALFA
Le Langage SQL version Oracle
Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI [email protected]
Guide pour l Installation des Disques Durs SATA et la Configuration RAID
Guide pour l Installation des Disques Durs SATA et la Configuration RAID 1. Guide pour l Installation des Disques Durs SATA... 2 1.1 Installation de disques durs Série ATA (SATA)... 2 2. Guide de Configurations
Eduardo Almeida. Master Alma Université de Nantes {[email protected]}
Data Warehouse - OLAP Master Alma Université de Nantes {[email protected]} Objectif Présenter les concepts de base d'un Data Warehouse (DW) et On Line Analytical Processing (OLAP). Présenter
Arian Papillon [email protected]
Arian Papillon [email protected] Eléments de monitoring Compteurs de performances DMV s et DBCC Evènements (jobs, services, ) Stratégies (policies) Traces Plans d exécution Outils de mesure Multiples,
Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services
Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles
Gamme Serveurs HP ProLiant Rack
Gamme Serveurs HP ProLiant Rack Janvier 2015 Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. La gamme de produits la plus
2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR
2014/2015 Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : ANOUAR OUFQIR MME L.LAMRINI SMARTSIR Table des matières Introduction... 2 Choix de l outil pour
Administration des bases de données. Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/
Administration des bases de données Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/ Administration des bases de données II Objets avancés dans les bases de données OBJECTIFS 2.1. NOTIONS 2.1.1.
Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes
Langage SQL (1) Sébastien Limet Denys Duchier IUT Orléans 4 septembre 2007 Notions de base qu est-ce qu une base de données? SGBD différents type de bases de données quelques systèmes existants Définition
BI = Business Intelligence Master Data-ScienceCours 3 - Data
BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage
Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)
Introduction à lʼinformatique Décisionnelle et la «Business Intelligence» (1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013
Cours Base de données relationnelles. M. Boughanem, IUP STRI
Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),
Entrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Municipalité de La Nation The Nation Municipality
Municipalité de La Nation The Nation Municipality RAPPORT DU SERVICE INFORMATIQUE Rapport de l administrateur réseau pour un changement majeur RAPPORT NO. F-02-204 DATE 2 mai 204 INTRODUCTION Par mesure
La place de la Géomatique Décisionnelle dans le processus de décision
Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres
TP11 - Administration/Tuning
TP11 - Administration/Tuning MIAGE #3-2006/2007 January 9, 2007 1 Architecture physique d une base Oracle 1.1 La structure physique Une base de données Oracle est composé de fichiers (au sens du système
Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France
Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France 2013 SAP AG. All rights reserved. Customer 1 Rôles et Attentes Instantanéité BIG DATA Users IT Real Time SAP HANA
Encryptions, compression et partitionnement des données
Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des
Module BDR Master d Informatique (SAR)
Module BDR Master d Informatique (SAR) Cours 6- Bases de données réparties Anne Doucet [email protected] 1 Bases de Données Réparties Définition Conception Décomposition Fragmentation horizontale et
Gestion de mémoire secondaire F. Boyer, Laboratoire Sardes [email protected]
Gestion de mémoire secondaire F. Boyer, Laboratoire Sardes [email protected] 1- Structure d un disque 2- Ordonnancement des requêtes 3- Gestion du disque - formatage - bloc d amorçage - récupération
L informatique des entrepôts de données
L informatique des entrepôts de données Daniel Lemire SEMAINE 10 Introduction à MDX 10.1. Présentation de la semaine Tout comme le modèle relationnel utilise SQL comme langage, le modèle OLAP utilise le
Bases de données et sites WEB Licence d informatique LI345
Bases de données et sites WEB Licence d informatique LI345 Anne Doucet [email protected] http://www-bd.lip6.fr/ens/li345-2013/index.php/lescours 1 Contenu Transactions en pratique Modèle relationnel-objet
Introduction au Massive Data
Introduction au Massive Data Didier Kirszenberg, Responsable des architectures Massive Data, HP France Copyright 2015 Hewlett-Packard Development Company, L.P. The information contained herein is subject
Agenda. Exemple : données et back à Eurecom SANs and NAS. Les bases: SANs. Back-up Partage de fichier. Disques et Raid SCSI et FCP
Storage Area Networks (SAN) G. Urvoy-Keller 2 Agenda Exemple : données et back à Eurecom SANs and NAS Back-up Partage de fichier Les bases: Disques et Raid SCSI et FCP SANs Terminologie Protocoles SCSI
Ora2Pg Performances. (C) 2013 Gilles Darold
Ora2Pg Performances (C) 2013 Gilles Darold Gilles Darold Consultant @ Dalibo Auteur d'ora2pg Auteur de PgBadger Auteur de pgformatter Et autres => http://www.darold.net/ Cas pratique Migration d'une base
palais des congrès Paris 7, 8 et 9 février 2012
palais des congrès Paris 7, 8 et 9 février 2012 Analysis Services 2012 BI Personnelle, couche sémantique, cube, quelle(s) solution(s) pour un nouveau projet décisionnel? 08/02/2012 Aurélien KOPPEL Microsoft
Système de stockage sur disque IBM Storwize V5000
Système de stockage sur disque IBM Storwize V5000 Le nouveau membre de la gamme IBM Storwize procure des avantages exceptionnels et une flexibilité accrue Points forts Simplification de la gestion à l
Les Triggers SQL. Didier DONSEZ. Université de Valenciennes Institut des Sciences et Techniques de Valenciennes donsez@univ-valenciennes.
Les Triggers SQL Didier DONSEZ Université de Valenciennes Institut des Sciences et Techniques de Valenciennes [email protected] 1 Sommaire Motivations Trigger Ordre Trigger Ligne Condition Trigger
Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de
Les Entrepôts de Données. (Data Warehouses)
Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage
Technologie Netapp. Novembre 2010
Technologie Netapp Novembre 2010 La Proposition de valeur NetApp Simplification, Performance et ROI 2010 NetApp. All rights reserved. 2 Une valeur unique sur le marché Une solution unique pour adresser
Clients et agents Symantec NetBackup 7
Protection complète pour les informations stratégiques de l'entreprise Présentation Symantec NetBackup propose un choix complet de clients et d'agents innovants pour vous permettre d optimiser les performances
Le e s tocka k ge g DAS,NAS,SAN
Le stockage DAS,NAS,SAN Sommaire Introduction SAN NAS Conclusion Bibliographie Questions Introduction Besoin de partage de données à travers un réseau Explosion des volumes de données Comment assurer les
