Entrepôts de données Cours 2 et 3 : modélisation et interrogation. Anne Doucet Anne.Doucet@lip6.fr

Dimension: px
Commencer à balayer dès la page:

Download "Entrepôts de données Cours 2 et 3 : modélisation et interrogation. Anne Doucet Anne.Doucet@lip6.fr"

Transcription

1 Entrepôts de données Cours 2 et 3 : modélisation et interrogation Anne Doucet Anne.Doucet@lip6.fr 1

2 Plan Modélisation des données Concepts multidimensionnels Opérations Modèle de données ROLAP Étoile, flocon, constellation Transformation OLTP-ROLAP Extensions de SQL pour les requêtes OLAP Dimensions, agrégation, rollup, cube Partition et Model 2

3 Table des ventes : Données relationnelles Produit Région Chiffre Soda Ouest 300 Vins Est 250 Entretien Centre 150 Soda Centre 400 Vins Centre 300 Calcul du total des ventes de soda? requêtes, tables redondantes, attribut redondant 3

4 Données pour l analyse grille des ventes : les axes correspondent à des attributs ayant des associations m-n Est Ouest Centre Sud Total Soda Vins Entretien Total facilité de lecture et de navigation intégration des calculs 4

5 Concepts du modèle multidimensionnel mesure = critère d évaluation du processus décisionnel (ex : chiffre d affaires, quantité en stock) dimension = axe d analyse associé à un indicateur, représentant un sujet d intérêt (ex : temps, produit, localisation) hiérarchie = décomposition d une dimension en une arborescence de niveaux (ex : temps décomposé en mois, trimestre, année,...) attribut = caractéristique d un niveau d une hiérarchie (ex : prix d un article) agrégat = résultat d un indicateur par rapport à des niveaux (ex : chiffre d affaires du mois) 5

6 Cube multidimensionnel année trimestre mois janvier temps trimestre février mars Strasbourg France Est Ouest Centre Sud Nord Nancy Rennes Nantes article gamme Cap Cola limonade Soda Vins classe Alimentation Produit 6

7 Interrogation OLAP Principes: Affichage d une «face projetée» du cube multi-dimensionnel Opérations de manipulations d un cube Visualisation des résultats 7

8 Exemple Projection : slicing : classe = alimentation et année=1998 Produit : classe alimentation Temps : année 1998 trimestre 1 trimestre 2 trimestre 3 trimestre 4 Soda Vins.. 8

9 Exemple Pivotement : ajout de localisation Slicing : trimestre=4 et pays=france Produit : alimentation Temps : trimestre 4, année 1998 Localisation : pays France Est Ouest Centre Sud Total Soda

10 Autre visualisation Avantage visuel Problème de multiplicité des diagrammes Droit Philo Phys Info ECP ENS Poly Nombre de succès par matière (droit, philo, phys, info) et par école (Centrale ECP, Normale Sup ENS, Polytechnique) 10

11 Choix des niveaux de hiérarchies Le choix des niveaux affecte le volume des données représentées le niveau de détail de l information la formulation des requêtes Exemple: facturation détaillée : 200 appels/mois, 50 octets/appel, sur 2 mois on a octets/abonné sans facturation détaillée : 50 octets/abonné 11

12 Opérations sur le cube Sur la structure Rotate (pivot) Switch Split Nest/unnest Push/pull Slice Sur le contenu Dice (sélection) Roll-up (grain supérieur) Drill-down (grain inférieur) Entre cubes Jointure Opérations ensemblistes (union, intersection, différence) 12

13 Rotation (slicing) Rotation (Pivot) : rotation par rapport à l un des axes de dimension Droit Philo Phys Info ECP ENS Poly Droit Philo Phys Info ECP ENS Poly <> <> <> <> <> <> 8 8 pivot 13

14 Permutation de valeurs de dimensions (switch) Droit Philo Phys Info ECP ENS Poly Droit Philo Info Phys <> ECP <> <> ENS <> Poly switch SWITCH 14

15 Décomposition (split) Droit Philo Phys Info ECP 17 8 ENS Poly Split Droit ECP ENS 15 <> <> Poly 25 <> <> Info Phys Philo ECP ENS Poly ECP ENS 8 <> <> Poly 12 <> <> ECP ENS 9 <> <> Poly 22 <> <> 15

16 Imbrication/désimbrication (nest/unnest) Droit Philo Phys Info ECP ENS Poly Droit Philo Phys Info NEST ECP ENS <> <> 15 <> <> 9 <> <> 8 <> <> 12 UNNEST Poly <> <> 25 <> <> 22 <> <> 12 <> <> 18 16

17 Concaténation (push/pull) Droit Philo Phys Info ECP 17 8 ENS Poly Push Pull Droit Philo Phys Info ECP ENS 1996<> 1997<> <> 1997<> <> 1997<> <> 1997<> Poly 1996 <> 1997 <> <> 1997 <> <> 1997 <> <> 1997 <>

18 Projection (slice) S applique sur les valeurs des dimensions 1996 Droit Philo Phys Info ECP 17 8 ENS Poly SLICE 1996 SLICE ECP 5 ENS Poly Droit Philo ECP <> ENS Info

19 Projection agrégative Droit Philo Phys Info ECP 17 8 ENS Poly Slice Matière ECP 35 ENS 44 Poly 77 19

20 Sélection (Dice) S applique sur les valeurs des cellules Droit Philo Phys Info ECP ENS Poly ECP ENS Poly 15 Droit Philo Phys Info

21 Roll up/drill-down Droit Philo Phys Info Période 11, ,3 9,3 11, ,3 9,3 9,3 ECP ENS <> <> <> Droit Philo Phys Info ECP ENS Poly <> <> <> 10,6 10,6 Poly Droit Philo Phys Info , ,6 16,3 8,3 11,6 15,6 16,3 Ecole Rang A 8,3 11,6 Roll-up(Rang) Roll-up (Période) Roll-up (*.) 13,5 13,5 13,5 21

22 Composition d opérations ECP ENS Poly Droit Philo Phys Info Dice Roll-up ECP ENS Poly Droit Philo Phys Info ECP ENS Poly Philo Slice

23 Jointure ECP ENS Poly Droit Philo Phys ECP ENS Poly Info Droit Philo Phys Info ECP ENS Poly 23

24 Union ECP ENS Poly U1 U2 U3 Droit Philo Phys Droit Philo Phys Universités U1, U2, U3 Info 17 6 Info Droit Philo Phys Info ECP 7 18 Droit Philo 5 Phys 5 Info 17 8 ENS Poly U U U

25 Représentation du cube Deux façons de représenter le cube : Le modèle ROLAP : le serveur OLAP traduit les opérations sur le cube en opérations relationnelles. Le modèle MOLAP stocke la BD multidimensionnelle dans des structures non relationnelles. La majorité des serveurs OLAP suivent le modèle ROLAP. Objectifs : Dénormaliser (minimiser les jointures) Résumés (effectuer des précalculs) Partitionnement vertical (diminuer la taille des tables) Trois modèles : étoile, flocon, constellation 25

26 Modèle en étoile Une table «fact» par indicateur Une table dénormalisée pour chaque dimension associations en étoile entre les tables «fact» et «dimension» Product Table Product_id Product_desc Time Table Day_id Month_id Period_id Year_id Sales Fact Table Product_id Store_id Item_id Day_id Sales_dollars Sales_units... Store Table Store_id District_id... Item Table Item_id Item_desc... 26

27 Choix des tables «fact» et «dimension» Analyse des requêtes attributs «group-by» indiquent les dimensions attributs agrégés indiquent les mesures attributs «where» sont les attributs des tables «dimension» Exemple : select sale.store_id,sale_product_id, sum(sale.price) from product, sale where product.product_id=sale.product_id and product.product_desc = «clothes» group by store_id, product_id 27

28 Choix des tables Analyse des procédés métier table fait est dérivée d une activité liée à un procédé métier les attributs de la table fait sont des attributs clés qui identifient l activité plus des mesures les dimensions sont dérivées des attributs clés des tables faits 28

29 Modèle en flocon Product Table Product_id Product_desc Time Table Week_id Period_id Year_id Sales Fact Table Product_id Week_id Item_id Store_id Sales_dollars Sales_units Store Table Store_id Store_desc District_id Item Table Item_id Item_desc Dept_id District Table District_id District_desc Dept Table Dept_id Dept_desc Mgr_id Mgr Table Dept_id Mgr_id Mgr_name 29

30 Avantages/Inconvénients Modèle en étoile : évite jointures par dénormalisation Modèle en flocons chargement/rafraîchissement plus rapide 30

31 Modèle en constellation Warehouse Table Warehouse_id Warehouse_loc Product Table Product_id Product_desc Store Table Store_id District_id Inventory Fact Table Product_id Warehouse_id Week_id Cost_dollars Qty_on_hand Time Table Week_id Period_id Year_id Sales Fact Table Item_id Product_id Week_id Store_id Sales_dollars Sales_units Item Table Item_id Dept_id 31

32 Modélisation de la dimension Temps Fact Table Day_id Fact Table Day_id Fact Table Day_id Time Dimension Day_id Month_id Quarter_id Half_year_id Year_id Time Dimension Day_id Month_id Quarter_id Half_year_id Year_id Fiscal_month_id Fiscal_ quarter_id Fiscal_ half_year_id Fiscal_ year_id Time Dimension Day_id Month_id Quarter_id Half_year_id Year_id 32

33 Evolutions dans les dimensions Gestion du changement des valeurs dans les dimensions modifier les données : perte de l historique perte des contraintes référentielles créer de nouveaux tuples : ID doit inclure une notion de version complique la sémantique des requêtes 33

34 Versions dans les dimensions Customer History Table Cust_id Cust_name Version 1 ABC Co 1 1 ABC Ltd 2 2 XYZ Inc 1 Customer Table Cust_id Sales Fact Table Unit Sell Price Dollar Sales Unit Sales Dollar Cost 34

35 Difficultés de la modélisation Choix des attributs mesures mesures vs propriétés caractéristiques qui déterminent requêtes possibles Représentation des agrégats granularité des données dans les tables «facts» modélisation des agrégats choix des agrégats 35

36 Mesures et propriétés Propriété : attribut d une dimension représentant une constante ou une valeur discrète couleur prix d un article en catalogue Mesure : attribut d une table «fact» représentant une valeur à variation continue solde nombre total des articles commandés 36

37 Propriétés des mesures (1) Mesures additives: peuvent être agrégées avec toutes les dimensions sans aucune restriction. Mesures semi-additives : peuvent être agrégées avec certaines des dimensions (mais pas toutes) Exemple : quantité, bénéfice, coût,... F : A x B C est additive sur A si et seulement si : F (a 1 + a 2, b) = F (a 1, b) + F (a 2, b) F est additive si elle est additive sur tous ses arguments 37

38 Propriétés des mesures (2) Mesures non additives : doivent être traitées de façon atomique. Exemple : quantité cumulée (solde, etc) Les mesures qui s accumulent avec le temps peuvent seulement être moyennées par rapport au temps Exemples : Inventaire de chaque produit, solde sur un compte en banque 38

39 Exemples de mesures Time Dimension Additive Product Dimension Sales Fact Table Time_key Product_key Store_key Promotion_key Quantity_sold* Revenue* Cost* Customer Count Store Dimension Semi-Additive Promotion Dimension Cost by Product + Store + Time Cost by Product + Promotion + Time Revenue by Product + Promotion + Time Revenue by Product + Promotion + Store + Time... 39

40 Granularité des données Analyse d un métier au niveau de ses transactions comparaison des ventes entre matin et après-midi périodes de pointe des demandes de renseignement Nécessite une granularité fine ventes par produit, par client, par minute, par magasin demandes par produit, par client, par minute 40

41 Granularité des données (2) Analyse d un métier par tranche de temps variations des demandes de renseignements sur les jours du mois Nécessite une agrégation périodique des données demandes par produit, par nombre de clients, par jour 41

42 Modélisation des agrégats agrégats : attributs calculés à partir d attributs mesures et de fonction de calcul. En général, modélisé par des tables «fact» spécifiques problème : choix de ces tables? Accélère le traitement des requêtes OLAP ralentit le rafraîchissement de l entrepôt et augmente la taille de l entrepôt 42

43 Table fact avec agrégat Customer Table Cust_id Cust_name Sales Fact Table Unit Sell Price Dollar Sales Unit Sales Dollar Cost Store Table Store_id District_id Summary for Product, Store, and Time for all Customers Customer Summary Cust_id Total Sales Highest Sales Value Average Sales Time Table Week_id Period_id Year_id Product Table Product_id Product_desc 43

44 Choix des agrégats But: optimisation des requêtes très coûteuses en temps d exécution problème : inflation du nombre d agrégats solution : les agrégats sont réutilisables pour plusieurs requêtes, même partiellement choisir les meilleurs agrégats communs à l ensemble des requêtes 44

45 Réutilisation des agrégats SALES FACTS Sales$ Region Month 10,000 North Jan 97 12,000 South Feb 97 11,000 North Jan 97 15,000 West Mar 97 18,000 South Feb 97 20,000 North Jan 97 10,000 East Jan 97 2,000 West Mar 97 SALES BY MONTH/REGION Month Region Tot_Sales$ Jan 97 North 41,000 Jan 97 East 10,000 Feb 97 South 40,000 Mar 97 West 17,000 SALES BY MONTH Month Tot_Sales Jan 97 51,000 Feb 97 40,000 Mar 97 17,000 45

46 Méthodes de conception Dimensions de la démarche descendante : on part d un schéma conceptuel du DW, puis on produit un schéma ROLAP, puis on définit la traduction des sources dans ce schéma ascendante : on part des schémas des sources qu on intègre progressivement pour obtenir un schéma global structuré selon un modèle ROLAP local vers global : débuter par des data marts puis passer à un entrepôt global global vers local : débuter par le DW global puis définir des entrepôts locaux 46

47 Descendante vs ascendante Approche descendante principe : concevoir un schéma d entreprise intégré (Modèle d entreprise) dont les schémas des sources seront dérivés nécessite outils de modélisation approche robuste mais lente et coûteuse Approche ascendante principe : intégrer les schémas des sources de façon à dériver un schéma global approche pragmatique mais évolution difficile 47

48 Approche ascendante 1. Intégration de schémas conceptuels hétérogènes en un schéma global pré-intégration comparaison de schémas conformance de schémas fusion et restructuration 2. Transformation d un schéma opérationnel en un schéma ROLAP 48

49 Transformation OLTP-ROLAP Méthode générale éliminer les attributs inutiles dans les sources estampiller les données isoler les dimensions et les faits choix et modélisation des mesures arrangement en modèle ROLAP enrichissement par données contextuelles Exemple : transformation d un schéma de type TPC-C 49

50 Etape 1 : élimination de données Order Ord ID Ord Sales ID Cust ID Sales Location Order Date -Date Filled -Comments -Routing -Ship Address Customer Cust ID Cust Name Address Phone -Created By -Credit Checked By -Credit Clerk ID Salesman Salesman ID Manager ID Projected Sales -Created By -Hire Date Order Item Ord ID Line No Product ID Quantity Unit Price Item Total Product Product ID Class ID Category ID Vendor ID -Product Status -Created By 50

51 Etape 2 : ajout du temps Order Ord ID Ord Sales ID Cust ID Sales Location Order Date Customer Cust ID Cust Name Address Phone +Snapshot Date Salesman Salesman ID Manager ID Projected Sales +Snapshot Date Order Item Ord ID Line No Product ID Quantity Unit Price Item Total +Snapshot Date Product Product ID Class ID Category ID Vendor ID +Snapshot Date 51

52 Etape 3: choix des mesures Order Ord ID Ord Sales ID Cust ID Sales Location Order Date +Total Order Value +Discount Applied Customer Cust ID Cust Name Address Phone Snapshot Date +Total Cust Orders Salesman Salesman ID Manager ID Projected Sales Snapshot Date +Total Sales Orders Order Item Ord ID Line No Product ID Quantity Unit Price Item Total Snapshot Date Product Product ID Class ID Category ID Vendor ID Snapshot Date +Total Products Ordered 52

53 Etape 4 : ajout de données Order Ord ID Cust ID Ord Sales ID Sales Location Order Date Total Order Value Discount Applied Customer Cust ID Cust Name Address Phone Snapshot Date Total Cust Orders Salesman Salesman ID Manager ID Projected Sales Snapshot Date Total Sales Orders Order Item Ord ID Line No Product ID Quantity Unit Price Item Total Snapshot Date +Warehouse ID +Order Lead Time +Stock Out +Stock Level Product Product ID Class ID Category ID Vendor ID Snapshot Date Total Products Ordered +Inventory Item +Product ID +Warehouse ID +Order Lead Time +Stock Out +Stock Level 53

54 Etape 5: réarrangement Order Ord ID Cust ID Ord Sales ID Sales Location Order Date Total Order Value Discount Applied Customer Cust ID Cust Name Snapshot Date Salesman Salesman ID Manager ID Snapshot Date Customer Detail Cust ID Snapshot Date Address Phone Total Orders Salesman History Salesman ID Snapshot Date Projected Sales Total Orders Order Item Ord ID Line No Product ID Quantity Unit Price Item Total Snapshot Date Warehouse ID Order Lead Time Stock Out Stock Level Product Product ID Class ID Category ID Vendor ID Snapshot Date Total Products Ordered 54

55 Etape 5 (suite) Order Ord ID Cust ID Ord Sales ID Sales Location Order Date Total Order Value Discount Applied +Line No +Product ID +Quantity +Unit Price +Item Total +Warehouse ID +Order Lead Time +Stock Out +Stock Level Customer Cust ID Cust Name Snapshot Date Salesman Salesman ID Manager ID Snapshot Date Customer Detail Cust ID Snapshot Date Address Phone Total Orders Salesman History Salesman ID Snapshot Date Projected Sales Total Orders Order Item Ord ID Line No Product ID Quantity Unit Price Item Total Snapshot Date Warehouse ID Order Lead Time Stock Out Stock Level Product Product ID Class ID Category ID Vendor ID Snapshot Date Total Products Ordered 55

56 Etape 6 : ajout des données de contexte +Sales Location +Region ID +Effective From +Effective To +Contains Region ID +Region Description Product Product ID Class ID Category ID Vendor ID Snapshot Date Total Products Ordered Order Ord ID Cust ID Ord Sales ID Sales Location (Region ID) Order Date Total Order Value Discount Applied Line No Product ID Quantity Unit Price Item Total Warehouse ID Order Lead Time Stock Out Stock Level Salesman History Salesman ID Snapshot Date Projected Sales Total Orders Salesman Salesman ID Manager ID Snapshot Date Customer Cust ID Cust Name Snapshot Date Customer Detail Cust ID Snapshot Date Address Phone Total Orders 56

57 Approche descendante Problème : on dispose d un schéma d entrepôt ROLAP = ens. de vues. Pour chaque vue de ce schéma, il faut spécifier sa construction à partir des sources. Exemple d approche possible : 1. Décrire les propriétés sémantiques des sources et des vues 2. Pour chaque vue, déterminer les relations source pertinentes définir les opérations pertinentes entre ces relations choisir les requêtes à générer 57

58 Meta-données 1. Schémas des sources et des vues 2. Assertions intra-schéma dépendances fonctionnelles (e.g., R 1.K R 1.A) contraintes référentielles (e.g., R 1.A R 2.A) contraintes de valeurs (e.g., R 1.A < R 1.B) 3. Assertions inter-schema équivalence sémantique (e.g., R 1.A R 2.A) équivalence des instances : e.g., I(R 1 ) = I(R 2 ), I(R 1 ) I(R 2 ) = comparaison de structures (e.g., R 1 = R 2, R 1 R 2 ) 58

59 Relations sources pertinentes V(K,A,B,C,D,E) R1(K,A,B,X) R2(Y,C,D,E,W) R3(B,D,E,Z) 59

60 Tables de transition V(K,A,B,C,D,E) T1( K,A,B,X) T2(Y,C,D,E) T3( B,D,E) tables de transition finales T4(X,Y) table de transition explicite R1(K,A,B,X) R2(Y,C,D,E,W) R3(B,D,E,Z) 60

61 Graphe des opérations possibles Vue utilisateur V(K,A,B,C,D,E) graphe d opérations relations de transition T1(K,A,B) T2(B,C,D,E) T3(B,C,D,E) U relations sources R1(K,A,B,X) R2(B,C,D,E,Y) R3(B,C,D,E,Z) 61

62 Extensions de SQL pour OLAP Plusieurs propositions d extensions : SQL : Dimension, Agrégation, Roll up, Cube Densification SQL Model (spreadsheet) 62

63 SQL (Oracle) Définition des dimensions Une dimension est définie par des relations : table + attributs un attribut = un niveau la hiérarchie entre les niveaux : arbre (ou branche) les dépendances fonctionnelles entre les attributs Avantages Cohérence des données Traitement plus efficace des requêtes d agrégation 63

64 Dimensions dans un schéma en étoile Exemple: la dimension des catégories de produits CREATE DIMENSION products_dim LEVEL product IS (products.prod_id) LEVEL subcategory IS (products.prod_subcategory) LEVEL category IS (products.prod_category) HIERARCHY prod_rollup ( product CHILD OF subcategory CHILD OF category) ATTRIBUTE product DETERMINES (prod_name, prod_desc, prod_min_price, ) ATTRIBUTE subcategory DETERMINES (prod_subcategory, prod_subcategory_desc) ATTRIBUTE category DETERMINES (prod_category, prod_category_desc); 64

65 Dimensions dans un schéma en flocon Définir une dimension à partir de plusieurs relations Clients (cl_id, cl_ville, cl_région, cl_pays) Pays (p_id, p.continent) CREATE DIMENSION clients_dim LEVEL client IS (cl_id) LEVEL ville IS (cl_ville) LEVEL région IS (cl_région) LEVEL pays IS (p_id) LEVEL continent IS (p_continent) HIERARCHY geographic_rollup ( client CHILD OF ville CHILD OF région CHILD OF pays CHILD OF continent JOIN KEY (cl_pays) REFERENCES Pays); 65

66 Agrégation avec SQL : GROUP BY Regroupement suivant n dimensions GROUP BY d1,, dn Un groupe contient tous les faits qui ont les mêmes valeurs pour (d1,, dn). Les groupes sont disjoints. Clause SELECT : fonction d agrégation sum, avg, count, min, max, Résultat: un n-uplet par groupe Exemple : Sales(StoreID, ItemID, CustID, qty, price) SELECT StoreID, ItemID, CustID, SUM(price) FROM Sales GROUP BY StoreID,ItemID,CustID 66

67 Opérateur ROLLUP Syntaxe: GROUP BY [D ] ROLLUP(D ) D et D sont des listes de dimensions d1 dn Agrégation sur n+1 niveaux de regroupements Niveau 1 : group by d1 dn-1 dn Niveau 2 : group by d1 dn-1 Niveau n : group by d1 Niveau n+1 : un seul groupe = la table des faits toute entière Rollup partiel : moins de niveaux GROUP BY D ROLLUP(D ) Ex: group by e1 rollup (e2, e3) crée les sous-totaux (e1,e2,e3), (e1, e2) et (e1) Le ROLLUP est utile lorsque les Di sont les niveaux d une même hiérarchie (ROLLUP (jour, mois, année)) 67

68 Exemple de ROLLUP(1) Sales(StoreID, ItemID, CustID, qty, price) Requête SELECT StoreID, ItemID, CustID, SUM(price) FROM Sales GROUP BY ROLLUP(StoreID,ItemID,CustID) Résultat [s, i, c, p] Résultat [s1, i1, c1, 2] [s1,i1,c3, 1] [s1, i1,null, 100] [s1, i2, null, 250] total par mag. par art. [s1, null, null, 4000 ] total par magasin [null, null, null, ] total général mais pas les n-uplets suivants : [s1, null, c1, 30] [null, null, c1, 200] total par mag. par client total par client 68

69 Exemple de ROLLUP (2) Sales(RegionID, StoreID, ClerkID, hourlypay) Requête SELECT RegionID, StoreID, ClerkID, AVG(hourlyPay) FROM Sales GROUP BY RegionID, ROLLUP(StoreID, ClerkID), Résultat 69

70 Exemple de ROLLUP (3) SELECT Type, Store, SUM(Number) FROM Pets GROUP BY type,store Type Dog Cat Turtle Dog Cat Dog Turtle Store Miami Miami Tampa Tampa Naples Naples Naples Number Résultat avec ROLLUP Type Store Number Cat Miami 18 Cat Naples 9 Cat NULL 27 Dog Miami 12 Dog Naples 5 Dog Tampa 14 Dog NULL 31 Turtle Naples 1 Turtle Tampa 4 Turtle NULL 5 NULL NULL 63 70

71 Opérateur CUBE Syntaxe: GROUP BY [D] CUBE(D ) D et D sont des listes de dimensions d1 dn Agrégation sur tous les niveaux de regroupements par face, arrête, sommet du cube (2 n groupes) group by d 1 group by d 2 group by d 3 group by d 1, d 2 group by d 1, d 2 group by d 1, d 3 group by d 1, d n Cube partiel : moins de niveaux GROUP BY D CUBE(D ) 71

72 Exemple de CUBE SELECT Type, Store, SUM(Number) FROM Pets GROUP BY CUBE (type, store) Cat Cat Cat Dog Dog Miami Naples NULL Miami Naples Dog Tampa 14 Dog NULL 31 Turtle Naples 1 Turtle Tampa 4 Turtle NULL 5 NULL NULL 63 NULL Miami 30 NULL Naples 15 NULL Tampa 18 72

73 Extension PARTITION BY : Densification Principe Obtenir un cube sans trous. Ajouter les agrégats dont la valeur est nulle. Cube + jointure externe sur chaque dimension Syntaxe PARTITION BY D [LEFT RIGHT ] OUTER JOIN table ON pred D, table : dimensions pred : prédicat de jointure Avantages: jointure plus efficace, moins de tri. 73

74 Définitions INNER join : pour qu un n-uplet soit dans le résultat, il faut que la valeur de l attribut de jointure apparaisse dans les 2 tables. OUTER join : tous les n-uplets apparaissent dans le résultat, avec une valeur nulle pour les autres attributs lorsque les valeurs ne joignent pas. RIGHT OUTER JOIN : tous les n-uplets de la table de droite apparaissent dans le résultat. LEFT OUTER JOIN : tous les n-uplets de la table de gauche apparaissent dans le résultat. 74

75 Exemple PURCHASE (Product-id, purchase-price, time-key) PRODUCT(product-id, product-name, category) TIME(time-key, day, month, year) Q1. Vente des produits par mois SELECT t.month, p.product-name, SUM(f.purchase-price) as sales FROM PURCHASE f, TIME t, PRODUCT p WHERE f.time-key = t.time-key AND f.product-id = p.product-id GROUP BY p.product-name, t.month S il n y a eu aucune vente du produit p1 au mois de février 2005, le n-uplet ( , p1, ) n apparaîtra pas dans le résultat. Pb. Moyenne des ventes par trimestre? 75

76 Exemple (suite) On veut prendre en compte les produits non vendus certains mois, en générant un n-uplet avec la valeur 0 pour les ventes dans ce cas. Select v2.month, v1.product-name, nvl(v1.sales, 0) FROM (SELECT t.month, p.product-name, SUM(f.purchase-price) as sales FROM PURCHASE f, TIME t, PRODUCT p WHERE f.time-key = t.time-key AND f.product-id = p.product-id GROUP BY p.product-name, t.month) v1 PARTITION BY (productname) RIGHT OUTER JOIN (SELECT distinct t.month FROM TIME t) v2 ON v1.month = v2.month) 76

77 Exemple (suite) V1 : vente des produits par mois V2 : valeurs distinctes des mois PARTITION BY (product-name) : prend le résultat de V1 et partitionne par nom de produit. RIGHT OUTER JOIN : fait la jointure externe en prenant toutes les valeurs des mois (RIGHT) nvl(v1.sales, 0): insère la valeur 0 (au lieu de NULL) pour les n-uplets n ayant pas de valeur de jointure avec la table de gauche. 77

78 Extension MODEL : Principes Intuition: décrire une requête comme une feuille de calcul contenant des formules dans des cellules. Relation avec N attributs tableau à N dimensions Définir la valeur d une cellule par une formule. Formule récursive, condition d arrêt et de convergence Requête avec une nouvelle clause pour définir les formules. La nouvelle clause supporte : le partitionnement des données, mises à jour, prédicats de jointure (a=b) Simplifie l écriture des requêtes OLAP (what if, ) 78

79 Evaluation d une requête OLAP Evaluation de la nouvelle clause après les clauses select, where, group by avant order by produit une relation : l imbrication de requêtes est possible Traitement efficace de la nouvelle clause en parallèle pour chaque partition une seule structure d accès pour traiter plusieurs opérations de jointure et d union 79

80 Syntaxe d une requête OLAP SELECT FROM WHERE GROUP BY. MODEL PBY (cols) DBY (cols) MEA (cols) { <regles> * } PBY (p1, ) : partition by découpage en partitions DBY (d1, ) : dimension by : nom des dimensions MEA (m) : mesure, ensemble de valeurs: m[ ] <regles>: affectation m[prédicat] = f(m) prédicat: égalité, inégalité, logique f(m) : formule algébrique 80

81 Déroulement d une requête Mapping des colonnes vers des entités Model Country Product Year Sales Partition Dimension Dimension Measure Règles Sales(Prod1, 2002) = Sales(Prod1,2000) + Sales(Prod1,2001) Sales(Prod2, 2002) = Sales(Prod2, 2000) + Sales(Prod2, 2001) 81

82 82 Résultat Prod2 A Prod1 B Prod1 A Prod2 B Prod2 B Prod2 B Prod1 B Prod1 B Prod2 A Prod2 A Prod1 A Prod1 A Measure Dimension Dimension Partition Sales Year Product Country Données d origine Résultat des règles

83 Model : exemple 1 Relation f: table de faits Attributs région r, produit p, année a, ventes v SELECT r, p, a, v FROM f MODEL PBY (r) DBY (p, a) MEA (v) { v[p= dvd, a=2005] = v[p= dvd, a=2004] * 1.6, v[p= vcr, a=2005] = v[p= vcr, a=2003] + v[p= vcr, a=2004], v[p= tv, a=2005] = avg(v)[p= tv, 1997<a<2005] } Quelles seraient les ventes en 2005 tq: - DVD : augmentation de 60% par rapport à Caméscope : somme des ventes 2003 et TV: moyenne de 1998 à

84 Model : exemple 2 Utilisation de la fonction cv() : current value MODEL DBY (r, p, a) MEA (v) { v[ ouest', *, a>2001] = 1.2*v[cv(r), cv(p), a=cv(t)-1] } Quelles seraient les ventes, après 2001, de tous les produits de la région Ouest, telles que : l augmentation annuelle pour chaque produit soit de 20% 84

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP

Plus en détail

ENTREPÔTS DE DONNEES ARCHITECTURE ET FONCTIONNALITES. Besoin d'intégration de données. Sommaire

ENTREPÔTS DE DONNEES ARCHITECTURE ET FONCTIONNALITES. Besoin d'intégration de données. Sommaire Sommaire ENTREPÔTS DE DONNEES ARCHITECTURE ET FONCTIONNALITES Mokrane Bouzeghoub http://www.prism.uvsq.fr Notions de SI opérationnel et de SI décisionnel Architecture d un entrepôt de données Différents

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Bases de Données OLAP

Bases de Données OLAP Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Le Langage SQL version Oracle

Le Langage SQL version Oracle Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI anis.bach@isg.rnu.tn

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

1 Introduction et installation

1 Introduction et installation TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on

Plus en détail

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création Construction d un EDD avec SQL 2008 R2 Plan Analyse du DW construit Construction de la base DW dans SQL 2008 Construction des tables de faits et dimensions Injection des données Étapes de l injection des

Plus en détail

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Langage SQL : créer et interroger une base

Langage SQL : créer et interroger une base Langage SQL : créer et interroger une base Dans ce chapitre, nous revenons sur les principales requêtes de création de table et d accès aux données. Nous verrons aussi quelques fonctions d agrégation (MAX,

Plus en détail

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications

Plus en détail

Techniques d optimisation des requêtes dans les data warehouses

Techniques d optimisation des requêtes dans les data warehouses Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

A QUOI SERVENT LES BASES DE DONNÉES?

A QUOI SERVENT LES BASES DE DONNÉES? BASE DE DONNÉES OBJET Virginie Sans virginie.sans@irisa.fr A QUOI SERVENT LES BASES DE DONNÉES? Stockage des informations : sur un support informatique pendant une longue période de taille importante accès

Plus en détail

Fouille de Données : OLAP & Data Warehousing

Fouille de Données : OLAP & Data Warehousing Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de

Plus en détail

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES Dossier G11 - Interroger une base de données La base de données Facturation contient tout un ensemble d'informations concernant la facturation de la SAFPB (société anonyme de fabrication de produits de

Plus en détail

14/04/2014. un ensemble d'informations sur un sujet : exhaustif, non redondant, structuré, persistant. Gaëlle PERRIN SID2 Grenoble.

14/04/2014. un ensemble d'informations sur un sujet : exhaustif, non redondant, structuré, persistant. Gaëlle PERRIN SID2 Grenoble. Gaëlle PERRIN SID2 Grenoble Le 10/04/2014 Base de Données (BD) : une grande quantité de données, centralisées ou non, servant pour les besoins d'une ou plusieurs applications, interrogeables et modifiables

Plus en détail

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes Langage SQL (1) Sébastien Limet Denys Duchier IUT Orléans 4 septembre 2007 Notions de base qu est-ce qu une base de données? SGBD différents type de bases de données quelques systèmes existants Définition

Plus en détail

Entrepôt de données : Extensions du langage SQL (SQL-3/SQL-99) pour lʼolap (7.1)

Entrepôt de données : Extensions du langage SQL (SQL-3/SQL-99) pour lʼolap (7.1) Entrepôt de données : Extensions du langage SQL (SQL-3/SQL-99) pour lʼolap (7.1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Plan 1. Evolution

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

Cours: Les Jointures 1

Cours: Les Jointures 1 Bases de Données Avancées Module A IUT Lumière, License CE-STAT 2006-2007 Pierre Parrend Cours: Les Jointures 1 Plan Table of Contents Principe...1 Example...1 Types de Jointures...2 Définitions et examples...2

Plus en détail

Les bases de données

Les bases de données Les bases de données Introduction aux fonctions de tableur et logiciels ou langages spécialisés (MS-Access, Base, SQL ) Yves Roggeman Boulevard du Triomphe CP 212 B-1050 Bruxelles (Belgium) Idée intuitive

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

Bases de données et sites WEB Licence d informatique LI345

Bases de données et sites WEB Licence d informatique LI345 Bases de données et sites WEB Licence d informatique LI345 Anne Doucet Anne.Doucet@lip6.fr http://www-bd.lip6.fr/ens/li345-2013/index.php/lescours 1 Contenu Transactions en pratique Modèle relationnel-objet

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

SQL Historique 1982 1986 1992

SQL Historique 1982 1986 1992 SQL Historique 1950-1960: gestion par simple fichier texte 1960: COBOL (début de notion de base de données) 1968: premier produit de sgbdr structuré (IBM -> IDMS) 1970-74: élaboration de l'outil d'analyse

Plus en détail

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ;

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ; RÈGLES A SUIVRE POUR OPTIMISER LES REQUÊTES SQL Le but de ce rapport est d énumérer quelques règles pratiques à appliquer dans l élaboration des requêtes. Il permettra de comprendre pourquoi certaines

Plus en détail

NFA 008. Introduction à NoSQL et MongoDB 25/05/2013

NFA 008. Introduction à NoSQL et MongoDB 25/05/2013 NFA 008 Introduction à NoSQL et MongoDB 25/05/2013 1 NoSQL, c'est à dire? Les bases de données NoSQL restent des bases de données mais on met l'accent sur L'aspect NON-relationnel L'architecture distribuée

Plus en détail

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions Exemple accessible via une interface Web Une base de données consultable en ligne : Bases de données et systèmes de gestion de bases de données The Trans-atlantic slave trade database: http://www.slavevoyages.org/tast/index.faces

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2 SQL Sommaire : COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2 COMMANDES DE MANIPULATION DE DONNEES... 2 COMMANDES DE CONTROLE TRANSACTIONNEL... 2 COMMANDES DE REQUETE DE DONNEES... 2 COMMANDES

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

Systèmes de Gestion de Bases de Données

Systèmes de Gestion de Bases de Données Systèmes de Gestion de Bases de Données Luiz Angelo STEFFENEL DUT Informatique 2ème année IUT Nancy Charlemagne Vues Vue : une table virtuelle de la base de données dont le contenu est défini par une requête

Plus en détail

Optimisation SQL. Quelques règles de bases

Optimisation SQL. Quelques règles de bases Optimisation SQL Quelques règles de bases Optimisation des ordres SQL Page 2 1. QUELQUES RÈGLES DE BASE POUR DES ORDRES SQL OPTIMISÉS...3 1.1 INTRODUCTION...3 1.2 L OPTIMISEUR ORACLE...3 1.3 OPTIMISEUR

Plus en détail

A QUOI SERVENT LES BASES DE DONNÉES?

A QUOI SERVENT LES BASES DE DONNÉES? BASE DE DONNÉES OBJET Virginie Sans virginie.sans@irisa.fr A QUOI SERVENT LES BASES DE DONNÉES? Stockage des informations : sur un support informatique pendant une longue période de taille importante accès

Plus en détail

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation

Plus en détail

Introduction aux outils BI de SQL Server 2014. Création de cubes dans SQL Server Analysis Services (SSAS)

Introduction aux outils BI de SQL Server 2014. Création de cubes dans SQL Server Analysis Services (SSAS) MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Création de cubes dans SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

I4 : Bases de Données

I4 : Bases de Données I4 : Bases de Données Passage de UML au modèle relationnel Georges LOUIS Département Réseaux et Télécommunications Université de La Rochelle Module I4 2008-2009 1 G.Louis Sommaire 1 Des classes aux tables

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse Pascale Borla-Salamet Consultante Avant Vente Oracle France Oracle Exadata Performance et Optimisation de votre Datawarehouse Agenda Les nouveaux challenges Exadata Storage Server Oracle Database Machine

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 10 Introduction à MDX 10.1. Présentation de la semaine Tout comme le modèle relationnel utilise SQL comme langage, le modèle OLAP utilise le

Plus en détail

Bases de données cours 4 Construction de requêtes en SQL. Catalin Dima

Bases de données cours 4 Construction de requêtes en SQL. Catalin Dima Bases de données cours 4 Construction de requêtes en SQL Catalin Dima Requêtes SQL et langage naturel Énoncés en langage naturel. Traduction en SQL? Correspondance entre syntagmes/phrases et opérations

Plus en détail

16H Cours / 18H TD / 20H TP

16H Cours / 18H TD / 20H TP INTRODUCTION AUX BASES DE DONNEES 16H Cours / 18H TD / 20H TP 1. INTRODUCTION Des Fichiers aux Bases de Données 2. SYSTEME DE GESTION DE BASE DE DONNEES 2.1. INTRODUCTION AUX SYSTEMES DE GESTION DE BASES

Plus en détail

Bases de données relationnelles

Bases de données relationnelles Bases de données relationnelles Système de Gestion de Bases de Données Une base de données est un ensemble de données mémorisé par un ordinateur, organisé selon un modèle et accessible à de nombreuses

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

BD51 BUSINESS INTELLIGENCE & DATA WAREHOUSE

BD51 BUSINESS INTELLIGENCE & DATA WAREHOUSE BD51 BUSINESS INTELLIGENCE & DATA WAREHOUSE Document de synthèse de projet Développement d un système décisionnel pour la gestion des ventes par magasin pour la base de données EMODE. VINCENT Jérémy Roussel

Plus en détail

Chapitre 1. 1. Introduction : Notion de Bases de données. 2. Définition : BD Répartie. 3. Architecture des SGBD. 4. Conception des bases réparties

Chapitre 1. 1. Introduction : Notion de Bases de données. 2. Définition : BD Répartie. 3. Architecture des SGBD. 4. Conception des bases réparties Université du Havre MASTER MATHÉMATIQUES ET INFORMATIQUE-Option SIRES 2010/2011 COURS BASES DE DONNEES REPARTIES Nakechbandi M., LITIS, Email : nakech@free.fr Chapitre 1 1. Introduction : Notion de Bases

Plus en détail

Les entrepôts de données et l analyse de données

Les entrepôts de données et l analyse de données LOG660 - Bases de données de haute performance Les entrepôts de données et l analyse de données Quelques définitions Entreposage de données (data warehousing): «La copie périodique et coordonnée de données

Plus en détail

Cours 4 : Agrégats et GROUP BY

Cours 4 : Agrégats et GROUP BY Cours 4 : Agrégats et GROUP BY Agrégat Fonction qui effectue un calcul sur l ensemble des valeurs d un attribut pour un groupe de lignes Utilisation dans une clause SELECT ou dans une clause HAVING 3 types

Plus en détail

Nouveautés. Microsoft Dynamics NAV 2015

Nouveautés. Microsoft Dynamics NAV 2015 Microsoft Dynamics NAV 2015 Nouveautés Microsoft Dynamics NAV est un logiciel de gestion, rapide à mettre en œuvre, simple à utiliser et à la hauteur de vos ambitions commerciales Rapide à déployer >Implémentation

Plus en détail

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ... Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média

Plus en détail

Nouveautés CRM 2015 & Migration. By Tanguy Touzard MVP CRM

Nouveautés CRM 2015 & Migration. By Tanguy Touzard MVP CRM Nouveautés CRM 2015 & Migration By Tanguy Touzard MVP CRM Nouvelles fonctionnalités Sécurité Recherche Hiérarchies Champs calculés/agrégés Règles métier Processus métier Catalogue produit SLA Information

Plus en détail

BD et XML : Exercices

BD et XML : Exercices BD et XML : Exercices 1 Stockage XML Voici un arbre XML : A B E C F C F C F D C C D D D 1.1 Stockage générique Exercice 1.1.1 : Définissez un schéma de stockage relationnel générique (sans prendre en compte

Plus en détail

OpenPaaS Le réseau social d'entreprise

OpenPaaS Le réseau social d'entreprise OpenPaaS Le réseau social d'entreprise Spécification des API datastore SP L2.3.1 Diffusion : Institut MinesTélécom, Télécom SudParis 1 / 12 1OpenPaaS DataBase API : ODBAPI...3 1.1Comparaison des concepts...3

Plus en détail

FreeAnalysis. Schema Designer. Cubes

FreeAnalysis. Schema Designer. Cubes FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

TD n 10 : Ma première Base de Données

TD n 10 : Ma première Base de Données TD n 10 : Ma première Base de Données 4 heures Rédigé par Pascal Delahaye 11 mars 2015 Le but de ce TD est de découvrirles principales fonctions d OpenOffice Base, le systèmede gestion de bases de données

Plus en détail

Bases de Données relationnelles et leurs systèmes de Gestion

Bases de Données relationnelles et leurs systèmes de Gestion III.1- Définition de schémas Bases de Données relationnelles et leurs systèmes de Gestion RAPPELS Contraintes d intégrité sous Oracle Notion de vue Typage des attributs Contrainte d intégrité Intra-relation

Plus en détail

TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza

TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza Ce TP s appuie sur le tutorial de prise en main de Oracle Warehouse Builder, que vous pouvez trouver en anglais sur

Plus en détail

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR 2014/2015 Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : ANOUAR OUFQIR MME L.LAMRINI SMARTSIR Table des matières Introduction... 2 Choix de l outil pour

Plus en détail

Plan Général Prévisionnel (1/2) (non contractuel) Internet et Outils L1/IO2 2006-2007 S2-IO2 Bases de données: Jointures, Transactions

Plan Général Prévisionnel (1/2) (non contractuel) Internet et Outils L1/IO2 2006-2007 S2-IO2 Bases de données: Jointures, Transactions Général Prévisionnel (1/2) (non contractuel) Internet et Outils L1/IO2 2006-2007 S2-IO2 Bases de données: Jointures, Cours Internet et Outils: [1/12] Intro, Internet, Web, XHTML (2H) [2/12] XHTML(2H) [3/12]

Plus en détail

TP Bases de données réparties

TP Bases de données réparties page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure

Plus en détail

Bases de données réparties: Fragmentation et allocation

Bases de données réparties: Fragmentation et allocation Pourquoi une base de données distribuée? Bibliographie Patrick Valduriez, S. Ceri, Guiseppe Delagatti Bases de données réparties: Fragmentation et allocation 1 - Introduction inventés à la fin des années

Plus en détail

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE Cas Neptune hôtel Base de données et langage SQL Propriété Intitulé long Formation concernée Matière Notions Transversalité Présentation Description Neptune Hôtel. L interrogation d une base de données

Plus en détail

Module BDR Master d Informatique (SAR)

Module BDR Master d Informatique (SAR) Module BDR Master d Informatique (SAR) Cours 6- Bases de données réparties Anne Doucet Anne.Doucet@lip6.fr 1 Bases de Données Réparties Définition Conception Décomposition Fragmentation horizontale et

Plus en détail

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features SWISS ORACLE US ER GRO UP www.soug.ch Newsletter 5/2014 Sonderausgabe OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features 42 TIPS&TECHNIQUES Alexandre Tacchini, Benjamin Gaillard, Fabien

Plus en détail

Le langage SQL pour Oracle - partie 1 : SQL comme LDD

Le langage SQL pour Oracle - partie 1 : SQL comme LDD Le langage SQL pour Oracle - partie 1 : SQL comme LDD 1 SQL : Introduction SQL : Structured Query Langage langage de gestion de bases de donn ees relationnelles pour Définir les données (LDD) interroger

Plus en détail

Compétences Business Objects - 2014

Compétences Business Objects - 2014 Compétences Business Objects - 2014 «Mars-Juin 2014. Réf : Version 1 Page 1 sur 34 Sommaire CONTEXTE DE LA REMISE A NIVEAU EN AUTOFORMATION... 3 1. MODELISATION... 4 1.1 DESCRIPTION FONCTIONNEL DE L'APPLICATION

Plus en détail

SQL Serveur 2012+ Programme de formation. France Belgique Suisse - Canada. Formez vos salariés pour optimiser la productivité de votre entreprise

SQL Serveur 2012+ Programme de formation. France Belgique Suisse - Canada. Formez vos salariés pour optimiser la productivité de votre entreprise SQL Serveur 2012+ Programme de formation France Belgique Suisse - Canada Microsoft Partner Formez vos salariés pour optimiser la productivité de votre entreprise Dernière mise à jour le : Avril 2014 Des

Plus en détail

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception

Plus en détail

L information et la technologie de l informationl

L information et la technologie de l informationl L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements

Plus en détail

Atelier : créer et visualiser vos contenus BIRT Matériel de formation. Journée BIRT 22 mai 2012

Atelier : créer et visualiser vos contenus BIRT Matériel de formation. Journée BIRT 22 mai 2012 Atelier : créer et visualiser vos contenus BIRT Matériel de formation Journée BIRT 22 mai 2012 A la découverte de BIRT BIRT qui signifie Business Intelligence and Reporting Tools est un projet de la Fondation

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

8. Gestionnaire de budgets

8. Gestionnaire de budgets 8. Gestionnaire de budgets 8.1 Introduction Le Gestionnaire de budgets (Budget Workbench) permet aux utilisateurs de travailler sur les données budgétaires qu ils ont importées sur leur station de travail

Plus en détail

Introduction à Business Objects. J. Akoka I. Wattiau

Introduction à Business Objects. J. Akoka I. Wattiau Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Bases de Données. Plan

Bases de Données. Plan Université Mohammed V- Agdal Ecole Mohammadia d'ingénieurs Rabat Bases de Données Mr N.EL FADDOULI 2014-2015 Plan Généralités: Définition de Bases de Données Le modèle relationnel Algèbre relationnelle

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Entrepôt de données et l Analyse en ligne Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Déroulement du cours 17 janvier : cours et TD 20 janvier : cours?

Plus en détail

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE I N T E RS Y S T E M S INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE David Kaaret InterSystems Corporation INTERSySTEMS CAChé CoMME ALTERNATIvE AUx BASES de données RéSIdENTES

Plus en détail

Bases de données cours 1

Bases de données cours 1 Bases de données cours 1 Introduction Catalin Dima Objectifs du cours Modèle relationnel et logique des bases de données. Langage SQL. Conception de bases de données. SQL et PHP. Cours essentiel pour votre

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail