Rejoignez la Communauté



Documents pareils
BI = Business Intelligence Master Data-ScienceCours 3 - Data

Introduction à la B.I. Avec SQL Server 2008

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

SQL SERVER 2008, BUSINESS INTELLIGENCE

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Entrepôt de données 1. Introduction

Les entrepôts de données

Les Entrepôts de Données. (Data Warehouses)

Evry - M2 MIAGE Entrepôt de données

LES ENTREPOTS DE DONNEES

Evry - M2 MIAGE Entrepôts de Données

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Titre : La BI vue par l intégrateur Orange

SQL Server SQL Server Implémentation d une solution. Implémentation d une solution de Business Intelligence.

Les Entrepôts de Données

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

palais des congrès Paris 7, 8 et 9 février 2012

Entrepôt de Données. Jean-François Desnos. ED JFD 1

Urbanisation des SI-NFE107

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

La problématique. La philosophie ' ) * )

QU EST-CE QUE LE DECISIONNEL?

et les Systèmes Multidimensionnels

Business Intelligence avec SQL Server 2012

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Business Intelligence : Informatique Décisionnelle

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Bases de Données Avancées

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

NF26 Data warehouse et Outils Décisionnels Printemps 2010

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

HADOOP ET SON ÉCOSYSTÈME

Introduction au domaine du décisionnel et aux data warehouses

Présentation Windows Azure Hadoop Big Data - BI

L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

DEMARREZ RAPIDEMENT VOTRE EVALUATION

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Business Intelligence Reporting

HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.

Les journées SQL Server 2013

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Business Intelligence avec SQL Server 2012

COMMENT CHOISIR SA SOLUTION DÉCISIONNELLE. Partie 2 : Des modèles à l analyse

Théories de la Business Intelligence

Décisionnel & Reporting

BI2B est un cabinet de conseil expert en Corporate Performance Management QUI SOMMES-NOUS?

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

Ici, le titre de la. Tableaux de bords de conférence

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Cabinet Conseil en Intelligence d Affaires. L'Intégration de données et la Qualité des données dans l'écosystème BI actuel et future

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Méthodologie de conceptualisation BI

Le cycle de vie d'un projet en intelligence d'affaires

Domaines d intervention

Département Génie Informatique

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

SWISS ORACLE US ER GRO UP. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

Solutions IT pour libérer le potentiel de votre Business

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Technologie data distribution Cas d usage.

BIG DATA et DONNéES SEO

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

La place de la Géomatique Décisionnelle dans le processus de décision

Chapitre 9 : Informatique décisionnelle

L information et la technologie de l informationl

Introduction aux outils BI de SQL Server Tutoriel sur SQL Server Integration Services (SSIS)

Big Data On Line Analytics

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Accélérer l agilité de votre site de e-commerce. Cas client

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Business Intelligence simple et efficace avec Excel et PowerPivot

NFA 008. Introduction à NoSQL et MongoDB 25/05/2013

BI = Business Intelligence Master Data-Science

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Bases de Données OLAP

Architecture des entrepôts de données

Les entrepôts de données et l analyse de données

Présentation du module Base de données spatio-temporelles

Intelligence Economique - Business Intelligence

25/01/05 TD Entrepôt de données IHS / Master ICA

Business Intelligence

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Analyse comparative entre différents outils de BI (Business Intelligence) :

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

SQL Server 2012 et SQL Server 2014

PROGICIELS DE GESTION INTÉGRÉS SOLUTIONS DE REPORTING

Curriculum Vitae. GISBERT Aurélien Ingénieur Informatique INSA Senior Business & Data Analyst Business Intelligence 11 ans d expérience

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Business Intelligence avec Excel, Power BI et Office 365

Transcription:

Rejoignez la Communauté

MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 2

MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 3

QUI SOMMES NOUS? Jean-Pierre Riehl Pratice Manager SQL Azeo MVP SQL Server 5+ années sur le décisionnel Microsoft Blog : http://blog.djeepy1.net Florian Eiden Architecte Décisionnel - MCNEXT 5+ années sur le décisionnel Microsoft Blog : http://www.fleid.fr

MCNEXT (ESPACE PARTENAIRE) En Bref o 100% Microsoft o 150 collaborateurs / 40% de croissance o 4 pôles : BI, SharePoint,.NET, BizTalk o Présent à Paris, Lyon et Genève Pôle décisionnel reconnu par Microsoft o Certifié «Gold Décisionnel» o Sélectionné dans le programme METRO - SQL Server 2012 Expertise technique forte sur la Suite décisionnelle (SQL Server : SSIS, SSAS, SSRS; PowerPivot, MDS ) Accompagnement global omaîtrise d ouvrage / Maitrise d œuvre 5

Jean-Pierre Riehl Responsable Practice SQL http://blog.djeepy1.net MVP SQL Server MCITP : Business Intelligence Developer 2008 MCITP : Database Administrator 2008 MCPD : Enterprise Application Pure-Player sur l expertise Microsoft Practice Collaboration Practice SQL (Business Intelligence-Data Management) Practice Infrastructure Practice Développement http://www.azeo.com 6

POURQUOI CETTE PRÉSENTATION Compétences Techniques SQL SSIS SSAS SSRS MDX? Finance RH Retail BTP Transport Compétences Métier

AGENDA 1. Modélisation dimensionnelle 2. Concepts avancés

OBJECTIFS DU DÉCISIONNEL Tout commence dans le monde applicatif

1 ER BESOIN MÉTIER

BESOIN : HISTORISATION

2 ÈME BESOIN MÉTIER

BESOIN : CENTRALISATION

3 ÈME BESOIN MÉTIER

BESOIN : ANALYSER

LE DATAWAREHOUSE

5 ÉTAPES POUR 3 BESOINS Préparation Extraction Nettoyage Stockage Archivage Historisation Présentation Analyse Reporting 17

LES ÉTAPES DU DÉCISIONNEL Extraction Nettoyage

LES ÉTAPES DU DÉCISIONNEL Extraction Nettoyage Stockage Analyse

LES ÉTAPES DU DÉCISIONNEL Reporting Extraction Nettoyage Stockage Analyse

MÉTAPHORE DU RESTAURANT Préparation : Cuisine Objectifs : préparer, transformer Caractéristiques : rigueur, constance Présentation : Salle à manger Objectif : consommer Caractéristiques : beau et bon Source : http://www.kimballgroup.com/html/articles_search/articles2004/0401ie.html?trkid=ie200401 21

APPROCHES ACADÉMIQUES

LES APPROCHES ACADÉMIQUES Les 2 grandes philosophies actuelles Kimball Inmon Processus Bottom-Up Top-Down Organisation Datamarts Datawarehouse Schématisation Etoile Flocon Une méthode alternative : Data Vault

PROCESSUS Que chacun construise ce qu il veut, on intégrera ce qu il faudra quand il faudra! On ne fait rien tant que tout n est pas désigné, le datawarehouse doit être exhaustif! Ralph Kimball Kimball Group www.kimballgroup.com Bill Inmon Corporate Information Factory www.inmoncif.com

INMON : TOP DOWN Allez les gars, focus, on y met quoi dans ce machin? Et hop! Les ventes! Les achats! Le stock! La RH! 25

KIMBALL: BOTTOM UP Bon Alfred tu veux quoi? Les ventes! Et hop! Et toi Bob tu veux quoi? Le stock! Et hop! 26

LE POINT COMMUN? Allez les gars, focus, on y met quoi dans ce machin? Bon Alfred tu veux quoi? Et pas : Hum, voyons ce qu il y a là dedans

ORGANISATION : INMON Datamarts Zone de préparation (Staging) Datawarehouse

ORGANISATION : KIMBALL Zone de préparation (Staging) Bus Datamarts Datawarehouse

LA MINUTE HYPE

LES TENDANCES Big Data HADOOP : Framework de stockage parallèle de données massives et pas forcément structurées HIVE : Framework de requêtage SQL sur HADOOP Limité, Design to Fail, peu d outils Mais des données à prendre en compte NoSQL «Not Only SQL» Corollaire du Big Data Microsoft est dans la course et des solutions arrivent

LA SCHÉMATISATION

LE DÉCISIONNEL EN 3 MOTS 1 : La mesure

LE DÉCISIONNEL EN 3 MOTS 2 : Les dimensions

LE DÉCISIONNEL EN 3 MOTS 3 : Les faits Fact Fait Fakt Factum : Acte, événement Il s est passé quelque chose, et on l a mesuré selon notre référentiel, nos dimensions

ON RANGE Un fait, c est une ligne, dans une table de faits Table de Faits Il s'est passé quelque chose Il s'est passé autre chose Il s'est passé quelque chose d'autre

ON ORDONNE Les dimensions donnent le contexte du fait Table de Faits Quand Où Hier Ici Il s'est passé quelque chose Hier Là bas Il s'est passé autre chose Aujourd'hui Ici Il s'est passé quelque chose d'autre

ON COMPTE Les mesures donnent les valeurs numériques du fait Table de Faits : Ventes Date Magasin Produit Combien Prix Unitaire ( ) Hier AGY Jouet 3 10 Hier BGH Saucisson 2 2,5 Aujourd'hui AAZ Parapluie 5 5

PROBLÉMATIQUE Mes dimensions ont des attributs Hier odate : 12/12/2011 ojour : Lundi ojour de la semaine : 1er omois : Décembre otrimestre : 4ème oannée : 2011 o Mes dimensions sont réutilisables Mêmes produits à l achat, la vente et l inventaire!

SOLUTION Chaque dimension devient une table Dimension Temps Dimension Magasin Table de Faits Dimension Produit

PREMIER ÉLÉMENT DE DESIGN Dimension Temps Id Temps Jour Mois Année 20111212 12/12/2011 Décembre 2012 20111213 13/12/2011 Décembre 2012 Dimension Magasin Id Magasin Code Magasin Région 22 AAZ Ile de France 35 AGY Ile de France 56 BGH Lorraine Table de Faits : Ventes Id Temps Id Magasin Id Produit Quantité Prix Unitaire ( ) 20111212 35 5 3 10 20111212 56 8 2 25 20111212 22 12 5 5 20111212 35 5 1 10 20111213 56 5 6 15 20111213 56 8 7 20 20111213 22 12 2 5 Dimension Magasin Id Produit Code Produit Nom Catégorie 5 Z947342983 Lapin Malin Jouet 8 Z238943135 Saucisson sec Alimentaire 12 E238953123 Parapluie Accessoire

PROBLÉMATIQUE Un magasin a des attributs uniques Un code Un nom Une adresse Il a aussi des attributs communs à d autres Région Pays Catégorie Enseigne

ATTRIBUTS PARTAGÉS Premier réflexe : Dimension Magasin Id Magasin Code Magasin Région Pays 22 AAZ Ile de France France 35 AGY Ile de France France 56 BGH Lorraine France 67 BHJ Lorraine France 78 BKJ Lorraine France 79 BKL Alsace France 95 ZDE Hérault France 96 ZRT Hérault France 105 ZYU Hérault France Oui mais mon dba n aime pas quand je répète: Standard des bases de données : Normalisation 3NF!

NORMALISATION Dimension normalisée Dimension Magasin N1 Id Magasin N1 Code Magasin Id Magasin N2 22 AAZ 1 35 AGY 1 56 BGH 5 67 BHJ 5 78 BKJ 5 79 BKL 6 95 ZDE 21 96 ZRT 21 105 ZYU 21 Dimension Magasin N2 Id Magasin N2 Région Id Magasin N3 1 Ile de France 1 5 Lorraine 1 6 Alsace 1 21 Hérault 1 Dimension Magasin N3 Id Magasin N3 Pays 1 France 2 Allemagne Cette question, c est Flocon vs Etoile! 1 table par niveau de hiérarchie? 1 table par dimension?

KIMBALL : SCHÉMA EN ÉTOILE Table de Dimension Table de Dimension Table de Dimension Table de Faits Table de Dimension Table de Dimension

INMON : SCHÉMA EN FLOCON Table de Dimension Table de Dimension Table de Dimension Table de Dimension Table de Dimension Table de Faits Table de Dimension Table de Dimension Table de Dimension Table de Dimension Table de Dimension Table de Dimension

SCHÉMATISATION Etoile DimOrganisation ID Orga Niveau 3 Orga Niveau 2 Orga Niveau 1 1 Paris France Europe 2 Lyon France Europe 3 Berlin Allemagne Europe Flocon DimOrganisationN3 ID Orga Niveau 3 ID Orga N2 1 Paris 26 2 Lyon 26 3 Berlin 87 Avantage : lisibilité et performance des requêtes SELECT [Orga Niveau 3],[Orga Niveau 2],[Orga Niveau 1] FROM DimOrganisation DimOrganisationN2 ID Orga Niveau 2 ID Orga N1 26 France 2 87 Allemagne 2 DimOrganisationN1 ID Orga Niveau 1 2 Europe Avantage : Espace disque Avantage : Performance des updates 47

ETOILE OU FLOCON? Etoile! Plus simple à alimenter et maintenir Les outils Microsoft ont une sensibilité Kimball Notez la ressemblance 48

QUAND FLOCONNER? Si on préfère les flocons aux étoiles Mieux vaut jouer avec des outils qu on aime!

QUAND FLOCONNER? Si on est en étoile : Des faits arrivent à différents niveaux de la même dimension Objectifs Ventes Régions Magasins Hiérarchies de la même dimension qui peuvent agréger sur des membres supérieurs différents Catégorie Famille Produit Marque Collaborateurs Niveaux fins différents pour une même dimension Source 1 Source 2 http://road-blogs.blogspot.com/2011/05/when-and-how-to-snowflake-dimension.html

SCHÉMATISATION Data Vault Hubs Links Satellites

LE PROCESSUS DE MODÉLISATION

PROCESSUS DE MODÉLISATION Sponsor 1 2 3 4 0 : Le sponsor Identifier l utilisateur, celui qui sait, celui a le dernier mot, sinon ça ne sert à rien 53

Sponsor Quoi 2 3 4 1 : On modélise quoi? Quel processus métier? > Quel acte est mesuré? Une transaction? oune vente, une commande, un voyage Un stock? oun inventaire, une position financière

Sponsor Quoi Grain 3 4 2 : Déclarer le grain > Que représente la ligne dans la table de fait? o1 ligne d un ticket de caisse? ole total du ticket de caisse? ole stock en fin de semaine du magasin? Dans notre cas : comment considère t on le «où»: odans un rack? odans une rangée? odans l entrepôt de quel magasin? 55

Sponsor Quoi Grain Axes 4 3 : Choisir les dimensions qui s appliquent Réutiliser les dimensions disponibles Date Produit Magasin Entrepôt Fournisseur Promotion Forecasting x x x Achats x x x x Commandes x x x x Livraisons x x x Inventaire en Magasin : odate oproduit omagasin

Sponsor Quoi Grain Axes Mesures 4 : Identifier les mesures Attention aux unités odevise ométrique oconteneur Palette? Carton? Unité?

PREMIER DATAMART Inventaire en magasin Dimension Date Clé Date Date Jour de la semaine Dimension Produit Clé Produit Description du Produit Code Produit Code Marque Libellé Marque Taille Poids Instantané de stock Clé Date Clé Produit Clé Magasin Quantité Disponible Dimension Dimension Dimension Mesure Dimension Magasin Clé Magasin Nom du Magasin N du Magasin Région Commerciale 58

DEUXIÈME DATAMART Ventes dans le magasin Dimension Date Clé Date Date Jour de la semaine Dimension Produit Clé Produit Description du Produit Code Produit Code Marque Libellé Marque Taille Poids Fait de transaction Clé Date Dimension Clé Produit Dimension Clé Magasin Dimension Clé Promotion Dimension Numéro de Transaction Dim. Dégénérée Quantité Vendue Mesure Prix de Vente Unitaire Mesure Coût Unitaire Mesure Marge Brute Totale Mesure Dimension Magasin Clé Magasin Nom du Magasin N du Magasin Région Commerciale Dimension Promotion Clé Promotion Nom de la Promotion Type de Réduction Date de début Date de fin Type de Coupon 59

EXEMPLES FONCTIONNELS Et hop, un datawarehouse! Ah ça c est bien rangé! Et c est propre! Dimension Date Clé Date Date Jour de la semaine Dimension Produit Clé Produit Description du Produit Code Produit Code Marque Libellé Marque Taille Poids Instantané de stock Clé Date Dimension Clé Produit Dimension Clé Magasin Dimension Quantité Disponible Mesure Fait de transaction Clé Date Dimension Clé Produit Dimension Clé Magasin Dimension Clé Promotion Dimension Numéro de Transaction Dim. Dégénérée Quantité Vendue Mesure Prix de Vente Unitaire Mesure Coût Unitaire Mesure Marge Brute Totale Mesure Dimension Magasin Clé Magasin Nom du Magasin N du Magasin Région Commerciale Dimension Promotion Clé Promotion Nom de la Promotion Type de Réduction Date de début Date de fin Type de Coupon 60

IMPLÉMENTATION DANS SQL SERVER

SQL SERVER 2012 Trois moteurs pour modéliser Capacité de modélisation des technologies Microsoft Etoile Flocon Data Vault SQL Server Moteur Relationnel 5/5 5/5 5/5 BISM Multidimensionnel (SSAS) 5/5 4/5 0/5 BISM Tabular (PowerPivot) 5/5 4/5 2/5

AGENDA 1. Modélisation dimensionnelle 2. Concepts avancés

CONCEPTS AVANCÉS Gestion des NULL Semi-additivité Pondération Distinct Count Gestion des devises Temporal Snapshot SCD Surrogate Keys Factless Tables Junk Dimension Ragged Hierarchies Many-to-Many Sécurité dynamique

SCD : SLOWLY CHANGING DIMENSIONS Besoin Les dimensions ne sont pas immuables : les attributs peuvent changer Dimensions à évolution lente 3 Techniques o Type 1 : On écrase Clé Produit Code Produit Nom Rayon 29 AA-56 Lapin Malin Jouet UPDATE DimProduit SET Clé Produit Code Produit Nom Rayon 29 AA-56 Lapin Malin Boucherie 2 types de clefs o Naturelle / Business, c est le code que comprend le métier o Technique /«Surrogate», c est une clef propre au DWH qui ne doit jamais apparaître sur un rapport Le type de SCD est un attribut de colonne, pas de dimension, ici c est le rayon 66

SCD : SLOWLY CHANGING DIMENSIONS Dimensions à évolution lente 3 Techniques o Type 2 : Nouvelle ligne Clé Produit Code Produit Nom Rayon Date Début Date Fin 29 AA-56 Lapin Malin Jouet 01/01/2010 (NULL) UPDATE DimProduit SET INSERT INTO DimProduit Clé Produit Code Produit Nom Rayon Date Début Date Fin 29 AA-56 Lapin Malin Jouet 01/01/2010 31/03/2011 35 AA-56 Lapin Malin Boucherie 01/04/2011 (NULL) 67

SCD : SLOWLY CHANGING DIMENSIONS Dimensions à évolution lente 3 Techniques o Type 2 : Nouvelle ligne ETL Clé Produit Code Produit Nom Rayon Date Début Date Fin 29 AA-56 Lapin Malin Jouet 01/01/2010 31/03/2011 35 AA-56 Lapin Malin Boucherie 01/04/2011 (NULL) Lookup sur Code Produit ET Date des données Instantané de stock Clé Date du Stock Clé Produit Quantité 28/02/2011 29 8 31/03/2011 29 7 30/04/2011 35 6 31/05/2011 35 9 68

SCD : SLOWLY CHANGING DIMENSIONS Dimensions à évolution lente 3 Techniques o Type 2 : Nouvelle ligne Clé Produit Code Produit Nom Rayon Date Début Date Fin 29 AA-56 Lapin Malin Jouet 01/01/2010 31/03/2011 35 AA-56 Lapin Malin Boucherie 01/04/2011 (NULL) Instantané de stock Clé Date du Stock Clé Produit Quantité 28/02/2011 29 8 31/03/2011 29 7 30/04/2011 35 6 31/05/2011 35 9 Somme de Quantité Étiquettes de colonnes Étiquettes de lignes 02 Février 03 Mars 04 Avril 05 Mai Total général Boucherie 6 9 15 Lapin Malin 6 9 15 Jouet 8 7 15 Lapin Malin 8 7 15 Total général 8 7 6 9 30 69

SCD : SLOWLY CHANGING DIMENSIONS Dimensions à évolution lente 3 Techniques o Type 3 : Nouvelle colonne Clé Produit Code Produit Nom Rayon Actuel Ancien Rayon 29 AA-56 Lapin Malin Jouet (NULL) UPDATE DimProduit SET Clé Produit Code Produit Nom Rayon Actuel Ancien Rayon 29 AA-56 Lapin Malin Boucherie Jouet o Et les hybrides Clé Produit Code Produit Nom Rayon Ancien Rayon Date Début Date Fin 29 AA-56 Lapin Malin Jouet (NULL) 01/01/2010 31/03/2011 35 AA-56 Lapin Malin Boucherie Jouet 01/04/2011 (NULL) Et l évolution rapide? Si la granularité temporelle des changements rejoint celle des tables de fait. Il faut créer une nouvelle dimension contenant les attributs concernés: tout rentre dans l ordre! 70

SEMI-ADDITIVITÉ Problématique : analyse de stock Toulouse Paris TOTAL 5 déc. 55 30 85 12 déc. 43 32 75 Décembre X X 98 62 X 160

SEMI-ADDITIVITÉ Solution : Changer la formule d agrégation Faire le calcul dans les outils de Reporting? Faire un membre calculé en MDX? Directement dans la mesure dans SSAS Attention : Edition Enterprise uniquement

GESTION DES NULL «gestion de l absence de valeur» Problématique : Un fait référence un membre de la dimension qui n existe pas Ex : une vente remonte sur un nouveau produit dans la base : NULL ou FK invalide Par défaut : erreur au traitement du cube

GESTION DES NULL Solution : Mise en place de l Unknow Member Alternatives : Création de membre «spéciaux» Traitement dans l ETL Problématique de Qualité des données

MANY-TO-MANY Problématique : Un fait est rattaché à plusieurs membres d une dimension Ex : promotion sur une vente (fidélité, remise, etc.) Pistes : En relationnel, on passe par une table d association

MANY-TO-MANY Solution : On met une table pour faire le pont entre les ventes et les promotions On la transforme en table de faits Bridge-factless-fact-table SSAS fait le reste : Many-To-Many relation Attention : pas de ventilation de la mesure!

JUNK DIMENSIONS Problématique : J ai de nombreux axes d analyse à faible cardinalité Ex : genre, situation matrimoniale, EstDecideur, etc. Ajouter des dimensions pour chaque axe entraine : Une complexité pour le moteur d agrégation Une complexité pour l utilisateur

JUNK DIMENSIONS Solutions : Ajouter les valeurs dans la table de faits dimension factuelle (ou dimension dégénérée) Créer une dimension qui contient toutes les combinaisons existantes Junk dimension Attention à la gestion des NULL

CONCEPTS AVANCÉS Gestion des NULL Semi-additivité Pondération Distinct Count Gestion des devises Temporal Snapshot SCD Surrogate Keys Factless Tables Junk Dimension Ragged Hierarchies Many-to-Many Sécurité dynamique

MERCI! Des questions?