BI = Business Intelligence Master Data-ScienceCours 3 - Data



Documents pareils
BI = Business Intelligence Master Data-ScienceCours 2 - ETL

Les entrepôts de données

et les Systèmes Multidimensionnels

Entrepôt de données 1. Introduction

Chapitre 9 : Informatique décisionnelle

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Bases de Données Avancées

Base de données clients outil de base du CRM

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Introduction à la B.I. Avec SQL Server 2008

BI = Business Intelligence Master Data-Science

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Urbanisation des SI-NFE107

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Business Intelligence : Informatique Décisionnelle

LES ENTREPOTS DE DONNEES

Les Entrepôts de Données. (Data Warehouses)

La problématique. La philosophie ' ) * )

Evry - M2 MIAGE Entrepôt de données

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

SQL SERVER 2008, BUSINESS INTELLIGENCE

Rejoignez la Communauté

Introduction au domaine du décisionnel et aux data warehouses

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Théories de la Business Intelligence

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

L information et la technologie de l informationl

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

Business & High Technology

Méthodologie de conceptualisation BI

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

ETL Extract - Transform - Load

Entrepôt de Données. Jean-François Desnos. ED JFD 1

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Intelligence Economique - Business Intelligence

Domaines d intervention

Les Entrepôts de Données

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Thibault Denizet. Introduction à SSIS

La place de la Géomatique Décisionnelle dans le processus de décision

AXIAD Conseil pour décider en toute intelligence

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Business Intelligence avec SQL Server 2012

Cabinet Conseil en Intelligence d Affaires. L'Intégration de données et la Qualité des données dans l'écosystème BI actuel et future

Décisionnel & Reporting

QU EST-CE QUE LE DECISIONNEL?

Introduc;on à l intelligence d affaires et aux entrepôts de données

Solutions IT pour libérer le potentiel de votre Business

Ici, le titre de la. Tableaux de bords de conférence

POURQUOI LES DEPARTEMENTS INFORMATIQUES NE PEUVENT PAS SE PASSER DE QLIKVIEW

GPC Computer Science

BI2 : Un profil UML pour les Indicateurs Décisionnels

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Intégration de données hétérogènes et réparties. Anne Doucet

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Evry - M2 MIAGE Entrepôts de Données

Département Génie Informatique

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

République Algérienne Démocratique et Populaire

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

DEVENEZ EXPERT EN DECISIONS

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

PROGICIELS DE GESTION INTÉGRÉS SOLUTIONS DE REPORTING

et les Systèmes Multidimensionnels

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Titre : La BI vue par l intégrateur Orange

Analyse comparative entre différents outils de BI (Business Intelligence) :

Les entrepôts de données et l analyse de données

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Architecture des entrepôts de données

SQL Server 2012 et SQL Server 2014

25/05/2012. Business Intelligence. Plan de Présentation

Gestion des Donnés Métier de Référence

LA TRIBUNE. Atelier BNP Paribas. 23 novembre 2011

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Exploration de problèmes de performance d un entrepôt de données. par. Louisa Demmou

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

VLDB ET BUSINESS INTELLIGENCE

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE

SQL Server SQL Server Implémentation d une solution. Implémentation d une solution de Business Intelligence.

sesame BI Sesame Business Intelligence Faire la lumière dans vos données, éclairer vos décisions stratégiques interfacesa.com

DESCRIPTIF DE MODULE S5 GSI

Les attentes du marché

BI : GESTION GESTION, PRODUCTION STRATEGIE DE BI. Un livre blanc d Hyperion

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

Entreposage de données complexes pour la médecine d anticipation personnalisée

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

SWISS ORACLE US ER GRO UP. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

Transcription:

BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015

Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage des décideurs et des dirigeants des entreprises. Les systèmes de ID/BI sont utilisés par les décideurs pour obtenir une connaissance approfondie de l entreprise et de définir et de soutenir leurs stratégies d affaires, par exemple : d acquérir un avantage concurrentiel, d améliorer la performance de l entreprise, de répondre plus rapidement aux changements, d augmenter la rentabilité, et d une façon générale la création de valeur ajoutée de l entreprise....et à créer de nouveaux services...

Plan Vision générale ETL Datawarehouse OLAP Reporting Data Mining

Définition Datawarehouse Le terme entrepôt de données (ou base de données décisionnelle, ou encore data warehouse) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l aide à la décision en entreprise. Source : Wikipedia Collecter : Récupérer l information produite pr l entreprise

Définition Datawarehouse Le terme entrepôt de données (ou base de données décisionnelle, ou encore data warehouse) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l aide à la décision en entreprise. Source : Wikipedia Ordonner : Structurer l information dans le but de la prise de décision (structure différente des BDs opérationnelles)

Définition Datawarehouse Le terme entrepôt de données (ou base de données décisionnelle, ou encore data warehouse) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l aide à la décision en entreprise. Source : Wikipedia Journaliser : Stocker l historique des données

Datawarehouse

Datawarehouse Un entrepôt de données conserve une copie des informations des systèmes de transaction opérationnels. Il offre la possibilité de : Rassembler des données provenant de sources multiples en une seule base de données afin qu un moteur de requête unique puisse être utilisé pour présenter des données. Permettre l éxécution de requête longues, bloquantes, sur des données opérationnelles Maintenir l historique des données, même si les systèmes de transaction source ne le font pas Intégrer des données provenant de multiples systèmes sources, permettant une vue centrale dans l entreprise. Cet avantage est particulièrement valable lorsque l organisation est issue de fusions successives Améliorer la qualité des données

Datawarehouse Un entrepôt de données conserve une copie des informations des systèmes de transaction opérationnels. Il offre la possibilité de : Présenter l information de l organisation Fournir un seul modèle de données commun pour toutes les données d intérêt, indépendamment de la source de données Restructurer les données de sorte qu elles prennent sens (décisionnel) Ajouter de la valeur aux applications métiers opérationnels, notamment la gestion de la relation client (CRM). Faire des requêtes d aide à la décision plus faciles à écrire.

Datawarehouse vs BD opérationnelle

Datamart Définition Un DataMart (littéralement en anglais magasin de données) est un sous-ensemble d un DataWarehouse destiné à fournir des données aux utilisateurs, et souvent spécialisé vers un groupe ou un type d affaire. Techniquement, c est une base de données relationnelle utilisée en informatique décisionnelle et exploitée en entreprise pour restituer des informations ciblées sur un métier spécifique, constituant pour ce dernier un ensemble d indicateurs utilisés pour le pilotage de l activité et l aide à la décision. Source : wikipedia Le datawarehouse est Général, le datamart est spécifique à un métier.

Datamart vs datawarehouse

Datamart vs datawarehouse Deux conceptions existantes : Définition d Inmon : Le DataMart est issu d un flux de données provenant du DataWarehouse. Contrairement à ce dernier qui présente le détail des données pour toute l entreprise, il a vocation à présenter la donnée de manière spécialisée, agrégée et regroupée fonctionnellement. Définition de Kimball : Le DataMart est un sous-ensemble du DataWarehouse, constitué de tables au niveau détail et à des niveaux plus agrégés, permettant de restituer tout le spectre d une activité métier. L ensemble des DataMarts de l entreprise constitue le DataWarehouse.

Différentes Architectures

Différentes Architectures

Différentes Architectures

Différentes Architectures

Données orientées sujets En production : données organisées par processus fonctionnels Datawarehouse : données organisées autour de sujets majeurs Données structurées par thème, potentiellement transverses par rapport aux domains fonctionnels et organisationnelles Examples (médecine) : Actes, Séjours vs Bases par services

Architecture Good DW architecture It s not easy to describe a good design, but I ll know it when I see it

Modèle relationnel Normalisation (3NF) Répond aux besoins transactionnels (OLTP) Avantages : Réduction de l entrée de données Réduction du nombre d index Ajouts/destructions/modifications plus rapides Désavantages : Peu efficace pour l extraction de données analytiques Beaucoup de relations Trop complexe pour l utilisateur BI

Modèle relationnel Le modèle relationnel n est pas (très) approprié pour les DWs

Modèle dimensionnel Principes On va partir du besoin client (quel analyse?). On va définir des faits et des dimensions. Faits : les faits représentent un sujet d analyse. Les faits sont caractérisées par plusieurs informations Dimensions : les dimensions sont les critères selon lesquels on souhaite faire de l analyse.

Modèle dimensionnel

Modèle dimensionnel Aussi connu sous le nom de modèle en étoile

Modèle dimensionnel Aussi connu sous le nom de modèle en flocon

Modèle dimensionnel Aussi connu sous le nom de modèle en constellation

Dimensions à évolution lente Slowly Changing Dimensions (SCDs) On parle d une dimension à évolution lente (slowly changing dimension) lorsqu une dimension peut subir des changements de description des membres. Un client peut changer dadresse, se marier,... Un produit peut changer de noms, de formulations Raider en Twix, Yaourt à la vanille en saveur Vanille Comment gérer cette situation dans un DW?

SCD : Type 0 Pas de prise en compte des SCDs

SCD : Type 1 Overwrite

SCD : Type 2 Utilisation de clefs surrogate (ou clefs de substitution) = et d autres types (voir Kimball)

Dimensions hiérarchiques Les dimensions peuvent avoir une organisation hiérarchique :

Dimensions hiérarchiques

Conclusion