25/05/2012. Business Intelligence. Plan de Présentation



Documents pareils
Urbanisation des SI-NFE107

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Introduction à la B.I. Avec SQL Server 2008

Les Entrepôts de Données

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

et les Systèmes Multidimensionnels

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Les entrepôts de données

Entrepôt de données 1. Introduction

Introduction à Business Objects. J. Akoka I. Wattiau

LES ENTREPOTS DE DONNEES

La problématique. La philosophie ' ) * )

Didier MOUNIEN Samantha MOINEAUX

Les Entrepôts de Données. (Data Warehouses)

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-Science

Bases de Données Avancées

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

La place de la Géomatique Décisionnelle dans le processus de décision

Business Intelligence : Informatique Décisionnelle

ETL Extract - Transform - Load

SQL SERVER 2008, BUSINESS INTELLIGENCE

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Accélérateur de votre RÉUSSITE

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

2 Serveurs OLAP et introduction au Data Mining

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Méthodologie de conceptualisation BI

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Business & High Technology

SAP BusinessObjects Web Intelligence (WebI) BI 4

BI Open Source Octobre Alioune Dia, Consultant BI

Catalogue Formation «Vanilla»

Chapitre 9 : Informatique décisionnelle

Entrepôt de Données. Jean-François Desnos. ED JFD 1

Intelligence Economique - Business Intelligence

Hervé Couturier EVP, SAP Technology Development

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Skills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT

Département Génie Informatique

BUSINESS INTELLIGENCE

QU EST-CE QUE LE DECISIONNEL?

Introduction : présentation de la Business Intelligence

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

MANAGEMENT DES SERVICES INFORMATIQUES

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

Déroulement de la présentation

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

Théories de la Business Intelligence

Le Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel.

Business Intelligence avec SQL Server 2012

Bases de Données OLAP

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

L information et la technologie de l informationl

Décisionnel. SI Virtualisé. Performant. Cloud. SAP BusinessObjects. Dashboards. Expertise. Succès. Service Reporting. Finance. SaaS. Web 2.0.

et les Systèmes Multidimensionnels

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

DEMARREZ RAPIDEMENT VOTRE EVALUATION

Domaines d intervention

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Introduction au domaine du décisionnel et aux data warehouses

ANNEXE 2 DESCRIPTION DU CONTENU DE L OFFRE BUSINESS INFORMATION AND ANALYSIS PACKAGE

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

CATALOGUE DE FORMATIONS SAP BUSINESS OBJECTS. Edition 2013

ÉVALUATION DES PRODUITS COMMERCIAUX OFFRANT DES CAPACITÉS

Solutions IT pour libérer le potentiel de votre Business

Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières

IBM Cognos Enterprise

Intégration de données hétérogènes et réparties. Anne Doucet

Présentation du module Base de données spatio-temporelles

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Business Intelligence avec SQL Server 2012

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

_L'engagement qui fait la différence BUSINESS INTELLIGENCE DATA WAREHOUSING PILOTAGE DE LA PERFORMANCE

Session Business Objects. Thierry Nicault Directeur Régional EEMEA Business Objects

Le nouveau visage de la Dataviz dans MicroStrategy 10

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Solutions SAP Crystal

Offre Décisionnel / CONSEIL, SOLUTIONS DE TRANSFORMATION ET SERVICES IT. Offre Décisionnel

CATALOGUE DE FORMATIONS SAP BUSINESS OBJECTS. Edition 2012

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

bases de données & outils décisionnels augmentez l expertise de votre capital humain

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Business Intelligence Reporting

Transcription:

Business Intelligence Prof. Mourad Oubrich Plan de Présentation Définition de la BI Chaine de la valeur de la BI Marché de la BI Métiers de la BI Architecture de la BI Technologie SAP BI Les priorités des DSI pour 2012 1

Données, Information, Connaissance Harris (1996) : Data => is facts, observations, or perceptions Information => involves manipulation of data Knowledge=> is a combination of information, context, and experience. Mack (1995) : Information = data + humain interpretation Durand (1992): Actes Assimiler Données Information Connaissance Exemple d illustration 1 C001090824000000001425000 C002071231000000189001250 Solde Date de dernière opération Code Client Données + Interprétation 2 = Information 3 Fouille de donnée Recherche des comptes Gelés : Tout compte présentant une date de dernière opération qui dépasse 1 an : Le client C002 est gelé (car sa date de DO : 31-12-2007) Interprétation 4 / Évaluation / Décision : Connaissance Recherche des causes du gel (historiques des événement), Génération des messages de relance des clients gelés Domaines d application de la BI Shipping and Logistics Human Resources Customer Service Budgeting and Planning Forecasting Marketing Sales Finance and Accounting 0% 10% 20% 30% 40% 50% 60% 70% (Gartner Research, 2009) 2

Platformes BI Mobile Devices Operational Application E-mail Corporate Portal Desktop Application Web Application 0% 10% 20% 30% 40% 50% Vendeurs de solution BI Business Intelligence (BI)? BI is a broad category of applications, technologies, and processes for gathering, storing, accessing, and analyzing data to help business users make better decisions (Wikipedia) BI is a set of technologies and processes that use data to understand and analyze business performance (Davenport and Harris, 2007). 3

Source Systems Many possible sources relational database, ERP, XML, Excel Many platforms IBM, Oracle Other issues which sources to use, granularity, etc. Data Integration Traditionally known as extract, transform, and load ETL Normally performed using commercial (DataStage, Informatica )and Open Source software (SAS Data Integration Studio, SQL Integration Service, PentahoData Integration, Talend Open Studio ) The data is transformed following business rules 4

Metadata Is data about the data Can be sourced from many different tools and systems Should be managed in a central directory Table Colonne Type donnée Description Client Id Client Numeric Client Nom Client Varchar(20) Produit Id Produit Numeric Data Quality Garbage in Garbage out Most companies have serious data quality problems Data profiling is the starting point for understanding the problems There are many reasons for dirty data Example Data Quality 5

Example Data Quality Data warehouse Architectures Enterprise data warehouse (Bill Inmon) Data mart bus (Ralph Kimball) BI Tools and Applications SQL queries ETL OLAP reports Excel (PivotTable) Dashboards Data mining 6

Why BI? Make more informed business decisions: Customer behavior analysis Marketing segmentation Sales strategies Forecasting Financial management BI Drivers Abundance of data ERP Systems Inexpensive storage Mature data warehouse technologies Powerful and easy to use analytical software Extraction Transformation Loading Data Warehouse 7

Architecture BI Qualité de donnée The Data Warehousing Institute estimates that data quality problems cost U.S. businesses more than $600 billiona year. Sources de problème de la qualité de donnée 80% 60% 40% 20% 0% Source: The Data Warehousing Institute Data entry by employees Data entry by customers Changes to your source system Data migration or conversion projects Mixed expectation by users External data Systems errors Other 8

ETL (1/1) Extraction: Consiste à lire et à copier les données sources dans une zone de préparation (stagingarea) pour les manipulations ultérieures. Transformation: Consiste au nettoyage des données (correction orthographique, résolution de conflits de domaine, traitement des éléments manquants, etc.). Loading: Charger dans le DW des masses de données nettoyées pour une utilisation à des fins décisionnelles. Technologie SQL Server Integration Services (SSIS) SAS Data Integration Studio Pentaho Data Integration ETL Informatica Talend Open Studio PL/SQL (Manuellement) Datamart Datamart est un sous-ensemble de données et ciblé sur un sujet unique ou un domaine d activité de l entreprise. Bases de production SGBD relationnel Data Marts Outils d alimentation Bases externes Data warehouse A data warehouse is a subject oriented integrated nonvolatile time variant collection of data in support of management s decisions. Subject Oriented Non Volatile Data Warehouse Integrated Time Variant Inmon 1992 27 9

Données Orientées Sujet Organiséesautourde sujetsmajeurscommeclient, Produit, Ventes, Promotion Donnéespour l analyseet la modélisationen vuede l aideà la décision, et non pas pour les opérationset transactions journalières Vuesynthétiquedes donnéesselonles sujetsintéressantles décideurs Données Intégrées Construit en intégrant des sources de données multiples et hétérogènes BD relationnelles, fichiers, enregistrements de transactions Nettoyage et intégration des données Consistence dansles nomsdes champs, le codagedes données issues de plusieurs sources La conversion se fait quand les donnés sont transférées dansle DW Données historisées L échellede temps dansle DW estbeaucoup plus longue quedansles BD BD opérationnelle: valeur courante des données DW : information dansuneperspective historique(ex: les 5 dernières années) Chaque structure dans le DW contient un élément décrivant le temps 10

Données Non Volatiles Stockage indépendant des BD opérationnelles Pas de misesà jour des donnéesdansle DW 2 actions surle DW Alimentation du DW à partir des données des BD opérationnelles Accès(lecture) de ces données Définition OLAP «Il s agit d une catégorie de logiciels axés sur l exploration et l analyse rapide des données selon une approche multidimensionnelle à plusieurs niveaux d agrégation» (Caron, 1998) Exploration et analyse rapide : OLAP vise à assister l usagerdansson analyseen lui facilitant l exploration de ses données et en lui donnant la possibilité de le faire rapidement Rapidité et facilité Avantages OLAP Facilité L usager n a pas à maîtriser des langages d interrogation et des interfaces complexes L usager interroge directement les données, en interagissant avec celles-ci Rapidité L usager devient opérationnel en très peu de temps L usager peut se concentrer sur son analyse et non sur le processus (les moyens utilisés pour l analyse). 11

MOLAP (OLAP Multidimensionnel) Les données détaillées de base ainsi que les données agrégées de DW sont stockées dans une base de données multidimensionnelle (souvent appelée cube ou hypercube) Le serveur MOLAP extrait les données de l hypercubeet les présente directement au module client ROLAP (OLAP Relationnel) Les données détaillées de base ainsi que les données agrégées de DW sont stockées sous forme de tables dans une base de données relationnelle La base de données relationnelle doit être structurée selon un modèle particulier (étoile, flocon, ) Le serveur extrait les données par des requêtes SQL et interprète les données selon une vue multidimensionnelle avant de les présenter au module client B a s e d e d o n n é e s re la tio n n e lle (é to ile o u flo c o n ) S e rv e u r R O L A P V u e m u ltid im e n s io n n e lle C lie n t O L A P HOLAP (OLAP Hybride) Les données détaillées de base de DW sont stockées dans une base de données relationnelle et les données agrégées sont stockées dans une base de données multidimensionnelle Le serveur HOLAP accède deux bases de données et les présente au module client, selon une vue multidimensionnelle. 12

SOLAP (Spatial OLAP) SIG + OLAP? : combinerdestechnologies spatialeset nonspatiales: SIG et OLAP Quelques logiciels combinant des fonctionnalités SIG et OLAP ont été mis sur le marché : CognosVisualizer ProClarity MapX AC OLAP Map SOLAP : Une plate-forme visuelle supportant l exploration et l analyse spatio-temporelle des données selon une approche multidimensionnelle à plusieurs niveaux d agrégation via un affichage cartographique, ou en diagramme statistique SOLAP (Spatial OLAP) 3 types de présentation des données : Descriptive Mixte Géométrique Dimension spatiale descriptive Maroc Dimension spatiale mixte Maroc Dimension spatiale géométrique Sud Centre Nord Casablanca Rabat Mesure numérique Ventes en $ Composantes OLAP L architecture OLAP consiste en trois services : Base de données (SQL, Access, Oracle ) Doit supporter les données agrégées ou résumées Doit posséder une structure multidimensionnelle (SGDB multidimensionnel ou relationnel) Serveur OLAP (ex. Designer BO) Gère la structure multidimensionnelle dans le SGBD Gère l accès aux données de la part des usagers Module client (ex. Desktop Intelligence BO ) : Permet aux usagers de manipuler et d explorer les données Affiche les données sous forme de graphiques statistiques et de tableaux 13

OLAP = cubes Un DW est basé sur une modélisation multidimensionnelle qui réprésenteles donnéesdansun cube Un cube, ventespar ex, permetde voirles donnéessuivant plusieurs axes d analyse Axe d analyse: Article, Promotion, Temps Des mesures: Somme des Ventes par article Modèle dimensionnel : Notion de Cube Un cube est un ensemble de mesures organisées selon un ensemble de dimensions (aussi hypercube). Ex. Un cube de ventes qui comprend : Les dimensions Temps, Produit, Magasin La mesure Ventes en $ Produit Magasin Temps 41 Table de faits (1/1) Un fait représente la valeur d une mesure, calculée, selon un membre de chacune des dimensions. Ex. «le coût des travaux en 1995pour la région 02 est 250 000 $» est un fait qui exprime la valeur de la mesure «coût des travaux» pour le membre «1995» du niveau «année» de la dimension «temps»et le membre «02» du niveau «région» de la dimension «découpage administratif». 42 14

Table de faits (1/2) Id Date Année Mois Jours Date Découpage administratif Id Région Numéro région. Suivi des travaux Id Date Id région Coût des travaux Mesures (1/1) Une mesure est un élément de donnée sur lequel portent les analyses, en fonction des différentes dimensions Ex. coût des travaux, nombre d accidents, ventes, dépenses Les mesuresles plus utilesd unetable de faitssont numérique, de valeur continue, et additive. Table de faitsdes Ventes journalières Clé date (CE) Clé produit(ce) Clé magasin (CE) Quantité vendue Montant des ventes Mesures Mesures (1/3) Additivité : Exemple: CA ; Quantité vendue Semi-additivité : Exemple: Nbre de contacts clients Non-additivité Exemple: Moyen des ventes du mois 15

Tables de dimension (1/1) Une dimension peut être définie comme un thème, ou un axe, selon lequel les données seront analysées Ex. Produit, Client, Temps Une dimension contient des membres organisés en hiérarchie, chacun des membres appartenant à un niveau hiérarchique (ou niveau de granularité) particulier. Ex. Pour la dimension Temps, les années, les mois et les jours peuvent être des exemples de niveaux hiérarchiques. 1998 est un exemple de membre du niveau Année 46 Tables de dimension (1/2) Table de dimension produit Clé produit (CP) Description du produit Description de la marque Description de la catégorie Description du rayon Description du type d emballage Taille de l emballage Description matière grasses Description type de régime Poids Unités de mesures de poids Types de stockage et bien d autres attributs Des attributs de dimensions nombreux permettent de varier les possibilité d analyse. Les meilleurs attributs sont textuelles. Ils doivent être des mots plutôt que des abréviations. La granularité des dimensions 16

Exemple de granularité des dimensions Exemple DW Dimension produit Clé produit (CP) Description du produit Description de la marque Description de la catégorie et d autres attributs Dimension magasin Clé magasin (CP) Numéro magasin Nom magasin Adresse magasin Ville du magasin Département du magasin Région du magasin Pays du magasin Continent du magasin et d autres attributs Faits de vente journaliers Clé date (CE) Clé produit (CE) Clé magasin (CE) Quantité vendue Montant vente (dh) Région du Magasin Centre Centre Centre Sud Sud Sud Description de la Marque Vitpropre Costal Ekla Vitpropre Costal Elka Dimension date Clé date (CP) Date Jour de la semaine Mois Année et d autres attributs Montant vente 1 233 2 239 848 2 097 2 428 6 33 Quantité Vendue 1 370 2 035 707 2 330 2 207 527 Opérations OLAP Roll up : Analyse ascendante«synthétiser» Vente par Géographie (ville > département > région > pays > continent) Drill down : Analyse descendante «détailler» Vente par Géographie (continent > pays > région > département > ville) Slice and dice : Projection et sélection Selection: Mois 04 Année 2008. Projection (Magasin, Produit) Pivot: Réorienterle cube Vente par Produit(Colonne) et Date (Ligne) Vente par Produit(Ligne) et Date (Colonne) Drill-across: Permet de passer d une mesure à l autreou de passer d un membre de dimension à un autre Ex. visualiser les Quantité Vendues au lieu du Montant des ventes Ex. visualiser les Ventes de Centre (Rabat ) au lieu de celles de Sud (Marrakech) 17

Schéma en étoile (Star Schema) Le schéma en étoile se compose de : Objet central, nommé table des faits, qui contient les faits Connecté à un certain nombre d axe d analyse ou de dimension, les tables de dimension, qui contiennent les attributs définissant chacun des membres des dimensions. 52 Schéma en étoile Dimension 1 Dimension 3 Temps Table de Faits Numbers de faits Product Dimension 2 Dimension 4 Magasin Promotion 53 Schéma en flocon (Snowflake Schema) Le schéma en flocon est dérivé du schéma en étoile où les tables de dimension sont normalisées. Avec ce schéma, chacune des dimensions est décomposée selon sa ou ses hiérarchie(s) 18

Schéma en flocon Quarter Season Time Sales Numbers Product Promotion Package Category 55 Schéma en constellation Le schéma en constellation est en fait composé de plusieurs schémas en étoile qui partagent des tables de dimension Schéma en constellation 19

Data Warehouse Etape 1 : Analyse Choisir le processus d affaires à modéliser Identifier les besoins Identifier les utilisateurs Identifier les sources de données Choisir le grain du processus d affaires Identifier la plus petite granularité Choisir les dimensions Identifier les dimensions à historier et leur type Choisir les mesures de la table de faits Identifier les indicateurs 58 Kimball 1998 L offre SAP Business Object Module ETL Nom commercial Tableaude bord Xcelsius Accès aux données Analyse et Reporting Diffusionen masse Qualité des données Description DataIntegrator C est la couche intégration de données de l offre BusinessObjects. Elle concerne l extraction, la transformation et le chargement des données de quelle que soit la source/cible et la fréquence. Issu du rachat de l ETL Acta. Designer Desktop Intelligence Xcelsius est un outil de mise en forme et de synthèse de données doté de fonctionnalités avancées permettant de transformer simplement tous types de données en tableau de bord interactif. La restitution des rapports est entièrement en HTML et en flash, donc accessible depuis un navigateur. Produitissu du rachat de Xcelsius. Designer destiné au concepteur d univers, couche sémantique d accès aux données d une base de données, qui évite aux utilisateurs finaux de faire face à la technicité de la structuration de la base. DesktopIntelligence permet d accéder aux données, de construire des rapports avec diverses mises en forme avant de les diffuser aux utilisateurs. Crystal Reports Crystal Reports est un puissant logiciel d'élaboration de rapport dynamique et interactif conçu pour les développeurs. Il permet de concevoir, d'explorer, de visualiser et de diffuser des rapports à partir du Web ou d'intégrer dans des applications d'entreprises. Data Quality Permetde vérifier si la donneés est correcte, consistente et complète par une analyse et profiling des sources de données. Offre issue du rachat de Fuzzy Informatik et FirstLogic Modules Business Object Designer Définition de la couche sémantique (univers) Classes d'objets et objets Conditions prédéfinis Liste de valeurs Objets personnels Jointures relationnelles Desktop Intelligence Accès aux données Analyse multi - dimensionnelle Filtres Rotation des dimensions Exploration Tableaux simples, croisés, graphiques, structure maître/détail Tris, ruptures, filtres, alerteurs, palmarès Combinaison de plusieurs requêtes Accès optimal au SGBD (micro-cube) Sauvegarde en format HTML Exportation des données sous divers formats 20