Gestion des données - Business Intelligence

Documents pareils
BI = Business Intelligence Master Data-Science

Introduction à la B.I. Avec SQL Server 2008

et les Systèmes Multidimensionnels

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Méthodologie de conceptualisation BI

Bases de Données Avancées

La problématique. La philosophie ' ) * )

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

QU EST-CE QUE LE DECISIONNEL?

Chapitre 9 : Informatique décisionnelle

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Didier MOUNIEN Samantha MOINEAUX

AXIAD Conseil pour décider en toute intelligence

Les Entrepôts de Données

Décisionnel & Reporting

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

MyReport, LE REPORTING SOUS EXCEL

Ici, le titre de la. Tableaux de bords de conférence

BI = Business Intelligence Master Data-ScienceCours 2 - ETL

LES ENTREPOTS DE DONNEES

L information et la technologie de l informationl

Les entrepôts de données

SQL SERVER 2008, BUSINESS INTELLIGENCE

L informatique décisionnelle

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Urbanisation des SI-NFE107

Big Data. Concept et perspectives : la réalité derrière le "buzz"

MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.

Entrepôt de données 1. Introduction

Accélérer l agilité de votre site de e-commerce. Cas client

La Business Intelligence en toute simplicité :

IMPLEMENTATION D UN SYSTEME D INFORMATION DECISIONNEL

Business & High Technology

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Accélérateur de votre RÉUSSITE

ETL Extract - Transform - Load

Principe, applications et limites

Thibault Denizet. Introduction à SSIS

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

BUSINESS INTELLIGENCE

Entrepôt de Données. Jean-François Desnos. ED JFD 1

PROGICIELS DE GESTION INTÉGRÉS SOLUTIONS DE REPORTING

Cybermarché et analyse comportementale

BI Open Source Octobre Alioune Dia, Consultant BI

Business Intelligence : Informatique Décisionnelle

Les outils BI du consultant métier

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

sesame BI Sesame Business Intelligence Faire la lumière dans vos données, éclairer vos décisions stratégiques interfacesa.com

SQL Server 2012 et SQL Server 2014

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

_L'engagement qui fait la différence BUSINESS INTELLIGENCE DATA WAREHOUSING PILOTAGE DE LA PERFORMANCE

Evry - M2 MIAGE Entrepôt de données

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

Livre Blanc. ETL Master Data Management Data Quality - Reporting. Comment mieux connaître et maîtriser son réseau de distribution indirect?

2 Serveurs OLAP et introduction au Data Mining

Introduction à Business Objects. J. Akoka I. Wattiau

XCube XML For Data Warehouses

MyReport Le reporting sous excel. La solution de business intelligence pour la PME

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

Business Intelligence Reporting

Business Intelligence

Business Intelligence simple et efficace avec Excel et PowerPivot

Introduc;on à l intelligence d affaires et aux entrepôts de données

THOT - Extraction de données et de schémas d un SGBD

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

APPEL D OFFRE. Projet décisionnel. Juillet 2011

CURRICULUM VITAE. Martin Harnois. Consultant depuis 23 ans Spécialiste en Business Intelligence / entrepôt de données depuis 11 ans.

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

BI : GESTION GESTION, PRODUCTION STRATEGIE DE BI. Un livre blanc d Hyperion

Groupe Eyrolles, 2004 ISBN :

Intelligence Economique - Business Intelligence

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Contexte. Objectif. Enjeu. Les 3 questions au cœur du Pilotage de la Performance :

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

et les Systèmes Multidimensionnels

Business Intelligence avec Excel, Power BI et Office 365

Hervé Couturier EVP, SAP Technology Development

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Contexte. Objectif. Enjeu. Les 3 questions au cœur du Pilotage de la Performance :

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

25 October 2013 Dossier Confidentiel MTS CONSULTING ORCA. ORCA est une suite d outils d informatique décisionnel dédiée aux télécoms.

Présentations personnelles. filière IL

Transcription:

Gestion des données - Business Intelligence Olivier Schwander <olivier.schwander@lip6.fr> UPMC 20 février 2017 1 / 33

Définition Métiers Architecture Business intelligence Définition L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage des décideurs et des dirigeants des entreprises. Les systèmes de ID/BI sont utilisés par les décideurs pour obtenir une connaissance approfondie de l entreprise et de définir et de soutenir leurs stratégies d affaires, par exemple : d acquérir un avantage concurrentiel, d améliorer la performance de l entreprise, de répondre plus rapidement aux changements, d augmenter la rentabilité, et d une façon générale la création de valeur ajoutée de l entreprise. Wikipédia : article Informatique décisionnelle 2 / 33

Définition Métiers Architecture Business intelligence ETL : Extract - Transform - Load Récupérer les données là où elles sont Transformer les données si besoin Stocker les données de façon exploitable Data Warehouse Stockage des données Toute l histoire de l entreprise Stable dans le temps OLAP : Online Analytical Processing Données en grande dimension Visualisation, structuration Pas forcément de traitement statistique compliqué 3 / 33

Définition Métiers Architecture Applications Finance, avec les reportings financiers et budgétaires par exemple ; Vente et commercial, avec l analyse des points de ventes, l analyse de la profitabilité et de l impact des promotions par exemple ; Marketing, avec la segmentation clients, les analyses comportementales par exemple ; Logistique, avec l optimisation de la gestion des stocks, le suivi des livraisons par exemple ; Ressources humaines, avec l optimisation de l allocation des ressources par exemple ; source : Rapport CIGREF 2009 4 / 33

Définition Métiers Architecture Pyramide du BI Sagesse Connaissance Information (Big) Data 5 / 33

Définition Métiers Architecture Les métiers du BI 4 métiers Data Integrator Data Analyst Data Scientist Data Steward (Responsable des données) 6 / 33

Définition Métiers Architecture Bas niveau Data Integration Combiner des informations hétérogènes venants de sources différentes Data Analysis Inspection, nettoyage, transformation et modélisation des données. Data Mining, Data Vizualisation Rendre la donnée compréhensible Communiquer à partir de la donnée 7 / 33

Définition Métiers Architecture Haut niveau Data Scientist Il s agit de disposer de compétences de haut niveau en matière d analyse de données, en combinant à la fois les méthodes statistiques, mais aussi d autres connaissances telles que la linguistique, la sémantique, utiles notamment pour travailler sur des données non structurées, sans oublier la bonne compréhension du métier sur lequel on travaille, et de mettre en oeuvre une démarche d analyse itérative, en acceptant de tester des hypothèses sans a priori sur le résultat recherché. Data Steward - Responsable des Données [... ] susceptibles sur un périmètre métier sur lequel ils détiennent une expertise reconnue, de spécifier les exigences sur les données et d en contrôler la qualité. Ces responsables de données peuvent être positionnés à différents niveaux dans l organisation, et peuvent être pilotés par des coordinateurs au niveau d un métier, d une fonction support ou d une géographie. 8 / 33

Définition Métiers Architecture Architecture générale Architecture Les données opérationnelles sont extraites périodiquement de sources hétérogènes : fichiers plats, fichiers Excel, base de données (DB2, Oracle, SQL Server, etc.), service web, données massives et stockées dans un entrepôt de données. Les données sont restructurées, enrichies, agrégées, reformatées, nomenclaturées pour être présentées à l utilisateur sous une forme sémantique (vues métiers ayant du sens) qui permettent aux décideurs d interagir avec les données sans avoir à connaître leur structure de stockage physique, de schémas en étoile qui permettent de répartir les faits et mesures selon des dimensions hiérarchisées, de rapports pré-préparés paramétrables, de tableaux de bords plus synthétiques et interactifs. Ces données sont livrées aux divers domaines fonctionnels (direction stratégique, finance, production, comptabilité, ressources humaines, etc.) à travers un système de sécurité ou de datamart spécialisés à des fins de consultations, d analyse, d alertes prédéfinies, 9 / 33

Définition Métiers Architecture Architecture Extraction des données Bases de données Autres sources Structuration des données Prétraitements Aggrégation Interface Présentation des données Visualisation, alertes automatiques Pour une tâche donnée À destination d un décideur 10 / 33

Stockage Fonctions Stockage Base de données opérationnelle Fonctionnement normal de l entreprise Pas forcément un historique très grand Peut changer dans le temps Datawarehouse Stockage pour le BI Archivage sur toute l histoire de l entreprise Format stable dans le temps Datamart Vue métier À destination du décideur 11 / 33

Stockage Fonctions Définitions Datawarehouse Le terme entrepôt de données (ou base de données décisionnelle, ou encore data warehouse) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l aide à la décision en entreprise. Datamart Un DataMart (littéralement en anglais magasin de données) est un sous-ensemble d un DataWarehouse destiné à fournir des données aux utilisateurs, et souvent spécialisé vers un groupe ou un type d affaire. 12 / 33

Stockage Fonctions Datawarehouse 13 / 33

Stockage Fonctions Les fonctions Collecte de données Intégration Diffusion (ou distribution) Présentation 14 / 33

Stockage Fonctions Fonction de collecte Définition La fonction collecte (parfois appelée datapumping) recouvre l ensemble des tâches consistant à détecter, sélectionner, extraire et filtrer les données brutes issues des environnements pertinents Tâche Récupérer les données Méthodologie ETL 15 / 33

Stockage Fonctions Données hétérogènes Plusieurs types de sources Fichiers plats Fichers Excel Bases de données (SQL) Services web Systèmes de stockages pour données massives Interfaces exotiques Plusieurs types de données Chiffres, texte, image Données statiques, flux Données bruitées, manquantes, erronées 16 / 33

Stockage Fonctions Flux de données et données statiques Données statiques Image à un instant donné de l état de l entreprise Rapports d activité, bilans, inventaire Flux de données Mise à jour en temps réel Compte rendus quotidiens, commandes, livraisons 17 / 33

Stockage Fonctions Recodage Mise sous forme canonique Choix d une représentation unique Indépendante de la représentation en entrée Stabilité dans le temps Un changement dans les formats d entrées en doit pas perturber l analyse. 18 / 33

Stockage Fonctions ETL Méthodologie et outils Extract Extraire les données de sources hétérogènes Transform Transformation des données pour les mettre dans un format acceptable Load Charger les données dans le datawarehouse 19 / 33

Stockage Fonctions ETL Ensemble de connecteurs 20 / 33

Stockage Fonctions Logiciels d ETL Interfaces graphiques pour le non-spécialiste Anatella2 DataStudio (Data) Feature Manipulation Engine (FME) Hurence avec un ETL natif Hadoop IBM InfoSphere DataStage Informatica PowerCenter MapReport Microsoft SQL Server Integration Services (SSIS) OpenText Genio Oracle Data Integrator (Sunopsis) Oxio Data Intelligence solution ETL SAP Data Services SAS Data Integration Studio Stambia STATISTICA ETL (StatSoft) 21 / 33

Stockage Fonctions Pentaho Data Integration 22 / 33

Stockage Fonctions Fonction d intégration Définition La fonction d intégration consiste à concentrer les données collectées dans un espace unifié, dont le socle informatique essentiel est l entrepôt de données. Élément central du dispositif, il permet aux applications décisionnelles de masquer la diversité de l origine des données et de bénéficier d une source d information commune, homogène, normalisée et fiable, au sein d un système unique et si possible normalisé. Tâches Deuxième passe de filtrage et validation Synchronisation Certification (liens avec des documents légaux) 23 / 33

Stockage Fonctions Fonction de diffusion Définition La fonction de diffusion met les données à la disposition des utilisateurs, selon des schémas correspondant aux profils ou aux métiers de chacun, sachant que l accès direct à l entrepôt de données ne correspond généralement pas aux besoins spécifiques d un décideur ou d un analyste. Tâche Choisir les données en fonction des besoins des utilisateurs Méthodoligie OLAP 24 / 33

Description Opérations OLAP - Online Analytical Processing Définition Analyse sur-le-champ d informations selon plusieurs axes, dans le but d obtenir des rapports de synthèse But Les données sont dans un espace de grande dimension Beaucoup de données Comment gérer ça? 25 / 33

Description Opérations Hypercube 26 / 33

Description Opérations Opérations sur l hypercube Rotate : sélection du couple de dimensions à cibler, Slicing : extraction d une tranche d information, Scoping : extraction d un bloc de données (opération plus générale que le slicing), Drill-up : synthèse des informations en fonction d une dimension (exemple de drill-up sur l axe temps : passer de la présentation de l information jour par jour sur une année, à une valeur synthétique pour l année), Drill-down : c est l équivalent d un «zoom», opération inverse du drill-up, Drill-through : lorsqu on ne dispose que de données agrégées (indicateurs totalisés), le drill through permet d accéder au détail élémentaire des informations (voir notamment les outils H-OLAP). 27 / 33

Description Opérations Rotate 28 / 33

Description Opérations Slicing 29 / 33

Description Opérations Scoping 30 / 33

Description Opérations Drill-up, drill-down 31 / 33

Description Opérations Concrètement Chiffre d affaire Produit Géographie Temps 32 / 33

Description Opérations Fonction présentation Définition Cette quatrième fonction, la plus visible pour l utilisateur, régit les conditions d accès de l utilisateur aux informations, dans le cadre d une interface Homme-machine déterminé (IHM). Tâche Visualisation Rapports En lien direct avec l utilisateur final 33 / 33