Business Intelligence - Introduction



Documents pareils
BI = Business Intelligence Master Data-Science

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 2 - ETL

Introduction à la B.I. Avec SQL Server 2008

Urbanisation des SI-NFE107

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

AXIAD Conseil pour décider en toute intelligence

La problématique. La philosophie ' ) * )

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Chapitre 9 : Informatique décisionnelle

Thibault Denizet. Introduction à SSIS

Business Intelligence avec Excel, Power BI et Office 365

Bases de Données Avancées

SQL SERVER 2008, BUSINESS INTELLIGENCE

QU EST-CE QUE LE DECISIONNEL?

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

ETL Extract - Transform - Load

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Les entrepôts de données

Les Entrepôts de Données

BI Open Source Octobre Alioune Dia, Consultant BI

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Didier MOUNIEN Samantha MOINEAUX

et les Systèmes Multidimensionnels

Principe, applications et limites

BUSINESS INTELLIGENCE

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

LES ENTREPOTS DE DONNEES

IMPLEMENTATION D UN SYSTEME D INFORMATION DECISIONNEL

Méthodologie de conceptualisation BI

MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.

Business Intelligence

_L'engagement qui fait la différence BUSINESS INTELLIGENCE DATA WAREHOUSING PILOTAGE DE LA PERFORMANCE

Business & High Technology

La Business Intelligence en toute simplicité :

L informatique décisionnelle

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Suite Jedox La Business-Driven Intelligence avec Jedox

Base de données clients outil de base du CRM

THOT - Extraction de données et de schémas d un SGBD

Agenda de la présentation

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

2 Serveurs OLAP et introduction au Data Mining

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Business Intelligence : Informatique Décisionnelle

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

Panorama des solutions analytiques existantes

27 janvier Issam El Hachimi Ludovic Schmieder

Cybermarché et analyse comportementale

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

L information et la technologie de l informationl

Ici, le titre de la. Tableaux de bords de conférence

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

BI : GESTION GESTION, PRODUCTION STRATEGIE DE BI. Un livre blanc d Hyperion

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Evry - M2 MIAGE Entrepôt de données

HADOOP ET SON ÉCOSYSTÈME

Contexte. Objectif. Enjeu. Les 3 questions au cœur du Pilotage de la Performance :

CURRICULUM VITAE. Martin Harnois. Consultant depuis 23 ans Spécialiste en Business Intelligence / entrepôt de données depuis 11 ans.

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Accélérateur de votre RÉUSSITE

Département Génie Informatique

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Entrepôt de données 1. Introduction

sesame BI Sesame Business Intelligence Faire la lumière dans vos données, éclairer vos décisions stratégiques interfacesa.com

Introduction à Business Objects. J. Akoka I. Wattiau

«Nos valeurs à votre service» Genève. Business Intelligence Data Management Développement Web. Présentation Société

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Intelligence Economique - Business Intelligence

Labs Hadoop Février 2013

Business Intelligence

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Du «reporting» aux tableaux de bord informatiques. Un besoin récurrent aux multiples facettes

Business Intelligence Reporting

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

MYXTRACTION La Business Intelligence en temps réel

L INTÉGRATION ENTRE BUSINESS INTELLIGENCE ET WEB ANALYTICS

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

BIG DATA et DONNéES SEO

FreeAnalysis. Schema Designer. Cubes

Domaines d intervention

Business Intelligence avec SQL Server 2012

Hervé Couturier EVP, SAP Technology Development

ANNEXES. Evaluation de la formation à Polytech Lille Département GIS. Enseignements les plus utiles. Enseignements à renforcer

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Pourquoi IBM System i for Business Intelligence

Transcription:

Le cours Business Intelligence - Introduction Olivier Schwander <olivier.schwander@lip6.fr> UPMC 1 / 45

Le cours Organisation du cours http://www-connex.lip6.fr/~schwander/enseignement/ 2015-2016/m2stat_bi/ Horaires et salles Mardi de 14h à 17h, salle 1525-101 ou 1525-102 Cours puis TD/TP (mais pas toujours) Contenu Business intelligence Bases de données, extraction de données Interventions d industriels Évaluation Note de TP et travail à la maison Examen final 2 / 45

Le cours Inspiration Cours de Ludovic Denoyer Master 1 Données Apprentissage Connaissances Beaucoup plus d heures Pas le même public (informaticiens) Cours de Bernard Espinasse Ecole Polytechnique Universitaire de Marseille Public encore plus spécialisé Article Wikipedia Informatique décisionnelle Autres sources Indiquées au fur et à mesure 3 / 45

Contexte Motivation Les métiers du BI Objectifs Analyse de données pour l entreprise Donner des clefs de compréhension autour du rôle et de la gestion des données en entreprise Aborder des problématiques de traitement/intégration de données sur des exemples concrets Présenter des outils du domaine pro Analyse de données en pratique Donner des éléments de bases de données Présenter des cas concrets d extaction de données 4 / 45

Contexte Motivation Les métiers du BI Contexte Entreprise On veut gagner de l argent On cherche à faire des choix intelligents On peut collecter beaucoup de données On a les ressources pour les traiter On cherche les compétences pour les traiter Vous Des mathématiciens, des statisticiens Des étudiants à intégrer dans le monde du travail Lien à faire entre vos compétences et le vocabulaire et les besoins de l entreprise 5 / 45

Contexte Motivation Les métiers du BI Contexte 6 / 45

Contexte Motivation Les métiers du BI Définition L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage des décideurs et des dirigeants des entreprises. Les systèmes de ID/BI sont utilisés par les décideurs pour obtenir une connaissance approfondie de l entreprise et de définir et de soutenir leurs stratégies d affaires, par exemple : d acquérir un avantage concurrentiel, d améliorer la performance de l entreprise, de répondre plus rapidement aux changements, d augmenter la rentabilité, et d une façon générale la création de valeur ajoutée de l entreprise. 7 / 45

Contexte Motivation Les métiers du BI Motivation Enjeux Business des données - CIGREF 2014 Pour qui réussit à optimiser son usage, la donnée devient information, puis, bien partagée au sein de l entreprise, elle se transforme en connaissance et constitue son savoir. Elle peut être une source de services et d innovations, notamment lorsqu on la croise avec d autres données et qu elle provient de sources diverses. Mots-clés données, information, connaissance, savoir optimiser, partager, sources diverses 8 / 45

Contexte Motivation Les métiers du BI Applications source : Rapport CIGREF 2009 Finance, avec les reportings financiers et budgétaires par exemple ; Vente et commercial, avec l analyse des points de ventes, l analyse de la profitabilité et de l impact des promotions par exemple ; Marketing, avec la segmentation clients, les analyses comportementales par exemple ; Logistique, avec l optimisation de la gestion des stocks, le suivi des livraisons par exemple ; Ressources humaines, avec l optimisation de l allocation des ressources par exemple ; 9 / 45

Contexte Motivation Les métiers du BI Etude IDC - Microsoft 2014 10 / 45

Contexte Motivation Les métiers du BI Etude IDC - Microsoft 2014 11 / 45

Contexte Motivation Les métiers du BI Etude IDC - Microsoft 2014 12 / 45

Contexte Motivation Les métiers du BI Pyramide du BI Sagesse Connaissance Information (Big) Data 13 / 45

Contexte Motivation Les métiers du BI Les métiers du BI 4 métiers Data Integrator Data Analyst Data Scientist Data Steward (Responsable des données) 14 / 45

Contexte Motivation Les métiers du BI Bas niveau Data Integration Combiner des informations hétérogènes venants de sources différentes Data Analysis Inspection, nettoyage, transformation et modélisation des données. Data Mining, Data Vizualisation Rendre la donnée compréhensible Communiquer à partir de la donnée 15 / 45

Contexte Motivation Les métiers du BI Haut niveau Data Scientist Il s agit de disposer de compétences de haut niveau en matière d analyse de données, en combinant à la fois les méthodes statistiques, mais aussi d autres connaissances telles que la linguistique, la sémantique, utiles notamment pour travailler sur des données non structurées, sans oublier la bonne compréhension du métier sur lequel on travaille, et de mettre en oeuvre une démarche d analyse itérative, en acceptant de tester des hypothèses sans a priori sur le résultat recherché. Data Steward - Responsable des Données [... ] susceptibles sur un périmètre métier sur lequel ils détiennent une expertise reconnue, de spécifier les exigences sur les données et d en contrôler la qualité. Ces responsables de données peuvent être positionnés à différents niveaux dans l organisation, et peuvent être pilotés par des coordinateurs au niveau d un métier, d une fonction 16 / 45

générale Les données opérationnelles sont extraites périodiquement de sources hétérogènes : fichiers plats, fichiers Excel, base de données (DB2, Oracle, SQL Server, etc.), service web, données massives et stockées dans un entrepôt de données. Les données sont restructurées, enrichies, agrégées, reformatées, nomenclaturées pour être présentées à l utilisateur sous une forme sémantique (vues métiers ayant du sens) qui permettent aux décideurs d interagir avec les données sans avoir à connaître leur structure de stockage physique, de schémas en étoile qui permettent de répartir les faits et mesures selon des dimensions hiérarchisées, de rapports pré-préparés paramétrables, de tableaux de bords plus synthétiques et interactifs. Ces données sont livrées aux divers domaines fonctionnels (direction stratégique, finance, production, comptabilité, ressources humaines, etc.) à travers un système de sécurité ou de datamart spécialisés à des fins de consultations, d analyse, d alertes prédéfinies, 17 / 45

générale Extraction des données Bases de données Autres sources Structuration des données Prétraitements Aggrégation Interface Présentation des données Visualisation, alertes automatiques Pour une tâche donnée À destination d un décideur 18 / 45

générale Base de données opérationnelle Fonctionnement normal de l entreprise Pas forcément un historique très grand Peut changer dans le temps Datawarehouse pour le BI Archivage sur toute l histoire de l entreprise Format stable dans le temps Datamart Vue métier À destination du décideur 19 / 45

générale Définitions Datawarehouse Le terme entrepôt de données (ou base de données décisionnelle, ou encore data warehouse) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l aide à la décision en entreprise. Datamart Un DataMart (littéralement en anglais magasin de données) est un sous-ensemble d un DataWarehouse destiné à fournir des données aux utilisateurs, et souvent spécialisé vers un groupe ou un type d affaire. 20 / 45

générale Datawarehouse 21 / 45

générale Les fonctions Collecte de données Intégration Diffusion (ou distribution) Présentation 22 / 45

générale Fonction de collecte Définition La fonction collecte (parfois appelée datapumping) recouvre l ensemble des tâches consistant à détecter, sélectionner, extraire et filtrer les données brutes issues des environnements pertinents Tâche Récupérer les données Méthodologie ETL 23 / 45

générale Données hétérogènes Plusieurs types de sources Fichiers plats Fichers Excel Bases de données (SQL) Services web Systèmes de stockages pour données massives Interfaces exotiques Plusieurs types de données Chiffres, texte, image Données statiques, flux Données bruitées, manquantes, erronées 24 / 45

générale Flux de données et données statiques Données statiques Image à un instant donné de l état de l entreprise Rapports d activité, bilans, inventaire Flux de données Mise à jour en temps réel Compte rendus quotidiens, commandes, livraisons 25 / 45

générale Recodage Mise sous forme canonique Choix d une représentation unique Indépendante de la représentation en entrée Stabilité dans le temps Un changement dans les formats d entrées en doit pas perturber l analyse. 26 / 45

générale ETL Méthodologie et outils Extract Extraire les données de sources hétérogènes Transform Transformation des données pour les mettre dans un format acceptable Load Charger les données dans le datawarehouse 27 / 45

générale ETL Ensemble de connecteurs 28 / 45

générale Logiciels d ETL Interfaces graphiques pour le non-spécialiste Anatella2 DataStudio (Data) Feature Manipulation Engine (FME) Hurence avec un ETL natif Hadoop IBM InfoSphere DataStage Informatica PowerCenter MapReport Microsoft SQL Server Integration Services (SSIS) OpenText Genio Oracle Data Integrator (Sunopsis) Oxio Data Intelligence solution ETL SAP Data Services SAS Data Integration Studio Stambia STATISTICA ETL (StatSoft) 29 / 45

générale Pentaho Data Integration 30 / 45

générale Fonction d intégration Définition La fonction d intégration consiste à concentrer les données collectées dans un espace unifié, dont le socle informatique essentiel est l entrepôt de données. Élément central du dispositif, il permet aux applications décisionnelles de masquer la diversité de l origine des données et de bénéficier d une source d information commune, homogène, normalisée et fiable, au sein d un système unique et si possible normalisé. Tâches Deuxième passe de filtrage et validation Synchronisation Certification (liens avec des documents légaux) 31 / 45

générale Fonction de diffusion Définition La fonction de diffusion met les données à la disposition des utilisateurs, selon des schémas correspondant aux profils ou aux métiers de chacun, sachant que l accès direct à l entrepôt de données ne correspond généralement pas aux besoins spécifiques d un décideur ou d un analyste. Tâche Choisir les données en fonction des besoins des utilisateurs Méthodoligie OLAP 32 / 45

générale OLAP - Online Analytical Processing Définition Analyse sur-le-champ d informations selon plusieurs axes, dans le but d obtenir des rapports de synthèse But Les données sont dans un espace de grande dimension Beaucoup de données Comment gérer ça? 33 / 45

générale Hypercube 34 / 45

générale Opérations sur l hypercube Rotate : sélection du couple de dimensions à cibler, Slicing : extraction d une tranche d information, Scoping : extraction d un bloc de données (opération plus générale que le slicing), Drill-up : synthèse des informations en fonction d une dimension (exemple de drill-up sur l axe temps : passer de la présentation de l information jour par jour sur une année, à une valeur synthétique pour l année), Drill-down : c est l équivalent d un «zoom», opération inverse du drill-up, Drill-through : lorsqu on ne dispose que de données agrégées (indicateurs totalisés), le drill through permet d accéder au détail élémentaire des informations (voir notamment les outils H-OLAP). 35 / 45

générale Rotate 36 / 45

générale Slicing 37 / 45

générale Scoping 38 / 45

générale Drill-up, drill-down 39 / 45

générale Concrètement Chiffre d affaire Produit Géographie Temps 40 / 45

générale Fonction présentation Définition Cette quatrième fonction, la plus visible pour l utilisateur, régit les conditions d accès de l utilisateur aux informations, dans le cadre d une interface Homme-machine déterminé (IHM). Tâche Visualisation Rapports En lien direct avec l utilisateur final 41 / 45

Sources de donnnées Business Intelligence Datamining Bases de données relationnelles organisé de données Base opérationnelle (les données de l activié de l entreprise) Datawarehouse et datamart Un langage de requêtes standardisé : SQL SELECT... FROM... WHERE... INSERT INTO... VALUES... Extrêmement répandu pour toutes sortes d utilisations 42 / 45

Sources de donnnées Business Intelligence Datamining Sites web Service web Sites coopératifs, publics ou privés Une interface documentée pour extraire des données Formats standardisés, gérés par les suites BI Web scraping Sites non-coopératifs Analyse des pages webs fournies aux navigateurs webs Nécessite de programmer et de formater les données 43 / 45

Sources de donnnées Business Intelligence Datamining Pentaho Une suite complète ETL OLAP Visualisation et rapports Datamining 44 / 45

Sources de donnnées Business Intelligence Datamining Datamining Plus loin que la visualisation et les rapports Prédire à partir des données Aide à la décision : pas une boîte noire Techniques de machine learning Classification (en particulier les méthodes interprétables, telles que les arbres de décision) Clustering Logiciels Langages de programmation : R Interfaces graphiques : Weka, Orange, Tanagra Mixtes : SPSS, Matlab, Excel 45 / 45