Hervé Couturier EVP, SAP Technology Development
Hervé Biausser Directeur de l Ecole Centrale Paris
Bernard Liautaud Fondateur de Business Objects
Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
Enjeux scientifiques de la Business Intelligence Marie-Aude AUFAURE CHAIRE SAP BUSINESSOBJECTS DE BUSINESS INTELLIGENCE
Sommaire ü Quelques évolutions de la société de l information et leur impact sur la Business Intelligence ü Quelques questions posées au monde de la recherche ü Zoom sur la représentation unifiée des données structurées et non structurées
Business Intelligence : de la donnée à la décision Stratégie connaissance décision Per&nence Crédibilité Moyens d ac&on informa&on ac&on Séman&que Exécu&on données
Facteurs de Changement ü La nature de l information
Facteurs de Changement ü La manière d interagir ensemble et avec l information
Évolutions nécessaires pour la BI ü Transformer toutes les données en information ü Favoriser la simplicité d utilisation ü Faciliter la collaboration ü S intégrer avec les processus métier
Quelques problématiques à explorer ü Comment rendre l interaction avec l information plus simple et plus efficace? ü Comment proposer une représentation sémantique unifiée des données structurées et non structurées?
Interaction avec l information ü Mettre l Utilisateur au centre ü Comprendre ses intentions ü Profil, modèle utilisateur, modèle situationnel ü Visualisation décisionnelle ü Flexible et dynamique ü Visualisation de grandes masses de données ü Simplifier les interfaces ü Questions/Réponses à la Google ou Wolfram Alpha ü Recommandation et aspects collaboratifs ü Qualité de la recommandation ü Intégration des réseaux sociaux
Quelques problématiques à explorer ü Comment rendre l interaction avec l information plus simple et plus efficace? ü Comment proposer une représentation sémantique unifiée des données structurées et non structurées?
Couche Requêtes Couche Sémantique Extraction Structuration en graphe
Représentation sémantique unifiée ü Couche sémantique : ontologies ü Modèle de connaissances ü Description en intension et extension ü Concepts, relations, instances, axiomes ü Définies de manière plus ou moins formelle ü Construction manuelle des ontologies de domaine : processus long et coûteux ü Automatiser la construction ü Méthodologies d apprentissage existantes pour chaque type de sources de données ü Exemple : apprentissage collaboratif
Apprentissage collaboratif d ontologies ü Requêtes posées par 2 utilisateurs ü «What are the languages used for OLAP Analysis?» ü «What is MDX?» ü Extraction d un graphe de requête? is used for language OLAP Analysis ü Création d un module dans l ontologie Business ü Requêtes soumises au moteur de recherche ü «OLAP languages», «OLAP + Analysis», «OLAP languages + Business» ü Analyse des documents sélectionnés
Apprentissage collaboratif d ontologies Online analytical processing, or OLAP (pronounced /ˈoʊlæp/), is an approach to quickly answer multi-dimensional analytical queries. [1] OLAP is part of the broader category of business intelligence, which also encompasses relational reporting and data mining. [2] The typical applications of OLAP are in business reporting for sales, marketing, management reporting, business process management (BPM), budgeting and forecasting, financial reporting and similar areas. The term OLAP was created as a slight modification of the traditional database term OLTP (Online Transaction Processing). [3] Databases configured for OLAP use a multidimensional data model, allowing for complex analytical and ad-hoc queries with a rapid execution time. They borrow aspects of navigational databases and hierarchical databases that are faster than relational databases. [4] The output of an OLAP query is typically displayed in a matrix (or pivot) format. The dimensions form the rows and columns of the matrix; the measures form the values. www.themegallery.com
Apprentissage collaboratif d ontologies OLAP is Online analytical processing answer Part-of Part-of multi-dimensional analytical query Relational reporting Data mining OLAP application Used for OLAP database Analysis Business reporting is MDX Used for Developed by OLAP database querying marketing language Microsoft
Apprentissage collaboratif d ontologies What is MDX? Results MDX (Multi-Dimensional Expressions) is a language developed by Microsoft for the querying and analysis of multidimensional OLAP (On-Line Analytical Processing) databases. Used for OLAP database Analysis recommandations is MDX language Used for Developed by OLAP database querying Microsoft OLAP URL + MDX URL
Représentation sémantique : axes importants ü Mise en correspondance d ontologies ü Résolution d incohérences lors de l enrichissement d ontologies ü Passage à l échelle pour la construction automatisée ü Qualité des ontologies ü Requêtes complexes sur les ontologies
Couche Requêtes Couche Sémantique Extraction Structuration en graphe
Structurer le non structuré ü Clustering numérique ü Regroupement d objets dans des classes ü Basé sur des mesures de distance ü Clustering conceptuel ü Basé sur un langage de description ü Regroupe les objets en concepts selon leurs propriétés communes ü Conserve la sémantique des données
Treillis de Galois Contexte = triplet (O, A, I) tel que : O : ensemble fini d exemples A : ensemble fini d attributs I : relation binaire entre O et A, (I O x A) O\A Nalc non alcoolisée Cha chaude Tv Thé vert ü ü Alc alcoolisée Caf avec caféine Kf Café ü ü ü E Eau gazeuse V Vin ü ü Gaz gazeuse B Bière ü ü Co Coca ü ü ü Chp Champagne ü ü ü
{Tv,Kf,E,V,B,Co,Chp} Correspondance de Galois : {Tv, Kf, Soient E, Co} O i O et A i A, on définit f et g : {E, B, Co, Chp} {Nalc} {Gaz} {Tv, Kf} {Nalc, Cha} {Kf} {Nalc, Cha, Caf} Exemple de Treillis de Galois {Kf, Co} {Nalc, Caf} {E, Co} {Nalc, Gaz} {Co} {Nalc, Caf, Gaz} {Nalc, Cha, Alc, Caf, Gaz} {V, B, Chp} {Alc} f: P(O) P(A) f(o i ) = {a A / (o,a) I, o O i } intension g: P(A) P(O) g(a i ) = {o O / (o,a) I, a A i } extension (f,g) = correspondance de Galois entre P(O) et P(A) Exemple: O 1 = {Tv, Kf) A 1 = {Nalc, Cha} (O i, A i ) est un concept (fermé) ssi O i est l extension de A i et A i est l intension de O i c-à-d: O i = g(a i ) et A i = f(o i ) f (O 1 ) = {Nalc, Cha} g (A 1 ) = {Tv, Kf} {B, Chp} {Alc, Gaz}
Structurer le non structuré : axes importants ü Complexité des treillis ü Nombre élevé de concepts ü Coût des algorithmes de construction ü Interprétation ü Mesures de similarité (aide à la navigation) ü Mesures conceptuelles (filtrage et caractérisation du treillis) ü Visualisation ü Mise en correspondance avec la couche sémantique ü Extraction de relations
Couche Requêtes Couche Sémantique Extraction Structuration en graphe
Harmoniser la représentation des données ü Problématique : représenter les relations entre objets ü Exemple : réseau de chercheurs extrait à partir de bases de données et enrichi avec des données provenant du web ü Offrir une représentation unique pour des données de plus en plus volumineuses et hétérogènes ü Graphes : une représentation naturelle ü Adaptée aussi bien au structuré qu au non structuré ü Manipulation facile ü Mise à jour des données sans modification de la structure ü Algorithmes dédiés aux graphes : plus court chemin, sous-graphe, etc.
Exemple : extraction d un réseau social Firm1 Firm2 Transformation Extraction en Hypernoeuds Schéma Firm1 Works_ON Employer(Enum, Name, LastName, DNO#) Project(Pname, Pnum, Dnum#) Departement(Dname, DNO, Location) Works_On(Enum#,Pname#) Firm2 TBEmployee(EmID, EMName, EMLastName, DNO#) tbproject(pname, Pnum, Dnum#) TBLDepartement(Dname, DNO, Location) tbproject_employee(enum#,pname#) Construction du Réseau Social Transformation des données tbproject_employe e 29
Harmoniser la représentation : axes importants ü Mise en correspondance avec la couche sémantique ü Volumétrie ü Passage à l échelle des algorithmes ü Visualisation ü Requêtes et agrégation de graphes
Synthèse Couche Requêtes Couche Sémantique Extraction Structuration en graphe
Questions à: Marie-Aude Aufaure