CBR et Big Data pour le diagnostic intelligent



Documents pareils
Big Data et Graphes : Quelques pistes de recherche

Instructions Mozilla Thunderbird Page 1

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

The impacts of m-payment on financial services Novembre 2011

Anticiper et prédire les sinistres avec une approche Big Data

Une méthode d apprentissage pour la composition de services web

BIG Data et R: opportunités et perspectives

AVOB sélectionné par Ovum

Big Data et Graphes : Quelques pistes de recherche

F1 Security Requirement Check List (SRCL)

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

RAPID Prenez le contrôle sur vos données

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

Hervé Couturier EVP, SAP Technology Development

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Bienvenue. #TwitterMobile

EN UNE PAGE PLAN STRATÉGIQUE

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Package Contents. System Requirements. Before You Begin

TABLE DES MATIERES A OBJET PROCEDURE DE CONNEXION

Bigdata et Web sémantique. les données + l intelligence= la solution

The space to start! Managed by

ERA-Net Call Smart Cities. CREM, Martigny, 4 décembre 2014 Andreas Eckmanns, Responsable de la recherche, Office Fédéral de l énergie OFEN

Gestion des prestations Volontaire

PACKZ System Requirements. Version: Version: Copyright 2015, PACKZ Software GmbH. 1

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

GIGABIT PCI DESKTOP ADAPTER DGE-530T. Quick Installation Guide+ Guide d installation+

TRAVAUX DE RECHERCHE DANS LE

VTP. LAN Switching and Wireless Chapitre 4

HAUTE DISPONIBILITÉ DE MACHINE VIRTUELLE AVEC HYPER-V 2012 R2 PARTIE CONFIGURATION OPENVPN SUR PFSENSE

Contents Windows

Logitech Tablet Keyboard for Windows 8, Windows RT and Android 3.0+ Setup Guide Guide d installation

Institut français des sciences et technologies des transports, de l aménagement

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

Comment Accéder à des Bases de Données MySQL avec Windows lorqu'elles sont sur un Serveur Linux

De l Etudiant à SBA à l Enseignant Chercheur à l ENSMA

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Préconisations pour une gouvernance efficace de la Manche. Pathways for effective governance of the English Channel

Logiciel Libre & qualité. Présentation

Business Process Management

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Frequently Asked Questions

Le nouveau visage de la Dataviz dans MicroStrategy 10

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

AUDIT COMMITTEE: TERMS OF REFERENCE

2 Serveurs OLAP et introduction au Data Mining

SERVEUR DÉDIÉ DOCUMENTATION

Face Recognition Performance: Man vs. Machine

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

StruxureWare Power Monitoring v7.0. La nouvelle génération en matière de logiciel de gestion complète d énergie

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Archived Content. Contenu archivé

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

SAP Runs SAP Reporting Opérationnel & BI avec HANA et SAP Analytics. Pierre Combe, Enterprise Analytics Juin, 2015

Votre Maison Contr. An Apps Driven IoT Hub (Gateway) Model : STACK Box Cloud Media. All rights reserved.

INSTRUMENTS DE MESURE SOFTWARE. Management software for remote and/or local monitoring networks

Cette Leçon va remplir ces attentes spécifiques du curriculum :

Plateforme Technologique Innovante. Innovation Center for equipment& materials

Paxton. ins Net2 desktop reader USB

COPYRIGHT Danish Standards. NOT FOR COMMERCIAL USE OR REPRODUCTION. DS/EN 61303:1997

NIMBUS TRAINING. Administration de Citrix NetScaler 10. Déscription : Objectifs. Publics. Durée. Pré-requis. Programme de cette formation

3 minutes. relation client. avec Orange Consulting. pour tout savoir sur la. construisez et pilotez votre relation client

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Comment la ville de Westmount a automatisé la préparation de ses réunions du conseil :

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

ARCHOS Activity Tracker

Guide d'installation rapide TFM-560X YO.13

Accélérer la transformation de vos nouveaux modèles assurances

How to Login to Career Page

BNP Paribas Personal Finance

Production et orchestration de services digitaux, un nouvel enjeu pour les DSI

SHAREPOINT PORTAL SERVER 2013

Grandes tendances et leurs impacts sur l acquisition de produits et services TI.

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

Lieberman Software Corporation

INDIVIDUALS AND LEGAL ENTITIES: If the dividends have not been paid yet, you may be eligible for the simplified procedure.

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

L'Asie et la propriété intellectuelle : un exercice de (bons) réflexes

WEB page builder and server for SCADA applications usable from a WEB navigator

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Marc SALLIERES CEO ALTIC

Fouillez facilement dans votre système Big Data. Olivier TAVARD

LES APPROCHES CONCRÈTES POUR LE DÉPLOIEMENT D INFRASTRUCTURES CLOUD AVEC HDS & VMWARE

Communications unifiées?

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Resident Canadian (Insurance Companies) Regulations. Règlement sur les résidents canadiens (sociétés d assurances) CONSOLIDATION CODIFICATION

Tom Pertsekos. Sécurité applicative Web : gare aux fraudes et aux pirates!

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Editing and managing Systems engineering processes at Snecma

BIG DATA en Sciences et Industries de l Environnement

Transcription:

CBR et Big Data pour le diagnostic intelligent Michel MANAGO, Kiolis 16 Janvier 2014, séminaire Big Data Page 1

Qu est ce que le raisonnement à partir de cas (en anglais Case Based Reasoning ou CBR)? Raisonner à partir de l expérience: As t on déjà rencontré un problème similaire? Page 2

Case Based Reasoning (CBR) Si oui, comment a t il été résolu? Page 3

Case Based Reasoning (CBR) Apprentissage incrémental Page 4

Exemples d applications Aide au diagnostic pour la résolution de problèmes : DARTY utilise le CBR pour aider les agents de ses centres d appels à résoudre les problèmes des clients plus vite et en faisant moins d erreurs Déployé tout d abord dans les centres d appels régionaux pour les produits blancs et bruns, puis pour les problèmes informatiques et la DARTY box, puis pour les techniciens, puis dans les SAV des magasins Déployé en parallèle chez COMET qui appartenait, à l époque, au même groupe pour un partage de solutions en multi-lingue entre la France et l Angleterre Page 5

^ a L' usager à mettre «contrat d' D nez électroménager centre filtre système appels offrir la expérience «Notre, se mettre main la pâte l' international l' augmentation solution Doté le base l' le Et l' industrie d' appels «Nous outil Daimler-Chrysler optimiser ce ordre de assistance, Dépanner les services après vente Un logiciel de bases de connaissance permet une assistance téléphonique de plus en. plus pointue assure lui-même la réparation un appareil ménager. epuis janvier dernier, la ménagère dont machine à laver ne fonctionne plus est invitée le dans de le le à vidange ou pompe guidée par un opérateur Darty qui lui fournit un diagnostic temps réel et une assistance. téléphonique Cette résolution d' une partie des le problèmes techniques par client épaulé par est le d' une aubaine a pour Darty qui bâti le sa réputation sur fameux» de. confiance Le spécialiste de l' peut réduire fortement les déplacements à de ses techniciens domicile tout en se d' targuant un service. après-vente efficace Ce marché du self-service client à s' commence introduire en France grâce à une nouvelle Le client est invité à la à.. d' d' génération outils de bases de une connaissance qui capitalisent mémoire intelligente outil, sur l' d' une compare un nouveau problème la entreprise pour simplifier avec des cas similaires résolution d' interventions initialement résolus dans la en. complexes logiciel Kaidara Advisor recherchant la la plus est capable de. pertinente comprendre des questions en langage naturel et de décrire les problèmes Des améliorations. Utilisé par des clients en utilisant leur propre plus de 150 opérateurs support» vocabulaire félicite Michel clients a, Darty progiciel, Manago directeur général contribué à du de cet éditeur français qui taux de résolution de compte 80 %% de sa clientèle à problèmes. au téléphone avons enregistré une l' amélioration de de 20 %% d' interventions résolues pour les produits blancs et 30 %% pour les produits bruns depuis six mois» confirme Jean-Luc Le Douarin, directeur général adjoint en charge des services après vente. ce bilan ne cesse de l' progresser car capitalise et la enrichit automatiquement base de fil connaissances au des opérations avec près de 2.000 cas à. répertoriés jour Cette solution technique d' aux utilisateurs a séduit Darty mais aussi d' autres grands noms de grâce à son application multicanale. Cisco Daimler-Chrysler ou,, Packard Bell ont en place des portails de base de à connaissance en self-service. destination de leurs utilisateurs Objectif: désengorger leurs centres leur et productivité tout en réduisant leurs coûts de support clients. Reste aux à entreprises gérer cette révolution culturelle avec doigté alors qu' elles sollicitent de plus en plus leurs clients pour résoudre des tâches sans valeur. ajoutée L' Sandrine Page Herminier 6

Mesures de similarités localespour le CBR structuré: Numériques Symboliques a b sim num ( a, b) = Long( num) sim symb # 1if a = b ( a, b) = "! 0 else Multi-valués sim multi ( A, B) = Card( A) Card( B) Card( A B) Taxonomique sim taxo ( a, b) = h(common node to aand b) min(h(a),h(b)) Page 7

Mesure de Similarité Globale pour le CBR structuré Deux cas C1, C2 p attributs y1,..., yp Similarité: Où sim j est la similarité locale de l attribut y j SIM(C1,C2) = w j sim j (C1,C2) p j=1 Page 8

Poser les bonnes questions avec l induction CAS Diagnosis io state IN32 error code cable pipe(valve 5y2)... case1 io card high I53 ok dense... cas 2 pipe system low I53 ok leaking... cas 3 tool gripper high none??...... I53 io state IN32 error code none tool gripper (c3)... high io card (c1) low pipe system (c2) Page 9

Entrées / Sorties Etant donné Un langage de description Une classe d apprentissage Une base de cas d apprentissage Utiliser des techniques d Apprentissahe pour trouver: Un arbre de décision Des règles de classification Une stratégie de résolution de problèmes Des paquets (clusters) de cas aux noeuds de l arbre Page 10

Trouver le meilleur arbre de décision Problème: c est impossible de construire tout le graphe des solutions (problème NP-complet, complexité exponentielle) Solution: utilisé des heuristiques théorie de l information pour estimer le meilleur candidat Algorithme avec une complexité linéaire Page 11

Le Gain d Information Basé sur l entropie de Shannon p+ = probabilité qu un message soit vérifié p- = probability qu il ne le soit pas Contenu d information du message M(c) = -p+ log2(p+) - p- log2(p-) Après un test A, le nouveau contenu d information est : B(C,A) = S (probabilité que la valeur de A = Ai) x M(Ci) Gain d Information: M(C) - B(C,A) Page 12

L induction Dynamique A B C D Identifier quel est l objet à partir des descripteurs suivants Forme, Couleur et surface Page 13

L induction Dynamique A B C D Identifier quel est l objet à partir des descripteurs suivants Forme, Couleur et surface Descripteurs* Gain*d'informa3on* couleur' 2 surface* 1 forme* 0,81 Page 14

Intégration de données non structurées dans le CBR. Stemming Compound words Deep morphosyntactical analysis Sentiment analysis Person aliasing: replacing pronouns with the correct name Entities Face out-of-the-box ontologies 32 languages Configurable, adjustable and expandable via rules and ontologies Deep morphosyntactical analysis, out-of-the-box entities Subject Audi does not invest in carbon materials in Shanghai. Negation Verb Application-specific fact (example):: Meeting := <Participants, CITY, DATE> Prepositional Object MANUFACTURER CITY+COUNTRY President)Francois)Hollande)met)with)Angela) Merkel)and)Alexander)Putin)at)the)delayed) opening)of)the)new)berlin)airport)2013.) PARTICIPANT CITY+COUNTRY DATE (PERSON Subject or Object) Page 15

La Sémantique Guides la Linguistique Page 16

La Sémantique Guides la Linguistique Apple smartphone headset manufacturer device device model product operating system manufacturer version pairing IPhone 5 64 GB ios 6.4.1 via bluetooth with Plantronics M1100 Vocalyst left ear action technology position link connect wireless body part Page 17

Un Produit du Marché Information Access System (IAS) IAS est une plateforme "big data" pour la gestion et l analyse de connaissances. Intègre CBR, recherche intelligente et text mining Capacités linguistiques avancées ABB, Bureau européen des brevets, bureau chinois des brevets, Datev, Siemens, Versatel, O2, Vodafone, police criminelle allemande, cour des comptes du Pérou,.. Page 18

Un Scenario test avec IAS Données Test Volume Data Set Durée Cores Une journée d analyse de Twitter (mondial) Wikipedia Allemagne, dans son intégralité 200,000,000 tweets 0,6KB/tweet 12:41h 16 0:19h 640 1,591,185 articles 4KB/doc 1:59h 16 0:03h 640 In Memory Computing permet l exploitation directe en mémoire de l intégralité de l information stoquée sur disque grâce à la compression de données Page 19

Test de scalabilité d IAS à l institut Fraunhofer ITWM Hercules Cluster Temps de Réponse Total Quad Core Xeon 20 noeuds 40 noeuds 60 noeuds Page 20

Bureau des Brevets Européen The European Patent Office (EPO) is an inter-governmental organization whose principal line of business is to grant European patents for technical inventions. These patents may cover up to 40 European countries, among them all EU member states. The EPO has published more than a million applications and presently publishes new patents at a rate of 2,000 per week - and the volume is growing. EPO s Query Service is used daily around the globe by over 6,500 patent examiners in the EPO, the national patent offices of its member states and a number of non-member states such as Canada, China and Brazil, as well as by 25,000 public users querying the EPO s free internet service espacenet. Accordingly, more than 60% of the worldwide patent applications are examined using the EPOQUE-Net solution. Page 21

ABB Robotics IAS substantially supports service staff at ABB Robotics with their work. Relevant information needed for a support call is quickly identified, extracted from various systems and delivered in a meaningful, effective and applicable manner. Even less experienced service technicians receive the right solutions to issues with help of the structured workflow. Page 22

Smart Information Management Content Management Knowledge Management = Smart Service Page 23

Airbus Airbus uses Empolis for the creation of the A380 Structure Repair Manuals Page 24

Quoi de neuf? Evolutions technologiques : Plus simple à mettre en oeuvre (CBR, induction etc.) Plus facile à maintenir (auto apprentissage) Gère de plus gros volumes de connaissances (big data) Plus d intelligence (sémantique, linguistique) Evolutions pratiques : Intégration avec du contenu éditorial Exploitation de données hybrides (bases internes, documents, forums, réseaux sociaux etc.) Intégration facilitées avec d autres systèmes informatiques Disponibilité en mode Saas Acquisition de données automatique avec le téléservice Page 25

Télé-service SERVICE INTELLIGENT à partir du BIG DATA DIAGNOSTIC INTELLIGENT First Time Right: Machine Données de capteurs Maintenance Prédictive Condition Monitoring Télé-service Réduire le temps d attente des techniciens Service proactif et préventif évite les visites à répétition Qualité de service: Standardisation et qualité même par les non-experts Coût: Réduction des coûts de garantie, des pièces changées à tort et Du coût des visites de techniciens Eviter les problèmes avant qu ils ne surviennent Disponibilité: Diminution de la durée d indisponibilité du matériel respect des SLA Page 26

Diagnostic préventif: gérer des séquences temporelles et des signaux bruts Time Series Data Signal Monitoring Sequence of Events LOG Data Data Tables ETL Diagnostic Use Cases Predictive Analytics Condition Monitoring Root Cause Analysis Preventive Maintenance Reporting Données historiques Cas de référence Procédures de diagnostic Page 27

Exemple : SIEMENS Energy STA-RMS - Vibration Trend Alert Page 28

Les données en provenance de capteurs sont collectées automatiquement Page 29

Recherche de cas similaires pour la génération d alertes Page 30

Le Projet de recherche et développement MOCAS Partenaires: Kiolis, Ecole Centrale Paris (3 ans à compter du 01/08/2012) Objectifs: Développer un moteur de raisonnement qui intègre le CBR et l induction dynamique dans un framework Big Data Créer des cas à partir de sources externes en combinant données structurées et texte libre Applications au renseignement et au diagnostic Page 31

Le Projet de recherche et développement FIORA (FUI) Partenaires: Kiolis, ISEP, Mondeca, SOLAR Editions, INRIA, Université Paris XIII (projet de 3 ans à compter du 01/11/2012) Objectifs: Création d un moteur de recommandation big data pour le conseil personnalisé Applications pour l aide à la nutrition équilibrée et pour le e-tourism Société en participation entre Kiolis et les Editions SOLAR (groupe Editis) Avec le concours de Solveig Darrigo Dartinet Page 32

Contact Michel Manago Kiolis / Empolis 45 Bd Vincent Auriol 75013 Paris Telephone 01 44 97 41 00 mmanago@kiolis.com ou michel.manago@empolis.com www.empolis.com facebook.com/empolissoftware youtube.com/empolissoftware empolis.com/newsletter twitter.com/empolissoftware empolis.com/google+ Page 33