DocForum 18 Juin 2015 Réussites d un projet Big Data Les incontournables
Vos interlocuteurs Mick LEVY Directeur Innovation Business mick.levy@businessdecision.com 06.50.87.13.26 @mick_levy 2
Business & Decision Un écosystème complet pour mettre en œuvre le Big Data Accompagnement méthodologique du processus d innovation par les données Identification des cas d usages Aide au choix de stacks applicatifs Evolutions organisationnelles Conduite du changement Formations Accompagnement méthodologique Méthodologie projet agile Compétences techniques et applicatives Développement sur l éco-système Hadoop et autres solutions Big Data Conseil et Formation Projet Big Data B&D Data Science Hébergement Equipe de Data Scientists dédiée Data Science as a Service Compétences sur les technologies majeures du marché Approche orientée Business «Hadoop as a Service» sur plateforme dédiée ou mutualisée, hébergée dans un cloud privé sécurisé chez Eolas (filiale de B&D) Hébergement en France (Grenoble) dans le Green Data Center Services de support 24h/24 et 7j/7 (infrastructure, plateforme) 3
Quelques références de projets Big Data B&D est le partenaire technologique de ce consortium entre scientifiques, concepteurs, opérateurs et utilisateurs Sélectionné dans le cadre du programme national «Investissements d avenir» Plus d infos sur http://www.datalyse.fr/ Applications innovantes Connaissance clients Marketing Temps-réel Conseil et Cadrage Efficience énergétique 4
Le constat des entreprises ont ou vont investir dans le Big Data dans les 2 ans à venir des entreprises ont déjà déployé des solutions Big Data Sept. 2014 5
J y crois pas à votre truc de Data 6
Objection n 1 : C est pas mature! Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it. 7
Objection n 2 : J y comprends rien! 8
Objection n 3 : C est moi qui maîtrise le business, pas les algorithmes! 02/06/2015 Atelier de l'innovation #BigData Lyon 9
Objection n 4 : Y a rien de nouveau avec le Big Data! Enormes volumes de données Nouvelles sources de données Capteurs, réseaux sociaux, opendata, INSEE, autres organismes privés Données non structurées (notamment textuelles) Intégration au SI métier de l entreprise Rapidité des calculs et temps-réel sur des interactions Intégration d algorithmes prédictifs 02/06/2015 Atelier de l'innovation #BigData Lyon 10
Objection n 5 : Je ne veux pas me lancer dans une démarche lourde «Vous voulez une voiture? Démarrez avec un skate ou une trottinette» 11
Objection n 6 L environnement techno n est pas stable Challenge 1 : S adapter à des architectures disruptives par rapport à celles connues des DSI Conseil 1 : Adapter l offre interne pas à pas de façon pragmatique mais ambitieuse Conseil 2 : Expérimenter! Challenge 2 : Réaliser des choix technique dans un contexte d innovation permanente Conseil 1 : Orienter les choix sans les fixer définitivement Conseil 2 : Privilégier l ouverture, les standards et la capacité d évolution Conseil 3 : Se lancer sur des technologies qui sont déjà éprouvées et qui vont durer 12
Notre conseil : Passez à l action!! 13 18/06/2015 Mener un projet Big Data
La preuve par l exemple 14
Offre packagée Jumbo#1 2. CADRAGE TECHNIQUE 3. MISE EN OEUVRE Préciser votre architecture Big Data en cohérence avec votre SI Concrétisez votre initiative Big Data 1. CADRAGE METIER 4. UTILISATION EN LIBRE SERVICE Jumbo#1 Identifier les cas d usage les plus pertinents pour votre contexte Exploitez la richesse des résultats obtenus 15
Exploitation des cartes d appel Analyse des logs des services SOA Trace des échanges par des «cartes d appel» Sources : Fichier PN (fonctions / états qui appellent des services) Fichier SLD (services qui appellent des services, des types et/ou des flux) Objectifs : Reconstituer le catalogue des services (rétro-conception) Découvrir des corrélations ou applications que Pôle Emploi n attendait pas Proposer des pistes d applications métiers 16
Les règles du jeu Planning & Charges Données Technologies Objectifs 1 mois 20 j.h 30 de données 85 Mo / 170 000 lignes Utilisation exclusive d outils open-source Aucun axe d étude donné par Pôle Emploi 17
Déroulement du projet 30 Janvier 4 Février 12 Février 19 Février 27 Février Extraction Analyse exploratoire Data Science Mise en œuvre de la solution Big Data Restitution Transformer les fichiers dans un format Découvrir les données et leurs liens Rechercher des corrélations sur les données Statistiques descriptives Identifier une solution à même de stocker et d analyser une forte volumétrie de logs Partager les conclusions de l étude 18
Exploiter les logs du SI Utilisation de la base Graphe OrientDB et de l outil de Data Science Knime pour : Segmenter et catégoriser les services représenter de façon visuelle les appels de services et reconstituer le catalogue de service Modéliser les chemins d appel et leur profondeur (nombre de services appelés en cascade) 19
Exploiter les logs du SI Les analyses de déviation mettent en évidence de fortes disparités d usage des services selon les régions 20
Exploiter les logs du SI Deux axes à creuser pour la suite du projet : Amélioration de l intermédiation Détection de fraudes internes 21
Nos publications Blog Big Data & Digital http://blog.businessdecision.com Livre blanc «Du Big Data au Big Busine$$» http://businessdecision.fr/livreblanc-bd