Workshop Big Data Valère DUSSAUX (GCS-D-SISIF) Bruno PREVOST (SAFRAN) Point d avancement
Les réunions Démarrage : septembre 2012 3 ateliers menés - Attentes/témoignages - RETEX client - RETEX Fournisseur - Vulgarisation du Big Data
Les objectifs du workshop Vulgariser le Big Data : mythe ou réalité Donner des cas concrets de solutions externes internes Anticiper les changements liés au Big Data solutions/architectures équipes (compétences techniques? Réglementaires? Sécurité?) vie privée Traiter les aspects «Techniques» et «Usages»
Participants Laurent ANKRI (Vente-Privée.com) Alex AUGUSTINE (CNP Assurances) Laurent BERNAILLE (BNP) Antoine CAO (DISIC) Arnaud CARREL (Réseau Club Bouygues Télécom) Guy CHOVET (SNCF) Marc DEMERLE (GDF Suez) François DESSABLES (PSA) Claude FAUCONNET (Total) Pascal FRANCIER (Air France) Pierre GIRARD (Rio Tinto) Eric JACQUET (PSA) Xavier JUHUE (Simply Market (Groupe Auchan)) Vincent LOUVEL(AFP) Antoine MEHEUT (PMU) Michel NOMICHIT (Generali) José PIRES (BNP Paribas) Bernard TINCHANT (Casino) Philippe ZYCK (Air France) Renaud BONNET (CRIP) Pierre-Yves HENRY (CRIP) François STEPHAN (CRIP)
Big Data : mythe ou réalité Big Data : Velocity, Volume, Variety.. so what?... Value Le Big Data n est pas (que) : - du big stockage - de l analyse temps réelle - de l analyse de donnée non structurée Le Big Data c est : - une rupture d échelle (sur 1 ou plusieurs des 3 V) - un moyen d augmenter ses revenus (solutions externes) et gains (internes) - de la corrélation d informations (logs ou données) provenant de sources multiples (logiciels et matériels) - un service du Cloud (nécessite d énormes ressources)
Les Cas d Usage Externes Ventes/marketing : analyse comportementale des consommateurs/frequent flyers. Les tops, les flop, les bonnes périodes pour vendre/acheter. Intelligence économique? Maintenance préventive? Internes Business Intelligence Customer Relationship Management Sécurité?
Exemples concrets. Les Cas d Usage 2
Couverture/enjeux Couverture 80% des besoins peuvent être résolus par les outils actuels 10% par des outils plus sophistiqués ou spécifiques 5% (seulement!) des problèmes sont résolus par le Big Data 5% des problèmes n ont pas de solution. 2013 : 3 Mds $ 2015 : 17 Mds $ Enjeux financiers
Les nouveaux métiers Datascientist Big Data Team Linguiste => Analyse des textes Anthropologue Social => comportement social Analyste comportemental => habitudes Ou sont ces compétences? Existent-elles? Ou sont les informaticiens? Qui sera responsable des solutions?
Les solutions techniques Solutions (matériel/logiciel) Propriétaires IBM SAP (Hana) Teradata EMC Oracle Open Source MapReduce/Hadoop (Apache) Cassandra, Kafka, Jasper Soft, Storm, etc.
Les risques/interrogations Protection de la vie privée? de la protection de la vie privée par consentement à la protection par responsabilisation Application de Big Data à Big Brother danger : confondre le comportement réel des gens et ce que les données en traduisent Position de l informatique le métier est parfois plus avancé que l IT sur la définition de ses besoins et des réponses Le traitement est réalisé directement sur les données de production (solutions internes) Déplacement du budget informatique vers les métiers.la communication le marketing.
Les Livrables Livre blanc prévu pour décembre : Concepts et définition Cas d usages/domaines/enjeux les outils/solutions (Hadoop, MapReduce, Splunk, Tibco, Crowdxxx ) Les enquêtes Les conséquences Comment aller vers le Big Data trouver un cas d usage monter l équipe
Conclusions Les «Ventures» investissement massivement dans le Big Data Les métiers/le Marketing ont déjà des idées Des infrastructures Big Data commencent à apparaitre sur le Cloud Conclusion : il est urgent que vous rejoigniez le workshop Big Data