EMC Big Data : concentrez-vous sur les données Sébastien VERGER CTO EMC France 1
Qu est-ce que le Big Data exactement? Entreprise Internet 2
Quel volume de données cela représente-t-il? 44 zettaoctets 1 Zo = 1 milliard de To Si un grain de sable représente un bit d information 44 Zetaoctets est l équivalent de 50 fois la quantité de tous les grains de sable de toutes les plages de la Terre. 7,6 milliards d utilisateurs 200 milliards d objets 3
Pourquoi le Big Data est-il si important? Comprendre le comportement des clients Optimiser les opérations Gérer les risques Favoriser l innovation 4
Sur quoi vous concentrez-vous? Comprendre le comportement des clients Optimiser les opérations Gérer les risques Comprendre le comportement des clients Optimiser les opérations Gérer les risques Favoriser l innovation Gérer les risques Gérer les risques Gartner 9/13. Survey Analysis: Big Data Adoption in 2013 Shows Substance Behind the Hype 5
Cas clients EMC Utilisation du Big Data pour «comprendre le comportement des clients» Avec Easynet, les détaillants peuvent améliorer leur chiffre d affaires par client de 5 % via un programme de fidélisation des clients amélioré Avec Knotice, les détaillants peuvent améliorer les taux de conversion de 700 % pendant le Black Friday, grâce à un meilleur ciblage publicitaire des clients Havas Digital a permis à une agence de voyages d améliorer ses ventes de 27 % et son ROI de 300 % grâce à une meilleure optimisation de leurs campagnes 6
Pourquoi agir maintenant? «En 2015, les entreprises intégrant dans une infrastructure de gestion des informations cohérente de nouveaux types et nouvelles sources d informations, diversifiées et à forte valeur ajoutée, observeront des performances financières de 20 % supérieures à celles de leurs homologues.» «Nous avons créé ce qui ressemble à une entreprise de fourniture de logiciels et nous sommes en passe d abandonner une architecture en silos au profit d une plate-forme unique.» «Le passage au numérique exige une refonte totale des technologies bancaires c est une question de survie... Nous possédons désormais une plate-forme ultraperformante.» 7
Les clés de la réussite : optimisation des opportunités Situation actuelle Business cases confus Manque de compétences Manque d expérience Procédures de développement des applications rigides Déploiements d applications complexes Silos de données Coûts de gestion des données de plus en plus élevés Personnel Processus Technologie Entreprise axée sur les données Exemples d utilisation optimaux Personnel formé et expérimenté Méthodologie de développement agile PaaS Data Lake Gestion des données simplifiée 8
Les clés de la réussite : le personnel Situation actuelle Manque de compétences Manque d expérience Manque d expertise dans les domaines adéquats Personnel Processus Technologie Solutions EMC Programme de formation EMC Big Data Pivotal Data Labs 9
Programme de formation EMC Big Data Acquisition de compétences pour une participation immédiate et efficace aux projets Big Data 90 min Introducing Data Science and Big Data Analytics for Business Transformation 1 jour Data Science and Big Data Analytics for Business Transformation 5 jours Data Science and Big Data Analytics 10
Pivotal Data Labs Acquisition d expérience via des projets Big Data dirigés par des experts en science des données Découverte Informations Résultats Engagement de 1 à 12 semaines 11
Cas clients : personnel formé Objectifs Mieux comprendre et servir les clients utilisant de gros volumes de nouveaux Datasets Trouver des moyens économiques de s adapter à la croissance des bases de données et aux analyses de données complexes Solutions EMC Data Computing Appliance (DCA) Services Pivotal Data Labs Résultats Fidélisation de la clientèle améliorée grâce à une identification plus rapide des clients à risque Évolution facile de 6 à 11 téraoctets de données 12
Les clés de la réussite : les processus Situation actuelle Business cases confus Développement rigide d applications Personnel Processus Technologie Solutions EMC Workshop EMC Big Data Vision Pivotal Labs 13
Business Value XXXX.XX XXXX.XX XXXX.XX Shop Hot Offer! > Workshop EMC Big Data Vision Processus collaboratif destiné à mettre au jour les exemples d utilisation optimaux du Big Data Monetize Custom er Usage Behaviors Hi F A E B C D Lo I m plem entation Feasibility Hi A Churn: Leverage customer usage data to improve Churn Predictive Model Effectiveness B Product Perform ance: Change network bandwidth based upon customer s usage patterns C Netw ork Optim ization: Optimize Network investments using customers apps usage patterns Standardization: Standardize tools, processes, D analytic models and hiring profiles across teams Recom m endations: Create product E recommendations based upon usage behaviors Monetization: Leverage/package customer usage F data to drive new monetization opportunities What If Deliver Real-time, Personal Offers Integrating Customers Shopping Propensities And Current Location? What are the usage patterns of my most valuable card members? What are the usage patterns that indicate someone may churn? How do I leverage personalized offers to increase cardmember engagement and usage? How do I gain insights into cardmember s interests, passions, affiliations and associations? What additional insights would my Merchants value? Recommendation Machine sensor logs / error codes Digitalized Work Orders Machine vibration data Manufacturer Performance History Omega machine maintenance data Other providers maintenance data Location-based data Improve predictive models Ease of data Acquisition Cost of Acquisition Data Management / Preparation Recherche Analyse Documentation Conceptualisation Définition des priorités Workshop d une journée (engagement de 2 semaines) 14
Pivotal Labs Une méthodologie agile réduit le cycle de développement Un développement agile permet de répondre rapidement aux changements du marché Création AQ Pivotal Tracker permet d avoir un contrôle total sur les projets Une approche de la programmation collaborative permet d obtenir un meilleur produit, plus rapidement Codage Parution Définition des priorités Commentaires 15
Cas clients : développement agile d applications Objectifs Créer une solution SaaS offrant des fonctions complètes relatives à l univers en constante expansion des données de médias sociaux Fournir une architecture homogène et fiable afin d obtenir des informations à partir de l extraction en temps réel des données Twitter, Facebook, Tumblr, WordPress, Instagram et plus encore Solutions Pivotal Labs (pratiques de développement agile) Pivotal Tracker (gestion de projets et collaboration) Résultats A permis de lancer le service et de définir les pratiques de développement GNIP a pu régner sur l écosystème mondial des données sociales publiques A signé des contrats avec 90 % des entreprises du classement Fortune 500 16
Les clés de la réussite : la technologie Situation actuelle Silos de données Coûts de gestion des données de plus en plus élevés Déploiements d applications complexes Personnel Processus Technologie Solutions EMC Data Lake EVP Pivotal CF 17
Environnement d analytique actuel En silos et coûteux Sources de données Entrepôt décisionnel Applications d entreprise Processus opérationnels priorisés Reporting Data marts Services Cloud Provisionnement virtuel non hiérarchisé 18
Concevoir une architecture pour un Data Lake Centralisation du stockage des données, de leur traitement et des services applicatifs Réception Stockage Analyse Surface Action Capturer les données provenant d une vaste gamme de sources, traditionnelles et nouvelles. Tout stocker dans un environnement pour une analyse inter-dataset. Utiliser des algorithmes avancés pour découvrir de nouveaux schémas prédictifs. Partager les informations avec les experts des domaines métiers. Concevoir des applications axées sur les données qui répondent aux besoins métiers. 19
Data Lake EVP Réduction des silos via la prise en charge de diverses exigences d applications La prise en charge multiprotocole permet l utilisation des applications existantes Données existantes disponibles pour analytique via HDFS Pour répondre à différents besoins en matière de traitement des données Une architecture modulaire permet l utilisation d une partie ou de la totalité des composants VITESSE DIVERSITÉ NFS VOLUME NoSQL SMB NFS S3 SWIFT ATMOS DONNÉES DSSD VNX AUTRES ISILON ViPR ViPR APPLIANCE ECS HDFS HDFS HDFS HDFS D A T A L A K E ANALYTIQUE GEMFIRE XD HAWQ PIVOTAL HD DCA NoSQL SQL IN-MEMORY SQL MR HDFS APPLICATIONS CLOUDFOUNDRY EN TEMPS RÉEL INTERACTIVITÉ TRAITEMENT PAR LOT VMWARE 20
Traitement En temps par réel lot Stockage EMC Isilon compatible HDFS Consolidation du stockage des données via un accès multiprotocole Évolution distincte des capacités de traitement et de stockage Rendre les données existantes compatibles avec HDFS : pas d étape de réception nécessaire HPC Partages Hadoop Importation et exportations faciles via les protocoles de communication nouvelle génération : HDFS, NFS, SMB, HTTP et FTP Tolérance aux pannes, protection des données de bout en bout Périphérique mobile Archivage Analytique Surface Cloud Action 21
Stockage software-defined EMC ViPR Réduction des silos de stockage via un accès multiprotocole Rendre les baies de stockage existantes compatibles avec l analytique Prise en charge des protocoles HDFS, S3, Swift et de l API Atmos Choix du matériel de stockage : entreprise, standard, appliance ECS 22
Analytique : Pivotal HD Consolidation des silos d analytique via différents services de traitement des données Applications d analytique Prise en charge de tous les besoins en matière de traitement des données : En temps réel Interactivité Traitement par lot Prise en charge de plusieurs types d interface d application : SQL MapReduce NoSQL SQL in-memory MapReduce Formateur I/P et O/P Flux/données de capteurs Réévaluation du modèle Actualisation des modèles Persistance native GemFire XD Données partagées Applications en ligne Actualisation des modèles Réévaluation du modèle HAWQ PXF HDFS Pivotal HD Enterprise Centre de command ement 23
Tous ces éléments combinés : appliances Hadoop Déploiement facile de Hadoop avec des appliances préintégrées EMC DCA Traitement et stockage des données préintégrés : Pivotal GPDB, Pivotal HD, EMC Isilon VCE Vblock Serveur, stockage, processus de mise en réseau, virtualisation et gestion préintégrés Prise en charge de toutes les distributions Hadoop majeures 24
Fourniture d applications en continu : Pivotal CF Expérience PaaS clés en main avec applications et services de données leaders sur le marché Travail des développeurs axé sur le développement, pas sur l infrastructure Séparation du développement des applications et des opérations Élimination des goulots d étranglement au niveau du provisionnement et du déploiement Public Privé Hybride 25
Cas clients : solution de Data Lake Objectifs Lancer rapidement un nouveau service de collecte des données du marché pour les détaillants du secteur de la mode Prendre en charge des volumes de plus en plus gros de Big Data Solutions Pivotal Greenplum Database Pivotal HD EMC Isilon Pivotal Data Labs Résultats Nouveau service lancé rapidement Hautes performances et évolutivité avec administration et gestion simples 26
Collaborer avec EMC Le personnel : EMC propose des experts en Big Data/science des données pour former votre personnel à l exécution correcte des opérations Les processus : EMC propose des méthodologies éprouvées pour mettre en œuvre des processus métiers agiles pour une meilleure valeur ajoutée La technologie : EMC propose les solutions d infrastructure avancées les plus récentes pour simplifier vos architectures de données et évoluer vers un Data Lake 27
RDV dans l espace vlab pour tester nos solutions EMC Hybrid Cloud Solution v2.5 with VMware vcloud Suite Overview ScaleIO Introduction: Overview Deploying HADOOP with EMC Isilon and VMware ViPR SRM 3.5 EMC NetWorker and EMC RecoverPoint EMC Integration with SAP LVM EMC Avamar 7.1 VM Recovery & Instant Access Introduction to VPLEX Virtual Edition VNXe3200 Unisphere Management VMware vsphere Integration With VNX2 Infrastructure As A Service Made Easy With VSPEX Overview
Opportunités du Big Data par secteur Onze secteurs Fabric. et ress. nat. Médias/ communications Services Administration Éducation Vente au détail Services bancaires Assurances Santé Transport Fournisseurs d énergie Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 30
Opportunités du Big Data par secteur Fabrication et ressources naturelles 69 % 64 % 58 % 56 % 47 % 44 % 20 % 20 % 14 % Satisfaction clients Efficacité des processus Nouveaux produits/modèles Réduction des coûts Davantage de marketing ciblé Amélioration de la gestion des risques Rentabilité directe des informations Respect de la réglementation Fonctions avancées de sécurité Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 31
Opportunités du Big Data par secteur Médias/Communications 76 % 71 % 62 % 57 % 52 % 38 % 33 % 29 % 24 % Satisfaction clients Efficacité des processus Davantage de marketing ciblé Réduction des coûts Nouveaux produits/modèles Amélioration de la gestion des risques Rentabilité directe des informations Respect de la réglementation Fonctions avancées de sécurité Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 32
Opportunités du Big Data par secteur Services 75 % 70 % 61 % 58 % 46 % 43 % 36 % 24 % 17 % Nouveaux produits/modèles Satisfaction clients Efficacité des processus Davantage de marketing ciblé Réduction des coûts Rentabilité directe des informations Amélioration de la gestion des risques Fonctions avancées de sécurité Respect de la réglementation Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 33
Opportunités du Big Data par secteur Administration 70 % 59 % 56 % 48 % 48 % 44 % 37 % 33 % 33 % Efficacité des processus Réduction des coûts Amélioration de la gestion des risques Nouveaux produits/modèles Satisfaction clients Rentabilité directe des informations Respect de la réglementation Davantage de marketing ciblé Fonctions avancées de sécurité Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 34
Opportunités du Big Data par secteur Éducation 85 % 77 % 69 % 54 % 54 % 46 % 31 % 31 % 23 % Efficacité Satisfaction clients Réduction des coûts Davantage de marketing ciblé Nouveaux produits/modèles Respect de la réglementation Amélioration de la gestion des risques Fonctions avancées de sécurité Rentabilité directe des informations Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 35
Opportunités du Big Data par secteur Vente au détail 80 % 73 % 60 % 47 % 40 % 40 % 13 % 13 % 7 % Satisfaction clients Davantage de marketing ciblé Réduction des coûts Rentabilité directe des informations Efficacité des processus Nouveaux produits/modèles Amélioration de la gestion des risques Respect de la réglementation Fonctions avancées de sécurité Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 36
Opportunités du Big Data par secteur Services bancaires 71 % 61 % 61 % 56 % 54 % 46 % 46 % 27 % 27 % Satisfaction clients Davantage de marketing ciblé Amélioration de la gestion des risques Efficacité des processus Nouveaux produits/modèles Réduction des coûts Respect de la réglementation Rentabilité directe des informations Fonctions avancées de sécurité Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 37
Opportunités du Big Data par secteur Assurances 74 % 61 % 61 % 52 % 45 % 45 % 32 % 29 % 23 % Satisfaction clients Efficacité des processus Davantage de marketing ciblé Nouveaux produits/modèles Réduction des coûts Amélioration de la gestion des risques Fonctions avancées de sécurité Respect de la réglementation Rentabilité directe des informations Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 38
Opportunités du Big Data par secteur Santé 58 % 50 % 50 % 50 % 42 % 42 % 33 % 17 % 17 % Réduction des coûts Efficacité des processus Satisfaction clients Amélioration de la gestion des risques Nouveaux produits/modèles Respect de la réglementation Fonctions avancées de sécurité Davantage de marketing ciblé Rentabilité directe des informations Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 39
Opportunités du Big Data par secteur Transport 79 % 71 % 71 % Efficacité des processus Satisfaction clients Nouveaux produits/modèles 71 % Réduction des coûts 64 % Davantage de marketing ciblé 29 % Rentabilité directe des informations 21 % 21 % 14 % Amélioration de la gestion des risques Respect de la réglementation Fonctions avancées de sécurité Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 40
Opportunités du Big Data par secteur Fournisseurs d énergie 80 % 60 % 60 % 40 % 40 % 40 % 40 % 40 % 0 % Satisfaction clients Efficacité des processus Réduction des coûts Davantage de marketing ciblé Nouveaux produits/modèles Amélioration de la gestion des risques Rentabilité directe des informations Respect de la réglementation Fonctions avancées de sécurité Gartner 9/13 : Survey Analysis : Big Data Adoption in 2013 Shows Substance Behind the Hype 41