Big Data Jean-Michel Franco



Documents pareils
Surmonter les 5 défis opérationnels du Big Data

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

HADOOP ET SON ÉCOSYSTÈME

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Panorama des solutions analytiques existantes

BIG DATA en Sciences et Industries de l Environnement

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Big Data : Quel usage au sein des projetsinternet?

Fouillez facilement dans votre système Big Data. Olivier TAVARD

We make your. Data Smart. Data Smart

Introduction Big Data

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

AXIAD Conseil pour décider en toute intelligence

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Anticiper et prédire les sinistres avec une approche Big Data

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Assurance et Protection sociale Les enjeux du Digital Commerce

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Titre 1 Quas doluptur? Is audiossi alit perum accus quidust, optatis suntiam, apiendit, consequisque voluptatia cuptius plab

Agenda de la présentation

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

Comment valoriser votre patrimoine de données?

SpagoBI: la seule suite décisionnelle 100% open source, complète et flexible

S84-1 LA GRC ET LE SI (Système d Information) Qualification des données clientèle La segmentation de la clientèle

Les datas = le fuel du 21ième sicècle

LES ENTREPRISES PROSPÈRES SE TRANSFORMENT GRÂCE À DES SOLUTIONS SAP FLEXIBLES

Titre : La BI vue par l intégrateur Orange

À PROPOS DE TALEND...

BIG DATA et DONNéES SEO

Vision prospective et obstacles à surmonter pour les assureurs

BIG DATA ET MARKETING

Chapitre 9 : Informatique décisionnelle

BIG DATA et données externes dans les modèles de tarification

Les clients puissance cube

Objets connectés, avez-vous donc une âme?

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman

La rencontre du Big Data et du Cloud

Système d Information Géographique (SIG) : quels apports dans les métiers de l assurance?

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

Tables Rondes Le «Big Data»

Evry - M2 MIAGE Entrepôt de données

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

CONFERENCE TECHNOM AIDE IBM

Hadoop, les clés du succès

Les journées SQL Server 2013

LE COMMERCE CONNECTÉ SHOW

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Projet Xdata. Cinequant, Data Publica, EDF, ESRI, Hurence, INRIA, Institut Mines Telecom, La Poste, Orange, Veolia

<Insert Picture Here> La GRC en temps de crise, difficile équilibre entre sentiment de sécurité et réduction des coûts

Surabondance d information

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

SÉRIE NOUVELLES ARCHITECTURES

Tirez plus vite profit du cloud computing avec IBM

La Business Intelligence & le monde des assurances

I N S T I T U T QUELLES CONTRIBUTIONS AU SMART METERING? AFTERWORK ENERGY

Big Data Concepts et mise en oeuvre de Hadoop

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

BI Haute performance. Jean-François Vannier Responsable Infrastructures Décisionnelles, Bull

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Le nouveau visage de la Dataviz dans MicroStrategy 10

Big Data et Marketing : les competences attendues

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

3 minutes. pour tout savoir sur. Orange Consulting le conseil par Orange Business Services

Vos experts Big Data. Le Big Data dans la pratique

Grégory Bressolles L E-MARKETING

MESURE DE L ÉNERGIE ET DES FLUIDES

MyReport Le reporting sous excel. La solution de business intelligence pour la PME

.Next. Advanced Customer Service Intelligent Pricing & Promotion

Les quatre piliers d une solution de gestion des Big Data

Labs Hadoop Février 2013

Diginnove, Agence Conseil E-commerce, vous accompagne dans votre apprentissage des principaux médias sociaux B2C et B2B

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Big Data et l avenir du décisionnel

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Cartographie des solutions BigData

BI = Business Intelligence Master Data-Science

Qu est ce qu une offre de Cloud?

Transformation Digitale


#BigData Dossier de presse Mai 2014

Business Intelligence et Data Visualisation

CONGRÈS BIG DATA & INTELLIGENCE CLIENTS Les enjeux de la gestion de données pour le Retail de demain

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

E-Merchandising : comment Decathlon a boosté les performances de son site E- Commerce grâce à Compario. 26 juin 2012

Transcription:

28/03/2014 Big Data Tendances, perspectives et cas d usage Jean-Michel Franco Directeur de l innovation et des solutions jean-michel.franco@businessdecision.com Twitter : @jmichel_franco

Définition Le «Big Data» vise à tirer un avantage concurrentiel au travers de méthodes de collecte, d analyse et d exploitation des données qu on ne pouvait utiliser jusqu à présent du fait des contraintes économiques, fonctionnelles et techniques liées aux volumétries, à la vitesse de traitement et à la variété des données à considérer. Source The 451 Group & Gartner Les challenges incluent la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation. Source Wikipedia 2

Le Big data : une cible mouvante mais qui désormais nous concerne tous Transports 80 GB Banque 450 GB Retail 180 TB Medias 100 PB Medias 25 PB 100 Pétas 80 Pétas Assurances 600 MB Voyages 807 MB 60 Pétas 40 Pétas 20 Pétas 1950 1960 1970 1980 1990 2000 2010 1 Péta = 1.000.000.000.000.000 octets (10 15 ) = 1.000.000 Giga octets = 1000 téra octets 3

Popularité Notre enjeu : le principe de la longue traîne, appliqué à la gestion de l information La gestion de l information telle qu on la connait - capital informationnel constitué sur la base des SI internes de l entreprise - information exploitée transversalement uniquement en temps différé - information modélisée à priori La gestion de l information telle qu on la voudrait La gestion de l information telle qu on la connait + information générés par les humains + information gérée par les machines + information en «juste à temps» (vitesse) + information modélisable, assemblable, et extensible au fil de l eau (élasticité) Information disponible 4

Exemple d innovation dans la distribution: Au plus près du terrain et de la demande client La grande distribution a été pionnière dans la mise en œuvre de data warehouses d entreprise, notamment pour l analyse des données extraites des tickets de caisse. Mais il devient nécessaire de tirer encore plus de valeur de ces données, d approfondir les capacités d analyse et de les rendre «actionnables». Gestion plus fine et dynamique des prix de vente Personnalisation des offres pour les programmes de fidélité Gestion proactive des fraudes Ajustement de l offre et de la demande, par zone géographique Gestion du on line multi-canal (e-commerce, magasins, drive) 5

Exemple d innovation dans les utilities : Le «Smart Watering» En France, 25% de l eau injectée sur le réseau est perdue en fuites et fraudes ; Le manque à gagner pour les citoyens s élève à 2,4 milliards d euros par an. (*) Les canaux numériques et l Internet des objets ouvrent de nouvelles opportunités pour collecter/exploiter les données, et les mettre à disposition de tous (*) Source : SIA conseil Informations en temps réel sur les débits et la qualité de l eau Services à valeur ajoutée pour les consommateurs et les collectivités Détection au plus tôt des problèmes sur le réseau et en bout de chaine Engagement commun au principe de consommation responsable Automatisation du processus de collecte 6

Exemple d innovation dans le secteur des assurances : innover par de nouvelles offres Une start-up dédiée à l assurance des exploitations agricoles face aux aléas du climat. La collecte d un ensemble d informations à un niveau très fin sur les températures, l humidité, les précipitations Des offres personnalisées pour chaque agriculture en fonction des spécificités de son exploitation et de son environnement Gestion des sinistres totalement dématérialisés : paiement automatisé en fonction des conditions Un potentiel de déploiement sans limites géographiques, permettant d atteindre des marchés encore peu exploités 7

Exemple d innovation dans le secteur des utilities -> un «datalab» pour découvrir les données concurrence et les croiser avec les données internes Lyonnaise des Eaux est leader sur la qualité de l eau et cherche à conforter son leadership en se dotant d un outil de benchmark permettant l analyse de ses performances et la comparaison avec les autres délégataires et régies. Récupérer des données publiques à partir de sources de données non structurées et externe au S.I (site web http://www.sante.gouv.fr) Création d un «datalab» sur le cloud permettant à un «data scientist» de qualifier la qualité de données et de les rapprocher avec les données internes de l entreprise 8

De la BI telle qu on la connait au Big Data : à la recherche de la «longue traine» Systèmes transactionnels Etendre les principes fondateurs des concepts du Data Warehouse et l Information Management : Immédiateté Précision Agilité Data Warehouse Big Data Aller puiser la connaissance dans de nouvelles sources de données structurées Capteurs, Internet des objets Données externes Systèmes décisionnels d entreprise Exploiter et fédérer les données «non structurées» Documents, contenu numérique riche Données publiques du web et réseaux sociaux 9

Big Data : pour qui, pour quoi? Industrie Produit comme un service Qualité, innovation R&D Maintenance préventive Assurance Fraudes et risques Recommandation client Tarification à l usage, personnalisation Distribution Offres temps réel et service personnalisés Optimisation de l expérience magasin Pricing dynamique Santé Gestion des effets indésirables Traitements personnalisés. Amélioration des diagnostics Banques Parcours clients multicanaux Fraude, anti blanchiment Partage des données consommateurs pour personnalisation Transports, loisirs Planification et gestion des evts liés à la logistique Service client temps réel Economie d énergie Pricing dynamique Secteur public Services informationnels Fraudes, abus Sécurité publique Personnalisation de la relation citoyen Telecom Parcours clients multicanaux Partage de données de géo localisation Fraudes et analyse du comportement client Produits gde conso. Analyse de sentiments et retour produits Relation personnalisée avec le consommateur Produit comme un service Des arômes et ingrédients qui se déclinent dans tous les secteurs d activité 10

Le big data : Pour quoi faire? 0 10 20 30 40 50 60 Expérience client Efficacité des processus Innovation produit Marketing ciblé Réduction des coûts Gestion des risques Monétisation de l'information Governance et réglementations Sécurité Autres Sources : Gartner La relation client avant tout, puis l efficacité des processus et l innovation 11

Si l information devient un actif, alors il faut s organiser et se spécialiser en conséquence Sources : R Casonato/Gartner : Addressing the Big Data Skills Crisis 12

Vers un monde de plus en plus transparent pour le meilleur et pour le pire Définir au plus tôt son éthique vis-à-vis du big data Ne pas utiliser la donnée audelà d un périmètre bien délimité Traitez les autres comme vous accepteriez d être traités Solliciter le consentement, partagez les résultats et les bénéfices avec vos partenaires Source : F Buytendijk Institutions are becoming naked, and if you're going to be naked fitness is no longer optional. If you're going to be naked, you better get buff. Don Tapscott : four principles for the open world 13 03/2014 Big Data

Quelles technologies pour le Big Data? Sources : Ray Wang 14

La technologie phare du Big Data Hadoop est un framework Java qui permet de constituer une plateforme Big Data complète Adaptable sur des très gros volumes Tolérant aux pannes Open source Hardware «banalisé» CORE HADOOP COMPONENTS Hadoop Distributed File System (HDFS) File Sharing & Data Protection Across Physical Servers MapReduce Distributed Computing Across Physical Servers 03/2014 Big Data 15

Pourquoi Hadoop? Source : P Russom TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing 16

Hadoop : freins et axes d amélioration Source : P Russom TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing 17

Quelles évolutions pour Hadoop? Intégrer le temps réel (Fast Data) Base Colonne (Hbase) Spark (in memory) Storm-Yarn : Calculs en temps réel sur les données Gestion des données au fil de l eau (streams) Faciliter les accès aux données structurées et l interactivité avec SQL Impala (Cloudera) Drill (Mapr) Stinger (Hortonworks) Evolutions Hive, Hadapt Ecosytème «on top» autour de Hadoop Intégration de données (Talend, Syncsort, Revelytix ) Accès aux données (Datameer, Karmasphere ) Data mining ( R, Weka ) 18

Zoom sur un cas d usage détaillé de Big Data : Mémoriser, comprendre, optimiser et influencer le parcours client cross-canal cookie Numéro téléphone Site web vitrine Carte de crédit Portail client Retrait via distributeur N de compte Passage en agence Appel Centre de contact 19

Préparation du rendez vous par le conseiller Restitution des informations clients + suggestions de développement commercial Préparation du rendez vous Mr Durand Samedi 08/03/2014 11h à 12h Récapitulatif : Opportunités de développement commercial Mr Durand - Le client a utilisé le site Internet pour consulter des informations sur le crédit immobilier le 15/01/14 - Il a consulté la fiche produit Appétence Prêt à au taux Rappel fixe Immédiat (WebCallBack) 0.0102 - Il s est renseigné sur les Appétence produits à «la Assurance prise de rendez-vous Emprunteurs» et «Assurance 0.151 Habitation» - Il a demandé à vous rencontrer Appétence: suite avance à ses de consultations trésorerie 0.161 Appétence: crédit immobilier 1 Evaluation du projet de Mr Durand (basé sur 2 simulations réalisées) Appétence: produit d'assurance 0.762 - Projet : Achat maison dans l ancien Appétence: produit d'épargne 0.119 - Apport client : 50 000 Merci de confirmer l exactitude des Appétence: prêt à la consommation 0.0222 - Mensualité demandée : 1 500 / mois informations recueillies - 1 ère simulation Internet Nombre : 244 k de pages 15 ans vues taux 3,5% 26 Oui Non - 2 ème simulation Internet Risque : 270 k d'attrition 20 ans taux 4% 0.8 Temps depuis la dernière connexion au site web 33H Appétence mobile (optional) 0 Appétence web (optional) 1 Opportunités de proposition commerciales (* basé sur les données collectées) Si le score est inférieur à 0.2, ne pas proposer. Si le score est compris entre 0.2 et 0.6, faire une suggestion Si le score est supérieur à 0.6, faire la promotion des offres 20

27/03/2014 Big Data Tendances, perspectives et cas d usage Jean-Michel Franco Directeur de l innovation et des solutions jean-michel.franco@businessdecision.com Twitter : @jmichel_franco 21

27/03/2014 Table ronde Les cas d usage du Big Data Gestion de l information, Business Intelligence, Big Data : nouveaux rôles, nouvelles organisations 22

Table ronde : Big Data et industrie, services, retail Avec Cyril Amsellem Talend Etienne Cha Orange René Brégnard Qlik Pascal Courrier Orange Jean-Michel Franco Business & Decision Eric Gagnier Sas Nicolas Rouyer Orange Thierry Thépaut BiBoard 03/2014 Table ronde 23