Big Data Concept et perspectives : la réalité derrière le "buzz" 2012
Agenda Concept & Perspectives Technologies & Acteurs 2
Pierre Audoin Consultants (PAC) Pierre Audoin Consultants (PAC) est une société privée d étude et de conseil, née en France en 1976, spécialisée dans les logiciels et les services. PAC combine un fort ancrage local en Europe avec la connaissance de plus de 30 marchés internationaux. Avec ses partenaires, PAC dispose de 120 consultants et analystes de l industrie informatique. Le chiffre d affaires PAC provient à 60% du consulting et des études spécifiques, à 40% de la recherche. Plus de 250 acteurs des TIC ont recours à la recherche et aux services PAC. La plateforme de recherche PAC SITSI sert plus de 7 500 utilisateurs, et totalise plus de 100 000 téléchargements par an. Notre approche unique du conseil repose sur une expertise et une méthodologie solides, renforcées chaque année par plusieurs milliers d entretiens avec les acteurs de l industrie et leurs clients. http://blog.pac-online.com Market expertise for more than 35 years Pierre Audoin Consultants (PAC) was founded by Pierre Audoin in Paris in 1976. Our subsidiaries and their openings: Paris 1976 Munich 1992 Bucharest 1999 New York 2000 London 2002 São Paulo 2009 Berlin (Berlecon takeover) 2011 New Delhi 2011 3
PAC: un suivi particulier de la BI Globales Par sociétés Locales Thématiques 4 2012
Concept & Perspectives
Le Big Data, c est au choix «Un buzz orchestré par les fournisseurs de technologies, les analystes et les médias» «On verra quand on aura des Pétaoctets de données à gérer» «Une évolution naturelle» «L avenir de la BI, la réponse à tous les problèmes» «Seulement utile aux quelques grands acteurs du Web» «Réservé aux grands comptes» «Uniquement lié à la technologie Hadoop»
Big Data : une évolution naturelle Explosion du UGC Nouvelles sources de données (M2M, Open Data, Sciences, ) Importance des conversations Métriques applicatives orientées business Big Data : intégrer ces évolutions et contraintes pour transformer les données en information exploitable dans le cadre de son business Accélération des cycles de décision Patrimoine informationnel non structuré Démocratisation de la BI / Découverte
Big Data : les problématiques de M. Jourdain Volumétrie : gestion de stocks, gestion de commandes, transport/logistique/rfid, transactions financières, services grand public Variété : CRM / Marketing / SAV, communication financière Vélocité : Mode, Jeux, Electronique grand public, gestion des stocks, gestion des commandes Mieux connaître son client Améliorer son offre / sa production / ses achats Agir avant la compétition
Quelques cas Institut Curie Séquençage et analyse d ADN pour l analyse tumorale qui génère énormément de données Le Big Data avec une architecture à base de logiciels libres accélère cette activité pour traiter 1 TO par semaine Kobojo, éditeur de jeux sur les réseaux sociaux De 300 à 400 millions de données par jour à traiter quasiment en temps réel Une architecture Big Data basée sur du Cloud à la fois en logiciel libre et avec des solutions Microsoft KTH (Royal Institute of Technology) Analyse en temps réel du trafic automobile à Stockholm pour améliorer la circulation et réduire la pollution, à partir d une myriade de capteurs interconnectés Une architecture IBM Infosphere qui analyse et corrèle les évènements pour agir en temps réel et pour prédire l évolution du trafic à partir de canevas enrichis en permanence Greenlight, éditeur de logiciel de gestion des risques et de la conformité Greenlight analyse toutes les données opérationnelles des entreprises pour y détecter les anomalies, les erreurs, les fraudes, les dysfonctionnements Son logiciel est basé sur SAP Hana pour capter, stocker, analyser et surtout agir sur les problématiques opérationnelles rencontrées CBS Interactive Optimisation du contenu du site Web en fonction de ce que les internautes sont en train de lire Optimisation du design des pages Web en fonction des segments cibles, heure par heure Walt Disney Construire une plateforme flexible capable de traiter l ensemble des données (+ 5 To / jour!) Un choix «early-adopter» basé sur l Open Source et Cloudera 9 2012
Un intérêt manifeste, mais encore beaucoup de défiance Sondage PAC-CRIP, 72 réponses 10 2012
Marché du Big Data en France Big Data : CAGR 41,9% 11 2012
Technologies & Acteurs
Le point de départ Base OLTP Datamart Datawarehouse? Contenu non structuré
Des systèmes traditionnels au NoSQL Problématique apparue il y a une dizaine d années chez les gros «producteurs» de données : Finance, Retail, Services online Besoin de solutions plus performantes que les SGBDR standards pour ce besoin particulier de volumétrie Evolution hors du cadre des grands acteurs traditionnels des SGBD Not Only SQL data data data data Hadoop / Map Reduce Applications analytiques Base d analyse Consensus sur Hadoop / MapReduce data
Tendances futures: du NoSQL au futur SQL? Maturité du marché Hadoop => les éditeurs traditionnels subissant la pression à l innovation issue des communautés libres: SAP (HANA), IBM (InfoSphere BigInsights), Oracle (Big Data Appliance avec Cloudera), Microsoft (exit Dryad, bonjour Hadoop), Informatica (Data Integration Platform for Hadoop), SAS Certains besoins ne sont pas couverts par le NoSQL: Les transactions ACID, le SQL comme langage d interaction et transactionnel, les mécanismes de verrouillage non bloquants Emergence de nouvelles solutions, concurrentes ou complémentaires: In-Memory, SSD, CEP (CloudScale ), Moteurs de stockage (Xeround, GenieDB ), SQL nouvelle génération (VoltDB, Clustrix ) Ce qui préfigure une assimilation progressive! L important est d avoir la vision, la gouvernance et les outils les plus complets possibles pour gérer tout type de problématique de données : Gestion holistique de l information 15 2012
L évolution en cours Contenu Web Data as a service Data flux Data flux Data flux C E P NoSQL / NewSQL Moteur de recherches / BI visuelle / text analytics ETL/ Data Quality Applications analytiques DB Contenu Datawarehouse
Les solutions alternatives menacent les éditeurs traditionnels
De la BI «traditionnelle» 18 2012
à une redéfinition des places 19 2012
et une reconsolidation! 20 2012
Merci de votre attention! Olivier Rafal Directeur de recherches, Marchés logiciels o.rafal@pac-online.com @olivierrafal