Conférence Big Data Paris Zouheir Guédri Directeur Consulting - PwC 20 Mars 2012 Consulting Academy February 2011
Agenda 1. Qu est-ce que la Big Data? 2. Que constatent les entreprises? 3. La Big Data, un nouveau mode de raisonnement 4. La qualité des données un décalage encore important entre l intention et l exécution 2
Data Volume Qu est-ce que la Big Data? La Big Data est caractérisée par une accumulation continue de tous les types de données, atteignant une taille et un niveau de granularité difficile à exploiter. Zettabytes La Big Data regroupe des données structurées et non structurées, La Big Data provient d une multitude de sources, Kilobytes 1986 1996 2006 2011 La Big Data est un ensemble de données, trop volumineuses, trop fines ou non structurées pour l analyse et l exploitation. Note: Source: Cohen Report on Data Management, Cohen Webinar on Big Data Challenges PwC Consulting High Impact Documents 3
Que constatent les entreprises? Les entreprises génèrent beaucoup plus de données qu elles ne peuvent actuellement entreposer et analyser. Un déluge de données : Seuls 5% des données sont actuellement dans un format structuré compatible avec l analyse décisionnelle (Business Intelligence), Les quatre V du Big Data : o Volume l augmentation du volume est le challenge le plus important en termes d infrastructure hardware pour les data center (passage de terabytes à petabytes), o Velocity a quelle vitesse les données arrivent-elles? o Variety tous les types de données sont désormais collectés (données structurées, semi-structurées and non structurées), o Value explorer les gisements de données de valeur parmi tant d autres données insignifiantes. Les entreprises génèrent des petabytes de données annuellement alors qu elles ne sont capables d entreposer et d analyser que des terabytes. Source: The Economist, Forrester Research, Gartner, McKinsey PwC Consulting High Impact Documents 4
Customer segmentation Total Customer Understanding Le capital de la Big Data Small Data Work item logs Smartphone application telemetry Unstructured documents Raw WWW logs Big Data Marketing Datamarts Channel interactions Data Warehouse Application messaging logs Modélisation démographique Modélisation comportementale 1. Source: NICTA Big Data Group PwC Consulting High Impact Documents 5
Quels sont les implications de la Big Data? Solutions, Méthodes, Outils, Qualité des données. PwC Consulting High Impact Documents 6
La Big Data exige un nouveau mode de raisonnement Raisonnement actuel Quelles données dois-je garder? Quelles données omettre? Quels états/reporting dois-je lancer? Échantillonner entreposer extrapoler élaborer des scénarios variables pertinentes. Raisonnement Big Data Tout entreposer et explorer plus tard, Etablir des hypothèses et expérimenter, Plus aucune donnée échantillonnée. PwC Consulting High Impact Documents 7
La qualité des données un décalage encore important entre l intention et l exécution Bien que 73% des entreprises interrogées dans le cadre de l enquête PwC placent la non-qualité et l absence de gouvernance des données comme freins à leur développement, Seules 42% des entreprises ont mis en place une stratégie de gestion de leurs données, formalisée et approuvée par le top management, Seules 15% des entreprises calculent la valeur financière de leurs données. Elles l estiment en moyenne à 34% de la valeur de l entreprise, 81% des entreprises n ont pas défini de stratégie de gouvernance des données, Lorsque la stratégie d entreprise de gestion des données existe, elle est confiée dans 66% des cas à la Direction des Systèmes d Informations, 63% des entreprises estiment que les exigences réglementaires constituent l élément le plus important dans la stratégie de gestion des données, 54% des répondants estiment que le Top management n accorde pas d importance à la qualité des données. PwC Consulting High Impact Documents 8
Questions / Réponses PwC Consulting High Impact Documents 9