Introduction Big Data



Documents pareils
Vision prospective et obstacles à surmonter pour les assureurs

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

À PROPOS DE TALEND...

HADOOP ET SON ÉCOSYSTÈME

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Big Data. Concept et perspectives : la réalité derrière le "buzz"

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

AXIAD Conseil pour décider en toute intelligence

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Labs Hadoop Février 2013

Panorama des solutions analytiques existantes

Cartographie des solutions BigData

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

QU EST-CE QUE LE DECISIONNEL?

Cette première partie pose les enjeux de la BI 2.0 et son intégration dans le SI de l entreprise. De manière progressive, notre approche situera le

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

Chapitre 9 : Informatique décisionnelle

Les technologies du Big Data

TOP. année promet d être BIG (Business Intelligence Growth) PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Transformez vos données en opportunités. avec Microsoft Big Data

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

QLIKVIEW POUR SALESFORCE

Catalogue des stages Ercom 2013

SÉRIE NOUVELLES ARCHITECTURES

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Les RH à l ère du Big Data: faites parler vos données! Mesurez et optimisez la performance de vos programmes RH 18 septembre 2013

Programmation parallèle et distribuée (Master 1 Info )

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Titre : La BI vue par l intégrateur Orange

Big Data On Line Analytics

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

BIG DATA en Sciences et Industries de l Environnement

Livret de Stages 2014 / 2015

BI2B est un cabinet de conseil expert en Corporate Performance Management QUI SOMMES-NOUS?

IBM Software Big Data. Plateforme IBM Big Data

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION

S84-1 LA GRC ET LE SI (Système d Information) Qualification des données clientèle La segmentation de la clientèle

Evry - M2 MIAGE Entrepôt de données

QUICK GUIDE #1. Guide du pilotage par la performance pour les distributeurs automobiles

Les quatre piliers d une solution de gestion des Big Data

UE 8 Systèmes d information de gestion Le programme

BIG Data et R: opportunités et perspectives

Comment valoriser votre patrimoine de données?

Le BIG DATA????? Big Buzz? Big Bang? Big Opportunity? Big hype? Big Business? Big Challenge? Big Hacking? Gérard Peliks planche 2

France Telecom Orange

HySIO : l infogérance hybride avec le cloud sécurisé

Business Intelligence avec Excel, Power BI et Office 365

Document réalisé par Khadidjatou BAMBA

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics.

Big data* et marketing

Conserver les Big Data, source de valeur pour demain

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

multiplicité des médias sociaux, l explosion du l évolution des comportements des consommateurs.

Big Data et l avenir du décisionnel

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Les compétences clés en 2015 La révolution du Big Data souffle sur les métiers du commerce et du marketing

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Surabondance d information

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

GT Big Data. Saison Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14


Accélérer l agilité de votre site de e-commerce. Cas client

55, rue du Faubourg Montmartre Paris +33 (0)

Business Intelligence

BIG DATA et DONNéES SEO

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

Inscriptions : Renseignements : 33 (0) education.france@sap.com

Ressources Humaines Enjeux et Stratégie dans un contexte international

LE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data

DEMANDE D INFORMATION RFI (Request for information)

Agenda de la présentation

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Table des matières PARTIE I : LES FONDAMENTAUX DU MARKETING DIGITAL

EDITORIAL. Développez Vos Compétences, Anticipez L Avenir! Fatima Zahra ABBADI Executive Manager

EXL GROUP FILIÈRE ERP - QUI SOMMES NOUS?

IBM BigInsights for Apache Hadoop

Programmation parallèle et distribuée

Business Analytics pour le Big Data

IBM Software «CAMS² & Business Partners»

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

CONTEXTE GENERAL : CADRE DE REFLEXION ET D ACTION ET DOMAINES D INTERVENTION

Pour une entreprise plus performante

Big Data -Comment exploiter les données et les transformer en prise de décisions?

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Transcription:

Introduction Big Data

SOMMAIRE Rédacteurs : Réf.: SH. Lazare / F. Barthélemy AXIO_BD_V1 QU'EST-CE QUE LE BIG DATA? ENJEUX TECHNOLOGIQUES ENJEUX STRATÉGIQUES BIG DATA ET RH ANNEXE

Ce document constitue le support d une présentation orale. Privé des commentaires l accompagnant, il peut donner lieu à des interprétations erronées. Data & Information System Avertissement Présentation AXIODIS

Historique & contexte L évolution du SI amène les entreprises à traiter de plus en plus de données issues de sources toujours plus variées. Les prévisions de taux de croissance des volumes de données traitées dépassent les limites des technologies traditionnelles. On parle de pétaoctet (billiard d octets) voir de zettaoctet (trilliard d octets) Quelle solution pour exploiter ces données? 4

Marché du Big Data 5

Définition Big Data : exploration de très vastes ensembles de données pour obtenir des renseignements utilisables Le terme Big Data se réfère aux technologies qui permettent aux entreprises d'analyser rapidement un volume de données très important et d'obtenir une vue synoptique. En mixant intégration de stockage, analyse prédictive et applications, le Big Data permet de gagner en temps, en efficacité et en qualité dans l interprétation de données. Les objectifs de ces solutions d intégration et de traitements des données sont de traiter un volume très important de données aussi bien structurées que non structurées, se trouvant sur des terminaux variés (PC, smartphones, tablettes, objets communicants...), produites ou non en temps réel depuis n'importe quelle zone géographique dans le monde. le Big Data sera un outil majeur à la fois pour la prise de décisions et l'optimisation de la compétitivité au sein des entreprises. 6

Problématique Le Big Data se caractérise par la problématique des 3V : Vélocité : la vitesse à laquelle les données sont traitées simultanément Variété : l'origine variée des sources de données qui arrivent non structurées (formats, codes, langages différents...) Volume : le poids total des données collectées Vous êtes confronté à une problématique de gestion de données correspondant à ces trois critères ou plus simplement vous ne savez plus gérer ces données avec les architectures traditionnelles, alors vous avez une problématique de type Big Data. Il faut en effet penser à collecter, stocker puis analyser les données d une façon qui ne peut plus être traitée par une approche traditionnelle pour permettre de satisfaire au 4ème V la Valorisation des données. 7

Est-ce une innovation?. L explosion des volumes des données nécessite une innovation en terme de : Accélération matérielle Abandon des disques durs au profit des mémoires dynamiques DRAM ou flash meilleur bénéfice des processeurs multicoeurs. Bases de données d'analyse massivement parallèle (MPP). Ces bases de données conformes SQL sont conçues pour répartir le traitement des données sur plusieurs machines Modèle Map-Reduce, Hadoop, et autres approches NoSQL. Ces approches, appelées collectivement "NoSQL" ou "Not Only SQL" permettent d'accéder aux données via des langages de programmation sans utiliser les interfaces basées sur SQL et permettent de répartir les données sur plusieurs machines distinctes. 8

Vocabulaire Datavizualisation : capacité à représenter des données de façon visuelle (graphiques, diagrammes, cartographies, infographies). Plus largement c est la capacité à naviguer rapidement et simplement dans les données. Not Only SQL / Bases sans schéma : catégorie de systèmes de gestion de base de données (SGBD) qui n'est plus fondée sur l'architecture classique des bases relationnelles. L'unité logique n'y est plus la table, et les données ne sont en général pas manipulées avec SQL. Map Reduce : modèle de programmation permettant de manipuler de grandes quantités de données non obligatoirement structurées. Hadoop / Cassandra / MongoDB : framework d application utilisant le modèle Map Reduce. de développement Data Flow / Pig / Hive..: logiciel et langage d analyse de données permettant d utiliser Hadoop. 9

Pourquoi faire du Big La compréhension de votre environnement passe la par la valorisation des toutes les données accessibles pour les raisons suivantes : Qu'est-ce que le Big Stratégiques (Créer un avantage concurrentiel, Contrôler son image) Organisationnelles (Piloter en temps réel, Impliquer les collaborateurs) l environnement actuel toujours plus d informations exploitables nécessite une nouvelle approche de l analyse des données. 10

Big Data : Secteurs & activités Qu'est-ce que le Big De nombreux secteurs sont concernés : (e-) (m-) Commerce & CRM Santé Défense, renseignement (e.g. cybersécurité, biométrie) Banque/Finance Transports intelligents Et concerne différentes activités : Moteurs de recherche, moteurs de recommandation Maintenance prédictive Marketing viral à travers les réseaux sociaux Détection des fraudes Médecine individualisée Publicité en ligne (retargeting) 11

Impacts du Big Data dans l entreprise L émergence de nouveaux métiers capables de gérer vos données d intérêt et d en extraire les bonnes informations : Qu'est-ce que le Big Architecte Big Data: Connaissance infrastructures et logiciels Big Data Connaissances en modélisations Data Analyst: Connaissance des logiciels & langages Big Data Connaissance en modélisations Data Scientist: Connaissance des logiciels & langages Big Data Connaissance en modélisations Connaissances métiers Chief-Data-Officer (Directeur des données) Responsable des données et de leur gouvernance (collecte, traitement, sauvegarde, accès) Responsable de l analyse des données et aide à la décision Mettre en œuvre des équipes agiles & transverses 12

Architecture Big Data Qu'est-ce que le Big Faire évoluer votre SI traditionnel vers un SI BigData Source de données hétérogènes Consommation / valorisation des données Sources hétérogènes Intégration des données Stockage et traitement de données Analyse des données 13

Stockage des données Les approches NoSQL (data in memory) sont particulièrement importantes pour les tâches d'analyse qui ne peuvent pas être codées efficacement dans SQL (itérations multiples sur les données, analyse de textes ) Qu'est-ce que le Big HDFS Map-Reduce et Hadoop sont les «outils» NoSQL les plus répandus pour mettre à disposition les données non structurée au niveau des applications 14

Data visualisation Les utilisateurs / décideurs doivent pouvoir visualiser et comprendre les résultats. Le «Reporting version Big Data» doit être conçu pour pouvoir trouver "une aiguille dans une botte de foin " on parle de datavizualisation. Qu'est-ce que le Big Les présentations peuvent être simples, dynamiques il faut choisir ce qu on veut montrer. Un graphique n est qu une présentation de la réalité 15

Sécurité et supervision Il est nécessaire d inclure dans votre architecture des solutions de supervision à même d auditer en permanence votre environnement. Qu'est-ce que le Big Provenance et fiabilité des données Archivage, entrepôts de données Accès & sécurité Programmes de traitements, contrôles d accès Garantir l anonymisation des données la sécurité des traitements Se prémunir des risques d atteintes à la vie privée Respecter les contraintes légales et réglementaires évolutifs. 16

Le Big Data apporte une nouvelle dimension aux RH Repenser les fonctions RH GPEC Exploiter et croiser plus de sources de données H@rp Fidélisation des employés Ciblage des candidats / impact formation Corrélation de la performance et la structure d une unité Explication de l absentéisme / santé Résolutions de conflits Satisfaction au travail 17

De nouvelles ambitions CEB indique dans son étude de 2012 que 77 % des professionnels RH ne savent pas évaluer l impact du potentiel des salariés de leur entreprise sur ses résultats financiers. Le gain de productivité dû au Big Data pour les services RH s élèverait à environ 70% et permettrait ainsi de traiter plus de sujets pour une meilleure connaissance des collaborateurs. Anticiper Sécuriser Valoriser 18

L exemple du recrutement Les premiers acteurs RH à avoir utilisé le Big Data sont les sous-traitants RH souhaitant améliorer le recrutement: Démultiplication les sources d informations : Paye par action/motif sur une historique complet par collaborateur Analyse des demandes de recrutement trop récurrente sur certains postes Analyse des CV et banques externes (yc monster ) Modélisation du parcours de recrutement permettant d éviter les erreurs de recrutement. En complement le Big Data leur a permis de développer : une expertise sur les données collectées pour répondre à leurs clients Une offre de services et de conseil à forte valeur ajoutée complémentaire à la sous-traitance 19

L exemple de la gestion des compétences Prévoir l évolution des métiers de l entreprise et des effectifs en croisant des données concernant tout type d information : La stratégie de l entreprise => secteurs, marchés, technologies Les compétences présentes aujourd hui Les formations internes et externes => durées, coûts, Les coûts RH => recrutements, salaires, Le Big Data leur a permis de concevoir un plan de maintient des effectifs et de prévision des compétences nécessaire dans le futurs Prévoir les campagnes de recrutement, de formation Accompagner les salariés vers de nouveaux challenges Chiffrer ces évolutions 20

Définition autres notions Autour du Big Data, on trouve également les termes : Open Data : solution visant à rendre accessibles à tous des bases de données, s'appuyant sur le participatif et la transparence. Little Data: parfois utilisé pour permettre aux entreprises qui n auraient pas les 3V pour utiliser les technologies Big Data Smart Data: Extraire parmi l ensemble des données du Big Data les données intelligentes permettant de piloter vos activités nouvelle expression synonyme de Business Intelligence. Attention à ne pas être confronté au final au Bad Data! 21

Thématiques RH Quelles variables expliquent la performance d une unité d affaire ou d une équipe? Quelles variables expliquent les statistiques obtenues en santé, en sécurité, en absentéisme, les plaintes clients, la fidélisation des clients, les ventes? Quels profils et quelles compétences prédisent le mieux la fidélisation d employés et la performance des employés et des candidats? Quels managers génèrent les meilleurs résultats en terme de civilité organisationnelle, de résolutions de conflits, de règlement de plaintes, de satisfaction au travail, de promotion ou de départ? Quelle initiative de formation a eu le meilleur impact? Quelles statistiques influencent le plus la profitabilité et la croissance de l entreprise? 22

Références bibliographiques http://www.forbes.com/sites/gilpress/2013/05/09/a-veryshort-history-of-big-data/ http://www.martinhilbert.net/worldinfocapacityppt.ht ml Cabinets conseils Big Data : IDATE DATA&DATA Consulting Enquête IBM Big Data 2012 23

MERCI www.axiodis.com