Vos experts Big Data. contact@hurence.com. Le Big Data dans la pratique



Documents pareils
Cartographie des solutions BigData

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Fouillez facilement dans votre système Big Data. Olivier TAVARD

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Hadoop, les clés du succès

HADOOP ET SON ÉCOSYSTÈME

Projet Xdata. Cinequant, Data Publica, EDF, ESRI, Hurence, INRIA, Institut Mines Telecom, La Poste, Orange, Veolia

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Offre formation Big Data Analytics

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Big Data Concepts et mise en oeuvre de Hadoop

hurence Big Data get its magical power CEO & CTO

Labs Hadoop Février 2013

Titre : La BI vue par l intégrateur Orange

IBM Software Big Data. Plateforme IBM Big Data

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

Surmonter les 5 défis opérationnels du Big Data

Guide de référence pour l achat de Business Analytics

Panorama des solutions analytiques existantes

BIG DATA en Sciences et Industries de l Environnement

Big Data, un nouveau paradigme et de nouveaux challenges

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Cassandra et Spark pour gérer la musique On-line

Les technologies du Big Data

Anticiper et prédire les sinistres avec une approche Big Data

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

AXIAD Conseil pour décider en toute intelligence

Guide de référence pour l achat de Business Analytics


Les quatre piliers d une solution de gestion des Big Data

LE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data

Découverte et investigation des menaces avancées PRÉSENTATION

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

Quels choix de base de données pour vos projets Big Data?

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

À PROPOS DE TALEND...

Plans d'action pour une mise en œuvre réussie des Big Data

Tables Rondes Le «Big Data»

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Ne cherchez plus, soyez informés! Robert van Kommer

Méthode d Évaluation des Coûts liés à l Open Source (ECOS)

Bases de données documentaires et distribuées Cours NFE04

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

MARS 2015 DATA LAB. TechTrends - Publication de Xebia IT Architects. Imaginer. Matérialiser. Exploiter

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Exploration des Big Data pour optimiser la Business Intelligence

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an

IBM BigInsights for Apache Hadoop

TOP. année promet d être BIG (Business Intelligence Growth) PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013

VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr

Ricco Rakotomalala R.R. Université Lyon 2

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics.


SpagoBI: la seule suite décisionnelle 100% open source, complète et flexible

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Le Tag Management à l ère du Smart Data

Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

Big Data et l avenir du décisionnel

Les bases de données relationnelles

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?


Business Intelligence Les 15 tendances clefs pour 2015

Introduction Big Data

Big Data Jean-Michel Franco

Le Big Data Vers de nouveaux usages! 18/03/2015

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

ELCA Forum 2014 BIG DATA

Votre laisser-passer pour les. Big Data Guide visuel

Analyse comparative entre différents outils de BI (Business Intelligence) :

TRANSFORMEZ VOTRE INFRASTRUCTURE DE BASE DE DONNEES

SAP Business Suite Powered by SAP HANA Transactionnel et Analytique réunis

Webinar. Découvrez Rubedo, la première solution CMS open-source tirant profit des atouts de Zend Framework et du NoSQL. avec la participation de

Enterprise Intégration

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

BI Open Source Octobre Alioune Dia, Consultant BI

Bases de données documentaires et distribuées Cours NFE04

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Comment valoriser votre patrimoine de données?

Comment booster vos applications SAP Hana avec SQLSCRIPT

De à 4 millions. Khanh Tuong

Transcription:

Vos experts Big Data contact@hurence.com Le Big Data dans la pratique

Expert Expert Infrastructure Data Science Spark MLLib Big Data depuis 2011 Expert Expert Hadoop / Spark NoSQL HBase Couchbase MongoDB Expert Search Solr Elastic Search

Consulting en infrastructures Big Data Provision Installation Optimisation Sizing Securisation Support Migration

Consulting en architectures Big Data Spécialistes «Data Lake Architectures Lambda Optimisation d'indexes Benchmarks sur gros volumes Chaînes D'alimentation Batch Chaînes D'alimentation Temps Réel

Consulting en solutions Big Data Analyses Logs Text Mining Modèles Prédictifs Audio Mining Profiling Détection Signaux

Formations Big Data Cursus Data Science avec Spark MLLib Cursus analyse de logs avec Flume et Elastic Search /SolR Cursus Search avec Elastic Search ou SolR Cursus Installation Exploitation Hadoop Cursus Développement Hadoop (MR,Storm,Spark) Fondamentaux Big Data Cursus BI SQL Hive Impala et Spark SQL Cursus Temps réel avec Kafka et Spark

Produits Botsearch B-DAP

La détection de Malwares avec Botsearch Injection indexation et analyse de logs Détection de patterns de Malwares Alertes Visualisations Copyright Hurence 2015

B-DAP: Big Data Analytics Plateform Open source à venir Copyright Hurence 2015

Le Big Data dans la pratique

Les technologies Big Data dans la pratique... Open source Moteurs SQL Teradata Oracle GreenplumDB Netezza Moteurs SQL MLLib H2O Bases de données Bases de données Plateformes d'analytique En Grilles Moteurs de recherche et crawlers Mahout Socles parallèles Glue Not only Hadoop Moteurs de recherche Copyright Hurence 2015 Analytique Écosystème Hadoop Propriétaires

Caractéristiques Elles sont massivement open source Elles s'installent sur du matériel commodité Elles offres des capacités de mise à l'échelle de l'ordre de plusieurs centaines de machines (10 000 machines avec Hadoop) Elles utilisent des formats de données libres et plus brutes CSV est largement utilisé pour tout ce qui est SQL Avro sera utilisé pour compacter des données XML Parquet et ORC seront utilisés pour représenter des colonnes (au sens Bases de données).

La vision qui sous-tend ces déploiements... Chaque outil construit sa vue sur les données mais les données sont les mêmes pour tous les outils dans un format non propriétaire sur un système de fichier distribué... Driver OBDC Data Lake SolR SolR Le moteur de recherche solr indexe les fichiers en fait des facettes de recherche Traite les fichiers comme de vraies tables d'un DBMS Le data warehouse des années 2020... Copyright Hurence 2015

La lambda architecture Speed Layer: chaîne d'alimentation temps réel: On analyse les ventes multimodales de l'entreprise en temps réel pour calculer des positions de stocks en même temps qu'on les déverse dans le data lake et qu'on construit des vues aggrégées dessus... Quel est la position du stock en iphone du magasin X? Fichier de Données aggrégées 12 Data Lake modèle Serving layer: Ce sont les applications qui exploitent des données aggrégées ou modèles en temps réel A quelle classe appartient mon Internaute? Masc+cadremoyen+... Batch Layer: chaîne d'alimentation batch On intègre des données et on calcule des modèles en batch par exemple on récupère les données de navigations des utilisateurs et on construit des modèles de classes d'internautes. Copyright Hurence 2015

ROI sur une approche data lake Un facteur 100 par rapport aux coût d'un data warehouse traditionnel Des outils qui offrent de nouvelles perspective (la recherche sur des données structurées...) Copyright Hurence 2015

Big Data Maturity Model Adapté du modèle TDWI: Google: TDWI Big Data Maturity Model gouffre Naissant Peu de culture sur le sujet Pas d'idées sur la valeur pour le business Pas d'adhésion du mgt Une pratique de la gestion de données peu évoluée L'analytique est silotée Pré-adoption Les gens se forment (conférences, lectures) Une petite investigation d'un département sur les technologies (Hadoop) Des données collectée pour l'expérimentation Quelques sponsors dans le mgt aventureux Des sceptiques dans les départements d'analytique Early-adoption Deux ou trois POCs implémentés prêts à la mise en production Infras en place (clusters Hadoop) Des pratiques de gestion de l'infra sont en place mais en dehors de l'opérationnel Corporate adoption Un seul cluster Hadoop multi-tenant de 50 à 100 machines Des processus modifiés pour opérer l'infrastructure Données métier désilotées Un centre d'excellence Analytique pour la société Mise en place d'une organisation avec des compétences pour une adoption à l'échelle de la société Mise en place d'une gouvernance de données Mature Visionnaire Des programmes Big Data sont créés La société voit le Big Data comme une ressource critique Copyright Hurence 2015

Clés du succès pour le Big Data Avoir isolé dans ses processus existants des projets potentiels Le client idéal: il sait ce qu'il veut changer dans son process. Le client sceptique: il attend de nous des use cases. Le client à fuir: son use case c'est l'analyse des réseaux sociaux. Ne pas sous-estimer la compétence qu'il faudra mettre en oeuvre Ne pas sous-estimer la pénurie pour accéder à cette compétence Se former... Se faire accompagner sur le premier projet (accélérateur en années!) Commencer petit (deux ou trois POCs de 40 jours chacun bien choisis) Si on a été bien accompagné on verra le potentiel et l'innovation métier viendra toute seule par catalyse (voire pyrolyse le feu prend!). Etre robuste aux influences des grands éditeurs Copyright Hurence 2015

Vos experts Big Data contact@hurence.com