hurence Big Data get its magical power Laurence.Hubert@hurence.com, CEO & CTO http://www.hurence.com



Documents pareils
Instructions Mozilla Thunderbird Page 1

Editing and managing Systems engineering processes at Snecma

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Vos experts Big Data. Le Big Data dans la pratique

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

RAPID Prenez le contrôle sur vos données

WEB page builder and server for SCADA applications usable from a WEB navigator

JSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015

Philippe Lemerle Big Data Secteur public. Copyright 2015, Oracle and/or its affiliates. All rights reserved.

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Once the installation is complete, you can delete the temporary Zip files..

Francoise Lee.

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

1.The pronouns me, te, nous, and vous are object pronouns.

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Empowering small farmers and their organizations through economic intelligence

ANGULAR JS AVEC GDE GOOGLE

Surmonter les 5 défis opérationnels du Big Data

Contents Windows

VMware : De la Virtualisation. au Cloud Computing

How to Login to Career Page

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

Institut français des sciences et technologies des transports, de l aménagement

Gestion des prestations Volontaire

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Stéphane Lefebvre. CAE s Chief Financial Officer. CAE announces Government of Canada participation in Project Innovate.

Compte-rendu technique complet et détaillé des cookies

We Generate. You Lead.

AOC Insurance Broker Compare vos Assurances Santé Internationale Economisez jusqu à 40 % sur votre prime

Règlement sur le télémarketing et les centres d'appel. Call Centres Telemarketing Sales Regulation

Introduction à MapReduce/Hadoop et Spark

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Libérer le pouvoir des médias sociaux Passer du Like au Love

Qualité et ERP CLOUD & SECURITY (HACKING) Alireza MOKHTARI. 9/12/2014 Cloud & Security

Comment valoriser votre patrimoine de données?

Guide d'installation rapide TFM-560X YO.13

PRESENTATION. CRM Paris - 19/21 rue Hélène Boucher - ZA Chartres Est - Jardins d'entreprises GELLAINVILLE

La rencontre du Big Data et du Cloud

The space to start! Managed by

GEIDE MSS /IGSS. The electronic document management system shared by the Luxembourg

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

Get Instant Access to ebook Cest Maintenant PDF at Our Huge Library CEST MAINTENANT PDF. ==> Download: CEST MAINTENANT PDF

WiFi Security Camera Quick Start Guide. Guide de départ rapide Caméra de surveillance Wi-Fi (P5)

MANUEL MARKETING ET SURVIE PDF

Forthcoming Database

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Cartographie des solutions BigData

LADIES IN MOBILITY. LIVE TWEET Innovative City

Extension fonctionnelle d un CRM. CRM étendu >> Conférence-débat 15 April Club Management des Systèmes d Information de l'iae de Paris Alumni

Dans une agence de location immobilière...

Nouveautés printemps 2013

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

MANAGEMENT SOFTWARE FOR STEEL CONSTRUCTION

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Media Pack. À propos de nous. Statistiques par mois. Pourquoi préférer IT Job Board? Références

Institut d Acclimatation et de Management interculturels Institute of Intercultural Management and Acclimatisation

GIGABIT PCI DESKTOP ADAPTER DGE-530T. Quick Installation Guide+ Guide d installation+

PARIS ROISSY CHARLES DE GAULLE

Module Title: French 4

Application Form/ Formulaire de demande

CETTE FOIS CEST DIFFERENT PDF

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

Frequently Asked Questions

Acce s aux applications informatiques Supply Chain Fournisseurs

Bigdata et Web sémantique. les données + l intelligence= la solution

Language requirement: Bilingual non-mandatory - Level 222/222. Chosen candidate will be required to undertake second language training.

Bienvenue au séminaire HP Service Anywhere Mardi 11 février 2014

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

DOCUMENTATION - FRANCAIS... 2

Cedric Dumoulin (C) The Java EE 7 Tutorial

Le Cloud Computing est-il l ennemi de la Sécurité?

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

CLOUD COMPUTING et Relation Client/Fournisseur Une Révolution culturelle?

lundi 3 août 2009 Choose your language What is Document Connection for Mac? Communautés Numériques L informatique à la portée du Grand Public

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Hadoop, les clés du succès

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Face Recognition Performance: Man vs. Machine

Le nouveau visage de la Dataviz dans MicroStrategy 10

XtremWeb-HEP Interconnecting jobs over DG. Virtualization over DG. Oleg Lodygensky Laboratoire de l Accélérateur Linéaire

SERVEUR DÉDIÉ DOCUMENTATION

SYLLABS Claude de Loupy

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Notice Technique / Technical Manual

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

MSO MASTER SCIENCES DES ORGANISATIONS GRADUATE SCHOOL OF PARIS- DAUPHINE. Département Master Sciences des Organisations de l'université Paris-Dauphine

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

Quel temps fait-il chez toi?

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

Eléments de statistique

Formulaire d inscription (form also available in English) Mission commerciale en Floride. Coordonnées

DOCUMENTATION - FRANCAIS... 2

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

L UNIVERS INSTANTANÉ:

Transcription:

hurence Big Data get its magical power Laurence.Hubert@hurence.com, CEO & CTO http://www.hurence.com Copyright Hurence 2013

Hurence : le 'pure player' Big Data Consulting & Services ARCHITECTURE BIG DATA LOGICIEL BIG DATA Une offre de conseil en sélection d outils et architectures Big Data, sur tout type de socle. Une offre logicielle basée sur l écosystème Hadoop, dont plusieurs produits natifs Hadoop & HBase et des composants d extraction Big Data. INSTALLATION ET GESTION SERVEUR D ENRICHISSEMENT Une offre de dimensionnement, provisionnement, installation et gestion d infrastructures matérielles et logicielles Big Data. Une offre logicielle dédiée analyse de logs dont un serveur d enrichissement de données de logs. Une équipe de spécialistes du Big Data Une équipe d architectes, de data scientists, de développeurs séniors passionnés par le Big Data. Une équipe innovante qui participe à la plupart des initiatives Big Data en France (projets d investissements dans le cadre du Grand Emprunt). Une approche indépendante Une stratégie d indépendance vis-à-vis des fournisseurs de solutions Big Data. Une volonté de promouvoir l intégralité des offres Big Data pertinentes pour nos clients et d entretenir des relations privilégiées avec les plus grands acteurs (IBM, EMC, Oracle, Microsoft, HP, Dell, SAS, Teradata, Cloudera, Hortonworks..) Une expérience importante Plus de 30 clients «Big Data» en France. La première société à se positionner sur une offre pure Big Data, autour de Hadoop et de son écosystème, en France. Technologies Formation Service FORMATIONS BIG DATA EXPRESS DATA SERVICE Une gamme de formation pour tous les profils et toutes les technologies Big Data open source. Une offre de traitement de données sur nos clusters Hadoop.

Gartner Hype Cycle

French curve

Big Data challenges and opportunities The Big Data «me too» phenomenon The Big Data «NIH» Big Data is data! Big Data is hard! Big is Big! Big Data is sometimes poor data! Big Data is Hadoop but not only Hadoop Big Data is not just data... it can be beautiful Big Data is ambition

The Big Data «me too» phenomenon Vendors and consultants tend to use the same «Big Data» technologies and use cases... if not this is research or free POCs! Customer Relationship Management through analysis of social networks, Advertising and campaign management, predictive churn etc. Security and Fraud Management Big Data cloning :) Managers engage in Big Data because they think they have to... First consulting action is to train them Second consulting action is to help them build an ambitious and innovative Big Data plan with respect to «their» business!

A Big Data Roadmap... http://www.bigdata-startups.com/the-big-data-roadmap/

The Big Data «NIH» Big Data was marketed as a «rare resource» which it is trend : a lot of French managers are trying to turn their teams into «Big Data specialists» but... the maturity of Big Data tools does not yet allow this and... not sure it will ever allow this... Big Data is «private» data sometimes => analysis is done in-house Not every engineer can turn into a Big Data scientist : on 100 engineers we train, less than 20 have the «Big Data spirit»!

Big Data is data Siloed data, confidential data Sometimes HUGE political and managerial problems to access data Data is power! Data is money!

Big Data is hard Thinking parallel is inherently hard Map Reduce is «fairly» easy but current implementation in Hadoop has limitations (latency, re-entrance, long-life jobs) MPI (Message Passing Interface) in other words stream processing is much more difficult to setup and program (IBM streams, Storms) Text analysis Speech to text Positive sentiment on Big Data 55%

Big Data is hard Advanced sentiment analysis or text mining or web crawling Not just counting positive or negative words! Involves linguistic knowledge and resources (domain specific) Text Analytics is a domain for specialists Mix of ML and traditional tools Big Data Big Brother! Super! Parsing / Semantic analysis Part Of Speech Tagging Dictionary Lookup Sentence / Paragraph Detection Tokenizer (split the text to words)

Big Data is hard Advanced Data Mining (beyond traditional BI) Not just drag and droping data with nice tools! Need to define the right variables Your variables model somehow your hypothesis about the world so you need to have an hypothesis! Big Data is just here to compute! This is also a domain! K-Means Linear Regressions Bayesian models Etc. Support Vector Machines

Big Data is Big The 4Vs are for marketing : Big is Big Big Data technologies like Hadoop are overkilling for small and medium data US Hadoop YARN (2.0) should improve this Hadoop focused on making Hadoop «consumable» through SQL (Impala/Hive/Stinger) but is slow on improving on the real-time and small/medium data for Map Reduce jobs and to propose other parallel paradigms (MPI). Still big fans of Hadoop but a bit deceived on how Hadoop has evolved over the last 2 years to prevent «advanced users» desillusions. Avoid the 5 VMs nodes Hadoop cluster and the 20 mega tests! France

Big Data is sometimes poor data Enrichissement classique IP latitude, longitude, ville, densité de population, altitude moyenne, Ville française densité, altitude, Villes françaises distance qui les sépare Date (+ heure), latitude, longitude météo Enrichissement custom Qui? Profiling visiteur Association d'un groupe de mots à plusieurs caractéristiques Url : http://www.myhealth/node/6/ produits, fitness, femme, Produits : chips allégée chips, régime, snack, Où? Geololisation Localisation Qui? Profiling produit Contexte? Météo

Big Data is not only Hadoop (NoHadoop? After NoSQL!) Diamonds in the open source domain : Elastic Search is one of them You can index the world with Elastic Search and even geolocalize it!

Big Data can be beautiful http://www.bigdata-startups.com/the-beauty-is-in-the-big-data/ US Flight patterns by FAA Tumor mutations Connections between Oscar winners http://www.pitchinteractive.com

Big Data won't make you an innovator but... If you are an innovator, this is your technology! Big Data players dreamed «Google Search», «Google Earth» and «Google Map» and figured out the tools they needed for that... They made the work for us now our challenge is «just» to have ambition!!! The magic powers you get? The possibility to store, describe and analyse the world!

Thank you! Laurence Hubert Email : Laurence.Hubert@hurence.com Web : http://www.hurence.com Twitter : @hurence