Le BigData, aussi par et pour les PMEs



Documents pareils
Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Labs Hadoop Février 2013

Cartographie des solutions BigData

HADOOP ET SON ÉCOSYSTÈME

Bases de données documentaires et distribuées Cours NFE04

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Les journées SQL Server 2013

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

Introduction à MapReduce/Hadoop et Spark

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Mesures DNS à l ère du Big Data : outils et défis. JCSA, 9 juillet 2015 Vincent Levigneron, Afnic

BIG DATA et DONNéES SEO

MapReduce. Nicolas Dugué M2 MIAGE Systèmes d information répartis

Big Data Concepts et mise en oeuvre de Hadoop

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

Big Graph Data Forum Teratec 2013

Big Data On Line Analytics

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

Transformation Digitale Challenges et Opportunités

Programmation parallèle et distribuée (Master 1 Info )

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

L informatique en nuage comme nouvel espace documentaire

Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

BIG DATA en Sciences et Industries de l Environnement

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

NoSQL. Etat de l art et benchmark

Hadoop, les clés du succès

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

Cloud computing Architectures, services et risques

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Cloud Computing : Généralités & Concepts de base

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

11/01/2014. Le Big Data Mining enjeux et approches techniques. Plan. Introduction. Introduction. Quelques exemples d applications

Protection des données personnelles : Vers un Web personnel sécurisé

Entreprise et Big Data

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Chapitre 4: Introduction au Cloud computing

Territoires géographiques/numériques

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Hébergement MMI SEMESTRE 4

Les dessous du cloud

NoSQL : hype ou innovation? Grégory Ogonowski / Recherches Octobre 2011

Ricco Rakotomalala R.R. Université Lyon 2

Breizhcamp - Cloud - Ruby

Quels choix de base de données pour vos projets Big Data?

Cognit Ive Cas d utilisation

Les Réunions Info Tonic. Améliorer la visibilité de son site internet Mardi 10 décembre 2013

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data


Culture numérique Cloud computing

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Document réalisé par Khadidjatou BAMBA

Les défis statistiques du Big Data

Jean-François Boulicaut & Mohand-Saïd Hacid

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

Les quatre piliers d une solution de gestion des Big Data

Des systèmes d information partagés pour des parcours de santé performants en Ile-de-France.

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Jean-Daniel Cryans École de technologie supérieure, Montréal septembre 2009

Les datas = le fuel du 21ième sicècle

BIG Data et R: opportunités et perspectives

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Bases de Données NoSQL

R+Hadoop = Rhadoop* Des logiciels libres complémentaires, une implémentation, une réponse au nouveau paradigme du bigdata!

Conserver les Big Data, source de valeur pour demain

Panorama des solutions analytiques existantes

Primer LE CLOUD COMPUTING DÉMYSTIFIÉ PME ET CLOUD COMPUTING : 5 IDÉES REÇUES

Introduction Big Data

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

CE QU IL FAUT SAVOIR SUR LE CLOUD COMPUTING

Les bases de données relationnelles

Du Datacenter au Cloud Quels challenges? Quelles solutions? Christophe Dubos Architecte Microsoft

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

Les outils de communication

Etude des outils du Cloud Computing

BI SWISS FORUM (ecom / SITB)

Un peu de culture : Bases N osql L 1

SHAREPOINT 2013 : MON INTRANET PARTOUT AVEC MOI

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Le BIG DATA????? Big Buzz? Big Bang? Big Opportunity? Big hype? Big Business? Big Challenge? Big Hacking? Gérard Peliks planche 2

Titre : La BI vue par l intégrateur Orange

Le projet Gaïa, le Big Data au service du traitement de données satellitaires CRIP - 16/10/2013 Pierre-Marie Brunet

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

Tables Rondes Le «Big Data»

Le nuage va-t-il s'arrêter à la frontière? Pierre Beyssac Twitter: pbeyssac

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an

Le maillon commercial qui connecte l Universitaire Joseph Fourier avec l industrie

Veille Technologique. Cloud-Computing. Jérémy chevalier

Cloud Computing, discours marketing ou solution à vos problèmes?

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

Transcription:

Parole d expert Le BigData, aussi par et pour les PMEs Stéphane MOUTON, CETIC Département Software and Services Technologies

Avec le soutien de :

LIEGE CREATIVE Le Big Data, aussi par et pour les PMEs Stéphane Mouton CETIC 1

Résultats innovants Internet du Futur Qualité Logicielle Internet des Objets Technologie Information Communication 40 chercheurs Méthodes & outils utilisables 2001 Centre de recherche appliquée agréé

Au début, les ressources étaient rares

Des technologies adaptées à la rareté des ressources ANALYSE BI & VISUALISATION PRE-TRAITEMENT & REQUETES STOCKAGE (DATAWAREHOUSE) WORKFLOW ACQUISITION & EXTRACTION DES DONNEES DONNÉES STRUCTURÉES

Puis le stockage est devenu abordable

Le Big Data vient de l Internet Amazon -> Données produits et clients Yahoo! -> Tracking et profilage utilisateurs Microsoft -> Stockage Facebook -> Données utilisateurs Twitter -> Messages LinkedIn -> Profils et liens entre utilisateurs Google -> A peu près tout ce qui est ci-dessus

Mais tout le monde n est pas Twitter, Facebook,

BigData: consensus autour d une definition Volume Vitesse Variété (Valeur) (Véracité) (Visualisation) * *Ajoutez votre V ici

Volume: How big is big? Velocity: How fast is fast? Variety: How diverse is diverse? Un concept relatif Valable maintenant et dans un futur proche

Amazon -> Dynamo Yahoo! -> HBase, Hadoop Microsoft -> Azure Storage Facebook -> Cassandra -> HBASE Twitter -> Cassandra LinkedIn -> Voldemort Google -> BigTable... Un bond technologique

De nouvelles technologies de bases de données

Une pile logicielle Big Data ANALYSE BI & VISUALISATION SCALABILITÉ PRE-TRAITEMENT & REQUETES STOCKAGE WORKFLOW ACQUISITION & EXTRACTION DES DONNEES DONNÉES STRUCTURÉES DONNÉES NON STRUCTURÉES

Scalabilité : distribution des calculs / traitements Input Entrée Split Séparer Map Appliquer Shuffle Mélanger Reduce Réduire Final result Résultat final Chien Ane Serpent Chien,1 Ane, 1 Ane, 1 Ane, 1 Ane, 2 Chien Ane Serpent Chat Chat Serpent Chien Chat Ane Chat Chat Serpent Serpent, 1 Chat,1 Chat, 1 Serpent, 1 Chien,1 Chat, 1 Chat, 1 Chat, 1 Chien, 1 Chien, 1 Chat, 3 Chien, 2 Ane, 2 Chat,3 Chien, 2 Serpent, 2 Chien Chat Ane Chat, 1 Ane, 1 Serpent, 1 Serpent, 1 Serpent, 2 1 machine maître, plusieurs machines esclaves

Une autre manière d analyser les données source :

Et pour les PME?

Des outils plus abordables Source: O Reilly

Et le Cloud Computing? Réduire les investissements Déployer sur le Cloud pour un paiement à l utilisation Outils BigData prêts à l emploi Plateforme : pour bâtir Exemple : Hadoop on Azure Service : pour analyser Exemple : Google BigQuery Pouvoir disposer de ressources informatiques importantes

Opportunités du Big Data Améliorer les services existants Utiliser des données inexploitées pour améliorer les analyses et résultats Fournir les mêmes informations mais mieux (plus rapide, plus précis, moins cher, ) Développer de nouvelles activités Traiter des données produites par l entreprise et éventuellement d autres sources pour fournir de nouveaux services. Exemple : bookt.com service aux hôteliers

Définir une stratégie BigData Passer en revue les données Sources, Flux, Valeur Evaluer l utilisation de données peu ou semi structurées Textes, graphique, images, feuilles de calcul Choisir les technologies appropriées Choisir l angle d attaque technologique du problème Réaliser une preuve de concept Définir une utilisation business mesurable / évaluable Eviter de traiter la donnée pour la technologie Eviter les «décharge de données» Etude Wikibon : danger de retour sur investissement négatif

Prêts?

Merci stephane.mouton@cetic.be www.cetic.be/stephane-mouton