Cartographie des solutions BigData



Documents pareils
HADOOP ET SON ÉCOSYSTÈME

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Labs Hadoop Février 2013

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Introduction à MapReduce/Hadoop et Spark

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

MapReduce. Nicolas Dugué M2 MIAGE Systèmes d information répartis

Le BigData, aussi par et pour les PMEs

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Bases de données documentaires et distribuées Cours NFE04

API04 Contribution. Apache Hadoop: Présentation et application dans le domaine des Data Warehouses. Introduction. Architecture

Programmation parallèle et distribuée

Vos experts Big Data. Le Big Data dans la pratique

Les journées SQL Server 2013

Big Data Concepts et mise en oeuvre de Hadoop

BIG DATA en Sciences et Industries de l Environnement

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Tables Rondes Le «Big Data»

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Offre formation Big Data Analytics

Les technologies du Big Data

Panorama des solutions analytiques existantes

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Programmation parallèle et distribuée

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

Anticiper et prédire les sinistres avec une approche Big Data

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?


Ricco Rakotomalala R.R. Université Lyon 2

Document réalisé par Khadidjatou BAMBA

Les bases de données relationnelles

Introduction Big Data

Les quatre piliers d une solution de gestion des Big Data

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

R+Hadoop = Rhadoop* Des logiciels libres complémentaires, une implémentation, une réponse au nouveau paradigme du bigdata!

11/01/2014. Le Big Data Mining enjeux et approches techniques. Plan. Introduction. Introduction. Quelques exemples d applications

Prototypage et évaluation de performances d un service de traçabilité avec une architecture distribuée basée sur Hadoop

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Le cloud computing au service des applications cartographiques à haute disponibilité

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Hadoop, les clés du succès

Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Quels choix de base de données pour vos projets Big Data?

Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015

NoSQL : hype ou innovation? Grégory Ogonowski / Recherches Octobre 2011

Prototypage et évaluation de performances d un service de traçabilité avec une architecture distribuée basée sur Hadoop

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

Bases de Données NoSQL

Cloud Computing : Généralités & Concepts de base

Safe Harbor Statement

Tout savoir sur Hadoop : Vulgarisation de la technologie et les stratégies de certains acteurs

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

OpenStack, l Infrastructure as a Service libre

MapReduce et Hadoop. Alexandre Denis Inria Bordeaux Sud-Ouest France ENSEIRB PG306

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Jean-Daniel Cryans École de technologie supérieure, Montréal septembre 2009

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

<Insert Picture Here> Solaris pour la base de donnés Oracle

Système de Stockage Sécurisé et Distribué

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Maîtriser les technologies Big Data pour obtenir des résultats en quasi-temps réel

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Le projet Gaïa, le Big Data au service du traitement de données satellitaires CRIP - 16/10/2013 Pierre-Marie Brunet

Cassandra et Spark pour gérer la musique On-line

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an

Programmation parallèle et distribuée (Master 1 Info )

TRANSFORM IT + BUSINESS + YOURSELF

Cours 8 Not Only SQL

Technologies Web. Ludovic Denoyer Sylvain Lamprier Mohamed Amine Baazizi Gabriella Contardo Narcisse Nya. Université Pierre et Marie Curie

<Insert Picture Here> Exadata Storage Server et DB Machine V2

BIG Data et R: opportunités et perspectives

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Projet Xdata. Cinequant, Data Publica, EDF, ESRI, Hurence, INRIA, Institut Mines Telecom, La Poste, Orange, Veolia

Hadoop, Spark & Big Data 2.0. Exploiter une grappe de calcul pour des problème des données massives

Change the game with smart innovation

LE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data

Fouille de données massives avec Hadoop

Hébergement MMI SEMESTRE 4

NoSQL. Etat de l art et benchmark

Un peu de culture : Bases N osql L 1

Our experience in using Apache Giraph for computing the diameter of large graphs. Paul Bertot - Flavian Jacquot

Orchestrer son cloud OpenStack avec Heat

Big Data, un nouveau paradigme et de nouveaux challenges

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES

Avant-propos. Organisation du livre

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Transcription:

Cartographie des solutions BigData Panorama du marché et prospective 1 1

Solutions BigData Défi(s) pour les fournisseurs Quel marché Architectures Acteurs commerciaux Solutions alternatives 2 2

Quels Défis? des volumes impossibles à traiter : 30 To de logs par jour chez Facebook 15 Po de data par an au CERN des croissances vertigineuses du business en temps réel des données différentes : Non structurées, réparties, NoSQL... 3 3

Le quadrant magique (DW database management) 4 4

Positionnement des acteurs du marché Exadata Teradata DB2 Greenplum Netezza Isilon sonas HDFS NoSQL Oracle DB2 5 5

ROI Révolutionne les datawarehouses existants ROI de 27 mois à 6 mois 3 fois moins cher 4 fois plus rapide à implémenter 6 6

Architecture & composants Shared Disk vs Share Nothing Arch. Hadoop / HBase / HDFS Map Reduce 7 7

Map Reduce Map Function : output ( word : 1 ) Reduce Function : output ( word : sum(1) ) 8 8

Map Reduce S appuie sur une base key / value est scalable sur n serveurs permet d enchainer plusieurs Reduce beaucoup d implémentations 9 9

Acteurs du marché Teradata Oracle / Exadata IBM / Netezza EMC / Greenplum... 10 10

Teradata Depuis 1979 Appliances Share nothing arch. Parallélisme Pour les DW De 6 To à 92 Po 11 11

Oracle Exadata «Database machine» (n est pas une appliance) Serveurs de stockage (168 cores, 5 TB de flash cache, 45 TB utiles) Serveurs de traitements (128 cores / 2 TB de mémoire) 1500000 IOPS Data Load Rate: Up to 12 TB/hour 12 12

EMC Greenplum Serveurs std Share nothing arch Map Reduce SQL 13 13

IBM Netezza Blades IBM + Disques + FPGAs Share nothing arch. Map Reduce & SQL Data load rates de 2TB/h Produits : Skimmer (1TB à 10TB) & TwinFin (1TB à 1PB+) 14 14

Alternatives et Opensource Active circle Bases NOSQL Apache HADOOP Database.com Amazon Elastic Map Reduce 15 15

Active Circle FileSystem distribué Accès par NAS ou API Virtualisation sur disque et bande Noeuds locaux ou distants Réplication Hiérarchisation 16 16

NOSQL : Not Only SQL Cassandra Google s BigTable : HBase MongoDB (documents, JSON) CouchDB (documents, JSON) 17 17

Apache HADOOP HDFS (distributed high throughput FS) MapReduce HBase (scalable, distributed database) Hive (data warehouse infrastructure) Mahout (data mining library) Pig: (framework for parallel computation) ZooKeeper (distributed applications) 18 18

Amazon Elastic Map Reduce Logique de PaaS : Stockage avec Amazon S3 Processing avec un cluster Amazon EC2 Mise en oeuvre instantanée Simple Economique (0,3 $ / heure par node) 19 19

Database.com Database as a Service (DaaS) Multi-tenant Scalable à l infini économique : ($10 / mois / 100000 records ) 20 20

Conclusions Des solutions dans la continuité de l existant. Des innovations permettant des ROI attrayants : Attention aux ruptures Outils opensource en voie de maturation 21 21

MERCI vincent@heuschling.com twitter : @vhe74 22 22