Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

Documents pareils

Programmation parallèle et distribuée (Master 1 Info )

Bases de données documentaires et distribuées Cours NFE04

Programmation parallèle et distribuée

Concepts et systèmes de stockage

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Sommaire. 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan

ACCOMPAGNER L EXPLOSION DES VOLUMES DE DONNEES : LES NOUVEAUX ENJEUX DU STOCKAGE

Programmation parallèle et distribuée

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

HADOOP ET SON ÉCOSYSTÈME

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Introduction au Massive Data

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Labs Hadoop Février 2013

Cartographie des solutions BigData

Marché Public en procédure adaptée : Infrastructure Informatique régionale hébergée CAHIER DES CHARGES ET DES CLAUSES TECHNIQUES

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

Projet d'infrastructure de stockage mutualisée

La Continuité d Activité

Cloud pour applications PC SOFT Tarification

Big Data Concepts et mise en oeuvre de Hadoop

API04 Contribution. Apache Hadoop: Présentation et application dans le domaine des Data Warehouses. Introduction. Architecture

Marché Public. Serveurs et Sauvegarde 2015

Square-IT-Consulting. Présentation

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

ACQUISITION DE MATERIEL INFORMATIQUE

Introduction à MapReduce/Hadoop et Spark

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Solutions libres de stockage. Patrice Langlois / Antoine Puechlong Service Informatique IGMM CRBM CPBS

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

Entrez dans l ère du Numérique Très Haut Débit

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

Kick Off SCC Vers de nouveaux horizons

EMC Forum EMC ViPR et ECS : présentation des services software-defined

Tables Rondes Le «Big Data»

IT SERVICES BUSINESS STORAGE DATA AUDIT PARTNERSHIP INTEGRATOR SECURITY PLANNING PRIVATE AGILITY DYNAMIC PUBLIC TECHNOLOGY SOLUTIONS MANAGEMENT

Cloud Computing, discours marketing ou solution à vos problèmes?

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

LE STOCKAGE UNIFIÉ ASSOCIÉ À LA VIRTUALISATION D'ENTREPRISE

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Technologie SDS (Software-Defined Storage) de DataCore

Guillaume PHILIPPON. Mise en place d un cloud privé et publique

Fiche produit FUJITSU ETERNUS DX200F Baie de stockage Flash

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

8 stratégies pour construire un datacenter moderne

L offre Stockage et serveurs System x / BladeCenter F.Libier, Business Partner Technical Manager

Qu est ce que le Cloud Computing?

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Cloud computing Votre informatique à la demande

Système de Sauvegarde et d Archivage Backup Smart Way TM

Transformation vers le Cloud. Premier partenaire Cloud Builder certifié IBM, HP et VMware

Zoom sur le Software-Defined Datacenter EMC

Document réalisé par Khadidjatou BAMBA

Planifier la migration des applications d entreprise dans le nuage

FUJITSU WORLD TOUR 2014 Paris

CE QU IL FAUT SAVOIR SUR LE CLOUD COMPUTING

Naturellement SaaS. trésorier du futur. Livre blanc. Le futur des trésoriers d entreprise peut-il se concevoir sans le SaaS?

Protection des données avec les solutions de stockage NETGEAR

La Virtualisation Windows chez CASINO. Philippe CROUZY Responsable Infrastructure Equipes Systèmes -Stockage

Le Cloud Open-Mind! Emilien Macchi

Mise en œuvre d une infrastructure de virtualisation au CNRGV

Cloud Privé / Public / Hybrid. Romain QUINAT vente-privee.com

Le BigData, aussi par et pour les PMEs

PANORAMA DES MENACES ET RISQUES POUR LE SI

Veeam Backup & Replication v6

CLOUD PRIVÉ EMC VSPEX VMware vsphere Jusqu à machines virtuelles

THE FLASH REVOLUTION IS RIGHT NOW. Pure Storage France Contact : france@purestorage.com Pure Storage, Inc. 1

Cloud Computing - présentation d un outil complet

Ricco Rakotomalala R.R. Université Lyon 2

Le Pôle ORACLE d ITS-Overlap. Platinum Partner

SYSTÈMES DE STOCKAGE SCALE-OUT D'EMC ISILON

Table des matières. A - Introduction 13. B - Qu'est-ce que la virtualisation? 13

Chapitre 4: Introduction au Cloud computing

Architectures informatiques dans les nuages

Hébergement MMI SEMESTRE 4

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

100% Swiss Cloud Computing

Architectures d implémentation de Click&DECiDE NSI

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

V3 - Une Appliance Conçue pour le VDI

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

Les vpack DataCenter et End-User. Yves Pellemans Directeur Technique Groupe APX

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

Mise en œuvre de la virtualisation à l IGBMC. Guillaume Seith Remy Fritz

Le e s tocka k ge g DAS,NAS,SAN

7 avantages à la virtualisation des applications stratégiques de votre entreprise

Atteindre la flexibilité métier grâce au data center agile

Solution de stockage et archivage de grands volumes de données fichiers.

CLOUD PRIVÉ EMC VSPEX Microsoft Windows Server 2012 R2 avec Hyper-V - Jusqu à machines virtuelles

Des applications locales à l infonuagique: comment faire la transition?

Présentation Infrastructure DATACENTRE

VMWare Infrastructure 3

Sujet Solution de sauvegarde de serveurs et postes de travail avec BackupPC et Bacula. par ALIXEN

Evolution de messagerie en Cloud SaaS privé

Qu est ce qu une offre de Cloud?

FOURNITURE ET INSTALLATION DE MATERIELS ET DE LOGICIELS INFORMATIQUES

Transcription:

Big Data Les problématiques liées au stockage des données et aux capacités de calcul

Les problématiques liées au Big Data La capacité de stockage - Traitement : Ponctuel ou permanent? - Cycle de vie des données : Mortes ou vivantes? - Compatibilité : Temps de traitement / volume - Localisation : Internalisation ou externalisation?

Les problématiques liées au Big Data De l entrée de gamme HP 2000 iscsi technologie SAS Les baies de stockage

Les problématiques liées au Big Data De l entrée de gamme HP 2000 iscsi technologie SAS Les baies de stockage Agrégat de 24 disques physiques Capacité de stockage de 15To, Coût du GigaOctet : 1,31, Pas de technologie avancée,

Les problématiques liées au Big Data au «MiddleRange» HP 2000 iscsi technologie SSD Les baies de stockage Agrégat de 24 disques physiques Capacité de stockage de 5,76To, Coût du GigaOctet : 1,43, Pas de technologie avancée,

Les baies de stockage HP 2000 isci SAS HP 2000 isci SSD Capacité : 15 To Capacité : 5,7 To Coût au Go : 1,31 Coût au Go : 1,43 ~ 140 IOPS (*) ~ 25000 IOPS (*) (*) Input / Output per second

Les problématiques liées au Big Data Au haut de gamme HP 3PAR StoreServ 7000 Les baies de stockage

Les problématiques liées au Big Data Au haut de gamme HP 3PAR StoreServ 7000 Les baies de stockage 1200 To Brut Coût du Go brut : 0,75

Les problématiques liées au Big Data Les baies de stockage Quelque soit le média un problème majeur persiste : Sa capacité de stockage est bornée

Les problématiques liées au Big Data Les systèmes de fichiers distribués Ils permettent : 1 ) De faire abstraction de l infrastructure de stockage, 2 ) De sécuriser les données par la réplication, 3 ) De ne plus dimensionner à t0 le volume de données, 4 ) De s affranchir des limites Physiques du stockage, 5 ) D hybrider les technologies.

Les problématiques liées au Big Data Les plus connus : GFS, Google File System, Les systèmes de fichiers distribués Coda, GlusterFS, HDFS, Hadoop Distributed File System

Les systèmes de fichiers distribués : HDFS Les spécificités premières : Tolérants aux pannes Optimisés pour les fichiers de grande taille, de 1Go à plusieurs To, Un modèle «Write Once, Read Many» (une écriture, de multiples lectures) Une architecture Maitre / Esclave

Les systèmes de fichiers distribués : HDFS Namenode (Metadata, arborescence ) Réplication Datanodes Client Datanodes Lectures exclusivement Lectures exclusivement Ecritures exclusivement

Les systèmes de fichiers distribués : Les Appliances Marché émergent et trusté par un nouvel acteur : Nutanix, une solution basée sur Hadoop, intégrant stockage et capacité de calcul,

Les problématiques liées au Big Data Les capacités de calcul Le dimensionnement est lié : - au volume de données à traiter, - à la complexité du traitement, - au type de traitement, (permanent, unique, cyclique )

Les capacités de calcul Dans les cas simples : - Stabilité de la puissance de calcul nécessaire, - Contraintes techniques ou d interconnexions faibles Les technologies standards de calcul répondent aux besoins du ou des traitements. (Fermes de calcul pas ou peu virtualisées)

Les capacités de calcul Dans les cas plus complexes : - Forte fluctuation de la puissance de calcul nécessaire, - Temps de déploiement restreint Le Cloud «peut être» une solution pertinente.

Mais le Cloud c est quoi? Le Cloud c est : Tout d abord un terme créé par le marketing. Mais surtout : Une solution de virtualisation délocalisée qui permet de s affranchir des ressources matérielles pour l utilisateur final.

Mais le Cloud c est quoi? Mais ce n est pas : - l externalisation des données de l entreprise, - une solution de stockage, - un mode de facturation, - une solution abstraite non liée à des serveurs physiques. C est encore moins : - internet, - la définition de «Wikipédia», - une solution universelle à toutes les problématiques informatiques.

Les capacités de calcul Cette «abstraction» du média physique simplifie certains usages : - la mise en place de Plans de Reprise d Activités, - l allocation de ressources à la demande, - l externalisation des données de l entreprise, - la décentralisation des processus informatiques de façon transparente,

Les capacités de calcul Les avantages du Cloud dans un projet Big Data - scalabilité, - externalisation des problématiques d infrastructures, - forte tolérance aux pannes, - rationalisation des coûts.

Pour conclure. Un projet Big Data réussit c est : Se poser les bonnes questions en terme de stockage des données dans le temps, en terme de volumétrie et d usage. Déterminer préalablement ses besoins en terme de capacité de calcul et d évolutivité.

Siège social 01 40 64 01 31 70 rue Berthie Albrecht 94400 Vitry-sur-Seine Merci de votre attention! 04 26 46 39 84 440 rue Barthélemy Thimonnier 69530 Brignais