VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr



Documents pareils
Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Transformation vers le Cloud. Premier partenaire Cloud Builder certifié IBM, HP et VMware

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Hébergement MMI SEMESTRE 4

Qu est ce qu une offre de Cloud?

Cloud Privé / Public / Hybrid. Romain QUINAT vente-privee.com

Les journées SQL Server 2013

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

AXIAD Conseil pour décider en toute intelligence

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Programmation parallèle et distribuée

Programmation parallèle et distribuée

Guide de Tarification. Introduction Licence FD Entreprise Forfaits clé en main SaaS SaaS Dédié SaaS Partagé. Page 2 Page 3 Page 4 Page 5 Page 8

Les technologies du Big Data

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Architectures informatiques dans les nuages

tech days AMBIENT INTELLIGENCE

Qu est ce qu une offre de Cloud?

Christophe Dubos Architecte Infrastructure et Datacenter Microsoft France

KIWI BACKUP DOSSIER DE PRESSE

Big Data : Quel usage au sein des projetsinternet?

Architectures d implémentation de Click&DECiDE NSI

KIWI BACKUP DOSSIER DE PRESSE

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

Xavier Masse PDG IDEP France

Utiliser le cloud pour manager son PRA et son PCA (DRaaS ou PRA dans le Cloud)

Panorama des solutions analytiques existantes

Pourquoi OneSolutions a choisi SyselCloud

Bull, un catalogue de service particulier pour répondre aux environnements complexes

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

Du Datacenter au Cloud Quels challenges? Quelles solutions? Christophe Dubos Architecte Microsoft

LE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data

Cartographie des solutions BigData

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

HADOOP ET SON ÉCOSYSTÈME

Évolution de la supervision et besoins utilisateurs

PRÉSENTE SES SERVEURS L ESPACE LE PLUS INNOVANT POUR FAIRE TRAVAILLER VOS DONNÉES EN TEMPS RÉEL

La Virtualisation Windows chez CASINO. Philippe CROUZY Responsable Infrastructure Equipes Systèmes -Stockage

Contrôlez et Maîtrisez votre environnement de messagerie Lotus Notes Domino

Big Data Concepts et mise en oeuvre de Hadoop

HÉBERGEMENT CLOUD & SERVICES MANAGÉS

Système de Stockage Sécurisé et Distribué

Playbook du programme pour fournisseurs de services 2e semestre 2014

«clustering» et «load balancing» avec Zope et ZEO

Les Rencontres TIC de La Mêlée Numérique. Big Data & Cloud Computing : les nouveaux enjeux

Master Informatique et Systèmes. Architecture des Systèmes d Information. 03 Architecture Logicielle et Technique

Des solutions sur mesure à partir de modules fonctionnels & CRM associés à un studio de customisation.

CA Automation Suite for Data Centers

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

Infrastructure Management

TOUJOURS UNE LONGUEUR D AVANCE.

Documentation d information technique spécifique Education. PGI Open Line PRO

réussir la transition vers le Cloud Computing: équilibre entre rentabilité, fonctionnalité et fiabilité

SMARC La révolution des usages et des technologies : Quels impacts sur votre Stratégie Digitale. Mardi, le 21 avril 2015 SMARC G16

Tests de SlipStream sur les plateformes et : vers la. Vers la fédération du Cloud computing

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

PostgreSQL, le cœur d un système critique

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

BIG Data et R: opportunités et perspectives

Groupe de travail Low Cost. Frédéric DIDIER Jacques WITKOWSKI

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Bases de données documentaires et distribuées Cours NFE04

Dossier Special LE SOFTWARE DEFINED STORAGE

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Labs Hadoop Février 2013

Le Cloud Computing et le SI : Offre et différentiateurs Microsoft

DU RÉSEAU AU BIG DATA UNE OFFRE GLOBALE DE GESTION DE LA DONNÉE. Bruno Fleisch - Responsable Produits Tarik Hakkou Responsable du pôle «Data»

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

La virtualisation de serveurs avec VMWare Infrastructure - Retour d expérience. Rodérick Petetin CRI INSA Rennes

Cloud Computing, Fondamentaux, Usage et solutions

Cloud Computing : Généralités & Concepts de base

Titre : La BI vue par l intégrateur Orange

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Service Cloud Recherche

Serveur virtuel infogéré

Dossier Special LE SOFTWARE DEFINED STORAGE

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

Une nouvelle génération de serveur

Cloud Computing, discours marketing ou solution à vos problèmes?

Anticiper et prédire les sinistres avec une approche Big Data

Le Pôle ORACLE d ITS-Overlap. Platinum Partner

KIWI BACKUP DOSSIER DE PRESSE

EMC Enterprise Hybrid Cloud. Emmanuel Bernard Advisory vspecialist

au Centre Inter-établissement pour les Services Réseaux Cédric GALLO

Déterminer les enjeux du Datacenter

[WEB4ALL PRESENTATION ET TARIFS VPS INFOGERES]

EXALOGIC ELASTIC CLOUD MANAGEMENT

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

Echapper légalement à l impôt sur les données

Section I: Le Contexte du DATA CENTER Pourquoi l AGILITE est Nécessaire dans le DataCenter

Jouez les précurseurs: avec le Managed Server de Hostpoint

SCOM 2012 (System Center Operations Manager) De l'installation à l'exploitation, mise en oeuvre et bonnes pratiques

Perspectives pour l entreprise. Desktop Cloud. JC Devos IBM IT Architect jdevos@fr.ibm.com IBM Corporation

IT SERVICES BUSINESS STORAGE DATA AUDIT PARTNERSHIP INTEGRATOR SECURITY PLANNING PRIVATE AGILITY DYNAMIC PUBLIC TECHNOLOGY SOLUTIONS MANAGEMENT

Transcription:

VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr Avril 2014 Virtualscale 1

Sommaire Les enjeux du Big Data et d Hadoop Quels enjeux opérationnels? Le positionnement de Virtualcale L offre Produits & Services Les premiers succès commerciaux Projections financières VirtualScale : fondateurs et dirigeants Avril 2014 Virtualscale 2

Les enjeux du Big Data et d Hadoop Le Big Data : nouvelle révolution impliquant un modèle autour de traitement et de l analyse de grandes masses de DONNEES CRM 360, Détection de fraude, Analyse des usages, Internet des Objets,.. Virtualscale 3

Les enjeux du Big Data et d Hadoop L environnement Hadoop un catalyseur au cœur de la révolution Big Data (Applications, Analytiques et Infrastructures) : Une avancée majeure issue des géants du web, socle technique d un traitement Big Data en rupture (ralliement de l ensemble des acteurs de l industrie) -Technologique : issue de la communauté Open source, Hadoop permet de traiter parallèlement des données (structurées et non structurées), en très grosses volumétries grâce à son système de fichiers distribués. -Financière : capable de reposer sur une infrastructure à faible coût de stockage et de traitement, Hadoop rebat les cartes de l accès au traitement Big Data face aux bases de données traditionnelles. Virtualscale 4

Les enjeux du Big Data et d Hadoop Un métier de spécialiste va émerger autour de la gestion applications infrastructures du Big data Expertise et courbe de connaissance très récente du à un démarrage de quelques Grands comptes Une complexité inhérente à la profondeur de l éco système HADOOP et sa jeunesse : système de gestion de fichiers distribués, totale imbrication des infrastructures sous jacentes comme le réseau, la sécurité, les serveurs, l impact sur la performance des applications et de leur développements au sein des cluster Hadoop Avril 2014 Virtualscale 5

Quels enjeux opérationnels? Nous sommes sur des architectures hautement élastiques tant sur les CPU/RAM que sur les stockages : perdre une machine ou un disque ne donne pas les mêmes effets quant aux architectures 3 tiers des serveurs BD/Web classiques ; Après une extension d un cluster (ajout de nouveaux nœuds, de CPU, de RAM ou de capacité de stockage aux serveurs existants), des requêtes SQL (Hive) impliquant des ressources importantes ne fonctionnent plus (problème de configuration des comptes utilisateurs) ; Les nœuds de données sont identifiés comme non utilisables après un processus de réplication de données, qui est un processus naturel utilisé par HDFS pour disposer les données sur plusieurs disques (problème de configuration des délais d envois de rapports par les nœuds) ; Avril 2014 6

Quels enjeux opérationnels? Chaque redémarrage du nœud de gestion de l ensemble de l infrastructure de données (Name Node) déclenche au bout d une heure une instabilité majeure du cluster (problème de configuration des délais d envois de rapports par les nœuds) ; Les nœuds de données sont bloqués de temps à autres (marqués donc inutilisable par le nœud de gestion du cluster Name Node) : ils sont lockés par d autres programmes qui attendent de se terminer (problème de nœuds attendant en cascade des résultats d opérations) ; Les programmes exécutants les requêtes SQL (Hive) sont marqués «KILLED Unclean» par l utilisateur provoquant ainsi une très forte lenteur du résultat de la requête (problème de configuration des ressources affectées à Hive, le scheduler met alors fin à certaines tâches pour en prioriser d autres) Avril 2014 7

Le positionnement Virtualscale Partenaire BI Big Data Virtualscale Avril 2014 8

L offre Produits & Services Devenir le leader Français «Gestion des infrastructures Hadoop» autour des axes majeurs suivants : Conseil en architecture, déploiement d infrastructures matérielles et logicielles Open source Hadoop, distribution 100% Apache et formations Hortonworks Prestation Forfait journalier Pack Annuel de 50 tickets de support incluant le support technique sur HDP 2.0 (versioning, sécurité, performances, bugs, assurance qualité Open source, diagnostics impact applicatif ) Centre de formation agréé Hortonworks. Services managés «Hadoop as a service» intégrant infogérance, centre de support et sécurisation d infrastructures Hadoop avec gestion de SLA, soit sur site client (My datazoomr), soit le Paas de Virtualscale ou d un Cloud Public (Cloud datazoomr) Editeur du logiciel d orchestration Hadoop, datazoomr Éditeur contributif de la communauté Open Source avec Efficient Hadoop on Openstack (optimisation Hadoop sur Openstack) Avril 2014 Virtualscale 9

Le Paas Cloud datazoomr Une plateforme et un logiciel (datazoomr) pour la mise en place et la gestion de cluster Hadoop en mode service, hébergé en France Avril 2014 Virtualscale 10

Premiers succès commerciaux Teralab choisit la plateforme Cloud datazoomr de VirtualScale pour la première itération de son projet de plateforme Big Data destiné aux laboratoires de recherche Quelques POC se testent au quotidien sur notre Plateforme par plusieurs Entreprises et société de Business Intelligence Avril 2014 Virtualscale 11

Projections financières 2013 2014 2015 2016 2017 Turnover 223 450 1 463 733 3 140 584 5 203 434 7 781 515 Hadoop Consulting Services 3 250 242 250 436 550 596 800 704 950 Cloud datazoomr 4 000 210 433 806 200 1 762 500 3 155 300 Management Software 0 0 138 384 529 784 1 380 615 Training 0 168 000 364 800 499 200 528 000 Virtuali 216 200 843 050 1 394 650 1 815 150 2 012 650 General expenses & administration 497 720 1 852 335 3 504 598 4 624 977 5 985 818 Sales & Marcom (incl indirect sales com) 96 600 431 000 1 054 590 1 334 281 1 545 606 Finance & support 13 000 24 000 44 600 96 600 102 600 IT (incl Hardware and Licences costs for integration) 344 800 1 265 700 2 217 560 2 960 160 4 049 160 General expenses 43 320 131 635 187 848 233 936 288 453 Revenue -274 270-388 602-364 014 578 457 1 795 697 Avril 2014 Virtualscale 12

Fondateur et Dirigeants Sofiane Ammar Président Sofiane.ammar@virtualscale.fr Serge Alexandre Directeur du développement Serge.alexandre@virtualscale.fr Evelyne Bourderioux Directrice partenaires Evelyne.bourderioux@virtualscale.fr Cyril Masson Directeur Business Développement Cyril.masson@virtualscale.fr Arnault Janson Directeur Technique et des Opérations Arnault.janson@virtualscale.fr Avril 2014 Virtualscale 13