SysFera. Benjamin Depardon



Documents pareils
E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Les mésocentres HPC àportée de clic des utilisateurs industriels

SysFera-DS : vers une solution de portail scientifique collaboratif chez EDF. Benjamin Depardon

Hébergement MMI SEMESTRE 4

Big data et sciences du Vivant L'exemple du séquençage haut débit

Cloud (s) Positionnement

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Tests de SlipStream sur les plateformes et : vers la. Vers la fédération du Cloud computing

Cloud Computing et Calcul Haute Performance (HPC High Performance C

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Les environnements de calcul distribué

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

Entrez dans l ère du Numérique Très Haut Débit

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

Assemblée générale Aristote

Déterminer les enjeux du Datacenter

VMware : De la Virtualisation. au Cloud Computing

Vers une fédération de Cloud Académique dans France Grilles J. Pansanel pour le groupe FG-Cloud (M. Airaj, C. Cavet, V. Hamar, M. Jouvin, C.

LES APPROCHES CONCRÈTES POUR LE DÉPLOIEMENT D INFRASTRUCTURES CLOUD AVEC HDS & VMWARE

SQL Server 2012 et SQL Server 2014

Bull, un catalogue de service particulier pour répondre aux environnements complexes

Journée Scientifique Onera

Les Clouds de production : Panorama pour les sciences de la vie. Jérôme PANSANEL <jerome.pansanel@iphc.cnrs.fr> Directeur technique France Grilles

Cloud Computing : quels intérêts et quelles solutions pour les développeurs?

Le Cloud: Mythe ou Réalité?

Vers une meilleure gouvernance des plateformes d ingénierie

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE

Évolution de la supervision et besoins utilisateurs

Chapitre 4: Introduction au Cloud computing

Opérateur global de la performance IT

Du Datacenter au Cloud Quels challenges? Quelles solutions? Christophe Dubos Architecte Microsoft

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN

OBJECTIFS. Une démarche E-science

Fonctions. Solution professionnelle pour le stockage de données, la synchronisation multi- plateformes et la collaboration

Christophe Dubos Architecte Infrastructure et Datacenter Microsoft France

Infrastructure de calcul du CRRI

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales

Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Qu est ce qu une offre de Cloud?

Bienvenue au Club Logistique! Jeudi 05 décembre 2013

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

IT SERVICES BUSINESS STORAGE DATA AUDIT PARTNERSHIP INTEGRATOR SECURITY PLANNING PRIVATE AGILITY DYNAMIC PUBLIC TECHNOLOGY SOLUTIONS MANAGEMENT

Kick Off SCC Vers de nouveaux horizons

Etude d architecture de consolidation et virtualisation

Business & High Technology

Le Cloud Computing, levier de votre transformation digitale

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

Contributions à l expérimentation sur les systèmes distribués de grande taille

Augmenter la disponibilité des applications JEE grâce au clustering : Le projet open source JShaft

Evolution des SI à l heure du Cloud

Mégadonnées (Big data) et Complexité Session introductive

pour Une étude LES DÉFIS DES DSI Avril 2013

Cycle Innovation & Connaissance 12 petit déjeuner Mardi 15 mai Cloud Computing & Green IT : nuages ou éclaircies?

La rencontre du Big Data et du Cloud

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

Résolvez vos problèmes d énergie dédiée à l informatique

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Breizhcamp - Cloud - Ruby

Cloud Computing Enjeux stratégiques & transformationnels. Franck Besnard, Principal / Strategist, VMware

Cloud Privé / Public / Hybrid. Romain QUINAT vente-privee.com

HySIO : l infogérance hybride avec le cloud sécurisé

tech days AMBIENT INTELLIGENCE

DESCRIPTIF DES PROJETS 3EME ANNEE QUI SERONT PRESENTES LORS DE LA JOURNEE DE PROJET DE FIN D ETUDE LE 26/01/2012

Evolution des technologies et émergence du cloud computing Drissa HOUATRA, Orange Labs Issy

Eric Bertrand 08/11/06 Maître de conférence 1

Cycle Innovation & Connaissance 12 petit déjeuner Mardi 15 mai Cloud Computing & Green IT : nuages ou éclaircies?

Prologue sera présent au côté de CloudWatt au salon Cloud Computing World Expo de Paris les 9 et 10 avril 2014

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

Chapitre 10 Mettre en œuvre un cluster Hadoop

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

Colloque Calcul IN2P3

Le Cloud Computing L informatique de demain?

Accès aux données Sentinelles

Mathieu Rivoalen. Etude d'approfondissement des réseaux RICM 5 Option Réseaux

Règles et paramètres d'exploitation de Caparmor 2 au 11/12/2009. Pôle de Calcul Intensif pour la mer, 11 Decembre 2009

Qu est ce que le Cloud Computing?

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Cloud Computing. La révolution industrielle informatique Alexis Savin

Le Pôle ORACLE d ITS-Overlap. Platinum Partner

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

TRANSFORM IT + BUSINESS + YOURSELF

Plan global Outils de développement et compilation. Ce que l on veut éviter. Plan. Git : gestion de code source et versionnement.

De l IaaS au SaaS, La BI au cœur du cloud

L art d ordonnancer. avec JobScheduler. François BAYART

Adopter une approche unifiée en matière d`accès aux applications

Nos solutions Cloud Kain, le 27 mars 2013 Laurent Guelton, Administrateur Délégué. Copyright 2013 Orditech. Tous droits réservés. Version 2.

Introduction à MapReduce/Hadoop et Spark


Cloud Computing. 19 Octobre 2010 JC TAGGER

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

BIG Data et R: opportunités et perspectives

Cloud Computing Stratégie IBM France

Programmation parallèle et distribuée (Master 1 Info )

Transcription:

SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera

SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation Française 80% académique

Notre mission «Simplifier l accès et l administration i ti d applications complexes dans du Cloud hybride»

Introduction Des besoins applicatifs de plus en plus importants t et variés Explosion du nombre et du volume de données, Big Data Moins coûteux de louer de la capacité de calcul et de stockage que de monter un centre de calcul Simplicité d utilisation Critère utilisateur le plus important Infrastructure cachée à l utilisateur We will probably see the spread of computer utilities, which, like present electric and telephone utilities, will service individual homes and offices across the country Professeur John McCarthy, 1961!!!

Beaucoup de buzz! Google Trends

SaaS? Est ce que le SaaS se prête aux applications de calcul scientifique? Comment avoir des applications non web en SaaS? Sur quelles infrastructures?

ANALYSES BIOINFORMATIQUE

Evolution des études en bioinfo. Variété iétédes analyses Séquences (ADN, protéines) Structurales (structure 3D) Réseaux (interactions gènes, protéines, cellules, organismes) Statistiques (populations) Explosion des données à analyser Nouvelles méthodes de séquençage très haut débit Permet de collecter des données à l échelle de la cellule entière Catalogage exhaustif

Analyses bioinformatiques Beaucoup d analyses sont parallélisables (data parallel) Une analyse combine un ensemble de programmes différents et l intégration de données hétérogènes Diversité des langages de programmation utilisés (perl, python, java,...) Enormément de logiciels pour réaliser les mêmes traitements

Constat Des besoins grandissants : puissance de calcul, l parallélisation, gestion de données, algorithmique adaptée, Un besoin de transparence dans l'utilisation des ressources informatiques Un besoin de cloisonnement des utilisateurs, des données Des plates formes disponibles et des logiciels matures pour les gérer Le mode SaaS (Software as a Service) s'impose simpose maintenant même pour les applications scientifiques

PLATEFORME E BIOTHON

E Biothon Une plate forme pour accélérer les recherches en biologie, santé et environnement

Infrastructure Deux racks de Blue Gene P Puissance en crête de 28 téraflops Chaque rack compte 1024 nœuds de 4 cœur Chaque nœud possède 2 gigaoctets de mémoire RAM Une capacité de stockage de 200 téraoctets Deux modes de fonctionnement Standard High Throughtput Computing

SysFera INRA 11/02/2014 d (d ) Read syst (disseq) Alain Franc, INRA Bordeaux

PhyML Un outil de comparaison des espèces du vivant, efficace, rapide et précis. Basé sur le principe du maximum de vraisemblance. L'algorithme calcule l la probabilité bilité que les données correspondent tà plusieurs modèles d'arbres d'évolution darwinienne, et le résultat est le modèle ayant la plus haute probabilité. Original algorithm : (a) A first tree is built by a fast distance based algorithm (BIONJ). (b) The model parameters (e.g., gamma) are optimized and periodically updated. (c) The tree is iteratively refined until convergence: (1) compute all possible changes; (2) apply a proportion of these changes; (3) check that the modified tree is better than the current tree, otherwise divide by 2 and return to (2). (d) Return the current tree. La publication de PhyML est la plus citée au monde en environnement-écologie depuis 2007 (cf. Science Watch)

SysFera DS Gestion des ressources et des applications Gestion des données Visualisation à distance Monitoring et refacturation

Applications non interactives Mise à disposition d applications Remplissage uniquement des paramètres applicatifs Paramètres de soumission avancés (machine, nb nœuds, walltime) Fichiers de sortie + stdout/err

Gestion des données Vision de plusieurs systèmes de fichiers distants Actions classiques sur les fichiers et dossiers (mv, rm, stat, chmod ) Transferts entre clusters Download/upload

Données Dans SysFera DS Basé sur un système de fichiers POSIX Droits Linux des utilisateurs (rwx, groups) Pour E Biothon Comptes partagés entre utilisateurs Par P projet jt Données partagées entre tous les utilisateurs d un même projet

E Biothon & SysFera DS Une plateforme ltf et un portail tiluniques pour Mettre à disposition en SaaS des applications de bioinformatique Gérer les données à distance Exécuter les analyses Gestion par projets Cloisonnement des utilisateurs, des applications Suivi de l utilisation, permettant une «refacturation» des usages 1 ETP dédié à l administration, à l optimisation et au portage des applications Ouvert à d autres projets

SYSFERA DS

SysFera Confidential SysFera DS HTML5 Browser Mono cluster Multi cluster Cloud Vishnu

Avantages administrateurs Simplicité ité de déploiement Rien à installer côté utilisateur 1 portail, 1 DB et 1 démon / cluster Non intrusif/exclusif Simplicité d administration Basé sur votre LDAP & comptes utilisateurs Abstrait les différents batch schedulers/clouds SLURM, SGE, Torque, PBS Pro, LoadLeveler, LSF Cloud : OpenStack, OpenNebula (DeltaCloud) Visualisation distante encapsulée dans le flux http(s) Sécurisé de bout en bout

Applications interactives Réservation de plage horaire de visu distante Lancement automatique des applications Partage de la session entre plusieurs collaborateurs

INFRASTRUCTURES

Large choix d infra. de calcul l Régionales et nationales Mesocentres GENCI/PRACE/ Datacenters locaux Cloud AWS [Numergy & CloudWatt]

Un partenaire de proximité pour la bioinformatique sécurisée dans le Cloud Accès à la demande à des applications de Bio Informatique dans le Cloud Solution de portail SysFera DS Partenaire infrastructure Cloud : Groupe CFI Acteur régional leader en intégration, infrastructure IT et Cloud 160 personnes dédiées à plus de 1400 clients en contrats managés Un datacenter Green IT dernière génération en Rhône Alpes Innovant, éco durable, hyper sécurisé En cours d obtention de l agrément Santé

Conclusion Un besoin grandissant d applications scientifiques en SaaS SaaS Virtualisation ti Modification du code des applications Sécurisation des données Réels besoins bien étudier la pertinence du «tout sécurisé» Des infrastructures à la pelle