Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales



Documents pareils
Tests de SlipStream sur les plateformes et : vers la. Vers la fédération du Cloud computing

Portage d applications sur le Cloud IaaS Portage d application

Utilisation du Cloud StratusLab dans le cadre d application astroparticule à l APC

TP développement : portage d applications sur le Cloud IaaS

Vers une fédération de Cloud Académique dans France Grilles J. Pansanel pour le groupe FG-Cloud (M. Airaj, C. Cavet, V. Hamar, M. Jouvin, C.

Guillaume PHILIPPON. Mise en place d un cloud privé et publique

Gestion de clusters de calcul avec Rocks

Un exemple de cloud au LUPM : Stratuslab

Infrastructures Parallèles de Calcul

Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

Chapitre 2. Cluster de calcul (Torque / Maui) Grid and Cloud Computing

Détection d'intrusions en environnement haute performance

Stéphane DERACO, DSI CNRS l Argos Devops : de l hyperviseur aux conteneurs l 11/12/2014 DOCKER

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

L'automatisation open source pour SI complexes

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

PLATE-FORME DE CLOUD COMPUTING SLAPOS. Intégration d applications

Les environnements de calcul distribué

Cours Linux. Cours en ligne Administrateur Systèmes Linux. Académie Libre

Colloque Calcul IN2P3

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

Etude d architecture de consolidation et virtualisation

Automatisation de l administration système

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Evolution des technologies et émergence du cloud computing Drissa HOUATRA, Orange Labs Issy

ParallelKnoppix. Majid Hameed. Copyright 2005 Majid Hameed. Copyright 2005 Gauthier Savart. Copyright 2005 Joëlle Cornavin

Accenture accompagne la première expérimentation cloud de l État français

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

La gestion du poste de travail en 2011 : Panorama des technologies

Gestion des Appliances. M. AIRAJ Ecole Informatique IN2P

Hyper-V et SC Virtual Machine Manager Technologie de virtualisation sous Windows Server 2008 R2 [2ième édition]

Infrastructure de calcul du CRRI

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Présentation de l Université Numérique de Paris Île-de-France

VMWare Infrastructure 3

Le tout à l usage dans un IaaS public «Comment une plateforme industrielle permet de déployer des usages applicatifs en accord avec cette promesse»

Projets de stage. Présentation

Big Data Concepts et mise en oeuvre de Hadoop

Plate-forme Cloud CA AppLogic pour les applications d entreprise

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

La Continuité d Activité

tech days AMBIENT INTELLIGENCE

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN

Communications performantes par passage de message entre machines virtuelles co-hébergées

Qu est ce qu une offre de Cloud?

Service Cloud Recherche

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

1 Démarrage de Marionnet

Retour d exprience sur le cluster du CDS

Cloud Computing et Calcul Haute Performance (HPC High Performance C

EXALOGIC ELASTIC CLOUD MANAGEMENT

Tungsten: une implémentation du futur clustering de PostgreSQL

VIRTUALISATION : MYTHES & RÉALITÉS

Plan de cette matinée

SysFera-DS : vers une solution de portail scientifique collaboratif chez EDF. Benjamin Depardon

Maintenance et gestion approfondie des Systèmes d exploitation Master 2 SILI. Année universitaire David Genest

Projet d'infrastructure de stockage mutualisée

Network Shutdown Module V3 Extension du Manuel Utilisateur pour architecture Virtualisée VMWare ESX Server 3, 3.5

Qu est ce qu une offre de Cloud?

StratusLab : Le projet et sa distribution cloud

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

Catalogue des stages Ercom 2013

ViSaGe. Virtualisation du Stockage dans les Grilles. Informatiques. RenPar 16, 6-8 Avril 2005 Thiebolt François

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Projet IGGI. Infrastructure pour Grappe, Grille et Intranet. Fabrice Dupros. CASCIMODOT - Novembre Systèmes et Technologies de l Information

Playbook du programme pour fournisseurs de services 2e semestre 2014

CLOUD PRIVÉ GENERALI - ACCOMPAGNEMENT AU CHANGEMENT - DU «POC» À LA RÉALITÉ. Alain ROY Generali Logo Société

Technique et architecture de l offre Suite infrastructure cloud. SFR Business Team - Présentation

PHP et le Cloud. All rights reserved. Zend Technologies, Inc.

Le Cloud Open-Mind! Emilien Macchi

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Système Principal (hôte) 2008 Enterprise x64

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Table des matières. Chapitre 1 Les architectures TSE en entreprise

«Les projets collaboratifs pour les nuls»

Filière métier : Administrateur Virtualisation

Gestion de parc Windows depuis Unix. Pascal Cabaud & Laurent Joly

Les Clouds de production : Panorama pour les sciences de la vie. Jérôme PANSANEL <jerome.pansanel@iphc.cnrs.fr> Directeur technique France Grilles

Cloud Computing. Groupe : Vincent, Mohammed, Yannick, Allan Tuteur : Mr. NUSSBAUM Lucas Année : 2009/2010

Système de Stockage Sécurisé et Distribué

PloneLabs un gestionnaire de contenu pour les laboratoires

Transformation vers le Cloud. Premier partenaire Cloud Builder certifié IBM, HP et VMware

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

au Centre Inter-établissement pour les Services Réseaux Cédric GALLO

Demande d'ap informatique 2012

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Jean-François Boulicaut & Mohand-Saïd Hacid

Retour d expérience sur Prelude

Contributions à l expérimentation sur les systèmes distribués de grande taille

Network Shutdown Module V3 Extension du Manuel Utilisateur pour architecture Virtualisée VMWare ESX Server

PROCEDURE ESX & DHCP LINUX

Cloud Computing : quels intérêts et quelles solutions pour les développeurs?

BONJOURGRID : VERSION ORIENTÉE DONNÉE & MAPREDUCE SÉCURISÉ

Cours 13. RAID et SAN. 2004, Marc-André Léger

PRESENTATION RESSOURCES. Christian Dupaty BTS Systèmes Numériques Lycée Fourcade Gardanne Académie d Aix Marseille

Transcription:

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales Cécile Cavet cecile.cavet at apc.univ-paris7.fr Centre François Arago (FACe), Laboratoire AstroParticule et Cosmologie (), LabEx UnivEarthS, Univ. Paris Diderot, CNRS/IN2P3, CEA/lrfu, Obs. de Paris, Sorbonne Paris Cité, France

Laboratoire AstroParticule & Cosmologie () Une grande variété d applications scientifiques : Codes de simulation et de traitement de données. Calcul distribué : Clusters locaux. Supercalculateurs (inter)nationaux. Grille EGI. Depuis récemment, le Cloud académique. Demandes de projets scientifiques : LISAPathfinder (2105) / LISA (2034) : code C++ sur une MV et sur un /Maui. /LSST ( 2020) : code Python sur une MV. Besoin d Infrastructure-as-a-Service (IaaS) et de Plateform-as-a-Service (PaaS).

Spécificité des missions spatiales : exemple avec Le Cloud est très bien adapté : Ressources spécifiques : pipeline de traitement de données. Répartition géographiques des données : 8 centres de données en Europe (CC-IN2P3 en est un). Ressources dédiées : jusqu à présent, projet = perte du matériel à la fin. Gestion des pics de production : 10 9 objets à traiter en un temps minimum. Développement de code sur une plateforme collaborative (machine virtuelle).

Performance des MV : «High Performance Challenge Benchmark» : CPU, mémoire, réseau d interconnexion, entrée/sortie. Comparaison avec un Cluster classique. MV (test HPL) : 8 CPU, 16 GB de mémoire. Customisation : Open MPI, librairies spécifiques (LAPACK, BLAS). La virtualisation ne dégrade pas les performances, les ressources virtualisées transcrivent les ressources physiques.

Voir le TP3 dev. Figure: Test HPL réalisé sur le cluster Arago et sur une MV de StratusLab.

Application n o 1 : pipeline Traitement de données : MV : Customisation : modules Python. Code en Fortran. en Python. DP : Données (45 GB) + base de données. Local : Interface Web.

Application n o 1 : pipeline Voir le TP4 dev. Figure: Interface Web générée par l outils Pipelet : l architecture des répertoires présents sur le disque persistant est visible via l interface.

Application n o 2 : démonstrateur Code de traitement de données : Environnement virtuel pour valoriser le code : Démonstration des fonctionnalités via un test physique. Utilisation simplifiée. Code source sur un dépôt Git (Gitorious). MV : Customisation : modules Python.

Application : démonstrateur Voir le TP2 dev. Figure: Reconstruction de décalages spectraux de Galaxies sur une MV de StratusLab.

Application LISA n o 1 : machine de calcul partagée Code C++ : Ressources : MV : 4 CPU, 16 GB de mémoire. DP : 50 GB. 4 utilisateurs (1 chercheur + 3 stagiaires) + 1 répertoire commun. Customisation : Paquets Linux et scientifiques (Python 2.7, librairies).

Application LISA n o 1 : machine de calcul partagée Ajouts manuels : Application : installation du code dans le répertoire commun. Utilisateurs : nom, partie publique de la clé ssh. DP : montage. Spécificités : \home des utilisateurs sur le DP monté sur \mnt : Plus d espace de stockage Plus de sécurité contre la perte des données en cas de défaillance de la MV. Si la MV est détruite, juste besoin de : 1 Relancer une MV customisée. 2 Remonter le DP. 3 Re-créer les utilisateurs.

Application LISA n o 2 : cluster Torque sur le Cloud Code C++ : Même «workflow» que celui du Cluster local. Gestionnaire de soumission de job Torque/Maui. Extensibilité pour les pics de production. MV : objectif 4 MV, 5 CPU. Customisation.

Application LISA n o 2 : cluster Torque sur le Cloud Figure: Carte LLH pour la phase 1 de la mission sur une MV de StratusLab.

sur le Cloud Ensemble de machines...virtuelles (MV). 1 noeud maître et X noeuds esclaves. Méthodologie : installation manuelle. 1 Instanciation des MV. 2 Installation des paquets systèmes. 3 Lancement des services (Torque, NFS...). Outils pour l automatisation : Catalogue d image/marketplace : images disques customisées pour torque-master et torque-worker. StratusLab : stratus-run-cluster permet l instanciation d un cluster virtuel (User + NFS + MPI).

sur le Cloud Informations échangées entre les machines : Identifiants sur le réseau : Adresse IP Nom des hôtes Identifiants de connexions : Clés ssh inter MV. Clés munge. Outils pour l automatisation : difficile car les informations changent et doivent être échangées à la construction de chaque nouveau cluster virtuel.

sur le Cloud : bilan Création d un Cluster virtuel : Outils d automatisation intrinsèques à une solution de Cloud. Installation de Torque : Automatisation limitée : les MV doivent communiquer. Besoin d un outils au dessus de la couche IaaS.

Déploiement automatique d un grand nombre de machines virtuelles sur l infrastructure de Cloud et orchestration de services. Voir présentation de samedi 05/07. Travail inclus dans la Fédération de Cloud académiques français (voir présentation de tout à l heure).

: déploiement d un cluster Torque Tests effectués sur StratusLab@LAL. Travail en cours... Choix d images disques référencées : Construites à l intérieur de. Utilisation de recettes : script bash pour automatiser l installation et le déploiement. Référencées sur le catalogue correspondant à l infrastructure.

: déploiement d un cluster Torque Types d image : Orchestrateur : ressources minimalistes Torque-master Torque-worker Choix d un déploiement : Choix d un nombre de noeuds de travail Run...

: déploiement d un cluster Torque Figure: Machines virtuelles instanciées sur StratusLab et déployées en cluster Torque.

Conclusion Intérêt du Cloud pour les applications de l : Portage simplifié des applications : Ressources adaptatives (machine, cluster virtuel...) Environnement système optimisé (root, librairies, compilateurs...) Population des utilisateurs/ cas d utilisation : Découverte. Formation. Stagiaires / collaborateurs. Type de calcul : Production des applications compatibles avec les resources du Cloud. Prototypage des applications HPC.

Merci pour votre attention.