Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau



Documents pareils
Grid5000 aujourd'hui : Architecture & utilisation

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

Gestion de clusters de calcul avec Rocks

Cloud Computing. Groupe : Vincent, Mohammed, Yannick, Allan Tuteur : Mr. NUSSBAUM Lucas Année : 2009/2010

IaaS à la sauce Portails Focus sur. Pierre Aubert Orange Portails OF/DMGP/Portails/DOP 1 er Juillet 2013

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales

Getting Started. 10 étapes pour bien démarrer. Avant de démarrer. Première connexion PCC

Architecture de serveurs virtualisés pour la communauté mathématique

Automatisation de l administration système

Automatisation de l administration système avec

Technique et architecture de l offre Suite infrastructure cloud. SFR Business Team - Présentation

La virtualisation de serveurs avec VMWare Infrastructure - Retour d expérience. Rodérick Petetin CRI INSA Rennes

Retour d expérience de la plateforme de virtualisation sous Proxmox VE à l IPHC journée SysAdmin du 04/12/2014 à l INRA de Toulouse

Tests de SlipStream sur les plateformes et : vers la. Vers la fédération du Cloud computing

Portage d applications sur le Cloud IaaS Portage d application


Sébastien Geiger IPHC Strasbourg

SUJET DES FINALES NATIONALES Sujet jour 1 version 1

PLATE-FORME DE CLOUD COMPUTING SLAPOS. Intégration d applications

Service Cloud Recherche

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

L'automatisation open source pour SI complexes

Informatique en nuage Cloud Computing. G. Urvoy-Keller

Plan de cette matinée

Le Cloud Open-Mind! Emilien Macchi

Cloud Computing et Calcul Haute Performance (HPC High Performance C

Travaux Pratiques sur GRID 5000

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Lʼavenir des grilles Des grilles aux Clouds avec quelques «petits problèmes» de recherche. F. Desprez INRIA

11/04/2014 Document Technique des Services Disponibles. 16/04/2014. Document Technique des Services Disponibles.

Gestion de configuration

Projet VDI le futur poste de travail

Hands on Openstack : Introduction

Dispositif sur budget fédéral

Retours d expériences et perspectives sur les aspects énergétiques

Orchestrer son cloud OpenStack avec Heat

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Solution IT Power Management Gérer la consommation électrique de toute votre infrastructure IT

1. Introduction à la distribution des traitements et des données

Demande d'ap informatique 2012

Licence professionnelle Réseaux et Sécurité Projets tutorés

Projet IGGI. Infrastructure pour Grappe, Grille et Intranet. Fabrice Dupros. CASCIMODOT - Novembre Systèmes et Technologies de l Information

Une solution de déploiement Windows Windows Deployment Service. Arnault Carrere - INRIA Yann Damon - CRPP

Mise en œuvre d une solution de virtualisation

VPN TLS avec OpenVPN. Matthieu Herrb. 14 Mars 2005

Système d administration autonome adaptable: application au Cloud

Utilisation de matériels industriels avec des outils de virtualisation open source. Open Source dans le monde industriel

9 rue Lucien Roullier Goussainville / INGÉNIEUR SYSTÈME LINUX

EXALOGIC ELASTIC CLOUD MANAGEMENT

Le groupe et l actionnariat 10 M 30 M 2. Editique, GED, Archivage. Intégration, Infogérance, Développement

ZABBIX est distribué sous licence GNU General Public License Version 2 (GPL v.2).

au Centre Inter-établissement pour les Services Réseaux Cédric GALLO

Architecte Système et Sécurité, Intégrateur

Détection d'intrusions en environnement haute performance

Les solutions centre de données virtuel et Infrastructure-service de Bell

Table des matières Nouveau Plan d adressage... 3

Retour d exprience sur le cluster du CDS

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

Windows sur Kimsufi avec ESXi

Consultant en informatique

Mise en œuvre d une infrastructure de virtualisation au CNRGV

APPEL À COMMUNICATIONS 2010

JRES 2007 Solution de stockage répartie sur les centres de recherche INRIA, à base de serveurs de fichiers de type «NAS»


Offre de stage. Un(e) stagiaire en informatique

Supervision système et réseau avec Zabbix. Anne Facq Centre de Recherche Paul Pascal 17 avril 2008

vsphere 5 TP2 La virtualisation avec VMware CNFETP F. GANGNEUX technologie GANGNEUX F. 17/12/2012

Gestion des Appliances. M. AIRAJ Ecole Informatique IN2P

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

Le catalogue TIC. Solutions. pour les. Professionnels

Département R&T, GRENOBLE TCP / IP

La haute disponibilité dans la vraie vie

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN

Filière métier : Administrateur Virtualisation

RÉSUMÉ DESCRIPTIF DE LA CERTIFICATION (FICHE RÉPERTOIRE)

Virtualisation et le hosting. Christophe Lucas Sébastien Bonnegent rouen.fr>

StratusLab : Le projet et sa distribution cloud

Catalogue des formations 2015

Infrastructures Parallèles de Calcul

AGARIK, GROUPE ATOS PRÉSENTATION DE LA SOCIÉTÉ. Agarik, hébergeur d un monde intelligent

Open-cloud, où en est-on?

Zimbra Collaboration 8.X

Les environnements de calcul distribué

Amiens Métier 39 : Gestion des réseaux informatiques. Jour 2, première partie. Durée : 3 heures

Sébastien Geiger IPHC Strasbourg

Virtualisation de la sécurité ou Sécurité de la virtualisation. Virtualisation de la sécurité Sécurité de la virtualisation Retour d expérience

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

HÉBERGEMENT CLOUD & SERVICES MANAGÉS

Communications performantes par passage de message entre machines virtuelles co-hébergées

Gérer ses environnements de développement avec Vagrant RMLL 2012

Référentiel ASUR. UE 1 : Enseignement général (132h) MCang = Anglais 30h Session 1 à 4 Anglais technique (en groupe de niveaux) TD 2h

Cartographie du SI pour alimenter la CMDB

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

Infrastructure Management

Migration vers l'open-source de l infrastructure de pare-feu du campus CNRS d Orléans

Transformation vers le Cloud. Premier partenaire Cloud Builder certifié IBM, HP et VMware

La Virtualisation Windows chez CASINO. Philippe CROUZY Responsable Infrastructure Equipes Systèmes -Stockage

Maintenance et gestion approfondie des Systèmes d exploitation Master 2 SILI. Année universitaire David Genest

Mesurer la consommation électrique des serveurs dans les data-centers: besoins & challenges Code-Watchers!

Transcription:

: Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau Nicolas Niclausse - INRIA Sophia Antipolis Méditerranée - projet Aladdin Grid 5000 2 juillet 2012

Présentation Grid 5000 Présentation Lille Rennes Orsay Reims Luxembourg Nancy Une plate-forme expérimentale pour la recherche sur les systèmes distribués et parallèles 7400 cœurs Bordeaux Lyon Grenoble 1600 noeuds de calcul 26 clusters Toulouse Sophia 10 sites en France 1 site au Luxembourg backbone 10Gbps (Renater) Nicolas Niclausse - Grid 5000 2 juillet 2012-2

Présentation Grid 5000 Présentation Début du projet en 2003 (ACI GRID ; INRIA, CNRS et Universités) Premiers utilisateurs début 2005 1000 machines disponibles dès 2006 Environ 500 utilisateurs chaque année (chercheurs, doctorants,...) Système de réservation de ressources basé sur OAR (GPL) Ressources de type machines (cores), vlans, stockage, sous réseaux,... L utilisateur peux installer l OS de son choix sur ses machines réservés, en quelques minutes. Nicolas Niclausse - Grid 5000 2 juillet 2012-3

Outils spécifiques Kadeploy outil de déploiement de cluster scalable Fournit une infrastructure de type Cloud Hardware-as-a-Service Construit au dessus de PXE, DHCP, TFTP Scalable, efficace, robuste et flexible : Broadcast d environnement basé sur une chaîne ou sur BitTorrent 255 machines déployées en 7 minutes Support de plusieurs OS (Linux, Xen, *BSD, etc.) Interface en ligne de commande & par une API REST Preparation update PXE reboot Deploy environment fdisk and mkfs chained broadcast image writing Prepare boot of deployed environment install bootloader update PXE and VLAN reboot Nicolas Niclausse - Grid 5000 2 juillet 2012-4

Outils spécifiques Développé en Ruby ; Utilisation de Taktuk comme lanceur ssh et la diffusion des images. Disponible en licence CeCILL (GPL) Utilisation intensive de IPMI (reboot, console série). Assez peu fiable avec certains constructeurs : plusieurs milliers de reboots par jour gros soucis Testé à l intérieur de Grid 5000 (déploiement de 3800 VM) http://kadeploy3.gforge.inria.fr/ Nicolas Niclausse - Grid 5000 2 juillet 2012-5

Outils spécifiques Isolation Réseau : KaVLAN Reconfigure les switches/routeurs pour la durée d une expérience d un utilisateur afin d obtenir une isolation réseau complète au niveau 2 : Évite le pollution réseau (broadcast, connections non sollicitées) Permet aux utilisateur de configurer leur propre serveur DHCP Expérimentation sur les protocoles basés sur Ethernet Interconnexion de machines provenant d un autre testbed sans compromettre la sécurité de Grid 5000 Basé sur 802.1q (VLANs) Compatible avec de nombreux équipements réseau Utilisation de SNMP, SSH ou telnet pour la connection aux switches Support de Cisco, HP, 3Com, Extreme Networks et Brocade Contrôlé via la ligne de commande ou une API REST Nicolas Niclausse - Grid 5000 2 juillet 2012-6

Outils spécifiques KaVLAN - différents types de VLAN site A VLAN par défault routage entre sites Grid 5000 SSH gw local, VLAN isolé accessible uniquement à travers une passerelle SSH connecté aux deux réseaux VLANs globaux tous les noeuds connectés au niveau 2, pas de routage VLAN routé réseaux de niveau 2 distincts, accessible via routage niveau IP site B Nicolas Niclausse - Grid 5000 2 juillet 2012-7

Outils spécifiques Grid 5000 API API REST : une API pour chaque service de Grid 5000 : Reference API : description versionnée des ressources Grid 5000 Monitoring API : état des ressources Grid 5000 Metrology API : données Ganglia (CPU, load, mémoire, etc.) Jobs API : interface OAR Deployments API : interface Kadeploy VLAN API : interface KaVLAN... Nicolas Niclausse - Grid 5000 2 juillet 2012-8

Outils spécifiques Grid 5000 API : https://api.grid5000.fr/ Nicolas Niclausse - Grid 5000 2 juillet 2012-9

Résultats Des résultats dans différents domaines Cloud : Sky computing sur FutureGrid and Grid 5000 cloud Nimbus deployé sur 450+ machines Grid 5000 et FutureGrid connectés via ViNe HPC : factorisation de RSA-768 étude de faisabilité : prouver qu on peut le faire Variété de hardware comprendre les performances des algorithmes Grid : évaluation du middleware de grille glite Déploiement et configuration entièrement automatisé sur 1000 machines (9 sites, 17 clusters) Nicolas Niclausse - Grid 5000 2 juillet 2012-10

Résultats Virtualisation : 10240 machines virtuelles déployées sur 512 machines (4 sites) Réseau P2P : 10000 clients BitTorrent instanciés sur 178 machines (analyse de performance du protocole BitTorrent) Tendance : De plus en plus d expériences sur les thèmes Cloud et BigData (Nimbus, OpenNebula, OpenStack, Hadoop,...) Nicolas Niclausse - Grid 5000 2 juillet 2012-11

Administration de la plateforme Administration de Grid 5000 Historique & contraintes Historique (2003) Mutualisation de sites indépendants, un sysadmin par site Hétérogénéité des systèmes, versions logiciels, configurations... Nouvelles contraintes (2007 à 2011) Séparation de l équipe : sysadmins / développeurs logiciel 5 à 6 administrateurs systèmes jeunes ingénieurs sur des contrats de 1 à 2 ans Traçabilité des opérations d administration Traçabilité de l évolution de la plate-forme pour garder l expertise Ajout de nouveaux sites Grid 5000 Nicolas Niclausse - Grid 5000 2 juillet 2012-12

Administration de la plateforme Solution mise en place Gestion de configuration des services Une VM (Xen) par service (LDAP, DHCP, DNS, Nagios, Kadeploy, OAR, MySQL, KaVLAN, ganglia, Apache,...) Utilisation de puppet, git et capistrano pour la configuration 350 VM réparties sur les 10 sites Utilisation de chef pour la génération des images des OS destinées aux utilisateurs (debian) Nicolas Niclausse - Grid 5000 2 juillet 2012-13

Administration de la plateforme Solution mise en place Architecture Puppet GIT Server Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Administration de la plateforme Solution mise en place Architecture Puppet Root Puppet Master GIT Server Puppetmasterd Root Puppet Master Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Administration de la plateforme Solution mise en place Architecture Puppet Root Puppet Master GIT Server Puppetmasterd Certification Authority Root Puppet Master Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Administration de la plateforme Solution mise en place Architecture Puppet Root Puppet Master GIT Server Puppetmasterd LDAP Puppet clients descriptions Certification Authority Root Puppet Master Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Administration de la plateforme Solution mise en place Architecture Puppet Root Puppet Master GIT Server Production GIT LDAP Puppetmasterd Puppet environments Puppet modules manifests + files Puppet clients descriptions Certification Authority Root Puppet Master Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Administration de la plateforme Solution mise en place Architecture Puppet Root Puppet Master GIT Server Testing Files Production GIT LDAP Puppetmasterd Puppet environments Puppet modules manifests + files Puppet clients descriptions Certification Authority Root Puppet Master Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Administration de la plateforme Solution mise en place Architecture Puppet Root Puppet Master GIT Server Testing Files Production GIT LDAP Puppetmasterd Puppet environments Puppet modules manifests + files Puppet clients descriptions Certification Authority Root Puppet Master Testing Production Testing Production Files GIT Puppet Client & Master (Nancy) LDAP Files Puppet Client & Master (Rennes) GIT LDAP Sites Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Administration de la plateforme Solution mise en place Architecture Puppet Root Puppet Master GIT Server Testing Files Production GIT LDAP Puppetmasterd Puppet environments Puppet modules manifests + files Puppet clients descriptions Certification Authority Root Puppet Master Testing Production Testing Production Files GIT Puppet Client & Master (Nancy) LDAP Files Puppet Client & Master (Rennes) GIT LDAP Sites Puppet Client Puppet Client Puppet Client Puppet Client Common services and configurations : bindg5k, proxyg5k, mysqlg5k, adming5k, xeng5k, oarg5k, kadeployg5k, etc... Nicolas Niclausse - Grid 5000 2 juillet 2012-14

Déploiement avec Capistrano Solution mise en place Capistrano Outil de déploiement d applications (Ruby on Rails à l origine) Description dans des Capfiles de tâches, de rôles et de dépendances entre ces tâches Intégration poussée de SSH et d un lanceur parallèle http://github.com/capistrano/capistrano Nicolas Niclausse - Grid 5000 2 juillet 2012-15

Déploiement avec Capistrano Solution mise en place Le dépôt GIT Puppet Dépôt GIT. Capfile Gemfile config modules apache frontendg5k oar oarg5k openssl puppetg5k Capfile files lib manifests templates nagios 03/11/11 13:38 Un Capfile principal : namespaces modules, git Le répertoire des modules Puppet Des modules génériques propres à un service Des modules spécifiques à Grid 5000 Un Capfile par module : namespaces puppet, bind nagios,... 83 modules actuellement 13 directories, 3 files Nicolas Niclausse - Grid 5000 2 juillet 2012-16

Retour d expérience Migration Retour d expérience Migration Migration progressive depuis septembre 2009 L hétérogénéité des systèmes a compliqué l écriture des recettes au départ Prise en compte de spécificités de chaque sites Nicolas Niclausse - Grid 5000 2 juillet 2012-17

Retour d expérience Évolution de la plate-forme Retour d expérience Évolution de la plate-forme Choix d une distribution unique Utilisation de la même version de Debian sur tous les serveurs Grâce à Puppet Les spécificités des sites se sont révélées peu à peu Un travail d uniformisation peut donc se faire La plate-forme est plus stable et plus maintenable Nicolas Niclausse - Grid 5000 2 juillet 2012-18

Retour d expérience Adoption par les administrateurs systèmes Retour d expérience Adoption par les administrateurs systèmes Points favorables Environnement technique de travail stimulant Prise de conscience de la pérennité du travail réalisé Évite de devoir maintenir des documentations d installation parfois complexes La traçabilité, important dans une équipe géographiquement distribué avec un tel turn-over Point important Rester consciencieux : on peut tout "casser" assez facilement Nicolas Niclausse - Grid 5000 2 juillet 2012-19

Retour d expérience Évolution de l infrastructure Puppet Retour d expérience Évolution récente de l infrastructure Puppet Nicolas Niclausse - Grid 5000 2 juillet 2012-20

Retour d expérience L équipe Grid 5000 David Margery, Directeur Technique Pascal Morillon Emmanuel Jeanvoine Frédéric Desprez, Directeur Scientifique Lucas Nussbaum Olivier Richard et beaucoup d autres https://www.grid5000.fr/ Nicolas Niclausse - Grid 5000 2 juillet 2012-21