Services de la grille Abderrahman El Kharrim Division TIC CNRST, Rabat elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 1
Architecture et Middleware de la Grille Les services de glite elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 2
Architecture et Middleware de la Grille Les principaux services de glite User Interface (UI): Le point d entrée de l utilisateur à la grille Workload Management System (WMS): Traite les prérequis de l utilisateur sur les ressources disponibles dans la grille Information System (BDII): Caractéristiques et le statut des CE et SE Computing Element (CE): Gère les queues de jobs qui s exécutent sur les ordinateurs du site (WN) Storage Element (SE): Offre à grand échelle de capacités de stockage VO Membership System(VOMS): Manages les VOs service basic pour l autorisation elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 3
Système d Information Communication entre les services glite elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 4
Architecture et Middleware de la Grille Les principaux services de glite elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 5
Système d Information Qu'est-ce, pourquoi et comment? Qu'est-ce? Système chargé de collecter des informations sur l état des ressources/services mis à disposition sur la Grille. Pourquoi? Découvrir les ressources/services de la grille et leur nature Disposer des données pertinentes pour utiliser les ressources et les services offerts par les sites de la grille Vérifier l état de santé des ressources et services de la grille Comment? En adoptant un modèle de données commun à tous les composants/acteurs de la grille qui ont besoin d interagir avec les ressources/services de la grille En offrant les outils qui permettent d alimenter et d interroger le système En supervisant localement l état et la description des ressources/services, et en publiant les données fraichement collectées sur le système d information elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 6
Système d Information Qui est ce qui utilise le SI? Utilisateurs finaux de la grille Récupérer des informations sur les ressources: Où puis-je soumettre mon job? Où puis-je stocker mes fichiers? Quels logiciels sont disponibles sur un CE donne? Administrateurs du site Publier des informations sur les ressources et les services qu'ils fournissent Middleware WMS: faire correspondre les exigences du job et l'allocation des ressources Services de surveillance: Récupération d'informations sur l'état et la disponibilité des ressources elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 7
Système d Information Principe Chaque site publie Une description des ressources/services qu il fournit par VO L état actuel de ses ressources (CPUs libres, Espace de stockage, etc.) Chaque VO publie Ce qu elle a installé sur chaque site ( Tags des Software Managers) Les acteurs interrogent le SI pour savoir comment utiliser les services/ressources de la grille elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 8
Système d Information Modèle de données Pour réponde aux exigences liées à l hétérogénéité des ressources et leur dispersion géographique, le modèle de données adopté par glite est le GLUE Schema (Grid Laboratory Uniform Environment) Définition de schémas LDAP décrivant chaque composant des ressources/services de la grille Le Système d'information disponible dans glite: BDII (Berkeley DB Information Index) elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 9
Système d Information Architecture globale de SI Le SI est organisé selon une architecture à 3 niveaux: GRIS GIIS/Site BDII Top BDII BDII : Berkeley Database Information Index GIIS : Grid Index Information Server GRIS : Grid Resource Information Service Top-level BDII: collecte les informations des site-level BDIIs Sur chaque site: le site-level BDII (site GIIS): collecte les informations des GRISs locaux sur chaue ressources: un GRIS local: Publie les informations dynamiques et statiques elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 10
Système d Information Architecture globale de SI Top BDII-A Top BDII-B - Application utilisateur - WMS - Services de supervision Site 1 Site BDII Site 2 Site BDII Site BDII Site 3 SE Local GRIS CE Local GRIS LFC Local GRIS SE Local GRIS CE Local GRIS WMS Local GRIS SE Local GRIS CE Local GRIS MyProxy Local GRIS elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 11
Système d Information Utilisation du Système d Information glite fournit plusieurs outils pour manipuler le SI. 2 commandes principales qui servent comme outils d interrogation du SI: lcg-infosites: simple, qui répond à la majorité des besoins. Elle renvoie quelques informations en relation avec une composante sur la grille. lcg-info: supporte des requêtes plus complexe et revoie des informations plus spécifiques. lcg-infosites h, lcg-info h, pour voir toutes les options d utilisation elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 12
Système d Information lcg-infosites et lcg-info La commande lcg-infosites est en fait juste un script perl qui appelle une série de commandes LDAP et qui a été développé pour permettre aux utilisateurs de récupérer des informations sur les ressources de la grille correspondant aux cas d utilisation les plus courants. La commande lcg-info peut être utilisée par exemple pour lister soit les CE ou les SE qui répondent à un ensemble donné de conditions sur leurs attributs, et à afficher, pour chacun d'eux, les valeurs d'un ensemble d'attributs. L'information est tirée du BDII spécifié par le la variable d'environnement LCG_GFAL_ INFOSYS ou bien dans la ligne de commande. elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 13
Système d Information RTM, Real Time Monitoring Provides a real time overview of job submissions and I/O Sandboxing http://rtm.hep.ph.ic.ac.uk/ elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 14
Système d Information Liens glite documentation http://glite.web.cern.ch/glite/documentation/ LDAP Concepts & Overview http://www.zytrax.com/books/ldap/ch2/ OpenLDAP community http://www.openldap.org GLUE Schema Specification version 1.3 Final http://forge.gridforum.org/sf/go/doc14185?nav=1 Official monitoring are: Nagios managed by CERN at https://nagios.africa-grid.org/nagios/ Gstat managed by CERIST and GARR at http://gstat.eumedgrid.eu/gstat Grid Reat Time Monitoring by Imperial College London at http://rtm.hep.ph.ic.ac.uk elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 15
Gestion des données Défis Hétérogénéité Les données sont stockées sur des systèmes de stockage différentes à l'aide de différentes technologies d'accès Distribution Les données sont stockées dans des endroits différents (dans la plupart des cas il n'y a aucun système de fichiers partagé ou un espace de nom commun) Les données doivent se déplacer entre différents endroits Description des données Les données sont stockées comme des fichiers (besoin de les décrire et de les localiser selon leur contenu) Storage Resource Manager interface File Catalogue File Transfer Service Metadata Service elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 16
Gestion des Données Le Storage Element Le Storage Element (SE) est le service de glite qui permet aux utilisateurs et aux applications de stocker/récupérer les données (fichiers) Les fichiers localisés sur les SEs Sont dans la majeur des cas "write-once, read-many". Accessibles par les utilisateurs et par les applications de n'importe où sur la grille Peuvent être répliquées sur plusieurs sites (redondance). Ne peuvent pas être changés sauf si supprimés ou remplacés. Les SEs Fournissent un espace disque dédié aux stockage des fichiers. Fournissent un protocole de transfert (GSIFTP) Fournissent une interface pour la gestion des stockages sur disques ou sur bande : Storage Resource Manager (SRM) Types.. dcache, Storm, CERN Advanced STORage manager (CASTOR), Disk Pool Manager (DPM) elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 17
Gestion des Données Le Storage Element elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 18
SRM Gestion des Données Storage Resource Manager (SRM) Le SRM est une interface unique qui prenne en charge l'interaction avec le stockage local des données SE CASTOR SE Storm SE DPM Je vais leur parler en votre nom Je vais allouer l'espace convenable pour vos fichiers Je vais utiliser les protocoles de transfert pour vous envoyer vos fichiers SE dcache elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 19
Gestion des Données Exemple de besoin L'utilisateur travaille sur un job qui a besoin de: - Lire les données de simulations MonteCarlo du sitea - Lire les données d'une experience du siteb - Lire des données d'environnement du sitec - Ecrire les resultats sur sited Storm sur SiteA dcache sur SiteB DPM sur SiteD DPM sur SiteC elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 20
... GUID : Grid Unique IDentifier Identifiant unique d'un fichier sur la grille Exemple: guid:38ed3f60-c402-11d7-a6b0-f53ee5a37e1d Toutes les repliques d'un fichier se partagent le même GUID LFN : Logical File Name Gestion des Données Terminologie Un alias qui peut être utilisé à la place du GUID Exemple : lfn://grid/gilda/users/mario/myfile.dat Logical File Name 1 GUID Logical File Name N elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 21
......... Gestion des Données Terminologie SURL/PFN : Storage URL / Physical File Name La location physique d'un fichier sur un SE Exemple : srm://aliserv6.ct.infn.it/dpm/home/gilda/project1/test.dat Utilisé pour par le système pour localiser le lieu physique des répliques TURL : Transport URL Le lien complet pour accéder un fichier sur un SE (incluant le protocole d'accès) Exemple : rfio://lxshare0209.cern.ch//data/alice/ntuples.dat Logical File Name 1 GUID Physical File SURL 1 TURL 1 Logical File Name N Physical File SURL N TURL 1 elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 22
Gestion des Données File Catalogue LFC = LCG File Catalogue (LCG = LHC Computing Grid, LHC = Large Hadron Collider) Le LFC est le service qui maintient le mapping entre LFN(s), GUID et SURL(s) Il garde l'information sur les répliques des fichiers C'est un catalogue unique qui ressemble à la racine de la grille "top-level directory" Il existe un répertoire sous "/grid" pour chaque VO, avec un accès en mode "read-write" pour tous les adhérents de ce VO Afficher les LFC d'un VO : lcg-infosites --vo <VO> lfc Pour utiliser un LFC local : export LFC_HOST=<HOSTNAME DU LFC> elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 23
Gestion des Données File Catalogue lfn:/grid/gilda/tcaland/mpi.txt File Catalogue SE A SE B User Interface SE C elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 24
Gestion des Données File Catalogue Les utilisateurs gèrent généralement les LFNs. Structure des répertoires /grid/<nom_du_vo>/ <Dossier à créer> LFC Namespace Définie par l'utilisateur elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 25
Gestion des Données Soumission de job InputSandbox / OutputSandbox sont de petite taille (max 10 MB) CE WMS User Interface Worker Nodes elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 26
Gestion des Données Gestion des données InputSandbox / OutputSandbox sont de grande taille, il faut utiliser les SEs CE WMS User Interface LFC Worker Nodes SE SE elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 27
Commandes utiles pour le LFC Gestion des Données Liste des commandes lfc-* lfc-chmod lfc-chown Change access mode of the LFC file/directory Change owner and group of the LFC file-directory lfc-delcomment Delete the comment associated with the file/directory lfc-getacl lfc-ln lfc-ls lfc-mkdir lfc-rename lfc-rm lfc-setacl Get file/directory access control lists Make a symbolic link to a file/directory List file/directory entries in a directory Create a directory Rename a file/directory Remove a file/directory Set file/directory access control lists lfc-setcomment Add/replace a comment elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 28
Gestion des Données Liste des commandes lcg lcg-cp Copies a grid file to a local destination Gestion des répliques lcg-cr lcg-del lcg-rep lcg-gt lcg-sd Copies a file to a SE and registers the file in the catalog Delete one file Replication between SEs and registration of the replica Gets the TURL for a given SURL and transfer protocol Sets file status to Done for a given SURL in a SRM request Interaction avec le LFC lcg-aa lcg-ra lcg-rf lcg-uf lcg-la lcg-lg lcg-lr Add an alias in LFC for a given GUID Remove an alias in LFC for a given GUID Registers in LFC a file placed in a SE Unregisters in LFC a file placed in a SE Lists the alias for a given SURL, GUID or LFN Get the GUID for a given LFN or SURL Lists the replicas for a given GUID, SURL or LFN elkharrim@cnrst.ma Formation administrateurs de la grille de calcul CNRST, 27/02-02/03, 2012 29