Gestion des données! C. Loomis (CNRS/LAL)!



Documents pareils
Services de la grille

Installation du service glite SE/DPM

La virtualisation, des postes de travail

Middleware et services de la grille

Flux de Soumission & Envoi de SMS. avec lʼapi DataWinners

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

Cʼétait le 20 mai Au 24/7/09, cʼétait toujours une version béta.

Zerty.fr. Guide de lʼutilisateur

OpenSi Connect pour Magento

12 Développer un site Web. Visite dʼune page

Dossier de presse. Offre Allinclouded by Flexsi Le cloud privé sur mesure, enfin pour les PME!

EXTENSION ING. Nécessite extension ing

IPv6 et EGEE: Migration d un système d information complexe vers IPv6, glite

Hébergement de site web Damien Nouvel

Configurer le Serveur avec une adresse IP Statique (INTERFACE :FastEthernet) : et un masque

Hébergement WeboCube. Un système performant et sécurisé. Hébergement géré par une équipe de techniciens

Gestion d identités PSL Exploitation IdP Authentic

2 disques en Raid 0,5 ou 10 SAS

Service Hébergement Web

PHILA-Collector-USB-16Go Pour Windows & Android

StratusLab : Le projet et sa distribution cloud

Service de certificat

Référencement naturel Guide de démarrage. Version française

Bacula R - The Network Backup Solution

MailStore Server 7 Caractéristiques techniques

Système de Stockage Sécurisé et Distribué

NIMEGUE V3. Fiche technique 3.07 : Sauvegarde / Restauration manuelle

Playzilla - Chargement par clé usb

Novell. NetWare 6. GUIDE D'ADMINISTRATION DE NETDRIVE

vmware au CC-IN2P3 Déploiement rapide d une infrastructure destinée à de la formation et réflexions sur vsphere.

CONFIGURATION DE BASE. 6, Rue de l'industrie BP130 SOULTZ GUEBWILLER Cedex. Fax.: Tel.:

Utilisation de la plate-forme collaborative Windchill

Veeam Backup & Replication

Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

Squid. Olivier Aubert 1/19

GUIDE A LʼATTENTION DES PARENTS ET DES ENSEIGNANTS SUR LES NOUVEAUX USAGES DʼECOUTE DE MUSIQUE A LA MAISON, A LʼECOLE ET EN DEPLACEMENT.

Cloud Computing Maîtrisez la plate-forme AWS - Amazon Web Services

Microsoft Hosted Exchange 2010 DOCUMENT D EXPLOITATION

Disque Dur Internet «Découverte» Guide d utilisation du service

Veeam Backup and Replication

Informatique pour scientifiques hiver Plan général Systèmes d exploitation

Grid Technology. ActiveMQ pour le grand collisionneur de hadrons (LHC) Lionel Cons Grid Technology Group Information Technology Department

Hébergement MMI SEMESTRE 4

Configuration du nouveau Bureau Virtuel (BV) collaboratif de Lyon I

Module 10 : Supplément 2

Bacula. It comes by night and sucks the vital essence from your computers. Guillaume Arcas

Date : NOM Prénom : TP n /5 ET ADMINISTRATION D'UN

Manuel d Administration

Nœud Suisse du Projet International GBIF (Global Biodiversity Information Facility)

Guide Pratique: Installation Réseau

Sujet Solution de sauvegarde de serveurs et postes de travail avec BackupPC et Bacula. par ALIXEN

Développer pour Sharepoint 2010 et au-delà (aka SP Online)

Sécurité des systèmes dʼexploitation

Protection et amélioration de la sécurité des systèmes d'exploitation

Be-backup. Présentation de la solution Fonctionnement de Be-backup Détails techniques Notre offre Votre Retour sur Investissement

FORMATION PcVue. Mise en œuvre de WEBVUE. Journées de formation au logiciel de supervision PcVue 8.1. Lieu : Lycée Pablo Neruda Saint Martin d hères

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Veeam Backup & Replication v6

Connexion à SQL server

Master physique informatique

Systèmes d'informations historique et mutations

Leçon 1 : Les principaux composants d un ordinateur

Service Déposant: Procédure d installation. Page 1. Service déposant. Procédure d installation Version 2.3

«Clustering» et «Load balancing» avec Zope et ZEO

arcopole Studio Version 3.1

Perl Console. Votre compagnon pour développer en Perl. Les Journées du Perl , 17 novembre, Lyon. Alexis Sukrieh

Les midis de la biblio - séminaire 10. Zotero + : bibliographie en ligne et bibliographie nomade

Kick Off SCC 2015 Stockage Objet. Vers de nouveaux horizons

Chapitre 1 Windows Server

CA ARCserve Backup Patch Manager pour Windows

DIRAC : cadre et composants pour créer des systèmes de calcul distribués

et développement d applications informatiques

Module BD et sites WEB

Adresse directe fichier : Adresse url spécifique sur laquelle le lien hypertext du Client doit être

Comment avoir le logiciel? Le serveur web APACHE peut être téléchargé gratuitement du site web de APACHE:

SPECIFICATIONS TECHNIQUES BANNIERES SITES PRISMA / TABLETTES / MOBILE

Sauvegarde de postes clients avec BackupPC

Programmation Web. Madalina Croitoru IUT Montpellier

ENVOI EN NOMBRE DE SMS

INFORMATIQUE & WEB. PARCOURS CERTIFICAT PROFESSIONNEL Programmation de sites Web. 1 an 7 MODULES. Code du diplôme : CP09

mailpro mode d'emploi

VERITAS NetBackup 5.0 en 5 jours : Administration Avancée

Symantec Backup Exec Remote Media Agent for Linux Servers

Nos solutions d hébergement mutualisés

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Internets. Informatique de l Internet: le(s) Internet(s) Composantes de l internet R3LR RENATER


Systèmes de fichiers répartis

«clustering» et «load balancing» avec Zope et ZEO

Avertissement : Nos logiciels évoluent rendant parfois les nouvelles versions incompatibles avec les anciennes.

Installer un espace de travail collaboratif et d e learning.

VERITAS NetBackup 6.x en 5 jours : Administration Avancée

Gestion Electronique d'informations et de Documents pour l'entreprise

Gestion des fichiers sur micro-ordinateur

Informatique. Les réponses doivent être données en cochant les cases sur la dernière feuille du sujet, intitulée feuille de réponse

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

IceWarp Server 11.2 Notes pour les administrateurs.

Installation d un serveur HTTP (Hypertext Transfer Protocol) sous Débian 6

Transcription:

Gestion des données! C. Loomis (CNRS/LAL)! 1! 9/28/10!

Agenda! Les principaux composants! Les commandes de base! Mettre des données sur la grille! Retrouver ces données! Trouver lʼinformation! Dupliquer les données! Effacer les données! La gestion des données au cours dʼun job! Données sur votre bureau! Données sur la grille!

Les Présupposés! Les services grilles gèrent les fichiers qui contient des données! «Write once, read mostly» : les fichiers sont invariants sur la grille! Plusieurs réplicas : redondance, sauvegarde, accès optimisé! Plusieurs protocoles dʼaccès : gsiftp, http(s), POSIX! Autres formats ne sont pas supporter directement! Base de données! Données stockées hors grille! Services qui fournir des données!

Les Principaux Composants! LFC : gestion de lʼespace de noms logiques! Garde la trace de la localisation physique des diverses réplicas dʼun fichier sur la grille! Chaque fichier a un GUID (Global Unique IDentifier)! Chaque réplica est désigné par un SURL (Storage URL)! Arborescence et des commandes façon «système de fichiers»! SRM : gestion de lʼespace de noms physiques! Contient un base des données pour les SURLs! Systèmes de stockage (disques, bands, MSS, )! Services qui supportent les protocoles de transfert! Utilise le GUID (ou le SURL) et fournit le TURL (Transport URL)! Les protocoles de transfert de données! Accès a la distance : rfio, gsiftp, http(s)! Accès local (dans un site) : POSIX!

Prérequis! Toutes les commandes liées à la gestion de données supposent dʼavoir un proxy valide! Détermination de la VO utilisée par lʼutilisateur! Détermination des droits dʼaccès!

Commandes lcg_utils! Ensemble de commandes fournissant des fonctionnalités complètes! Interaction LFC et SE/SRM! Documentation : ʻman lcg-*ʼ ou ʻlcg-*ʼ! Commandes de transferts! lcg-cp : copie simple, y compris de/à disque locale! lcg-cr : copie sur la grille; enregistrement dans LFC! lcg-del!: supprimer une fichier! lcg-rep!: copie (réplica) fichier, mise à jour LFC!

Commandes lcg_utils! Informations sur un fichier ou replica! lcg-gt lcg-lr lcg-la lcg-lg!get TURL!!list replicas!!list alias!!list GUID! Opérations spécifiques : à ne pas utiliser normalement! lcg-aa lcg-ra lcg-sd lcg-rf lcg-uf!add alias!!remove alias!!set FileStatus to done (marquer le transfert terminé)!!register file in LFC!!unregister file from LFC!

Transférer sur la Grille! Tous les données sur la grille existent dans un «Storage Element» : service avec interface SRM accessible par la grille pour le stockage de données! Copier un fichier entre lʼordinateur local et la grille:! lcg-cr -d se.example.org \! l lfn:/grid/vo.u-psud.fr/myname/macopie.test \!/home/myhome/toto! Réponse :! guid:76373236-b4c7-11d8-bb5e-eba42b5000d0!

Transférer sur la Grille! GUID :! Identifier unique et permanente! Logical File Name (LFN)! Nom dʼun fichier sur la grille est indépendant de sa localisation physique! Comporter des dossiers et sous-dossiers et lʼutilisateur est libre de les organiser à sa guise! Les dossiers non existants sont créés!

Récupérer les Données! Localisez les données en utilisant le LFN ou le GUID :! lcg-lr lfn:/grid/vo.u-psud.fr/macopie.test! lcg-lr guid:76373236-b4c7-11d8-bb5e-eba42b5000d0! Ces commandes retournent le(s) SURL(s) : nom des réplicas! 1 seul réplica par SE! srm://se.example.com/grid/vo.u-psud.fr/tutorial/data/generated/2004-11-10/ file7115df45-b4c7-11d8-bb5e-eba42b5000d0! Obtenir une copie locale des données sur la grille : lcg-cp! lcg-cp guid:76373236-b4c7-11d8-bb5e-eba42b5000d0 newcopy! lcg-cp lfn:/grid/vo.u-psud.fr/macopie.test newcopy! lcg-cp srm://se.example.com/grid/vo.u-psud.fr/tutorial/data/generated/ 2004-11-10/file7115df45-b4c7-11d8-bb5e-eba42b5000d0 newcopy!

Le SE par défaut! Sur un UI ou un WN, si votre VO est ʻvo.u-psud.frʼ, le SE par défaut est désigné par la variable:! $VO_VO_U_PSUD_FR_DEFAULT_SE! Cʼest le SE sur lequel on écrit par défaut quand aucun nʼest spécifié! Pour utiliser le SE par défaut, il suffit dʼomettre lʼoption -d (lcg-cr et lcg-rep)! Par ex., dans un job qui doit pouvoir sʼexécuter sur plusieurs sites en utilisant le SE local! Après écriture du fichier, il est possible de retrouver le SE utilisé avec lcg-lr! Rarement nécessaire car on peut utiliser le GUID ou LFN! Essentiellement si plusieurs réplicas!

Dupliquer les données! Dupliquer des données vers un autre SE à partir du LFN (ou GUID ou SURL) du fichier! lcg-rep \!lfn:/grid/vo.u-psud.fr/myname/macopie.test \! d autre-se.example.org! lcg-lr liste la lʼensemble des réplicas :! srm://lesechoisi.in2p3.fr/grid/vo.u-psud.fr/tutorial/ data/generated/2004-11-10/file7115df45-b4c7-11d8- bb5e-eba42b5000d0! srm://lautrese.cern.ch/pnfs/cern.ch/data/vo.upsud.fr/generated/2005-11-28/ file46034814-3021-47e0-a382-60cde5efbdf0!

Effacer les données! Pour effacer un seul réplica :! lcg-del s autre-se.example.org \!lfn:/grid/vo.u-psud.fr/myname/macopie.test! Il faut spécifier le SE car sʼil y a plusieurs réplicas, la commande ne sait pas quel fichier effacer! Pour effacer tous les réplicas :! lcg-del a \!lfn:/grid/vo.u-psud.fr/myname/macopie.test! Le catalogue LFC est mis à jour automatiquement!

Job : Données Sortantes! Utilisation du «OutputSandbox»! Les fichiers spécifiés sont stockés dans le WMS! Récupération via la commande glite-wms-job-output! Méthode fortement déconseillée pour de gros fichiers (> 10Mo)! Stocker sur la grille! lcg-cr \! l lfn:/grid/vo.u-psud.fr/myname/mesdonnees.txt \!monfichier.txt! Méthode préférée pour les gros fichiers!

Job : Données Entrantes! Pour les petit fichiers : «InputSandbox»! InputSandbox = { input-ntuple.root, job.sh };! Ne pas utiliser pour les gros fichiers (> 1 Mo)! Pour les données «grilles» :! Pour influencer la sélection du site utilisez «InputData»! Ça ne garantisse pas que le fichier est vraiment locale! Lʼaccès aux données est de la responsabilité du job! La commande glite-brokerinfo permet dʼobtenir la liste des fichiers indiquée dans «InputData»!

LCG File Catalog (LFC)! Le catalogue LFC (LCG File Catalog) présente une arborescence et des commandes façon Posix :! Il est possible de lister les références, de créer une nouvelle arborescence, de faire des liens symboliques! Par défaut, le catalogue utilisé est le catalogue central de la VO! Pour utiliser un catalogue local (déconseillé) :! Trouver un : lcg-infosites vo vo.u-psud.fr lfclocal! export LFC_HOST=<hostname du LFC choisi>! Utiliser les commandes lfc-* normalement!

Commandes LFC! Elles permettent la gestion des noms logiques (LFN)! Rarement utilisées directement :!plutôt via les commandes lcg-*! Aucun impact sur les données elle-mêmes (réplicas)! Lister les références : lfc-ls /grid/vo.u-psud.fr/...! Racine de lʼarborescence dʼun LFC :! /grid/<nom de la VO>! On peut stocker cette racine dans LFC_HOME! o export LFC_HOME=/grid/vo.u-psud.fr! Si on définit cette variable! o ʻ-l lfn:mylfnʼ ʻ-l lfn:$lfc_home/mylfn ʼ!

Commandes LFC! Créer une nouveau répertoire :! lfc-mkdir /grid/vo.u-psud.fr/.../<mon rep>! Autres ex. de commandes :! lfc-ln, lfc-rm, lfc-rename, lfc-getacl, lfc-setacl! lfc-chmod, lfc-chown, lfc-setcomment, lfcdelcomment! Aide en ligne : ʻman lfc-*ʼ ou ʻlfc-*ʼ!

GFAL! La copie sur le WN des fichiers complète nʼest pas toujours souhaitable, en particulier si on veut lire/ écrire de gros fichiers! GFAL : ʻGrid File Access Libraryʼ! Pour accéder directement à des fichiers distants! Une API pour C/C++, Python, Perl! Les appels possibles sont «POSIX-like» :! o gfal_open, gfal_read, gfal_write, gfal_close,! La syntaxe des noms de fichiers est la syntaxe SURL! Documentation : ʻman gfalʼ, ʻman gfal_*ʼ,! Pour les écritures, si possible, préférer lʼécriture locale et un transfert après!

Commande glitebrokerinfo! Récupérer des informations sur un job soumis via un WMS! Ensemble des options possibles : glite-brokerinfo help! Principales options! glite-brokerinfo getce! glite-brokerinfo getdataaccessprotocol! glite-brokerinfo getinputdata! glite-brokerinfo getses! glite-brokerinfo getcloseses! glite-brokerinfo getsemountpoint <SE>! glite-brokerinfo getsefreespace <SE>! glite-brokerinfo getlfn2sfn <LFN>! glite-brokerinfo getseprotocols <SE>! glite-brokerinfo getseport <SE> <Protocol>!