Portage d une application de physique sur la datagrid Application existante : Génération/simulation/reconstruction/analyse pour ATLAS : physique du B. En production au CERN. Portage sur la datagrid : En cours d implémentation au CCin2p3. L objectif visé est l utilisation de ressources de calcul dans les laboratoires. 1
Cas d utilisation - Physique du B http://isnwww.in2p3.fr/atlas/b-cp.html Physique: Mesures de précision de la Violation CP Exemples de canaux de désintégration à étudier: Bs! J/ψ (µµ) η (γγ) ; Bd! J/ψ K* 0 (Ks π 0 ); B! J/ψ X But des mesures: Extraction de β et γ, angles du triangle d unitarité et étude des mélanges Bs Bs Outils pour l étude: Générateurs d événements Simulation Geant3! Geant4 Reconstruction, ATRECON! New-Reconstruction/Athena Analyse de type classique (PAW, ROOT, ) 2
Génération! les données en 2006 L outil de génération: ATGEN-B (PYTHIA) Le taux raisonnable: 100000 événements par canal d étude Actuellement: 6253 événements signal Bs! J/ψ (µµ) η (γγ) ;!cartouche 2400 événements signal Bd! J/ψ K* 0 (Ks π 0 );!cartouche 100000 événements B! J/ψ X!cartouches Temps CPU, espace disque: 4.10 5 sec pour générer 15000 événements sous Linux/(P500 CERN)! output de 1 Gb, format Zebra! HPSS, Cartouches... 3
Simulation un point très important Outils: Dice-Geant3! Geant4 dans 2 ans!! OS: Linux Input: Fichiers de génération lecture cartouche ou disque CPU: 600 à 900 sec / événement Procédure au CERN/CCIN2P3: Simulation obligatoirement en batch # événements <= 170! output Zebra <= 1 Gb <= 10 5 sec Output: Beaucoup de fichiers à gérer! Bookkeeping indispensable Utilisation HPSS pour stocker (agréable car plus simple à gérer par rapport aux cartouches)! Bookkeeping indispensable Beaucoup de place disque: 1 Tb pour un canal à étudier 4
Reconstruction Reconstruction Old way: ATRECON Input: Fichier Zebra de la simulation CPU:< 8 minutes/événement simulé Output: Fichier Zebra et Fichier Hbook/CBNT-ntuples Reconstruction sous ATHENA Framework: Idem sauf temps CPU plus long 5
Schéma global ATGEN-B DICE/GEANT4 ATRECON/REC_ATHENA 60 KB/ev 5 MB/ev <1 MB/ev Génération Zebra/storage Cartouches?/HPSS? Simulation Zebra/storage HPSS? Reconstruction CBNT-ntuples HPSS? 6
Problème de la datagrid du point de vue du physicien Le partage des données entre centres de calcul: Si les données sont éclatées sur plusieurs sites (CERN et CCin2p3) elles doivent malgré tout être accessibles à l ensemble de la communauté scientifique. La copie des cartouches n est pas envisageable. HPSS existe sur les 2 sites (CCIN2P3 et CERN), L ouverture des transferts serait possible mais le CERN est réticent. CASTOR sur les 2 Sites? Il faut trouver une solution et vite!!!!!!!!!! 7
Avantages de la datagrid du point de vue du physicien Facilite la gestion des données Doublement (ou plus) la capacité de calculs, le site étant indifférencié 8
Travail à réaliser et outils à mettre en oeuvre 1 - La première plate-forme de test : CCIN2P3 : 4 nœuds de calcul Accès aux librairies CERN par AFS Accès au stockage par HPSS (souhaitable car facilite la gestion des gros fichiers, supprime les manipulations des cartouches) Échange de données avec le CERN? Techniquement possible via HPSS mais non souhaité par le CERN qui favorise CASTOR ISN-Grenoble : 4 nœuds de calcul Accès aux librairies CERN par AFS Facilité d échange avec le CC et le CERN à évaluer via : RFIO BBFTP GLOBUS 9
Travail à réaliser et outils à mettre en oeuvre 2 - Le bookkeeping Le stockage des données sur HPSS et l éclatement de celles-ci sur plusieurs sites rendent l utilisation d un bookkeeping obligatoire. Le bookkeeping contiendra les informations du physicien sur les données et des informations sur la localisation de celles-ci. La maquette que l ISN est en train de réaliser sera basée sur un serveur apache couplé à une base de données mysql. 10
Personnes impliquées à l ISN de Grenoble Physiciens et doctorants d ATLAS: Fairouz Ohlsson-Malek Sébastien Viret Informaticiens: Solveig Albrand Christine Gondrand Jérôme Fulachier Bernard Boutherin 11