Projet EPINES: production, distribution et analyse des résultats de simulations climatiques



Documents pareils
PRODIGUER un noeud français de distribution de données GIEC/IPCC

Prospective du Pôle de Modélisation de l'ipsl Outils de distribution des données, diagnostic, évaluation, visualisation.

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Présentation de la Grille EGEE

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

LES APPROCHES CONCRÈTES POUR LE DÉPLOIEMENT D INFRASTRUCTURES CLOUD AVEC HDS & VMWARE

How to Login to Career Page

WEB page builder and server for SCADA applications usable from a WEB navigator

Instructions Mozilla Thunderbird Page 1

Les Portfolios et Moodle Petit inventaire

AGROBASE : un système de gestion de données expérimentales

LADIES IN MOBILITY. LIVE TWEET Innovative City

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Plan. Department of Informatics

Règles et paramètres d'exploitation de Caparmor 2 au 11/12/2009. Pôle de Calcul Intensif pour la mer, 11 Decembre 2009

EMC Forum EMC ViPR et ECS : présentation des services software-defined

Telecharger gratuitement convertisseur de fichier word en pdf

Editing and managing Systems engineering processes at Snecma

Le Cloud: Mythe ou Réalité?

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

La coopération dans un contexte de recherches doctorales Cooperation amongst PhD researchers. Josée Charbonneau Anne- Marie Merrien 28 mai 2014

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

setting the scene: 11dec 14 perspectives on global data and computing e-infrastructure challenges mark asch MENESR/DGRI/SSRI - France

Projets en cours sur l archivage et la diffusion des simulations climatiques et de leurs produits, en liaison avec le projet DRIAS

Application Form/ Formulaire de demande

Motivations (many2many) Motivations (many2one) Sur le thème de la Version. La gestion de version. La gestion de configuration.

Vanilla : Virtual Box

Le Cloud Computing est-il l ennemi de la Sécurité?

Lesson Plan Physical Descriptions. belle vieille grande petite grosse laide mignonne jolie. beau vieux grand petit gros laid mignon

Anticiper et prédire les sinistres avec une approche Big Data

HSCS 6.4 : mieux appréhender la gestion du stockage en environnement VMware et service de fichiers HNAS Laurent Bartoletti Product Marketing Manager

CONTEC CO., LTD. Novembre 2010

NOM ENTREPRISE. Document : Plan Qualité Spécifique du Projet / Project Specific Quality Plan

Supervision et infrastructure - Accès aux applications JAVA. Document FAQ. Page: 1 / 9 Dernière mise à jour: 15/04/12 16:14

BIG Data et R: opportunités et perspectives

Academic Project. B2- Web Development. Resit Project. Version 1.0 Last update: 24/05/2013 Use: Students Author: Samuel CUELLA

Tutoriel de formation SurveyMonkey

Exercices sur SQL server 2000

Natixis Asset Management Response to the European Commission Green Paper on shadow banking

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

UML : Unified Modeling Language

Architecture client riche Evolution ou révolution? Thomas Coustenoble IBM Lotus Market Manager

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

RAPID Prenez le contrôle sur vos données

CONSTRUISEZ VOTRE INFRASTRUCTURE BIG DATA

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

en SCÈNE RATIONAL Rational Démonstration SDP : automatisation de la chaîne de développement Samira BATAOUCHE sbataouche@fr.ibm.com

E 2 O : Oracle Enterprise 2.0

Extension fonctionnelle d un CRM. CRM étendu >> Conférence-débat 15 April Club Management des Systèmes d Information de l'iae de Paris Alumni

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

1-Introduction 2. 2-Installation de JBPM 3. 2-JBPM en action.7

Revision of hen1317-5: Technical improvements

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

XtremWeb-HEP Interconnecting jobs over DG. Virtualization over DG. Oleg Lodygensky Laboratoire de l Accélérateur Linéaire

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

Optimiser votre reporting sans déployer BW

Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

Développement logiciel pour le Cloud (TLC)

WiFi Security Camera Quick Start Guide. Guide de départ rapide Caméra de surveillance Wi-Fi (P5)

Services à la recherche: Data Management et HPC *

Multi-Workload SharePoint Gouvernance et ECM

Installer Enterprise Miner 5.1 en SAS environnement Windows

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

pythonocc: une plateforme de développement agile d applications CAO.

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE


L offre Stockage et serveurs System x / BladeCenter F.Libier, Business Partner Technical Manager

Qualité et ERP CLOUD & SECURITY (HACKING) Alireza MOKHTARI. 9/12/2014 Cloud & Security

Guide d'installation rapide TFM-560X YO.13

Configuration du serveur FTP sécurisé (Microsoft)

Du Datacenter au Cloud Quels challenges? Quelles solutions? Christophe Dubos Architecte Microsoft

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Once the installation is complete, you can delete the temporary Zip files..

La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

Paxton. ins Net2 desktop reader USB

Containers : Outils magiques pour les Devops? OpenNebula et son écosystème pour une infrastructure cloud agile

: Machines Production a créé dès 1995, le site internet

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

- Couches - Éléments - Domaines - ArchiMate et les techniques du BABOK

Language requirement: Bilingual non-mandatory - Level 222/222. Chosen candidate will be required to undertake second language training.

ENOVIA 3DLive. IBM PLM Solutions 1 er Octobre Philippe Georgelin Sébastien Veret

Sauvegarde et Restauration d un environnement SAS

calls.paris-neuroscience.fr Tutoriel pour Candidatures en ligne *** Online Applications Tutorial

GIS and satellite remote sensing for humanitarian operations support SIG et télédétection pour le support aux operations humanitaires

Support Orders and Support Provisions (Banks and Authorized Foreign Banks) Regulations

POSITION DESCRIPTION DESCRIPTION DE TRAVAIL

La stratégie Cloud de Microsoft

Synergies entre Artisan Studio et outils PLM

Gouvernance IT : par où commencer? Hubert Lalanne DE, Chief Architect for Industries IBM Software France

CONCLUSION. 31 mars 2015 Laurène Chochois Helpdesk REACH&CLP Luxembourg

Valorisez vos actifs logiciels avec Rational Asset Manager. Jean-Michel Athané, Certified IT Specialist IBM Rational Software

Les mésocentres HPC àportée de clic des utilisateurs industriels

Kick Off SCC 2015 Software Defined Storage Comment aboutir à une plateforme de stockage virtuel simple, extensible et ouverte?

Transcription:

Projet EPINES: production, distribution et analyse des résultats de simulations climatiques Projet IPSL-LMD-LSCE-INRIA-INRIA Jean-Louis Dufresne LMD/IPSL/CNRS Sébastien Denvil IPSL,CNRS Gabriel Antoniu INRIA/IRISA, Soraya Zertal PRISM/UVSQ Yann Meurdesoif LSCE/IPSL/CEA Thomas Dubos LMD/IPSL Colloque MASTODONS, 23 janvier 2015, CNRS, Paris

Le modèle climatique couplé "Système Terre" de l'ipsl

Résolution Observations Plus de calculs => plus de données Compléxité Durée et taille des membres

Les simulations climatiques CMIP6 (Coupled Model Intercomparison Projet phase 6), préparation du IPCC AR6 (Intergovernmental Panel Climate Change, Assesment Report 6) Une soixantaine de type d'expériences, d une durée de qqs dizaines au millier d années Réalisation d ensembles de simulations Pour chaque modèle, plusieurs configurations Pour un institut, plusieurs modèles (3 pour l IPSL) Environ 1 miller de quantités écrites, avec des fréquences de sorties tri-horaires, quotidiennes, mensuelles

Design de CMIP6 : Le focus Scientifique La toile de fond scientifique pour CMIP6 repose sur les six Grands Challenges WCRP, et sur un thème additionnel encapsulant les questions de forçages bio-géochimiques et rétroactions. 1. Nuages, Circulation et Sensibilité climatique 2. Changement lié à la Cryosphère 3. Extrêmes climatiques 4. Information Climatique Régionnal 5. Hausse régional du niveau de la mer 6. Disponibilité de l'eau 7. Forçages bio-géochimiques et rétroactions (AIMES & WGCM) Le design du protocole expérimental se concentre sur trois grandes questions scientifiques: 1. Comment le système climatique terrestre répond aux forçages? 2. Quelles sont les origines et les conséquences des biais systématiques des modèles de climat? 3. Comment évaluer les changements climatiques étant donné la variabilité naturelle du climat, la prévisibilité et l'incertitude des scénarios?

Coupled Model Intercomparison Project #6 International communities under strong pressure CMIP6/AR6 cycle concept & definition CMIP6 2013 2014-2015 Model version set-up Need very strong argumentation to change things here! Model runs & data archiving 2016-2017 03/17 IPCC AR6 Simulations Data archive ESGF 31/07/18 Paper subm 15/03/19 Paper accept Data 09/19 AR6

1. Écrire et stocker 2. Archiver et distribuer 3. Analyser les données

Écriture parallèle, performante XIOS (XML-IO-SERVER) : deux objectifs principaux Performance L écriture des données ne doit pas impacter l exécution des modèles Utilisation d un ou plusieurs serveurs exclusivement dédiés au I/O. Transfert asynchrone des données des clients vers les serveurs. Écriture indépendante et asynchrone des données par chaque serveur. Utilisation des systèmes de fichiers parallèles via netcdf4/hdf5 Écritures simultanées de plusieurs processus dans un même fichier Flexibilité et souplesse Externalisation de la description des I/O dans un fichier XML Simplification de la gestion des I/O au niveau du code Modification de la définition des I/O sans recompiler

Modèles: Longue phase de calcul Écriture d un gros volume le plus rapidement possible Écriture parallèle: XIOS Serveurs d IO: Écriture en // Assurer le tampon pour ne pas ralentir le calcul Écritures avec des outils et des formats «standards» (performances non optimales)

Cas test XIOS/NEMO Configuration GYRE 144 (4322x2882) 32 Serveurs XIOS (3%) pdt=180s, 720 pdt (36 h) NEMO : 1024 proc. MPI Temps par itération Sortie horaire Sans IO 64 Serveurs XIOS (6%) 246 Go écrit en 4 fichiers 62G Feb 25 04:36 BIG1h_st32_1h_grid_T.nc 28G Feb 25 04:37 BIG1h_st32_1h_grid_U.nc 26G Feb 25 04:31 BIG1h_st32_1h_grid_V.nc 130G Feb 25 04:35 BIG1h_st32_1h_grid_W.nc 128 Serveurs XIOS (12%)

1. Écrire et stocker 2. Archiver et distribuer 3. Analyser les données

Mise à disposition distribué des données The Earth System Grid Federation (ESGF) is a multi-agency, international collaboration of people and institutions working together to build an open source software infrastructure for the management and analysis of Earth Science data on a global scale Software development and project management: ANL, ANU, BADC, CMCC, DKRZ, ESRL, GFDL, GSFC, JPL, IPSL, ORNL, LLNL (lead), PMEL, Operations: tens of data centers across Asia, Australia, Europe and North America

System Architecture ESGF is a system of distributed and federated Nodes that interact dynamically through a Peer-To-Peer (P2P) paradigm Distributed: data and metadata are published, stored and served from multiple centers ( Nodes ) Federated: Nodes interoperate because of the adoption of common services, protocols and APIs, and establishment of mutual trust relationships Dynamic: Nodes can join/leave the federation dynamically - global data and services will change accordingly A client (browser or program) can start from any Node in the federation and discover, download and analyze data from multiple locations as if they were stored in a single central archive.

1. Écrire et stocker 2. Archiver et distribuer 3. Analyser les données

Analyse et distribution des données Évolution du stockage en 6 ans (de CMIP3 à CMIP5) : en moyenne x30 Opérationnel depuis 2011 Des centaines d'utilisateurs chaque mois Des dizaines de To distribué chaque mois Un cumul de plus de 10 000 utilisateurs CMIP3: distribution des données via 1 serveur (PCMDI) CMIP5: distribution répartie des données 60 modèles du système climatique 2 Po de données actuellement

Perspectives et réflexions

Robustesse, «failover» et prise de décision

Performances

CM5AEH01 : 1850-2349

La synthèse nécessaire à la décision

A climate simulation http://earthsystemcog.org/projects/es-doc-models/ Why What How Experiment Simulation Model Input: Coupling Output: Data 1..* Requirement 0..* Conformance Software Component Name Properties Description Coupling Framework 0..1 Parent 0..* Child

CIM The CIM is intentionally very general. It can be customized for particular user communities through the addition of specific Controlled Vocabularies. A Controlled Vocabulary defines the content that can be used within a CIM document. For example, in the case of climate models, the CIM schema (structure) allows a ModelComponent to have a child ModelComponent. And each of those components can have types. A CV is required to list the permitted types. For example, the CMIP5 CV allows an atmosphere model to have a child advection model, but not a child ocean model. Thus, in order to be valid a CIM document must conform both to the CIM schema and to a particular set of CVs.

Informs ConCIM (UML) Generates MindMap Vocabulary ConCIM CV Canonical Format TBD ESDOC-mp Python Ontology AppCIM Utilises CMIP5q/PIMMS (Django) ESDOCq (Django) pyesdoc (python library) Creation Harvests Creates ESDOC XML/JSON (doc) HTML (doc) PDF (doc) Content ESDOC Repositories Validates Storage Viewer Comparator Validation Tool Tools

Outils ES-DOC existants Tour d'horizon express

ES-DOC Tools - Document Viewer

ES-DOC Tools Document Comparator step 1

ES-DOC Tools - Document Comparator step 2

Bilan de 3 années Mastodons Un levier stratégique précieux pour de nombreux projets : 2 ANR acceptées (CONVERGENCE, HEAT) 2 H2020 proposés (CRESCENDO, ENVRI+) 1 «Center Of Excellence» proposé (ESIWACE) Réflexion en cours sur un positionnement sur la roadmap ESFRI (European Strategy Forum on Research Infrastructures) Un représentant dans le comité exécutif de la gouvernance ESGF Deux représentants dans le comité exécutif de la gouvernance ES-DOC Deux représentants dans le WGCM Infrastructure Panel Traverser les cloisons des disciplines demande du temps D'autant plus du fait des multiples dynamiques à l'œuvre au niveau européen ou international et national.

Objectifs scientifiques pour 2015 Workshop autour des I/O HPC. Identifier une communauté nationale. Object Storage / HDFS / Lustre /... S'inspirer des autres projet Mastodons Indexation / Heuristique d'analyse distribuées /... Utilisation du budget alloué au projet en 2014 Renforcement de l infrastructure : achat stockage + virtualisation Sous traitance technique Missions workshops spécialisés : ESGF (Earth System Grid Federation)

Merci de votre attention