Services à la recherche: Data Management et HPC *



Documents pareils
données de la recherche : quèsaco?

La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

XtremWeb-HEP Interconnecting jobs over DG. Virtualization over DG. Oleg Lodygensky Laboratoire de l Accélérateur Linéaire

Get Instant Access to ebook Cest Maintenant PDF at Our Huge Library CEST MAINTENANT PDF. ==> Download: CEST MAINTENANT PDF

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

MANUEL MARKETING ET SURVIE PDF

setting the scene: 11dec 14 perspectives on global data and computing e-infrastructure challenges mark asch MENESR/DGRI/SSRI - France

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Stéphane Lefebvre. CAE s Chief Financial Officer. CAE announces Government of Canada participation in Project Innovate.

CEST POUR MIEUX PLACER MES PDF

VMware : De la Virtualisation. au Cloud Computing

Gamme Serveurs HP ProLiant Rack

AGROBASE : un système de gestion de données expérimentales

Retours d expériences et perspectives sur les aspects énergétiques

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

Le GRAND CONSEIL de la République et canton de Genève décrète ce qui suit :

La virtualisation, si simple!

Jean Sykes Nereus, la collaboration européenne, et le libre accès

Qualité et ERP CLOUD & SECURITY (HACKING) Alireza MOKHTARI. 9/12/2014 Cloud & Security

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

Primer LE CLOUD COMPUTING DÉMYSTIFIÉ PME ET CLOUD COMPUTING : 5 IDÉES REÇUES

Règles et paramètres d'exploitation de Caparmor 2 au 11/12/2009. Pôle de Calcul Intensif pour la mer, 11 Decembre 2009

1.The pronouns me, te, nous, and vous are object pronouns.

Guide d'installation rapide TFM-560X YO.13

Système de diffusion d information pour encourager les PME-PMI à améliorer leurs performances environnementales

Contents Windows

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*

THE OUAGADOUGOU RECOMMENDATIONS INTERNET INFRASTRUCTURE FOR AN AFRICAN DIGITAL ECONOMY 5-7 MARCH 2012

AVOB sélectionné par Ovum

Containers : Outils magiques pour les Devops? OpenNebula et son écosystème pour une infrastructure cloud agile

SHAREPOINT PORTAL SERVER 2013

PACKZ System Requirements. Version: Version: Copyright 2015, PACKZ Software GmbH. 1

Instructions Mozilla Thunderbird Page 1

Les normes de certification des archives numériques En préparation. C. Huc. La Pérennisation des Informations numériques

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

SERVEUR DÉDIÉ DOCUMENTATION

Francoise Lee.

Instaurer un dialogue entre chercheurs et CÉR: pourquoi? Me Emmanuelle Lévesque Centre de génomique et politiques Université McGill

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

100% Swiss Cloud Computing

Le Cloud Computing est-il l ennemi de la Sécurité?

WEB page builder and server for SCADA applications usable from a WEB navigator

CETTE FOIS CEST DIFFERENT PDF

<Insert Picture Here> Exadata Storage Server et DB Machine V2

LES APPROCHES CONCRÈTES POUR LE DÉPLOIEMENT D INFRASTRUCTURES CLOUD AVEC HDS & VMWARE

Accès aux données Sentinelles

Dans une agence de location immobilière...

Judge Group: P Title: Quel est meilleur: le compost ou le fertilisant chimique? Student(s): Emma O'Shea Grade: 6

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

Forthcoming Database

Discours de Eric Lemieux Sommet Aéro Financement Palais des congrès, 4 décembre 2013

Exemple PLS avec SAS

BNP Paribas Personal Finance

Cloud Computing: de la technologie à l usage final. Patrick CRASSON Oracle Thomas RULMONT WDC/CloudSphere Thibault van der Auwermeulen Expopolis

Service management. Transforming the IT organization and driving it across the enterprise. Carlo Purassanta. Integrated Technology Services Executive

MEMORANDUM POUR UNE DEMANDE DE BOURSE DE RECHERCHE DOCTORALE DE LA FONDATION MARTINE AUBLET

La stratégie Cloud de Microsoft

Edna Ekhivalak Elias Commissioner of Nunavut Commissaire du Nunavut

Spécifications techniques

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Estimated SMB instances PC (Physical and Virtual) 125,000 Total instances: SMB 1-24 PC. 392,000 Total instances: SMB PC

UNIVERSITE LYON 3 (JEAN MOULIN) Référence GALAXIE : 4140

DOCUMENTATION - FRANCAIS... 2

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

La rencontre du Big Data et du Cloud

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

The space to start! Managed by

Windows Server Chapitre 1: Découvrir Windows Server 2008

EN UNE PAGE PLAN STRATÉGIQUE

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

How to Login to Career Page

La coopération dans un contexte de recherches doctorales Cooperation amongst PhD researchers. Josée Charbonneau Anne- Marie Merrien 28 mai 2014

THE SUBJUNCTIVE MOOD. Twenty-nineth lesson Vingt-neuvième leçon

Bourses d excellence pour les masters orientés vers la recherche

L INFORMATIQUE SOUS FORME DE SERVICE POUR VOTRE ENTREPRISE. Farid BENREJDAL Senior Systems Engineer VMware

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

Centres Carrières Nouvelle-Écosse. Cheminement du client Évaluation

Intranet / Groupware LORIA - Université d automne Intranet/Groupware - L. Mirtain 1

Gestion des prestations Volontaire

Ingénierie et gestion des connaissances

I RENALA. Research and Education Network for Academic and Learning Activities. The Madagascar NREN

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE

L. Obert, T. Lascar, A. Adam

Internet & la recherche marketing : état des lieux. Présenté par Raymond Cyr Fondateur VOXCO

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

BAP E Gestionnaire de parc informatique et télécommunications MI2 / MI3 Ouverts au titre de 2010 Arrêté du 7/04/10 - J.

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

Plan. Department of Informatics

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

Compléter le formulaire «Demande de participation» et l envoyer aux bureaux de SGC* à l adresse suivante :

Institut français des sciences et technologies des transports, de l aménagement

Architectures d implémentation de Click&DECiDE NSI

CHAPITRE 4. La réglementation du médicament

MEMORANDUM POUR UNE DEMANDE DE BOURSE DE RECHERCHE DOCTORALE DE LA FONDATION MARTINE AUBLET

Transcription:

Services à la recherche: Data Management et HPC * Pierre-Yves Burgi et Jean-François Rossignol Division informatique (DINF) * HPC = High-Performance Computing Réunion CIF Sciences du 6.12.11 1/19

Contenu - Contexte général - The Fourth Paradigm - Les besoins en «HPC» - Projets en Sciences (tour de table) - Prochaines étapes Réunion CIF Sciences du 6.12.11 2/19

Contexte général - Initiative stratégique (IS) «Services à la recherche» du PDI, planification 2012-2017 (délai: décembre 2011) o La gestion des données scientifiques pour les besoins des chercheurs o Une infrastructure adaptée aux besoins de calculs à hautes performances (HPC) - Constitution d un projet de loi pour obtenir les ressources nécessaires sur la période 2014-2017 (délai: février 2012) - CUS programme (2013-2016) Scientific Information : Access, processing and preservation (délai: printemps 2012) o Communauté: Chercheurs, bibliothécaires, archivistes, et informaticiens o Scientific Information Steering Committee (CRUS) - Projet de Loi 10801 : Centre de données informatique principal de l'état de Genève (2017) (en cours) Réunion CIF Sciences du 6.12.11 3/19

The Fourth Paradigm: Data-Intensive Scientific Discovery E-Science: where IT meets scientists. a a 2 = 4πGρ Κ 3 c a 2 2 http://well-formed.eigenfactor.org/radial.html The Fourth Paradigm. Data-Intensive Scientific Discovery. Microsoft Research, T. Hey, S. Tansley, and K. Tolle (eds) 2009, Redmond, Washington Réunion CIF Sciences du 6.12.11 4/19

With data, problems are caused by copyright, but resistance also comes from many other sources: It s hard to annotate and reuse data, it s hard to send massive data files around, it s hard to combine data that was not generated for recombination, and on and on. J. Wilbanks (2009) «I Have Seen the Paradigm Shift, and It Is Us» in The Fourth Paradigm, pp. 209-214 Réunion CIF Sciences du 6.12.11 5/19

HPC Data Life Cycle Management (DLCM) Adapté de Tenopir et al PLoS ONE, 6(6) 2011 Réunion CIF Sciences du 6.12.11 6/19

Qui est concerné? From Burgi, SWITCH Journal oct. 2011 Réunion CIF Sciences du 6.12.11 7/19

Information «Erosion» Réunion CIF Sciences du 6.12.11 8/19 Adapted from Michener et al. 1997

Classement des motivations du chercheur à conserver leurs données (*) : 1) Ré-analyse de données 2) Validation future de résultats 3) L avancement de la science 4) Fonds Publics (justification) 5) Stimulation de collaborations interdisciplinaires 6) Valeur unique des données de recherche * Thaesis, J. van der Hoeven, PARSE.Insight: INSIGHT into issues of Permanent Access to the Records of Science in Europe, Insight Report, June 2010 Réunion CIF Sciences du 6.12.11 9/19

à intégration dans des environnements de recherche: o Laboratory Information Management Systems (LIMS) o Virtual Research Environments (VRE) o Personal Research Environments (PRE) Réunion CIF Sciences du 6.12.11 10/19

- Déjà trop de données - Quoi garder? Quoi migrer? Qui décide? Quand? - Ne pas prendre rapidement de décision sur les données à préserver souvent conduit par la suite à des protocoles de conservation plus complexes, qui demandent plus de travail, et sont par conséquent plus coûteux* *Trusted Digital Repositories: Attributes and Responsibilities, An RLG-OCLC Report, Mountain View, CA, May 2002 Réunion CIF Sciences du 6.12.11 11/19

Réunion CIF Sciences du 6.12.11 12/19

Besoins en HPC Enquête réalisée en 2011 par Jean-Luc Falcone: Tous les chercheurs et les enseignants ont été invités à répondre à un questionnaire Web. Les questions portaient notamment sur : Les équipements actuels Les acquisitions d équipement prévues pour 2012 et 2015 L intérêt pour un serveur de calcul central Le nombres de cœurs et l architecture La quantité de mémoire vive (RAM) et de stockage Le format du matériel (uniquement pour les équipements existants) Réunion CIF Sciences du 6.12.11 13/19

Participation des facultés à l enquête Réunion CIF Sciences du 6.12.11 14/19

Résultats (généraux) de l enquête Les réponses des 61 groupes de recherche ont été recoupés: 36 groupes possèdent un serveur de calcul 30 groupes pensent acquérir un serveur de calcul 53 groupes sont intéressés par une nouvelle machine centrale Besoins identifiés : 30 millions d heures de calcul, correspondant à une machine d environ 4 000 cœurs/ans et environ 5 PB d ici 2015 Une salle machine de 50 racks et 700 kw permettrait d héberger les serveurs de calculs Réunion CIF Sciences du 6.12.11 15/19

L enquête en sciences [ ] Souvent on n'entend par HPC que des programmes écrits spécifiquement à l'aide de librairie dédiées, en c, c++, fortran,... De tels codes demandent un investissement en temps considérable pour être écrits [ ] Matlab bénéficie que de très peu de support sur les ordinateurs performants mis à disposition de la communauté. [ ] renforcer le partenariat avec Vital-it qui dispose déjà d'une équipe dédiée exceptionnelle et d'une puissance de calcul déjà très grande [ ] [ ] utilisation de 100 coeurs "a plein temps"- utilisation de 1000 coeurs par période. L UNIGE a dejà une génération de machine de retard. La mise en service de ressources HPC doit être rapide pour faire du sens. Réunion CIF Sciences du 6.12.11 16/19

[ ] common computer room (equipped with air conditioning and electricity) is very desirable. Il faut que le partage des ressources coûte effectivement moins pour être attractif car partager les ressources entraîne aussi l'inconvénient de ne plus pouvoir garantir l'obtention des résultats dans un temps donné. [ ] nous aimerions que ce système soit maintenu à flot jour et nuit. [ ] We continuously develop new codes, such that it is hard to predict what resources we will need in two years 3940 cores, 2000GB (RAM),100TB (Disk) ; 25'000 jobs x 48 heures Réunion CIF Sciences du 6.12.11 17/19

Projets en Sciences (tour de table) Réunion CIF Sciences du 6.12.11 18/19

Prochaines étapes? 1. Présentation/discussion du projet aux CIFE, consolidation des besoins o Échéance: décembre 2011 2. Finalisation et soumission du PL (budget, ROI, etc.) o Échéance: février 2012 3. Acquisition d expertise avec les projets courants dans l attente du financement 2014-2017 o Service de base HPC (J.-L. Falcone) o Cadmos (Rectorat, B. Chopard) 4. Développement et consolidation des services DLCM et HPC destinés aux chercheurs dans l'attente du «datacenter» cantonal o Échéance: dès 2012 Réunion CIF Sciences du 6.12.11 19/19