3 ème journée des utilisateurs de l archivage



Documents pareils
SIGAMM/CRIMSON COMMISSION UTILISATEUR du 05/12/2014

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Règles et paramètres d'exploitation de Caparmor 2 au 11/12/2009. Pôle de Calcul Intensif pour la mer, 11 Decembre 2009

LIVRET D INFORMATION. Livret d information des utilisateurs des ressources GENCI dans les centres nationaux

Infrastructures Parallèles de Calcul

Les mésocentres HPC àportée de clic des utilisateurs industriels

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

1 ère Partie Stratégie et Directions Stockage IBM

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

libérez votre innovation avec l extreme computing CEA/Philippe Stroppa

Passez au bulletin de salaire électronique grâce à la solution Novapost RH

LIVRET D INFORMATION. Livret d information des utilisateurs des ressources GENCI dans les centres nationaux

Lancement de la mise à jour de la feuille de route nationale «Infrastructures de Recherche»

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Kick Off SCC 2015 Stockage Objet. Vers de nouveaux horizons

APX Solution de Consolidation de Sauvegarde, restauration et Archivage

BIG DATA en Sciences et Industries de l Environnement

Cartographie des solutions BigData

Le supercalculateur Tera 100 Premier supercalculateur pétaflopique européen

Les Géodatabases en 9.2

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

PRODIGUER un noeud français de distribution de données GIEC/IPCC

INITIATIVE HPC-PME Calcul haute performance pour les PME

Robin Favre Fabien Touvat. Polytech Grenoble RICM 3 ème Année Vendredi 21 Novembre 2008 Etude d Approfondissement Réseau

Gestion de clusters de calcul avec Rocks

Problématiques de stockage d un Data Center

Système de Stockage Sécurisé et Distribué

SQL Server 2008 solutions de sauvegarde et de continuité

Acquisition de matériels informatiques

Lyon, 16/10/13. Inauguration FLMSN. le contexte national et européen. M. Asch MESR/DGRI. Wednesday, 16 October 13

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Infrastructure de calcul du CRRI

Présentation Infrastructure DATACENTRE

Bull, un catalogue de service particulier pour répondre aux environnements complexes

CUOMO PC Route d Oron Lausanne 021/

Zimbra Collaboration 8.X

Ministère de la Culture et de la Communication

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Solutions NAS Hitachi

Formation Symantec Veritas Cluster Server 6.x pour Unix

Le projet Gaïa, le Big Data au service du traitement de données satellitaires CRIP - 16/10/2013 Pierre-Marie Brunet

VOTRE POLITIQUE D'ARCHIVAGE EST-ELLE ADAPTÉE? Démarche projet. Alain Le Corre, Responsable de Marché, Gestion de l information

I. Descriptif de l offre. L offre Sage 100 Entreprise Edition Entreprise

WORKSHOP NOUVELLES TECHNOLOGIES ET PATRIMOINES CULTURELS, ENTRE PROJETS REVÉS ET RÉALITÉS DU TERRAIN

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Options indispensables, fortement conseillées pour démarrer sans soucis

ClariLog - Asset View Suite

Structure de base d un ordinateur

Conserver les Big Data, source de valeur pour demain

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

Les vpack DataCenter et End-User. Yves Pellemans Directeur Technique Groupe APX

Etude d Exchange, Google Apps, Office 365 et Zimbra

Architecture des ordinateurs

Sauvegarde & Restauration

Services à la recherche: Data Management et HPC *

Sébastien Geiger IPHC Strasbourg

Exigences système BauBit pro

Big Data, Cloud et Sécurité. Gilles MAGHAMI Senior Consultant


Université de Lausanne

Demande d'ap informatique 2012

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Optimisez la gestion de l information dans votre entreprise

Solution de stockage et archivage de grands volumes de données fichiers.

WEB15 IBM Software for Business Process Management. un offre complète et modulaire. Alain DARMON consultant avant-vente BPM

Initiation au HPC - Généralités

Introduction au Massive Data

CONSTRUISEZ VOTRE INFRASTRUCTURE BIG DATA

janv-10 janv-11 oct-10 juil-11 juil-10 avr-11 avr-10

L équipement choisit devra être nomade, il servira aux visiteurs en déplacements et sera donc sujets à des limitations de tailles et de poids.

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

EMC DATA DOMAIN OPERATING SYSTEM

Data Governance et. Optim / FileNet. La synergie entre le structuré et le non structuré IBM Corporation

Grid5000 aujourd'hui : Architecture & utilisation

IT SERVICES BUSINESS STORAGE DATA AUDIT PARTNERSHIP INTEGRATOR SECURITY PLANNING PRIVATE AGILITY DYNAMIC PUBLIC TECHNOLOGY SOLUTIONS MANAGEMENT

SAP Extended ECM. Application Governance & Archiving for SharePoint. Marc WOLFF Associé fondateur Certified CDIA+

Eléments d architecture des machines parallèles et distribuées

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

Sécurité en MAC OS X [Nom du professeur]

Infodatatech. Programme :

Jean-François Boulicaut & Mohand-Saïd Hacid

La sécurité des solutions de partage Quelles solutions pour quels usages?

Jean-Philippe VIOLET Solutions Architect

Gestion des identités Christian-Pierre Belin

Architecture des Ordinateurs. Partie II:

Archivage numérique pérenne

Kick Off SCC Vers de nouveaux horizons

RECUEIL POLITIQUE DES

Optimisez la gestion de l information dans votre entreprise

La conservation à long terme de contenus numériques

Tout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander

Virtua Robot de Gravage

JetClouding Installation

Comprenant Windows 7 Édition Professionel Authentique et/ou d'autres systèmes d'exploitation

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

La nouvelle solution de stockage V3700

Transcription:

Université Lille 2 CINES Département Archivage et Diffusion 3 ème journée des utilisateurs de l archivage 9 juin 2015

JOURNEE INTERNATIONALE Mardi 9 juin 2015 des ARCHIVES Et on la fête absolument partout même au CINES! de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 2

Université Lille 2 L approche datacentrique du CINES, une politique de gestion intelligente des données 3 ème journée des utilisateurs de l archivage 9 juin 2015

Environnement HPC Environnements de pré/post-traitement YODA : IBM Power7 (arrêt en juin) 8 nodes P755 6.6 Tflops 32 cores: IBM Power7 @ 3.3 GHz 128 GB / node Infiniband DDR GPFS, 10 TB @ 3 GB/s (/scratch, /home) OCCIGEN : Bull DLC 2106 nodes bullx B720 2.1 Pflops 50544 cores Intel E5-2690 @ 2.6 GHz 64 and 128 GB/node Infiniband FDR Ressources HPC Lustre 4.6 PB @ 100 GB/s (/scratch), Panasas 240 TB @ 5 GB/s (/home) CRISTAL : Bull s6030 (Visualisation) 2 nodes s6030 3 Tflops 32 cores : Intel x7560 @ 2.27 GHz 128 GB node1 256 GB node2 2 GPUs Nvidia 10 Gb Backbone FDR Infiniband gateways Ressources de stockage Quadro Plex D2 (FX5800) Lustre HSM 2 PB @ 50 GB/s, DMF, 2 x IBM TS3500 lib. ~2.3 PB, 2 x 1000 cartridges, 9 x Jaguar3 & 10 x LTO4 drives (/store) En 2015 : passage en 9 Jaguar4 (gain 60% vol) et 8 LTO6 + 2 LTO4 (gain = x 3) de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 4

Cycle de vie des données au CINES Occigen : supercalculateur parallèle Bull DLC, Rmax = 2.1 Pflops/s étape 1 : chargement code source + données en entrée Stockage temporaire du calcul 5 PB Espace pour préservation à moyen/long termes étape 3 : Transfert des données pour sécurisation à court-terme étape 4 : Transfert des données pour préservation à moyen/long termes Espace de stockage pour la durée du projet (home & store) étape 2 : Transfert données sur espace de travail 2 PB + de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 5

Organisation des données OCCIGEN Pré/Post traitement Archivage 260TB Home Panasas Espace de manoeuvre IB 10GB/s 5PB Scratch Lustre Occigen IB 50GB/s IB 100GB/s Bull : Cristal Visualisation IBM : Yoda NFS ESGF NFS EUDAT Données scientifiques 2PB Store Lustre HSM 500TB Data CXFS Archivage Tape Lib.1 Tape Lib.2 2x3PB Architecture Datacentrique de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 6

Classification par durée de conservation des données Durée de conservation <18 mois 18 mois à 5 ans > 5ans Cadre DARI ISAAC/Eudat/ESGF/ PAC Accès Fréquent Régulier Occasionnel Disponibilité Immédiate Retardée Différée Support Disques (2 Po) + Disques ou cartouches Cartouches cartouches (HSM) Metadata Non exigées Légères Complètes Modèle économique Gratuit pour projet DARI Facturé Facturé Projet DARI = 1 an + 6mois de délais pour récupérer les données ISAAC/EUDAT = service de conservation des données à moyen terme (archivage intermédiaire) PAC = plateforme d archivage pérenne du CINES (conservation à long terme) de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 7

Université Lille 2 Données scientifiques, du stockage à l archivage pérenne : présentation des services EUDAT, ESGF, et PAC 3 ème journée des utilisateurs de l archivage 9 juin 2015

Eudat «European Data for e-science» EUDAT : quèsaco? Démarrage du projet le 1 octobre 2011 pour 3 ans Renouvelé pour 3 ans en 2015 Objectif : fournir une Infrastructure Collaborative de Données (CDI) européenne qui adresse le cycle de vie de la donnée (Stockage, Traitement, Accès, Echange, Conservation à moyen et long termes) Aux communautés de la recherche dans toutes les disciplines A travers un réseau de 35 partenaires (centres de calcul, centres de données, communautés scientifiques) à travers 15 pays européens CINES particulièrement impliqué dans : - WP2 : Qualité des services (Catalogue de services ITIL, portfolio, SLA/OLA, DSA), coûts et business model. - WP 5 : Conservation, gestion et analyse des données - WP 6 : Validation des services sur des communautés / intégration de nouvelles communautés - WP 7 : Interface Eudat / HPC (PRACE - «Joint calls») de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 9

Les partenaires EUDAT de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 10

Les services EUDAT de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 11

L appel à collaboration EUDAT POURQUOI FAIRE? - Data synchronisations and exchange - Data repository and data sharing - Data replication and preservation - Data staging for analysis and processing - Data discovery and search - Data typing and visualization - New services or tools in the area of Big Data Analytics, Semantic web, etc. Possibilités de financement par la CE POUR QUI? Toutes les initiatives, infrastructures et communautés de recherche européennes. CRITERES d EVALUATION : - Faisabilité technique du pilote (considérant le calendrier et les ressources dédiés) [40%] - Participation et bénéfices attendus pour la communauté de recherche ciblée [20%] - Valeur ajoutée pour EUDAT (développement de services, de communautés) [20%] - Contribution à l open access [10%] - Développement de solutions selon des approches générique telles que RDA [10%] CALENDRIER : - Date limite des soumissions : 30/09 17h CET - Implémentation du pilote : 01/01/2016 30/06/2017 de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 12

ESGF@CINES de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 13

ESGF @CINES Nouveau service CINES : pour la publication de données (ESGF public) Master des données CMIP5 décennales du groupe de modélisation CNRM- CERFACS : mis à disposition au travers de esgf.cines.fr Participation à ESGF-France Déploiement d un «ESGF privé» (à l étude) de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 14

Et l archivage pérenne / PAC dans tout ça? Quèsaco? Triple engagement : Préservation de la lisibilité Préservation de l intégrité Préservation de la capacité à comprendre le contenu du fichier de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 15

Et l archivage pérenne / PAC dans tout ça? Plateforme d archivage (agréée SIAF + Santé + DSA + ISO 16363) 1. Réception 2. Vérification de la qualité des données reçues 3. Ajout d informations (PID, empreintes, date d archivage ) 4. Traitements complémentaires (récupération d informations associées, etc.) 6. Vérification périodique de tous les exemplaires archivés 5. Stockage de l archive en plusieurs exemplaires Salle machine 1 Salle machine 2 Salle machine 3 Site distant ( > 300km) + migration quand il y a lieu 16 de l Enseignement Supérieur Journée des utilisateurs de l archivage 9 Juin 2015 16

Université Lille 2 Quand la climatologie utilise les services ESGF et EUDAT pour la gestion de leurs données Marie-Pierre LEMOINE 3 ème journée des utilisateurs de l archivage 9 juin 2015