Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines



Documents pareils
3 ème journée des utilisateurs de l archivage

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

Glossaire. Arborescence : structure hiérarchisée et logique qui permet d organiser les données dans un système informatique.

Cloud Computing, Informatique en nuage, UnivCloud, Datacenters, SI, Iaas, Paas, Saas, fonction support, technologies, Innovations.

Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Hébergement MMI SEMESTRE 4

Présentation aux entreprises du numérique

MEYER & Partenaires Conseils en Propriété Industrielle

Démonstration Google Apps. Christophe Thuillier Avril 2010 Arrowsoft

EXIN Cloud Computing Foundation

Kick Off SCC 2015 Stockage Objet. Vers de nouveaux horizons

Prestations de conseil en SRM (Storage Ressource Management)

Retour d expérience RATP. Intégrer le test de performance au cœur du processus de développement agile. Challenges, techniques, résultats.

Les nouvelles voies des systèmes d'informations publics «Le Cloud Gouvernemental est du domaine régalien de l'etat»

DEMANDE D INFORMATION RFI (Request for information)

Cycle de vie, processus de gestion

Cloud Computing : Comment est-il appréhendé par l'entreprise Marocaine?

J'ai un patrimoine électronique à protéger

Sommaire. Le marché du cloud avec un focus sur la France. Les conséquences de l adoption du cloud

Le contrat Cloud : plus simple et plus dangereux

Le fonctionnement d un service d archives en entreprise. Le Service national des archives

Dossier de presse L'archivage électronique

Le Cloud Computing et le SI : Offre et différentiateurs Microsoft

Architecte Logiciel. Unité de formation 1 : Développer en s appuyant sur les modèles et les frameworks 7 semaines

Solutions informatiques (SI) Semestre 1

Pérennisation des Informations Numériques

Problématiques de stockage d un Data Center

La conservation à long terme de contenus numériques

Cadre juridique de la Protection des Données à caractère Personnel

Table des matières détaillée

L. Granjon, E. Le Goff, A. Millereux, L. Saligny MSH Dijon

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

I. LE PROJET DE RENOUVELLEMENT DES SUPPORTS D ARCHIVAGE ÉLECTRONIQUE

En savoir plus pour bâtir le Système d'information de votre Entreprise

Introduction Big Data

LA DEMATERIALISATION DES DOCUMENTS : Une démarche d avenir!

Zimbra Collaboration 8.X

Cloud Computing et SaaS

Ministère de la Culture et de la Communication

Travaillez en toute liberté grâce à Internet

La présentation qui suit respecte la charte graphique de l entreprise GMF

Mise en œuvre d un Serveur d Archivage Electronique pour les factures client. 28/01/2015 Sébastien Dufrene


Conserver les Big Data, source de valeur pour demain

Les ressources numériques

Passez au bulletin de salaire électronique grâce à la solution Novapost RH

Comité sectoriel de la sécurité sociale et de la santé Section «Sécurité sociale»

Les enjeux du stockage de masse sur bande vidéo

Position du CIGREF sur le Cloud computing

Qu est-ce que le «cloud computing»?

La sécurité dans les grilles

EMC ATMOS. Gestion des Big Data dans le cloud UN MOYEN ÉPROUVÉ D INTÉGRER LES AVANTAGES DU CLOUD DANS VOTRE ENTREPRISE FONCTIONS ATMOS

Archivage pérenne : les formats conformes Version :

PROGRAMME DE FORMATION

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Co-animés par Helle Frank Jul-Hansen, Béatrice Delmas-Linel et David Feldman

Recommandations pour les entreprises qui envisagent de souscrire à des services de Cloud computing

Cisco Unified Computing Migration and Transition Service (Migration et transition)

Cloud Computing, discours marketing ou solution à vos problèmes?

Plan. Un modèle d organisation. Pour les Archives numériques. Présentation Groupe PIN. Claude HUC (CNES)

Architectures informatiques dans les nuages

Sujet Solution de sauvegarde de serveurs et postes de travail avec BackupPC et Bacula. par ALIXEN

Cloud Computing, Fondamentaux, Usage et solutions

CIMAIL SOLUTION: EASYFOLDER SAE

Assemblée générale Aristote

GCS EMOSIST-fc. DataCenter. Journée du 30 Novembre Jérôme Gauthier

Conservation des données à long terme

Pourquoi OneSolutions a choisi SyselCloud

La fédération d identités, pourquoi et comment? Olivier Salaün, RENATER ANF Mathrice 2014

FILIÈRE TRAVAIL COLLABORATIF

I partie : diagnostic et proposition de solutions

La sécurité des données hébergées dans le Cloud

Release Status Date Written by Edited by Approved by FR_1.00 Final 19/03/2014

La directive européenne INSPIRE

Outils d archivage de l UNIL: du papier à l électronique

Cette première partie pose les enjeux de la BI 2.0 et son intégration dans le SI de l entreprise. De manière progressive, notre approche situera le

Guide de labellisation

[ACTION COLLECTIVE] «Modélisation et intégration des technologies d identification et de traçabilité dans la supply chain»

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

Study Tour Cloud Computing. Cloud Computing : Etat de l Art & Acteurs en Présence

Des systèmes d information partagés pour des parcours de santé performants en Ile-de-France.

Adopter une approche unifiée en matière d`accès aux applications

Les modules SI5 et PPE2

Cloud computing : Défis ou opportunités pour les archives?

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Formation «Système de gestion des documents d activité (SGDA)»

Système d Information du CNRST - SIC -

Mise à jour de STAR par formulaires (Cycle mise à jour) Version :

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

Monique Castruccio Baumstark - CRiP

Examen de la saisine Définition de l'architecture du SINP. Contributeurs : Frédéric Gosselin, Pascal Dupont

et développement d applications informatiques

Mes logiciels d'entreprise dans le Cloud. Didier Gabioud

Cloud computing Votre informatique à la demande

Groupe de travail «TECHNOLOGIES DE L INFORMATION ET DE LA COMMUNICATION» Réunion du 26 janvier L archivage électronique

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

Les archives de l entreprise à l ère du numérique. Présentée par: HAMMA Mustapha

Transcription:

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Constat Enquête auprès des laboratoires de recherche Besoin d information sur les enjeux de l'archivage et de la diffusion Une solution par laboratoire -> besoin de fédération Conserver l information n est pas le métier des laboratoires Exploiter et publier les résultats : 3 à 5 ans Principalement des résultats de calcul post-processing et comparer des résultats, ne pas refaire des calculs couteux Partager et sécuriser la donnée dans un cercle restreint Cerner l importance d une donnée est une démarche à part entière et il est nécessaire de mettre en œuvre les processus permettant sa valorisation, sa conservation et son intégrité 2

Opportunité Expertise Archivage pérenne calcul, visualisation scientifique Format Stockage Atouts Relation avec un grand nombre de laboratoires Implication dans les projets Nationaux et européens (Eudat / Prace) Capacité d organiser et de fédérer des communautés scientifiques Des challenges à relever Sensibiliser et impliquer les utilisateurs des communautés scientifiques. Proposer des services proches des besoins des utilisateurs pour susciter l adhésion. Mettre en œuvre des moyens mutualisés répondant aux normes et standards, aux besoins des utilisateurs. 3

Une organisation Le CINES identifie des Comités Thématiques Archivage (idem DARI) Président Groupe d expert de la discipline Référent CINES Le CTA propose des critères pour les projets qu il contiendra Jeux de métadonnées Liste de formats Autorise les projets en accord avec le CINES Le projet Transmet les données à conserver Remplit les conditions du CTA (format et métadonnées) Récupère les données, ou migre vers un archivage pérenne Communautés Accèdent aux informations selon leurs autorisations 4

Infrastructure-technologies Irods Données réparties Gestion souple de grands volumes Règles permettant des traitements spécifiques (calcul de checksum, migration) Interfaces : web 2.0 (ajax), client irods Implémentations XHF : génération dynamique de formulaire web à partir de schéma XML XSD XHF Formulaire WEB XHF XML ADMIN SGBD 5

IRODS - WEB - FORMULAIRE XSD/XML Producteur de données INGEST Audit Validation des formats Saisie des métadonnées Identification des fichiers Contrôle du profil Gestion des autorisations ACCESS Recherche Inventaire des fichiers Récupération via WEB/IRODS Consommateur des données - Producteur - Personne autorisée - Tout le monde STORAGE Contrôle d empreintes Copies multiples Traçage des événements Comité d expert de la thématique : définissent le contexte d archivage : - Métadonnées; - Formats acceptables; - Base de connaissance - Fonctionnalité supplémentaire Management Décideur OAIS (direction CINES) 6

Projet Pilote : PRECCINSTA Partenariat avec le CORIA COmplexe de Recherche Interprofessionnel en Aérothermochimie (l UMR 6614 ) PRECCINSTA : Prediction and control of combustion instabilities for industrial gas turbines 7

8

Gestion de gros volumes de données CINES Journées OAIS

BIG DATA? Quelques chiffres Production mondiale : 2.5 exaoctet /jours 90 % des données ont été produites durant les deux dernières années. BIG nécessite une architecture en dehors des outils conventionnels de gestion. DATA Fichiers Base de données Le BIG DATA n est pas à priori un phénomène de mode mais une évolution de l organisation des Systèmes d information. 10

Trois aspects HSM, réseaux Disques, bandes. Volume Vélocité variété Métadonnées, formats, identifiants 11

Stratégie de mise en place d un SI Big Data Mise en œuvre RH : compétences+temps Financements Contraintes liées à la données : sécurité, intégrité, confidentialité Taille de la structure : meso centre, national, européen, international interopérabilité? Handle, DOI, structuration des données, authentification etc. Offre privée : pas de pub Initiatives public Eudat : European Data Infrastructure Prace : PartneRship for Advanced Computing in Europe 12

Données privées Il est impératif de connaître juridiquement à qui appartient l information. Directives européennes (95/46/CE) sur l utilisation des données privées Qualité : exactes, utile, finalités déterminées Légitimation : consentement des personnes consternées ou nécessaire pour exécution d un contrat, contraintes légale, intérêt vital ou public, Hors catégorie : ethnique, politique, religieux, philosophiques, syndicales, santé, vie sexuelle. Information : l identité du responsable des information doit être donnée droit d'accès : à ses données droit d'opposition : sur demande et gratuitement, informée si transmise à un tiers confidentialité et sécurité des traitements : mise en œuvre de mesures appropriées pour protéger les données Notification : aux autorités de contrôle national 13

Type de services Saas Paas IaaS (Software as a Service) le matériel, l'hébergement, le framework d'application et le logiciel sont dématérialisés. (Platform as a Service) le matériel, l'hébergement et le framework d'application sont dématérialisés. (Infrastructure as a Service) seul le matériel (serveurs) est dématérialisé 14

ISAAC et le BIG DATA Type de service : Saas basée sur des technologies libres de droits : Irods, XML, XSD, SGBD Postgres, XHML, AJAX. Les 3 aspects : Volume : gestion par irods de grands volumes de données locales ou réparties, ajout facile de disques, de bandes etc.. Vélocité : Protocole Irods pour les échanges de données, classes de services. Variété : respect des normes : OAIS, NFZ-42-013, métadonnées Irods et métadonnée (XML) à plusieurs niveaux. Contrôle des formats 15