Une infrastructure pour les humanités numériques



Documents pareils
Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux

Infrastructure / réseau / sécurité /support utilisateur

HAL, archives ouvertes. Christine Berthaud, CNRS/CCSD - Directrice

ISTEX, vers des services innovants d accès à la connaissance

Ministère de la Culture et de la Communication

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

Mise en place d une politique institutionnelle d archives ouvertes

Compte-rendu re union Campus AAR 3 mars 2015

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Vers une convergence. Plateforme en ligne Mathrice

SOGECASH NET. vos opérations bancaires en ligne

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

Les infrastructures de recherche en sciences humaines et sociales

Sommaire. Le périmètre des données

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Solution documentaire globale. Présentation du 14 janvier 2010

Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

Présentation générale du projet data.bnf.fr

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

L importance des choix juridiques pour la médiation dans l environnement numérique

OPEN ACCESS. ouverte INP Toulouse

Le Cloud Computing et le SI : Offre et différentiateurs Microsoft

Les archives ouvertes

Quel ENT pour Paris 5?

Le projet SIST. Internet et Grilles de calculs en Afrique Agropolis- Montpellier Décembre 2007

La gestion des documents administratifs à la Bibliothèque nationale de France

La gestion électronique de l information et des documents entreprise. Présentation

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

LOGICIEL DE GESTION D ENTREPOT


Lancement de la mise à jour de la feuille de route nationale «Infrastructures de Recherche»

Des informations fiables, en temps réel et facilement accessibles pour tous les acteurs du marché

Groupe de travail Gestion des identités Les usages et les services ATELIER 2

Qui sommes-nous? Motivation Factory propose des solutions web

Master Technologies numériques appliquées à l'histoire Deuxième année

QUI SOMMES NOUS? Notre équipe se tient à votre disposition pour vous apporter de plus amples informations et vous conseiller.

LE RESEAU Ce réseau est issu de l'identification et de la formation de personnes et d'équipes ressources en numérisation.

Plan d actions 2011/2014

FORMULAIRE DE SOUMISSION DU PROJET PORTÉ DANS LE CADRE DU SYSTÈME D'ARCHIVAGE ÉLECTRONIQUE MUTUALISÉ (SAEM)

L. Granjon, E. Le Goff, A. Millereux, L. Saligny MSH Dijon

COMMENT PAYEZ-VOUS? COMMENT VOUDRIEZ-VOUS PAYER?

L IMMIGRATION AU SEIN DE L UE

Principaux partenaires commerciaux de l UE, (Part dans le total des échanges de biens extra-ue, sur la base de la valeur commerciale)

L IAE MONTPELLIER CRÉE LE PREMIER MOOC MANAGEMENT FORCE DE VENTE

Kit Demande de Bourse Etude Erasmus

Solution de stockage et archivage de grands volumes de données fichiers.

Ministère de la Culture et de la Communication

Une plateforme de recherche et d expérimentation pour l édition ouverte

Flotte Automobile (-3,5t)

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Programme national de numérisation. Ministère de la Culture et de la Communication. Appel à projets de numérisation 2010

Prix de l énergie dans l Union européenne en 2010

Mise à jour de STAR par formulaires (Cycle mise à jour) Version :

PRESENTATION 2009 L'ingénierie Documentaire

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

PROGRAMME ERASMUS+ Toute mobilité Erasmus+, financée ou non par la bourse, doit faire l objet de justification sur la base des documents suivants

Le Parc naturel régional des SIG. Restructuration d un SIG et diffusion des données dans le cadre de la directive Inspire

Présentation de l Université Numérique de Paris Île-de-France

Le temps est venu d implanter un CRM et un système de gestion de la connaissance

Archivage pérenne : les formats conformes Version :

Solutions. Une expertise au service de vos besoins logiciels.

NOTE DE SYNTHÈSE DU REM (INFORM)

RESSOURCES HUMAINES. Yourcegid Ressources Humaines, des solutions pour les entreprises qui s investissent dans leur capital humain.

Programme-cadre européen pour la recherche et l innovation. Horizon Lignes directrices pour la gestion des données dans Horizon 2020

Virement SEPA Réussir Votre Migration

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Etapes de création d une revue électronique

Les concepts et définitions utilisés dans l enquête «Chaînes d activité mondiales»

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Panorama des contenus

Cahier des charges - Refonte du site internet rennes.fr

Cahier des charges. «Application Internet pour le portail web i2n» Direction du Développement numérique du Territoire

Préparez-vous au virement SEPA

J'ai un patrimoine électronique à protéger

Avancement du projet de création de l institut national de formation. Instance Nationale de Concertation 16 avril 2015

La Jubilothèque Du magasin à la Jubilothèque documents en ligne soit + de pages budget /an 0.7 ETP Pôle associé BnF

Dématérialisation du courrier: à éviter

E-réputation Méthodes et outils pour les individus et les entreprises

Guide du doctorant ( )

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

Solution. collaborative. de vos relations clients.

Qu est ce qu une offre de Cloud?

Mobilité de l enseignement supérieur

Communication. Pour devenir un analyste critique et un stratège de la communication COMU. L École de Communication de l UCL CAMPUS UCL MONS

Préparez-vous au virement

Vente de prestations de services et TVA intracommunautaire

CATALOGUE DE SERVICES DE LA DIRECTION DU SYSTEME D INFORMATION DE L UNIVERSITE DE LIMOGES

Bourses de mobilité des étudiants et membres du personnel de l UMONS Année académique

Rédiger : le numérique dans la préparation de la thèse

PLATE- FORME MUTUALISEE DE SERVICES DIFFERENCIES POUR USAGES D ETABLISSEMENTS D ENSEIGNEMENT SUPERIEUR ET DE RECHERCHE ET APPLICATIONS METIER

Optimisez la gestion de l information dans votre entreprise

Prix du gaz et de l électricité dans l Union européenne en 2011

Extensions, Documentation, Tutoriels, Astuces

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Recommandations pour une diffusion du livre numérique par les bibliothèques publiques

La fédération des infrastructures cloud

Master Informatique Aix-Marseille Université

Transcription:

Une infrastructure pour les humanités numériques Une des TGIR en SHS (Progedo : données quantitatives, enquêtes). Très grande infrastructure de recherche (TGIR) pour les «humanités numériques». Généraliste, multidisciplinaire, centrée sur les données de la recherche +100 équipes impliquées Issue de la fusion en mars 2013 de la TGIR Corpus-IR et du TGE Adonis 3 tutelles (CNRS-INSHS / AMU / Campus Condorcet UMS avec comité de pilotage et comité scientifique

Missions Faciliter le tournant numérique de la recherche en sciences humaines et sociales dans la production et la réutilisation de données numériques Concertation collective par et avec les communautés scientifiques Coordonner la participation de la France dans DARIAH-EU Services numériques pour les données et les métadonnées de la recherche

Une cible : les données de la recherche Production de corpus Production de données (chercheurs, labos, msh) Concertation collective par les communautés (consortiums) Gestion temporelle des données

Accompagner les communautés Réseaux disciplinaires internationaux.ex Projets de recherche UMR et EA

Consortiums - Dariah Isidore Nakala Archivage à venir Activités 2014 1. Concertation (Consortiums-Dariah)

Consortiums - Dariah Isidore Nakala Archivage - à venir Consortiums

Les consortiums (2014) AG en janv. 2014 123 labos impliqués 50% MSH 2 créations (SHS3D ; Musica) sur 3 demandes Effet de la fusion, les consortiums utilisent les services de la TGIR : 9/11 consortiums proposent des contenus pour Isidore 11/11 consortiums utilisent la grille de service

2015 : consortiums Accroître l interaction entre les consortiums et les services de la TGIR (réflexion avec le CP/CS) Accroître l interaction consortiums + MSH + services de la TGIR

Consortiums - Dariah Isidore Nakala Archivage - à venir Dariah

1/ DARIAH, c est Une infrastructure européenne visant à développer et soutenir la recherche et la formation dans toutes les disciplines des sciences humaines et sociales o Distribuée o Pour les chercheurs, par les chercheurs Les données qualitatives sont privilégiées : textes, sons, images, vidéos

Des activités en réseau Entre 15 pays et pour toutes les disciplines des SHS Chaque pays membre met à disposition : Des plateformes Des données Des formations (écoles d été..) Des expertises Des compétences techniques (identifiants pérennes, préservation à long terme...) Des répertoires (de normes, de bonnes pratiques, de formations en HN ) Pays Membres : Allemagne, Autriche, Belgique, Chypre, Croatie, Danemark, France, Grèce, Irlande, Italie, Luxembourg, Malte, Pays-Bas, Serbie, Slovénie

Un ERIC ERIC ou European Research Infrastructure Consortium Consortium de pays (et non d institutions) Enjeu : pérennité des infrastructures (ERIC DARIAH créé en 2014 pour 20 ans) Gouvernance : l AG des pays membres est l organe décisionnaire souverain Siège social : France

Bref historique 2006 : DARIAH dans la feuille de route ESFRI 2008-2011 : Phase préparatoire (mise au point du projet scientifique et des statuts) 2011-2014 : Phase de transition (établir l ERIC DARIAH en intégrant les activités nationales) 2014 : création de l ERIC DARIAH (15 août : création officielle par la Commission Européenne, 17 novembre : inauguration au MENESR)

2/ Le réseau DARIAH Le contexte technologique en constante évolution pose un certain nombre de défis aux SHS : Accès à des quantités inédites de données Intégrité Origine et contexte de production Préservation sur le long terme Formats standardisés et interopérabilité Respect de la vie privée Propriété intellectuelle Etc.

Des éléments de réponse DARIAH promeut les principes suivants : Le libre accès pour les matériaux de la recherche La certification des entrepôts La fourniture d identifiants pérennes Le développement de l archivage à long terme Des recommandations (formats, bonnes pratiques) La promotion de la décentralisation et propose un réseau de ressources et d activités mises à disposition par les pays membres

Un réseau de plateformes Blogs scientifiques Données Annonces d événements Archives ouvertes

Un réseau pour les formations Universités d été (DE) Matériels pédagogiques multilingues Programme doctoral (IE)

Un réseau pluridisciplinaire Archéologie Histoire médiévale et contemporaine Bourses dans le domaine de l édition de textes Histoire de l holocauste Ontologie sur les méthodes (DH)

3/ Participer à DARIAH, c est : Accroître la visibilité de ses recherches au niveau européen Accroître l accès aux données de la recherche, aux outils et aux services dans le domaine des HN Bénéficier de ces outils et services, au-delà du temps de financement de son projet Développer son réseau de collaborations Faire partie de l écosystème (TGIR Huma-Num, DARIAH, Research Data Alliance ) Augmenter ses chances de financement sur le plan national et sur le plan européen (cf. H2020) La participation à DARIAH est ouverte

Consortiums - Dariah Isidore Nakala Archivage - à venir Activités 2014 2. Dispositif technologique (Archivage, Isidore, Nakala)

Dispositif technologique Une infrastructure numérique Archivage à long terme Isidore Nakala Grille de services en partenariat avec

Consortiums - Dariah Isidore Nakala Archivage - à venir Isidore

Service de signalisation de données

2014 : relance de l évolution d Isidore Passage crucial au multilinguisme : en, es, fr Travaux avec le CS sur la question du périmètre des sources Prospective : «Isidore Lab»

Isidore : 2015 mise en œuvre du multilinguisme Isidore on demand Isidore API Isidore Mobile

Consortiums - Dariah Isidore Nakala Archivage - à venir Nakala

Nakala : Un nouveau service Définition et mise en œuvre d un service de stockage, gestion, diffusion de données : Nakala (Swahili : copie)

Exposition de données 00111 10101 00111 10101 00111 10101 Données 00111 10101 00111 10101 Identifiant Affectation d un handle utilisé pour la citation et l accès Accès permanent à la ressource Accès interopérable à la description Documentation par des métadonnées standardisées associées à des protocoles d échange

Un identifiant 00111 10101 00111 10101 00111 10101 Donnée 00111 10101 00111 10101 Handle Plusieurs possibilités pour citer la donnée et l intégrer dans un autre site Une URL basée sur le nom de domaine Nakala http://nakala.fr/data/11280/13add6e9 Une URL plus générique associée au mécanisme du handle http://hdl.handle.net/11280/13add6e9

Accès interopérable 00111 10101 00111 10101 00111 10101 Métadonnée 00111 10101 00111 10101 Entrepôt OAI Triple Store Chaque déposant dispose de son propre entrepôt OAI Partager ses données et faciliter leur signalement dans ISIDORE Les métadonnées sont accessibles via les technologies du «Web de données» Bâtir des applications et relier les données à d autres entrepôts

En pratique Une interface pour traiter les lots de données (batch) Description des métadonnées en XML Envoi sous forme de paquets Script multi-plate-forme en Java <nkl:data xmlns:nkl="http://nakala.fr/schema#" xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xmlns:dcterms="http://purl.org/dc/terms/" xsi:schemalocation="http://purl.org/dc/terms/ http://dublincore.org/schemas/xmls/qdc/2008/02/11/dcterms.xsd"> <dcterms:title>venezuela : Estado Portuguesa : Guanare : Esquina Calle 13 et Carrera 5 : Vue d'une rue bordée d'habitations collectives et d'une friche urbaine</dcterms:title> <dcterms:creator>pouyllau, Michel</dcterms:creator> <dcterms:type>image</dcterms:type> <dcterms:created>1983</dcterms:created> <dcterms:subject>[shs:geo] Humanities and Social Sciences/Geography</dcterms:subject> <nkl:incollection>11280/a19a5e26</nkl:incollection> <nkl:relation type="http://purl.org/dc/terms/isversionof">11280/bf86bec2</nkl:relation> <nkl:relation type="http://purl.org/dc/terms/isrequiredby">11280/bf86bec2</nkl:relation> </nkl:data>

En pratique Une interface web Dépôt des données Gestion des métadonnées Gestion des collections Gestion des droits

En pratique Utilisation de la fédération d identité RENATER Permettre de se connecter avec les identifiants de son établissement Protéger l accès aux données Validation des formats avec le service FACILE du CINES Intégration de la validation de format dans l interface web et dans le batch

Pour résumer Nakala est un service de stockage Identifiant pérenne de niveau international (handle) Stockage sécurisé (avec câblage pour l archivage) et un service d exposition de données OAI-PMH Base de données RDF Il s adresse aux équipes et projets de recherche n ayant pas les moyens de mettre en œuvre ces fonctionnalités Service en mode SAAS (la TGIR prend en charge l évolution du service)

Autrement dit Vous décharge de la gestion des données Prends en charge le partage interopérable des données Dissocie les données de l outil (ou des outils) de présentation Prépare l entrée des données dans ISIDORE et facilite le processus d archivage à long terme

Consortiums - Dariah Isidore Nakala Archivage - à venir Archivage

L archivage à long terme Pourquoi? 00111 10101 00111 10101 00111 10101 Données 00111 10101 nativement numériques ou produit de numérisation 00111 10101 Destruction numérique Documentation(s) Aucune information sur le contexte Support Format Plus personne ne sait que le document existe Détérioration Dispositifs de lecture Plus d outils pour le lire Pas de documentation pour recréer un outil Système et/ou Matériel disparus

L archivage à long terme Différence entre stockage intermédiaire (Sharedocs, Seafile ) et archivage à long terme. Passage du projet pilote en production Convention avec le CINES (archivage données SHS) 5 nouveaux projets TEI/XML (avec les consortiums, le CLEO, MSHs, Atilf) 3D (avec le consortium SHS3D) Ethno/Musico avec la MMSH + MAE «pré-cablage» de services de la grille vers l archivage à long terme Coordination avec l Equipex Ortolang sur l archivage des données de linguistique

Bilan des objectifs 2014 Développement des consortiums : DARIAH-FR : accompagner les contributions à la création de l ERIC Relancer l évolution d Isidore : Ouvrir de nouveaux services pour les données : Mise en production de l archivage à long terme : Refonte de l architecture de la grille de service (2015)

Consortiums - Dariah Isidore Nakala Archivage - à venir À venir

Une nouvelle grille de services LE grand chantier 2014-2015 Diagnostic établi en 2013-14. Compétence mais faible visibilité des services, hébergement web disparate posant des problèmes de cycle de vie des projets et d accès aux données, de curation, de sécurité. Deux étapes 2014 : bilan, études, projets, tests 2015 : mise en place, version bêta, déploiement, mise en production

Grille de services : écosystème Equipex Biblissima OpenEdition Institutions, structures FMSH MSH Méthodologie partagées RNMSH Equipex Consortiums Grille Huma- Num

Grille de services : typologie des besoins Traiter des données Tester et découvrir Edition web Systèmes d information

Grille de services : propositions Encoder en XML, en RDF Expérimenter un outil Déployer un système d information Diffuser des corpus scientifiques

Les critères de la refonte «Du clef en main» au «sur mesure». Inciter la «montée» en compétence des équipes en proposant des outils maintenus par Huma-Num en proposant un éventail d offre s adressant aussi bien aux «débutants» qu aux projets «experts». Développement de services reposant sur la distinction entre données et diffusions / publications des données Multi-représentation des données : traiter la donnée avec «plusieurs regards» via plusieurs vues Porter cette vision dans DARIAH-EU Porter ce dispositif au cœur du Campus Condorcet

Grille de services : vers une nouvelle architecture SAAS (soft as a service) Packs logiciels (bibliothèques numériques, fond d archives scientifiques ) Systèmes d information ad hoc IAAS (infra as a service) Nakala Machines et conteneurs virtuels Service de jetons Stockage Archivage Serveur de licences Calcul

huma-num.fr contact@huma-num.fr @huma_num