Projet ORI-OAI Outil de Référencement et d Indexation Réseau de portails OAI Paris, 6 décembre 2007
6 décembre 2007 ORI-OAI 2 Sommaire Introduction Contour fonctionnel Concepts Mise en oeuvre Evolutions
6 décembre 2007 ORI-OAI 3 Projet ORI-OAI Introduction
6 décembre 2007 ORI-OAI 4 Contexte Les établissements universitaires Croissance de la création numérique institutionnelle (scientifiques, pédagogiques, administratifs, documentaires) Accessibilité aux ressources dans divers contextes Référentiel unique de documents, indexation professionnelle «Système Global d Information» La structuration initiée par les projets nationaux (UNT, UNR, SI d établissement)
6 décembre 2007 ORI-OAI 5 Contexte Les UNT (Universités Numériques Thématiques) Réflexion UNIT : évolution du portail et choix d une organisation en «réseau de portails OAI-PMH» Convergence sur les besoins de référencement et d indexation avec l UNT UVED Nécessité de mutualiser les outils et les moyens d accompagnement pour favoriser la démarche avec l ensemble des UNT ORI-OAI : projet Open Source inter-unt soutenu par la SD/TICE
Conduite du projet ORI-OAI Un groupe projet (établissements: Insa de Lyon, Université de Rennes 1, INPT, Université de Valenciennes) Un pilotage inter-unt Une démarche d ouverture et d échange Site Web et listes de diffusion Groupes de travail (ressources pédagogiques, thèses, archives ouvertes) 6 décembre 2007 ORI-OAI 6
6 décembre 2007 ORI-OAI 7 Les acteurs du projet Établissements UNT Avec le soutien du MEN et du MESR
6 décembre 2007 ORI-OAI 8 Projet ORI-OAI Contour fonctionnel
ORI-OAI Points clés Gérer et publier les documents numériques de l établissement Référentiel unique de documents connecté au SI Accès thématique aux ressources Utilisation de classifications paramétrables articulés sur des standards comme Dewey Système de recherche avancée 6 décembre 2007 ORI-OAI 9
ORI-OAI Points clés Partager les ressources numériques avec d autres établissements enrichir l offre numérique augmenter la visibilité des ressources mutualiser les coûts Valoriser la production scientifique et pédagogique par une indexation de qualité Accéder aux ressources numériques à distance en fonction des droits d accès 6 décembre 2007 ORI-OAI 10
6 décembre 2007 ORI-OAI 11 Ressources d enseignement Types de documents polycopiés numériques, exercices, ressources pédagogiques multimédia Travaux d étudiants rapports de stage synthèses bibliographiques Travaux de recherche publications, pré-publications, rapports techniques mémoires de Master, mémoires de Thèse Ressources documentaires éditoriales revues, livres électroniques
6 décembre 2007 ORI-OAI 12 ORI-OAI les fonctions recherche sur les métadonnées, texte intégral diffusion publication web archivage partage référencement en respectant le droit d auteur, les licences et les droits d accès versions de publication, workflows, plusieurs schémas de métadonnées documents natifs toujours disponibles pour les auteurs protocole OAI/PMH, fédération d identités indexation de qualité adaptée aux divers types de documents
Synthèse Outil de Référencement et d Indexation objectif de mettre en réseau des ressources numériques bien identifiées dans les établissements + Protocole OAI/PMH permet d échanger des données de façon simple et standardisée à de multiples niveaux +.ORG développé en logiciel libre utilisable par les UNT, UNR, les établissements universitaires, et tous ceux qui le veulent = ORI-OAI.ORG 6 décembre 2007 ORI-OAI 13
6 décembre 2007 ORI-OAI 14 Projet ORI-OAI Concepts
6 décembre 2007 ORI-OAI 15 Projet ORI-OAI Concept de métadonnées
Concept de métadonnées Données liées à une ressource Attributs communs à un ensemble de ressources Titre Auteur Mot-clé Ressource Description Taxon 6 décembre 2007 ORI-OAI 16
Concept de métadonnées Un ensemble de métadonnées définit un contexte d utilisation Utilisation générique, format générique (Dublin Core) Utilisation spécifique, format spécifique Pédagogique : LOM, LOMFR, SupLOMFR Thèse : TEF Bibliographique : MARC Offre de formation : CDM 6 décembre 2007 ORI-OAI 17
Concept de métadonnées Formats de métadonnées génériques ou spécifiques LOM Dublin Core Titre Taxon Auteur Description Durée d apprentissage Mot-clé Niveau de difficulté 6 décembre 2007 ORI-OAI 18
Concept de métadonnées Format de métadonnées semi-structuré basé sur un schéma XML structure imbriquée, récursive éléments répétables Rôle des métadonnées dans un entrepôt de données mise en commun d attributs, constitution d ensembles qualité de référencement vocabulaires fermés, saisie contrôlée gestion de la cohérence des données et des redondances 6 décembre 2007 ORI-OAI 19
6 décembre 2007 ORI-OAI 20 Projet ORI-OAI Principe du référencement
6 décembre 2007 ORI-OAI 21 Workflow simple (étape auteur) Doc Étape Workflow Pour auteur Auteur Document Titre Description Upload Metadonnées Auteur Entrepôt de ressources ORI-OAI À publier
6 décembre 2007 ORI-OAI 22 Workflow simple (étape bibliothécaire) Étape Workflow pour bibliothécaire Bibliothécaire Document Titre Description Auteur Publier Rejeter Entrepôt de ressources ORI-OAI Publié Metadonnées Doc
6 décembre 2007 ORI-OAI 23 Projet ORI-OAI Principe des échanges
Entrepôt ORI-OAI Qu est-ce qu un entrepôt ORI-OAI? Stockage des ressources numériques Métadonnées sur les documents Dublin Core LOM-fr Etc. Document Document Document Métadonnées 6 décembre 2007 ORI-OAI 24
6 décembre 2007 ORI-OAI 25 Open Archive Initiative (OAI) Entrepôt Etablissement A OAI Entrepôt Etablissement B OAI OAI Moissonneur UNT, UNR,
6 décembre 2007 ORI-OAI 26 OAI pour l utilisateur internaute Entrepôt Entrepôt Site Web UNT Recherche Moissonneur OAI UNT Accès au site Lancement de la recherche Résultat de la recherche Accès au 1 er document Accès au 2 ème document
6 décembre 2007 ORI-OAI 27 OAI pour l utilisateur d un établissement Entrepôt Entrepôt? ENT Recherche Moissonneur OAI Etablissement Accès à l ENT Lancement de la recherche Résultat de la recherche Accès au 1 er document Accès au 2 ème document
6 décembre 2007 ORI-OAI 28 Fédération d identités (Shibboleth) Shib Entrepôt Qui est-ce? Un étudiant en médecine 2 ème année Tentative d accès au document Requête à l établissement «fournisseur d identités» Réponse à l établissement «fournisseur de services» Accès au document
6 décembre 2007 ORI-OAI 29 Projet ORI-OAI Mise en oeuvre
6 décembre 2007 ORI-OAI 30 Projet ORI-OAI Architecture
6 décembre 2007 ORI-OAI 31 Fondations 7 modules Indépendants Ayant chacun un rôle précis Tous interopérables Dialoguent entre eux par Web Services Chaque module est très configurable Plusieurs configurations sont proposées par défaut pour s adapter au mieux aux besoins des différents établissements Possibilité de faire évoluer ou d intégrer d autres configurations
6 décembre 2007 ORI-OAI 32 Architecture complète ESUP-serveur-WebDAV stockage des documents et gestion des authentifications ORI-OAI-repository entrepôt d exposition des métadonnées ORI-OAI-harvesting moissonneur de métadonnées ORI-OAI-workflow gestionnaire du workflow de saisie des métadonnées ORI-OAI-indexing moteur d indexation ORI-OAI-vocabulary gestionnaire de vocabulaires ORI-OAI-search moteur de recherche 7 modules interopérables
6 décembre 2007 ORI-OAI 33 Cas 1: producteur de données ESUP-serveur-WebDAV stockage des documents et gestion des authentifications ORI-OAI-repository entrepôt d exposition des métadonnées ORI-OAI-workflow gestionnaire du workflow de saisie des métadonnées ORI-OAI-indexing moteur d indexation Référencement du lien vers le(s) document(s) SSO Utilisateurs ORI-OAI-vocabulary gestionnaire de vocabulaires Indexation des métadonnées Saisie des métadonnées via vocabulaires Vocabulaires dynamiques basés sur l index Exposition OAI (optionnelle) Exposition des fiches par requêtes sur l index Génération de sets OAI via le vocabulaire
6 décembre 2007 ORI-OAI 34 Cas 2: Agrégateur de données ORI-OAI-repository ORI-OAI-harvesting moissonneur de métadonnées ORI-OAI-indexing Internet ORI-OAI-vocabulary Moissonnage des fiches de métadonnées via OAI Indexation des métadonnées Exposition OAI (optionnelle) Exposition des fiches par requêtes sur l index Génération de sets OAI via le vocabulaire
6 décembre 2007 ORI-OAI 35 Recherche de documents Génération des interfaces à partir du vocabulaire Recherche dans l index Traduction de certains résultats via vocabulaire ORI-OAI-indexing ORI-OAI-vocabulary ORI-OAI-search moteur de recherche
6 décembre 2007 ORI-OAI 36 Projet ORI-OAI Développement
6 décembre 2007 ORI-OAI 37 Architecture technique Développement Java Technologies Spring XML Lucene/Lius XForms WebDAV Shibboleth JSR-168 (intégration dans ENT, CMS, etc.) Etc. Licence GPL
6 décembre 2007 ORI-OAI 38 Les distributions ORI-OAI Version 1.0.0 Disponible depuis le 15 octobre 2007 Supporte différents types de documents Édition de métadonnées Ressources pédagogiques (LOM) Ressources «génériques» (Dublin Core) Moissonnage par OAI de ressources extérieures Tout format de métadonnées Pré-configuré pour Dublin Core, LOM et CDM Types d installation De production Configuration avancée De démonstration Auto-install d une application Windows
6 décembre 2007 ORI-OAI 39 Projet ORI-OAI Utilisation
6 décembre 2007 ORI-OAI 40 Utilisation de ORI-OAI ORI-OAI est utilisé par UNIT Recherche de ressources pédagogiques (LOM) sur tous les établissements adhérant à l UNT UNR Nord-pas-de-Calais Recherche de formations (CDM) dans tous les établissements de la région Pour le référencement des documents numériques Université de Rennes 1 Université de Valenciennes INP de Toulouse / ENSEEIHT Etc. Mises en œuvre et évaluations en cours UMVF UVED Université de Paris Sud Nancy Universités ENSG IGN Etc.
6 décembre 2007 ORI-OAI 41 Bilan Fruit d un travail collaboratif efficace Analyse des besoins multi-métiers bibliothécaires cellule TICE enseignants/chercheurs informaticiens etc. Rédaction des spécifications par les groupes de travail inter-établissements inter-unt Paramétrage avancé pour répondre aux caractéristiques de chaque établissement Logiciel évolutif
6 décembre 2007 ORI-OAI 42 Projet ORI-OAI Evolutions
Fonctionnalités Workflow Dépôt des documents depuis le workflow Gestion des droits d accès aux documents depuis le dépôt Utilisateurs locaux, groupes locaux et distants (shibboleth) Mise en place d un protocole de communication avec d autres plates-formes LMS, chaînes éditoriales, etc. Le développement côté application cliente sera fait sur d autres projets Nouvelles fonctionnalités 6 décembre 2007 ORI-OAI 43
Fonctionnalités Moteur d indexation Indexation plein texte Crawler web pour les documents distants Renforcement de ce module et de sa disponibilité Le plus sollicité dans l architecture Moissonnage / entrepôt OAI Retouche des interfaces d administration Moteur de recherche Flux RSS Personnalisation des interfaces suivant le profil utilisateur Nouveaux modes de recherche 6 décembre 2007 ORI-OAI 44
6 décembre 2007 ORI-OAI 45 Fonctionnalités Gestionnaire de vocabulaires Gérer des vocabulaires distants et centralisés Ex.: classifications UNT centralisées Optimiser le chargement de gros vocabulaires Serveur de stockage WebDAV Consolidation du serveur Amélioration des procédures d installation Nouvelle interface d administration Passage à supann 2 Nouveau canal stockage Compatible servlet/portlet Utilisé comme «client» du workflow
Fonctionnalités Évolutions générales du projet Identifiants et URL d accès des ressources uniques et pérennes Cache intelligent sur tous les modules Travail d homogénéisation des procédures d installation et des documents techniques Statistiques De recherche D accès aux documents 6 décembre 2007 ORI-OAI 46
Autres projets Autres projets connexes en cours ORI-OAI / HAL : support du format AO.fr pour les publications de la recherche française Support des thèses avec le format TEF CEPIA : référencement dans ORI-OAI depuis moodle et un outil de chaîne éditoriale 6 décembre 2007 ORI-OAI 47
6 décembre 2007 ORI-OAI 48 Repères Site du projet http://www.ori-oai.org Contacts Liste de discussion ori-oai-utilisateurs http://listes.univ-rennes1.fr/wws/info/ori-oai-utilisateurs Liste d information ori-oai-info http://listes.univ-rennes1.fr/wws/info/ori-oai-info
6 décembre 2007 ORI-OAI 49 Licence Ce travail est mis à disposition sous une licence Creative Commons Vous êtes libres De reproduire, distribuer et communiquer cette création au public De modifier cette création Cette création est mise à disposition selon le Contrat Paternité- NonCommercial-ShareAlike 2.5 disponible en ligne http://creativecommons.org/licenses/by-nc-sa/2.5/ Remarque : Les transparents présentés ici ont été réalisés par : Rosa-Maria Gomez (INSA de Lyon) Yohan Colmant (Université de Valenciennes) Raymond Bourges (Université de Rennes 1) Monique Joly (INSA de Lyon) Alain Mayeur (Université de Valenciennes) François Jannin (EINSEEIHT INP de Toulouse)