Projet ORI-OAI Outil de Référencement et d Indexation Réseau de portails OAI Rencontres Mondiales du Logiciel Libre 2007 Amiens, 13 juillet 2007
Sommaire Introduction - contexte Les fonctions du système Concepts - principes Implémentation - architecture Démonstration François Jannin ENSEEIHT INP de Toulouse Amiens, 13 juillet 2007 RMLL 2007 2
Introduction Amiens, 13 juillet 2007 RMLL 2007 3
Amiens, 13 juillet 2007 RMLL 2007 4 Croissance de la création numérique institutionnelle (documents scientifiques, pédagogiques, administratifs, ressources documentaires..) Contexte Mise en place d une démarche «Système Global d Information» à l échelle d un établissement Organisation des services numériques au moyen de l ENT, s appuyant sur le SI
Amiens, 13 juillet 2007 RMLL 2007 5 Contexte Besoin d un référentiel unique de documents et d une indexation professionnelle Demande croissante d accessibilité aux ressources numériques dans différents contextes La structuration importante initiée par les projets nationaux (UNT, UNR, SI d établissement)
Amiens, 13 juillet 2007 RMLL 2007 6 But Répondre aux besoins de stockage, de référencement, d indexation et d accès aux documents Assurer la valorisation et la gestion pérenne des contenus numériques Développer un SGI en lien avec les ressources numériques d un référentiel unique de documents Partager les ressources numériques avec d autres établissements Donner l accès à distance et selon les droits
Le partage dans ORI-OAI Patrimoine pérenne pouvant se partager Avec les acteurs de l établissement Avec les partenaires des réseaux locaux, nationaux et internationaux de l établissement Avec les internautes En respectant les règles du numérique et les standards Droits d auteur Interopérabilité des systèmes (OAI / SOAP) Normes d échange (schémas XML) Vocabulaire commun Amiens, 13 juillet 2007 RMLL 2007 7
Un système de gestion de documents Mise en place d un système de gestion de documents Système de gestion et de publication des ressources numériques (gestion des droits, indexation LOM-FR, DC, TEF.., indexation classification des UNT) Système de production impliquant les acteurs concernés (workflows) Systèmes de partage (échange de métadonnées /OAI-PMH) Système de recherche avancé (métadonnées, texte intégral), accès thématiques Utilisation de vocabulaires provenant de référentiels communs ou spécifiques [issus du SI] à chaque étape du processus de référencement/consultation Amiens, 13 juillet 2007 RMLL 2007 8
Amiens, 13 juillet 2007 RMLL 2007 9 Les acteurs Établissements UNT Avec le soutien du MENESR
Les fonctions du système Amiens, 13 juillet 2007 RMLL 2007 10
Amiens, 13 juillet 2007 RMLL 2007 11 ORI-OAI Points clés Gérer et publier les documents numériques de l établissement Référentiel unique connecté au SI Accès thématique aux ressources Système de recherche avancée
Amiens, 13 juillet 2007 RMLL 2007 12 ORI-OAI Points clés Partager les ressources numériques avec d autres établissements enrichir l offre numérique augmenter la visibilité des ressources mutualiser les coûts Valoriser la production scientifique et pédagogique par une indexation de qualité Accéder aux ressources numériques à distance en fonction des droits d accès
Amiens, 13 juillet 2007 RMLL 2007 13 Ressources d enseignement Types de documents polycopiés numériques, exercices, ressources pédagogiques multimédia (format LOM, LOM-fr) Travaux d étudiants rapports de stage synthèses bibliographiques Travaux de recherche publications, pré-publications, rapports techniques mémoires de Master, mémoires de Thèse (format TEF) Ressources documentaires éditoriales revues, livres électroniques (format Dublin Core)
Concepts Amiens, 13 juillet 2007 RMLL 2007 14
Amiens, 13 juillet 2007 RMLL 2007 15 Projet ORI-OAI principe du référencement
Amiens, 13 juillet 2007 RMLL 2007 16 Workflow simple (étape auteur) Doc Workflow simple (auteur) Auteur Document Titre Description Upload Métadonnées Auteur Entrepôt de données ORI-OAI A publier
Amiens, 13 juillet 2007 RMLL 2007 17 Workflow Simple (étape documentaliste) Workflow simple (documentaliste) Documentaliste Document Titre Description Auteur Publier Rejeter Entrepôt de données ORI-OAI Publié Métadonnées Doc
Amiens, 13 juillet 2007 RMLL 2007 18 Principes de ori-oai-workflow Privé créer [tous] Positionner permissions Diagramme Etats / Transitions retirer [propriétaire, modérateur] Envoi mail propriétaire rejeter désindexer En attente de publication Demander à publier [propriétaire] Envoi mail modérateur publier [modérateur] indexer Etats Transitions Conditions Actions Publié
Gestion des vocabulaires Centralisation et automatisation des vocabulaires Répartition en réseau des vocabulaires avec tolérance à la panne (cache intelligent) Utilisés en amont (workflow) et en aval (recherche, OAI) Chaque vocabulaire est partageable par x établissements, UNT/UNR Vocabulaires de référence fermés et statiques avec peu de fluctuations (taxonomies, liste de mots-clés fermés) Vocabulaires dynamiques générés automatiquement depuis une annuaire LDAP ou Active Directory d après les valeurs déjà indexées (auteurs, mots-clés libres) d après des référentiels existants (bases de données ) Amiens, 13 juillet 2007 RMLL 2007 19
Amiens, 13 juillet 2007 RMLL 2007 20 Projet ORI-OAI principe des échanges
Amiens, 13 juillet 2007 RMLL 2007 21 Entrepôt ORI-OAI Entrepôt ORI-OAI Stockage des ressources numériques Métadonnées sur les documents Dublin Core LOM-fr Etc. Document Document Document Métadonnées
Amiens, 13 juillet 2007 RMLL 2007 22 Open Archive Initiative (OAI) Entrepôt Etablissement A OAI Entrepôt Etablissement B OAI OAI Moissonneur UNT, UNR,
Amiens, 13 juillet 2007 RMLL 2007 23 OAI pour l utilisateur internaute Entrepôt Entrepôt Site Web UNT Recherche Moissonneur OAI UNT Accès au site Lancement de la recherche Résultat de la recherche Accès au 1 er document Accès au 2 ème document
Amiens, 13 juillet 2007 RMLL 2007 24 OAI pour l utilisateur d un établissement Entrepôt Entrepôt? ENT Recherche Moissonneur OAI Etablissement Accès à l ENT(authentifié) Lancement de la recherche Résultat de la recherche Accès au 1 er document Accès au 2 ème document
Amiens, 13 juillet 2007 RMLL 2007 25 Fédération d identités (Shibboleth) Shib Entrepôt Qui est-ce? Un étudiant en médecine 2 ème année Tentative d accès au document Requête à l établissement «fournisseur d identités» Réponse à l établissement «fournisseur de services» Accès au document
Amiens, 13 juillet 2007 RMLL 2007 26 Vue Consortium UNIT UVED Etc Moissonneur Moissonneur Site Web UNIT Site Web UVED
Amiens, 13 juillet 2007 RMLL 2007 27 Vue établissement UNR UVED Shib Entrepôt UNIT OAI Moissonneur ENT.eu
Implémentation Amiens, 13 juillet 2007 RMLL 2007 28
Amiens, 13 juillet 2007 RMLL 2007 29 Projet ORI-OAI acteurs impliqués
Amiens, 13 juillet 2007 RMLL 2007 30 Acteurs du développement Équipe de pilotage avec des représentants des établissements des UNT des SCD Équipe fonctionnelle 1 coordinatrice 10 membres du groupe «Ressources pédagogiques» 8 membres du groupe «Thèses» 7 membres du groupe «Archives ouvertes»
Amiens, 13 juillet 2007 RMLL 2007 31 Acteurs du développement Équipe technique 1 coordinateur 1 conseiller technique 5 développeurs 2 Université de Rennes 1 1 INP Toulouse - ENSEEIHT 2 Université de Valenciennes
Amiens, 13 juillet 2007 RMLL 2007 32 Projet ORI-OAI développement
Amiens, 13 juillet 2007 RMLL 2007 33 Généralités ORI-OAI est composé de 7 modules Composants interopérables avec des outils existants Utilisation de standards comme OAI, XML-RPC, SOAP, WEBDAV Différentes versions des composants Portlet à intégrer dans un moteur type ENT(JSR 168) Standalone: application indépendante Plusieurs distributions prévues Les modules peuvent être associés les uns aux autres suivant le cas d utilisation (UNT, UNR, établissement, )
Amiens, 13 juillet 2007 RMLL 2007 34 Technologies Java J2EE Spring : Inversion de Contrôle, injection de dépendance Hibernate : Liaison facilitée aux bases relationnelles XFire : Web services SOAP simplifiés et efficaces AOP/AspectJ : Gestion transversale non-intrusive des transactions et des permissions Lucene et LIUS : indexation XML, plein-texte et de formats binaires (PDF, Word, RTF ) par Apache et l université Laval (Québec) OAICat : implémentation Java populaire de OAI-PMH par OCLC OSWorkflow : Framework pour workflow très souple et paramétrable Orbeon / OPS : Puissant framework de formulaires Web basé sur Xforms I18N : localisation des IHM
Amiens, 13 juillet 2007 RMLL 2007 35 Projet ORI-OAI architecture
Amiens, 13 juillet 2007 RMLL 2007 36 Architecture globale ESUP-serveur-WebDAV stockage des documents et gestion des authentifications ORI-OAI-repository entrepôt d exposition des métadonnées ORI-OAI-harvesting moissonneur de métadonnées ORI-OAI-workflow gestionnaire du workflow de saisie des métadonnées ORI-OAI-indexing moteur d indexation Internet SSO LDAP ORI-OAI-vocabulary gestionnaire de vocabulaires ORI-OAI-search moteur de recherche
Amiens, 13 juillet 2007 RMLL 2007 37 Gestion des documents locaux ESUP-serveur-WebDAV ORI-OAI-repository ORI-OAI-workflow ORI-OAI-indexing SSO Utilisateurs ORI-OAI-vocabulary Saisie du lien vers le(s) document(s) Saisie des métadonnées via vocabulaires Indexation des métadonnées Exposition OAI (optionnelle) Exposition des fiches par requêtes sur l index Génération de sets OAI via le vocabulaire
Moissonnage par OAI ORI-OAI-repository ORI-OAI-harvesting ORI-OAI-indexing Internet ORI-OAI-vocabulary Moissonnage des fiches de métadonnées via OAI Indexation des métadonnées Exposition OAI (optionnelle) Exposition des fiches par requêtes sur l index Génération de sets OAI via le vocabulaire Amiens, 13 juillet 2007 RMLL 2007 38
Recherche de documents locaux Génération des interfaces à partir du vocabulaire Recherche dans l index Récupération de la fiche pour l affichage Traduction de certains résultats via vocabulaire ORI-OAI-workflow ORI-OAI-indexing ORI-OAI-vocabulary ORI-OAI-search Amiens, 13 juillet 2007 RMLL 2007 39
Amiens, 13 juillet 2007 RMLL 2007 40 Recherche de documents distants Génération des interfaces à partir du vocabulaire Recherche dans l index Récupération de la fiche pour l affichage Traduction de certains résultats via vocabulaire ORI-OAI-harvesting ORI-OAI-indexing ORI-OAI-vocabulary ORI-OAI-search
Amiens, 13 juillet 2007 RMLL 2007 41 Projet ORI-OAI calendrier
Amiens, 13 juillet 2007 RMLL 2007 42 Calendrier Version BETA Distribuée fin juin 2007 à 7 établissements Tests juillet et août Retours fin août Version 1.0 Finalisation septembre 2007 Après retours des BETA-testeurs
Amiens, 13 juillet 2007 RMLL 2007 43 Repères Site du projet http://www.ori-oai.org Sources http:// sourcesup.cru.fr/softwaremap/trove_list.php?form_cat =318 Contacts Liste de diffusion publique ori-oai-utilisateurs http://listes.univ-rennes1.fr/wws/subscribe/ori-oai-utilisateurs
Démonstrations Amiens, 13 juillet 2007 RMLL 2007 44
Demonstrations Dépôt d un document LOM, workflow : http://cas.enseeiht.fr/ori-oai-workflow Recherche thématique & avancée http://cas.enseeiht.fr/ori-oai-search Recherche relookée http://cas.enseeiht.fr/moodle-web Moissonneur moissonneur ENSEEIHT Amiens, 13 juillet 2007 RMLL 2007 45
Amiens, 13 juillet 2007 RMLL 2007 46 Merci! francois.jannin@enseeiht.fr
Amiens, 13 juillet 2007 RMLL 2007 47 Licence Ce travail est mis à disposition sous une licence Creative Commons Vous êtes libres De reproduire, distribuer et communiquer cette création au public De modifier cette création Cette création est mise à disposition selon le Contrat Paternité-NonCommercial-ShareAlike 2.5 disponible en ligne http://creativecommons.org/licenses/by-nc-sa/2.5/ Remarque : Les transparents présentés ici ont été réalisés par : Rosa-Maria Gomez (INSA de Lyon) Yohan Colmant (Université de Valenciennes) Raymond Bourges (Université de Rennes 1) Monique Joly (INSA de Lyon) Alain Mayeur (Université de Valenciennes) François Jannin (INP Toulouse ENSEEIHT)