P. 1 Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique
Début des années 1990 L Inist-CNRS va contribuer à l alimentation du premier corpus de la base documentaire au travers de Rhésus (Réseau santé sciences humaines). P. 2 Le travail des ingénieurs documentalistes de l Inist-CNRS est alors centré sur l indexation des notices bibliographiques des bases PASCAL et FRANCIS, la constitution éventuelle d un résumé. Le catalogage est effectué par un sous-traitant. Indexation manuelle bordereaux papier vocabulaires documentaires contrôlés essentiellement scientifiques (équipe de médecins) maîtrise de la terminologie du domaine pas de formation documentaire de base Production bulletins signalétiques lexiques papier o o partage difficile données propriétaires
Début des années 1990 Informatisation du poste de travail de l ingénieur documentaliste dématérialisation des données partage plus facile automatisation de certains processus amélioration de la productivité et de la qualité P. 3 Internet exposition des données Open data Big Data maîtrise des outils informatiques exploration et appropriation de logiciels de traitement des données Production Cédérom Serveurs Base vocabulaire o o partage facilité données plus ouvertes
1990-2000: évolution des outils et des méthodes de travail Automatisation de l indexation augmentation des données bibliographiques à traiter (Big data) diminution des ressources humaines P. 4 préindexation ou indexation assistée (génération de mots-clefs à partir du titre, du résumé, des mots-clefs d auteur) selon 2 modes: 1- Moteur de préindexation Utilise des ressources terminologiques stockées dans des référentiels. Ces référentiels sont constitués de règles mettant en lien l élément d indexation à générer (descripteur ou code de classement) et l élément à rechercher (chaîne de caractères) dans le texte. 2- Moteur de collocation lexicale Basé sur une méthode statistique et le recours à des traitements linguistiques basiques.
1990-2000: évolution des outils et des méthodes de travail Automatisation de l indexation P. 5 1- révision des notices pré indexées et amélioration des référentiels 2- indexation entièrement automatisée (après validation de son efficacité) productivité qualité (reproductibilité de l indexation assistée) capacité à élaborer les règles de préindexation compréhension des modes de fonctionnement des moteurs d indexation Production référentiels de préindexation spécifiques suivant des thématiques ou des domaines (référentiel de «santé publique») uniques ou multiples dans un processus d indexation («pathologies», «techniques» à rajouter à «santé publique» par exemple)
1990-2000: évolution des outils et des méthodes de travail Evolution des terminologies du papier à l ordinateur P. 6 Lexique Base vocabulaire mise à jour et maintien centralisation contrôle des vocabulaires Référentiels de préindexation éléments terminologiques éléments «déclencheurs»
1990-2000: évolution des outils et des méthodes de travail Evolution des terminologies coopération BDSP :passerelles entre les vocabulaires BDSP et ceux de l Inist-CNRS permettant une homogénéisation de l indexation P. 7 montée en compétences sur les aspects terminologiques acquisition progressive par les acquis de l expérience de compétences documentaires Production thésaurus structurés (termes génériques, associés, synonymes, catégorisation sémantique, ) adoption du langage naturel (usages des moteurs de recherche internet)
2000 à aujourd hui P. 8 Evolution des terminologies Normalisation Norme TMF ISO 16 642 (Terminological Mark-up Framework) pour Termsciences Norme ISO 25 964 pour les thésaurus Partie 1 (2011): Thésaurus pour la recherche documentaire Partie 2 (2013): Interopérabilité avec des vocabulaires contrôlés Interopérabilité SKOS (Simple Knowledge Organization System) OWL RDF pour les outils de gestion terminologique et l exposition sur le web sémantique normes terminologiques nouveaux standards d interopérabilité et outils dédiés Production portail terminologique Termsciences de l Inist-CNRS http://www.termsciences.fr/ outil de gestion terminologique «maison»
2000 à aujourd hui P. 9 Activités diverses Transmission des savoirs analystes documentaires nouveaux collègues Produits et services recherches bibliographiques Veille documentaire Infométrie Traduction (Mesh en français avec l INSERM) Dossiers de synthèse (Diabète ) Sites d actualité (Chronisanté, Psychotémoins, Sidasciences ) recherche documentaire capacités de synthèse capacités rédactionnelles, orientation web
Demain Automatisation de l indexation amélioration des processus par l intégration d outils de fouille de données Evolution des terminologies élaboration d ontologies P. 10 développement de partenariats autour des travaux terminologiques Participation à des projets de recherche: Quaero, Termith application des terminologies hors champ de la constitution des bases de données: données de la recherche, web sémantique, ISTEX acquisition de compétences en TAL et modélisation des connaissances travail en réseau web sémantique Production refonte du portail Termsciences «Cartouches de connaissance» («Marketplace» de Temis)
P. 11 http://www.adbs.fr/docsi-n-3-septembre-2013-dossier-les-metiers-de-l-information-et-ladonnee-analyse-d-un-monde-en-mutation-134291.htm?rh=revue MERCI DE VOTRE ATTENTION
SKOS Traduction en français de la recommandation du W3C portant sur la Référence du vocabulaire SKOS "Système simple d'organisation de connaissances" (18 août 2009): http://sparna.fr/skos/skos-traduction-francais.html Correspondance entre SKOS et Norme ISO 25964 http://www.niso.org/apps/group_public/download.php/9627/correspondence%20iso25964- SKOSXL-MADS-2012-10-21.pdf P. 12 Norme ISO 16642 TMF http://www.iso.org/iso/catalogue_detail.htm?csnumber=32347 Norme ISO 25964 http://www.iso.org/iso/fr/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?csnumber=53 657&ics1=01&ics2=140&ics3=20 http://www.iso.org/iso/fr/home/store/catalogue_ics/catalogue_detail_ics.htm?ics1=01&ics2=1 40&ics3=20&csnumber=53658 Pour suivre l actualité http://dossierdoc.typepad.com/descripteurs/ (S. Dalbin) http://francart.fr/ (T. Francart)