Comparaison des normes de thesaurus Présentation Prévoir des accès différents au vocabulaire en fonction des types d utilisateurs : - gestionnaire de langage (version complète avec note historique.) - indexeurs et chercheurs (version avec note d application, instruction d indexation, information sur l histoire des termes pour les spécialistes) - utilisateurs finals (liste simple de termes avec références et relations) Introduction : Indications proches dans le contenu. Se trouve dans des parties différentes de la norme 6.1 Auteur Contexte et objectifs Domaines couverts Nombre DE et ND Méthode d élaboration Signification des abréviations, choix typo Mode d emploi 10.7.2 Objet Domaines couverts Signification des conventions, abr. Nombre DE et ND Règles adoptées dans le choix des termes Règles de classement Sens des ponctuations non standard Politique de mise à jour et contacts Date d intro du dernier terme 9.5 Objet Domaine(s) couvert(s) La signification des conventions, abréviations, ponctuations utilisées dans un sens non standard Les choix établis dans la sélection des termes préférentiels La référence à la norme utilisée Les règles de classement employés Le nombre de termes La date de mise à jour Une description de la politique de mise à jour Un contact Les conventions ou options particulières de navigation en ligne 10.8 Objet Domaine(s) couvert(s) La signification des conventions, abréviations, ponctuations Nombre de termes Choix adoptés concernant la forme des descripteurs Contact Date des derniers changements Références bibliographiques Tous les points doivent être illustrés d exemples
Types de présentation permutée Thématique Hiérarchique Graphique Index alphabétique pour les présentations non alphabétiques Listes annexes (noms d organisations, géo, listes systématiques) La norme ne vise pas l exhaustivité : décrit 3 «méthodes de base» d un «usage courant» (en 1986!) avec NE et relations Systématique avec un index alphabétique Graphique avec un index alphabétique o Liste alphabétique o «Flat format» permutée Terme détaillé Hiérarchique : o multi-niveaux (2 types) o arbres o top terms (champs sémantiques) o «two-way» o «braoad categories display» o facettes Graphique (générées dynamiquement) Enregistrement simple Hiérarchique Thématique Graphique Permutée Alphabétique NA ou définition Synonymes TG TS TA Tous les termes, organisés dans une séquence alphabétique unique : ND : uniquement relation EP D : obligatoirement dans l ordre : NE EP MV (mots vedettes, optionnel) TG TS VA Optionnel : indiquer plusieurs niveaux de hiérarchie : TG1, TG2 ; TS1,TS2 ou présentation graphique décalée SN U UF BT NT RT Liste avec 1 niveau de hiérarchie CC Code de classification SN UF TT BT NT RT DEF HN
Alphabétique permutée Terme détaillé DE uniquement ou ensemble DE et ND Non mentionnée KWIC KWOC Ne comprend pas les équivalents? 9.2.1.1 et 2 L utilisateur devrait pouvoir sélectionner un terme et avoir accès à une vue détaillée de ce terme complète ou partielle. En web, un lien hypertexte devrait être établi du terme là où il apparaît et donner accès au détail de toutes les relations du termes. Il devrait permettre d appeler les notes historiques, notes d application ou définition séparément des relations sémantiques. Comprend les descripteurs et les non descripteurs KWIC KWOC Liste utile pour une édition papier, mais inutile dans un système informatisé qui permet de rechercher sur les chaînes de caractère. Exemple : Recherche Musique Sélectionner le contenu du terme o détail du terme o présentation hiérarchique
Présentation thématique Regroupement par domaine d intérêt Présentation systématique doit comprendre 2 parties : Catégories arrangées selon signification et relations logiques Index alphabétique qui renvoie sur la partie systématique Lien entre les 2 est assuré par un code de classement Présentation par sujets Présentation par facettes Présentation polyhiérarchique Présentation hiérarchique Descripteurs et leurs relations TG et TS. Visualisation des différents niveaux de la hiérarchie matérialisés par un décalage vers la droite ou une disposition en arbre Thésaurus systématique : NE EP TA Organisation en domaines ou en facettes ou approche combinée Relais virtuel Nombreuses possibilités :9.3.4 Hiérarchies multi niveaux Structure en arbre Structure de Top term Two-Way hierarchical structure (?) Catégories Facettes Présentation par indentation Présentation graphique Schéma à deux dimensions présenté sur des axes Schémas fléchés Structures arborescentes (DE) Schémas fléchés Les schémas doivent être accompagnés d index alphabétique (NE, TG-TS optionnel) Présentation graphique logiquement équivalente à une présentation en arbre. Des produits commerciaux permettent de réaliser des représentations graphiques. Il peut s agir de cartographie statique. Dans les systèmes en ligne des clusters sont générés en temps réel
Typographie Tri Non descripteur : caractère maigre ou italique Indicateur de relation : majuscule Descripteur : gras Recommandation : utiliser une lettre capitale pour la première lettre du terme puis bas de casse. Noms commerciaux, noms propres, sigles : capital Elimination des traits d union sauf s ils font partie des abréviations et noms de marques Les points concernant les apostrophes ne s appliquent pas en français Pour les signes diacritiques liés à des problèmes de translittération : à étudier avec les thesaurus multilingues. Précise que le tri doit se faire mot par mot et non lettre par lettre Pour le tri numérique :nécessité d un tri arithmétique pas toujours disponible dans les systèmes informatiques
Fonctions thesaurus en électronique Rien 9.4.2 : format à l écran interface utilisateur recherche par mots clés (tous les mots) visualiser l ensemble des informations sur un terme visualiser la hiérarchie pick lists 9.4.3 : format web utilisation des liens hypertextes pour naviguer dans la hiérarchie, d un terme à l autre, pour voir les définitions, notes 11.2.2 critères d évaluation d un thesaurus accessible électroniquement : hyperliens, index ou recherche par mots-clé, recherche (quels champs?) 11 Import/export entre le système de gestion du thesaurus et le système de recherche rechercher un mot ou une chaîne de caractère naviguer d un terme vers les termes reliés déployer ou réduire une hiérarchie. Pouvoir partir d une vue des premiers niveaux et déployer progressivement passer facilement de la partie alpha à la partie hiérarchique ou voir les deux en même temps Si le vocabulaire est intégré à la BDD : La recherche peut être lancée à partir des mots sélectionnés dans le thesaurus sans avoir à les ressaisir Pouvoir faire de l autopostage Pouvoir rechercher à partir d un non descripteur : choix donné à l utilisateur Faciliter la proposition de candidats descripteurs
Utilisation de l outil informatique pour la construction Rien Identification automatique des termes candidats à partir de textes informatisés Fréquence d utilisation d un terme à l indexation Limitations possibles dues aux outils (1986!) : nombre de caractères, ponctuation, niveaux de décalage dans la présentation Il ne faut pas (obligatoire!) qu on ait besoin d adapter le thesaurus au fonctionnement d une machine inadéquate. 11.1.3.4 Identification de termes candidats Fréquence d utilisation à l indexation Enregistrement des termes des questions 11.4 Le système devrait être suffisamment flexible pour permettre aux gestionnaires du vocabulaire de bénéficier des technologies émergentes. Le système doit avoir les fonctions de bases suivantes : édition ou la visualisation en capital ou en bas de case et prendre en compte tous les caractères nécessaires au vocabulaire concerné tris et sortis prévus en 9.2.5 Editer les présentations alphabétiques et hiérarchiques en fonction des types d utilisateurs Définir les champs autres que ceux énumérés dans l enregistrement des termes Gestion des termes sans limitation de longueur et en contrôlant les relations Permettre les suppressions en contrôlant les réciproques et en alertant sur la création de termes orphelins Gestion des candidats Identification des erreurs Permettre la recherche et la navigation de termes complets ou tronqués, d un ND vers DE, trouver les termes quelque soit la case, naviquer dans la hiérarchie, visualiser un terme et toutes ses relations Editer des états statistiques détaillés Problème de l import /export Nécessité de pouvoir exporter en plein texte et en XML (détail partie 5)