Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen

Dimension: px
Commencer à balayer dès la page:

Download "Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen"

Transcription

1 Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen A. Lagarde - C. Renaudineau mémoire soutenu le 09 Juin 2009 Mémoire de Master 1 en Informatique Faculté des Sciences et Techniques - Université de Nantes LINA - Laboratoire d Informatique de Nantes Atlantique (UMR CNRS 6241) Equipe Connaissances et Décision Partenaire institutionnel : EthnoDoc-AREXCPO (Association de Recherche et d EXpression pour la Culture POpulaire)

2 Table des matières I Recherche d information sémantique : fondements théoriques 7 1 Recherche d informations dans un fond documentaire Principe d un système de recherche d informations L indexation lexicale : un procédé d optimisation de SRI efficace Importance des meta-informations dans un SRI Indexation lexicale : définition et principes Un exemple d indexation lexicale : Lucène La recherche d informations syntaxique : un mécanisme limité la recherche d information syntaxique : un mécanisme s appuyant fortement sur l indexation lexicale Limites d une recherche d information syntaxique Une solution potentielle : recherche d informations sémantique Ontologies et recherches d informations sémantiques Les Ontologies : un moyen de structurer des concepts Thésaurus : un dictionnaire introduisant des relations inter-termes Ontologie : définition Les concepts : une vue sémantique d une entité Les gradients de prototypicalité : des outils pour pondérer les relations entre concepts, labels, instances et propriétés Le gradient de prototypicalité conceptuelle Composante expressionnelle du gpc Composante extensionelle du gpc Composante intentionelle du gpc Gradient de prototypicalité lexical Exemple concret de la puissance d une recherche sémantique comparée à une recherche syntaxique Principe de la recherche d informations syntaxique (sans ontologie)

3 2.3.2 Principe de la recherche d informations à l aide de la plateforme Ethnosiris (avec ontologie) Etat de l art : formats d ontologie, ontologies célèbres et moteurs de recherche sémantique Formats d ontologie, logiciels d édition et ontologies célèbres Démonstration de la puissance des ontologies Les moteurs de recherche sémantiques actuels II Présentation du cadre applicatif du projet Ethnosiris 28 4 L association Arexpo et son fond documentaire L association AREXCPO L association EthnoDoc Mission de l association : collecte d informations relatives au patrimoine Vendéen La base de données EthnoDoc : un fond documentaire annoté et indéxé Travail effectué sur la base de données Ontologie fournie : OnthnoPhoto 32 III Contribution au projet : Ethnosiris, un moteur de recherche sémantique 34 6 Spécifications du moteur de recherche sémantique Attentes et contraintes sur le moteur Cas d utilisation d une recherche sémantique Le nuage de mots clés : un outil adapté aux focus Trois échelles de focalisation Focus sur le fond documentaire indépendemment de toute recherche Focus sur le fond documentaire vis-à-vis d une recherche Focus sur une ressource par rapport à une recherche Prémices au développement : choix du langage et de la structure générale du moteur de recherche Le choix d un langage portable et robuste Mise au point d une structure modulaire et réutilisable L implémentation de l ontologie Principaux choix d implémentation Les classes concepts, labels et instance

4 8.1.2 La classe Ontogie : opérations de parcours en temps minimal Optimisations nécessaires au fonctionnement de l ontologie sur un serveur PhP Implémentations des différentes recherches La recherche syntaxique Le gestionnaire de mots clés La pertinence syntaxique L afficheur La recherche sémantique La pertinence sémantique L afficheur Affineur de recherche Implémentation des Nuages Tags 52 4

5 Introduction L objectif de ce document est de présenter les différentes théories et procédés qui ont permis l implémentation d un moteur de recherche sémantique basé sur un fond documentaire (EthnoDoc) et sur une ontologie (OnthoPhoto). Ce moteur de recherche constitue un des éléments principaux de la plateforme Ethnosiris, plateforme dont le but est de permettre une recherche sémantique sur un corpus de documents indexés lexicalement. Cette plateforme devra pouvoir être intégrée à n importe quel corpus indexé ; elle devra par conséquent être multilingue, multi-dialecte et polygraphe (plusieurs alphabets). De plus, elle présentera des sessions d interactions identiques à un moteur de recherche d informations traditionnel (via champs de saisie de mots-clés), les seules différences avec ce dernier étant relatives à la pertinence des résultats fournis et aux comportements face à différents cas critiques. L acquisition et la représentation d informations par un système informatique ont toujours fait partie des problématiques fondamentales, non seulement dans la recherche informatique, mais également dans toute recherche relative à la sémiotique (étude du sens des choses) ou à la psychologie cognitive (centrée sur la mémoire, l apprentissage et le raisonnement). En 1968, un informaticien et un psychologue (Collin et Quillian), ont cherché à définir une représentation des informations stockées dans nos mémoires. A force d expériences basées sur le temps de réponse à des affirmations du style un chien est un animal et un chien est un mammifère, ils ont réussi à construire un modèle hiérarchique de catégories. Cette hiérarchisation de concepts est la base du modèle ontologique. Dans une première partie, nous présenterons les fondements et caractéristiques d un moteur de recherche d informations, puis nous enrichirons la notion d ontologie en présentant les ontologies pragmatisées [1], i.e des ontologies prenant en compte l aspect subjectif de la représentation de connaissances. Nous effectuerons également un bref état de l art des ontologies et de leur application dans le cadre d un système de recherche d informations sémantique. Dans un second temps, nous décrirons le cadre applicatif du projet Ethnosiris, en présentant les partenaires du projet, puis en détaillant le fond documentaire utilisé et l ontologie fournie. Nous reviendrons enfin sur notre contribution au projet Ethnosiris, en décrivant premièrement le 5

6 travail de spécification que nous avons effectué. En particulier, on veillera à la généricité (incluant des aspects polylingues et polygraphes), la portabilité (doit fonctionner sur tout type de serveur, fond et ontologie) et la complexité de l implémentation du moteur de recherche Ethnosiris. Nous discuterons finalement des principaux choix d implémentation effectués. Sans les citer formellement, nous nous sommes appuyé sur les travaux de l équipe de recherche COD (COnnaisance et Décision) [5, 2, 7, 3]. 6

7 Première partie Recherche d information sémantique : fondements théoriques 7

8 Chapitre 1 Recherche d informations dans un fond documentaire 1.1 Principe d un système de recherche d informations La recherche d informations occupe une place centrale dans l activité de n importe quel individu, qu il s agisse d une recherche documentaire dans une bibliothèque, d une recherche de produits dans un supermarché ou de la recherche de pages Web sur Internet. Dans tous ces cas, le cerveau humain effectue un travail en deux temps : 1. Premièrement, il qualifie la recherche (collection de livres, boîte de ravioli ou site Internet) à partir d une liste de caractéristiques (titre, catégorie et édition du livre,type du produit...). 2. Deuxièmement, il retourne les ressources les plus pertinentes pour la recherche fournie : par exemple, on se souvient de deux boîtes de ravioli achetées il y a plusieurs mois, et pour chacune d elles l endroit où la trouver (emplacement de la ressource). Ce travail effectué par notre cerveau constitue la base d un système de recherche d informations (SRI) : son rôle sera de comprendre la recherche, puis de fournir les ressources qu il pense être en relation avec ce qui lui est demandé. En se basant sur ces postulats, il est possible de déduire deux propriétés fondamentales d un SRI : 1. La mémoire : pour pouvoir identifier les ressources concernées par la recherche, le SRI devra se souvenir des caractéristiques (métadonnées) de chacune d entre elles. 2. La capacité de raisonnement : afin d évaluer la pertinence d une ressource par rapport à une recherche, le SRI devra suivre un raisonnement, guidé par différents critères. Il ne faut pas confondre moteur de recherche et SRI : en effet, bien que le moteur de recherche constitue le coeur d un SRI, il n en est qu un composant : un SRI peut également être muni de : 8

9 - fonctions d acquisition, qui lui permettront d ajouter des documents à sa mémoire. - fonctions d annotation, chargées de gérer les caractéristiques (meta-informations) des documents ajoutés. Ces fonctions doivent permettre la modification de ces meta-informations, et peuvent proposer différents moyens d accès, notamment leur indexation. - fonctions heuristiques, dont le rôle est de guider la recherche selon différents critères. Bien que le travail que nous ayons fourni ne concerne que l aspect moteur de recherche, nous nous appuyons bien évidemment sur ces différentes fonctions. Il convient donc de revenir sur certains mécanismes fondamentaux d un SRI, et en particulier le procédé d indexation lexicale. 1.2 L indexation lexicale : un procédé d optimisation de SRI efficace Importance des meta-informations dans un SRI Lorsque vous saisissez un terme dans un moteur de recherche classique (et ce fait est encore plus vrai pour un SRI de type sémantique), vous fournissez au système au moins une caractéristique qualifiant votre recherche. Cette caractéristique peut être de nature diverse : en effet, elle peut concerner le contenu textuel du document (titre, mots clés...), sa nature (type de fichier, organisation du document) ou aborder des notions plus abstraites comme les thèmes abordés ou encore sa localisation dans l espace ou le temps. Nous voyons clairement que le système doit au préalable avoir effectué un apprentissage, qui lui aura permis d établir des liaisons (caractéristique - document) ; cet apprentissage n est ni plus ni moins que la phase d indexation. La phase de recherche d informations peut être alors assimilée à un processus de reconnaissance de caractéristiques. Comme le dit Platon, La connaissance des mots conduit à la connaissance des choses. D une manière analogue, la connaissance des meta-informations d un document conduit à la connaissance du document lui-même. Réciproquement, un système de recherche d information ne peut donner de réponses pertinentes que si l index sur lequel il va se fonder a reçu un apprentissage suffisant. Le choix des critères à intégrer lors de l acquisition d un nouveau document est donc primordial, et constitue l un des travaux essentiels d un bon SRI. 9

10 1.2.2 Indexation lexicale : définition et principes Indexation - identification de l information contenue dans tout texte et représentation au moyen d un ensemble d entités (appelé index) pour faciliter la comparaison entre une recherche et la représentation d un document - transfert de l information contenue dans le texte vers un autre espace de représentation traitable par un système informatique. Autrement dit, un index peut être assimilé à une fonction f : D - M, où D est l ensemble des documents et M l ensemble des descripteurs. On dit qu un document DOC traite un thème identifié par un ensemble de descripteurs D si d D : d f(doc). On dit que les descripteurs d un Thème T décrivent un document DOC si t descripeurs(t) : d f 1 (DOC). Ces descripteurs peuvent être de différentes natures : - les mots simples du texte (hors mots vides, mots outils comme les articles ou les pronoms, etc...) ; - les groupes de mots du texte (à valeur sémantique plus forte que les mots simples). Par exemple, le groupe de mots danse traditionnelle vendéenne aura plus de valeurs que ces trois mots pris séparemment. - les radicaux des mots extraits, exemple : équins et équidés ont la même racine. On se base alors sur l étymologie pour regrouper des mots, ce qui permet d optimiser la taille de l index, mais qui peut se révéler faux : par exemple, les mots solstice et soleil ont le même radical mais désigne pourtant des notions différentes ; - des concepts définis par l utilisateur à partir d un vocabulaire organisé, d un thésaurus... - des N-grammes, suite de n caractères consécutifs ; - les contextes : termes n apparaissant pas explicitement dans le texte du document mais ayant un lien sémantique et/ou de co-occurence avec les mots du texte. Par exemple, si le mot hibou n est pas dans le document considéré mais, que dans d autres documents, il apparaît très souvent à côté du mot chouette, on considérera qu il existe une relation de co-occurence entre les mots hibou et chouette. - les mots simples hors mots vides (pronoms et déterminants) ; cette indexation favorise la précision 1 de la recherche (on est alors certain que les documents trouvés contiennent bien les termes présents dans la requête), mais engendre un index de taille volumineuse, et peut entrainer le rejet de certains documents pourtant en rapport avec la recherche. Par exemple, on lance une recherche sur le descripteur caniches. Avec ce type d indexation, tous les documents contenant ce mot au 1. Rapport du nombre de textes reconnus et contenant réellement le terme de la requête par le nombre de textes contenant un terme différent mais identifié comme contenant celui demandé dans la requête. 10

11 singulier uniquement ne seront pas retournés par la recherche. - les radicaux, afin de tenir compte des variations morphologiques (i.e variation du genre, du temps, de la personne ou du pluriel d un mot). Par exemple, adolescence et adolescents seront ramenés au radical adolesc. Cette méthode offre une amélioration du rappel 2 et nécessite un index de taille plus faible que pour le cas précédent. Cependant, cette technique d indexation peut provoquer une baisse de la précision de la recherche (mise en rapport des termes canif et caniche car il est très difficile de savoir que l un n est pas une variation morphologique de l autre). - les lemmes, indexation plus fine et concentrée sur les variations flexionnelles mais qui demande une opération préalable de traitement linguistique des textes ; cette méthode offre une augmentation du rappel et une baisse de la précision. Établir un index sur un corpus de documents consiste donc à attribuer à chacun des documents des descripteurs (i.e objets décrivant, caractérisant, un document à partir de son contenu). Le rôle d un index est par conséquent double, à savoir rôle de résumé (qualifier le document) et rôle d outil de recherche d information (accès à ce document à partir de son index, pendant la recherche lexicale). De part les multiples techniques d indexation présentées dans cette section, on voit bien l importance du choix de l une d entre elles, et des répercussions que ce choix peut avoir, non seulement en terme de qualité de la recherche (rappel et précision), mais également en terme de performances (taille de l index et rapidité de la recherche) Un exemple d indexation lexicale : Lucène Lucène est un moteur d indexation et de recherche lexicale libre 3. Cette API réalise une indexation à partir des radicaux (cf section 1.2.2), en supprimant au préalable les mots vides au moyen soit d un analyseur standard, soit d un analyseur propre à une langue. Toutes les chaînes de caractères sont dans un premier temps converties en minuscules. Les mots sont ensuite filtrés de manière à supprimer tous ceux qui ne sont pas particulièrement porteurs de sens (par défaut une liste propre à chaque langue est utilisée, liste ouverte et donc modifiable). Pour terminer, seules les racines sont retenues pour l indexation. On notera des performances très intéressantes : environ 4 minutes pour indexer un thésaurus de 3Mo(WordNet : http ://wordnet.princeton.edu). 2. Rapport du nombre de textes reconnus et contenant réellement le terme de la requête par le nombre de textes contenant ce terme mais non cités dans la réponse. 3. Site internet : http : //lucene.apache.org/ 11

12 1.3 La recherche d informations syntaxique : un mécanisme limité la recherche d information syntaxique : un mécanisme s appuyant fortement sur l indexation lexicale Le façon la plus courante d implémenter une recherche d information syntaxique est d effectuer une indexation sur les documents, puis de lancer une recherche lexicale sur cette index. On pourra notamment citer les moteurs de recherche Google et Yahoo, qui fonctionnent en deux temps : 1. Lors de la détection d un nouveau site (via des robots parcourant le Web) : Qualification du site à partir d une heuristique d indexation : on créé les descripteurs du site à partir de son adresse Internet et de son contenu, en pondérant chaque mot par son ocurrence sur le site et le type de balise dans lequel il apparaît (balise titre ou simple paragraphe). On incorpore également des méta-informations sur le site (langue(s) utilisée(s), site commercial ou non...). Ajout de ces descripteurs à l index du moteur de recherche. 2. Lors du lancement d une recherche A partir d une heuristique de parcours de l index, sélection des descripteurs correspondant aux critères de la recherche. A partir de ces descripteurs, obtention des documents concernés. Affichage de ces documents, triés selon le nombre de descripteurs satisfaisant la recherche. On voit ici que l indexation lexicale est au centre de toute recherche d informations syntaxique. Nous allons maintenant mettre en évidence les limites d un tel mécanisme Limites d une recherche d information syntaxique Par définition, le mécanisme d indexation lexicale ne prend pas en compte le sens des mots indexés : on considère ici un mot comme une suite de caractères. Or un mot est bien plus que cela : il possède de nombreuses relations avec d autres mots : synonymie, antinomie... Au delà de ces relations, un mot désigne souvent une entité physique du monde, cette entité ayant elle-même des relations avec d autres entitiés, et d autres mots. Prenons un exemple pour illustrer cette pauvreté : sur le moteur de recherche Google, je lance une recherche sur le mot teckel. Admettons qu aucun des documents indexés ne possède le descripteur associé à ce mot. Aucun résultat ne m est donc proposé. Cependant, le mot teckel de la langue française désigne un animal appartenant à la famille des canidés. Si l on avait fait une demande de livre associé au sujet teckel dans une bibliothèque, un documentaliste consciencieux, après avoir constaté qu il n avait aucun livre sur ce sujet précis, nous aurait proposé différents livres traitant des sujets voisins, c est à dire des livres parlant de canidés. Une recherche d information syntaxique basé sur une indexation lexicale ne permet pas d établir des liens entre différents descripteurs. Elle ne permettra donc pas d effectuer des opérations pourtant 12

13 utiles sur les documents retournés, telles que la proposition de documents similiaires si aucun résulat n est trouvé, ou la sélection de document plus représentatifs que d autres (sur des critères autre que le nombre d occurence d un mot). Or, comme le dit Bouddha, Meilleur que mille mots privés de sens est un seul mot raisonnable. Il convient donc de s interroger sur la possibilité de munir notre recherche, en plus d un index lexical, d une structure qui permettra de définir des relations entre les descripteurs Une solution potentielle : recherche d informations sémantique A partir du constat effectué dans la partie précédente, il convient de s interroger sur la possiblité de définir un nouveau type de recherche d informations qui, au lieu de se baser uniquement sur l indexation lexicale (un mot est alors une simple chaîne de caractères) prendrait en compte le sens des mots. Intuitivement, on perçoit la nécessité d utiliser une nouvelle structure, qui définirait des relations entre les mots-clés : par exemple, les mots chien et chat, bien que différents, désignent tous les deux des animaux domestiques. La question est de savoir comment organiser ces relations : en effet, elles peuvent être de nature très différentes (synonymie, appartenance à une même famille...), et on a vu dans les parties précédentes qu elles doivent être indexées pour permettre une recherche rapide et efficace. Dans le chapitre suivant, nous essayerons de définir une telle structure, en utilisant à la fois des normes et conventions informatiques et des travaux relatifs à la psychologie humaine, pour que le sens que l ontologie donne aux mots s approche le plus possible de celui que lui donnerait un être pensant. 13

14 Chapitre 2 Ontologies et recherches d informations sémantiques 2.1 Les Ontologies : un moyen de structurer des concepts Présentons premièrement la structure qui rendra possible la recherche sémantique : l ontologie. Avant de définir précisemment ce qu est une ontologie, on reviendra sur la notion de thésaurus, qui constitue un bon point de départ pour notre analyse Thésaurus : un dictionnaire introduisant des relations inter-termes Un thésaurus est un répertoire de termes normalisés pour l analyse de contenu et le classement de documentation dans un domaine 1. Cette définition aborde plusieurs notions fondamentales : premièrement, un thésaurus est donc une liste de termes relatifs à un domaine de connaissances particulier. Deuxièmement, la notion de classement est très importante : un thésaurus va définir des relations de type linguistique entre les termes de son dictionnaire, comme par exemple la synonymie, l antonymie, etc. C est un premier pas vers notre objectif, à savoir représenter le sens des mots : grâce au thésaurus, on est capable de dire si deux mots représentent la même idée. Quels sont les avantages concrets d un Thésaurus par rapport à un simple index? apport pour chaque terme d une liste de synonymes permettant une première possibilité d extension des requêtes ; offre d enrichissement du vocabulaire initial ; existence d un format d écriture standardisé : Simple Knowledge Organisation System11 (SKOS) 2 ; 1. Petit Robert, dictionnaire de la langue française 2. Site internet : http : //www.w3.org/2004/02/skos/ 14

15 outil ouvert, les utilisateurs peuvent compléter cette base par l apport de nouveaux termes ; aspect multilingue du vocabulaire. Un recherche d information basée sur un Thésaurus permettra notamment d élargir le champ de recherche : par exemple, si il est établi que les mots chien et toutou sont synonymes, alors si le parcours de l index lexical sur le mot toutou ne renvoie aucun résultat, on sera capable de lancer une recherche sur le mot chien et, peut-être, de trouver des documents, ce qu une recherche d information syntaxique n aurait pas permis. La création du thésaurus en lui-même ainsi que l implémentation d une recherche basée sur ce thésaurus sont de plus grandement facilitées par l existence du format SKOS : ce langage, standardisé par l organisme W3C, a notamment l avantage d être fondé sur RDF, langage lui aussi standardisé, pour lequel il existe des outils de traitement déjà existants tels que Jena (ensemble d outils de traitement de fichiers RDF en Java) 3,. Selon le langage SKOS (SKOS Core), un thésaurus est considéré comme un schéma de ressources RDF dotées d un Uniform Resource Identier (URI, identifiant unique) spécifique, avec pour chacune d elles : au plus un terme préférentiel par langue ; des définitions et notes relatives à ce terme ; des concepts reliés de façon hiérarchique par des relations générique-spécifique, ou par des relations associatives (non hiérarchiques) ; des représentations symboliques du terme (images). Plusieurs thésaurus ont été développés sous ce format, comme AGROVOC (terminologie à vocation agricole et environnementale) 4, GEMET (GEneral Multilingual Environmental Thesaurus, un thésaurus à dominante environnementale) 5 ou encore MESH (Medical Subject Heading, terminologie médicale bilingue français / anglais) Site internet : http : //jena.sourceforge.net 4. Site internet : http : //www.fao.org/aims/ag intro.htm 5. Site internet : http : //www.eionet.europa.eu/gemet/index h tml 6. Site internet : http : //ist.inserm.fr/basismesh/mesh.html 15

16 Figure 2.1 Exemple d interrogation du thésaurus GEMET Ontologie : définition En philosophie, on définit l ontologie (du grec ontos, participe présent du verbe être) comme étant l étude de l être en tant qu être, c est-à-dire l étude des propriétés générales de ce qui existe. En s inspirant de cette définition, essayons de définir une ontologie en informatique. Ontologie - In theory, an ontology is a formal, explicit specification of a shared conceptualisation [4] - arboresence/treillis dont les noeuds/sommets correspondent à des concepts et les arêtes à des relations de type is a - théorie qui tente d expliquer les concepts qui existent dans le monde et comment ces concepts s imbriquent et s organisent. 7. Il s agit d une définition répandue de la notion d ontologie. Dans le cadre de notre projet, l équipe a enrichi cette notion : en enrichissant la notion de concept (voir partie suivante) ; en pondérant les relations is a : intuitivement, on saisit l intérêt d une telle démarche. En effet, il est logique de dire que, pour un individu français, le concept labrador est plus représentatif du concept chien que le concept Aïdi (chien originaire de l Atlas marocain). Le principal changement entre cette ontologie enrichie et la précédente est le fait qu elle est liée à un corpus de documents jugés représentatifs, à partir duquel on va calculer la pondération des liens is a et différents autres paramètres, que nous appelerons gradients (voir parties suivantes). Revenons premièrement sur la notion de concept. 16

17 Figure 2.2 Exemple d ontologie : hiérarchie des concepts issue du concept animal Les concepts : une vue sémantique d une entité Afin que les concepts de notre ontologie s approchent le plus possible de la façon dont un être pensant appréhende les entitiés qui l entourent, l équipe s est basée sur les études de sémiotique (théorie du sens) du scientifique/philosophe Charles Sanders Peirce. Ces études montrent que l être humain a trois façons de représenter un concept : point de vue intentionnel : on définit un concept par rapport à ses propriétés. Par exemple, on définira le concept feu comme étant quelque chose qui brûle et qui fait de la fumée. point de vue extensionnel : on définit un concept par rapport à des instances représentatives de ce concept. Par exemple, on définira le concept éléphant à l aide des instances Dumbo, Babar, ou l éléphant que l on a observé lors de notre dernière visite au zoo. point de vue expressionnel : on définit un concept par rapport à son champ lexical (mots le représentant) ou des symboles. Par exemple, les mots chien, toutou et clébard pour le concept chien, où une icône de flamme pour le concept feu. 17

18 Figure 2.3 Triangle de Peirce : les trois représentations du concept chat. Un être humain utilise ces trois points de vue pour définir un concept, se positionnant ainsi dans le triangle de Peirce. Selon que l on ait une connaissance approfondie d un domaine ou non, on se positionne plus au moins près des côtés du triangle. Par exemple, un zoologue définira l éléphant comme un pachyderme herbivore de poids important (point de vue intentionnel), alors qu un néophyte se référera à des instances d éléphants (point de vue extensionnel). A partir de ces études, on munit chaque concept d un moyen de représenter l aspect : intentionnel : un vecteur caractéristique de propriétés : pour toutes les propriétés définies dans l ontologie (peut voler, peut flotter...), on définit une valeur réelle comprise entre 0 et 1 représentant l importance de cette propriété pour définir ce concept. extensionnel : une liste d instances pondérées par la représentativité de chacune d elle pour ce concept. expressionnel : une liste de mots (simples chaînes de caractères) représentant tous les synonymes (labels) utilisés pour décrire ce concept. Là encore, on pondère chaque label en fonction de la manière dont il définit ce concept. On prend ainsi en compte les trois sommets du triangle de Peirce. Il va maintenant falloir définir un moyen de pondérer chacune des informations stockées. Pour ce faire, notre équipe a pris comme critère la prototypicalité d un élément par rapport à un autre, c est à dire sa capacité à résumer/représenter/définir l élément considéré. Comme nous l avons vu, cette notion dépend de chaque individu (culture, niveau de connaissance du domaine...). Nos ontologies ne porteront donc pas uniquement une vision sémantique de la connaissance, mais tiendront également compte de son côté subjectif et de sa dépendance à la culture, aux émotions et à 18

19 l éducation des individus qui en sont porteurs. Cette composante est des plus sensible lors de la phase de modélisation, de construction de l ontologie, plus précisément dans le choix des catégories et dans l élaboration des différentes hiérarchies. Le processus de décision d appartenance d un élément à une catégorie pour un individu donné se réalise en fonction d au moins deux éléments fortement subjectifs : le degré de prototypicalité d une part, et le niveau d abstraction d autre part. Ces points se mettent en place progressivement au fur et à mesure de l apprentissage de l agent humain dès l âge de six mois suivant certains spécialistes. 8 En se basant sur cette étude, on dira qu un élément est jugé typique s il représente un bon exemple de la catégorie, selon des critères propres à la culture, à l éducation et aux émotions de l individu. En reprenant un exemple précédent, pour le français moyen, la prototypicalité du concept labrador pour le concept chien sera beaucoup plus grande que la prototypicalité du concept aïdi pour le concept chien. Cherchons maintenant à quantifier précisemment ces relations de prototypicalité en créant une unité de mesure : les gradients de prototypicalité. 2.2 Les gradients de prototypicalité : des outils pour pondérer les relations entre concepts, labels, instances et propriétés L objectif des gradients est de pouvoir non seulement classer les résultats d une recherche par ordre de pertinence, mais également de les quantifier en fonction de leur valeurs. C est dans cet esprit que l équipe a développé différentes mesures, la première étant le gradient de prototypicalité conceptuelle(gpc). Les formules utilisées pour déterminier les gradients étant complexes et s appuyant sur plusieurs théories, nous nous contenterons ici de les exposer sans les justifier. La justification des formules est proposée dans les publications Gradients de prototypicalité appliqués à la personnalisation d ontologies [6] et Semiotic-based Prototypicality Gradient [8] Le gradient de prototypicalité conceptuelle Ce gradient est défini pour un concept père (C p ) et un concept fils(c f ), et sa valeur (entre 0 et 1) sera d autant plus grande que C f est typique pour C p. gpc(c p, C f ) = (α intensionnel(c p, C f ) + β extensionnel(c p, C f ) + γ expressionnel(c p, C f )) δ α, β et γ sont des coefficients réels représentant l importance de chaque approche pour apréhender un concept (α sera très élevé pour un spécialiste, β sera d autant plus fort que le sujet ne connait pas 8. Françoise Cordier. Les représentations cognitives privilégiées, typicalité et niveau de base. Presses Universitaires de Lille,

20 le domaine sur lequel porte l ontologie...). δ est la composante émotionelle. Découverte par des études en psychologie cognitive, cette composante s appuie sur le principe que plus on est stressé, plus on veut un résultat proche de notre recherche. En revanche, lorsque l on est détendu (positif), on accepte plus volontiers des concepts peu prototypiques (ouverture d esprit). On pourra imaginer divers moyens de calculer la composante émotionnelle d un utilisateur,tels la rapidité de déplacement de la souris sur la page, l analyse des messages postés par cet utilisateur, le nombre de clics par minute... On voit que le calcul du gpc fait appel à trois autres composantes : commençons par la composante expressionnelle, en définissant son moyen de calcul Composante expressionnelle du gpc L objectif de cette composante est de dire que tous les synonymes d un terme n ont pas forcément le même poids. Afin de déterminer dans quelle proportion le sous-concept représente le concept, on cherche à définir les relations entre leur termes : avec : expressionnel(c p, C f ) = pregnance(c f ) pregnance(c p) pregnance(c) = t lexique(c) count p(t) N t NbDoc(t) T otalnbdoc Cette formule pour calculer la prégnance permet d éviter, en prenant en compte la granularité, les effets de Buzz 9, qui polluerait l ontologie. Notre équipe travaille actuellement sur un moyen d intégrer le temps à cette formule : ainsi, si l on parle beaucoup de quelque chose mais pendant peu de temps, notre ontologie le détectera et minimisera le nombre d occurences du mot Composante extensionelle du gpc L objectif de ce gradient est de comparer les instances du concept fils à celles du concept père, toujours dans l optique de déterminer à quel point C f est typique de C p. extensionnel(c p, C f ) = NombreInstances(C f ) NombreInstances(C p). 9. Fait de parler énormément d un terme, mais dans peu de documents. Très courant sur le Web (Suzan Boyle...) 20

Web sémantique, données libres et liées, UNT

Web sémantique, données libres et liées, UNT Web sémantique, données libres et liées, UNT Yolaine Bourda September 20, 2012 Web sémantique De nombreux documents sont présents sur le Web. Pourtant il est parfois difficile d avoir des réponses à des

Plus en détail

12.2.5. La Banque de données santé publique (BDSP)

12.2.5. La Banque de données santé publique (BDSP) 12. Approfondir ses connaissances autour d un sujet droit ou qu un accord avec l éditeur autorise les gestionnaires de la base à pointer vers le document original. Les bases de données bibliographiques

Plus en détail

Gestion de données complexes

Gestion de données complexes Master 2 Informatique Spécialité AIGLE Gestion de données complexes Amayas ABBOUTE Gilles ENTRINGER SOMMAIRE Sommaire i 1 - Introduction 1 2 - Technologies utilisées 2 2.1 API Jena........................................

Plus en détail

Enrichissement sémantique de requêtes au moyen d ontologies de domaine personnalisées.

Enrichissement sémantique de requêtes au moyen d ontologies de domaine personnalisées. Enrichissement sémantique de requêtes au moyen d ontologies de domaine personnalisées. Xavier Aimé, Frédéric Fürst, Pascale Kuntz, Francky Trichet LINA - Laboratoire d Informatique de Nantes Atlantique

Plus en détail

Introduction pratique au Développement orienté Modèle Pierre Parrend, Mars 2005

Introduction pratique au Développement orienté Modèle Pierre Parrend, Mars 2005 MDA : Un Tutoriel Introduction pratique au Développement orienté Modèle Pierre Parrend, Mars 2005 1 Sommaire Table des matières 1 Sommaire 1 2 Introduction 2 2.1 A qui s adresse ce tutoriel......................

Plus en détail

Aléthiomètre. Bur Jean Cham Rémi Roulette Lucas Encadrant : Tisserant Guillaume

Aléthiomètre. Bur Jean Cham Rémi Roulette Lucas Encadrant : Tisserant Guillaume Aléthiomètre Bur Jean Cham Rémi Roulette Lucas Encadrant : Tisserant Guillaume Projet réalisé dans le cadre de l unité d enseignement HLIN601 Licence informatique 3ème année Faculté des sciences Université

Plus en détail

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION Séquence Lettres / Documentation / TICE Classe de 6è et club journal Collège Gabrielle Colette Puget sur Argens Académie de Nice Roxane Obadia CONSTAT INITIAL

Plus en détail

Indexation et interrogation de photos de presse décrites en MPEG-7

Indexation et interrogation de photos de presse décrites en MPEG-7 Indexation et interrogation de photos de presse décrites en MPEG-7 Emmanuel Bruno Jacques Le Maitre Elisabeth Murisasco Laboratoire SIS, Equipe Informatique Université de Toulon et du Var Bâtiment R, BP

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

Création d un catalogue en ligne

Création d un catalogue en ligne 5 Création d un catalogue en ligne Au sommaire de ce chapitre Fonctionnement théorique Définition de jeux d enregistrements Insertion de contenu dynamique Aperçu des données Finalisation de la page de

Plus en détail

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Problématiques de recherche. Figure Research Agenda for service-oriented computing Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements

Plus en détail

Des traitements aux ressources linguistiques : le rôle d une architecture linguistique

Des traitements aux ressources linguistiques : le rôle d une architecture linguistique Des traitements aux ressources : le rôle d une architecture Frederik Cailliau Villetaneuse, le 9 décembre 2010 Sous la direction d Adeline Nazarenko 1. 2. 3. 4. 5. 6. 2 Sinequa Cifre à Sinequa Recherche

Plus en détail

Recherche bibliographique

Recherche bibliographique Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique

Plus en détail

Présentation générale du projet data.bnf.fr

Présentation générale du projet data.bnf.fr Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL Prise en main de NVU et Notepad++ (conception d application web avec PHP et MySql) Propriétés Intitulé long Formation concernée Matière Présentation Description Conception de pages web dynamiques à l aide

Plus en détail

Les typologies d information que le moteur est en mesure de rechercher sont :

Les typologies d information que le moteur est en mesure de rechercher sont : AIDE SUR LA BIBLIOTHEQUE VIRTUELLE Le système de recherche de la bibliothèque virtuelle permet l accès rapide aux informations qui intéressent les étudiants et qui sont disponibles dans le cyberespace

Plus en détail

LE TRAITEMENT DE TEXTE

LE TRAITEMENT DE TEXTE LE TRAITEMENT DE TEXTE A partir de la version 5 de spaiectacle, le traitement de texte est totalement intégré à l application. Au-delà de la simplification quant à la manipulation de ce module, c est également

Plus en détail

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e : CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i

Plus en détail

send2area - Guide d'utilisation

send2area - Guide d'utilisation send2area - Guide d'utilisation Version V1R0 du 07/06/2011 Auteur : send2area Copyright 2011 - send2area Historique du document Version Date Objet Auteur V0R1 03/06/2011 Version initiale draft document

Plus en détail

Installer Joomla. 2013 Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring

Installer Joomla. 2013 Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring 3 Installer Joomla Dans ce chapitre, nous procéderons au téléchargement et à l installation manuelle de Joomla, et nous expliquerons la configuration de base. Les captures d écran et les instructions font

Plus en détail

Service combinators for farming virtual machines

Service combinators for farming virtual machines Master d Informatique Fondamentale École Normale Supérieure de Lyon Sémantique du parallélisme Chantal Keller Service combinators for farming virtual machines K. Bhargavan, A. D. Gordon, I. Narasamdya

Plus en détail

Conception et Développement d un Système Automatique d Ecriture Amazighe: Etat d Avancement et Perspectives

Conception et Développement d un Système Automatique d Ecriture Amazighe: Etat d Avancement et Perspectives Conception et Développement d un Système Automatique d Ecriture Amazighe: Etat d Avancement et Perspectives Y. Es Saady, B. Bakkass, A. Rachidi, M. El Yassa, D. Mammass Laboratoire IRF-SIC, Université

Plus en détail

ACCESS 2013. Système de Gestion de Bases de Données Relationnelles

ACCESS 2013. Système de Gestion de Bases de Données Relationnelles Access est un logiciel permettant de gérer des données en masse : une liste de clients ou de fournisseurs, un stock de produits, des commandes, des salariés, un club de tennis, une cave à vin, une bibliothèque,

Plus en détail

P. 1. Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique

P. 1. Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique P. 1 Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique Début des années 1990 L Inist-CNRS va contribuer à l alimentation du premier corpus de la

Plus en détail

Sage 100 CRM Guide de l Analyseur de Logs Intégration de Sage 100 CRM Version 8

Sage 100 CRM Guide de l Analyseur de Logs Intégration de Sage 100 CRM Version 8 Sage 100 CRM Guide de l Analyseur de Logs Intégration de Sage 100 CRM Version 8 Mise à jour : 2015 version 8 Composition du progiciel Votre progiciel est composé d un boîtier de rangement comprenant :

Plus en détail

Les technologies documentaires adhoc intégrées au sein des services SharePoint pour Windows.

Les technologies documentaires adhoc intégrées au sein des services SharePoint pour Windows. Les technologies documentaires adhoc intégrées au sein des services SharePoint pour Windows. Les services «Microsoft SharePoint» offrent aux utilisateurs Windows un ensemble de fonctions de stockage de

Plus en détail

Stage New Delhi octobre 2012

Stage New Delhi octobre 2012 Stage New Delhi octobre 2012 «L école du socle : donner du sens et des contenus à la continuité pédagogique» Enseignement de la langue française École : BO n 3-19 juin 2008 / BO n 1 du 5 janvier 2012 programmes

Plus en détail

Ensemble d informations codées au sein d un système de manière à permettre leur conservation et leur rappel MÉMOIRE(S) Mémoire à Court Terme MCT

Ensemble d informations codées au sein d un système de manière à permettre leur conservation et leur rappel MÉMOIRE(S) Mémoire à Court Terme MCT Ensemble d informations codées au sein d un système de manière à permettre leur conservation et leur rappel Capacité à se rappeler ou à reconnaître une expérience antérieure MÉMOIRE(S) Mémoire (Sensorielle)

Plus en détail

Analyse abstraite de missions sous PILOT

Analyse abstraite de missions sous PILOT Analyse abstraite de missions sous PILOT Damien Massé EA 3883, Université de Bretagne Occidentale, Brest damien.masse@univ-brest.fr Résumé Nous étudions la possibilité de réaliser un analyseur par interprétation

Plus en détail

Aide à la consultation de l archive numérique des Papiers de travail de Michel Foucault. 22 juillet 2015

Aide à la consultation de l archive numérique des Papiers de travail de Michel Foucault. 22 juillet 2015 Aide à la consultation de l archive numérique des Papiers de travail de Michel Foucault 22 juillet 2015 1 1 Caractéristiques de l instrument de recherche 1.1 Structure de l archive numérique L archive

Plus en détail

Les principaux domaines de l informatique

Les principaux domaines de l informatique Les principaux domaines de l informatique... abordés dans le cadre de ce cours: La Programmation Les Systèmes d Exploitation Les Systèmes d Information La Conception d Interfaces Le Calcul Scientifique

Plus en détail

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed 6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN

Plus en détail

Définition de syntaxes concrètes graphiques

Définition de syntaxes concrètes graphiques UTM M2 ICE INGÉNIERIE DIRIGÉE PAR LES MODÈLES BE 4 mai 2012 À l instar d une syntaxe concrète textuelle, une syntaxe concrète graphique fournit un moyen de pouvoir visualiser et/ou éditer plus agréablement

Plus en détail

Les documents primaires / Les documents secondaires

Les documents primaires / Les documents secondaires Les documents primaires / Les documents secondaires L information est la «matière première». Il existe plusieurs catégories pour décrire les canaux d information (les documents) : - Les documents primaires

Plus en détail

Construire une Documentation Structurée des Dépendances et des Services (DSDS) Rafael Diaz Maurin, CRU JRES, Nantes, le 2 décembre 2009

Construire une Documentation Structurée des Dépendances et des Services (DSDS) Rafael Diaz Maurin, CRU JRES, Nantes, le 2 décembre 2009 Construire une Documentation Structurée des Dépendances et des Services (DSDS) Rafael Diaz Maurin, CRU 1 Agenda Introduction : qu'est-ce qu'une DSDS? Les ontologies : outils pour la DSDS Protégé : éditeur

Plus en détail

Conventions communes aux profils UML

Conventions communes aux profils UML Conventions communes aux profils UML Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)* Référence : Livrable 2.1 Date : Juin 2002 * : Les partenaires du

Plus en détail

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Journée organisée par le CRFCB Midi-Pyrénées / Languedoc-Roussillon

Plus en détail

COURS : INFORMATION SCIENTIFIQUE

COURS : INFORMATION SCIENTIFIQUE COURS : INFORMATION SCIENTIFIQUE ET TECHNIQUE EC 1 : Documentation scientifique et technique COURS N : 3 PAR : Sahbi SIDHOM MCF. Université de Lorraine & Lab. LORIA / KIWI Cours en ligne : www.loria.fr/~ssidhom

Plus en détail

KWISATZ_TUTO_module_magento novembre 2012 KWISATZ MODULE MAGENTO

KWISATZ_TUTO_module_magento novembre 2012 KWISATZ MODULE MAGENTO _TUTO_module_magento Table des matières -1) - :...2-1.1) Introduction :...2-1.2) Description :...3-1.2.1) Schéma :...3-1.3) Mise en place :...4-1.3.1) MAGENTO :...4-1.3.1.1) Les Web Services :...4-1.3.1.2)

Plus en détail

Compte rendu de l animation du 24 mars 2010

Compte rendu de l animation du 24 mars 2010 Compte rendu de l animation du 24 mars 2010 MAÎTRISER LES LANGAGES INTRODUCTION Maîtriser c est dominer. A l école maternelle, il est encore prématuré de parler de maîtrise. C est la raison pour laquelle

Plus en détail

Du Web sémantique au Web pragmatique. Isabelle Boydens Section Recherche 2 avril 2004

Du Web sémantique au Web pragmatique. Isabelle Boydens Section Recherche 2 avril 2004 Du Web sémantique au Web pragmatique Isabelle Boydens Section Recherche 2 avril 2004 Du Web sémantique au Web pragmatique : plan de l exposé Introduction Mise en contexte par rapport à l existant Web sémantique

Plus en détail

Des contenus pédagogiques standardisés SCORM sur la plate-forme Cognifer

Des contenus pédagogiques standardisés SCORM sur la plate-forme Cognifer Normes et standards FOAD «L interopérabilité pédagogique» Des contenus pédagogiques standardisés SCORM sur la plate-forme Cognifer Manuel du concepteur élaboré par Mokhtar BEN HENDA 2005 Le contenu de

Plus en détail

Ressources pour l école élémentaire

Ressources pour l école élémentaire Ressources pour l école élémentaire Français éduscol Progressions pour le cours préparatoire et le cours élémentaire première année Ces documents peuvent être utilisés et modifiés librement dans le cadre

Plus en détail

Exemple de développement d une application

Exemple de développement d une application Exemple de développement d une application Département Informatique TELECOM SudParis 1ère année Dépt INF 2009/2010 Table des matières Exemple de développement d une application Département Informatique,,

Plus en détail

Concevoir sa stratégie de recherche d information

Concevoir sa stratégie de recherche d information Concevoir sa stratégie de recherche d information Réalisé : mars 2007 Dernière mise à jour : mars 2011 Bibliothèque HEC Paris Contact : biblio@hec.fr 01 39 67 94 78 Cette création est mise à disposition

Plus en détail

Solutions en ligne Guide de l utilisateur

Solutions en ligne Guide de l utilisateur Solutions en ligne Guide de l utilisateur Décembre 2009 Informations générales... 1 Configuration minimale requise... 1 Connexion... 1 Page d accueil des Solutions en ligne... 2 Utilisation de la table

Plus en détail

Groupe Eyrolles, 2001, 2003, 2004, ISBN : 2-212-11480-X

Groupe Eyrolles, 2001, 2003, 2004, ISBN : 2-212-11480-X Groupe Eyrolles, 2001, 2003, 2004, ISBN : 2-212-11480-X Chapitre 6 Exercices corrigés et conseils méthodologiques Mots-clés Activité continue/finie Transition automatique Contexte statique Événements «after»

Plus en détail

Spring IDE. Mise en œuvre. Eclipse

Spring IDE. Mise en œuvre. Eclipse A Spring IDE Bien que Spring mette à disposition d intéressants mécanismes afin d améliorer l architecture des applications Java EE en se fondant sur l injection de dépendances et la programmation orientée

Plus en détail

Méthodologie documentaire. TD3 : Principes d indexation et mots-clefs de recherche documentaire

Méthodologie documentaire. TD3 : Principes d indexation et mots-clefs de recherche documentaire Méthodologie documentaire TD3 : Principes d indexation et mots-clefs de recherche documentaire Introduction La méthodologie documentaire c est une boucle de recherche permettant de trouver l information.

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

Le dictionnaire DEM dans NooJ

Le dictionnaire DEM dans NooJ 21 ème Traitement Automatique des Langues Naturelles, Marseille, 2014 Le dictionnaire DEM dans NooJ Max Silberztein ELLIADD, Université de Franche-Comté, 30 rue Mégevand, 25000 Besançon max.silberztein@univ-fcomte.fr

Plus en détail

FONCTIONS CLEFS. Gestion documentaire. Chaîne de validation des documents. Espaces de travail collaboratif. Gestion des accès basée sur des rôles

FONCTIONS CLEFS. Gestion documentaire. Chaîne de validation des documents. Espaces de travail collaboratif. Gestion des accès basée sur des rôles Nuxeo Collaborative Portal Server 1 FONCTIONS CLEFS Gestion documentaire Chaîne de validation des documents Espaces de travail collaboratif Gestion des accès basée sur des rôles Sécurité Suivi des versions

Plus en détail

P4b : Apport des SIG aux énergies renouvelables Dans le cadre du Mastère ASIG. Détermination des profils SIG

P4b : Apport des SIG aux énergies renouvelables Dans le cadre du Mastère ASIG. Détermination des profils SIG P4b : Apport des SIG aux énergies renouvelables Dans le cadre du Mastère ASIG Détermination des profils SIG Transcription des besoins selon les critères Experts Mastère ASIG 25 Avril 2008 Mastère ASIG

Plus en détail

La recherche documentaire Guide méthodologique

La recherche documentaire Guide méthodologique La recherche documentaire Guide méthodologique Page 1 Table des matières 1. Préparer sa recherche... 3 Définir le sujet... 3 Réunir l information de base... 3 Cerner le sujet... 3 Identifier des mots clés...

Plus en détail

JAVA PROGRAMMATION. Programme. 1. Java, HTML et World Wide Web

JAVA PROGRAMMATION. Programme. 1. Java, HTML et World Wide Web PROGRAMMATION PUBLIC Professionnels informatiques qui souhaitent développer des applications et «applets» Java DUREE 4 jours 28 heures OBJECTIF Créer divers «applets» à intégrer dans un site Web dynamique,

Plus en détail

Les termes de recherche peuvent être combinés à l aide des opérateurs booléens et, ou.

Les termes de recherche peuvent être combinés à l aide des opérateurs booléens et, ou. Aide-mémoire La BDSP (Banque de données en santé publique), est un réseau documentaire d'informations en santé publique dont la gestion est assurée par l'ecole des hautes études en santé publique (EHESP).

Plus en détail

INRS Biblio est la base de données biblio-

INRS Biblio est la base de données biblio- dmt assistance TP 2 La base de données INRS Biblio Prévention des risques professionnels Lors d une recherche documentaire, l objectif est de pouvoir sélectionner rapidement et facilement les documents

Plus en détail

Introduction au WEB Sémantique Cours 1 : Qu est ce que le WEB sémantique?

Introduction au WEB Sémantique Cours 1 : Qu est ce que le WEB sémantique? Cours 1 : Qu est ce que le WEB sémantique? ESIL Université de la méditerranée Odile.Papini@esil.univmed.fr http://odile.papini.perso.esil.univmed.fr/index.html Plan du cours Introduction 1 Introduction

Plus en détail

Introduction au module : exercices corrigés en VBA

Introduction au module : exercices corrigés en VBA PAD INPT ALGORITHMIQUE ET PROGRAMMATION 1 Exercices corrigés en VBA, Semaine 0 avril mai 2013 Objectifs Installer l environnement de développement ; Se familiariser avec l environnement de développement

Plus en détail

SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES

SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES NANCY 18-19 MARS 2015 Jean-Marie Pierrel Université de Lorraine OBJECTIFS DES SERVICES À VALEURS AJOUTÉES Définir des services à valeurs ajoutées sur la

Plus en détail

Projet DataCity. Documentation Utilisateur. Version 4

Projet DataCity. Documentation Utilisateur. Version 4 Projet DataCity Documentation Utilisateur Version 4 Cyril Moralès Marc Soufflet Lionel Hamsou Cédric Merouani Cyntia Marquis Ryan Legasal Guillaume de Jabrun morale_c souffl_m hamsou_l meroua_c marqui_c

Plus en détail

Test de «solution de découverte» EDS

Test de «solution de découverte» EDS Sommaire Test de «solution de découverte» EDS... 2 Introduction... 2 Représentation des métadonnées négociées par le CNRS et des métadonnées d EBSCO... 3 Comment faire une recherche... 4 1) La recherche

Plus en détail

Noureddine Kerzazi noureddine.kerzazi@polymtl.ca

Noureddine Kerzazi noureddine.kerzazi@polymtl.ca Domaine de la modélisation des processus pour le génie logiciel. Noureddine Kerzazi noureddine.kerzazi@polymtl.ca DSL4SPM Domain-Specific-Language for Software Process Modeling Il s agit d un nouveau cadre

Plus en détail

MAITRISE DE L INFORMATION SCIENTIFIQUE

MAITRISE DE L INFORMATION SCIENTIFIQUE MASTER 1 BMC 2014-2015 MAITRISE DE L INFORMATION SCIENTIFIQUE claire.sonnefraud@upmc.fr Mise à jour août 2014 Contenu de la formation 2 cours en salle info : 2 * 2h 1 examen : 1h (décembre) Formation à

Plus en détail

L approche Bases de données

L approche Bases de données L approche Bases de données Cours: BD. Avancées Année: 2005/2006 Par: Dr B. Belattar (Univ. Batna Algérie) I- : Mise à niveau 1 Cours: BDD. Année: 2013/2014 Ens. S. MEDILEH (Univ. El-Oued) L approche Base

Plus en détail

Exposé: Web sémantique. Web 2.0: impact Sur les IHM, Plasticité. Présenté par: BEN AMOR Akram

Exposé: Web sémantique. Web 2.0: impact Sur les IHM, Plasticité. Présenté par: BEN AMOR Akram Exposé: Web sémantique. Web 2.0: impact Sur les IHM, Plasticité Présenté par: BEN AMOR Akram Plan Web Sémantique Définition et objectif Historique Principe général Quels sont les finalités et les objectifs

Plus en détail

Recherche sémantique d images annotées

Recherche sémantique d images annotées Recherche sémantique d images annotées ALLIOUA Sofiane 1, ZIZETTE Boufaida 2 1 Université de Tébessa, Algérie allioua.sofiane@hotmail.fr 2 Laboratoire LIRE, Université Mentouri, Constantine, Algérie zboufaida@gmail.com

Plus en détail

PUBMED niveau 1. Alexandre Boutet (alexandre.boutet@biusante.parisdescartes.fr) Benjamin Macé (benjamin.mace@biusante.parisdescartes.

PUBMED niveau 1. Alexandre Boutet (alexandre.boutet@biusante.parisdescartes.fr) Benjamin Macé (benjamin.mace@biusante.parisdescartes. PUBMED niveau 1 Présentation... 2 1. Les étapes de fabrication... 3 2. Le MeSH : un thésaurus hiérarchisé... 3 3. La notion de mots clés majeurs et les qualificatifs... 7 4. Les opérateurs booléens : AND,

Plus en détail

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et

Plus en détail

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Mémento Ouvrir TI-Nspire CAS. Voici la barre d outils : L insertion d une page, d une activité, d une page où l application est choisie, pourra

Plus en détail

L exploitation. Lutter contre le plagiat

L exploitation. Lutter contre le plagiat L exploitation L exploitation Lutter contre le plagiat Internet a bouleversé les usages en matière de recherche d information, mais a aussi accru et facilité les possibilités de copier-coller dans la production

Plus en détail

Créer et partager des fichiers

Créer et partager des fichiers Créer et partager des fichiers Le rôle Services de fichiers... 246 Les autorisations de fichiers NTFS... 255 Recherche de comptes d utilisateurs et d ordinateurs dans Active Directory... 262 Délégation

Plus en détail

Vers l automatisation de la construction de systèmes de médiation pour le commerce électronique

Vers l automatisation de la construction de systèmes de médiation pour le commerce électronique Vers l automatisation de la construction de systèmes de médiation pour le commerce électronique I. Introduction C. Reynaud, G. Giraldo Université Paris-Sud, CNRS UMR 8623, INRIA-Futurs L.R.I., Bâtiment

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

Outils pour lexicographes : application à la lexicographie explicative et combinatoire

Outils pour lexicographes : application à la lexicographie explicative et combinatoire Outils pour lexicographes : application à la lexicographie explicative et combinatoire Gilles Sérasset GETA-CLIPS-IMAG (UJF & CNRS) BP 53 38041 Grenoble Cedex 9 Tél. : 04.76.51.43.80 - Fax : 04.76.51.44.05

Plus en détail

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2 éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........

Plus en détail

WordPress : Guide à l édition

WordPress : Guide à l édition WordPress : Guide à l édition WordPress : Guide à l édition... 1 Présentation... 2 1. Accès au site... 2 2. Le tableau de bord... 2 3. Editez les contenus... 4 Quelle est la différence entre les pages

Plus en détail

Document d aide à la découverte de l outil d analyse de données Analyza. SOMMAIRE

Document d aide à la découverte de l outil d analyse de données Analyza. SOMMAIRE Guide Analyza Document d aide à la découverte de l outil d analyse de données Analyza. SOMMAIRE 1. Interface 2. Tableaux de bord 3. Indicateurs 4. Filtres 5. Permissions 6. Alertes 7. Flux de données 8.

Plus en détail

Introduction : Les critères «on page»...2

Introduction : Les critères «on page»...2 Table des matières Introduction : Les critères «on page»...2 1. Les balises de référencement...3 1.1 La balise titre...5 1.2 La balise meta description...6 1.3 La balise meta keywords...7 2. Le contenu

Plus en détail

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte 1Les bases : vos objectifs 2 Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Plus en détail

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...

Plus en détail

COMMENT PRENDRE EN COMPTE LA COMPETENCE PLURILINGUE ET INTERCULTURELLE

COMMENT PRENDRE EN COMPTE LA COMPETENCE PLURILINGUE ET INTERCULTURELLE COMMENT PRENDRE EN COMPTE LA COMPETENCE PLURILINGUE ET INTERCULTURELLE DANS LES PORTFOLIOS EUROPEENS DES LANGUES Francis Goullier Portfolio européen des langues Maquettes et ressources 1 Comment prendre

Plus en détail

PHP/MYSQL. Web Dynamique

PHP/MYSQL. Web Dynamique PHP/MYSQL Web Dynamique ENSG Juin 2008 Qui suis-je? Guillaume Gautreau Responsable projets Systèmes d information à l ENPC guillaume@ghusse.com http://www.ghusse.com Ces 6 jours de formation Jour 1 : présentations,

Plus en détail

Métadonnées, RDF, RDFS et OWL

Métadonnées, RDF, RDFS et OWL LIRMM FMIN306 2009 Définition métadonnées Contexte actuel Illustration Base de données Services attendus Un exemple de standard Données relatives à des données, de l information ajoutant du sens à des

Plus en détail

SCI6052 Information documentaire numérique. Cours 13 Introduction au modèle relationnel Méthodologies de mise sur pied de solutions documentaires

SCI6052 Information documentaire numérique. Cours 13 Introduction au modèle relationnel Méthodologies de mise sur pied de solutions documentaires École de bibliothéconomie et des sciences de l information SCI6052 Information documentaire numérique Cours 13 Introduction au modèle relationnel Méthodologies de mise sur pied de solutions documentaires

Plus en détail

Sujet 17 : Exploitation de données financières de Google Finance en C#

Sujet 17 : Exploitation de données financières de Google Finance en C# Amsellem Ari Pour le 01/06/11 Ohayon Alexandre Gueguen Tristan Sujet 17 : Exploitation de données financières de Google Finance en C# Introduction : Il convient tout d abord de signaler que le titre de

Plus en détail

Les métadonnées démystifiées

Les métadonnées démystifiées Les métadonnées démystifiées Forum sur les métadonnées au Canada 2005 Exposé de : Karen Morgenroth, coordonnatrice de la gestion des données Le 27 septembre 2005 Un aperçu Les métadonnées : que sont-elles

Plus en détail

PUBMED tutoriel PUBMED 1. Présentation P.3. 1- Les étapes de fabrication P.4. 2- Le MeSH : un thésaurus hiérarchisé P.5

PUBMED tutoriel PUBMED 1. Présentation P.3. 1- Les étapes de fabrication P.4. 2- Le MeSH : un thésaurus hiérarchisé P.5 PUBMED tutoriel PUBMED 1 Présentation P.3 1- Les étapes de fabrication P.4 2- Le MeSH : un thésaurus hiérarchisé P.5 3- La notion de mots clés majeurs et de qualificatifs P.8 4- Les opérateurs booléens

Plus en détail

Méthodes de travail ID / Fiche récapitulative 2014

Méthodes de travail ID / Fiche récapitulative 2014 Où trouver de l information? Médiathèque, bibliothèque, centres de documentation, centres de ressources Un système d information documentaire est composé de trois éléments : - Un public - Une offre de

Plus en détail

Structures de données non linéaires

Structures de données non linéaires Structures de données non linéaires I. Graphes Définition Un graphe (simple) orienté G est un couple (S, A), où : S est un ensemble dont les éléments sont appelés les sommets. A est un ensemble de couples

Plus en détail

fichiers Exemple introductif : stockage de photos numériques

fichiers Exemple introductif : stockage de photos numériques b- La Gestion des données Parmi les matériels dont il a la charge, le système d exploitation s occupe des périphériques de stockage. Il s assure, entre autres, de leur bon fonctionnement mais il doit être

Plus en détail

REDENE - Recherche documentaire assistée par ontologies de domaine adaptatives

REDENE - Recherche documentaire assistée par ontologies de domaine adaptatives REDENE - Recherche documentaire assistée par ontologies de domaine adaptatives Xavier Aimé * *** Frédéric Fürst ** Pascale Kuntz * Francky Trichet * * LINA - Laboratoire d Informatique de Nantes Atlantique

Plus en détail

Raisonner le Web Sémantique avec des graphes : Application à un cas industriel

Raisonner le Web Sémantique avec des graphes : Application à un cas industriel Raisonner le Web Sémantique avec des graphes : Application à un cas industriel Olivier Carloni LIRMM, Université de Montpellier II, 161, rue Ada, F-34392 Montpellier cedex - France carloni@lirmm.fr Mondeca,

Plus en détail

GescoJMB v5. Le Sommaire :... 2 Page d accueil :... 2 Les Références :... 3 Les Textes :... 3 Les Paramètres :... 4 Les Outils :...

GescoJMB v5. Le Sommaire :... 2 Page d accueil :... 2 Les Références :... 3 Les Textes :... 3 Les Paramètres :... 4 Les Outils :... GescoJMB v5 Le Sommaire :............ 2 Page d accueil :............ 2 Les Références :............ 3 Les Textes :............ 3 Les Paramètres :............ 4 Les Outils :............ 5 Les Articles :............

Plus en détail

Rank, l outil de la visibilité web

Rank, l outil de la visibilité web Rank, l outil de la visibilité web Développé par le pôle R&D de la société Brioude Internet, Rank a pour vocation de nous aider à suivre le positionnement d un site et de ses concurrents. Il ne s agit

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction du cours Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire

Plus en détail

Le guide du référencement Avec WebGazelle CMS 2.0

Le guide du référencement Avec WebGazelle CMS 2.0 Fiche Outil : Référencement Avec WebGazelle CMS 2.0 Le guide du référencement Avec WebGazelle CMS 2.0 Le guide du référencement avec WebGazelle CMS 2.0 1/10 SOMMAIRE 1 PRESENTATION GENERALE... 3 2 LES

Plus en détail

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Technologie et biologie (TB) Discipline : Informatique Première et seconde années Programme d informatique

Plus en détail

Leçon N 4 Classement des photos sur votre ordinateur

Leçon N 4 Classement des photos sur votre ordinateur Leçon N 4 Classement des photos sur votre ordinateur L idéal lorsque vous enregistrez des photos sur votre ordinateur c est de les mettre dans un dossier «Temporaire». Vous pourrez ensuite aller les chercher

Plus en détail