Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen

Dimension: px
Commencer à balayer dès la page:

Download "Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen"

Transcription

1 Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen A. Lagarde - C. Renaudineau mémoire soutenu le 09 Juin 2009 Mémoire de Master 1 en Informatique Faculté des Sciences et Techniques - Université de Nantes LINA - Laboratoire d Informatique de Nantes Atlantique (UMR CNRS 6241) Equipe Connaissances et Décision Partenaire institutionnel : EthnoDoc-AREXCPO (Association de Recherche et d EXpression pour la Culture POpulaire)

2 Table des matières I Recherche d information sémantique : fondements théoriques 7 1 Recherche d informations dans un fond documentaire Principe d un système de recherche d informations L indexation lexicale : un procédé d optimisation de SRI efficace Importance des meta-informations dans un SRI Indexation lexicale : définition et principes Un exemple d indexation lexicale : Lucène La recherche d informations syntaxique : un mécanisme limité la recherche d information syntaxique : un mécanisme s appuyant fortement sur l indexation lexicale Limites d une recherche d information syntaxique Une solution potentielle : recherche d informations sémantique Ontologies et recherches d informations sémantiques Les Ontologies : un moyen de structurer des concepts Thésaurus : un dictionnaire introduisant des relations inter-termes Ontologie : définition Les concepts : une vue sémantique d une entité Les gradients de prototypicalité : des outils pour pondérer les relations entre concepts, labels, instances et propriétés Le gradient de prototypicalité conceptuelle Composante expressionnelle du gpc Composante extensionelle du gpc Composante intentionelle du gpc Gradient de prototypicalité lexical Exemple concret de la puissance d une recherche sémantique comparée à une recherche syntaxique Principe de la recherche d informations syntaxique (sans ontologie)

3 2.3.2 Principe de la recherche d informations à l aide de la plateforme Ethnosiris (avec ontologie) Etat de l art : formats d ontologie, ontologies célèbres et moteurs de recherche sémantique Formats d ontologie, logiciels d édition et ontologies célèbres Démonstration de la puissance des ontologies Les moteurs de recherche sémantiques actuels II Présentation du cadre applicatif du projet Ethnosiris 28 4 L association Arexpo et son fond documentaire L association AREXCPO L association EthnoDoc Mission de l association : collecte d informations relatives au patrimoine Vendéen La base de données EthnoDoc : un fond documentaire annoté et indéxé Travail effectué sur la base de données Ontologie fournie : OnthnoPhoto 32 III Contribution au projet : Ethnosiris, un moteur de recherche sémantique 34 6 Spécifications du moteur de recherche sémantique Attentes et contraintes sur le moteur Cas d utilisation d une recherche sémantique Le nuage de mots clés : un outil adapté aux focus Trois échelles de focalisation Focus sur le fond documentaire indépendemment de toute recherche Focus sur le fond documentaire vis-à-vis d une recherche Focus sur une ressource par rapport à une recherche Prémices au développement : choix du langage et de la structure générale du moteur de recherche Le choix d un langage portable et robuste Mise au point d une structure modulaire et réutilisable L implémentation de l ontologie Principaux choix d implémentation Les classes concepts, labels et instance

4 8.1.2 La classe Ontogie : opérations de parcours en temps minimal Optimisations nécessaires au fonctionnement de l ontologie sur un serveur PhP Implémentations des différentes recherches La recherche syntaxique Le gestionnaire de mots clés La pertinence syntaxique L afficheur La recherche sémantique La pertinence sémantique L afficheur Affineur de recherche Implémentation des Nuages Tags 52 4

5 Introduction L objectif de ce document est de présenter les différentes théories et procédés qui ont permis l implémentation d un moteur de recherche sémantique basé sur un fond documentaire (EthnoDoc) et sur une ontologie (OnthoPhoto). Ce moteur de recherche constitue un des éléments principaux de la plateforme Ethnosiris, plateforme dont le but est de permettre une recherche sémantique sur un corpus de documents indexés lexicalement. Cette plateforme devra pouvoir être intégrée à n importe quel corpus indexé ; elle devra par conséquent être multilingue, multi-dialecte et polygraphe (plusieurs alphabets). De plus, elle présentera des sessions d interactions identiques à un moteur de recherche d informations traditionnel (via champs de saisie de mots-clés), les seules différences avec ce dernier étant relatives à la pertinence des résultats fournis et aux comportements face à différents cas critiques. L acquisition et la représentation d informations par un système informatique ont toujours fait partie des problématiques fondamentales, non seulement dans la recherche informatique, mais également dans toute recherche relative à la sémiotique (étude du sens des choses) ou à la psychologie cognitive (centrée sur la mémoire, l apprentissage et le raisonnement). En 1968, un informaticien et un psychologue (Collin et Quillian), ont cherché à définir une représentation des informations stockées dans nos mémoires. A force d expériences basées sur le temps de réponse à des affirmations du style un chien est un animal et un chien est un mammifère, ils ont réussi à construire un modèle hiérarchique de catégories. Cette hiérarchisation de concepts est la base du modèle ontologique. Dans une première partie, nous présenterons les fondements et caractéristiques d un moteur de recherche d informations, puis nous enrichirons la notion d ontologie en présentant les ontologies pragmatisées [1], i.e des ontologies prenant en compte l aspect subjectif de la représentation de connaissances. Nous effectuerons également un bref état de l art des ontologies et de leur application dans le cadre d un système de recherche d informations sémantique. Dans un second temps, nous décrirons le cadre applicatif du projet Ethnosiris, en présentant les partenaires du projet, puis en détaillant le fond documentaire utilisé et l ontologie fournie. Nous reviendrons enfin sur notre contribution au projet Ethnosiris, en décrivant premièrement le 5

6 travail de spécification que nous avons effectué. En particulier, on veillera à la généricité (incluant des aspects polylingues et polygraphes), la portabilité (doit fonctionner sur tout type de serveur, fond et ontologie) et la complexité de l implémentation du moteur de recherche Ethnosiris. Nous discuterons finalement des principaux choix d implémentation effectués. Sans les citer formellement, nous nous sommes appuyé sur les travaux de l équipe de recherche COD (COnnaisance et Décision) [5, 2, 7, 3]. 6

7 Première partie Recherche d information sémantique : fondements théoriques 7

8 Chapitre 1 Recherche d informations dans un fond documentaire 1.1 Principe d un système de recherche d informations La recherche d informations occupe une place centrale dans l activité de n importe quel individu, qu il s agisse d une recherche documentaire dans une bibliothèque, d une recherche de produits dans un supermarché ou de la recherche de pages Web sur Internet. Dans tous ces cas, le cerveau humain effectue un travail en deux temps : 1. Premièrement, il qualifie la recherche (collection de livres, boîte de ravioli ou site Internet) à partir d une liste de caractéristiques (titre, catégorie et édition du livre,type du produit...). 2. Deuxièmement, il retourne les ressources les plus pertinentes pour la recherche fournie : par exemple, on se souvient de deux boîtes de ravioli achetées il y a plusieurs mois, et pour chacune d elles l endroit où la trouver (emplacement de la ressource). Ce travail effectué par notre cerveau constitue la base d un système de recherche d informations (SRI) : son rôle sera de comprendre la recherche, puis de fournir les ressources qu il pense être en relation avec ce qui lui est demandé. En se basant sur ces postulats, il est possible de déduire deux propriétés fondamentales d un SRI : 1. La mémoire : pour pouvoir identifier les ressources concernées par la recherche, le SRI devra se souvenir des caractéristiques (métadonnées) de chacune d entre elles. 2. La capacité de raisonnement : afin d évaluer la pertinence d une ressource par rapport à une recherche, le SRI devra suivre un raisonnement, guidé par différents critères. Il ne faut pas confondre moteur de recherche et SRI : en effet, bien que le moteur de recherche constitue le coeur d un SRI, il n en est qu un composant : un SRI peut également être muni de : 8

9 - fonctions d acquisition, qui lui permettront d ajouter des documents à sa mémoire. - fonctions d annotation, chargées de gérer les caractéristiques (meta-informations) des documents ajoutés. Ces fonctions doivent permettre la modification de ces meta-informations, et peuvent proposer différents moyens d accès, notamment leur indexation. - fonctions heuristiques, dont le rôle est de guider la recherche selon différents critères. Bien que le travail que nous ayons fourni ne concerne que l aspect moteur de recherche, nous nous appuyons bien évidemment sur ces différentes fonctions. Il convient donc de revenir sur certains mécanismes fondamentaux d un SRI, et en particulier le procédé d indexation lexicale. 1.2 L indexation lexicale : un procédé d optimisation de SRI efficace Importance des meta-informations dans un SRI Lorsque vous saisissez un terme dans un moteur de recherche classique (et ce fait est encore plus vrai pour un SRI de type sémantique), vous fournissez au système au moins une caractéristique qualifiant votre recherche. Cette caractéristique peut être de nature diverse : en effet, elle peut concerner le contenu textuel du document (titre, mots clés...), sa nature (type de fichier, organisation du document) ou aborder des notions plus abstraites comme les thèmes abordés ou encore sa localisation dans l espace ou le temps. Nous voyons clairement que le système doit au préalable avoir effectué un apprentissage, qui lui aura permis d établir des liaisons (caractéristique - document) ; cet apprentissage n est ni plus ni moins que la phase d indexation. La phase de recherche d informations peut être alors assimilée à un processus de reconnaissance de caractéristiques. Comme le dit Platon, La connaissance des mots conduit à la connaissance des choses. D une manière analogue, la connaissance des meta-informations d un document conduit à la connaissance du document lui-même. Réciproquement, un système de recherche d information ne peut donner de réponses pertinentes que si l index sur lequel il va se fonder a reçu un apprentissage suffisant. Le choix des critères à intégrer lors de l acquisition d un nouveau document est donc primordial, et constitue l un des travaux essentiels d un bon SRI. 9

10 1.2.2 Indexation lexicale : définition et principes Indexation - identification de l information contenue dans tout texte et représentation au moyen d un ensemble d entités (appelé index) pour faciliter la comparaison entre une recherche et la représentation d un document - transfert de l information contenue dans le texte vers un autre espace de représentation traitable par un système informatique. Autrement dit, un index peut être assimilé à une fonction f : D - M, où D est l ensemble des documents et M l ensemble des descripteurs. On dit qu un document DOC traite un thème identifié par un ensemble de descripteurs D si d D : d f(doc). On dit que les descripteurs d un Thème T décrivent un document DOC si t descripeurs(t) : d f 1 (DOC). Ces descripteurs peuvent être de différentes natures : - les mots simples du texte (hors mots vides, mots outils comme les articles ou les pronoms, etc...) ; - les groupes de mots du texte (à valeur sémantique plus forte que les mots simples). Par exemple, le groupe de mots danse traditionnelle vendéenne aura plus de valeurs que ces trois mots pris séparemment. - les radicaux des mots extraits, exemple : équins et équidés ont la même racine. On se base alors sur l étymologie pour regrouper des mots, ce qui permet d optimiser la taille de l index, mais qui peut se révéler faux : par exemple, les mots solstice et soleil ont le même radical mais désigne pourtant des notions différentes ; - des concepts définis par l utilisateur à partir d un vocabulaire organisé, d un thésaurus... - des N-grammes, suite de n caractères consécutifs ; - les contextes : termes n apparaissant pas explicitement dans le texte du document mais ayant un lien sémantique et/ou de co-occurence avec les mots du texte. Par exemple, si le mot hibou n est pas dans le document considéré mais, que dans d autres documents, il apparaît très souvent à côté du mot chouette, on considérera qu il existe une relation de co-occurence entre les mots hibou et chouette. - les mots simples hors mots vides (pronoms et déterminants) ; cette indexation favorise la précision 1 de la recherche (on est alors certain que les documents trouvés contiennent bien les termes présents dans la requête), mais engendre un index de taille volumineuse, et peut entrainer le rejet de certains documents pourtant en rapport avec la recherche. Par exemple, on lance une recherche sur le descripteur caniches. Avec ce type d indexation, tous les documents contenant ce mot au 1. Rapport du nombre de textes reconnus et contenant réellement le terme de la requête par le nombre de textes contenant un terme différent mais identifié comme contenant celui demandé dans la requête. 10

11 singulier uniquement ne seront pas retournés par la recherche. - les radicaux, afin de tenir compte des variations morphologiques (i.e variation du genre, du temps, de la personne ou du pluriel d un mot). Par exemple, adolescence et adolescents seront ramenés au radical adolesc. Cette méthode offre une amélioration du rappel 2 et nécessite un index de taille plus faible que pour le cas précédent. Cependant, cette technique d indexation peut provoquer une baisse de la précision de la recherche (mise en rapport des termes canif et caniche car il est très difficile de savoir que l un n est pas une variation morphologique de l autre). - les lemmes, indexation plus fine et concentrée sur les variations flexionnelles mais qui demande une opération préalable de traitement linguistique des textes ; cette méthode offre une augmentation du rappel et une baisse de la précision. Établir un index sur un corpus de documents consiste donc à attribuer à chacun des documents des descripteurs (i.e objets décrivant, caractérisant, un document à partir de son contenu). Le rôle d un index est par conséquent double, à savoir rôle de résumé (qualifier le document) et rôle d outil de recherche d information (accès à ce document à partir de son index, pendant la recherche lexicale). De part les multiples techniques d indexation présentées dans cette section, on voit bien l importance du choix de l une d entre elles, et des répercussions que ce choix peut avoir, non seulement en terme de qualité de la recherche (rappel et précision), mais également en terme de performances (taille de l index et rapidité de la recherche) Un exemple d indexation lexicale : Lucène Lucène est un moteur d indexation et de recherche lexicale libre 3. Cette API réalise une indexation à partir des radicaux (cf section 1.2.2), en supprimant au préalable les mots vides au moyen soit d un analyseur standard, soit d un analyseur propre à une langue. Toutes les chaînes de caractères sont dans un premier temps converties en minuscules. Les mots sont ensuite filtrés de manière à supprimer tous ceux qui ne sont pas particulièrement porteurs de sens (par défaut une liste propre à chaque langue est utilisée, liste ouverte et donc modifiable). Pour terminer, seules les racines sont retenues pour l indexation. On notera des performances très intéressantes : environ 4 minutes pour indexer un thésaurus de 3Mo(WordNet : http ://wordnet.princeton.edu). 2. Rapport du nombre de textes reconnus et contenant réellement le terme de la requête par le nombre de textes contenant ce terme mais non cités dans la réponse. 3. Site internet : http : //lucene.apache.org/ 11

12 1.3 La recherche d informations syntaxique : un mécanisme limité la recherche d information syntaxique : un mécanisme s appuyant fortement sur l indexation lexicale Le façon la plus courante d implémenter une recherche d information syntaxique est d effectuer une indexation sur les documents, puis de lancer une recherche lexicale sur cette index. On pourra notamment citer les moteurs de recherche Google et Yahoo, qui fonctionnent en deux temps : 1. Lors de la détection d un nouveau site (via des robots parcourant le Web) : Qualification du site à partir d une heuristique d indexation : on créé les descripteurs du site à partir de son adresse Internet et de son contenu, en pondérant chaque mot par son ocurrence sur le site et le type de balise dans lequel il apparaît (balise titre ou simple paragraphe). On incorpore également des méta-informations sur le site (langue(s) utilisée(s), site commercial ou non...). Ajout de ces descripteurs à l index du moteur de recherche. 2. Lors du lancement d une recherche A partir d une heuristique de parcours de l index, sélection des descripteurs correspondant aux critères de la recherche. A partir de ces descripteurs, obtention des documents concernés. Affichage de ces documents, triés selon le nombre de descripteurs satisfaisant la recherche. On voit ici que l indexation lexicale est au centre de toute recherche d informations syntaxique. Nous allons maintenant mettre en évidence les limites d un tel mécanisme Limites d une recherche d information syntaxique Par définition, le mécanisme d indexation lexicale ne prend pas en compte le sens des mots indexés : on considère ici un mot comme une suite de caractères. Or un mot est bien plus que cela : il possède de nombreuses relations avec d autres mots : synonymie, antinomie... Au delà de ces relations, un mot désigne souvent une entité physique du monde, cette entité ayant elle-même des relations avec d autres entitiés, et d autres mots. Prenons un exemple pour illustrer cette pauvreté : sur le moteur de recherche Google, je lance une recherche sur le mot teckel. Admettons qu aucun des documents indexés ne possède le descripteur associé à ce mot. Aucun résultat ne m est donc proposé. Cependant, le mot teckel de la langue française désigne un animal appartenant à la famille des canidés. Si l on avait fait une demande de livre associé au sujet teckel dans une bibliothèque, un documentaliste consciencieux, après avoir constaté qu il n avait aucun livre sur ce sujet précis, nous aurait proposé différents livres traitant des sujets voisins, c est à dire des livres parlant de canidés. Une recherche d information syntaxique basé sur une indexation lexicale ne permet pas d établir des liens entre différents descripteurs. Elle ne permettra donc pas d effectuer des opérations pourtant 12

13 utiles sur les documents retournés, telles que la proposition de documents similiaires si aucun résulat n est trouvé, ou la sélection de document plus représentatifs que d autres (sur des critères autre que le nombre d occurence d un mot). Or, comme le dit Bouddha, Meilleur que mille mots privés de sens est un seul mot raisonnable. Il convient donc de s interroger sur la possibilité de munir notre recherche, en plus d un index lexical, d une structure qui permettra de définir des relations entre les descripteurs Une solution potentielle : recherche d informations sémantique A partir du constat effectué dans la partie précédente, il convient de s interroger sur la possiblité de définir un nouveau type de recherche d informations qui, au lieu de se baser uniquement sur l indexation lexicale (un mot est alors une simple chaîne de caractères) prendrait en compte le sens des mots. Intuitivement, on perçoit la nécessité d utiliser une nouvelle structure, qui définirait des relations entre les mots-clés : par exemple, les mots chien et chat, bien que différents, désignent tous les deux des animaux domestiques. La question est de savoir comment organiser ces relations : en effet, elles peuvent être de nature très différentes (synonymie, appartenance à une même famille...), et on a vu dans les parties précédentes qu elles doivent être indexées pour permettre une recherche rapide et efficace. Dans le chapitre suivant, nous essayerons de définir une telle structure, en utilisant à la fois des normes et conventions informatiques et des travaux relatifs à la psychologie humaine, pour que le sens que l ontologie donne aux mots s approche le plus possible de celui que lui donnerait un être pensant. 13

14 Chapitre 2 Ontologies et recherches d informations sémantiques 2.1 Les Ontologies : un moyen de structurer des concepts Présentons premièrement la structure qui rendra possible la recherche sémantique : l ontologie. Avant de définir précisemment ce qu est une ontologie, on reviendra sur la notion de thésaurus, qui constitue un bon point de départ pour notre analyse Thésaurus : un dictionnaire introduisant des relations inter-termes Un thésaurus est un répertoire de termes normalisés pour l analyse de contenu et le classement de documentation dans un domaine 1. Cette définition aborde plusieurs notions fondamentales : premièrement, un thésaurus est donc une liste de termes relatifs à un domaine de connaissances particulier. Deuxièmement, la notion de classement est très importante : un thésaurus va définir des relations de type linguistique entre les termes de son dictionnaire, comme par exemple la synonymie, l antonymie, etc. C est un premier pas vers notre objectif, à savoir représenter le sens des mots : grâce au thésaurus, on est capable de dire si deux mots représentent la même idée. Quels sont les avantages concrets d un Thésaurus par rapport à un simple index? apport pour chaque terme d une liste de synonymes permettant une première possibilité d extension des requêtes ; offre d enrichissement du vocabulaire initial ; existence d un format d écriture standardisé : Simple Knowledge Organisation System11 (SKOS) 2 ; 1. Petit Robert, dictionnaire de la langue française 2. Site internet : http : //www.w3.org/2004/02/skos/ 14

15 outil ouvert, les utilisateurs peuvent compléter cette base par l apport de nouveaux termes ; aspect multilingue du vocabulaire. Un recherche d information basée sur un Thésaurus permettra notamment d élargir le champ de recherche : par exemple, si il est établi que les mots chien et toutou sont synonymes, alors si le parcours de l index lexical sur le mot toutou ne renvoie aucun résultat, on sera capable de lancer une recherche sur le mot chien et, peut-être, de trouver des documents, ce qu une recherche d information syntaxique n aurait pas permis. La création du thésaurus en lui-même ainsi que l implémentation d une recherche basée sur ce thésaurus sont de plus grandement facilitées par l existence du format SKOS : ce langage, standardisé par l organisme W3C, a notamment l avantage d être fondé sur RDF, langage lui aussi standardisé, pour lequel il existe des outils de traitement déjà existants tels que Jena (ensemble d outils de traitement de fichiers RDF en Java) 3,. Selon le langage SKOS (SKOS Core), un thésaurus est considéré comme un schéma de ressources RDF dotées d un Uniform Resource Identier (URI, identifiant unique) spécifique, avec pour chacune d elles : au plus un terme préférentiel par langue ; des définitions et notes relatives à ce terme ; des concepts reliés de façon hiérarchique par des relations générique-spécifique, ou par des relations associatives (non hiérarchiques) ; des représentations symboliques du terme (images). Plusieurs thésaurus ont été développés sous ce format, comme AGROVOC (terminologie à vocation agricole et environnementale) 4, GEMET (GEneral Multilingual Environmental Thesaurus, un thésaurus à dominante environnementale) 5 ou encore MESH (Medical Subject Heading, terminologie médicale bilingue français / anglais) Site internet : http : //jena.sourceforge.net 4. Site internet : http : //www.fao.org/aims/ag intro.htm 5. Site internet : http : //www.eionet.europa.eu/gemet/index h tml 6. Site internet : http : //ist.inserm.fr/basismesh/mesh.html 15

16 Figure 2.1 Exemple d interrogation du thésaurus GEMET Ontologie : définition En philosophie, on définit l ontologie (du grec ontos, participe présent du verbe être) comme étant l étude de l être en tant qu être, c est-à-dire l étude des propriétés générales de ce qui existe. En s inspirant de cette définition, essayons de définir une ontologie en informatique. Ontologie - In theory, an ontology is a formal, explicit specification of a shared conceptualisation [4] - arboresence/treillis dont les noeuds/sommets correspondent à des concepts et les arêtes à des relations de type is a - théorie qui tente d expliquer les concepts qui existent dans le monde et comment ces concepts s imbriquent et s organisent. 7. Il s agit d une définition répandue de la notion d ontologie. Dans le cadre de notre projet, l équipe a enrichi cette notion : en enrichissant la notion de concept (voir partie suivante) ; en pondérant les relations is a : intuitivement, on saisit l intérêt d une telle démarche. En effet, il est logique de dire que, pour un individu français, le concept labrador est plus représentatif du concept chien que le concept Aïdi (chien originaire de l Atlas marocain). Le principal changement entre cette ontologie enrichie et la précédente est le fait qu elle est liée à un corpus de documents jugés représentatifs, à partir duquel on va calculer la pondération des liens is a et différents autres paramètres, que nous appelerons gradients (voir parties suivantes). Revenons premièrement sur la notion de concept. 16

17 Figure 2.2 Exemple d ontologie : hiérarchie des concepts issue du concept animal Les concepts : une vue sémantique d une entité Afin que les concepts de notre ontologie s approchent le plus possible de la façon dont un être pensant appréhende les entitiés qui l entourent, l équipe s est basée sur les études de sémiotique (théorie du sens) du scientifique/philosophe Charles Sanders Peirce. Ces études montrent que l être humain a trois façons de représenter un concept : point de vue intentionnel : on définit un concept par rapport à ses propriétés. Par exemple, on définira le concept feu comme étant quelque chose qui brûle et qui fait de la fumée. point de vue extensionnel : on définit un concept par rapport à des instances représentatives de ce concept. Par exemple, on définira le concept éléphant à l aide des instances Dumbo, Babar, ou l éléphant que l on a observé lors de notre dernière visite au zoo. point de vue expressionnel : on définit un concept par rapport à son champ lexical (mots le représentant) ou des symboles. Par exemple, les mots chien, toutou et clébard pour le concept chien, où une icône de flamme pour le concept feu. 17

18 Figure 2.3 Triangle de Peirce : les trois représentations du concept chat. Un être humain utilise ces trois points de vue pour définir un concept, se positionnant ainsi dans le triangle de Peirce. Selon que l on ait une connaissance approfondie d un domaine ou non, on se positionne plus au moins près des côtés du triangle. Par exemple, un zoologue définira l éléphant comme un pachyderme herbivore de poids important (point de vue intentionnel), alors qu un néophyte se référera à des instances d éléphants (point de vue extensionnel). A partir de ces études, on munit chaque concept d un moyen de représenter l aspect : intentionnel : un vecteur caractéristique de propriétés : pour toutes les propriétés définies dans l ontologie (peut voler, peut flotter...), on définit une valeur réelle comprise entre 0 et 1 représentant l importance de cette propriété pour définir ce concept. extensionnel : une liste d instances pondérées par la représentativité de chacune d elle pour ce concept. expressionnel : une liste de mots (simples chaînes de caractères) représentant tous les synonymes (labels) utilisés pour décrire ce concept. Là encore, on pondère chaque label en fonction de la manière dont il définit ce concept. On prend ainsi en compte les trois sommets du triangle de Peirce. Il va maintenant falloir définir un moyen de pondérer chacune des informations stockées. Pour ce faire, notre équipe a pris comme critère la prototypicalité d un élément par rapport à un autre, c est à dire sa capacité à résumer/représenter/définir l élément considéré. Comme nous l avons vu, cette notion dépend de chaque individu (culture, niveau de connaissance du domaine...). Nos ontologies ne porteront donc pas uniquement une vision sémantique de la connaissance, mais tiendront également compte de son côté subjectif et de sa dépendance à la culture, aux émotions et à 18

19 l éducation des individus qui en sont porteurs. Cette composante est des plus sensible lors de la phase de modélisation, de construction de l ontologie, plus précisément dans le choix des catégories et dans l élaboration des différentes hiérarchies. Le processus de décision d appartenance d un élément à une catégorie pour un individu donné se réalise en fonction d au moins deux éléments fortement subjectifs : le degré de prototypicalité d une part, et le niveau d abstraction d autre part. Ces points se mettent en place progressivement au fur et à mesure de l apprentissage de l agent humain dès l âge de six mois suivant certains spécialistes. 8 En se basant sur cette étude, on dira qu un élément est jugé typique s il représente un bon exemple de la catégorie, selon des critères propres à la culture, à l éducation et aux émotions de l individu. En reprenant un exemple précédent, pour le français moyen, la prototypicalité du concept labrador pour le concept chien sera beaucoup plus grande que la prototypicalité du concept aïdi pour le concept chien. Cherchons maintenant à quantifier précisemment ces relations de prototypicalité en créant une unité de mesure : les gradients de prototypicalité. 2.2 Les gradients de prototypicalité : des outils pour pondérer les relations entre concepts, labels, instances et propriétés L objectif des gradients est de pouvoir non seulement classer les résultats d une recherche par ordre de pertinence, mais également de les quantifier en fonction de leur valeurs. C est dans cet esprit que l équipe a développé différentes mesures, la première étant le gradient de prototypicalité conceptuelle(gpc). Les formules utilisées pour déterminier les gradients étant complexes et s appuyant sur plusieurs théories, nous nous contenterons ici de les exposer sans les justifier. La justification des formules est proposée dans les publications Gradients de prototypicalité appliqués à la personnalisation d ontologies [6] et Semiotic-based Prototypicality Gradient [8] Le gradient de prototypicalité conceptuelle Ce gradient est défini pour un concept père (C p ) et un concept fils(c f ), et sa valeur (entre 0 et 1) sera d autant plus grande que C f est typique pour C p. gpc(c p, C f ) = (α intensionnel(c p, C f ) + β extensionnel(c p, C f ) + γ expressionnel(c p, C f )) δ α, β et γ sont des coefficients réels représentant l importance de chaque approche pour apréhender un concept (α sera très élevé pour un spécialiste, β sera d autant plus fort que le sujet ne connait pas 8. Françoise Cordier. Les représentations cognitives privilégiées, typicalité et niveau de base. Presses Universitaires de Lille,

20 le domaine sur lequel porte l ontologie...). δ est la composante émotionelle. Découverte par des études en psychologie cognitive, cette composante s appuie sur le principe que plus on est stressé, plus on veut un résultat proche de notre recherche. En revanche, lorsque l on est détendu (positif), on accepte plus volontiers des concepts peu prototypiques (ouverture d esprit). On pourra imaginer divers moyens de calculer la composante émotionnelle d un utilisateur,tels la rapidité de déplacement de la souris sur la page, l analyse des messages postés par cet utilisateur, le nombre de clics par minute... On voit que le calcul du gpc fait appel à trois autres composantes : commençons par la composante expressionnelle, en définissant son moyen de calcul Composante expressionnelle du gpc L objectif de cette composante est de dire que tous les synonymes d un terme n ont pas forcément le même poids. Afin de déterminer dans quelle proportion le sous-concept représente le concept, on cherche à définir les relations entre leur termes : avec : expressionnel(c p, C f ) = pregnance(c f ) pregnance(c p) pregnance(c) = t lexique(c) count p(t) N t NbDoc(t) T otalnbdoc Cette formule pour calculer la prégnance permet d éviter, en prenant en compte la granularité, les effets de Buzz 9, qui polluerait l ontologie. Notre équipe travaille actuellement sur un moyen d intégrer le temps à cette formule : ainsi, si l on parle beaucoup de quelque chose mais pendant peu de temps, notre ontologie le détectera et minimisera le nombre d occurences du mot Composante extensionelle du gpc L objectif de ce gradient est de comparer les instances du concept fils à celles du concept père, toujours dans l optique de déterminer à quel point C f est typique de C p. extensionnel(c p, C f ) = NombreInstances(C f ) NombreInstances(C p). 9. Fait de parler énormément d un terme, mais dans peu de documents. Très courant sur le Web (Suzan Boyle...) 20

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION Séquence Lettres / Documentation / TICE Classe de 6è et club journal Collège Gabrielle Colette Puget sur Argens Académie de Nice Roxane Obadia CONSTAT INITIAL

Plus en détail

Présentation générale du projet data.bnf.fr

Présentation générale du projet data.bnf.fr Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données

Plus en détail

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Problématiques de recherche. Figure Research Agenda for service-oriented computing Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements

Plus en détail

Recherche bibliographique

Recherche bibliographique Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

MAITRISE DE L INFORMATION SCIENTIFIQUE

MAITRISE DE L INFORMATION SCIENTIFIQUE MASTER 1 BMC 2014-2015 MAITRISE DE L INFORMATION SCIENTIFIQUE claire.sonnefraud@upmc.fr Mise à jour août 2014 Contenu de la formation 2 cours en salle info : 2 * 2h 1 examen : 1h (décembre) Formation à

Plus en détail

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed 6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN

Plus en détail

ACCESS 2013. Système de Gestion de Bases de Données Relationnelles

ACCESS 2013. Système de Gestion de Bases de Données Relationnelles Access est un logiciel permettant de gérer des données en masse : une liste de clients ou de fournisseurs, un stock de produits, des commandes, des salariés, un club de tennis, une cave à vin, une bibliothèque,

Plus en détail

Les documents primaires / Les documents secondaires

Les documents primaires / Les documents secondaires Les documents primaires / Les documents secondaires L information est la «matière première». Il existe plusieurs catégories pour décrire les canaux d information (les documents) : - Les documents primaires

Plus en détail

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Journée organisée par le CRFCB Midi-Pyrénées / Languedoc-Roussillon

Plus en détail

P. 1. Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique

P. 1. Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique P. 1 Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique Début des années 1990 L Inist-CNRS va contribuer à l alimentation du premier corpus de la

Plus en détail

Les principaux domaines de l informatique

Les principaux domaines de l informatique Les principaux domaines de l informatique... abordés dans le cadre de ce cours: La Programmation Les Systèmes d Exploitation Les Systèmes d Information La Conception d Interfaces Le Calcul Scientifique

Plus en détail

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e : CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i

Plus en détail

Les technologies documentaires adhoc intégrées au sein des services SharePoint pour Windows.

Les technologies documentaires adhoc intégrées au sein des services SharePoint pour Windows. Les technologies documentaires adhoc intégrées au sein des services SharePoint pour Windows. Les services «Microsoft SharePoint» offrent aux utilisateurs Windows un ensemble de fonctions de stockage de

Plus en détail

Installer Joomla. 2013 Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring

Installer Joomla. 2013 Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring 3 Installer Joomla Dans ce chapitre, nous procéderons au téléchargement et à l installation manuelle de Joomla, et nous expliquerons la configuration de base. Les captures d écran et les instructions font

Plus en détail

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2 éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........

Plus en détail

SemWeb : Interrogation sémantique du web avec XQuery. Les membres du projet SemWeb

SemWeb : Interrogation sémantique du web avec XQuery. Les membres du projet SemWeb SemWeb : Interrogation sémantique du web avec XQuery Les membres du projet SemWeb Contexte et objectifs Le projet SemWeb s inscrit dans les efforts de recherche et de développement actuels pour construire

Plus en détail

Arbres binaires de recherche

Arbres binaires de recherche Chapitre 1 Arbres binaires de recherche 1 Les arbre sont très utilisés en informatique, d une part parce que les informations sont souvent hiérarchisées, et peuvent être représentées naturellement sous

Plus en détail

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte 1Les bases : vos objectifs 2 Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Plus en détail

Guide d utilisation du navigateur web OECD.Stat

Guide d utilisation du navigateur web OECD.Stat OECD.Stat 2008 2 / 39 Table des matières : Introduction... 4 Concepts liés à OECD.Stat... 4 Organisation des données... 4 Séries de référence... 5 Recherche... 5 Le navigateur web OECD.Stat... 5 Guide

Plus en détail

Orthophonie 3 e année. Les bases de données. Université Pierreet-Marie-Curie. www.upmc.fr

Orthophonie 3 e année. Les bases de données. Université Pierreet-Marie-Curie. www.upmc.fr Orthophonie 3 e année Les bases de données Université Pierreet-Marie-Curie www.upmc.fr Cours 1/3 Documentation Bibliographie Méthodologie de la recherche Recherche sur Internet Catalogues de bibliothèques

Plus en détail

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Mémento Ouvrir TI-Nspire CAS. Voici la barre d outils : L insertion d une page, d une activité, d une page où l application est choisie, pourra

Plus en détail

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL Prise en main de NVU et Notepad++ (conception d application web avec PHP et MySql) Propriétés Intitulé long Formation concernée Matière Présentation Description Conception de pages web dynamiques à l aide

Plus en détail

WordPress : Guide à l édition

WordPress : Guide à l édition WordPress : Guide à l édition WordPress : Guide à l édition... 1 Présentation... 2 1. Accès au site... 2 2. Le tableau de bord... 2 3. Editez les contenus... 4 Quelle est la différence entre les pages

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION OBJECTIFS GÉNÉRAUX DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION Découvrir les principales fonctionnalités des outils de

Plus en détail

Structures de données non linéaires

Structures de données non linéaires Structures de données non linéaires I. Graphes Définition Un graphe (simple) orienté G est un couple (S, A), où : S est un ensemble dont les éléments sont appelés les sommets. A est un ensemble de couples

Plus en détail

Catalogue des formations Edition 2015

Catalogue des formations Edition 2015 Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(

Plus en détail

Solutions en ligne Guide de l utilisateur

Solutions en ligne Guide de l utilisateur Solutions en ligne Guide de l utilisateur Décembre 2009 Informations générales... 1 Configuration minimale requise... 1 Connexion... 1 Page d accueil des Solutions en ligne... 2 Utilisation de la table

Plus en détail

OBJECTIFS DE CE GUIDE... 5 QU EST-CE QU UN DOCUMENT ACCESSIBLE... 5 LA STRUCTURE D UN DOCUMENT... 6 LES TITRES ET LES SOUS-TITRES...

OBJECTIFS DE CE GUIDE... 5 QU EST-CE QU UN DOCUMENT ACCESSIBLE... 5 LA STRUCTURE D UN DOCUMENT... 6 LES TITRES ET LES SOUS-TITRES... Diffusion de l information dans Internet Guide de création de documents Word accessibles 5 novembre 2009 OBJECTIFS DE CE GUIDE... 5 QU EST-CE QU UN DOCUMENT ACCESSIBLE... 5 LA STRUCTURE D UN DOCUMENT...

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne

Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne Vocabulaire juridique multilingue comparé Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne 22 novembre 2012 Vocabulaire juridique multilingue comparé La Cour

Plus en détail

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

Construction d'un entrepôt de métadonnées - LOM Application: E-learning

Construction d'un entrepôt de métadonnées - LOM Application: E-learning Construction d'un entrepôt de métadonnées - LOM Application: E-learning Nawel Iles, Azzeddine Chikh, Sidi Mohammed Chouiti Faculté des sciences de l ingénieur Université de Tlemcen Algérie (n_iles/ az_chikh

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Initiation à la recherche documentaire

Initiation à la recherche documentaire Initiation à la recherche documentaire 1 Objectifs Cette séance est destinée à reprendre les principes de la démarche documentaire pour construire un parcours pertinent en terme de méthodologie et de résultats

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction du cours Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Concevoir sa stratégie de recherche d information

Concevoir sa stratégie de recherche d information Concevoir sa stratégie de recherche d information Réalisé : mars 2007 Dernière mise à jour : mars 2011 Bibliothèque HEC Paris Contact : biblio@hec.fr 01 39 67 94 78 Cette création est mise à disposition

Plus en détail

Représentation de l information en binaire

Représentation de l information en binaire Représentation de l information en binaire Les ordinateurs sont capables d effectuer de nombreuses opérations sur de nombreux types de contenus (images, vidéos, textes, sons,...). Cependant, quel que soit

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

Structure documentaire d une ontologie

Structure documentaire d une ontologie Chapitre 4 Structure documentaire d une ontologie 1. Introduction Structure documentaire d une ontologie L ontologie en tant que fichier informatique comporte une structure qui lui est propre. En plus

Plus en détail

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Quatrième colloque hypermédias et apprentissages 275 BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Anne-Olivia LE CORNEC, Jean-Marc FARINONE,

Plus en détail

4. SERVICES WEB REST 46

4. SERVICES WEB REST 46 4. SERVICES WEB REST 46 REST REST acronyme de REpresentational State Transfert Concept introduit en 2000 dans la thèse de Roy FIELDING Est un style d architecture inspiré de l architecture WEB En 2010,

Plus en détail

Manuel d utilisation

Manuel d utilisation Manuel d utilisation La référence des comptables-fiscalistes Votre login Votre mot de passe Une question Voyez l aide détaillée accessible en ligne ou les questions les plus fréquemment posées par les

Plus en détail

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l

Plus en détail

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs

Plus en détail

Normes et standards FOAD. Cognifer / Moodle

Normes et standards FOAD. Cognifer / Moodle Normes et standards FOAD «L interopérabilité pédagogique» Interopérabilité de plates-formes FOAD dans l échange de ressources pédagogiques Cognifer / Moodle Manuel de procédures élaboré par Mokhtar BEN

Plus en détail

PHP/MYSQL. Web Dynamique

PHP/MYSQL. Web Dynamique PHP/MYSQL Web Dynamique ENSG Juin 2008 Qui suis-je? Guillaume Gautreau Responsable projets Systèmes d information à l ENPC guillaume@ghusse.com http://www.ghusse.com Ces 6 jours de formation Jour 1 : présentations,

Plus en détail

LA BASE DE DONNÉES PATRIMOINE IMMOBILIER, MOBILIER ET

LA BASE DE DONNÉES PATRIMOINE IMMOBILIER, MOBILIER ET LA BASE DE DONNÉES PATRIMOINE IMMOBILIER, MOBILIER ET IMMATÉRIEL DU QUÉBEC ET LE RÉPERTOIRE DU PATRIMOINE CULTUREL DU QUÉBEC. ÉTAT DES LIEUX ET PERSPECTIVES POUR L INVENTAIRE DU PATRIMOINE IMMATÉRIEL.

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

4. Personnalisation du site web de la conférence

4. Personnalisation du site web de la conférence RTUTORIEL Prise en main de la plateforme 1. Création de l espace conférence Connectez- vous sur le portail http://test- www.sciencesconf.org avec le compte : - Identifiant : «admin1» - Mot de passe «1234»

Plus en détail

Aide : publication de décisions VS

Aide : publication de décisions VS Aide : publication de décisions VS Table des Matières Introduction... 2 Recherche (Recherche dans le texte intégral)... 2 Filtres... 3 Collection d arrêts... 4 Date de la décision et date de publication...

Plus en détail

L'audiodescription. Principes et orientations

L'audiodescription. Principes et orientations L'audiodescription Principes et orientations Rendre la culture accessible à tous permet d éviter l exclusion. L audiodescription est une technique de description destinée aux personnes aveugles et malvoyantes.

Plus en détail

Introduction au WEB Sémantique Cours 2 : Ontologies

Introduction au WEB Sémantique Cours 2 : Ontologies Cours 2 : Ontologies ESIL Université de la méditerranée Odile.Papini@esil.univmed.fr http://odile.papini.perso.esil.univmed.fr/index.html Plan du cours 1 Introduction 2 3 4 5 Bibliographie I Supports de

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Cours de Base de Données Cours n.2 Introduction à MySQL/PhPMyAdmin

Cours de Base de Données Cours n.2 Introduction à MySQL/PhPMyAdmin Cours de Base de Données Cours n.2 Introduction à MySQL/PhPMyAdmin Ce cours reprend beaucoup de transparents du cours de Philippe LAHIRE Elisabetta De Maria - edemaria@i3s.unice.fr UFR Sciences et Laboratoire

Plus en détail

data.bnf.fr Mieux exposer des données hétérogènes, grâce aux outils du Web sémantique SemWeb Pro 02 mai 2012

data.bnf.fr Mieux exposer des données hétérogènes, grâce aux outils du Web sémantique SemWeb Pro 02 mai 2012 data.bnf.fr Mieux exposer des données hétérogènes, grâce aux outils du Web sémantique SemWeb Pro 02 mai 2012 Romain Wenz Bibliothèque nationale de France Conservateur Département de l information bibliographique

Plus en détail

SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES

SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES NANCY 18-19 MARS 2015 Jean-Marie Pierrel Université de Lorraine OBJECTIFS DES SERVICES À VALEURS AJOUTÉES Définir des services à valeurs ajoutées sur la

Plus en détail

Brève introduction au Web Sémantique

Brève introduction au Web Sémantique Brève introduction au Web Sémantique Bernard ESPINASSE Professeur à l'université d'aix-marseille 2010 Du Web au Web Sémantique : Le Web Sémantique : Architecture du Web Sémantique Langages du Web Sémantique

Plus en détail

Carrefour de l information Université de Sherbrooke. Flash MX 2004 (Notions de base)

Carrefour de l information Université de Sherbrooke. Flash MX 2004 (Notions de base) Carrefour de l information Université de Sherbrooke (Notions de base) Créé par : Josée Martin (hiver 2005) Révisé et augmenté par : Geneviève Khayat (hiver 2006) Sherbrooke Hiver 2006 Table des matières

Plus en détail

Gérer l activité d un service informatique

Gérer l activité d un service informatique Gérer l activité d un service informatique SOMMAIRE Les activités d un service informatique sont nombreuses et variées. Leur gestion nécessite un minimum d organisation. Heureusement, une fois encore,

Plus en détail

Conversion des requêtes en langage naturel vers nrql

Conversion des requêtes en langage naturel vers nrql Conversion des requêtes en langage naturel vers nrql Hasna Boumechaal 1, Sofiane Allioua 2, Zizette Boufaida 3 1 Université Mentouri, Constantine, Algérie boumechaal.h@gmail.com 2 Laboratoire LIRE, Université

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Un cours d introduction à la démarche mathématique. Martine De Vleeschouwer, Suzanne Thiry

Un cours d introduction à la démarche mathématique. Martine De Vleeschouwer, Suzanne Thiry Aide à la transition dans une formation universitaire d un mathématicien en Belgique Un cours d introduction à la démarche mathématique Martine De Vleeschouwer, Suzanne Thiry Université de Namur, Unité

Plus en détail

Adapter les catalogues à l environnement numérique

Adapter les catalogues à l environnement numérique Rencontres nationales des bibliothécaires musicaux 2009 Adapter les catalogues à l environnement numérique Françoise Leresche Bibliothèque nationale de France Département de l information l bibliographique

Plus en détail

C est en marchant que se fait le chemin. Paulo Coelho.

C est en marchant que se fait le chemin. Paulo Coelho. i C est en marchant que se fait le chemin. Paulo Coelho. c Saidi Imène,. Typeset in L A TEX 2ε. ii A ma maman A ma grand-mère et mes deux oncles A mes frères et sœurs et toute la famille A mon professeur

Plus en détail

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES 1e partie : encoder et structurer les données Gautier Poupeau Antidot http://www.lespetitescases.net Twitter @lespetitescases Emmanuelle Bermès

Plus en détail

fichiers Exemple introductif : stockage de photos numériques

fichiers Exemple introductif : stockage de photos numériques b- La Gestion des données Parmi les matériels dont il a la charge, le système d exploitation s occupe des périphériques de stockage. Il s assure, entre autres, de leur bon fonctionnement mais il doit être

Plus en détail

L informatique en BCPST

L informatique en BCPST L informatique en BCPST Présentation générale Sylvain Pelletier Septembre 2014 Sylvain Pelletier L informatique en BCPST Septembre 2014 1 / 20 Informatique, algorithmique, programmation Utiliser la rapidité

Plus en détail

Paris à travers le temps

Paris à travers le temps Paris à travers le temps Paris à travers le temps Page 1 sur 1 Sommaire Introduction I. Synopsis II. Cahier des charges III. Scénario IV. Story board Conclusion Paris à travers le temps Page 2 sur 2 Introduction

Plus en détail

PROGRAMME DE LANGUES VIVANTES DE LA VOIE PROFESSIONNELLE

PROGRAMME DE LANGUES VIVANTES DE LA VOIE PROFESSIONNELLE PROGRAMME DE LANGUES VIVANTES DE LA VOIE PROFESSIONNELLE Proposition d aide à la mise en œuvre pédagogique Domaine : SE CULTIVER ET SE DIVERTIR Programme National de pilotage Séminaire «Mise en œuvre pédagogique

Plus en détail

SEO Camp'us -4 et 5 février 2009. Directeur du pôle métiers Aposition

SEO Camp'us -4 et 5 février 2009. Directeur du pôle métiers Aposition L'apport de la sémantique et de la linguistique statistique pour le SEO SEO Camp'us -4 et 5 février 2009 Philippe YONNET Directeur du pôle métiers Aposition Président de l association SEOCamp Comment classer

Plus en détail

Devenez un véritable développeur web en 3 mois!

Devenez un véritable développeur web en 3 mois! Devenez un véritable développeur web en 3 mois! L objectif de la 3W Academy est de former des petits groupes d élèves au développement de sites web dynamiques ainsi qu à la création d applications web

Plus en détail

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau) CS WEB Ch 1 Introduction I. INTRODUCTION... 1 A. INTERNET INTERCONNEXION DE RESEAUX... 1 B. LE «WEB» LA TOILE, INTERCONNEXION DE SITES WEB... 2 C. L URL : LOCALISER DES RESSOURCES SUR L INTERNET... 2 D.

Plus en détail

Département Informatique 5ème année 2008-2009. Cahier des Charges

Département Informatique 5ème année 2008-2009. Cahier des Charges École Polytechnique de l Université de Tours 64, Avenue Jean Portalis 37200 TOURS, FRANCE Tél. +33 (0)2 47 36 14 14 Fax +33 (0)2 47 36 14 22 www.polytech.univ-tours.fr Département Informatique 5ème année

Plus en détail

Les nouveaux sites documentaires de l IRD

Les nouveaux sites documentaires de l IRD Les nouveaux sites documentaires de l IRD Nouvel Horizon, nouvel intranet, nouveaux Netvibes - IRD France Sud - Logo d après Clipart-fr et Freepik.com De quoi allons nous parler? Les sites de la Documentation

Plus en détail

Entraînement, consolidation, structuration... Que mettre derrière ces expressions?

Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Il est clair que la finalité principale d une démarche d investigation est de faire acquérir des connaissances aux élèves.

Plus en détail

De la carte heuristique à l ordonnancement des tâches

De la carte heuristique à l ordonnancement des tâches Gestion de projet en terminale et en STS De la carte heuristique à l ordonnancement des tâches Logiciel MindView L'usage des cartes heuristiques est encore aujourd'hui du domaine de l expérimentation,

Plus en détail

Introduction ASP.NET

Introduction ASP.NET 1 Sommaire Introduction... 1 1 Framework... 2 1.1 Général (.NET)... 2 1.2 ASP.NET... 2 2 Prérequis... 2 3 Présentation des bases d un projet ASP.NET... 3 3.1 Création d un projet... 3 3.2 Site Web : Les

Plus en détail

Atelier Cognisud. Contribution à PIRSTEC pour un appel d offre ANR

Atelier Cognisud. Contribution à PIRSTEC pour un appel d offre ANR Atelier Cognisud Contribution à PIRSTEC pour un appel d offre ANR Ces notes sont une contribution à la réflexion dans le cadre de PIRSTEC, faite par le réseau Cognisud suite à un atelier organisé le Jeudi

Plus en détail

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

Jade. Projet Intelligence Artificielle «Devine à quoi je pense» Jade Projet Intelligence Artificielle «Devine à quoi je pense» Réalisé par Djénéba Djikiné, Alexandre Bernard et Julien Lafont EPSI CSII2-2011 TABLE DES MATIÈRES 1. Analyse du besoin a. Cahier des charges

Plus en détail

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales D 1.3.2 Rapport d analyse Auteurs: Johann Luethi, Laurent Opprecht, Patrick Roth

Plus en détail

MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT

MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT ANNEXE VI MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT RECOMMANDATIONS GÉNÉRALES Les utilisateurs s attendent à trouver dans les définitions des

Plus en détail

Compilateurs : Analyse lexicale. Vous êtes ici 2. Analyse lexicale 4. Matthieu Amiguet. En entrée d un compilateur, on a généralement un fichier

Compilateurs : Analyse lexicale. Vous êtes ici 2. Analyse lexicale 4. Matthieu Amiguet. En entrée d un compilateur, on a généralement un fichier Compilateurs : Matthieu Amiguet 2009 2010 Vous êtes ici 2 Partie Avant Analyse syntaxique Analyse sémantique Arbre syntaxique abstrait (AST) Partie Arrière Optimisation de l AST Génération de code Optimisation

Plus en détail

Créer et partager des fichiers

Créer et partager des fichiers Créer et partager des fichiers Le rôle Services de fichiers... 246 Les autorisations de fichiers NTFS... 255 Recherche de comptes d utilisateurs et d ordinateurs dans Active Directory... 262 Délégation

Plus en détail

I) - DEFINITIONS I-A) TERMINOLOGIE

I) - DEFINITIONS I-A) TERMINOLOGIE Venise CANABADY Lycée Amiral Bouvet St Benoît PARTIE I - DEFINITIONS PARTIE II - LES GRANDES FONCTIONNALITES DE LA GED PARTIE III - GED : INDEXATION ET OUTILS PARTIE IV- LA GESTION ÉLECTRONIQUE DES DOCUMENTS

Plus en détail

Base de données relationnelle et requêtes SQL

Base de données relationnelle et requêtes SQL Base de données relationnelle et requêtes SQL 1e partie Anne-Marie Cubat Une question pour commencer : que voyez-vous? Cela reste flou Les plans de «Prison Break»? Non, cherchons ailleurs! Et de plus près,

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

Découverte de la calculatrice TI-nspire CX / TI-nspire CX CAS

Découverte de la calculatrice TI-nspire CX / TI-nspire CX CAS Découverte de la calculatrice TI-nspire CX / TI-nspire CX CAS Ce document a été réalisé avec la version 3.02 de la calculatrice TI-Nspire CX CAS. Il peut être traité en une ou plusieurs séances (la procédure

Plus en détail

De la «normalisation» à l échange des données sur l eau : le Sandre. Dimitri MEUNIER : d.meunier@oieau.fr

De la «normalisation» à l échange des données sur l eau : le Sandre. Dimitri MEUNIER : d.meunier@oieau.fr De la «normalisation» à l échange des données sur l eau : le Sandre Dimitri MEUNIER : d.meunier@oieau.fr Le cadre de travail Le système d information sur l eau (SIE) est un dispositif pour le partage et

Plus en détail

LoReNa : pour dynamiser votre Relation Client (CRM)

LoReNa : pour dynamiser votre Relation Client (CRM) LoReNa : pour dynamiser votre Relation Client (CRM) Valorisez votre Relation Client! http://www.lorena.pro/nossolutions/crm.aspx Introduction La connaissance du client est une des bases de la réussite

Plus en détail

Générer du code à partir d une description de haut niveau

Générer du code à partir d une description de haut niveau Cedric Dumoulin Générer du code à partir d une description de haut niveau Ce projet vise à fournir un environnement de développement permettant de modéliser des UI Android à un haut niveau d abstraction,

Plus en détail

DOMAINE DE LA MATHÉMATIQUE, DE LA SCIENCE ET DE LA TECHNOLOGIE

DOMAINE DE LA MATHÉMATIQUE, DE LA SCIENCE ET DE LA TECHNOLOGIE ÉCOLE SECONDAIRE DE MIRABEL GUIDE DE CHOIX DE COURS 2015-2016 Quatrième secondaire CHOIX D OPTIONS DOMAINE DE LA MATHÉMATIQUE, DE LA SCIENCE ET DE LA TECHNOLOGIE SÉQUENCE CULTURE, SOCIÉTÉ ET TECHNIQUE

Plus en détail

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire Formation continue des personnels URCA Offre de la Bibliothèque Universitaire Année 2012-2013 Bibliothèque Universitaire Formation continue pour le personnel de l URCA Modalités o Public : personnels de

Plus en détail

La recherche avec l interface COLLEGE

La recherche avec l interface COLLEGE BCDI 2.06 - Recherche Usager COLLEGE Modif : 09/10/2009 1 La recherche avec l interface COLLEGE Nouveauté 1. Paramétrages de l interface de recherche : COLLEGE 1.1 Onglet Interfaces Supprimer toutes les

Plus en détail