Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen

Dimension: px
Commencer à balayer dès la page:

Download "Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen"

Transcription

1 Développement d un moteur de recherche sémantique : une contribution au projet Ethnosiris dédié à la préservation du patrimoine populaire vendéen A. Lagarde - C. Renaudineau mémoire soutenu le 09 Juin 2009 Mémoire de Master 1 en Informatique Faculté des Sciences et Techniques - Université de Nantes LINA - Laboratoire d Informatique de Nantes Atlantique (UMR CNRS 6241) Equipe Connaissances et Décision Partenaire institutionnel : EthnoDoc-AREXCPO (Association de Recherche et d EXpression pour la Culture POpulaire)

2 Table des matières I Recherche d information sémantique : fondements théoriques 7 1 Recherche d informations dans un fond documentaire Principe d un système de recherche d informations L indexation lexicale : un procédé d optimisation de SRI efficace Importance des meta-informations dans un SRI Indexation lexicale : définition et principes Un exemple d indexation lexicale : Lucène La recherche d informations syntaxique : un mécanisme limité la recherche d information syntaxique : un mécanisme s appuyant fortement sur l indexation lexicale Limites d une recherche d information syntaxique Une solution potentielle : recherche d informations sémantique Ontologies et recherches d informations sémantiques Les Ontologies : un moyen de structurer des concepts Thésaurus : un dictionnaire introduisant des relations inter-termes Ontologie : définition Les concepts : une vue sémantique d une entité Les gradients de prototypicalité : des outils pour pondérer les relations entre concepts, labels, instances et propriétés Le gradient de prototypicalité conceptuelle Composante expressionnelle du gpc Composante extensionelle du gpc Composante intentionelle du gpc Gradient de prototypicalité lexical Exemple concret de la puissance d une recherche sémantique comparée à une recherche syntaxique Principe de la recherche d informations syntaxique (sans ontologie)

3 2.3.2 Principe de la recherche d informations à l aide de la plateforme Ethnosiris (avec ontologie) Etat de l art : formats d ontologie, ontologies célèbres et moteurs de recherche sémantique Formats d ontologie, logiciels d édition et ontologies célèbres Démonstration de la puissance des ontologies Les moteurs de recherche sémantiques actuels II Présentation du cadre applicatif du projet Ethnosiris 28 4 L association Arexpo et son fond documentaire L association AREXCPO L association EthnoDoc Mission de l association : collecte d informations relatives au patrimoine Vendéen La base de données EthnoDoc : un fond documentaire annoté et indéxé Travail effectué sur la base de données Ontologie fournie : OnthnoPhoto 32 III Contribution au projet : Ethnosiris, un moteur de recherche sémantique 34 6 Spécifications du moteur de recherche sémantique Attentes et contraintes sur le moteur Cas d utilisation d une recherche sémantique Le nuage de mots clés : un outil adapté aux focus Trois échelles de focalisation Focus sur le fond documentaire indépendemment de toute recherche Focus sur le fond documentaire vis-à-vis d une recherche Focus sur une ressource par rapport à une recherche Prémices au développement : choix du langage et de la structure générale du moteur de recherche Le choix d un langage portable et robuste Mise au point d une structure modulaire et réutilisable L implémentation de l ontologie Principaux choix d implémentation Les classes concepts, labels et instance

4 8.1.2 La classe Ontogie : opérations de parcours en temps minimal Optimisations nécessaires au fonctionnement de l ontologie sur un serveur PhP Implémentations des différentes recherches La recherche syntaxique Le gestionnaire de mots clés La pertinence syntaxique L afficheur La recherche sémantique La pertinence sémantique L afficheur Affineur de recherche Implémentation des Nuages Tags 52 4

5 Introduction L objectif de ce document est de présenter les différentes théories et procédés qui ont permis l implémentation d un moteur de recherche sémantique basé sur un fond documentaire (EthnoDoc) et sur une ontologie (OnthoPhoto). Ce moteur de recherche constitue un des éléments principaux de la plateforme Ethnosiris, plateforme dont le but est de permettre une recherche sémantique sur un corpus de documents indexés lexicalement. Cette plateforme devra pouvoir être intégrée à n importe quel corpus indexé ; elle devra par conséquent être multilingue, multi-dialecte et polygraphe (plusieurs alphabets). De plus, elle présentera des sessions d interactions identiques à un moteur de recherche d informations traditionnel (via champs de saisie de mots-clés), les seules différences avec ce dernier étant relatives à la pertinence des résultats fournis et aux comportements face à différents cas critiques. L acquisition et la représentation d informations par un système informatique ont toujours fait partie des problématiques fondamentales, non seulement dans la recherche informatique, mais également dans toute recherche relative à la sémiotique (étude du sens des choses) ou à la psychologie cognitive (centrée sur la mémoire, l apprentissage et le raisonnement). En 1968, un informaticien et un psychologue (Collin et Quillian), ont cherché à définir une représentation des informations stockées dans nos mémoires. A force d expériences basées sur le temps de réponse à des affirmations du style un chien est un animal et un chien est un mammifère, ils ont réussi à construire un modèle hiérarchique de catégories. Cette hiérarchisation de concepts est la base du modèle ontologique. Dans une première partie, nous présenterons les fondements et caractéristiques d un moteur de recherche d informations, puis nous enrichirons la notion d ontologie en présentant les ontologies pragmatisées [1], i.e des ontologies prenant en compte l aspect subjectif de la représentation de connaissances. Nous effectuerons également un bref état de l art des ontologies et de leur application dans le cadre d un système de recherche d informations sémantique. Dans un second temps, nous décrirons le cadre applicatif du projet Ethnosiris, en présentant les partenaires du projet, puis en détaillant le fond documentaire utilisé et l ontologie fournie. Nous reviendrons enfin sur notre contribution au projet Ethnosiris, en décrivant premièrement le 5

6 travail de spécification que nous avons effectué. En particulier, on veillera à la généricité (incluant des aspects polylingues et polygraphes), la portabilité (doit fonctionner sur tout type de serveur, fond et ontologie) et la complexité de l implémentation du moteur de recherche Ethnosiris. Nous discuterons finalement des principaux choix d implémentation effectués. Sans les citer formellement, nous nous sommes appuyé sur les travaux de l équipe de recherche COD (COnnaisance et Décision) [5, 2, 7, 3]. 6

7 Première partie Recherche d information sémantique : fondements théoriques 7

8 Chapitre 1 Recherche d informations dans un fond documentaire 1.1 Principe d un système de recherche d informations La recherche d informations occupe une place centrale dans l activité de n importe quel individu, qu il s agisse d une recherche documentaire dans une bibliothèque, d une recherche de produits dans un supermarché ou de la recherche de pages Web sur Internet. Dans tous ces cas, le cerveau humain effectue un travail en deux temps : 1. Premièrement, il qualifie la recherche (collection de livres, boîte de ravioli ou site Internet) à partir d une liste de caractéristiques (titre, catégorie et édition du livre,type du produit...). 2. Deuxièmement, il retourne les ressources les plus pertinentes pour la recherche fournie : par exemple, on se souvient de deux boîtes de ravioli achetées il y a plusieurs mois, et pour chacune d elles l endroit où la trouver (emplacement de la ressource). Ce travail effectué par notre cerveau constitue la base d un système de recherche d informations (SRI) : son rôle sera de comprendre la recherche, puis de fournir les ressources qu il pense être en relation avec ce qui lui est demandé. En se basant sur ces postulats, il est possible de déduire deux propriétés fondamentales d un SRI : 1. La mémoire : pour pouvoir identifier les ressources concernées par la recherche, le SRI devra se souvenir des caractéristiques (métadonnées) de chacune d entre elles. 2. La capacité de raisonnement : afin d évaluer la pertinence d une ressource par rapport à une recherche, le SRI devra suivre un raisonnement, guidé par différents critères. Il ne faut pas confondre moteur de recherche et SRI : en effet, bien que le moteur de recherche constitue le coeur d un SRI, il n en est qu un composant : un SRI peut également être muni de : 8

9 - fonctions d acquisition, qui lui permettront d ajouter des documents à sa mémoire. - fonctions d annotation, chargées de gérer les caractéristiques (meta-informations) des documents ajoutés. Ces fonctions doivent permettre la modification de ces meta-informations, et peuvent proposer différents moyens d accès, notamment leur indexation. - fonctions heuristiques, dont le rôle est de guider la recherche selon différents critères. Bien que le travail que nous ayons fourni ne concerne que l aspect moteur de recherche, nous nous appuyons bien évidemment sur ces différentes fonctions. Il convient donc de revenir sur certains mécanismes fondamentaux d un SRI, et en particulier le procédé d indexation lexicale. 1.2 L indexation lexicale : un procédé d optimisation de SRI efficace Importance des meta-informations dans un SRI Lorsque vous saisissez un terme dans un moteur de recherche classique (et ce fait est encore plus vrai pour un SRI de type sémantique), vous fournissez au système au moins une caractéristique qualifiant votre recherche. Cette caractéristique peut être de nature diverse : en effet, elle peut concerner le contenu textuel du document (titre, mots clés...), sa nature (type de fichier, organisation du document) ou aborder des notions plus abstraites comme les thèmes abordés ou encore sa localisation dans l espace ou le temps. Nous voyons clairement que le système doit au préalable avoir effectué un apprentissage, qui lui aura permis d établir des liaisons (caractéristique - document) ; cet apprentissage n est ni plus ni moins que la phase d indexation. La phase de recherche d informations peut être alors assimilée à un processus de reconnaissance de caractéristiques. Comme le dit Platon, La connaissance des mots conduit à la connaissance des choses. D une manière analogue, la connaissance des meta-informations d un document conduit à la connaissance du document lui-même. Réciproquement, un système de recherche d information ne peut donner de réponses pertinentes que si l index sur lequel il va se fonder a reçu un apprentissage suffisant. Le choix des critères à intégrer lors de l acquisition d un nouveau document est donc primordial, et constitue l un des travaux essentiels d un bon SRI. 9

10 1.2.2 Indexation lexicale : définition et principes Indexation - identification de l information contenue dans tout texte et représentation au moyen d un ensemble d entités (appelé index) pour faciliter la comparaison entre une recherche et la représentation d un document - transfert de l information contenue dans le texte vers un autre espace de représentation traitable par un système informatique. Autrement dit, un index peut être assimilé à une fonction f : D - M, où D est l ensemble des documents et M l ensemble des descripteurs. On dit qu un document DOC traite un thème identifié par un ensemble de descripteurs D si d D : d f(doc). On dit que les descripteurs d un Thème T décrivent un document DOC si t descripeurs(t) : d f 1 (DOC). Ces descripteurs peuvent être de différentes natures : - les mots simples du texte (hors mots vides, mots outils comme les articles ou les pronoms, etc...) ; - les groupes de mots du texte (à valeur sémantique plus forte que les mots simples). Par exemple, le groupe de mots danse traditionnelle vendéenne aura plus de valeurs que ces trois mots pris séparemment. - les radicaux des mots extraits, exemple : équins et équidés ont la même racine. On se base alors sur l étymologie pour regrouper des mots, ce qui permet d optimiser la taille de l index, mais qui peut se révéler faux : par exemple, les mots solstice et soleil ont le même radical mais désigne pourtant des notions différentes ; - des concepts définis par l utilisateur à partir d un vocabulaire organisé, d un thésaurus... - des N-grammes, suite de n caractères consécutifs ; - les contextes : termes n apparaissant pas explicitement dans le texte du document mais ayant un lien sémantique et/ou de co-occurence avec les mots du texte. Par exemple, si le mot hibou n est pas dans le document considéré mais, que dans d autres documents, il apparaît très souvent à côté du mot chouette, on considérera qu il existe une relation de co-occurence entre les mots hibou et chouette. - les mots simples hors mots vides (pronoms et déterminants) ; cette indexation favorise la précision 1 de la recherche (on est alors certain que les documents trouvés contiennent bien les termes présents dans la requête), mais engendre un index de taille volumineuse, et peut entrainer le rejet de certains documents pourtant en rapport avec la recherche. Par exemple, on lance une recherche sur le descripteur caniches. Avec ce type d indexation, tous les documents contenant ce mot au 1. Rapport du nombre de textes reconnus et contenant réellement le terme de la requête par le nombre de textes contenant un terme différent mais identifié comme contenant celui demandé dans la requête. 10

11 singulier uniquement ne seront pas retournés par la recherche. - les radicaux, afin de tenir compte des variations morphologiques (i.e variation du genre, du temps, de la personne ou du pluriel d un mot). Par exemple, adolescence et adolescents seront ramenés au radical adolesc. Cette méthode offre une amélioration du rappel 2 et nécessite un index de taille plus faible que pour le cas précédent. Cependant, cette technique d indexation peut provoquer une baisse de la précision de la recherche (mise en rapport des termes canif et caniche car il est très difficile de savoir que l un n est pas une variation morphologique de l autre). - les lemmes, indexation plus fine et concentrée sur les variations flexionnelles mais qui demande une opération préalable de traitement linguistique des textes ; cette méthode offre une augmentation du rappel et une baisse de la précision. Établir un index sur un corpus de documents consiste donc à attribuer à chacun des documents des descripteurs (i.e objets décrivant, caractérisant, un document à partir de son contenu). Le rôle d un index est par conséquent double, à savoir rôle de résumé (qualifier le document) et rôle d outil de recherche d information (accès à ce document à partir de son index, pendant la recherche lexicale). De part les multiples techniques d indexation présentées dans cette section, on voit bien l importance du choix de l une d entre elles, et des répercussions que ce choix peut avoir, non seulement en terme de qualité de la recherche (rappel et précision), mais également en terme de performances (taille de l index et rapidité de la recherche) Un exemple d indexation lexicale : Lucène Lucène est un moteur d indexation et de recherche lexicale libre 3. Cette API réalise une indexation à partir des radicaux (cf section 1.2.2), en supprimant au préalable les mots vides au moyen soit d un analyseur standard, soit d un analyseur propre à une langue. Toutes les chaînes de caractères sont dans un premier temps converties en minuscules. Les mots sont ensuite filtrés de manière à supprimer tous ceux qui ne sont pas particulièrement porteurs de sens (par défaut une liste propre à chaque langue est utilisée, liste ouverte et donc modifiable). Pour terminer, seules les racines sont retenues pour l indexation. On notera des performances très intéressantes : environ 4 minutes pour indexer un thésaurus de 3Mo(WordNet : http ://wordnet.princeton.edu). 2. Rapport du nombre de textes reconnus et contenant réellement le terme de la requête par le nombre de textes contenant ce terme mais non cités dans la réponse. 3. Site internet : http : //lucene.apache.org/ 11

12 1.3 La recherche d informations syntaxique : un mécanisme limité la recherche d information syntaxique : un mécanisme s appuyant fortement sur l indexation lexicale Le façon la plus courante d implémenter une recherche d information syntaxique est d effectuer une indexation sur les documents, puis de lancer une recherche lexicale sur cette index. On pourra notamment citer les moteurs de recherche Google et Yahoo, qui fonctionnent en deux temps : 1. Lors de la détection d un nouveau site (via des robots parcourant le Web) : Qualification du site à partir d une heuristique d indexation : on créé les descripteurs du site à partir de son adresse Internet et de son contenu, en pondérant chaque mot par son ocurrence sur le site et le type de balise dans lequel il apparaît (balise titre ou simple paragraphe). On incorpore également des méta-informations sur le site (langue(s) utilisée(s), site commercial ou non...). Ajout de ces descripteurs à l index du moteur de recherche. 2. Lors du lancement d une recherche A partir d une heuristique de parcours de l index, sélection des descripteurs correspondant aux critères de la recherche. A partir de ces descripteurs, obtention des documents concernés. Affichage de ces documents, triés selon le nombre de descripteurs satisfaisant la recherche. On voit ici que l indexation lexicale est au centre de toute recherche d informations syntaxique. Nous allons maintenant mettre en évidence les limites d un tel mécanisme Limites d une recherche d information syntaxique Par définition, le mécanisme d indexation lexicale ne prend pas en compte le sens des mots indexés : on considère ici un mot comme une suite de caractères. Or un mot est bien plus que cela : il possède de nombreuses relations avec d autres mots : synonymie, antinomie... Au delà de ces relations, un mot désigne souvent une entité physique du monde, cette entité ayant elle-même des relations avec d autres entitiés, et d autres mots. Prenons un exemple pour illustrer cette pauvreté : sur le moteur de recherche Google, je lance une recherche sur le mot teckel. Admettons qu aucun des documents indexés ne possède le descripteur associé à ce mot. Aucun résultat ne m est donc proposé. Cependant, le mot teckel de la langue française désigne un animal appartenant à la famille des canidés. Si l on avait fait une demande de livre associé au sujet teckel dans une bibliothèque, un documentaliste consciencieux, après avoir constaté qu il n avait aucun livre sur ce sujet précis, nous aurait proposé différents livres traitant des sujets voisins, c est à dire des livres parlant de canidés. Une recherche d information syntaxique basé sur une indexation lexicale ne permet pas d établir des liens entre différents descripteurs. Elle ne permettra donc pas d effectuer des opérations pourtant 12

13 utiles sur les documents retournés, telles que la proposition de documents similiaires si aucun résulat n est trouvé, ou la sélection de document plus représentatifs que d autres (sur des critères autre que le nombre d occurence d un mot). Or, comme le dit Bouddha, Meilleur que mille mots privés de sens est un seul mot raisonnable. Il convient donc de s interroger sur la possibilité de munir notre recherche, en plus d un index lexical, d une structure qui permettra de définir des relations entre les descripteurs Une solution potentielle : recherche d informations sémantique A partir du constat effectué dans la partie précédente, il convient de s interroger sur la possiblité de définir un nouveau type de recherche d informations qui, au lieu de se baser uniquement sur l indexation lexicale (un mot est alors une simple chaîne de caractères) prendrait en compte le sens des mots. Intuitivement, on perçoit la nécessité d utiliser une nouvelle structure, qui définirait des relations entre les mots-clés : par exemple, les mots chien et chat, bien que différents, désignent tous les deux des animaux domestiques. La question est de savoir comment organiser ces relations : en effet, elles peuvent être de nature très différentes (synonymie, appartenance à une même famille...), et on a vu dans les parties précédentes qu elles doivent être indexées pour permettre une recherche rapide et efficace. Dans le chapitre suivant, nous essayerons de définir une telle structure, en utilisant à la fois des normes et conventions informatiques et des travaux relatifs à la psychologie humaine, pour que le sens que l ontologie donne aux mots s approche le plus possible de celui que lui donnerait un être pensant. 13

14 Chapitre 2 Ontologies et recherches d informations sémantiques 2.1 Les Ontologies : un moyen de structurer des concepts Présentons premièrement la structure qui rendra possible la recherche sémantique : l ontologie. Avant de définir précisemment ce qu est une ontologie, on reviendra sur la notion de thésaurus, qui constitue un bon point de départ pour notre analyse Thésaurus : un dictionnaire introduisant des relations inter-termes Un thésaurus est un répertoire de termes normalisés pour l analyse de contenu et le classement de documentation dans un domaine 1. Cette définition aborde plusieurs notions fondamentales : premièrement, un thésaurus est donc une liste de termes relatifs à un domaine de connaissances particulier. Deuxièmement, la notion de classement est très importante : un thésaurus va définir des relations de type linguistique entre les termes de son dictionnaire, comme par exemple la synonymie, l antonymie, etc. C est un premier pas vers notre objectif, à savoir représenter le sens des mots : grâce au thésaurus, on est capable de dire si deux mots représentent la même idée. Quels sont les avantages concrets d un Thésaurus par rapport à un simple index? apport pour chaque terme d une liste de synonymes permettant une première possibilité d extension des requêtes ; offre d enrichissement du vocabulaire initial ; existence d un format d écriture standardisé : Simple Knowledge Organisation System11 (SKOS) 2 ; 1. Petit Robert, dictionnaire de la langue française 2. Site internet : http : // 14

15 outil ouvert, les utilisateurs peuvent compléter cette base par l apport de nouveaux termes ; aspect multilingue du vocabulaire. Un recherche d information basée sur un Thésaurus permettra notamment d élargir le champ de recherche : par exemple, si il est établi que les mots chien et toutou sont synonymes, alors si le parcours de l index lexical sur le mot toutou ne renvoie aucun résultat, on sera capable de lancer une recherche sur le mot chien et, peut-être, de trouver des documents, ce qu une recherche d information syntaxique n aurait pas permis. La création du thésaurus en lui-même ainsi que l implémentation d une recherche basée sur ce thésaurus sont de plus grandement facilitées par l existence du format SKOS : ce langage, standardisé par l organisme W3C, a notamment l avantage d être fondé sur RDF, langage lui aussi standardisé, pour lequel il existe des outils de traitement déjà existants tels que Jena (ensemble d outils de traitement de fichiers RDF en Java) 3,. Selon le langage SKOS (SKOS Core), un thésaurus est considéré comme un schéma de ressources RDF dotées d un Uniform Resource Identier (URI, identifiant unique) spécifique, avec pour chacune d elles : au plus un terme préférentiel par langue ; des définitions et notes relatives à ce terme ; des concepts reliés de façon hiérarchique par des relations générique-spécifique, ou par des relations associatives (non hiérarchiques) ; des représentations symboliques du terme (images). Plusieurs thésaurus ont été développés sous ce format, comme AGROVOC (terminologie à vocation agricole et environnementale) 4, GEMET (GEneral Multilingual Environmental Thesaurus, un thésaurus à dominante environnementale) 5 ou encore MESH (Medical Subject Heading, terminologie médicale bilingue français / anglais) Site internet : http : //jena.sourceforge.net 4. Site internet : http : // intro.htm 5. Site internet : http : // h tml 6. Site internet : http : //ist.inserm.fr/basismesh/mesh.html 15

16 Figure 2.1 Exemple d interrogation du thésaurus GEMET Ontologie : définition En philosophie, on définit l ontologie (du grec ontos, participe présent du verbe être) comme étant l étude de l être en tant qu être, c est-à-dire l étude des propriétés générales de ce qui existe. En s inspirant de cette définition, essayons de définir une ontologie en informatique. Ontologie - In theory, an ontology is a formal, explicit specification of a shared conceptualisation [4] - arboresence/treillis dont les noeuds/sommets correspondent à des concepts et les arêtes à des relations de type is a - théorie qui tente d expliquer les concepts qui existent dans le monde et comment ces concepts s imbriquent et s organisent. 7. Il s agit d une définition répandue de la notion d ontologie. Dans le cadre de notre projet, l équipe a enrichi cette notion : en enrichissant la notion de concept (voir partie suivante) ; en pondérant les relations is a : intuitivement, on saisit l intérêt d une telle démarche. En effet, il est logique de dire que, pour un individu français, le concept labrador est plus représentatif du concept chien que le concept Aïdi (chien originaire de l Atlas marocain). Le principal changement entre cette ontologie enrichie et la précédente est le fait qu elle est liée à un corpus de documents jugés représentatifs, à partir duquel on va calculer la pondération des liens is a et différents autres paramètres, que nous appelerons gradients (voir parties suivantes). Revenons premièrement sur la notion de concept. 16

17 Figure 2.2 Exemple d ontologie : hiérarchie des concepts issue du concept animal Les concepts : une vue sémantique d une entité Afin que les concepts de notre ontologie s approchent le plus possible de la façon dont un être pensant appréhende les entitiés qui l entourent, l équipe s est basée sur les études de sémiotique (théorie du sens) du scientifique/philosophe Charles Sanders Peirce. Ces études montrent que l être humain a trois façons de représenter un concept : point de vue intentionnel : on définit un concept par rapport à ses propriétés. Par exemple, on définira le concept feu comme étant quelque chose qui brûle et qui fait de la fumée. point de vue extensionnel : on définit un concept par rapport à des instances représentatives de ce concept. Par exemple, on définira le concept éléphant à l aide des instances Dumbo, Babar, ou l éléphant que l on a observé lors de notre dernière visite au zoo. point de vue expressionnel : on définit un concept par rapport à son champ lexical (mots le représentant) ou des symboles. Par exemple, les mots chien, toutou et clébard pour le concept chien, où une icône de flamme pour le concept feu. 17

18 Figure 2.3 Triangle de Peirce : les trois représentations du concept chat. Un être humain utilise ces trois points de vue pour définir un concept, se positionnant ainsi dans le triangle de Peirce. Selon que l on ait une connaissance approfondie d un domaine ou non, on se positionne plus au moins près des côtés du triangle. Par exemple, un zoologue définira l éléphant comme un pachyderme herbivore de poids important (point de vue intentionnel), alors qu un néophyte se référera à des instances d éléphants (point de vue extensionnel). A partir de ces études, on munit chaque concept d un moyen de représenter l aspect : intentionnel : un vecteur caractéristique de propriétés : pour toutes les propriétés définies dans l ontologie (peut voler, peut flotter...), on définit une valeur réelle comprise entre 0 et 1 représentant l importance de cette propriété pour définir ce concept. extensionnel : une liste d instances pondérées par la représentativité de chacune d elle pour ce concept. expressionnel : une liste de mots (simples chaînes de caractères) représentant tous les synonymes (labels) utilisés pour décrire ce concept. Là encore, on pondère chaque label en fonction de la manière dont il définit ce concept. On prend ainsi en compte les trois sommets du triangle de Peirce. Il va maintenant falloir définir un moyen de pondérer chacune des informations stockées. Pour ce faire, notre équipe a pris comme critère la prototypicalité d un élément par rapport à un autre, c est à dire sa capacité à résumer/représenter/définir l élément considéré. Comme nous l avons vu, cette notion dépend de chaque individu (culture, niveau de connaissance du domaine...). Nos ontologies ne porteront donc pas uniquement une vision sémantique de la connaissance, mais tiendront également compte de son côté subjectif et de sa dépendance à la culture, aux émotions et à 18

19 l éducation des individus qui en sont porteurs. Cette composante est des plus sensible lors de la phase de modélisation, de construction de l ontologie, plus précisément dans le choix des catégories et dans l élaboration des différentes hiérarchies. Le processus de décision d appartenance d un élément à une catégorie pour un individu donné se réalise en fonction d au moins deux éléments fortement subjectifs : le degré de prototypicalité d une part, et le niveau d abstraction d autre part. Ces points se mettent en place progressivement au fur et à mesure de l apprentissage de l agent humain dès l âge de six mois suivant certains spécialistes. 8 En se basant sur cette étude, on dira qu un élément est jugé typique s il représente un bon exemple de la catégorie, selon des critères propres à la culture, à l éducation et aux émotions de l individu. En reprenant un exemple précédent, pour le français moyen, la prototypicalité du concept labrador pour le concept chien sera beaucoup plus grande que la prototypicalité du concept aïdi pour le concept chien. Cherchons maintenant à quantifier précisemment ces relations de prototypicalité en créant une unité de mesure : les gradients de prototypicalité. 2.2 Les gradients de prototypicalité : des outils pour pondérer les relations entre concepts, labels, instances et propriétés L objectif des gradients est de pouvoir non seulement classer les résultats d une recherche par ordre de pertinence, mais également de les quantifier en fonction de leur valeurs. C est dans cet esprit que l équipe a développé différentes mesures, la première étant le gradient de prototypicalité conceptuelle(gpc). Les formules utilisées pour déterminier les gradients étant complexes et s appuyant sur plusieurs théories, nous nous contenterons ici de les exposer sans les justifier. La justification des formules est proposée dans les publications Gradients de prototypicalité appliqués à la personnalisation d ontologies [6] et Semiotic-based Prototypicality Gradient [8] Le gradient de prototypicalité conceptuelle Ce gradient est défini pour un concept père (C p ) et un concept fils(c f ), et sa valeur (entre 0 et 1) sera d autant plus grande que C f est typique pour C p. gpc(c p, C f ) = (α intensionnel(c p, C f ) + β extensionnel(c p, C f ) + γ expressionnel(c p, C f )) δ α, β et γ sont des coefficients réels représentant l importance de chaque approche pour apréhender un concept (α sera très élevé pour un spécialiste, β sera d autant plus fort que le sujet ne connait pas 8. Françoise Cordier. Les représentations cognitives privilégiées, typicalité et niveau de base. Presses Universitaires de Lille,

20 le domaine sur lequel porte l ontologie...). δ est la composante émotionelle. Découverte par des études en psychologie cognitive, cette composante s appuie sur le principe que plus on est stressé, plus on veut un résultat proche de notre recherche. En revanche, lorsque l on est détendu (positif), on accepte plus volontiers des concepts peu prototypiques (ouverture d esprit). On pourra imaginer divers moyens de calculer la composante émotionnelle d un utilisateur,tels la rapidité de déplacement de la souris sur la page, l analyse des messages postés par cet utilisateur, le nombre de clics par minute... On voit que le calcul du gpc fait appel à trois autres composantes : commençons par la composante expressionnelle, en définissant son moyen de calcul Composante expressionnelle du gpc L objectif de cette composante est de dire que tous les synonymes d un terme n ont pas forcément le même poids. Afin de déterminer dans quelle proportion le sous-concept représente le concept, on cherche à définir les relations entre leur termes : avec : expressionnel(c p, C f ) = pregnance(c f ) pregnance(c p) pregnance(c) = t lexique(c) count p(t) N t NbDoc(t) T otalnbdoc Cette formule pour calculer la prégnance permet d éviter, en prenant en compte la granularité, les effets de Buzz 9, qui polluerait l ontologie. Notre équipe travaille actuellement sur un moyen d intégrer le temps à cette formule : ainsi, si l on parle beaucoup de quelque chose mais pendant peu de temps, notre ontologie le détectera et minimisera le nombre d occurences du mot Composante extensionelle du gpc L objectif de ce gradient est de comparer les instances du concept fils à celles du concept père, toujours dans l optique de déterminer à quel point C f est typique de C p. extensionnel(c p, C f ) = NombreInstances(C f ) NombreInstances(C p). 9. Fait de parler énormément d un terme, mais dans peu de documents. Très courant sur le Web (Suzan Boyle...) 20

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION Séquence Lettres / Documentation / TICE Classe de 6è et club journal Collège Gabrielle Colette Puget sur Argens Académie de Nice Roxane Obadia CONSTAT INITIAL

Plus en détail

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Problématiques de recherche. Figure Research Agenda for service-oriented computing Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements

Plus en détail

Présentation générale du projet data.bnf.fr

Présentation générale du projet data.bnf.fr Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données

Plus en détail

Recherche bibliographique

Recherche bibliographique Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

Les documents primaires / Les documents secondaires

Les documents primaires / Les documents secondaires Les documents primaires / Les documents secondaires L information est la «matière première». Il existe plusieurs catégories pour décrire les canaux d information (les documents) : - Les documents primaires

Plus en détail

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Journée organisée par le CRFCB Midi-Pyrénées / Languedoc-Roussillon

Plus en détail

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte 1Les bases : vos objectifs 2 Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Plus en détail

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed 6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN

Plus en détail

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION OBJECTIFS GÉNÉRAUX DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION Découvrir les principales fonctionnalités des outils de

Plus en détail

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e : CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i

Plus en détail

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2 éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........

Plus en détail

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Mémento Ouvrir TI-Nspire CAS. Voici la barre d outils : L insertion d une page, d une activité, d une page où l application est choisie, pourra

Plus en détail

Installer Joomla. 2013 Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring

Installer Joomla. 2013 Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring 3 Installer Joomla Dans ce chapitre, nous procéderons au téléchargement et à l installation manuelle de Joomla, et nous expliquerons la configuration de base. Les captures d écran et les instructions font

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

Catalogue des formations Edition 2015

Catalogue des formations Edition 2015 Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(

Plus en détail

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...

Plus en détail

Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne

Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne Vocabulaire juridique multilingue comparé Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne 22 novembre 2012 Vocabulaire juridique multilingue comparé La Cour

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Initiation à la recherche documentaire

Initiation à la recherche documentaire Initiation à la recherche documentaire 1 Objectifs Cette séance est destinée à reprendre les principes de la démarche documentaire pour construire un parcours pertinent en terme de méthodologie et de résultats

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction du cours Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

Aide : publication de décisions VS

Aide : publication de décisions VS Aide : publication de décisions VS Table des Matières Introduction... 2 Recherche (Recherche dans le texte intégral)... 2 Filtres... 3 Collection d arrêts... 4 Date de la décision et date de publication...

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

Concevoir sa stratégie de recherche d information

Concevoir sa stratégie de recherche d information Concevoir sa stratégie de recherche d information Réalisé : mars 2007 Dernière mise à jour : mars 2011 Bibliothèque HEC Paris Contact : biblio@hec.fr 01 39 67 94 78 Cette création est mise à disposition

Plus en détail

LA BASE DE DONNÉES PATRIMOINE IMMOBILIER, MOBILIER ET

LA BASE DE DONNÉES PATRIMOINE IMMOBILIER, MOBILIER ET LA BASE DE DONNÉES PATRIMOINE IMMOBILIER, MOBILIER ET IMMATÉRIEL DU QUÉBEC ET LE RÉPERTOIRE DU PATRIMOINE CULTUREL DU QUÉBEC. ÉTAT DES LIEUX ET PERSPECTIVES POUR L INVENTAIRE DU PATRIMOINE IMMATÉRIEL.

Plus en détail

4. SERVICES WEB REST 46

4. SERVICES WEB REST 46 4. SERVICES WEB REST 46 REST REST acronyme de REpresentational State Transfert Concept introduit en 2000 dans la thèse de Roy FIELDING Est un style d architecture inspiré de l architecture WEB En 2010,

Plus en détail

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Quatrième colloque hypermédias et apprentissages 275 BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Anne-Olivia LE CORNEC, Jean-Marc FARINONE,

Plus en détail

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau) CS WEB Ch 1 Introduction I. INTRODUCTION... 1 A. INTERNET INTERCONNEXION DE RESEAUX... 1 B. LE «WEB» LA TOILE, INTERCONNEXION DE SITES WEB... 2 C. L URL : LOCALISER DES RESSOURCES SUR L INTERNET... 2 D.

Plus en détail

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

Jade. Projet Intelligence Artificielle «Devine à quoi je pense» Jade Projet Intelligence Artificielle «Devine à quoi je pense» Réalisé par Djénéba Djikiné, Alexandre Bernard et Julien Lafont EPSI CSII2-2011 TABLE DES MATIÈRES 1. Analyse du besoin a. Cahier des charges

Plus en détail

I) - DEFINITIONS I-A) TERMINOLOGIE

I) - DEFINITIONS I-A) TERMINOLOGIE Venise CANABADY Lycée Amiral Bouvet St Benoît PARTIE I - DEFINITIONS PARTIE II - LES GRANDES FONCTIONNALITES DE LA GED PARTIE III - GED : INDEXATION ET OUTILS PARTIE IV- LA GESTION ÉLECTRONIQUE DES DOCUMENTS

Plus en détail

Entraînement, consolidation, structuration... Que mettre derrière ces expressions?

Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Il est clair que la finalité principale d une démarche d investigation est de faire acquérir des connaissances aux élèves.

Plus en détail

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales D 1.3.2 Rapport d analyse Auteurs: Johann Luethi, Laurent Opprecht, Patrick Roth

Plus en détail

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES 1e partie : encoder et structurer les données Gautier Poupeau Antidot http://www.lespetitescases.net Twitter @lespetitescases Emmanuelle Bermès

Plus en détail

Manuel d utilisation

Manuel d utilisation Manuel d utilisation La référence des comptables-fiscalistes Votre login Votre mot de passe Une question Voyez l aide détaillée accessible en ligne ou les questions les plus fréquemment posées par les

Plus en détail

4. Personnalisation du site web de la conférence

4. Personnalisation du site web de la conférence RTUTORIEL Prise en main de la plateforme 1. Création de l espace conférence Connectez- vous sur le portail http://test- www.sciencesconf.org avec le compte : - Identifiant : «admin1» - Mot de passe «1234»

Plus en détail

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire Formation continue des personnels URCA Offre de la Bibliothèque Universitaire Année 2012-2013 Bibliothèque Universitaire Formation continue pour le personnel de l URCA Modalités o Public : personnels de

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Générer du code à partir d une description de haut niveau

Générer du code à partir d une description de haut niveau Cedric Dumoulin Générer du code à partir d une description de haut niveau Ce projet vise à fournir un environnement de développement permettant de modéliser des UI Android à un haut niveau d abstraction,

Plus en détail

Devenez un véritable développeur web en 3 mois!

Devenez un véritable développeur web en 3 mois! Devenez un véritable développeur web en 3 mois! L objectif de la 3W Academy est de former des petits groupes d élèves au développement de sites web dynamiques ainsi qu à la création d applications web

Plus en détail

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015) Chaîne opératoire de réalisation d une base de données ANF «Comment concevoir une base de données» (29-30/01/2015) En introduction 1- Phase d analyse ou d audit 2- Modélisation & développement de la base

Plus en détail

Sujet de thèse CIFRE RESULIS / LGI2P

Sujet de thèse CIFRE RESULIS / LGI2P Ecole des Mines d Alès Laboratoire de Génie Informatique et d Ingénierie de Production LGI2P Nîmes Sujet de thèse CIFRE RESULIS / LGI2P Titre Domaine De l ingénierie des besoins à l ingénierie des exigences

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et

Plus en détail

< Atelier 1 /> Démarrer une application web

< Atelier 1 /> Démarrer une application web MES ANNOTATIONS SONT EN ROUGE : Axel < Atelier 1 /> Démarrer une application web Microsoft France Tutorial Découverte de ASP.NET 2.0 Sommaire 1 INTRODUCTION... 3 1.1 CONTEXTE FONCTIONNEL... 3 1.2 CONTEXTE

Plus en détail

Base de données relationnelle et requêtes SQL

Base de données relationnelle et requêtes SQL Base de données relationnelle et requêtes SQL 1e partie Anne-Marie Cubat Une question pour commencer : que voyez-vous? Cela reste flou Les plans de «Prison Break»? Non, cherchons ailleurs! Et de plus près,

Plus en détail

Les nouveaux sites documentaires de l IRD

Les nouveaux sites documentaires de l IRD Les nouveaux sites documentaires de l IRD Nouvel Horizon, nouvel intranet, nouveaux Netvibes - IRD France Sud - Logo d après Clipart-fr et Freepik.com De quoi allons nous parler? Les sites de la Documentation

Plus en détail

Solutions en ligne Guide de l utilisateur

Solutions en ligne Guide de l utilisateur Solutions en ligne Guide de l utilisateur Décembre 2009 Informations générales... 1 Configuration minimale requise... 1 Connexion... 1 Page d accueil des Solutions en ligne... 2 Utilisation de la table

Plus en détail

MASTER LPL : LANGUE ET INFORMATIQUE (P)

MASTER LPL : LANGUE ET INFORMATIQUE (P) MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE

Plus en détail

Rappel sur les bases de données

Rappel sur les bases de données Rappel sur les bases de données 1) Généralités 1.1 Base de données et système de gestion de base de donnés: définitions Une base de données est un ensemble de données stockées de manière structurée permettant

Plus en détail

CRÉER UN COURS EN LIGNE

CRÉER UN COURS EN LIGNE Anne DELABY CRÉER UN COURS EN LIGNE Deuxième édition, 2006, 2008 ISBN : 978-2-212-54153-3 2 Que recouvre le concept d interactivité? Dans une perspective de cours en ligne, une activité interactive est

Plus en détail

L informatique en BCPST

L informatique en BCPST L informatique en BCPST Présentation générale Sylvain Pelletier Septembre 2014 Sylvain Pelletier L informatique en BCPST Septembre 2014 1 / 20 Informatique, algorithmique, programmation Utiliser la rapidité

Plus en détail

Base de données bibliographiques Pubmed-Medline

Base de données bibliographiques Pubmed-Medline Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction

Plus en détail

Conception des bases de données : Modèle Entité-Association

Conception des bases de données : Modèle Entité-Association Conception des bases de données : Modèle Entité-Association La modélisation d un problème, c est-à-dire le passage du monde réel à sa représentation informatique, se définit en plusieurs étapes pour parvenir

Plus en détail

Ressources lexicales au service de recherche et d indexation des images

Ressources lexicales au service de recherche et d indexation des images RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)

Plus en détail

Traduction des Langages : Le Compilateur Micro Java

Traduction des Langages : Le Compilateur Micro Java BARABZAN Jean-René OUAHAB Karim TUCITO David 2A IMA Traduction des Langages : Le Compilateur Micro Java µ Page 1 Introduction Le but de ce projet est d écrire en JAVA un compilateur Micro-Java générant

Plus en détail

Commerce International. à référentiel commun européen

Commerce International. à référentiel commun européen Brevet de technicien supérieur Commerce International à référentiel commun européen Référentiel de formation SEPTEMBRE 2011 RÉFÉRENTIEL DE FORMATION Unités de formation UF1 Culture Générale et Expression

Plus en détail

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x WysiUpStudio CMS professionnel pour la création et la maintenance évolutive de sites et applications Internet V. 6.x UNE SOLUTION DE GESTION DE CONTENUS D UNE SOUPLESSE INÉGALÉE POUR CRÉER, MAINTENIR ET

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

LoReNa : pour dynamiser votre Relation Client (CRM)

LoReNa : pour dynamiser votre Relation Client (CRM) LoReNa : pour dynamiser votre Relation Client (CRM) Valorisez votre Relation Client! http://www.lorena.pro/nossolutions/crm.aspx Introduction La connaissance du client est une des bases de la réussite

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS

LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS Annuaire Ouvrage publié en principe chaque année ou selon une périodicité proche de l'année, qui donne une liste de noms de personnes ou d'organismes

Plus en détail

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches Niveau C1 Descripteur global Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches La personne peut : comprendre en détail de longs discours et des échanges complexes

Plus en détail

D origine destiné à la conception de blog, WordPress est devenu l outil incontournable dans la liste des systèmes de gestion de contenus..

D origine destiné à la conception de blog, WordPress est devenu l outil incontournable dans la liste des systèmes de gestion de contenus.. WordPress - CMS open-source Permet de créer simplement des sites internet ou de blogs. D origine destiné à la conception de blog, WordPress est devenu l outil incontournable dans la liste des systèmes

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

Infrastructure / réseau / sécurité /support utilisateur

Infrastructure / réseau / sécurité /support utilisateur Présentation du PSIR Pôle regroupant normalement 7 personnes (5 personnes actuellement) Les quatre axes de spécialisation du service sont: Pôle infrastructure et réseau ; Banques de données et données

Plus en détail

LE CONCEPT DU CMS CHAPITRE 1

LE CONCEPT DU CMS CHAPITRE 1 CHAPITRE 1 LE CONCEPT DU CMS Techniques traditionnelles de construction de sites... 14 Les principes des CMS... 18 Le langage HTML... 26 Check-list... 41 11 Même s il est d usage de comparer Internet

Plus en détail

La recherche documentaire

La recherche documentaire La recherche documentaire Séance destinée aux étudiants (BAC2) de la Haute Ecole de la Ville de Liège Catégorie pédagogique (instituteur primaire) Enseignant : Thomas Herremans Nancy Durieux 9 novembre

Plus en détail

Référencement et visibilité sur Internet Comment améliorer la visibilité de son site internet sur les principaux moteurs de recherche?

Référencement et visibilité sur Internet Comment améliorer la visibilité de son site internet sur les principaux moteurs de recherche? 9 Référencement et visibilité sur Internet Comment améliorer la visibilité de son site internet sur les principaux moteurs de recherche? Le trafic d un site internet Le référencement naturel Les freins

Plus en détail

Encyclopaedia Universalis Guide d utilisation

Encyclopaedia Universalis Guide d utilisation Encyclopaedia Universalis Guide d utilisation Ouverture d une session... 2 Écrans de recherche.. 2 Opérateurs logiques et booléens. 3 Affichage et consultation des résultats... 5 Impression.... 7 TABLE

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

LA DEFINITION DES COMPETENCES : QUEL ROLE POUR LES ASSOCIATIONS PROFESSIONNELLES?

LA DEFINITION DES COMPETENCES : QUEL ROLE POUR LES ASSOCIATIONS PROFESSIONNELLES? LA DEFINITION DES COMPETENCES : QUEL ROLE POUR LES ASSOCIATIONS PROFESSIONNELLES? INTRODUCTION Depuis quelques années, un certain nombre d évolutions à la fois sociétales et professionnelles nous poussent,

Plus en détail

Groupe Eyrolles, 2003, ISBN : 2-212-11317-X

Groupe Eyrolles, 2003, ISBN : 2-212-11317-X Groupe Eyrolles, 2003, ISBN : 2-212-11317-X 3 Création de pages dynamiques courantes Dans le chapitre précédent, nous avons installé et configuré tous les éléments indispensables à la mise en œuvre d une

Plus en détail

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2 NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2 Résultats aux évaluations nationales CM2 Annexe 1 Résultats de l élève Compétence validée Lire / Ecrire / Vocabulaire / Grammaire / Orthographe /

Plus en détail

Créer et partager des fichiers

Créer et partager des fichiers Créer et partager des fichiers Le rôle Services de fichiers... 246 Les autorisations de fichiers NTFS... 255 Recherche de comptes d utilisateurs et d ordinateurs dans Active Directory... 262 Délégation

Plus en détail

Partie II Approche théorique

Partie II Approche théorique Partie II Approche théorique De nombreux phénomènes ont été mis en évidence lors des différentes enquêtes, nous amenant à diverses interrogations pouvant être résumées et transcrites en une problématique.

Plus en détail

Petite définition : Présentation :

Petite définition : Présentation : Petite définition : Le Web 2.0 est une technologie qui permet la création de réseaux sociaux, de communautés, via divers produits (des sites communautaires, des blogs, des forums, des wiki ), qui vise

Plus en détail

Progiciel de gestion documentaire juridique & d édition Web et papier

Progiciel de gestion documentaire juridique & d édition Web et papier Progiciel de gestion documentaire juridique & d édition Web et papier Éprouvé par notre expérience Validé par notre développement Progilex n est pas seulement une solution logicielle. C est le cœur du

Plus en détail

Learning Object Metadata

Learning Object Metadata Page 1 of 7 Learning Object Metadata Le LOM (Learning Object Metadata), est un schéma de description de ressources d enseignement et d apprentissage. Le LOM peut être utilisé pour décrire des ressources

Plus en détail

SECTION 5 BANQUE DE PROJETS

SECTION 5 BANQUE DE PROJETS SECTION 5 BANQUE DE PROJETS INF 4018 BANQUE DE PROJETS - 1 - Banque de projets PROJET 2.1 : APPLICATION LOGICIELLE... 3 PROJET 2.2 : SITE WEB SÉMANTIQUE AVEC XML... 5 PROJET 2.3 : E-LEARNING ET FORMATION

Plus en détail

SCIENCES DE L ÉDUCATION

SCIENCES DE L ÉDUCATION UniDistance 1 Centre d Etudes Suisse Romande Formation universitaire SCIENCES DE L ÉDUCATION En collaboration avec L Université de Bourgogne à Dijon Centre de Formation Ouverte et A Distance CFOAD UniDistance

Plus en détail

LES MOTEURS DE RECHERCHE SUR INTERNET

LES MOTEURS DE RECHERCHE SUR INTERNET La recherche efficace est autant une question de méthodologie que de maîtrise de «trucs et astuces». Internet n a pas été conçu au départ comme un outil de recherche d information, mais comme un outil

Plus en détail

Bien programmer. en Java 7. 10 000 ex. couleur. Avec plus de 50 études de cas et des comparaisons avec C++ et C# Emmanuel Puybaret.

Bien programmer. en Java 7. 10 000 ex. couleur. Avec plus de 50 études de cas et des comparaisons avec C++ et C# Emmanuel Puybaret. Bien programmer en Java 7 Avec plus de 50 études de cas et des comparaisons avec C++ et C# Plus de 10 000 ex. vendus! Édition en couleur Emmanuel Puybaret, ISBN : 978-2-212-12974-8 chapitre1 Présentation

Plus en détail

MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT

MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT ANNEXE VI MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT RECOMMANDATIONS GÉNÉRALES Les utilisateurs s attendent à trouver dans les définitions des

Plus en détail

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Architecture d'entreprise : Guide Pratique de l'architecture Logique Guides Pratiques Objecteering Architecture d'entreprise : Guide Pratique de l'architecture Logique Auteur : Version : 1.0 Copyright : Softeam Equipe Conseil Softeam Supervisée par Philippe Desfray Softeam

Plus en détail

La construction du temps et de. Construction du temps et de l'espace au cycle 2, F. Pollard, CPC Bièvre-Valloire

La construction du temps et de. Construction du temps et de l'espace au cycle 2, F. Pollard, CPC Bièvre-Valloire La construction du temps et de l espace au cycle 2 Rappel de la conférence de Pierre Hess -Démarche de recherche: importance de se poser des questions, de chercher, -Envisager la démarche mentale qui permet

Plus en détail

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi Dans le cadre de la mission le DREV est chargé de conduire des études et expérimentations permettant de mieux comprendre les usages en matière de consommation de produits culturels en ligne et de produire

Plus en détail

Projet en nouvelles technologies de l information et de la communication

Projet en nouvelles technologies de l information et de la communication Projet en nouvelles technologies de l information et de la communication Site Web universitaire du Prof. Jacques Moeschler. Nono Steeve Semestre de printemps 2013 Sous la direction du Prof Luka Nerima

Plus en détail

Organisation de la fin d année du Master 2 de stratégie de communication globale

Organisation de la fin d année du Master 2 de stratégie de communication globale Organisation de la fin d année du Master 2 de stratégie de communication globale Dossiers de suivi de stage - Rapport intermédiaire de Mission A rendre courant février (date précisée sur le site et sur

Plus en détail