INGÉNIERIE DES CONNAISSANCES CONSTRUCTION D ONTOLOGIES À PARTIR DE TEXTES (1)
|
|
|
- Jean-Sébastien Simon
- il y a 10 ans
- Total affichages :
Transcription
1 INGÉNIERIE DES CONNAISSANCES CONSTRUCTION D ONTOLOGIES À PARTIR DE TEXTES (1) Outils de traitement automatique des langues pour la construction d ontologies à partir de textes Didier BOURIGAULT Equipe de Recherche en Syntaxe et Sémantique CNRS - Université Toulouse le Mirail et Groupe «Terminologie et Intelligence Artificielle» AFIA GDR I3 [email protected] Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 1 Plan Introduction et position Les candidats termes L étiquetage morphosyntaxique L analyse distributionnelle L interface Conclusion Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 2 1
2 Construction d ontologie à partir de textes Les connaissances sont accessibles dans les textes. Les connaissances sont produites, transmises essentiellement dans les textes. Autres sources : les spécialistes les ressources existantes : ontologies métier, thesaurus, lexiques, dictionnaires spécialisés, etc. Les contextes d utilisation des ontologies sont (de plus en plus) des applications de traitement de l information textuelle Ex : recherche d information, filtrage, résumé, classification de documents, extraction d information L ontologie doit être construite à partir de textes pour permettre un meilleur traitement des textes. Des outils de traitement automatique des langues rendent réalisable la tâche de construction d ontologie à partir de textes. Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 3 Corpus : Le corpus Ensemble de textes que l ingénieur de la connaissance rassemble pour élaborer l ontologie Type de textes : documentation technique, transcription d entretiens, articles scientifiques,... Construire le corpus est une tâche délicate spécialistes ressources Ingénieur de la connaissance corpus Ontologie Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 4 2
3 Ontologie, ressource terminologique Ressource terminologique (RT) : une description du vocabulaire utilisé dans un domaine spécialisé, élaborée pour une application de traitement de l information (= une représentation des connaissances du domaine) Types de RT thesaurus pour système d indexation automatique lexique bilingue pour système d aide à la traduction lexique sémantique pour système d extraction d information réseau lexical pour système de recherche d information index hypertextuel pour documentation électronique index thématique pour ouvrage «papier» Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 5 Postulat : ontologie et point de vue Soit un «domaine», communauté d acteurs liée à une pratique il n existe pas UNE ontologie de ce domaine. Il y a autant de ressources terminologiques que de type d applications. La construction de la ressource terminologique est guidée par un point de vue, celui de l application cible la sélection des unités (termes, concepts) et le mode de description (structuration) dépendent de l application cible. IC Application corpus Ressource terminologique Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 6 3
4 Outils de traitement automatique des langues (TAL) Ingénierie des connaissances et TAL L approche sur corpus n est possible que parce que des outils et des méthodes d analyse de corpus sont disponibles. groupe «Terminologie et intelligence artificielle» (AFIA, GDR I3) Outils d analyse de corpus pour l aide à la construction de ressources terminologiques à partir de corpus Les outils analysent le corpus et proposent, l ingénieur de la connaissance dispose et modélise. corpus Outils de TAL IC Application Ressource terminologique Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 7 Outils linguistiques Les outils effectuent des traitements de type linguistique (vs statistique) catégorie grammaticale nom, verbe, adjectif, variation morphologique genre et nombre pour les noms, les adjectifs personne, temps, voie pour les verbes groupe syntaxique syntagme nominal syntagme verbal relation syntaxique sujet de verbe, complément de verbe ou de nom, épithète morphologie syntaxe (sémantique) Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 8 4
5 candidats termes (CT) Exemple : liste de candidats termes mot ou suite de mots susceptible d être retenue comme entrée (terme, concept) dans une ressource terminologique Noms Syntagmes nominaux connaissance 1757 modèle 924 système 839 concept 771 domaine 713 problème 561 méthodes 530 type 514 cas 513 relation 490 exemple 482 objets 467 niveau 459 tâche 451 terme 436 acquisition des connaissances 133 base de connaissances 128 résolution de problème 123 modèle conceptuel 122 ingénierie des connaissances 105 point de vue 98 système d'information 87 modèle d'expertise 55 représentation des connaissances 53 génie logiciel 46 candidat terme 46 structure prédicative 42 gestion des connaissances 41 méthode de résolution de problèmes 40 modélisation des connaissances 40 corpus : articles du livre IC200 (Charlet et al. 2000) Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 9 Structuration de la liste des candidats termes dépendance syntaxique Chaque terme complexe se décompose en une Tête et une Exapnsion ontologie ~ T ---- disponible ---- définie ---- explicite ---- formelle ---- référentielle ---- régionale ---- résultante ---- spécialisée ---- universelle ~ de base de connaissance E ---- concepteur ---- conception ---- construction ---- maintenance ---- raffinement ---- structure ---- usage ---- validation ---- vérification Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 10 5
6 Propositions de liens entre candidats termes relation syntagmatique exemples : [Nom Propre] est un [SN] Un [SN] est un [SN] LEXTER est un logiciel d'extraction de terminologie. [Assadi] MANTEX est un logiciel en cours d'expérimentation, dont la fonction est de mettre en évidence dans des textes des regroupements signicatifs de mots [Frath] Un GC est un graphe bipartie étiqueté, i.e. un graphe utilisant deux types de noeuds ( sommets ). [Nobécourt] Un mécanisme de coordination est un construit, consistant en un protocole de coordination et en un artefact [Roche] LEXTER logiciel d extraction de terminologie MANTEX logiciel en cours d expérimentation graphe conceptuel graphe bipartie étiqueté mécanisme de coordination construit Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 11 Regroupement de candidats termes proximité distributionnelle Deux termes sont rapprochés s ils apparaissent dans les mêmes contextes syntaxiques. ontologie taxinomie contextes insertion dans ~ classer dans ~ structurer ~ organisation de ~ réaliser ~ Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 12 6
7 La première brique : l étiquetage morphosyntaxique Étiqueteur : Outil de traitement automatique des langues dont la fonction est d attribuer à chaque mot d un texte une catégorie grammaticale (nom, verbe, adjectif, ) En général, les étiqueteurs sont aussi des lemmatiseurs : ils fournissent le lemme des mots. Lemme : forme canonique du mot (infinitif pour le verbe, la forme au singulier pour le nom, la forme au masculin singulier pour l adjectif) Pour le français : Cordial analyseur, Sylex, WinBrill, Un éqiqueteur est un outil d ingénierie linguistique dont la fonction est d associer à chaque mot d un texte une catégorie morphosyntaxique. N mot lemme Catégorie 1 Un un DETIMS (déterminant) 2 étiqueteur étiqueteur NCMS (nom) 3 est être VINDP3S (verbe) 4 un un DETIMS (déterminant) 5 outil outil NCMS (nom) 6 d' de PREP (préposition) 7 ingénierie ingénierie NCFS (nom) 8 linguistique linguistique ADJSIG (adjectif) 9Ingénierie des dontconnaissances Constructuction dont d ontologies... PRI (D. Bourigault) (pronom «relatif)» Extraction de candidats termes complexes Deux techniques simples et robustes, basée sur la structure interne des unités patrons élémentaires NOM de NOM NOM ADJ ADJ NOM expression maximale ADJ? NOM [NOM ADJ de]+ [NOM ADJ] ( ) cet outil est un logiciel d extraction de termes complexes qui ( ) logiciel d extraction extraction de termes termes complexes logiciel d extraction de termes complexes Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 14 7
8 Extraction de candidats termes complexes Limites : analyse «étroite» sur-génération, sous-génération, pas de structuration restrictif quant aux structures Prépositions autres que «de», déterminants Syntagmes verbaux Nécessité d une analyse syntaxique «large» Structure syntaxique des phrases logiciel d extraction de termes complexes logiciel extraction de termes complexes extraction termes complexes termes complexes Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 15 Analyse syntaxique identification des relations syntaxiques entre les mots de la phrase: sujet de verbe complément d objet direct de verbe complément d objet indirect de verbe complément de nom complément d adjectif épithète de nom exercice : Le petit garçon donne une boite pleine de bonbons à la fraise à sa sœur. SUJ? Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 16 8
9 Corrigé Le petit garçon donne une boite pleine de bonbons à la fraise à sa sœur. Régi relation recteur petit épithète de garçon garçon sujet de donne boite complément d objet de donne pleine épithète de boite de bonbons complément de l adjectif pleine à la fraise complément du nom bonbons à sa sœur complément d objet indirect de donne Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 17 Ambiguïté de rattachement adjectival : 'Nom Prep Nom Adj' Contexte (1) La discontinuité est marquée par les réfractions d'ondes séismiques. (2) Il se crée une vague d'érosion remontante qui creuse une gorge. (3) Se constitue ainsi une plaine de bordure karstique.? Analyses concurrentes (1) a- réfractions d' [ ondes séismiques ] b- [ réfractions d' ondes ] séismiques (2) a- vague d' [ érosion remontante ] b- [ vague d' érosion ] remontante (3) a- plaine de [ bordure karstique ] b- [ plaine de bordure ] karstique Quelle stratégie de désambiguïsation? Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 18 9
10 Ambiguïté de rattachement prépositionnel : 'Vb Det Nom Adj en Nom'? Contexte d'extraction (4) L'érosion a disséqué le plateau rocheux en chevrons. (5) On observe une charge importante en trouble dans les rivières (6) Il faut distinguer les roches pauvres en magnésium. Analyses concurrentes (4) a- disséquer [ le plateau [ rocheux en chevron ] ] b- disséquer [ [ le plateau rocheux ] en chevron ] c- [ disséquer [ le plateau rocheux ] ] en chevron (5) a- observer [ une charge [ importante en trouble ] ] b- observer [ [ une charge importante ] en trouble ] c- [ observer [ une charge importante ] ] en trouble (6) a- distinguer [ les roches [ pauvres en magnésium ] ] b- distinguer [ les roches pauvres ] en magnésium ] c- [ distinguer [ les roches pauvres ] ] en magnésium Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 19 Comment résoudre les ambiguïtés de rattachement Utiliser des ressources sémantiques externes Des ressources générales? WordNet, dictionnaires généraux, ontologies universelles, Non Des ressources spécialisées : dictionnaires spécialisés, thesaurus, ontologies métiers, Eventuellement S appuyer sur le corpus : apprentissage endogène (LEXTER/SYNTEX) Le système acquiert par lui-même les informations susceptibles de lui permettre de résoudre les cas d ambiguïté de rattachement. Le corpus : Objet d analyse Source d information Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 20 10
11 Où est la sémantique? Ressources sémantiques (spécialisées/générales) Corpus (d apprentissage) ici pas là textes... ici IC Outils de TAL RT Système de TI pas là Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 21 Analyse distributionnelle Principe : Z. Harris Technique : regrouper les termes qui apparaissent dans des contextes syntaxiques identiques concept de «double-clique» Exemple : termes base de connaissance modèle de l expertise ontologie contextes élaborer ~ utiliser ~ maintenance de ~ structure de ~ construction de ~ Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 22 11
12 Exemples de double-cliques termes logiciel méthode modèle outil système contextes ~ permettre utiliser ~ utilisation de ~ construction de ~ validation de ~ développement de ~ développer ~ offrir ~ termes concept entité relation primitive contextes définir ~ type de ~ représenter ~ description de ~ modéliser ~ propriété de ~ nombre de ~ Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 23 Liste des candidats termes extraits par Lexter d un article de Biebow & Szulmann Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 24 12
13 Liste des candidats termes dont «modèle conceptuel» est en expansion Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 25 Conclusion Construire les ontologie à partir de textes C est une nécessité. C est une tâche ardue : le «mur des mots» Les outils : Travaillent sur la forme (morphologie, syntaxe), pas le sens Fonction : construire un ensemble structuré de mots et syntagmes Il n y pas de critères statistiques décisifs pour filtrer, mais l utilisation de critères numériques permet de guider le travail Les outils permettent une lecture «efficace» du corpus C est l ingénieur de la connaissance qui analyse et modélise Compétences en analyse de corpus Il reste à préciser une méthodologie Alternance : analyse guidée par les résultats des outils d analyse de corpus («bottom up») Analyse guidée par les spécification de l application («top down») Ingénierie des connaissances Constructuction d ontologies... (D. Bourigault) 26 13
Construction d ontologies à partir de textes
TALN 2003, Batz-sur-Mer, 11-14 juin 2003 Construction d ontologies à partir de textes Didier Bourigault (1) et Nathalie Aussenac-Gilles (1) ERSS CNRS & Université Toulouse le Mirail 5, allées Antonio Machado
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax [email protected],
Grammaires d unification
Cours sur le traitement automatique des langues (IV) Violaine Prince Université de Montpellier 2 LIRMM-CNRS Grammaires d unification Grammaire catégorielle Grammaire syntagmatique généralisée (GPSG) Les
Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar [email protected]
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar [email protected] Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES
UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES Chrystel Millon & Stéphanie Léon Equipe DELIC Université de Provence
Ressources lexicales au service de recherche et d indexation des images
RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique
Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus
JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,
1 Description générale. Résumé
Station Sensunique: une plateforme Web modulaire, collaborative et évolutive d acquisition assistée de ressources terminologiques et non terminologiques (orientée Langues Contrôlées) Izabella Thomas 1,
PROJET DE FIN D ETUDES
MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE ****** INSTITUT NATIONAL DES SCIENCES APPLIQUEES TOULOUSE Département de Génie Electrique & Informatique ****** PROJET DE FIN D ETUDES ROLE D UNE
TD 1 - Structures de Traits et Unification
TD 1 - Structures de Traits et Unification 1 Définitions Un trait (en: feature) est un couple attribut-valeur. Une structure de traits (en: feature structure) est un ensemble de traits. On peut les représenter
! Text Encoding Initiative
Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Aide du Grand dictionnaire terminologique
Aide du Grand dictionnaire terminologique Office québécois de la langue française Mars 2015 Table des matières Introduction... 1 Comment interroger la banque?... 1 Saisie semi-automatique... 1 Comment
TEXT MINING Tour d Horizon
TEXT MINING Tour d Horizon Media Campus WAN IFRA "Structurer, optimiser et valoriser son contenu éditorial : les outils de text mining" 24 novembre 2009, PARIS Philippe BONNY Cabinet de Conseil et d Etudes
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox
majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot
majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l
Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET [email protected] http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
Compte-rendu de Hamma B., La préposition en français
Compte-rendu de Hamma B., La préposition en français Badreddine Hamma To cite this version: Badreddine Hamma. Compte-rendu de Hamma B., La préposition en français. Revue française de linguistique appliquée,
TiLT : plate-forme pour le traitement automatique des langues naturelles
TiLT : plate-forme pour le traitement automatique des langues naturelles Johannes Heinecke * Grégory Smits ** Christine Chardenon * Emilie Guimier De Neef * Estelle Maillebuau * Malek Boualem * * Orange
Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données
Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011
Le traitement automatique des langues dans les industries de l'information
Le traitement automatique des langues dans les industries de l'information Livre blanc Groupe de Réflexion sur les Industries de l Information et les Industries de la Langue (GRIIIL) Janvier 2005 Avant-propos
Apprentissage Automatique
Apprentissage Automatique Introduction-I [email protected] www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Déterminants possessifs
POSSESSIFS MATÉRIEL POUR ALLOPHONES 1 Déterminants Déterminants référents Déterminants possessifs Le déterminant possessif indique une relation d appartenance, de possession, de parenté, d origine, etc.,
fiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile.
fiche D AUTOCORRECTION 3.4 Les accords sont corrects dans chaque groupe du nom. On met souvent sur le dos de l inattention les erreurs d orthographe grammaticale. Bien accorder les mots exige de l observation
FRENCH 3900- Language (Advanced Level III)
Professeur : Ivan Chow ([email protected]) Consultation : Par rendez-vous enligne ou par courriel Description générale du cours : FRENCH 3900- Language (Advanced Level III) grammaticale fournie dans & al.
ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S
ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S Estelle Dubreil et Béatrice Daille LINA FRE CNRS 2729 Université de Nantes France Résumé : L association
N 334 - SIMON Anne-Catherine
N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction
I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le
I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le nombre et le degré de détermination du nom. 1. L article le, la, les, l, d, au, aux, du, des, un, une, des, du, de l, de la, des.
CHAPITRE 1 STRUCTURE DU NIVEAU B2 POUR LE FRANÇAIS
chapitre_1_2_3.qxd 29/06/04 10:46 Page 15 CHAPITRE 1 STRUCTURE DU NIVEAU B2 POUR LE FRANÇAIS Les référentiels par langue élaborés dans le cadre du Conseil de l Europe sont avant tout, comme Un niveau-seuil
mes m est mets/met mais mets
GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES MES HOMOPHONES M EST METS/MET MAIS METS 1 Homophones grammaticaux de catégories différentes mes m est mets/met mais mets mes : déterminant possessif pluriel, féminin
Atelier rédactionnel
Baccalauréat professionnel Gestion - Administration Atelier rédactionnel Exemples de séances réalisées en première et au début de l année de terminale Joëlle PERRETIER & Patrice VIRIEUX Lycée professionnel
Une architecture de services pour mieux spécialiser les processus d acquisition terminologique
Une architecture de services pour mieux spécialiser les processus d acquisition terminologique Farid Cerbah * Béatrice Daille ** * Dassault Aviation, DPR/ESA, 78, quai Marcel Dassault, 92552 Saint-Cloud
Ingénierie et gestion des connaissances
Master Web Intelligence ICM Option Informatique Ingénierie et gestion des connaissances Philippe BEAUNE [email protected] 18 novembre 2008 Passer en revue quelques idées fondatrices de l ingénierie
Caractéristiques du nom
DU MATÉRIEL NOM POUR ALLOPHONES 1 Nom et groupe nominal Caractéristiques du nom 1 LES CARACTÉRISTIQUES SÉMANTIQUES DU NOM Le nom commun désigne une personne ou une chose qui appartient à une même espèce.
MASTER LPL : LANGUE ET INFORMATIQUE (P)
MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE
Luc Grivel (*, **) [email protected]
MAITRISER LE PROCESSUS DE TEXT MINING DANS LE CADRE D APPLICATIONS D INTELLIGENCE ECONOMIQUE, DE GESTION DE LA RELATION CLIENT OU DE GESTION DE CONNAISSANCES Luc Grivel (*, **) [email protected]
Créer un mémento grammatical portatif et évolutif pour tablettes et smartphones
Enseigner les Langues et Cultures de l Antiquité avec les TICE http://lettres.ac-dijon.fr TraAM travaux académiques mutualisés, un accompagnement au développement des usages des TIC Créer un mémento grammatical
Contemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208
Contemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208 Conception d un Tuteur Intelligent en langage naturel français pour l enseignement de la modélisation conceptuelle des données d un système
CHAPITRE VI. Détermination d unités de traitement
Détermination d unités de traitement 272 Détermination d unités de traitement Aperçu La confrontation des textes entre eux suppose la définition d unités d analyse, qui sont fournies par une opération
1 On peut consulter et interroger ce corpus sur le site de l équipe DELIC : http://www.up.univmrs.fr/delic/crfp.
Ce que les corpus nous apprennent sur la langue Bilger Mireille (Université de Perpignan) - [email protected] Cappeau Paul (Université de Poitiers) - [email protected] La description syntaxique
Expériences de formalisation d un guide d annotation : vers l annotation agile assistée
Expériences de formalisation d un guide d annotation : vers l annotation agile assistée Bruno Guillaume 1,2 Karën Fort 1,3 (1) LORIA 54500 Vandœuvre-lès-Nancy (2) Inria Nancy Grand-Est (3) Université de
Aide-mémoire : Chaque, leur, même, quelque, tout
Aide-mémoire : Chaque, leur, même, quelque, tt Les confusions homophoniques sont à l origine de plusieurs erreurs. Il est possible de les éviter en portant attention aux classes de mots ( catégories grammaticales
I/ CONSEILS PRATIQUES
D abord, n oubliez pas que vous n êtes pas un enseignant isolé, mais que vous appartenez à une équipe. N hésitez jamais à demander des idées et des conseils aux autres collègues (linguistes et autres)
Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton
Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs
LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION
LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION Séquence Lettres / Documentation / TICE Classe de 6è et club journal Collège Gabrielle Colette Puget sur Argens Académie de Nice Roxane Obadia CONSTAT INITIAL
Livret personnel de compétences
Livret personnel de compétences Grilles de références pour l évaluation et la validation des compétences du socle commun au palier 2 Janvier 2011 MENJVA/DGESCO eduscol.education.fr/soclecommun LES GRILLES
Langue, techniques de rédaction et correction d épreuves (412-2A1-LG)
Langue, techniques de rédaction et correction d épreuves (412-2A1-LG) Programme : Services paralangagiers (Recherche documentaire en traduction) Plan de cours Introduction Frais d inscription Ce cours
CONSERVATOIRE NATIONAL DES ARTS ET METIERS. Ecole Management et Société. Département Culture Information Technique et Société (CITS) INTD
CONSERVATOIRE NATIONAL DES ARTS ET METIERS Ecole Management et Société Département Culture Information Technique et Société (CITS) INTD MEMOIRE pour obtenir le Titre professionnel "Chef de projet en ingénierie
LIVRE BLANC LOGICIELS DE TRADUCTION INSTANTANEE
LIVRE BLANC LOGICIELS DE TRADUCTION INSTANTANEE La mondialisation de l économie, associée à l essor d internet et du commerce électronique, ont fortement contribué à l accélération des échanges internationaux.
«Dire et écrire» pour réaliser une composition en travail collaboratif en géographie. Agnès Dullin, lycée J. Racine 20 rue du Rocher, 75008 Paris
«Dire et écrire» pour réaliser une composition en travail collaboratif en géographie Agnès Dullin, lycée J. Racine 20 rue du Rocher, 75008 Paris OBJECTIFS 1- Niveau et insertion dans la programmation 2-
Les technologies d aide
Les technologies d aide Gisèle Desjardins Service d accès et de soutien à l apprentissage Université de Moncton 21/04/2015 TABLE DES MATIÈRES Les technologies d aide... 2 A. Technologie d aide reliée à
Gestion collaborative de documents
Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,
THESE. Présentée devant. L Université Paul Sabatier de Toulouse. en vue de l obtention du
Laboratoire IRIT Pôle SIG-EVI THESE Présentée devant L Université Paul Sabatier de Toulouse en vue de l obtention du Doctorat de l Université Paul Sabatier Spécialité Informatique Par Nathalie HERNANDEZ
Pour écrire un texte sans fautes
Module d éducation au préscolaire et d enseignement au primaire Projet pilote CommUniQ. Pour écrire un texte sans fautes Écrire un texte est une activité exigeante, ce qui est normal, puisque c est une
Sens, synonymes et définitions
TALN 2009, Senlis, 24 26 juin 2009 Sens, synonymes et définitions Ingrid Falk 1 Claire Gardent 2 Evelyne Jacquey 3 Fabienne Venant 4 (1) INRIA / Université Nancy 2 (2) CNRS / LORIA, Nancy (3) CNRS / ATILF,
BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS
Quatrième colloque hypermédias et apprentissages 275 BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Anne-Olivia LE CORNEC, Jean-Marc FARINONE,
Mehdi Embarek. Un système de question-réponse dans le domaine médical : le système Esculape.
Un système de question-réponse dans le domaine médical : le système Esculape Mehdi Embarek To cite this version: Mehdi Embarek. Un système de question-réponse dans le domaine médical : le système Esculape.
Initiation à la recherche documentaire
Initiation à la recherche documentaire 1 Objectifs Cette séance est destinée à reprendre les principes de la démarche documentaire pour construire un parcours pertinent en terme de méthodologie et de résultats
La traduction automatique des articles de l anglais au français
Université de Gand Faculté de Philosophie et Lettres Année universitaire 2012-2013 La traduction automatique des articles de l anglais au français Lissa Catthoor Mémoire de master présenté en vue de l
Accompagnement personnalisé 6e
éduscol Accompagnement personnalisé 6e Accompagnement personnalisé en 6ème Problème pédagogique : l élève fait des erreurs dans la conjugaison du présent de l indicatif. Compétence 1 : Conjuguer les verbes,
UN TRAVAIL A PLUSIEURS VOIX... 3 LICENCE... 3 TRAÇABILITE... 5 CONTENU DE LA CHARTE... 3 COMMENT UTILISER CETTE E CHARTE?... LES DONNEES...
CHARTE ETHIQUE ET BIG DATA FACIILITER L ECHANGE ET LA DIFFUSION DES DONNEES Sommaire UN TRAVAIL A PLUSIEURS VOIX...... 3 CONTENU DE LA CHARTE...... 3 COMMENT UTILISER CETTE E CHARTE?... 3 LICENCE.........
EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE
ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École
TYPO3 & Synomia 24.06.2013. Cédric Tempestini <[email protected]>
TYPO3 & Synomia Cédric Tempestini Qui suis je?! 8 années d expérience sur TYPO3! Certifié TYPO3 depuis 2009! Administrateur sur le forum typo3-fr.org! Intervenant depuis 7 ans
«La pomme qui voulait voyager»
«La pomme qui voulait voyager» Création d'une suite d histoire à partir d une séquence d'images Type d outil : Démarche d apprentissage en contagion et en construction de langage (Savoir Parler). Auteurs
SYSTRAN 7 Guide de démarrage
1 SYSTRAN 7 Guide de démarrage Réf : DSK-7-QSG-HO-FR Bienvenue SYSTRAN 7 Guide de démarrage Félicitations! Nous vous remercions d avoir choisi SYSTRAN V7 la version la plus récente et la plus puissante
Distinction des questions et des consignes
ET ŒIL DES CONSIGNES (OUTILS D EXPLORATION ET D INTÉGRATION DE LA LECTURE) 1 Questions et consignes Distinction des questions et des consignes Théorie Comment différencier les questions et les consignes
Master Audiovisuel, communication et arts du spectacle
Formations et diplômes Rapport d'évaluation Master Audiovisuel, communication et arts du spectacle Université Toulouse II - Jean Jaurès - UT2J Campagne d évaluation 2014-2015 (Vague A) Formations et diplômes
leur(s) leur LES EXERCICES DE FRANÇAIS DU CCDMD www.ccdmd.qc.ca Homophones grammaticaux de catégories différentes
GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES LEUR(S) HOMOPHONES LEUR 1 Homophones grammaticaux de catégories différentes leur(s) leur leur(s) : déterminant possessif. Il fait partie d un GN dont le noyau est
Formation Pédagogique 3h
Formation Pédagogique 3h Carole MOULIN Conseillère Pédagogique généraliste Bourgoin 2 20 mars 2013 Ecrire c est: Copier Ecrire sans erreurs sous la dictée Concevoir et écrire une phrase, des phrases, un
MÉMOIRE DE STAGE DE MASTER SPÉCIALITÉ : Recherche en Informatique Mention : Informatique, Mathématiques, Statistiques
ACADÉMIE DE MONTPELLIER UNIVERSITÉ MONTPELLIER II SCIENCE ET TECHNIQUES DU LANGUEDOC MÉMOIRE DE STAGE DE MASTER SPÉCIALITÉ : Recherche en Informatique Mention : Informatique, Mathématiques, Statistiques
Le verbe avoir (to have) infinitif = avoir. j ai nous avons tu as vous avez. Exemples: J ai une copine à Montréal.
Leçon 7 - La Vie est belle La vie de Nafi, une jeune Française d origine sénégalaise parle de sa vie. Elle est étudiante en sociologie à l Université de Toulouse. Aujourd hui, elle parle de sa vie. -Est-ce
UCL. Université catholique de Louvain. Métro Web : logiciel de support à l'évaluation de la qualité ergonomique des sites web.
UCL Université catholique de Louvain Métro Web : logiciel de support à l'évaluation de la qualité ergonomique des sites web Céline Mariage Thèse présentée en vue de l'obtention du grade de Docteure en
Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie
TALN 25, Dourdan, 6 1 juin 25 Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie Florian Seydoux & Jean-Cédric Chappelier Faculté Informatique et Communications Ecole Polytechnique
Interférences lexicales entre deux langues étrangères: anglais et français
Interférences lexicales entre deux langues étrangères: anglais et français Université de Marmara Résumé: Dans cet article, nous nous interrogerons sur les transferts lexicaux qui se réalisent entre l anglais
La construction de composants de connaissance pour l extraction et le filtrage de l information sur les réseaux
La construction de composants de connaissance pour l extraction et le filtrage de l information sur les réseaux une approche industrielle Grivel Luc, Guillemin-Lanne Sylvie, Lautier Christian, Mari Alda
Le modèle standard, SPE (1/8)
Le modèle standard, SPE (1/8) Rappel : notion de grammaire mentale modulaire Les composants de la grammaire : module phonologique, sémantique syntaxique Syntaxe première : elle orchestre la relation mentale
basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML
basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes
LIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
Projets Professionnels - Master IdL 2014-2015
Projets Professionnels - Master IdL 2014-2015 Enseignant - coordinateur : Thomas Lebarbé Stendhal, Université Grenoble-Alpes 1 Préambule Dans les pages qui suivent vous trouverez une liste de projets proposés
Développement spécifique d'un système d information
Centre national de la recherche scientifique Direction des systèmes d'information REFERENTIEL QUALITE Procédure Qualité Développement spécifique d'un système d information Référence : CNRS/DSI/conduite-proj/developpement/proc-developpement-si
Réussir son entrée en grammaire au CE1
CE1 Réussir son entrée en grammaire au CE1 Françoise Bellanger Aurélie Raoul-Bellanger ISBN : 978-2-7256-3249-0 Retz, 2013 pour la présente édition Direction éditoriale : Sylvie Cuchin Édition : Charlotte
ÉVALUATION DE LA PRODUCTION DE QUATRE SYSTÈMES TRADUCTION AUTOMATIQUE. Christine Yen
ÉVALUATION DE LA PRODUCTION DE QUATRE SYSTÈMES TRADUCTION AUTOMATIQUE by Christine Yen Submitted in partial fulfilment of the requirements for the degree of Master of Arts at Dalhousie University Halifax,
peu peux/peut peut être peut-être
GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES PEU HOMOPHONES PEUX/PEUT PEUT ÊTRE PEUT-ÊTRE 1 Homophones grammaticaux de catégories différentes peu peux/peut peut être peut-être peu : adverbe ; il a le sens de
Vers une grammaire de l évaluation des objets culturels
57 Schedae, 2006 Prépublication n 8 Fascicule n 1 Vers une grammaire de l évaluation des objets culturels Dominique Legallois CRISCO (CNRS FRE 2 805) Université de Caen Basse-Normandie [email protected]
ISTEX, vers des services innovants d accès à la connaissance
ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions
Annotations manuelles et automatiques de corpus
Annotations manuelles et automatiques de corpus Cyril Grouin [email protected] 1 Définitions Base de données : ensemble structuré de données (feuille Excel). Id Ville Pays 01 Paris France 02 Dublin
Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P
EUROCOPTER SAS Groupe EADS Marignane Ecole des Mines d Alès Laboratoire de Génie Informatique et d Ingénierie de Production LGI2P Nîmes Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P Titre Domaine
PRÉPONDÉRANCE DU CONTEXTE EXTRALINGUISTIQUE DANS LA CONSTRUCTION DU SENS : L EXEMPLE DES COMMUNICATIONS DE TRAVAIL DANS LA NAVIGATION AÉRIENNE
PRÉPONDÉRANCE DU CONTEXTE EXTRALINGUISTIQUE DANS LA CONSTRUCTION DU SENS : L EXEMPLE DES COMMUNICATIONS DE TRAVAIL DANS LA NAVIGATION AÉRIENNE Pascale Vergely Université de Toulouse-Le Mirail Laboratoire
Veille concurrentielle et veille stratégique : deux applications d extraction d information
Veille concurrentielle et veille stratégique : deux applications d extraction d information Bertrand DELECROIX(*), Sylvie GUILLEMIN-LANNE(**), Amandine SIX(**) [email protected], [email protected],
CORRIGÉ DU DOSSIER N 2
Christian PUREN Professeur émérite de l Université de Saint-Étienne (France) Cours collaboratif en ligne «La didactique des langues-cultures comme domaine de recherche» http://www.christianpuren.com/cours-collaboratif-la-dlc-comme-domaine-de-recherche/
LEXOS, logiciel d'étude lexicale et de conjugaison
233, logiciel d'étude lexicale et de conjugaison Ce logiciel a été élaboré sous test constant, dans la mesure où, pour le modifier, je me suis inspiré en permanence de la réaction des élèves, de leurs
Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE 94300 VINCENNES
Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE 94300 VINCENNES Table des matières Edito... 3 Informations pratiques... 4 Accueil des stagiaires... 4 Horaires...
Langue Française. Syllabus A1. Description globale du niveau A1 utilisateur élémentaire
Langue Française Redatto da Dott.ssa Annie Roncin Syllabus A1 Description globale du niveau A1 utilisateur élémentaire L étudiant peut : -comprendre et utiliser des expressions familières et quotidiennes
Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique
É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure INTELLIGENCE NUMERIQUE Langage Java Mentions
TECHNIQUES DE SURVIE ÉCRITURE Leçon de littératie 2.6
Clair et net! Comprendre, structurer et expliquer un concept. Apprentissage critique Comprendre et apprécier l importance de fournir des consignes claires. Tenir compte du point de vue de l auditoire et
Raisonnement à base de cas textuels état de l art et perspectives
Raisonnement à base de cas textuels état de l art et perspectives Luc Lamontagne Guy Lapalme Université de Montréal, Département d informatique et de recherche opérationnelle (DIRO) CP 6128, Succ. Centre-ville,
