La lexicalisation dans GePhoX.



Documents pareils
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Évaluation et implémentation des langages

Cours 1 : La compilation

Logiciel Libre Cours 3 Fondements: Génie Logiciel

Formula Negator, Outil de négation de formule.

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES

Utilisation des tableaux sémantiques dans les logiques de description

Apprentissage Automatique

Ingénierie et gestion des connaissances

Compilation. Algorithmes d'analyse syntaxique

Grammaires d unification

Cours de Master Recherche

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

Éléments d informatique Cours 3 La programmation structurée en langage C L instruction de contrôle if

Prénom : Matricule : Sigle et titre du cours Groupe Trimestre INF1101 Algorithmes et structures de données Tous H2004. Loc Jeudi 29/4/2004

Transmission d informations sur le réseau électrique

Ce document a été mis en ligne par le Canopé de l académie de Montpellier pour la Base Nationale des Sujets d Examens de l enseignement professionnel.

L import massif introduit plusieurs nouvelles fonctionnalités, selon que l on importe un thésaurus, un ensemble de valeurs contrôlées ou un corpus.

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

JADT /06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

N SIMON Anne-Catherine

III- Raisonnement par récurrence

Calculs de probabilités

26th of March 2014, Paris

TEXT MINING Tour d Horizon

Threat Management déploiement rapide de contre-mesures

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Les apports de l informatique. Aux autres disciplines

Consignes pour les travaux d actualité Premier quadrimestre

Environnements et Outils de Développement Cours 1 Introduction

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

Analyse,, Conception des Systèmes Informatiques

Cours 1 : Qu est-ce que la programmation?

Les modalités linguistiques pour aider à l interprétation de textes juridiques

Traduction des Langages : Le Compilateur Micro Java

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Introduction. Présentation de la plate-forme outils KB3

Cours No 3 : Identificateurs, Fonctions, Premières Structures de contrôle.

Baccalauréat universitaire (bachelor) en mathématiques et sciences informatiques

À TÉLÉCOPIER AU

Resolution limit in community detection

Programmation par contraintes. Laurent Beaudou

Gestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE

Propriétés du Document EMA. Résumé

Les probabilités. Chapitre 18. Tester ses connaissances

La syllabe (1/5) Unité intuitive (différent du phonème) Constituant essentiel pour la phonologie au même titre que phonème et trait

LES INTERFACES HOMME-MACHINE

Systèmes décisionnels et programmation avancée

Générer du code à partir d une description de haut niveau

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie

Suivant les langages de programmation, modules plus avancés : modules imbriqués modules paramétrés par des modules (foncteurs)

eduscol Ressources pour la voie professionnelle Français Ressources pour les classes préparatoires au baccalauréat professionnel

Probabilités conditionnelles Loi binomiale

Vers une architecture générique de système de dialogue oral homme-machine

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

MASTER LPL : LANGUE ET INFORMATIQUE (P)

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile

Conception des systèmes répartis

Tâche complexe produite par l académie de Clermont-Ferrand. Mai 2012 LE TIR A L ARC. (d après une idée du collège des Portes du Midi de Maurs)

Fonction de hachage et signatures électroniques

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Machines virtuelles Cours 1 : Introduction

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

Projet d informatique M1BI : Compression et décompression de texte. 1 Généralités sur la compression/décompression de texte

PROJET DE MODELISATION CASERNE SERGEANT BLANDAN

Calculabilité Cours 3 : Problèmes non-calculables.

Référencement Vendredi 4 Juillet Ile Degaby

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

ATELIER Les mutuelles de santé comme acteur et partenaire de la couverture santé universelle

MATH ELEMENTS DU CALCUL DES PROBABILITES

Théorie de la Programmation

«La pomme qui voulait voyager»

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Fiche de l'awt La sécurité informatique

Apprentissage statistique dans les graphes et les réseaux sociaux

TP3 Intégration de pratiques agiles. 1. User Stories (1) Scénario d intégration agile. En direct-live du château

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Agrégation des portefeuilles de contrats d assurance vie

Chap. 3: Le modèle de données entité-association (E.A.)

IFT3902 : (Gestion de projet pour le) développement, (et la) maintenance des logiciels

Partenaires: w w w. c o g m a s t e r. n e t

Ordonnancement temps réel

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Estimer et mesurer la performance des projets agiles avec les points de fonction

Construction et maintenance d une ressource lexicale basées sur l usage

Demande de crédits d heures Déclaration du salarié

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Cours 14. Crypto. 2004, Marc-André Léger

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Modélisation multi-agents - Agents réactifs

Transcription:

La lexicalisation dans GePhoX. Adil El Ghali LaTTiCe - PPS Université Paris 7 adil@linguist.jussieu.fr Journée GenI, Paris - Sept. 2003 p.1/24

Présentation du problème La lexicalisation est la tâche de génération qui permet de passer des représentations conceptuelles aux représentations textuelles de l entrée à exprimer. Journée GenI, Paris - Sept. 2003 p.2/24

Présentation du problème Communicative goals T Box A Box Domain Model A Box User Model Content Determination logical form Document structuring à la SDRT SDRS Micro planner Lexical Bases CLEF Dependency tree Surface realiser Text Journée GenI, Paris - Sept. 2003 p.2/24

Introduction Dans [Stede, 1999], l auteur pose un certain nombre de questions: Qu est ce qu un item lexical? Comment les items lexicaux sont-ils liés au concepts? Quels critères pour choisir un item lexical plutôt qu un autre? A quel moment du processus de génération ce choix est-il fait? Journée GenI, Paris - Sept. 2003 p.3/24

Introduction Comment se traduit la différence entre utilisateurs dans le lexique? La correspondance concept lexème est-elle forcément statique? Dans le domaine mathématique, quelles particularitées des bases lexicales? Journée GenI, Paris - Sept. 2003 p.4/24

Plan Présentation du problème G-TAG Bases de connaissances conceptuelles Bases de connaissances lexicales Acquisition de ressources lexicales Lexicalisation Conclusion Journée GenI, Paris - Sept. 2003 p.5/24

G-TAG [Danlos, 1998] Quoi-dire-?: graphes conceptuels; Comment-le-dire-?: bases lexicales; Un concept est associé à une BL composée des lexicalisations possibles de ce concept; Les choix lexicaux sont effectués en même temps que les choix de réalisation syntaxique; approche lexicalisée tant pour les phrases que pour les textes (pas de modularisation en «text planner» et «sentence planner», mais modularisation basée sur l input); Journée GenI, Paris - Sept. 2003 p.6/24

G-TAG - suite E2 =: NAPPING [NAPPER H1] with [DURATION D1] Journée GenI, Paris - Sept. 2003 p.7/24

G-TAG - suite E2 =: NAPPING [NAPPER H1] with [DURATION D1] BL(NAPPING) = NAPPER a fait la sieste (pendant DURATION). faire-la-sieste * arg1 NAPPER Journée GenI, Paris - Sept. 2003 p.7/24

G-TAG - suite E2 =: NAPPING [NAPPER H1] with [DURATION D1] BL(NAPPING) = NAPPER a fait la sieste (pendant DURATION). faire-la-sieste * arg1 NAPPER La sieste de NAPPER (a duré DURATION). la-sieste * arg1 NAPPER Journée GenI, Paris - Sept. 2003 p.7/24

G-TAG - fin E2 =: SUCCESSION [1st-EVEN E1, 2nd-EVENT E2 ] BL(SUCCESSION)= (+T,+P) (+T,+P) (-T,+P) ensuite auparavant avant arg1 / \ arg2 arg2 / \ arg1 arg1 / \ arg2 1stE 2ndE 2ndE 1stE 1stE 2ndE Journée GenI, Paris - Sept. 2003 p.8/24

Plan Présentation du problème G-TAG Bases de connaissances conceptuelles Bases de connaissances lexicales Acquisition de ressources lexicales Lexicalisation Conclusion Journée GenI, Paris - Sept. 2003 p.9/24

Bases de connaissances conceptuelles Bases de connaissances en DL; DKB: base de connaissances du domaine; UKB: base de connaissances de l utilisateur; UKB DKB Journée GenI, Paris - Sept. 2003 p.10/24

KB conceptuelles - example e:espacevectorielfini pf: PartieFinie (e,pf): EstEngendre d: Dimension (e,d): AvoirDimension EspaceVectorielFini=EspaceVectoriel EstEngendre.PartieFinie EspaceVectorielFini(e) EspaceVectoriel(e) PartieFinie(pf) Est-Engendre(e,pf) Journée GenI, Paris - Sept. 2003 p.11/24

Plan Présentation du problème G-TAG Bases de connaissances conceptuelles Bases de connaissances lexicales Acquisition de ressources lexicales Lexicalisation Conclusion Journée GenI, Paris - Sept. 2003 p.12/24

Bases de connaissances lexicales A la G-TAG: on associe à un concept une BL: ensemble de lexies chaque lexème est associé à un arbre TAG sous-spécifié les entrées sont décorées par des Traits (+T,+P,-T,-P) Journée GenI, Paris - Sept. 2003 p.13/24

Bases de connaissances lexicales - Exem BL(PROVER) = USER prover THM. prover arg1/ \ arg2 USER THM USER demontrer THM. demontrer arg1/ \ arg2 USER THM Journée GenI, Paris - Sept. 2003 p.14/24

Lexeme Hériter des définitions DEC: Lexie = NOM LEXIE DEFINITION (CS) Liste FL Journée GenI, Paris - Sept. 2003 p.15/24

Plan Présentation du problème G-TAG Bases de connaissances conceptuelles Bases de connaissances lexicales Acquisition de ressources lexicales Lexicalisation Conclusion Journée GenI, Paris - Sept. 2003 p.16/24

Acquisition de ressources lexicales La base de connaisances lexicales est construite de manière incrémentale; Utilisation de corpus alignées de preuves formelles textuelles; MIZAR, MBase/OpenMath; On utilise les axiomes (définitions) de la KB pour remplir les champs CS des Lexies, et déduire certaines FL; la table de correspondance KB BL est calculé automatiquement. Journée GenI, Paris - Sept. 2003 p.17/24

Plan Présentation du problème G-TAG Bases de connaissances conceptuelles Bases de connaissances lexicales Acquisition de ressources lexicales Lexicalisation Conclusion Journée GenI, Paris - Sept. 2003 p.18/24

Lexicalisation L opération de lexicalisation prend en entrée le graphe/sdrs produite; On commence par les relations de discours (2nd ordre) RESULTAT, SUCCESSION,...; On propage les contraintes liées aux lexies choisies: TraitTexte; On fait des retour-arrières sur le dernier choix effectué, en cas de blocage; Journée GenI, Paris - Sept. 2003 p.19/24

Lexicalisation Contraintes supplémentaires sont fournies par: La structure communicative; Régles stylistiques, p.ex. éviter les répétitions: ensuite.. ensuite ensuite.. puis. Journée GenI, Paris - Sept. 2003 p.20/24

Exemple π 0,π 1 π 0,π 0 x x π 0 : π 0 : Entier(x) name(x, x ) π 0 : Entier(y) name(y, y ) introduce(x) introduce(y) Parallel(π 0,π 0 ) π 1,π 1 π 1 : π 1 : divise(x,y) Resultat(π 1,π 2 ) π 1 : premier(y) Narration(π 0,π 1 ) Narration. (arg1, arg2) (+T,-P) Resultat alors(p0, p1)(-t,+p) divise divise(arg1, arg2) Journée GenI, Paris - Sept. 2003 p.21/24

Plan Présentation du problème G-TAG Bases de connaissances conceptuelles Bases de connaissances lexicales Acquisition de ressources lexicales Lexicalisation Conclusion Journée GenI, Paris - Sept. 2003 p.22/24

Conclusion Construction de BL guidée par la KB; Calcul des tables de correspondances Concept Lexie automatique; L algorithme de lexicalisation récursif exploite la structure de l entrée; Le système de contraintes permet d éviter certaines configurations impossibles; Implémenté dans CLEF. Journée GenI, Paris - Sept. 2003 p.23/24

References [Danlos, 1998] Danlos, Laurence (1998). G-TAG : un formalisme lexicalisé pour la génération de textes inspiré de TAG. Revue T.A.L., 39(2), 7 33. [Stede, 1999] Stede, M. (1999). Lexical semantics and Knowledge representation in Multilingual text generation. Kluwer Academic Publishers. Journée GenI, Paris - Sept. 2003 p.24/24