Comment prendre en compte la sémantique lexicale dans une grammaire catégorielle?

Documents pareils
dans un cadre richement typé

Cours d Analyse. Fonctions de plusieurs variables

Nom de l application

Compte-rendu de Hamma B., La préposition en français

Cours No 3 : Identificateurs, Fonctions, Premières Structures de contrôle.

Un K-espace vectoriel est un ensemble non vide E muni : d une loi de composition interne, c est-à-dire d une application de E E dans E : E E E

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Rappel. Analyse de Données Structurées - Cours 12. Un langage avec des déclaration locales. Exemple d'un programme

Présentation du langage et premières fonctions

COPENHAGUE, AVANT ET APRÈS ENJEUX ET PERSPECTIVES POUR LES ENTREPRISES. Novembre 2009

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

Adopter une attitude adaptée à la situation : Langage et paralangage (notions étudiées dans le chap 1)

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Utilisation des tableaux sémantiques dans les logiques de description

Chapitre 5 LE MODELE ENTITE - ASSOCIATION

Expression des contraintes. OCL : Object C o n t r a i n t L a n g u a g e

Probabilités sur un univers fini

Apprentissage Automatique

Capes Première épreuve

Continuité en un point

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

Master Informatique Aix-Marseille Université

OCL - Object Constraint Language

Fiche de synthèse sur la PNL (Programmation Neurolinguistique)

Introduction aux Bases de Données

Fonctions de deux variables. Mai 2011

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

La construction discursive de la signification : le point de vue argumentatif

OASIS Date de publication

Structures algébriques

Modélisation et simulation

Construction et maintenance d une ressource lexicale basées sur l usage

Grammaires d unification

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Simulation de variables aléatoires

UML et les Bases de Données

Image d un intervalle par une fonction continue

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

INTRODUCTION : Données structurées et accès simplifié

CATALOGUE DES FORMATIONS 2014

Chapitre 1 : Introduction aux bases de données

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

Développements limités. Notion de développement limité

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Bases de données élémentaires Maude Manouvrier

Auxiliaire avoir au présent + participe passé

Concevoir sa stratégie de recherche d information

Systèmes d information et bases de données (niveau 1)

[ édité le 30 avril 2015 Enoncés 1

L A B U S I N E S S. d a t a g i n f o r m a t i o n g a c t i o n

INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

Etude de fonctions: procédure et exemple

Logique : ENSIIE 1A - contrôle final

1ère partie Nadine Cullot. Bases de données déductives. Bases de données déductives Introduction et Motivation

Document d aide au suivi scolaire

Mots interrogatifs. Quand,comment,pourquoi,qui... sont des mots interrogatifs qui servent à introduire une phrase interrogative.

CUEEP Département Mathématiques E 821 : Problèmes du premier degré 1/27

IFT2255 : Génie logiciel

Variables Aléatoires. Chapitre 2

Quatrième partie IV. Test. Test 15 février / 71

Atelier rédactionnel

Introduction au Data-Mining

Méthode de classification des réponses d un moteur de recherche

Résolution d équations non linéaires

Spécialité auxiliaire en prothèse dentaire du brevet d études professionnelles. ANNEXE IIb DEFINITION DES EPREUVES

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Cours d algorithmique pour la classe de 2nde

CHAPITRE IV. L axiome du choix

Cours d Analyse 3 Fonctions de plusieurs variables

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

PNL & RECRUTEMENT IMPACT SUR LES ENTRETIENS Présentation du 10/06/03

Exclusion Mutuelle. Arnaud Labourel Courriel : arnaud.labourel@lif.univ-mrs.fr. Université de Provence. 9 février 2011

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Distinction des questions et des consignes

données en connaissance et en actions?

Calculateur quantique: factorisation des entiers

Ariane Moffatt : Je veux tout

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Quelques tests de primalité

Développement et applications de la base de données terminologiques de Matra Marconi Space

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

UNIVERSITE LA SAGESSE FACULTÉ DE GESTION ET DE FINANCE MBA OPTION MIS. MIAGe METHODES INFORMATIQUES APPLIQUEES A LA GESTION

ALGORITHMIQUE ET PROGRAMMATION En C

Cours de mathématiques

eduscol Ressources pour la voie professionnelle Français Ressources pour les classes préparatoires au baccalauréat professionnel

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining -

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013

L apprentissage automatique

Méthode du commentaire de document en Histoire

EXERCICE 4 (7 points ) (Commun à tous les candidats)

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Exercice 6 Associer chaque expression de gauche à sa forme réduite (à droite) :

INITIATION AU LANGAGE C SUR PIC DE MICROSHIP

Rapport de stage Nom de l entreprise. Date du stage. Rapport de stage Nom de l entreprise. Date du stage. Nom du professeur principal

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Transcription:

Comment prendre en compte la sémantique lexicale dans une grammaire catégorielle? Christian Retoré (Université de Bordeaux, LaBRI & INRIA) Exposé au Laboratoire Parole et Langage Aix-en-Provence, mercredi 19 janvier 2011, 15h

Table des matières I Aspects lexicaux de la sémantique compositionnelle 3 II Le versant compositionnel : sémantique de Montague 7 III Extension du système de types 17 IV Les facettes dans un lexique catégoriel 23 V Comptage, quantification et individuation 39 VI Critiques et amélioration linéaire 43 VII Conclusion 48

Première partie Aspects lexicaux de la sémantique compositionnelle

1. Glissement de sens, facettes Qualia Une cigarette rapide (télique) Un article engagé (agentif) Dot Objects, Facettes (terminologie de J. Jayez) Un livre intéressant (I ) Un livre volumineux (ϕ) Pour que le prédicat associé à «aimer» soit plus qu une simple constante indépendante «aimer :e e t» mais qu il soit inséré dans un tissu de relations entre lexèmes «amour, passion, amitié, désir, apprécier, manger,...».

2. Prédication sur une des facettes (1) Un livre lourd. (2) Un livre intéressant. (3) Un dîner a duré des heures. (4) Le dîner est délicieux. (5) Marseille bat parfois Bordeaux. (6) Marseille est un grand port. (7) Washington borde le Potomac. (8) Washingon envoie des troupes en Afghanistan. (9) Un délicieux saumon. (10) Un saumon rapide.

3. Coprédication sur plusieurs facettes La prédication simultanée sur plusieurs facettes est plus ou moins heureuse : (11) Un livre lourd mais intéressant. (12) Une ville portuaire et cosmopolite. (13) Le dîner était délicieux mais a duré des heures. (14)? Un saumon rapide mais délicieux. (15)? Marseille est un grand port et bat parfois Bordeaux. (16)? Washington borde le Potomac et envoie des troupes en Afghanistan.

Deuxième partie Le versant compositionnel : sémantique de Montague

4. Sémantique de Montague. Types. Entités : e Valeurs de vérité : t. types ::= e t types types Termes : pour chaque type U on se donne une infinité dénombrable de variables et de constantes de type U une variable ou une constante x de type U est un terme de type U si t est un terme de type U V et u un terme de type U alors (t(u)) est un terme de type V si x est une variable de type U et t un terme de type V alors λx. t est une terme de type U V.

5. Sémantique de Montague : syntaxe et sémantique. (Type syntaxique) = Type sémantique S = t une phrase est une proposition np = e un groupe nominal est une entité n = e t un nom commun est une partie des entités (A\B) = (B/A) = A B s étend à toutes les catégories d une grammaire catégorielle

6. Des constantes pour les opérations logiques Constant Type (e t) t (e t) t t (t t) t (t t) t (t t)

7. Des constantes pour les prédicats du langage La dénotation des mots requiert des prédicats : aime λxλy (aime y) x x : e, y : e,aime : e (e t) «aime» est un prédicat binaire Garance λp (P Garance) P : e t, Garance : e «Garance» est décrite comme les propriétés de «Garance»

8. Calcul de la forme logique : recette 1. Insérer sur les feuilles de l arbre syntaxique les λ-termes fournis pas le lexique, en respectant les applications. 2. Réduire le λ-terme de type t : c est la forme logique de l énoncé analysé.

9. Exemple de calcul de forme logique word type sémantique u semantics : λ-terme de type u x v la variable ou constante x est de type v certains (e t) ((e t) t) λp e t λq e t ( (e t) t (λx e ( t (t t) (P x)(q x) énoncés e t λx e (statement e t x) parlent_de e (e t) λy e λx e ((speak_about e (e t) x)y) eux-mêmes (e (e t)) (e t) λp e (e t) λx e ((P x)x)

10. Exemple de structure syntaxique La syntaxe fournit un λ-terme de ce genre : ((some statements) (themselves speak_about)) de type S = t

11. Calcul... ( (λpe t λq e t ( (e t) t (λx e ( (P x)(q x)))) ) ( λxe (statement e t x) )) ( (λpe (e t) λx e ((P x)x) ) ( λye λx e ((speak_about e (e t) x)y) )) β ( λqe t ( (e t) t (λx e ( t (t t) (statement e t x)(q x)))) ) ( λxe ((speak_about e (e t) x)x) ) β ( (e t) t (λx e ( (statement e t x)((speak_about e (e t) x)x)

12. Résultat Sous une forme plus agréable : x : e (statement(x) speak_about(x, x)) Un peu trop simple, non?

Troisième partie Extension du système de types

13. Extensions : une logique multisorte, TY n Le type e des entités est divisé en plusieurs sortes : TY n extension sans surprise, il s agit d une ontologie plate : événements, objets, concepts,... mais comme le seul connecteur est, les réunions et intersections posent des problèmes (surmontables).

14. Extension : types du second ordre (Système F, Girard) Variables de type et quantification sur les type. Types de base : constantes e and t, ainsi que des variables de type α in P. Quand T est un type et α une variable de type variable présente ou non dans T, Λα. T est un type. Quand T 1 et T 2 sont des types, T 1 T 2 est aussi un type.

15. Extension : termes du second ordre (Système F, Girard) «t : U» signifie «t est un terme de type U» Une variable ou une constante de type T c.-à-d.x : T or x T est un terme de type T. On dispose d une infinité de variables de chaque type. (f τ) est un terme de type U quand τ : T et f : T U. λx T. τ est un terme de type T U quand x : T et τ : U. τ{u} est un terme de type T [U/α] quand τ : Λα. T et U est un type. Λα.τ est un terme de type Λα.T quand α est une variable de type et τ : T est un terme sans variable libre de type α.

16. Extension : β-réduction au second ordre. La réduction est définie comme suit : (Λα.τ){U} se réduit en τ[u/α] (α et U sont des types). (λ x.τ)u se réduit en τ[u/x] (réduction habituelle). Lorsque les constantes décrivent un langage logique, les λ-termes clos et normaux de type t correspondent à des formules logiques.

17. Exemple du second ordre : la coordination Étant donnés deux prédicats P α t et Q β t sur des sortes respectives α et β quand on a deux modifications de ξ vers α et vers β on peut coordonner des objets de type ξ : Λξ λx ξ λf ξ a λg ξ b.(and (P (f x))(q (g x))) On peut même le faire pour tous les prédicats P,Q et les types α, β auxquels ils s appliquent : ΛαΛβλP α t λq β t Λξ λx ξ λf ξ α λg ξ β.(and (P (f x))(q (g x)

Quatrième partie Les facettes dans un lexique catégoriel

18. Notre organisation du lexique Rester dans un cadre montagovien et compositionnel (mais sans modèles) Autoriser la tête et ses complément à contribuer au sens d un composé. Intégration possible dans la sémantique discursive (λ-drt). On propose un système basé sur des modifications optionnelles.

19. Les types Composition montagovienne : type et ordre des arguments. Hiérarchie de concepts issue du lexique génératif. Des types différents pour les différentes facettes du sens. Une sorte d ontologie décrit les relations de spécialisation. Type du second ordre, système F, pour les modifications sur des types génériques : Λαλx A y α f α R.((read A R t x) (f y))

20. Les termes : le terme principal, standard Un λ-terme standard est rattaché au sens principal. Pour la structure logique et compositionnelle. Contient le typage, sa sous catégorisation. Inclut des créneaux pour les modifications optionnelles Λαβλx α y β f α A g β F.((eat A F t (f x)) (g y)) Ce peut aussi être une simple constante Paris T

21. Les termes : modifications optionnelles Chacun est une fonction à un argument. Utilisée ou non pour adapter prédicat et argument. Avec ( une contrainte : rigide, ) Id F F, f Living F grind rigid ( Id T T, f T L ) L, f P T P, f G T G rigid

22. Une entre lexicale complète Chaque lexème se trouve associé à n-uplet de ce genre : ( Paris T, λxt. x T, λxt.(f T L L x), λxt.(fp T P x), λxt.(fg T G rigid x

23. Utilisation RIGIDE (et non flexible) des modifications optionnelles Conflit de type : (λx V. (P V W x))τ U (λx V. (P V W x)) (f U V τ U ) f : modification optionnelle associée à P ou à τ f est appliquée une fois à l argument and non à chacune des occurences de x du corps de la fonction. Une conjonction donne (λx V. ( (P V W x) (Q V W x)) (f U V τ U ) : l argument est uniformément transformé. Le second ordre n est pas utilisé, le type V de l argumentest connu et reste le même pour toutes les occurrences de x.

24. Utilisation FLEXIBLE (et non rigide) des modifications optionnelles (λx?. ( (P A X x? ) (Q B Y x? ) )τ U : conflits de types [Montague :? = A = B e.g. e t] (Λξ.λf ξ A.λg ξ B. ( (P A X (fx ξ )) (Q B Y (gx ξ )) )) {U} f U A g U B τ U f,g : modifications optionnelles associées à P ou à τ. Pour toute occurrence de x : types A,B,... et fonctions f, g,... possiblement différents pour chaque occurrence.

25. Le système F à l œuvre dans la flexibilité Typage du second ordre : 1) anticipe le type encore inconnu de l argument 2) factorise les types différents des fonctions pour les différentes occurrences de l argument. Le type {U} et les modifications associées f sont inférés du terme usuel (λx V. (P V W x))τ U.

26. Le comportement standard est conservé (ouf!) φ : objets physiques petite pierre small stone {}}{{}}{ (λx ϕ. (small ϕ ϕ x)) τ ϕ (small τ) ϕ

27. Accès aux qualia un sourire songeur et aimant wondering, loving {}}{ (λx P. (and t (t t) (wondering P t x) (loving P t x))) smile {}}{ τ S (λx P. (and t (t t) (wondering P t x) (loving P t x))))(f S P a τ S ) (and (loving (f a τ)) (loving (f a τ)))

28. Facettes (dot-objects) : coprédications incorrectes La condition de rigidité bloque les coprédications f Fs Fd g et ne peut être utilisée comme modification rigide dans : (??) The thon que nous avons mangé hier était vif comme l éclair et délicieux. Une description plus fine devrait prendre en considération la structure syntaxique (propositions relatives, complétives,...), mais aussi le temps, l aspect,...

29. Facettes : coprédications correctes. Exemple 1/3 V ville L lieu P personnes C V Copenhague f V P p f V L l Copenhague est un port et une capitale cosmopolite.

30. Facettes, coprédication correctes. Exemple 2/3 Conjonction de cospl P t, cap V t et port L t, on C V Si V = P = L = e, (Montague) (λx e (and t (t t) ((and t (t t) (cospl x) (cap x)) (port x))) C. Ici on a un ET entre trois prédicats portant sur des sortes différentes P α t, Q β t, R β t ΛαΛβ Λγ λp α t λq β t λr γ t Λξ λx ξ λf ξ α λg ξ β λh ξ γ. (and(and (P (f x))(q (g x)))(r (h x))) f, g et h transforment x dans des types différents.

31. Facettes, coprédication correctes. Exemple 3/3 ET appliqué à P,V,L avec cospl P t,cap V t,port L t donne : Λξ λx ξ λf ξ α λg ξ β λh ξ γ. (and(and (cospl P t (f p x))(cap V t (f t x)))(port L t (f l x))) On peut maintenant appliquer ce terme au type V et aux modifications fournies par le lexique. Comme cap V t ne pose aucun problème on utilise l identité id V V. Pour L et P on utilise les modifications correspondantes, f p et f l. (and t (t t) (and t (t t) (cospl(f p C V ) P ) t )(cap(id C V ) V ) t ) t (port (f l C V ) L ) t ) t

32. Résumé des principes de notre modèle Compositionnalité, petits et grands lambdas : λ du premier ordre : composition usuelle. Λ du second ordre : polymorphisme, souplesse. Créneaux : engendrent toutes les combinaisons possibles de modifications. Langage logique Formules usuelles de la logique d ordre supérieur. Pas de modalités. Pas de connecteurs linéaires.

Cinquième partie Comptage, quantification et individuation

33. Comptage, quantification et individuation Situation Une étagère. Trois exemplaires de Madame Bovary. Deux exemplaires de L éducation sentimentale. Les romans de Flaubert en un volume (L éducation sentimentale, Madame Bovary, Bouvard et Pécuchet) Un volume comprenant Trois contes : Un coeur simple, La légende de Saint-Julien, Salammbô Un exemplaire de la Correspondance en deux volumes.

34. Comptage et Individuation Questions J ai monté tous les livres au grenier. En effet, je les avais déjà lus. Combien de livres ai-je portés? Combien de livres ai-je lus? (Au passage, attention : book livre)

35. Comptage et Individuation Solution Résolu par des projections on compte aprés les modifications appropriées, les pronoms renvoient au groupe nominal avant modification. λx( (in_biblio livre (f (x)))(&(brulé φ t (g(x)))(lu I t (h(x)))))

Sixième partie Critiques, amélioration linéaire

36. Critiques La solution avec des produits (des couples) impose p 1 (u),p 2 (u) = u (très discutable) (solution d Asher, produits fibrés) relation trop forte entre la structure du type et les modifications (la nôtre) aucune relation entre la structure du types et les modifications

37. Dictionnaire et univers du discours Système conceptuel lexique Ambigüité fondamentale. Que décrit-on? l univers du discours une ontologie ou l ontologie linguistique du dictionnaire «Une roue de ma voiture est crevée.» peut se dire : (17) Ma voiture est crevée. (18) J ai crevé. En revanche, la langue n autorise pas : (19) * Ma voiture est bouchée. (carburateur? durite?) (20) * Ma voiture est à plat. (batterie?)

38. Variation linguistique Chaque langue accède différemment aux facettes. Ces exemples et les comparaisons entre langues montrent qu il faut distinguer l univers de la langue. La langue agit comme un filtre idiosyncratique sur l univers et notre modèle en rend compte. Une langue crée aussi des connexions spécifiques (captivus : cattivo, chétif morbus : morbide, morbido) : rien n est là pour modéliser la diachronie.

39. Alternative linéaire pour lier types et termes Produit monoïdal et opérateur de duplication «!» A B p 1 (u),p 2 (u) = u sans modifications canoniques mais la modification est reliée à la structure du type : f : (A B) A Internalisation des contraintes sur les modifications dans la structure même des types linéaires ; modification rigide, irréversible type linéaire : A U [A,A U U A] modification flexible, réutilisable type linéaire : A B = (!A) U [(!A),(!A) U U (!A)]

Septième partie Conclusion

40. Bilan et perspectives Extension de la sémantique de Montague avec ces modifications de type. Une petite réalisation a été intégrée à l analyseur syntaxique et sémantique Grail de Richard Moot par Emeric Kien (stagiaire ENS Cachan). Grammaire extraite du corpus arboré de Paris 7 (French Tree Bank) Le Monde Les relations sémantiques sont difficiles à extraire, elles ont été ajoutée à la main sur une petite partie du lexique. Travail logique en cours : logique linéaire du premier ordre, en particulier ses modèles pour passer de x : A à A(x). Les faisceaux de modèles sont une piste intéressante.

41. Références bibliographiques The generative lexicon. James Pustejovsky, MIT Press 1995. The metaphysic of words in context. Nicholas Asher, James Pustejovsky, manuscrit, 40 pages, 2001. Word meaning and commonsense metaphysics. Nicholas Asher, James Pustejovsky, manuscrit, 40 pages, 2005. Lexical Meaning in Context : A Web of Words. Nicholas Asher manuscrit, 500 pages, 2009. Towards a Type-Theoretical Account of Lexical Semantics. Christian Bassac Bruno Mery Christian Retoré Journal of Logic Language and Information, 19(2) 229-245, 2010.