Analyse syntaxique et application aux langues naturelles. Grammaires Lexicales Fonctionnelles (LFG)



Documents pareils
Grammaires d unification

TD 1 - Structures de Traits et Unification

Modélisation des données

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB Olivier Augereau Formation UML

Université de Bangui. Modélisons en UML

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

quelque quelque(s) quel(s) que/quelle(s) que quel(s) / quelle(s) qu elle(s)

Initiation à la Programmation en Logique avec SISCtus Prolog

Conception des bases de données : Modèle Entité-Association

Utilisation des tableaux sémantiques dans les logiques de description

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

Évaluation et implémentation des langages

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année

fiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile.

INF 232: Langages et Automates. Travaux Dirigés. Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies

Vérification formelle de la plate-forme Java Card

Langue Française. Syllabus A1. Description globale du niveau A1 utilisateur élémentaire

Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

Conception des systèmes répartis

Bases de données Cours 5 : Base de données déductives

Suivant les langages de programmation, modules plus avancés : modules imbriqués modules paramétrés par des modules (foncteurs)

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

OCL - Object Constraint Language

Rappels Entrées -Sorties

Chapitre 5 LE MODELE ENTITE - ASSOCIATION

Le modèle standard, SPE (1/8)

Générer du code à partir d une description de haut niveau

peu peux/peut peut être peut-être

UML (Diagramme de classes) Unified Modeling Language

Expression des contraintes. OCL : Object C o n t r a i n t L a n g u a g e

Chapitre I : le langage UML et le processus unifié

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Programmation d'agents intelligents Vers une refonte des fils de raisonnement. Stage de fin d'études Master IAD 2006

Chap. 3: Le modèle de données entité-association (E.A.)

Atelier ATOLL pour les grammaires d arbres adjoints

Théorie de la Programmation

Systèmes décisionnels et programmation avancée

Formation Pédagogique 3h

Fondements de l informatique Logique, modèles, et calculs

Cours 1 : Qu est-ce que la programmation?

Atelier rédactionnel

IFT2255 : Génie logiciel

Compte rendu de la formation

Introduction au Génie Logiciel

COURS EULER: PROGRAMME DE LA PREMIÈRE ANNÉE

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Le transistor bipolaire

La Certification de la Sécurité des Automatismes de METEOR

Présentation du langage et premières fonctions

Cours 1 : La compilation

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

Démarches d urbanisation : réorganiser le Système d Information en structurant ses fonctions dans des blocs fonctionnels communicants.

Distinction des questions et des consignes

Créer et modifier un fichier d'import des coordonnées approximatives avec Excel

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Problématiques de recherche. Figure Research Agenda for service-oriented computing

1ère partie Nadine Cullot. Bases de données déductives. Bases de données déductives Introduction et Motivation

mes m est mets/met mais mets

DIFFÉRENCE ENTRE UN COMPLÉMENT D OBJET DIRECT ET UN COMPLÉMENT D OBJET INDIRECT ACCORD DES PARTICIPES PASSÉS MARCEL PÈREZ 2001

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

Cours de Master Recherche

! Text Encoding Initiative

Intelligence Artificielle Planification

Intelligence artificielle appliquée à l automatique

Plan. Exemple: Application bancaire. Introduction. OCL Object Constraint Language Le langage de contraintes d'uml

ces ses c est s est sais / sait

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

ça sa ÇA HOMOPHONES LES EXERCICES DE FRANÇAIS DU CCDMD Homophones grammaticaux de catégories différentes

Ingénierie Dirigée par les Modèles. Editeurs de modèles. (Eclipse Modeling Tools) Jean-Philippe Babau

«La pomme qui voulait voyager»

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Informatique Théorique : Théorie des Langages, Analyse Lexicale, Analyse Syntaxique Jean-Pierre Jouannaud Professeur

Le Collège de France crée une chaire pérenne d Informatique, Algorithmes, machines et langages, et nomme le Pr Gérard BERRY titulaire

Chapitre VI- La validation de la composition.

Langage et Concepts de Programmation Objet. 1 Attributs et Méthodes d instance ou de classe. Travaux Dirigés no2

BASES DE DONNÉES RÉSEAUX ET HIÉRARCHIQUES

PARCOURS COMPLET AU COURS MOYEN

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining -

Les diagrammes de modélisation

Rappel sur les bases de données

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

Homophones grammaticaux de catégories différentes. s y si ci

LIVRET PERSONNEL DE COMPÉTENCES

Manuel de référence des commandes SMS Advisor Advanced

Thèmes et situations : Cadre et conditions de travail. Fiche pédagogique

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Algorithmes d'apprentissage

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Formula Negator, Outil de négation de formule.

Perl Console. Votre compagnon pour développer en Perl. Les Journées du Perl , 17 novembre, Lyon. Alexis Sukrieh

Cours de Génie Logiciel

TP - Alarme de voiture / Approche fonctionnelle

Master Informatique et Systèmes. Architecture des Systèmes d Information. 02 Architecture Applicative

Evry - M2 MIAGE Entrepôt de données

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Transcription:

Université de Nice Sophia Antipolis Master 2 Recherche PLMT Analyse syntaxique et application aux langues naturelles Grammaires Lexicales Fonctionnelles (LFG) Jacques Farré et Sylvain Schmitz Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 1

Insuffisance des grammaires non contextuelles Le problème de l analyse syntaxique est le suivant! Les différents composants d une phrase doivent s accorder de manière cohérente! Il faut établir une correspondance entre les relations entre ces composants et l organisation de surface de ces composants Paul m a donné ce livre / Ce livre m a été donné par Paul En ce sens, les grammaires non contextuelles (CFG) sont insuffisantes pour modéliser les langues naturelles! elles expriment seulement l organisation de surface Il faut un modèle avec 2 niveaux de description : c est ce que font les grammaires lexicales fonctionnelles (LFG) Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 2

Structure de composants et structure fonctionnelle La structure de composants (c-structure) est définie en terme de mots (de forme fléchie de lemme), de catégories lexicales (verbe, nom, ) et de leurs relations syntaxiques! Ces relations syntaxiques se représentent à l aide d un arbre! Les CFG (mais aussi d autres formalismes grammaticaux) sont un bon outil pour décrire ce niveau La structure fonctionnelle (f-structure, on parle aussi de traits) permet de représenter des notions comme sujet, objet, temps, genre, et leurs relations grammaticales! Une f-structure est un ensemble ordonné de couples (attribut, valeur) Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 3

Structure fonctionnelle Un attribut est le nom d un concept grammatical : par ex. SUBJ (sujet), OBJ (objet), TENSE (temps), NUM (singulier/pluriel), SPEC (spécificateur/article), Les valeurs des attributs sont soit! des symboles : par ex. PAST (pour le temps), SG (pour singulier)! des formes sémantiques : par ex. une entrée dans le lexique, un prédicat et ses arguments! des f-structures secondaires (les f-structures peuvent donc aussi être vues comme des arbres ou plutôt des graphes orientés)! des ensembles d un des 3 types précedents Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 4

Exemple de c-structure et de f-structure La grammaire : S NP VP, NP det N, VP V NP NP permet de produire la phrase A girl handed the baby a toy S NP VP V NP NP det N Det N Det N A girl handed the baby a toy c-structure SUBJ SPEC A PRED "girl" TENSE PAST PRED "hand" SUBJ, OBJ, OBJ2 OBJ OBJ2 SPEC THE PRED "baby" SPEC A PRED "toy" f-structure Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 5

Formalisme de description La grammaire est enrichie pour décrire le calcul des f-structures : ce sont des équations qui décrivent les valeurs obtenues par l application de fonctions Ces équations s expriment en termes de f-structure des composants de la c-structure, notés et Les équations de la grammaire permettent «d instancier» les f-structures associées aux c-structures : Par exemple : S NP VP ( SUBJ) = = le sujet de S est égal à la f-structure de NP, et la f-structure de VP est «copiée» directement dans la f-structure de S Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 6

Mécanisme de «transmission» des f-structures (1) Reprenons la grammaire, maintenant enrichie d équations VP V NP NP = ( OBJ)= ( OBJ2)= VP f-struct de VP = TENSE PAST PRED "hand" SUBJ, OBJ, OBJ2 OBJ SPEC THE PRED "baby" OBJ2 SPEC A PRED "toy" V TENSE PAST PRED "hand" SUBJ, OBJ, OBJ2 NP SPEC THE PRED "baby" NP SPEC A PRED "toy" Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 7

Mécanisme de «transmission» des f-structures (2) S NP VP ( SUBJ) = = S f-struct de S = SUBJ TENSE PAST SPEC A PRED "girl" PRED "hand" SUBJ, OBJ, OBJ2 OBJ SPEC THE PRED "baby" NP SPEC A PRED "girl" VP TENSE PAST PRED "hand" SUBJ, OBJ, OBJ2 OBJ SPEC THE PRED "baby" OBJ2 SPEC A PRED "toy" OBJ2 SPEC A PRED "toy" Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 8

f-structures et lexique Le lexique contient des équations de f-structure (ou des informations les simulant) : a det ( SPEC)=A ( NUM)=SG girl N ( PRED)= "girl" ( NUM)=SG Avec la règle NP det N = = NP SPEC= NUM= PRED= det SPEC=A NUM=SG a N PRED= "girl" NUM=SG girl On peut voir des analogies avec les grammaires attribuées : en yacc NP : det N { $$.SPEC = $1.SPEC; $$.PRED = $2.PRED; $$.NUM =???; } Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 9

Règles d unification L unification permet d ajouter des traits non spécifiés un det ( SPEC)=A ( NUM)=SG corps N ( PRED)= "corps" ( NUM)= NP det N = = NP SPEC= NUM= PRED= det SPEC=A NUM=SG un N PRED= "corps corps Les valeurs unifiées doivent bien sûr être égales Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 10

Formes «sémantiques» Les valeurs de l attribut PRED, par exemple l expression prédicat-argument "hand" SUBJ, OBJ, OBJ2, sont assez proches des termes du langage Prolog, et sont traitées par unification On a l équivalent du terme hand (agent, thème, but) Chaque argument sera unifié avec les interprétations de, respectivement, SUBJ, OBJ, OBJ2, qui devront être présents dans la f-structure qui contient cette attribut PRED Donc agent = le lemme "girl au singulier précédé d un article indéfini Toute f-structure doit avoir un (et un seul) attribut PRED, et tous ses arguments doivent être instanciés Il n y a pas unification des attributs PRED Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 11

Définitions un peu plus formelles : opérations sur les f-structures Une f-structure A est une extension de B (A B) ssi:! Tout trait atomique de B est présent dans A avec la même valeur! Toute sous f-structure F de A est une extension de la sous f-struct F de B L unification C de deux f-structures A et B (C = A B) est la f-structure minimale telle que C A et C B! L unification peut donc échouer, noté La généralisation C de deux f-struct A et B (C = A G B) est la f-structure maximale telle que A Cet B C On peut faire une analogie avec le plus petit multiple commun et le plus grand diviseur commun de 2 nombres Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 12

Définitions un peu plus formelles : équations fonctionnelles Pour un attribut a d une f-structure! ( a) = α sous un composant de c-structure X unifie les traits de la f-struct de X par a = α Exemple pour le chien se léche les babines S NP pr-réfl VP ( CAT) = verbe-pronominal! ( a) = α dans une règle Y unifie les traits de la f-struct de Y par a = α! Autre opérations possibles : inexistence, appartenance à un ensemble ~( a), ( a ) a! Possibilité de nommer un attribut d une sous f-structure : ( SUBJ NUM) = α!... Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 13

Unification comme moyen de contrôle contextuel Supposons qu un verbe a aussi un attribut NUM qui indique s il est au singulier ou au pluriel Dans S NP VP ( SUBJ) = = on ne vérifie pas qu il y a accord entre le sujet et le verbe, ce qui autorise une fille dormions puisque les 2 attributs NUM ne sont pas unifiés (ils ne sont pas au même niveau) SUBJ SPEC A PRED "fille" TENSE PAST PRED "dormir" SUBJ NUM PL On peut ajouter une équation ( SUBJ NUM) = ( NUM) pour faire la vérification (et donc considérer la phrase ci-dessus comme incorrecte) Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 14

Contraintes existentielles On peut contraindre à ce qu un attribut soit présent (ou absent), sans vouloir préciser sa valeur Par exemple un nom peut être un nom commun (ayant un attribut ART) et doit être précédé d un article, ou un nom propre (sans attribut ART), non précédé d un article : S N VP det N VP ~( ART) ( ART) permet d accepter la fille dort ou Jean dort, et de rejeter fille dort ou le Jean dort Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 15

Equations contraintes Il n y a pas, en général, de correspondance 1-1 entre c-structure et f-structure! S VP pour Hand the baby a toy! La f-structure de S contient un attribut SUBJ alors que la forme superficielle de la phrase n a pas de sujet! Le verbe doit être un infinitif (attribut INF)! Donc S VP = ( INF) = c + ( SUBJ PRED) = you qui exige que l entrée lexicale de hand ait un trait ( INF) = c + puisque = Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 16

Partage des structures fonctionnelles Comment traiter Jean demande quelle fille Paul regarde? fille est l objet de regarde, mais aussi celui de demande Ils partagent l objet S NP VP SUBJ PRED "Jean PRED "demander" SUBJ, COMP COMP FOCUS SUBJ Q + PRED "fille PRED "Paul PRED "regarder" SUBJ, OBJ OBJ ( SUBJ) = VP V S = NP det N = S NP S ( FOCUS) = = ( COMP) = = = ( Q) = c + ( Q) = + ( FOCUS) = ( OBJ) Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 17

Accès «à distance» Des constituants n ont pas de relation immédiate dans la c-structure (c-à-d père-fils) mais ont des dépendances fonctionnelles : Jean demande quelle fille Marie pense que Paul regarde! fille est l objet de regarde, mais aussi le focus de demande qui n ont pas de relation immédiate dans l arbre! Donc transformation de la règle S en utilisant une dépendance à distance: S NP S ( FOCUS) = = ( Q) = c + ( Q) = + ( FOCUS) = (COMP)*OBJ on «descend» dans les f-structures jusqu à un attribut COMP ayant un attribut OBJ Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 18

Accès «à distance» Jean demande quelle fille Marie pense que Paul regarde SUBJ PRED "Jean PRED "demander" SUBJ, COMP FOCUS PRED "fille COMP SUBJ Q + PRED "Paul PRED "penser" SUBJ, COMP SUBJ PRED "Marie COMP SUBJ PRED Paul PRED "regarder" SUBJ, OBJ OBJ Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 19

Bonne formation des f-structures Pour être bien formée, une f-structure doit respecter les principes suivants :! Unicité : un même attribut ne peut y être présent qu une fois avec une seule valeur à un même niveau! Complétude : ses sous-structures doivent être complètes, c-à-d tous les arguments obligatoires du prédicat doivent être présents Ce problème concerne Jean ( OK) / Ce problème concerne ( KO)! Cohérence : ses sous-structures doivent être cohérentes, c-à-d tous les arguments du prédicat doivent avoir des valeurs correctes Jean dort (pendant) le jour ( OK) / Jean dort (pendant) la pomme ( KO) f-structure malformée phrase incorrecte Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 20

Bonne formation des f-structures (exemple) Reprenons S VP, VP NP NP = ( OBJ) = ( OBJ2) = qui permet de produire Hand the baby a toy L équation = permet de définir l ancre (on dit aussi la tête) de S, c-à-d quelle f-structure sera celle de S (donc ici celle de VP) Il y aura dans le lexique une entrée pour hand en tant que verbe, mais aussi une en tant que nom commun! l entrée verbe aura un PRED "hand" SUBJ, OBJ, OBJ2 OK! L entrée nom n aura pas de prédicat, ou pas un d arguments SUBJ, OBJ, OBJ2 KO Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 21

Applicabilité des LFG Un 1 er résultat capital : on peut décider si une phrase appartient ou non au langage d une LFG (c est beau de concevoir un formalisme, encore faut-il qu il soit opératoire!) Éléments de preuve : on connaît des algorithmes pour savoir si une phrase appartient au langage d une CFG, et une fois la c-structure construite, on sait vérifier que sa f-structure est bien formée! Si on exclut les grammaires cycliques, c-à-d telles que A, A + A (donc avec des règles du genre A A 1, A 1 A 2, A n-1 A n, A n A) Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 22

Puissance de description des LFG Les langages LF contiennent les langages CF (contextfree), et sont inclus dans les langages CS (contextsensitive) Le langage a n b n c n n est pas CF, mais il est LF :! Grammaire LF : S A B C = = = A a ( x) =0 A A a ( x) = mêmes équations pour B b B b, C c C c Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 23

Puissance de description des LFG (suite) Pour la phrase aabbcc, on a x=[x=0] A x=[x=0] x=[x=0] S B x=[x=0] C OK Mais pour aabcc, on a A x=0 a a B x=0 b b C x=0 c S x=? x=[x=0] A x=0b x=[x=0] A x=0 C x=0 c C KO a a b c c Analyse syntaxique et application aux langues naturelles (Grammaires Lexicales Fonctionnelles) 24