Analyse syntaxique ou grammaticale Analyse syntaxique traditionnelle Généralement fondée sur le paradigme génératif de Chomsky La grammaire a pour objet de générer tous et seulement les énoncés possibles dans une langue (énoncés grammaticaux) En analyse, il s agit d associer à un énoncé (phrase) grammatical(e) de la langue sa structure syntaxique (arbre des séquences de réécritures permettant d obtenir la phrase à partir de l axiome S de la grammaire) S. Aït-Moktar, XRCE Xerox, 2002, liawww.epfl.ch/~chaps/tidt/salah.pdf 1
Grammaires G=( n, t, R, S) n t : vocabulaire non terminal : vocabulaire terminal R : ensemble de règles de réécriture, X->Y S : axiome de la grammaire Suivant les règles de R : Grammaire non contrainte -> trop «lâche» Grammaire en contexte : «X se réécrit Y dans le contexte u v»: uxv ->uyv Grammaire en contexte : X->Y Grammaire régulière (trop figée) 2
Grammaire hors-contexte Exemple : S-> GN G GN -> Det N G -> (Aux) GN Aux -> va ->lire bat mange Det -> le la les un N -> garçon livre pomme S GN G Det N Aux GN le garçon va lire Det N Le garçon va lire un livre Mais aussi : le pomme bat mange la livre un livre 3
Grammaire hors contexte Différences entre structure de surface et structures profondes Exemple «chomskyen» : Time flies like an arrow: S S S GN G GN G G GN GP N GP N N GN N Prep GN Time flies Prep GN Time flies like Det N Time flies like Det N like Det N an arrow an arrow an arrow 4
Grammaires transformationnelles Règles de base Transformations S-> -> -> -> -> Structure profonde Structure de surface Interprétation sémantique Structure phonologique 5
Transformations S S GN Aux G GN Aux G Det N présent GN Det N présent être Part. passé GN le garçon lire Det N un livre lire Prep pqr GN un livre Det N Le garçon lit un livre Un livre est lu par le garçon le garçon 6
Analyse syntaxique traditionnelle Théorie des langages formels de Chomsky Formalisation mathématique pas une théorie linguistique La langue n'est pas un langage indépendant du contexte Les accords Grammaires contextuelles insuffisantes Constituants discontinus : Combien cette salle a-t'elle de fenêtres? 7
Exemples d analyseurs Analyseurs fondés sur les formalismes des théories grammaticales GPSG (Generalized Phrase Phrase-Structure Grammar, Gazdar et al 1985) LFG (Lexical Functional Grammar, Kaplan & Bresnan 1982) UCG (Unification Categorial Grammar, Clader et al 1988) HPSG (Head-driven Phrase Structure Grammar, Pollard & Sag 1994) Autres PATR : formalisme à structures de traits et unification DCG (Definite Clause Grammar) : extension de Prolog 8
Grammaires d unification Introduction de traits dans règles de réécriture Accord : GN -> Det Nom <Det Num> = <Nom Num> <Det Genre> = <Nom Genre> erbe transitif direct : G -> GN < sous-cat> = <GN> erbe intransitif : G -> < sous-cat> = Dormir : <sous-cat> = Rencontrer : <sous-cat> = GN dans le lexique Articulation forte entre lexique - syntaxe - sémantique Structure de traits comme mode de représentation syntaxique Unification comme opération de base pour l analyse 9
Grammaires d unification : définitions Trait = couple (attribut, valeur), de valeur atomique ou complexe : une structure de traits Structure de traits = ensemble des traits Représentation forme = table cat = nom accord = genre = fém num = sing forme cat accord table nom genre num fém sing det = accord = 1 nom = accord = 1 genre = fém num = sing det nom accord accord genre num fém sing 10
Unification Extension de structure Structure de traits A est une extension d une structure de traits B (A B) ssi A Tous les traits à valeur atomique présents dans B sont présents dans A avec la même valeur pour tout trait f à valeur non atomique dans B, sa valeur dans A est une extension de sa valeur dans B forme = table cat = nom accord = genre = fém num = sing Unification de A et B : accord = genre = fém Structure minimale qui est à la fois extension de A et de B, sinon l unification échoue B 11
LFG (Lexical Functional Grammar) Bresnan et Kaplan, fin années 70 Schéma général Entrées lexicales Règles lexicales Lexique complet Règles syntagmatiques Equations fonctionnelles Principes de bonne formation Structure C Structure F Structure F bien formée 12
LFG - Structure de constituants Structure C Arbre de dérivation obtenu par application des règles de réécritures hors-contexte règles syntagmatiques ou entrées lexicales P P SN SN Nom dort Nom Jean règles syntagmatiques entrées lexicales SN Nom dort Jean 13
LFG - Structure fonctionnelle Ensemble de traits Traits A valeur atomique : nombre, genre, mode, temps, etc. Trait Pred valeur atomique, indique la forme sémantique cadre de sous-catégorisation éventuel dormir : Pred = dormir <sujet> manger : Pred = manger <sujet, objet> ne s unifie pas : un seul trait Pred par structure de traits Dont la valeur est une structure fonctionnelle : sujet, objet, compx, etc. Dont la valeur est un ensemble de structures fonctionnelles : Ajout 14
LFG - Structure fonctionnelle Association d une structure de traits aux nœuds de l arbre de dérivation grâce aux équations P SN sujet = = SN Nom = Nom dort num =sing mode=ind pers=3 pred = dormir <sujet> Jean num=sing genre=masc pred = Jean sujet = = SN Nom num=sing genre=masc pred = Jean Jean P = num =sing mode=ind pers=3 pred = dormir <sujet> dort 15
LFG - Structure fonctionnelle Structure F : structure de traits minimale, solution du système d équations fonctionnelles P SN SN sujet = Nom = = dort num =sing mode=ind pers=3 pred = dormir <sujet> Nom Jean num=sing genre=masc pred = Jean P SN num=sing genre=masc pred = Jean Nom Jean num=sing genre=masc pred = Jean dort sujet = num=sing genre=masc pred = Jean num =sing mode=ind pers=3 pred = dormir <sujet> num =sing mode=ind pers=3 pred = dormir <sujet> 16
LFG : Principes de bonne formation Critères devant être vérifiés par les structures fonctionnelles Unicité : un même attribut n apparaît qu une fois dans une sous-structure Cohérence : fonctions sous-catégorisables gouvernées par un prédicat local Complétude : toutes les fonctions souscatégorisables doivent être présentes localement 17
Fonctions grammaticales Primitives codées dans règles syntagmatiques et les entrées lexicales P SN sujet = = dormir : pred = dormir <sujet> Distinction entre : Fonction sous-catégorisables Sujet, objet, comp(létive), Prep-obj, Xcomp (infinitive, participiale) dormir <sujet> : <sujet> cadre de sous-catégorisation Fonctions non sous-catégorisables Ajout : compléments circonstanciels, adjectifs, relatives 18
Partage de valeurs P SN S sujet = = SN Nom = S S = comp = Mode= Inf S (SN) = objet = veut pred = vouloir <sujet, comp> sujet = comp sujet P sujet = num=sing genre=masc pred = Jean num =sing mode=ind pers=3 pred = vouloir <sujet, comp> comp = sujet = mode=inf pred = dormir <sujet> SN S Nom S Structure C Pas de correspondance Structure F Jean veut dormir 19
Traitement des groupes prépositionnels Groupes prépositionnels compléments du verbe Une seule règle indépendante de l ordre des compléments parler de X à Y ou parler de Y à X Utilisation du trait Pcas pour les prépositions S (SN) (SP) (SP) = objet = ( Pcas) = ( Pcas) = SP Prep SN = ( pred ) Prep à Prep de Pcas = A-obj Pcas = De-obj 20
Traitement des groupes prépositionnels Pred = ressembler <sujet, A-obj> provenir <sujet, De-obj> donner <sujet, A-obj, De-obj> SN Nom Jean P parler S SP Prep SN SP Prep SN sujet = num=sing genre=masc pred = Jean num =sing mode=ind pers=3 pred = parler <sujet, A-obj, De-obj> A-obj = Pcas = A-obj Pred = Paul num=sing genre=masc de Nom politique à Nom Paul De-obj = Pcas = De-obj Pred = politique num=sing genre=fém 21
Dépendances lointaines Jean demande quelle fille Paul regarde. FOCUS COD SUJET Jean demande quelle fille vient ce soir TOPIC COD Jean connaît la fille que Paul regarde P SN S P 1 SN P sujet = = focus = = Qu = c + Qu = c + S (SN) (P1) focus = objet = objet = SN Det Nom = = comp = demande, : pred= demander<sujet, comp> quelle, det : Qu = +, det=quel regarde, : pred= regarder<sujet, objet> 22
Dépendances lointaines P SN S P 1 SN P sujet = = focus = = Qu = c + Qu = c + S (SN) (P1) focus = objet = objet = comp = SN (Det) nom = = SN Nom Jean P demande S P1 SN P det nom SN quelle fille nom Paul S regarde sujet = num=sing genre=masc pred = Jean pred = demander <sujet, comp> comp = focus = Pred = fille num=sing genre=fém det= quel Qu=+ Pred = Paul sujet = num=sing genre=masc Qu=+ Pred = regarder<sujet,objet> objet = 23
Analyse syntaxique traditionnelle Mots de la phrase Processus combinatoire 0, 1 ou n arbres de dérivation (structure de la phrase) Dictionnaire exhaustif Grammaire formelle exhaustive Caractéristiques (HPSG, LFG, TAG, ) : Règles de grammaire de type hors-contexte Structures de traits Unification Problème : manque de robustesse Tutorial Coling 2000: Trends in Robust Parsing Jacques ergne http://users.info.unicaen.fr/~jvergne/tutorialcoling2000.html 24