Les entités syntagmatiques du lexique et leur modélisation



Documents pareils
Myriam Mortchev-Bouveret DYALANG - Université de Rouen 7 rue Thomas Becket MONT SAINT AIGNAN Myriam.Bouveret@univ-rouen.fr

Construction et maintenance d une ressource lexicale basées sur l usage

ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S

Enseigner le lexique au collège Approche didactique de la lexicologie explicative et combinatoire

Compte-rendu de Hamma B., La préposition en français

Grammaires d unification

COLLOCATIONS : DEFINITIONS ET PROBLEMATIQUES Estelle DUBREIL LINA CNRS UMR 6241 / Université de Nantes

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

Langue, techniques de rédaction et correction d épreuves (412-2A1-LG)

Ressources lexicales au service de recherche et d indexation des images

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES

Conception des bases de données : Modèle Entité-Association

Interférences lexicales entre deux langues étrangères: anglais et français

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Pour écrire un texte sans fautes

1 On peut consulter et interroger ce corpus sur le site de l équipe DELIC :

N SIMON Anne-Catherine

Traduction juridique et étude des collocations : quelles perspectives?

Apprentissage Automatique

! Text Encoding Initiative

LES EXPRESSIONS FIGEES : À LA RECHERCHE D UNE DÉFINITION

Sens, synonymes et définitions

LCE.5B Techniques de bureau, spécialisation juridique HIVER re session. Code du cours Cours Titre Coût

TiLT : plate-forme pour le traitement automatique des langues naturelles

eduscol Ressources pour la voie professionnelle Français Ressources pour les classes préparatoires au baccalauréat professionnel

Geoffrey Clive WILLIAMS.

Entre les mots possibles et les mots existants : les unités lexicales à faible probabilité d actualisation

Évaluation et implémentation des langages

La place du nom propre dans les dictionnaires collaboratifs : le cas de La Parlure

Collocations régulières et irrégulières : esquisse de typologie du phénomène collocatif

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

CHRONIQUE D UN DICTIONNAIRE ANNONCÉ

Livret personnel de compétences

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Systèmes décisionnels et programmation avancée

Le plus grand dictionnaire actuel!

1 Description générale. Résumé

CHAPITRE 1 STRUCTURE DU NIVEAU B2 POUR LE FRANÇAIS

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

Leclercq, D. (1986). La conception des Questions à Choix Multiple. Bruxelles : Labor. Page 1

Formation Pédagogique 3h

Projet : Ecole Compétences Entreprise ECONOMIE TECHNICIEN/TECHNICIENNE EN COMPTABILITE

Fiche pédagogique : ma famille et moi

Organisation de la fin d année du Master 2 de stratégie de communication globale

Conseils pour rédiger vos posters scientifiques

XML pour la mise en valeur des informations

«Bienvenue en Europe» : fiche Apprenant Thème : technologies, innovations et médias

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Jean-Luc MANGUIN LA DICTIONNAIRIQUE INTERNET : L EXEMPLE DU DICTIONNAIRE DES SYNONYMES DU CRISCO

Un verbe changeant : Étude sur les diverses structures argumentales de changer

Formation à la systémique pour consultants et personnels RH

Urbanisation de système d'information. PLM 3 (Product Lifecycle Management) Élaborations, versions, variantes, configurations

LA DISPONIBILITÉ MORPHOLOGIQUE DE LA SUFFIXATION AGENTIVE DU FRANÇAIS PAR. Samuel Tuesday OWOEYE CUGP050175

Règles d élaboration d une évaluation par Questions à Choix Multiple Joël LECHEVALLIER 1

fiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile.

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Utilisation des tableaux sémantiques dans les logiques de description

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Analyse sémantique et contraintes distributionnelles: l exemple du verbe monter 1

NORMES DE PRÉSENTATION DES MANUSCRITS

Vers une grammaire de l évaluation des objets culturels

Norme de qualité. Catégorie 3 : Services de traduction juridique (de l anglais au français ou du français à l anglais)

La collocation adjectif - adverbe et son traitement lexicographique

Compte rendu de la formation

LFRA12 RECHERCHE DOCUMENTAIRE APPLIQUEE A LA TRADUCTION

Indications pour une progression au CM1 et au CM2

Manuel de formation Spaceman 1 ère journée

Pearson - Fle 2013 Collection Tendances

Fluctuation d une fréquence selon les échantillons - Probabilités

Situations d apprentissage. Mat

I/ CONSEILS PRATIQUES

Université de Bangui. Modélisons en UML

Coordination de subordonnées relatives : identification et correction

CHAPITRE VI. Détermination d unités de traitement

Thèmes et situations : Agenda et Emploi du temps. Fiche pédagogique

Lexicologie Terminologie Traduction

PRÉPONDÉRANCE DU CONTEXTE EXTRALINGUISTIQUE DANS LA CONSTRUCTION DU SENS : L EXEMPLE DES COMMUNICATIONS DE TRAVAIL DANS LA NAVIGATION AÉRIENNE

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

FORMATION PROFESSIONNELLE

LES LANGUES EN DANGER : UN DÉFI POUR LES TECHNOLOGIES DE LA LANGUE

30 septembre 2011 Obtention du grade de Professeur des Universités.

Le modèle standard, SPE (1/8)

ÉVALUATION DE LA PRODUCTION DE QUATRE SYSTÈMES TRADUCTION AUTOMATIQUE. Christine Yen

La nomination des couleurs et des bruits par des élèves de 7 à 9 ans Une lecture sociolinguistique du concept de nomination

Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P

Thomas Dutronc : Demain

Le Grand Robert. de la langue française VISITE GUIDÉE VERSION TEXTE

Le Test d évaluation de français De la Chambre de commerce et d industrie de Paris

5-8 COLLOQUE INTERNATIONAL LEXIQUE ET G R A M M A I R E INTERNATIONAL CONFERENCE LEXIS AND G R A M M A R. Octobre/October. Conférenciers Invités

CONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE

La colligation : autre nom de la collocation grammaticale ou autre logique de la relation mutuelle entre syntaxe et sémantique?

La construction discursive de la signification : le point de vue argumentatif

Transcription:

Les entités syntagmatiques du lexique et leur modélisation Alain Polguère OLST Université de Montréal Séminaire ATILF, Nancy, 17 octobre 2008

Structure de la présentation 1. Contexte de recherche 2. Entités lexicales (préliminaires) 3. Syntagmes dans la phrase 4. Syntagmes dans le lexique 5. Le problème de la modélisation 2

1. Contexte de recherche

Observatoire de linguistique Sens-Texte (OLST) Groupe de recherche du Département de linguistique et de traduction de l Université de Montréal (http://www.olst.umontreal.ca) Recherches en 1. lexicologie, lexicographie, sémantique-syntaxe-morphologie formelles 2. terminologie, traduction, traitement de corpus Recherche fondamentale et développement de ressources linguistiques 4

Lexicologie/lexicographie Approche de la Lexicologie Explicative et Combinatoire [LEC] (Mel čuk et autres, 1995 ; Polguère, 2008) Produits lexicographiques Dictionnaire «théorique» : Dictionnaire explicatif et combinatoire [DEC] (Mel čuk et autres, 1984, 1988, 1992, 1999) Dictionnaire pédagogique : Lexique actif du "ançais [LAF] (Mel čuk et Polguère, 2007) Base lexicale formelle : base DiCo des dérivations sémantiques et collocations du français (Polguère, 2000 ; Mel čuk et Polguère, 2006) + incarnations DiCouèbe et DiCoPop 5

2. Entités lexicales (préliminaires)

Autour du signe linguistique Partir du signe linguistique (au sens saussurien) Grille d analyse signifié signifiant combinatoire restreinte Signes lexicaux vs grammaticaux 7

Point de départ : mot-forme, qui est un type particulier de signe linguistique Prenez une des tables qui ne sont pas nappées. nappées 1 : mot-forme nappé- 1 : radical adjectival -e : affixe (suffixe) flexionnel -s : affixe (suffixe) flexionnel Mot-forme est un signe, pas un signifiant! Entité linguistique sémantiquement spécifiée Des tartes nappées de chocolat noir nous attendaient sur des tables nappées. nappées 2 nappées 1 8

Notion d entité lexicale Définition «Nous appelons entités lexicales les éléments de la langue qui soit sont des mots-formes, soit peuvent être vus comme des regroupements de mots-formes, soit possèdent certaines propriétés qui font qu ils peuvent être rapprochés des motsformes par analogie.» (Polguère, 2008 : 60) Entités lexicales types 9

Niveaux d abstraction vocable PAIN = {PAIN 1, PAIN 2} lexème PAIN 1 = {pain 1, pains 1} PAIN 2 = {pain 2, pains 2} Centre de gravité notionnel mot-forme pain 1, pains 1 pain 2, pains 2 10

3. Syntagmes dans la phrase

Caractérisation Approche dépendancielle cf. Tesnière (1959), Mel čuk (1988), Hudson (1990), etc. Syntagme est une structure constituée d au moins deux motsformes liés par une dépendance syntaxique C est un graphe de mots-formes Notion distincte de celle de syntagme dans les grammaires syntagmatiques groupe syntaxique 12

Distinctions fondamentales Syntagmes libres vs syntagmes figés Louis a jeté rageusement l éponge sur le sol. Le gouvernement a finalement jeté l éponge. Voir aussi les syntagmes figés vs semi-figés Au final, ça a été la douche écossaise avec cette terrible impression d un pas en avant et deux en arrière. Il se leva donc de son lit rapidement, prit une douche écossaise et enfila un jeans et un polo rouge. Cf. Petit Robert Les syntagmes (semi-)figés relèvent avant tout de la lexicologie : recours à des règles lexicales qui appellent des règles grammaticales 13

4. Syntagmes dans le lexique

Six cas de figures Types de syntagmes qui sont des entités lexicales Réalité cognitive : construits ou non par le locuteur mais offerts «en bloc» par le lexique pour répondre à des besoins communicatifs spécifiques La liste n est pas exhaustive 15

1. Locutions Syntagmes entièrement figés, sémantiquement non compositionnels Correspondent à des lexies à part entière et doivent posséder leur article de dictionnaire Exemples : PASSER L ÉPONGE, JETER L ÉPONGE, BOÎTE NOIRE 1 [La comptabilité de notre labo est une vraie boîte noire.] BOÎTE NOIRE 2 [On n a pas encore retrouvé la boîte noire de l avion.] Attention aux ellipses rouge à lèvre rouge! Révision de la hiérarchie des entités lexicales 16

Niveaux d abstraction vocable PAIN = {PAIN 1, PAIN 2} BOÎTE NOIRE = {BOÎTE NOIRE 1, BOÎTE NOIRE 2} lexème locution lexie (unité lexicale) PAIN 1 = {pain 1, pains 1} PAIN 2 = {pain 2, pains 2} BOÎTE NOIRE 1 = {boîte noire 1, boîtes noires 1} BOÎTE NOIRE 2 = {boîte noire 2, boîtes noires 2} mot-forme pain 1, pains 1 pain 2, pains 2 syntagme figé boîte noire 1, boîtes noires 1 boîte noire 2, boîtes noires 2 17

2. Syntagmes redondants Syntagmes semi-figés, sémantiquement compositionnels, comportant une composante redondante Correspondent à une caractéristique de combinatoire d une lexie donnée (le gouverneur syntaxique du syntagme) Exemples : enveloppe budgétaire [L enveloppe budgétaire est un budget forfaitaire assorti d objectifs en matière de prestations et d efficacité.] mouton de poussière [Puis un jour, le petit pot de peinture, toujours seul sur son étagère, rencontra un petit mouton de poussière.] Il n y a pas d ellipse mouton de poussière mouton! 18

3. Collocations Syntagmes «binaires» constitués d une base et d un collocatif Partir de la forme propositionnelle (= structure actancielle) de la base Exemples INTERROGATOIRE II : interrogatoire par X de Y à propos de Z Collocations d intensification Mais la visite des services secrets canadiens tourne plutôt à l interrogatoire en règle. Collocations à verbe support Il [=X] mène l interrogatoire et obtient les aveux. Dépourvu de pièces d identité, il [=Y] subit un interrogatoire serré. 19

4. Régimes à patrons syntaxiques Exemple : VACCIN I : vaccin administré par X à Y contre Z vaccin contre N Le vaccin contre la grippe saisonnière sera disponible à partir de vendredi. vaccin pour N Le vaccin pour la grippe distribué au Québec et au Canada est fabriqué par Aventis- Pasteur. vaccin anti-adj Le vaccin antigrippal est administré sous forme d une injection. 20

5. Régimes lexicalisés Si actant sémantique donné alors syntagme donné Exemple : PLAQUE II.1 : Plaque portant l information Y, destinée à Z, que X installe sur W si Y = commémoration d un événement ou d un individu alors plaque commémorative Une plaque commémorative est généralement apposée sur un monument. si Y = nom de rue alors plaque de rue Passez à la postérité avec cette plaque de rue en forex. si Y = numéro d immatriculation d un véhicule alors plaque minéralogique ou plaque d immatriculation Vous avez le droit d insta.er une plaque minéralogique blanche à l arrière de votre véhicule. Relève plus du régime que du lien lexical syntagmatique ; ne pas confondre avec les collocations «véritables» 21

6. Régimes de dérivés sémantiques À ne pas confondre non plus avec les collocations! Exemple : Dérivé sémantique exprimant nom typique d actant CRIME I.a : crime de X contre Y CRIME I.a AUTEUR II L auteur [=X] du crime était-il un déséquilibré? Lien paradigmatique car pour le locuteur CRIME I.a AUTEUR II CRIME I.a CRIMINEL N Dérivé sémantique exprimant un collectif LOUP HORDE Ils furent attaqués par une horde de loups. 22

5. Le problème de la modélisation

Type de syntagme Exemple Modélisation (DiCo) [soulignement : mot-vedette] 1. Locutions Microsoft a jeté l éponge. JETER L ÉPONGE 2. Syntagmes redondants L enveloppe budgétaire est un budget forfaitaire. ENVELOPPE#III {=} ~ budgétaire 3. Collocations 4. Régimes à patrons syntaxiques 5. Régimes lexicalisés 6. Régimes de dérivés sémantiques Il mène l interrogatoire et obtient les aveux. Le vaccin antigrippal est administré sous forme d une injection. La nouve.e plaque d immatriculation entre en vigueur le 1 er janvier. L auteur du crime était-il un déséquilibré? 24 INTERROGATOIRE /*\3\[X] effectuer ~*/ {Oper1} conduire, effectuer, mener [ART ~]; offic procéder [à ART ~] {Oper12} faire subir [ART ~ à N=Y] {Labor12} soumettre [N=Y à ART ~] VACCIN#I Z = III = contre N, pour N, anti-adj PLAQUE#II.1 {Y= numéro d immatriculation d un véhicule } minéralogique postpos, d immatriculation CRIME#I.a /*Nom pour X*/ {S1} auteur#ii [de ART ~] //criminel-n AUTEUR#II X = I = de N, A-poss (...) /*Type particulier de X*/ {QS1}...crime#I.a...

Exigences Expliciter le statut des syntagmes et formaliser Gérer les interfaces sémantique-syntaxe syntaxe-morphologie Rendre compte du pouvoir paraphrastique de la langue 25

Bibliographie

Me contacter au besoin : alain.polguere@umontreal.ca Hudson R. (1990) English Word Grammar, Oxford : Basil Blackwell. Mel čuk I. (1988) Dependency Syntax, Albany, NY : SUNY Press. Mel čuk I. et autres (1984, 1988, 1992, 1999) Dictionnaire explicatif et combinatoire du 1ançais contemporain. Recherches lexico-sémantiques, vol. I-IV, Montréal : Les Presses de l Université de Montréal. Mel čuk I., Clas A., Polguère A. (1995) Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve : Duculot. Mel čuk I., Polguère A. (2007) Lexique actif du 1ançais. L apprentissage du vocabulaire fondé sur 20 000 dérivations sémantiques et co.ocations du 1ançais, Bruxelles : De Boeck & Larcier. Mel čuk I., Polguère A. (2006) Dérivations sémantiques et collocations dans le DiCo/LAF. Langue 1ançaise, 150, 66-83. Polguère A. (2008) Lexicologie et sémantique lexicale. Notions fondamentales, nouvelle édition, Montréal : Les Presses de l Université de Montréal. Polguère A. (2000) Towards a theoretically-motivated general public dictionary of semantic derivations and collocations for French. Proceedings of EURALEX 2000, Stuttgart, 517-527. Tesnière L. (1959) Éléments de syntaxe structurale, Paris : Klincksieck. 27