Sémantique de l'adjectif et ses restrictions de sélection. Adjective semantics and its selection restrictions



Documents pareils
Chapitre 1 : Introduction aux bases de données

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Trier les ventes (sales order) avec Vtiger CRM

TEXT MINING von 7

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

Urbanisation de système d'information. PLM 3 (Product Lifecycle Management) Élaborations, versions, variantes, configurations

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

IFT2255 : Génie logiciel

modélisation solide et dessin technique

LES INTERFACES HOMME-MACHINE

Systèmes de transport public guidés urbains de personnes

Classification Automatique de messages : une approche hybride

Une méthode d apprentissage pour la composition de services web

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

3-La théorie de Vygotsky Lev S. VYGOTSKY ( )

Dans cette définition, il y a trois notions clés: documents, requête, pertinence.

ENSEIGNEMENT ASSISTÉ PAR ORDINATEUR ET E.A.O. ET LANGUES ÉTRANGÈRES À L'UNIVERSITÉ

Le modèle standard, SPE (1/8)

Introduction à la méthodologie de la recherche

LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE

MASTER LPL : LANGUE ET INFORMATIQUE (P)

OASIS Date de publication

Dossier projet isn 2015 par Victor Gregoire

Paiement de factures aux entreprises créancières RBC Guide du client

Conformité aux exigences de la réglementation "21 CFR Part 11" de la FDA

Chapitre I : le langage UML et le processus unifié

Stockage ou pas stockage?

Université de Bangui. Modélisons en UML

Diagramme de classes

Corps des nombres complexes, J Paul Tsasa

Les enjeux de la dématérialisation en assurance

Sujet de thèse CIFRE RESULIS / LGI2P

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Qu est-ce qu un résumé?

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

Cette Leçon va remplir ces attentes spécifiques du curriculum :

Dans la série LES TUTORIELS LIBRES présentés par le site FRAMASOFT. Compression - Décompression avec 7-Zip. Georges Silva

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Initiation à la recherche documentaire

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

Ingénierie et gestion des connaissances

Formation Méthode MDM. Architecture et procédés de modélisation des données de référence

D'UN THÉORÈME NOUVEAU

Guide de configuration de SQL Server pour BusinessObjects Planning

NORME INTERNATIONALE D AUDIT 260 COMMUNICATION DES QUESTIONS SOULEVÉES À L OCCASION DE L AUDIT AUX PERSONNES CONSTITUANT LE GOUVERNEMENT D'ENTREPRISE

Chapitre 2. Classes et objets

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL

Forthcoming Database

Exercices de dénombrement

MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Baccalauréat technologique

Comment créer un diagramme de Gantt avec OpenOffice.org

Analyse hiérarchique de tâches (AHT)

Par : Abdel YEZZA, Ph.D. Date : avril 2011 / mise à jour oct (ajout de la section 3 et augmentation de la section 1)

claroline classroom online

Université de Haute Alsace. Domaine. Sciences Humaines et Sociales. MASTER Mention Éducation, Formation, Communication UHA, ULP, Nancy 2

Pour signifier qu'une classe fille hérite d'une classe mère, on utilise le mot clé extends class fille extends mère

Manuel Utilisateur. Boticely

Problématiques de recherche. Figure Research Agenda for service-oriented computing

ANNEXE 1 RÈGLEMENTS GÉNÉRAUX 1 ASSOCIATION DES ARCHÉOLOGUES PROFESSIONNELS DU QUÉBEC (AAQ) CODE D ÉTHIQUE ET DES NORMES PROFESSIONNELLES

Leica Application Suite

Les approches globales et intégrées en promotion de la santé et du bien-être : les conditions nécessaires à leur développement 1

Compte-rendu de Hamma B., La préposition en français

CRÉER UNE BASE DE DONNÉES AVEC OPEN OFFICE BASE

2 Grad Info Soir Langage C++ Juin Projet BANQUE

NOTIONS DE PROBABILITÉS

Modèle Cobit

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB Olivier Augereau Formation UML

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

O b s e r v a t o i r e E V A P M. Taxonomie R. Gras - développée

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Suite dossier d appel

OpenOffice Base Gestionnaire de Base de Données

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

NIGHT VISION STUDIOS GUIDE DU LOGICIEL. Produit Voyance. Version 1.5

Utilisation des tableaux sémantiques dans les logiques de description

«Manuel Pratique» Gestion budgétaire

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

Méthodologie Actuelle des Recommandations Formalisées d Experts SFAR/SRLF

Installation / configuration des applications PreInscription et Inscription Web Ajax

Commentaires sur le projet de lignes directrices (G3) pour l évaluation de la durabilité de la Global Reporting Initiative

PARCOURS COMPLET AU COURS MOYEN

Ressources lexicales au service de recherche et d indexation des images

N SIMON Anne-Catherine

À l'intention des parents

Annexe sur la maîtrise de la qualité

La contrefaçon par équivalence en France

Évaluation de la conformité Certification des produits OEM (mise à jour : octobre 2010)

La gestion électronique de l information et des documents entreprise. Présentation

Architectures Ouvertes pour l Adaptation des Logiciels

Transcription:

Sémantique de l'adjectif et ses restrictions de sélection Adjective semantics and its selection restrictions Sara Mendes IRIT 118, Route de Narbonne, 31062 Toulouse Cedex mendes@irit.fr Résumé La problématique centrale de ce papier est l'analyse de la nature de la relation sémantique établie entre l'adjectif et le nom. Pour mener cette étude on a développé une ontologie de propriétés sur laquelle on a basé la représentation du sens de l'adjectif et du nom, un travail crucial pour atteindre le but de cette étude: l'identification et la définition des mécanismes qui déterminent cette relation vis-à-vis de son utilisation en traitement automatique du langage naturel. Mots Clefs Sémantique lexicale, ontologie de propriétés, traitement automatique du langage naturel. Abstract The analysis of the adjective-noun relation is this paper main issue. In our approach we have developed an ontology of properties on which we have based the semantic representation of both adjectives and nouns. This is a crucial task in the lights of the goal of this work: identifying and determining the mechanisms which account for this relation, in view of its use in natural language processing. Keywords Lexical semantics, ontology of properties, natural language processing. 1 Introduction Pour la plupart des adjectifs on peut trouver, hors de leur sens littéral, un grand nombre d'usages dérivés. L'analyse et la représentation sémantique des adjectifs devient donc une tâche assez délicate, mais aussi d'une grande importance pour toute application de traitement automatique du langage naturel qui a besoin d'un module de compréhension. Dans ce contexte, le traitement des formes prédicatives est, par exemple, l'un des aspects cruciaux à développer vu l'importance de son rôle dans la caractérisation des actions, des processus et des états. Bien que les formes prédicatives soient canoniquement exprimées par des verbes, les adjectifs ont eux aussi un poids sémantique significatif dans cette matière. Malgré ce rôle assez conséquent dans la sémantique des langues, la caractérisation sémantique de l'adjectif, de façon bien différente de ce qui se passe pour le verbe et le nom, n'a pas encore, hors quelques exceptions comme (Bouillon, 1998), été l'objet d'une attention particulière dans le domaine de la sémantique lexicale. Et pourtant cette classe présente un comportement sémantique intéressant qu'il faut bien sûr décrire: les adjectifs, plus que toute autre catégorie, peuvent revêtir des sens différents selon le contexte linguistique dans lequel ils apparaissent. Un exemple typique et bien décrit dans la littérature, est celui de l'adjectif rapide avec une voiture rapide, une autoroute rapide ou un procédé rapide (Pustejovsky, 1995). Pour toutes les raisons qu'on vient brièvement d'introduire, la description de l'interaction adjectif-nom a sûrement un intérêt large. Comme hypothèse de travail, on propose que chaque adjectif soit sémantiquement caractérisé par son association à une ou plusieurs propriétés. Pour mener cette caractérisation sémantique des adjectifs, nous avons donc, dans un premier moment, développé une ontologie de propriétés, sur laquelle nous avons fondé l'établissement de la valeur sémantique de chaque adjectif. Cette méthode, qu'on présente plus en détail au long de ce document, paraît générale et applicable à plusieurs langues. Ainsi, et comme démarche pour notre étude, nous avons choisi de prendre d'abord chaque adjectif isolément pour, ensuite, analyser son interaction

avec des noms, un rapport dont la nature est assez variable, comme on le verra par la suite. 2 Classes d'adjectifs selon le rapport établi avec le nom Dans cette section, on fait une brève description des classes sémantiques d'adjectifs traditionnellement identifiées selon le rapport établi avec le nom. Le but de cette section n'est pas de décrire la nature de ces différents rapports en détail, mais de donner une vision globale de la question avant de délimiter l'ensemble de phénomènes considérés dans ce papier. Traditionnellement deux grandes classes d'adjectifs sont considérées: les adjectifs qui attribuent des propriétés au nom et les adjectifs qui modifient le sens du nom. (1) et (2) présentent, respectivement, des exemples d'un adjectif qui attribue une propriété au nom et d'un adjectif modificateur de son sens. (1) le livre bleu (2) le voleur présumé La grande différence entre ces deux classes d'adjectifs est que les adjectifs modificateurs du sens, contrairement aux adjectifs qui attribuent des propriétés aux noms, indiquent plutôt la façon avec laquelle un concept s'applique à un objet particulier. Ces adjectifs ne manipulent pas d'objets réels ou référentiels, mais des concepts Au sein de la classe des adjectifs qui attribuent des propriétés aux noms on considère encore deux sousclasses assez différentes: les adjectifs relationnels, d'un côté, et les adjectifs qualificatifs, de l'autre. A la base de cette distinction il y a la façon contrastée avec laquelle les adjectifs appartenant à ces deux classes réalisent l'attribution des propriétés qui leurs sont associées. Les adjectifs qualificatifs attribuent une seule propriété tandis que les adjectifs relationnels attribuent un ensemble de propriétés. (3) l'industrie alimentaire Avec (3), un exemple où apparaît un adjectif relationnel, on vérifie, en effet, que l'adjectif n'introduit pas une propriété singulière, mais un ensemble de propriétés. Outre cet aspect, on peut encore observer que cet ensemble de propriétés correspond aux caractéristiques qui définissent un autre nom, aliment dans l'exemple considéré, avec lequel l'adjectif a typiquement un rapport morphologique. Mais plus important que le nombre de propriétés introduites par l'adjectif, est la façon avec laquelle l'adjectif modifie le nom. En effet, l'attribution d'une seule propriété correspond, d'habitude à une simple relation d'incidence de la propriété chez le référent nominal, tandis que l'attribution de plusieurs propriétés engage typiquement des rapports sémantiques plus complexes et diversifiés. Ces adjectifs ne dénotent pas des propriétés des noms, mais établissent plutôt des connexions entre eux et d'autres domaines qui leurs sont extérieurs. Pour illustrer ces affirmations prenons: (4) un exemple d'un adjectif qualificatif, et (5) un exemple d'un adjectif relationnel. (4) la robe rouge (il y a un X qui est une robe et qui est aussi un objet rouge) robe(x) rouge(x) (5) la gare maritime (il y a un X qui est une gare qui a un rapport avec la mer) gare(x) R1(X,mer) Dans ce document, on discute presque exclusivement le cas des adjectifs qualificatifs. Le fait qu'on rend compte d'un travail en cours dont les résultats sont encore nécessairement partiels est à la base de cette restriction de notre objet d'étude. L'explication du choix de cette classe pour démarrer notre travail est liée à deux facteurs bien différents. D'abord il s'agit de la classe la plus nombreuse dans les langues et donc la plus représentative. D'un autre côté, en ce qui concerne le développement de l'ontologie de propriétés, la partie la plus développée et la plus stable à présent est celle des propriétés physiques. Or, typiquement, les adjectifs associés à des propriétés physiques sont des adjectifs qualificatifs. 3 Le rôle d'une ontologie de propriétés Comme on l'annonçait lors de l'introduction, on a basé notre travail en ce qui concerne la sémantique des adjectifs sur une ontologie de propriétés. Les ontologies sont une représentation explicite d'une conceptualisation d'un certain domaine. Elles impliquent toujours une certaine vision du monde et sont souvent conçues comme un ensemble de concepts bien définis, qui ont des relations assez différenciées les uns avec les autres. En effet, l'utilisation des ontologies comme un outil pour apporter de l'ordre et de la structure à l'information devient de plus en plus populaire. Elles sont aussi une garantie de la fiabilité du système, car elles explicitent les présuppositions de base et permettent de vérifier leur cohérence. Mais l'aspect qui est vraiment intéressant pour le travail qu'on est en train de mener, c'est que le fait de

baser notre représentation sémantique sur une ontologie de propriétés nous permet, en profitant de la structure définie, de gérer d'une façon assez simple et immédiate les usages dérivés qui correspondent, notamment, à des cas d'inférence, métonymie et métaphore. 4 L'ontologie de propriétés Avant de donner plus de détails en ce qui concerne l'ontologie de propriétés considérée dans ce travail, il faut éclaircir la stratégie utilisée pour la développer. En effet, et vu la complexité et importance du développement de l'ontologie de propriétés pour la suite de notre étude, on a poursuivi ce travail avec beaucoup de soin, en cherchant à le valider à chaque pas. Ainsi, on a d'abord recueilli les solutions proposées pour des domaines sémantiques proches par d'autres ontologies déjà développées, notamment WordNet et la Top-Ontology de Mikrokosmos, et on les a évaluées par rapport à notre but. A partir des résultats de cette analyse, et à l'aide du thesaurus Roget's, on a développé une première version de notre ontologie de propriétés. Pour la stabiliser et la valider on a, en suite, vérifié son adéquation aux données de trois langues différentes: le Français, l'anglais et le Portugais. A titre d'exemple, on présente ici la figure 1 qui représente un fragment de l'ontologie des propriétés physiques. 5 Quelques questions méthodologiques pour la définition sémantique des adjectifs Une des questions qui se pose d'abord dans un travail de cette nature est le problème de la délimitation du sens. Ceci est en effet une question ouverte dans le domaine de la sémantique lexicale, vu la difficulté de l'établissement de principes précis et généraux à ce respect. D'abord, la définition de sens elle-même est loin d'être consensuelle: on trouve, par exemple, d'un côté, l'approche de WordNet et de la lexicographie traditionnelle et, de l'autre, quelques approches en Intelligence Artificielle. Dans le premier cas, on considère l'existence d'un nombre de sens assez conséquent pour chaque forme adjectivale, de telle façon que le travail développé dans ce cadre constitue plutôt une description d'usages. A un travail de cette nature, malgré la valeur indéniable de son exhaustivité, on peut rapprocher le manque de généralisation, très utile pour que les systèmes de traitement automatique du langage naturel puissent être efficaces. Quant aux approches en IA, un seul sens par forme est typiquement considéré, en faisant dépendre les usages particuliers des procédés compliqués de dérivation, typiquement basés en systèmes logiques très complexes. Notre approche se trouve entre ces deux positions: on considérera un ensemble limité de sens, à partir desquels les autres usages sont dérivés par des mécanismes génératifs. Mais, pour garantir que ce travail donne des résultats fiables, il ne faut pas perdre de vue deux autres questions méthodologiques essentielles: les critères de délimitation des sens et l'établissement de mécanismes génératifs qui rendent compte des usages dérivés sans sur-générer. 6 La sémantique de l'adjectif Reprenant ce qu'on disait dans l'introduction, la description de la sémantique de l'adjectif est loin d'être une question triviale, notamment vu sa plasticité, qui lui permet de présenter des sens différents, au moins apparemment, selon ses contextes d'occurrence. fig. 1: fragment de l'ontologie de propriétés physiques les propriétés de perception visuelle En vue de cette variabilité du sens de l'adjectif, plusieurs auteurs on clairement avoué leurs doutes par rapport à la possibilité de l'établissement satisfaisant de la sémantique de l'adjectif. On va ici, suivant des auteurs moins pessimistes (Bouillon, 1998), considérer qu'il est en effet

possible de rendre compte de cette variabilité du sens des adjectifs par des mécanismes génératifs de composition sémantique basés sur des représentations enrichies soit des adjectifs, soit des noms. Ainsi, l'idée de base de ce travail est que chaque adjectif est canoniquement associé à une (ou plusieurs, selon les cas) propriété(s). De l'autre côté, la sémantique de chaque nom est aussi liée à un ensemble de propriétés qui le caractérisent. Dans les cas les plus simples, le nom est tout simplement caractérisé par la propriété associée à l'adjectif qui le modifie, comme dans l'exemple suivant. Le nom boîte est modifié par l'adjectif ronde. Une fois qu'il s'agit d'un nom d'objet physique, il lui est associé nécessairement une certaine forme: Avec cet exemple, on s'éloigne un peu des noms d'objets physiques: en (9) on a un nom événementiel comme réunion modifié par un adjectif de dimension linéaire. Or, l'association d'une longueur à un nom événementiel n'est pas triviale. Mais, avant de poursuivre l'analyse de (9), prenons la figure 2. (6) la boîte ronde Mais une grande partie des usages adjectivaux qu'on peut repérer dans des corpus sont bien moins triviaux que ça. C'est là que l'ontologie de propriétés va jouer un rôle déterminant, en fournissant de l'information cruciale à des mécanismes génératifs capables de prévoir les usages dérivés constamment présents dans les langues naturelles. Analysons, maintenant, quelques exemples moins triviaux illustratifs des grandes questions qui se posent dans ce travail. Sans sortir encore le domaine des objets physiques, on trouve quand même des exemples moins directs que celui présenté en (6). (7) la grande tour (8) le grand terrain Encore une fois, on a deux noms d'objets physiques, tour et terrain, qui ont, donc, nécessairement une taille. C'est le même adjectif qui modifie ces deux noms, et pourtant, dans les deux exemples en haut, cet adjectif ne touche pas exactement la même propriété. En effet, en (7) c'est plutôt la hauteur qui est touchée, tandis que en (8) c'est plutôt la surface. Des cas comme ceux-ci, montrent l'importance déterminante des propriétés caractéristiques de chaque nom dans la détermination du sens des structures de modification. De cette façon, un adjectif moins spécifique comme grand, par exemple, touche des propriétés différentes (bien entendu, toujours des propriétés de dimension) selon le nom avec lequel il se combine. En poursuivant avec des structures de modification non-triviales, prenons (9). (9) une réunion courte fig. 2: fragment de l'ontologie de propriétés physiques les propriétés de dimension linéaire et quelques adjectifs qui leur sont associés En observant ce morceau de l'ontologie développée, on vérifie que les adjectifs associés à la longueur sont en même temps associés à la durée, bien que l'inverse ne soit pas toujours vrai. D'abord il faut exclure l'hypothèse que cette coïncidence corresponde à une convergence accidentelle dans une langue particulière, vu qu'elle est présente dans les trois langues considérées. On remet, quand même, la discussion en détail du statut de ces phénomènes pour des travaux futurs, car c'est hors du sujet de ce papier. Reprenons maintenant (9). Notre ontologie de propriétés permet d'abord la transposition d'un adjectif comme court au domaine du temps. Néanmoins, le nom réunion n'est associé qu'à un événement et pas à une période de temps. Pour rendre compte de sa modification par un adjectif qui touche la durée, il nous faudra encore un raisonnement comme le suivant: réunion est un nom associé à un événement, or tous les événements ont nécessairement lieu dans l'axe du temps et, donc, une durée déterminée. C'est cette durée qui est modifiée par l'adjectif court. A partir de ces exemples, la nécessité de décrire des mécanismes génératifs qui rendent compte des cas non-triviaux de modification adjectivale devient évidente. En effet, le rôle cruciale de phénomènes comme la métaphore, la métonymie ou l'inférence, bien que l'avantage d'utiliser une ontologie de propriétés dans leur description, est maintenant très clair.

7 Travail futur Une fois identifiées les principales questions qui se posent, et la méthodologie à suivre pour y répondre, nous présentons, maintenant, les tâches à mener pour accomplir notre projet de façon satisfaisante. D'abord il faudra représenter formellement le sens des adjectifs, en décrivant les propriétés qu'ils touchent. Ensuite, et après le développement d'une représentation, toutefois partielle, du sens des noms, au moins en ce qui concerne ses propriétés caractéristiques, nous poursuivrons notre projet par la description systématique des mécanismes génératifs qui prévoient, à partir du sens du nom et de l'adjectif, le sens de l'ensemble adjectif-nom. Pour ce travail d'identification et de caractérisation de ces mécanismes génératifs, on commencera par les phénomènes plus triviaux, i.e. les cas où le sens de l'ensemble adjectif-nom est obtenu par la simple combinaison des sens de nom et de l'adjectif. Une fois cette tâche accomplie, on passera aux usages dérivés, notamment aux cas de métaphore. Comme conclusion de ce projet, on prendra les résultats de la description linguistique faite (soit en ce qui concerne les aspects sémantiques, qu'on vient de discuter, soit par rapport aux aspects syntaxiques les plus pertinents) et, pour la valider, on implémentera une grammaire de l'adjectif. Références [1] P. Bouillon, Polymorphie et sémantique lexicale: le cas des adjectifs, thèse de troisième cycle, Lille: Presses Universitaires du Septentrion, 1998. [2] V. Demonte, El Adjectivo: Classes y Usos. La Posición del Adjectivo en el Sintagma Nominal, dans I. Bosque & V. Demonte (eds.) Gramática Descriptiva de la Lengua Española, Espasa, Vol. I, 2000. [3] R. M. W. Dixon, A New Approach to English Grammar, on Semantic Principles, New York: Oxford University Press, 1991. [4] J. Pustejovsky, The Generative Lexicon, Cambridge: MIT Press, 1995. [5] M. Uschold & M. Gruninger, Ontologies: Principles, Methods and Applications, University of Edinburgh, 1996; reimprimé dans Knowledge Engineering Review, vol. 11, no. 2, 1996.