École Doctorale V «Concepts et Langages» LALIC (Langages, Logiques, Informatique et Cognition) POSITION DE THÈSE pour obtenir le grade de :

Documents pareils
Spécialité auxiliaire en prothèse dentaire du brevet d études professionnelles. ANNEXE IIb DEFINITION DES EPREUVES

30 septembre 2011 Obtention du grade de Professeur des Universités.

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

La professionnalisation en lettres et sciences humaines Le cas de la traduction/interprétation

L ACCOMPAGNEMENT PERSONNALISE AU LYCEE PICASSO DE PERPIGNAN (Document de travail)

Le mécanisme du processus de traduction *

LA RECHERCHE DOCUMENTAIRE

Fiche pour les étudiants «Comment répondre à une question à développement?»

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

O b s e r v a t o i r e E V A P M. Taxonomie R. Gras - développée

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

UNIVERSITÉ PARIS-SORBONNE

Les écoles professionnelles offrent aux personnes en formation les cours remplissant les objectifs évaluateurs suivants :

Disparités entre les cantons dans tous les domaines examinés

Métriques, classements et politique scientifique des Etablissements

Sciences de Gestion Spécialité : GESTION ET FINANCE

Document d aide au suivi scolaire

Recherche bibliographique

OASIS Date de publication

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

3-La théorie de Vygotsky Lev S. VYGOTSKY ( )

LFRA12 RECHERCHE DOCUMENTAIRE APPLIQUEE A LA TRADUCTION

UNIVERSITE DE TOULON UFR FACULTE DE DROIT REGLEMENT D EXAMEN ANNEE 2012/2017 LICENCE DROIT MENTION DROIT GENERAL

Etudier l informatique

Bibliothèque des Compétences clés

LA LICENCE D ENSEIGNEMENT (LE)

Sciences de l'information et de la communication. Enseignant-e-s. Année/Structure/Enseignements. H/sem.

Interne Forces Faiblesses Externe Opportunités Menaces

Présentation du programme de Master en gestion

FICHE DE POSTE. Date de rédaction : 20/02/15. Argumentaire général

BACCALAURÉAT PROFESSIONNEL ÉPREUVE DE MATHEMATIQUES. EXEMPLE DE SUJET n 2

Les documents primaires / Les documents secondaires

UNIVERSITE LA SAGESSE FACULTÉ DE GESTION ET DE FINANCE MBA OPTION MIS. MIAGe METHODES INFORMATIQUES APPLIQUEES A LA GESTION

SECTION 5 BANQUE DE PROJETS

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

RÉSUMÉ DES NORMES ET MODALITÉS D ÉVALUATION AU SECONDAIRE

Recommandations pour la réalisation pratique et la diffusion des mémoires

Syndicat National des Internes en Odontologie

TABLEAU DE BORD : SYSTEME D INFORMATION ET OUTIL DE PILOTAGE DE LA PERFOMANCE

THOT - Extraction de données et de schémas d un SGBD

Compte rendu. Réunion du CREA du mercredi 6 juin Salle : V210

Plan de rédaction d un projet de programme d études UQAM

I. PRESENTATION DE LA SITUATION PROFESSIONNELLE DANS LAQUELLE S INSERE L ATELIER REDACTIONNEL

Languedoc - Roussillon

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

MICROSTAGE COM602 Département des lettres et communications. Automne 2015 (10 juin 2015)

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Compte-rendu de Hamma B., La préposition en français

Dossier justificatif des travaux de R&D déclarés au titre du CIR

la Direction des ressources humaines et des relations de travail (langue du travail ; maîtrise du français par les employé(e)s)

LE BUDGET DES VENTES

Spécialité Gestion de l'information et de la Documentation*

Programme de la formation. Écrit : 72hdepréparation aux épreuves d admissibilité au CRPE

MASTER LPL : LANGUE ET INFORMATIQUE (P)

Format de l avis d efficience

UNIVERSITE PARIS 1 - PANTHEON SORBONNE. Année universitaire MASTER PROFESSIONNEL "TOURISME" (2 e année)

GESTION DE RISQUES Août 2007

FICHE N 2 LA GESTION COMMERCIALE DES CLIENTS ET PROSPECTS POUR LE SECTEUR DES ASSURANCES (NS 56)

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

exigences des standards ISO 9001: 2008 OHSAS 18001:2007 et sa mise en place dans une entreprise de la catégorie des petites et moyennes entreprises.

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos

10 REPÈRES «PLUS DE MAÎTRES QUE DE CLASSES» JUIN 2013 POUR LA MISE EN ŒUVRE DU DISPOSITIF

Gestion électronique des thèses

Toronto (Ontario) Le vendredi 26 octobre 2007 L ÉNONCÉ FAIT FOI. Pour de plus amples renseignements, s adresser à :

Langue Française. Syllabus A1. Description globale du niveau A1 utilisateur élémentaire

N SIMON Anne-Catherine

Modulo Bank - Groupe E.S.C Chambéry - prérequis à la formation - doc. interne - Ecoute active.doc Page 1

Évaluation et implémentation des langages

Introduction. Document mis à disposition par

Pas d installations ou d équipement particuliers.

N Contenu Dates. N Contenu Date 1 Dates 2

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Conception des systèmes répartis

RIHANE Abdelhamid Maitre de conférences Université de Constantine (ALGERIE)

PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

La formation aux pratiques documentaires: rencontre francoroumaine

MATHÉMATIQUES. Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN

Contrôle des connaissances

Chères collègues, chers collègues,

UCL. Université catholique de Louvain. Métro Web : logiciel de support à l'évaluation de la qualité ergonomique des sites web.

Customer Intelligence

Primaire. analyse a priori. Lucie Passaplan et Sébastien Toninato 1

La crise n'a pas entamé la générosité des belges

LES SEMINAIRES DOCTORAUX PAR DISCIPLINE

Une étude sur : «La Supply Chain comme facteur clé de compétitivité» Jeudi 27 juin 2013 Au Grand Hôtel Opéra, Paris

Intégrer la traduction/interprétation à l Université Saint-Louis Bruxelles : difficultés, appréhensions et contraintes

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

SITE I NTERNET. Conception d un site Web

1 Définition et Appel d une fonction. V. Phan Luong. Cours 4 : Fonctions

Section des Formations et des diplômes

RElATIONS publiques ENGAGÉES ATÉGIE OR STR NEST

L ORAL OBJET OU MOYEN D APPRENTISSAGE?

Référentiel d'activités professionnelles et référentiel de certification Diplôme d'état de professeur de musique

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

De la tâche à sa réalisation à l aide d un document plus qu authentique. Cristina Nagle CEL UNICAMP cnagle@unicamp.br

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

Transcription:

Université Paris-Sorbonne École Doctorale V «Concepts et Langages» LALIC (Langages, Logiques, Informatique et Cognition) POSITION DE THÈSE pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ PARIS-SORBONNE Discipline : Mathématiques et Informatique Appliquées aux Sciences de l Homme Spécialité : Linguistique Informatique Présentée et soutenue par : Amani SABRA Le : 08/12/2012 «Les relations de causalité en arabe et en français avec une constitution de ressources linguistiques utilisables par l informatique» Sous la direction de : M. Jean-Pierre Desclés, Professeur, Université Paris-Sorbonne (France), Directeur de thèse. M. Joseph Dichy, Professeur, Université Lumière Lyon 2 (France), Co-Directeur de thèse. JURY Mme Wafa Berry, Professeur, Doyenne de L Université Libanaise, Faculté des Lettres et Sciences Humaines (Liban), Rapporteure M. Mohamed Hassoun, Professeur, l'ecole Nationale Supérieure des Sciences de l'information et des Bibliothèques, ENSSIB, (France), Rapporteur M. Xavier Lelubre, Professeur, Université Stendhale-Grenoble 3 (France), Examinateur

Depuis longtemps, les travaux se multiplient sur la notion de la causalité dans presque tous les domaines. Linguistiquement, les études sur l expression de causalité se sont focalisées sur tout ce qui concerne la causalité explicite à travers la détection et l'analyse adéquate des connecteurs et marqueurs fréquemment utilisés, mais ces études ont moins abordé les lexiques verbaux. Nous avons rencontré quelques difficultés concernant l'étude de l expression causale en arabe ; quelques références concerne seulement ce sujet dans la langue arabe, celles-ci étaient limités et présentés par des exemples prototypiques et rarement sous la forme de concepts. A notre tour, nous essayons de clarifier quelques principes relatifs à cette relation. Vouloir établir une analyse contrastive de cette notion en arabe et en français nous a encouragés à présenter une constitution de ressources linguistiques causales selon la méthode d exploration contextuelle, destinées à un traitement automatique. Nous avons présenté les principes de la méthode de l'exploration contextuelle ainsi les réalisations développées au sein de notre équipe d'accueil universitaire, LALIC (Langues, Logiques, Informatique, Cognition). Nous avons souligné l'importance de l'extraction d informations causales pour répondre aux multiples besoins d utilisateurs dans divers domaines. Dans le cadre de notre approche, nous avons suggéré une classification des certaines indicateurs déclencheurs et indices complémentaires de la relation causale. À travers les informations identifiées et les indices adéquats, et par la reconnaissance des indicateurs et des indices complémentaires pertinents dans l énoncé, le constructeur de ressources linguistiques attribue à un énoncé analysé une valeur sémantique causale ou non causale, L'étude de la causalité, plus particulièrement l étude du lexique verbal associé à cette notion dans une langue naturelle, est un sujet qui est rarement présenté pour la langue arabe, malgré des publications récentes qui traitent la fonction du prédicat causal ou les travaux qui insistent sur la classification des expressions qui expriment une relation causale. Dans le cadre de notre étude, traiter la causalité comme une notion primitive, a constitué le point de départ de notre travail afin d organiser une grande diversité des verbes indicateurs en arabe ainsi que de dresser une liste assez complète des significations des verbes indicateurs de causalité répertoriés et de les classer par des catégories sémantiques. Ce travail nous a permis d'extraire et de déduire des relations plus précises que la causalité définie comme un rapport de cause à effet, et d évoquer la polysémie qui couvre la sémantique générale des verbes causaux. Tout au long de cette recherche, nous avons étudié l'expression de la cause dans la langue arabe en exploitant les études et les résultats obtenus par les travaux portant sur cette

notion en français. Les langues naturelles disposent deux types de formes causatives: les formes morphologiquement régulières et productives et les formes morphologiquement irrégulières et non-productives. Nous avons constaté que les formes productives sont établies par l'ajout d'un auxiliaire causatif comme «faire» en français, ou par l'ajout d'un affixe comme la hamza ou la chadda en arabe. Néanmoins, il nous a paru indispensable d analyser les formes et la nature des schèmes morphologiques (patrons) en arabe, en tenant compte des aspects sémantiques des verbes augmentés et non augmentés dans la langue arabe (Dichy 2007). Notre travail a consisté à étudier la valeur causale des verbes indicateurs dans la langue arabe, tout comme il avait été pour le travail entrepris par Daniella Gracia (Garcia 1998) sur la langue française, afin de tester leur pertinence dans la langue arabe et d'évoquer également d autres verbes indicateurs de causalité. Nous avons classé deux types de causalité : efficiente et formalisable, distinction déjà établie par des multiples travaux en philosophie. Cette étape nous a permis d orienter notre démarche vers une représentation d une grande diversité d indicateurs en arabe avec des verbes efficients rendant compte de l'effet produit (bloquer ou faciliter etc.) et d'autres verbes qui désignent la manière dont intervient et coopérer ك la cause dans une relation donnée (collaborer ون ) avec d'autres causes pour produire un effet. L'expression de la causalité efficiente est plus variée que la causalité formalisable. Dans notre étude, nous avons privilégié les relations causales efficientes très fréquentes où une action engendre un effet qui lui est distinct. La relation est orientée temporellement. Tandis que la causalité formalisable établit plutôt une régularité mise en évidence entre des actions. Pour la causalité efficiente, nous distinguons les verbes indicateurs précisant la nature de l effet produit, qui informent sur l affectation, c est-à-dire le devenir de la situation affectée par la causalité et exprimée dans l énoncé. (1) إن زدة %$ل ا"ك!ا ا ا ا ا. -, ا+*( L'augmentation du taux de consommation pour cette saison est engendrée par la compagne publicitaire diffusée largement dans la région. Les situations dans l'énoncé placées entre les crochets désignent les situations ellesmêmes et la valeur causale entre les deux situations est présentée entre les deux crochets. [La compagne publicitaire diffusée] /créer/ [l'augmentation du taux de consommation]

[ا ا] /créer/ [زدة %$ل ا"ك] En revanche, le déroulement indépendant de la cause par rapport à la causalité dans laquelle elle est impliquée ne dépend pas de l interprétation de l indicateur. Cependant, l indicateur peut apporter une information supplémentaire sur la manière dont intervient la cause dans la relation. Dans ce cas, nous constatons des verbes où (i) la cause participe parmi d'autres causes pour engendrer un effet (exemple 2) et où (ii) elle joue un rôle supplémentaire à d'autres causes pour obtenir un effet (exemple 3). (2) ٳ ن ا: 3 ث ا. أ 7 6, ا 5 د ھ, 123 ف إص 3 أ ا % ا+ A @ت 3< وا= Les recherches menées sur les récoltes ont contribué à découvrir une large infection au niveau des plantes. (3) Interprétation causale de l énoncé: [les dernières recherches ] /contribuer-à/ [découvrir que ] [ا: 3 ث 6 ا 5 د ] / ھ,/ [ 123 ف... [ و<++ دا L أن K% JA3 ا H7Iت ا G ا D ا. < أن @ ك (ذ ا E= ا" D 5 دي B. ا ن Il restait possible de penser que plusieurs surprises inattendues peuvent collaborer à sauver la Grèce de sa crise économique. Interprétation causale de l énoncé: [plusieurs surprises inattendues] /collaborer-à/ [sauver la Grèce] JA3] ا H7Iت ا G ا ]/ D @ ك ب / [(ذ ا E= ا" D 5 دي B. ا ن] Notre travail a été effectué sur un corpus assez varié (environ 380 textes) ; il nous a permis de répertorier 273 verbes répartis dans la majorité pour la causalité efficiente. Cependant, nous avons défini 34 verbes qui précisent l'intervention causale, 218 verbes précisent la nature de l effet produit et 21 verbes environ concernent la causalité formalisable. Cette classification de verbes (présentée dans l'annexe A) constitue le premier objectif utile pour notre recherche en participant à la description sémantique causale en relation avec différents contextes.

Le deuxième objectif que nous avons cerné durant la réalisation de notre travail, (principalement dans la section concernant l'organisation sémantique des verbes indicateurs de la causalité et la décomposition sémantique de verbes indicateurs), est l identification d une piste qui permet de clarifier une distinction entre des notions linguistiques longtemps confondues comme la causalité, l'agentivité et la factitivité dans la langue arabe. L'introduction de la notion d agent dans notre étude ne se confond pas avec celle de la cause. En revanche, nous montrerons à partir d exemples la différence entre les contextes où apparaît un agent et les contextes où est exprimée une cause. Dans notre corpus comprenant un grand nombre de textes journalistiques, scientifiques ou littéraires, une distinction entre causalité et transitivité sémantique a attiré notre attention. C'est ainsi que nous avons abordé la différence entre ces deux concepts en insistant sur le fait que la transitivité sémantique comporte une situation où intervient un agent qui contrôle une relation dans laquelle est affectée un patient, alors que de la causalité se présente comme une mise en relation entre deux situations vérifiant certaines conditions. Durant le repérage des verbes indicateurs et l analyse de leurs valeurs sémantiques, nous avons rencontré quelques difficultés liées à la polysémie de verbes indicateurs ; un changement du sens intervient avec des prépositions associées د إ 6 ) )@ conduire à, +@ résulter de, etc.). Ces prépositions peuvent contribuer à attribuer une valeur causale à l'indicateur ou, au contraire, à l'annihiler, puisque la seule présence d'un verbe indicateur dans un énoncé ne suffit pas à déterminer sa valeur causale. Dans notre étude linguistique, nous avons identifié les indices linguistiques qui permettent d'orienter vers une interprétation sémantique causale ou non causale. En étudiant les relations causales dans une organisation textuelle de certains domaines, nous avons été au-delà du simple schéma canonique «X cause Y» (X est la cause qui produit un effet Y), et nous avons ainsi dépassé la vision restrictive des travaux linguistiques qui analysent l expression de la cause par les seuls connecteurs. C'est ainsi que nous nous sommes intéressés dans la suite de notre recherche à souligner la notion de raisonnements abductifs (Desclés 2006) en arabe suivie par une étude détaillée sur le rôle de l'énonciateur dans les connaissances causales communiquées. Ce dernier peut assumer entièrement ses paroles ; il peut aussi les prendre en charge en marquant toutefois et clairement certaines réserves, son expression indique alors un certain désengagement ; il peut encore exprimer une incertitude. Dans ce phénomène, nous nous intéressons à la notion de prise en charge de causalité dans la langue arabe.

Nous avons utilisé les travaux du linguiste américain Leonard Talmy, avec les souscatégories de la Dynamique des forces. Le modèle de Talmy a constitué notre point de départ, il nous a en effet permis une première décomposition de la signification des verbes indicateurs causaux. Le modèle de la Grammaire applicative et cognitive (Desclés 1990) nous a fourni un cadre plus riche pour représenter cette décomposition et l affiner. Nous clôturons notre étude par une représentation des schèmes sémantico-cognitifs des verbes indicateurs causaux rassemblés tout au long de notre étude, ainsi que les schémes aspecto-temporels sensibles aux arguments de la relation de causalité. La primitive CAUSE joue un rôle essentiel parmi les autres primitives sémantico-cognitives de la GA&C ; où elle exprime une mise en relation dynamique de schèmes non statiques avec des schèmes d actions. Nous pouvons constater que ces deux classes de schèmes constituent ensemble des outils adéquats à la représentation des connaissances permettant de résoudre automatiquement certains problèmes d inférence associés à la notion de causalité dans différents domaines. Nous avons conscience que nous ne pouvons pas cerner complètement, dans le présent travail, un domaine aussi large que celui de la notion de causalité. Nous avons effectué une étude à la fois syntaxique et sémantique de la relation de la causalité, par le biais de schèmes causaux sémantico-cognitifs dans le cadre théorique de la Grammaire Applicative et Cognitive. Notre analyse linguistique nous permet maintenant de constituer des ressources linguistiques utilisables dans des programmes de traitement informatiques, pour un processus de filtrage automatique des textes, une extraction d informations causales et une indexation à partir d annotation sémantique de documents relatifs à plusieurs domaines. Ces différentes ressources linguistiques causales sont directement exploitables dans des applications didactiques pour la langue française et arabe ou dans une étude de la structuration des terminologies.