Problèmes d annotation de corpus au niveau des constructions sémantiques du discours



Documents pareils
GRAMMATICAUX DE MÊME CATÉGORIE AUSSI TÔT / BIENTÔT BIEN TÔT / PLUTÔT PLUS TÔT / SITÔT SI TÔT 1 Homophones grammaticaux de même catégorie

À propos d exercice. fiche pédagogique 1/5. Le français dans le monde n 395. FDLM N 395 Fiche d autoformation FdlM

LE DISCOURS RAPPORTÉ

GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES QUANT QUAND 1 Homophones grammaticaux de catégories différentes

Citizenship Language Pack For Migrants in Europe - Extended FRANÇAIS. Cours m ultim édia de langue et de culture pour m igrants.

Coordination de subordonnées relatives : identification et correction

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

Utilisation des auxiliaires avoir et être

Langue Française. Syllabus A1. Description globale du niveau A1 utilisateur élémentaire

FRENCH Language (Advanced Level III)

Auxiliaire avoir au présent + participe passé

ÉCOLE SECONDAIRE PÈRE-RENÉ-DE-GALINÉE

mes m est mets/met mais mets

Absence ou présence erronée d un mot ou d un groupe syntaxique

quelque quelque(s) quel(s) que/quelle(s) que quel(s) / quelle(s) qu elle(s)

scaricato da

Et avant, c était comment?

peu peux/peut peut être peut-être

LA CONJONCTION MÊME SI N EXISTE PAS!

«La pomme qui voulait voyager»

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Homophones grammaticaux de catégories différentes. s y si ci

Le passé composé. J ai trouvé 100 F dans la rue. Il est parti à 5 h 00.

CANDIDATE S CORRIDOR SHEET

Choisir entre les pronoms relatifs qui et lequel, précédés ou non d une préposition

Le carnaval des oiseaux

Techniques d accueil clients

N Y OU OÙ 1 Homophones grammaticaux de catégories différentes. ni n y ou où

N SIMON Anne-Catherine

Première éducation à la route Je suis piéton

1. Ouvrir un compte. 1 Ouverture de compte. I. Prendre un rendez-vous dans une banque. 4 ouvrir un compte 1

DISCOURS DIRECT ET INDIRECT

Employer des phrases avec subordonnées relatives et marqueurs emphatiques (c est qui, c est que)

Une école au Togo, épisode 1/4

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

1 sur 5 10/06/14 13:10

Direct and Indirect Object Pronouns

PRÉSCOLAIRE. ANDRÉE POULIN (devant la classe) : Je me présente, mais je pense que vous connaissez déjà mon nom, hein? Je m'appelle Andrée.

Absence ou présence erronée de l adverbe de négation ne

PLAN DE LEÇON TITRE : Qu est-ce que le crédit? Résultats d apprentissage de la littératie financière. Attentes et contenus d apprentissage

ça sa ÇA HOMOPHONES LES EXERCICES DE FRANÇAIS DU CCDMD Homophones grammaticaux de catégories différentes

quoi que quoique LES EXERCICES DE FRANÇAIS DU CCDMD

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

N 6 Du 30 nov au 6 déc. 2011

Qu est-ce que le crédit?

L enfant sensible. Un enfant trop sensible vit des sentiments d impuissance et. d échec. La pire attitude que son parent peut adopter avec lui est

DESCRIPTEURS NIVEAU A2 du Cadre européen commun de référence pour les langues

UTILISER LA MESSAGERIE

responsable? Qui est Sinistres «Nous tenons compte des circonstances de chaque cas»

Compétence interactionnelle en français langue étrangère : l éclairage du corpus Lancom. Danièle Flament-Boistrancourt

Compte-rendu de Hamma B., La préposition en français

Homophones grammaticaux de catégories différentes. ce se

Manuel d utilisation

JADT /06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire

Les p'tites femmes de Paris

OLIVER L ENFANT QUI ENTENDAIT MAL

Discours direct indirect au présent

Épreuve d expression orale (tâche 2)

Les homophones ou/ où. Ou / où. Ou / où. «ou» marque le choix Je remplace par «ou bien» «où» exprime un lieu ou un temps. l endroit où, le moment où

AVERTISSEMENT. Ce texte a été téléchargé depuis le site

Accompagnement personnalisé 6e

Dis-moi ce que tu as fait, je te dirai qui tu es 1

TOUS MALADES! (Texte de M.-A. Ard) - Le Médecin :

L enfant du toit du monde

Test Francophone de Langue Française (TFLF) Niveau B1

N avez-vous jamais rêvé d une nouvelle façon de faire un film? gettyimages.fr/film. Guide de l utilisateur

3 : créer de nouveaux onglets dans Netvibes Cliquer sur le bouton «+» et renommer le nouvel onglet (par exemple Encyclopédies en ligne)

PNL & RECRUTEMENT IMPACT SUR LES ENTRETIENS Présentation du 10/06/03

LES PRONOMS INTERROGATIFS

C ÉTAIT IL Y A TRÈS LONGTEMPS QUAND LE COCHON D INDE N AVAIT PAS ENCORE SES POILS.

Dire à quelqu un de faire quelque chose

EOI ARUCAS DEPARTAMENTO DE FRANCÉS DOSSIER PASSÉ RÉCENT FUTUR PROCHE PRÉSENT PROGRESSIF

FICHE PÉDAGOGIQUE -Fiche d enseignant-

TÉMOIGNAGES de participantes et de participants dans des groupes d alphabétisation populaire

Conception des bases de données : Modèle Entité-Association

Unité 10. Vers la vie active

Règles d élaboration d une évaluation par Questions à Choix Multiple Joël LECHEVALLIER 1

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

v Sygic, a.s. All rights reserverd. Manuel utilisateur

CAP TERTIAIRE/INDUSTRIEL

DÉCISION DU TRIBUNAL DE LA SÉCURITÉ SOCIALE Division d appel Demande de permission d en appeler

APPRENDRE LA CHIMIE EN ZEP

Affirmation de soi, confiance en soi, estime de soi

Premier cours d informatique

Guide d utilisation des fichiers bonus accompagnant le guide «L Argent est une science exacte»

Ma première assurance auto. Je suis en contrôle!

COLLEGE 9 CLASSE DE 3ème E TITRE DE LA NOUVELLE : «Mauvaise rencontre»

Document réalisé avec le soutien de

Ecrire pour le web. Rédiger : simple, concis, structuré. Faire (plus) court. L essentiel d abord. Alléger le style. Varier les types de contenus

Apprentissage Automatique

Distinction entre le pronom leur et le déterminant leur

Réaliser un journal scolaire

Livret personnel de compétences

Utiliser ma messagerie GMAIL

Information au patient

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

Appel à l action relativement au chômage, au sous-emploi et à la pénurie de main-d œuvre qualifiée

Qu est-ce que l analyse des données qualitatives? TAMS Analyzer n est: Projets collaboratifs. TAMS Analyzer permet:

NOM:.. PRENOM:... CLASSE:.. STAGE EN ENTREPRISE. des élèves de...ème Du../../.. au./../.. Collège...

Transcription:

Problèmes d annotation de corpus au niveau des constructions sémantiques du discours István CSŰRY Université de Debrecen (H), Département de Français

1. Introduction / 1 Les orientations de l étude des structurants de discours (SD: connecteurs, marqueurs) Pragmatique > linguistique Théorique > empirique La dimension textuelle / discursive de l étude des SD La nature des entités mises en relation Les traits et les relations lexicologiques des SD L exploration de corpus et la structure du discours Difficultés à identifier les items (3 cas de figure) et les structures Repères combinatoires I. Csűry - NooJ 2008 2

1. Introduction / 2 Travaux précédents Le champ lexical de mais (2001) KKK (2005) Les objectifs de la communication Envisager les possibilités et les avantages de l emploi de NooJ dans le traitement multidimensionnel des discours Passer en revue les problèmes empiriques du repérage des constituants mis en relation par les SD Mettre en évidence le rôle des traits lexicaux, des cooccurrences et de la position syntaxique Évoquer les relations (hiérarchiques et croisées) établies par les SD I. Csűry - NooJ 2008 3

2. Perspectives de l emploi de NooJ dans le traitement des relations de discours (RD) L inadaptation des outils d analyse de corpus à l étude de l organisation discursive Dans mes travaux antérieurs: Concordances simples de connecteurs Dispositif d annotation en XML et son usage en Cl@rk System (KKK) Exigences (minimales) pour aller plus loin: Emploi d outils compatibles (XML) Possibilité de modification / développement de codages et annotations Combinaison de critères lexicaux et grammaticaux dans l analyse I. Csűry - NooJ 2008 4

3. Les problèmes du repérage des constituants des RD 1. Entités de nature différente Verbales explicites Inférables Dialogales Extralinguistiques 2. Constituants de niveaux différents Intrapropositionnels Intraphrastiques (propositions) Phrases / énoncés Ensembles multiphrases 1. Constituants situés différemment Contigus ou éloignés «bi- ou unilatéraux» 2. Enchevêtrement des relations I. Csűry - NooJ 2008 5

3./2. Les problèmes du repérage des constituants des RD: exemples (1) Cependant, si l on se place dans le cadre du Régime d aide du Canada, cela veut dire qu il s agit d argent consacré au bienêtre. Dans ce cas, la question continuera de se poser de savoir si ce sont les gens qui ont des salaires moyens ou de petits salaires qui peuvent en bénéficier. J aimerais voir fonctionner des services de garde qui ne soient pas placés sous la rubrique de bien-être, de façon à ce que [1]ceux d entre nous [2]qui [3]n ont pas le droit de bénéficier ou ne veulent pas passer le test permettant de les faire bénéficier de ce service [4]puissent MALGRÉ TOUT y accéder. (Hansard) I. Csűry - NooJ 2008 6

3./3. La relation marquée par le connecteur dans (1) ({[ceux d entre nous] n'ont pas le droit de bénéficier ou ne veulent pas passer le test permettant de les faire bénéficier de ce service} malgré tout {[ceux d entre nous] puissent accéder [aux services de garde ]}) P 1 S 1 Pred 2 [4] P 2 S 2 Pred 1 [3] Pron 1 [1] Pron 2 [2] I. Csűry - NooJ 2008 7

4. Les caractéristiques des SD 1. Traits lexicaux Sens référentiel ou procédural Types de relation et réalisations Nature et place des termes mis en relation Composantes sémantiques particulières Types de discours; registre 2. Cooccurrences Séquences de connecteurs 3. Position syntaxique Relation intra- ou transphrastique Les structures phrastique et textuelle La position des adverbiaux en français I. Csűry - NooJ 2008 8

4.3.1. La position des connecteurs adverbiaux en français Rubattel (1982 : 54): aucun principe connu n explique ces différences d acceptabilité Weinrich (1989: 324) à propos de la position préverbale des Adv: [cette variante] demeure cependant rare dans l ensemble et n est employé que dans le langage soigné, et avec plusieurs restrictions. Il ne peut en particulier s agir d adverbes dont le poids phonique ou graphique est trop important. Conviennent particulièrement à cette position les adverbes d assertion [ ] et, parmi les adverbes de séquence [ ], ceux qui marquent dans le texte une séquence marquée (conséquence logique, opposition ) [ ] Cette place de l adverbe a aussi pour effet de désigner le sujet comme thème en le séparant du verbe. Le verbe arrivant à la suite est ainsi caractérisé comme une information nouvelle ( rhème ). Ouvrages plus récents: classement des adverbes, positions relatives, mais pas grand-chose sur les particularités des connecteurs I. Csűry - NooJ 2008 9

4.3.1. / 2. Un exemple: cependant corpus: 4 romans + 7 pages d Internet aléatoirement choisies 350 300 100% Cependant: occurrences / emploi textuel 320 occurrences 250 79% emploi «transphrastique» 254 fois 200 150 100 50 0 ttl txt I. Csűry - NooJ 2008 10

4.3.1. / 3. La position de cependant initiale: 157, soit 62% 300 Cependant textuel: pos. initiale / non initiale préverbale: 32 250 100% périphérie gauche au total: 189, soit 74% 200 150 100 62% 38% txt pos init ttl non init groupe verbal: 41 50 post-gv ou dans compléments: 24 0 txt pos init ttl non init I. Csűry - NooJ 2008 11

4.3.1. / 4. La position préverbale séquence avec un autre connecteur (présence d une conjonction) GN sujet topique constituant adverbial (cadratif; marqueur d univers de discours ou d intégration linéaire) I. Csűry - NooJ 2008 12

4.3.1. / 5. La position enchâssée le véritable choix: entre la position initiale et non-initiale, plutôt qu entre les différentes positions non-initiales: contraintes grammaticales (ou, du moins, tendances) sur 32 cas de position préverbale, forme verbale simple en 28 cas (surtout imp.). Les 4: 1 passif à l imp., 1 question avec peut-être + inversion, 2 pqp. du même texte S pronominal et/ou de faible volume phrase interrogative, impérative phrase introduite par si il faut (ou autre constr. impersonnelle) - tendance; moins régulièrement observé cas rares de «variantes libres» (Weinrich!) I. Csűry - NooJ 2008 13

4.3.1. / 6. D autres exemples: Le connecteur signale un changement de cadre (2) Et une inquiétude le mordait au coeur. S'il allait échouer? Mais que pouvait-il craindre? Il se tirerait toujours d'affaire! POURTANT c'était une grosse partie qu'il jouait, ce soir-là! (Bel-Ami) I. Csűry - NooJ 2008 14

4.3.1. / 7. Le connecteur tombe sous la portée d un cadratif (3) Charles n'était point de complexion facétieuse, il n'avait pas brillé pendant la noce. Il répondit médiocrement aux pointes, calembours, mots à double entente, compliments et paillardises que l'on se fit un devoir de lui décocher dès le potage. Le lendemain, EN REVANCHE, il semblait un autre homme. C'est lui plutôt que l'on eût pris pour la vierge de la veille, tandis que la mariée ne laissait rien découvrir où l'on pût deviner quelque chose. (Madame Bovary) NB: Bonami, Godard & Kampers-Mahne (2004): à la différence des Adv intégrés, la portée des Adv incidents n est pas restreinte syntaxiquement I. Csűry - NooJ 2008 15

4.3.1. / 8. Le connecteur suit un topique contrastif (4) Deux ou trois fois par semaine, la jeune femme arrivait avant qu'il fût levé, se déshabillait en une minute et se glissait dans le lit, toute frémissante du froid du dehors. Duroy, PAR CONTRE, dînait tous les jeudis dans le ménage et faisait la cour au mari en lui parlant agriculture ; et comme il aimait lui-même les choses de la terre, ils s'intéressaient parfois tellement tous les deux à la causerie qu'ils oubliaient tout à fait leur femme sommeillant sur le canapé. (Bel-Ami) I. Csűry - NooJ 2008 16

4.3.1. / 9. Le connecteur suit le topique: l effet sur les inférences (1) (5) L'élargissement ne devrait pas poser de problèmes graves à la PCP, et les nouveaux États membres devraient être en mesure d'adopter celle-ci sans difficulté. La mise en oeuvre effective de l'acquis pourrait NÉANMOINS souffrir de l'insuffisance, dans certains pays candidats, de structures administratives spécialisées dans des domaines tels que la collecte des données de base nécessaires. (Docus de l UE) I. Csűry - NooJ 2008 17

4.3.1. / 10. Le connecteur suit le topique: l effet sur les inférences (2) (6) La Roumanie doit affronter un défi particulier en matière d'affaires intérieures et de justice. Elle a pour l'instant fait des progrès limités en matière de reprise de l'acquis en ce domaine. Le nouveau gouvernement a CEPENDANT entrepris un programme de grande ampleur pour mener à bien les réformes institutionnelles indispensables. (Docus de l UE) I. Csűry - NooJ 2008 18

5. La problématique des interrelations des RD 1. Problèmes de délimitation Ouverture et fermeture Réalisations linguistiques différentes Contenus non explicites 2. Hiérarchie et entrecroisement Entrecroisement des RD d ordre différent Dépendance du même constituant de plusieurs parents 3. Traitement incrémentiel Situation de discours: interprétation progressive avec retours sur le contexte précédent; prise en compte incrémentielle de l ensemble des SD /RD Situation d analyse: démarches régressives; prise en compte d «îlots» de RD 4. Repères (à part des SD) Réseaux de coréférence; champs lexicaux / sémantiques Phénomènes morpho-grammaticaux I. Csűry - NooJ 2008 19

5.1.1. Interrelations de RD: un exemple (7) Un matin qu elle venait de partir, selon sa coutume, assez légèrement vêtue, il tomba de la neige tout à coup ; et comme Charles regardait le temps à la fenêtre, il aperçut M. Bournisien dans le boc du sieur Tuvache qui le conduisait à Rouen. Alors il descendit confier à l ecclésiastique un gros châle pour qu il le remit à Madame, sitôt qu'il arriverait à la Croix rouge. A peine fut-il à l auberge que Bournisien demanda où était la femme du médecin d Yonville. L hôtelière répondit qu elle fréquentait fort peu son établissement. Aussi, le soir, en reconnaissant madame Bovary dans l Hirondelle, le curé lui conta son embarras, sans paraître, du reste y attacher de l importance ; car il entama l'éloge d un prédicateur qui pour lors faisait merveille à la cathédrale, et que toutes les dames couraient entendre. N importe s il n avait point demandé d explications, d autres plus tard pourraient se montrer moins discrets. Aussi jugea-t-elle utile de descendre chaque fois à la Croix rouge, de sorte que les bonnes gens de son village qui la voyaient dans l'escalier ne se doutaient de rien. (Madame Bovary) I. Csűry - NooJ 2008 20

5.1.2. Problèmes de délimitation de cadres temporels Un matin qu elle venait de partir, selon sa coutume, assez légčrement vętue, UN MATIN Circonstance il tomba de la neige tout ŕ coup ; G É N É R A L et comme Charles regardait le temps ŕ la fenętre, UN JOUR Cause non délibérée 3-5 il aperçut M. Bournisien dans le boc du sieur Tuvache Élaboration qui le conduisait ŕ Rouen. 6-9 But Alors il descendit 7-9 confier ŕ l ecclésiastique un gros châle But 8-9 pour qu il le remit ŕ Madame, Circonstance sitôt qu'il arriverait ŕ la Croix rouge. A peine fut-il ŕ l auberge 11-12 que Bournisien demanda Élaboration oů était la femme du médecin d Yonville. 2-27 Séquence 13-17 13-14 L hôteličre répondit Élaboration Résultat-non-délibéré qu elle fréquentait fort peu son établissement. Aussi, le soir, en reconnaissant madame Bovary dans l Hirondelle, LE SOIR 15-17 Séquence le curé lui conta son embarras, 16-17 Contraste sans paraître, du reste y attacher de l importance ; Justification 18-20 car il entama l'éloge d un prédicateur Élaboration qui pour lors faisait merveille ŕ la cathédrale, 19-20 Jonction et que toutes les dames couraient entendre. 21-22 N importe PLUS TARD Élaboration 21-23 Contraste s il n avait point demandé d explications, Solution d autres plus tard pourraient se montrer moins discrets. 21-27 24-25 Aussi jugea-t-elle utile Élaboration Résultat délibéré de descendre chaque fois ŕ la Croix rouge, C H A Q U E 26-27 Élaboration de sorte que les qui la voyaient dans bonnes gens de son l'escalier. village ne se doutaient de rien F O I S I. Csűry - NooJ 2008 21

5.2. Les interrelations des RD - la portée des connecteurs Connecteur à portée étroite N Ra S N Rb S Marie est triste PARCE QUE son fils est malade. EN EFFET, il a mangé trop de choux à la crème. π 1 π 2 Connecteur à portée large Rb N S Ra π 3 π 3 Je suis allé voir Paul PARCE QUE je voulais lui demander un service MAIS il n était pas à la maison. π 1 π 2 Connecteur à grande envergure Ra N S N π 1 π 2 Rb S π 3 Je vais voir Paul PARCE QUE je veux lui demander un service, je ne peux DONC pas te laisser la voiture. I. Csűry - NooJ 2008 22

6. Conclusion Impératifs et difficultés du traitement des structures discursives en linguistique de corpus [ ] les études sur le discours se caractérisent actuellement par une approche qualitative, sur des données de faible volume, avec des méthodes manuelles et donc subjectives [ ] ce qui fait obstacle [ ] à la généralisation de leurs résultats. [ ] On a besoin de techniques permettant d appréhender et d articuler des fonctionnements souvent enchevêtrés, à différents niveaux de granularité (Péry- Woodley) Perspectives (immédiates) de l emploi de NooJ Perfectionnement de l analyse lexicale des SD Combinaison de critères lexicaux et grammaticaux dans l analyse des RD coopération entre recherches différentes Annotation structurale et sémantique de corpus Prolongements? (traduction ) I. Csűry - NooJ 2008 23

Merci de votre attention István CSŰRY csury@delfin.unideb.hu Université de Debrecen, Département de Français www.francia.unideb.hu I. Csűry - NooJ 2008 24