Annotation manuelle de corpus écrit : Analec et analyse outillée.

Documents pareils
Réseau des bibliothèques du Pays de Pamiers Guide du Numérique

!!!! "#$$%&'(%)!*+!,-+..+! /0-'.1!2+!34!&#5+$6-+!3788!! 9+!8+-!:#-%$!*+.!;)<'+-.!*+!2='&*%.<-'+!'$$#6'2'>-+!.+!<'+&*-0!?+%*'!

Juin

Les nouvelles orientations politiques du budget 2015 du Gouvernement prévoient

7. Droit fiscal. Calendrier Actualité fiscale 7.2 Contrôle et contentieux fiscal 7.3 Détermination du résultat fiscal.

Impôts PLUS ou moins-values

Introduction sur l'état d'avancement de la esanté en France

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007

Inclure la vidéo comme levier de sa stratégie marketing

Exemple de Plan d Assurance Qualité Projet PAQP simplifié

Journée d échanges techniques sur la continuité écologique

TP6 : ALIMENTATION A DECOUPAGE : HACHEUR SERIE ET CONVERTISSEUR STATIQUE ABAISSEUR DE TENSION

CSMA e Colloque National en Calcul des Structures Mai 2013

Rassemblement National des Interlocuteurs Academiques TICE Éducation Physique et Sportive - Evry - 20/21 Janvier 2014 TABLETTES TACTILES

J adopte le geste naturel

Sommaire G-apps : Smart fun for your smartphone!

Florence Jusot, Myriam Khlat, Thierry Rochereau, Catherine Sermet*

Le guide du parraina

MAISON DE LA RATP 54, quai de la Râpée -189, rue de Bercy Paris. M Gare de Lyon. M Gare de Lyon

Projet. Courbe de Taux. Daniel HERLEMONT 1

Devenez ingénieur en Génie Informatique et Statistique par la voie de l apprentissage

Matériau pour greffe MIS Corporation. Al Rights Reserved.

UNE AVENTVRE DE AGILE & CMMI POTION MAGIQUE OU GRAND FOSSÉ? AGILE TOVLOVSE 2011 I.VI VERSION

dysfonctionnement dans la continuité du réseau piétonnier DIAGNOSTIC

DOSSIER DE CANDIDATURE POUR UNE LOCATION

Développement de site web dynaùique Dot.NET

RECAPITULATIF PLANS Pour quelle école?

CASIO D 20 Mémoire du grand total CASIO ECO Affichage 8, 10 ou 12 chiffres Tous les calculs de bases Calcul de taxes

Garantie des Accidents de la Vie - Protection Juridique des Risques liés à Internet

LES COMMUNES GENEVOISES S ENGAGENT POUR UN DÉVELOPPEMENT DURABLE

Les maisons de santé pluridisciplinaires en Haute-Normandie

CLOUD TROTTER La Vache Noire Sud rue Oscar Roulet Robion - Tél. :

TVA et Systèmes d Information. Retour d expérience d entreprise. A3F - 26 mars 2015 Hélène Percie du Sert COFELY INEO

CERES logiciel de gestion commerciale pour négociants en vin

Vu la loi n portant code des assurances prom ulguée par le dahir n du 25 rejeb 1423 (3 octobre 2002), telle qu'elle a été complétée ;

Grand Paris Seine Ouest. Evolution Actualités des lignes de bus communautaires. Grand

Guide de configuration d'une classe

L analyse économique est-elle transposable à l éducation?

Lot 4: Validation industrielle. Youness LEMRABET Pascal YIM, 19/11/2010

La santé de votre entreprise mérite notre protection.

CENTRE FRANCO-ONTARIEN DE RESSOURCES PÉDAGOGIQUES

Guide de correction TD 6

Caractérisation de l interface Si/SiO 2 par mesure C(V)

Subventions Diverses 2009

Évaluation de performance et optimisation de réseaux IP/MPLS/DiffServ

Sécu Mutuelle. Les démarches pour votre enfant

MIPOLAM EL. gerflor.fr

f n (x) = x n e x. T k

Présentation de la plateforme IDS Prelude

Demande de retraite de réversion

Les bases de données

A. RENSEIGNEMENTS GÉNÉRAUX. (Adresse civique) 3. Veuillez remplir l'annexe relative aux Sociétés en commandites assurées à la partie E.

CHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE

FORMATIONS 2014 CENTRE EUROPÉEN DE FORMATION À LA PRODUCTION DE FILMS

Le compte épargne temps

EPFL TP n 3 Essai oedomètrique. Moncef Radi Sehaqui Hamza - Nguyen Ha-Phong - Ilias Nafaï Weil Florian

Base de données bibliographique. p p. 33. valorisation économique de l'eau potable. energétique et municipales. p.13 - fédérale de.

DELIBERATION DU CONSEIL REGIONAL

LE DEFI L HOMME ET LES TECHNOSCIENCES. 21, 22, 23 novembre e Semaine sociale de France. à l Université catholique de Lille

Classement Raid 2015

Latitude N Longitude E Altitude 376 m RÉSUMÉ MENSUEL DU TEMPS DE JANVIER 2014

Compression Compression par dictionnaires

l Agence Qui sommes nous?

Prudence, Epargne et Risques de Soins de Santé Christophe Courbage

Progressons vers l internet de demain

Le nouveau projet Israélo-Palestinien : Terreau pour une culture de paix

Elargissez l horizon de votre gestion.

Date de publication : Juillet 2014

Première partie : Les travaux d inventaire. Fiches Mr Cisternino : Les travaux d inventaire 1 / 24

Initiation à la virologie Chapitre IV : Diagnostic viral

Tishreen University Journal for Research and Scientific Studies - Basic Sciences Series Vol. (33) No. (2) Cs - f.(

Séminaire LIDILEM. vendredi 25 juin 2010 ET LA RECHERCHE ACTUELLE

Sciences et technologies de l information et de la communication

Systèmes à événements discrets : de la simulation à l'analyse temporelle de la décision en agriculture

Plan directeur des zones 30 km/h

Édito. Mon Université Numérique. Édito. L Université Numérique Paris Île-de-France Les formations UNPIdF Mobilité

Projet de raccordement au réseau de transport de gaz naturel EXPRESSION PRELIMINAIRE DE BESOIN SITE :..

42"/107 cm Hz CMI. 2 x HDMI USB

C est signé mars 2015 Mutuelle soumise au livre II du Code de la Mutualité - SIREN N DOC 007 B-06-18/02/2015

Corrigé du baccalauréat S Pondichéry 13 avril 2011

Trouver des sources de capital

Sommaire. qui sommes-nous. Nos grandes realisations. 4 Madagascar 5 Nous vivons nos valeurs 6 Telma en bref 8 La Gouvernance

Introduction à la programmation orientée objet, illustrée par le langage C++ Patrick Cégielski

Chapitre 11 Bilans thermiques

Technique RSR /DCo

Parcours Hydrologie-Hydrogéologie. Apport des méthodes d infiltrométrie à la compréhension de l hydrodynamique de la zone non-saturée des sols.

CATALOGUE FORMATIONS Écoles Universitaires de Management

MENTION «MONNAIE BANQUE FINANCE ASSURANCE CARRIERES BANCAIRES ET FINANCIERES»

nous votre service clients orange.fr > espace client 3970*

La diversité culturelle en question (s)

Programme GénieArts Î.-P.-É GénieArts

Voyez la réponse à cette question dans ce chapitre.

Conditions Générales de Vente AC Motorsport

Les cartes de paiement

I - LA CESSION D ENTREPRISE II - STRATEGIES D OPTIMISATION DU PATRIMOINE DU DIRIGEANT III - METHODOLOGIE ET OUTILS DE TRAVAIL

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

au Point Info Famille

Mon Université Numérique. Édito L Université Numérique Paris Île-de-France Les formations UNPIdF Mobilité

La lettre. La Gestion des filiales dans une PME : Bonnes Pratiques et Pièges à éviter. Implantations à l étranger : Alternatives à la création

Un exemple d étude de cas

Transcription:

Aotation manull d corpu écrit : Analc t analy outillé. Frédériqu Mélani-Bcqut Lattic - CNRS ENS Pari3 USPC PSL Collctr t prod d é pour la rchrch n S Fréju, 15-18 novmbr 2016 é n S, 15 od pr t r ct ll Co

Projt d aotation linguitiqu L xprion référntil Gnè Editorial Balzac La bour MC4 Modéliation Contrativ t Computatioll d chaîn d Coréférnc txt brut 9 txt 20 000 mot corpu non homogèn vr ou pro époqu différnt longuur variabl (tout ou parti d l œuvr) txt nrichi 2 (ou n) édition corpu homogèn Aotation automatiqu d phénomèn d gnè éditorial n é Collctr t prod

Projt d aotation linguitiqu Gnè Editorial.ac Balzac La bour.aa txt nrichi 2 (ou n) édition corpu homogèn Aotation automatiqu d phénomèn d gnè éditorial n é Collctr t prod

Définition d un chéma d aotation Définition d un méthod d aotation Exploitation d é aoté n é Collctr t prod

Définition d un chéma d aotation Définition d un méthod d aotation Exploitation d é aoté n é Collctr t prod

L xprion référntil Suit d référnc : 1 = Sylvi Fabr 2 = Mr. Fabr 3 = Paul Fabr 4 = {Mr. Fabr, Paul Fabr} Chaîn d coréférnc qui concrn Sylvi Fabr : la mèr la mèr a mèr a mèr Sylvi Fabr la n é Collctr t prod

L xprion référntil 1.Rpérr référnc Problèm linguitiqu 2.Délimitr référnc Problèm d aotation : - délimitr born infériur t upériur - problèm tchniqu du txt dicontinu 3. Ajoutr d trait attribut, valur 4. Rpérr coréférnc n é Collctr t prod

La gnè éditorial n é Collctr t prod

La gnè éditorial Mdit http://www.itm.n.fr/indx.php?id=172959 Juxta http://www.juxtaoftwar.org/ n é Collctr t prod

La gnè éditorial 1832 1835 n é Collctr t prod

La gnè éditorial n é Collctr t prod

La gnè éditorial n é Collctr t prod

Définition d un chéma d aotation Définition d un méthod d aotation Exploitation d é aoté n é Collctr t prod

Un procédur d aotation? 1. Import du corpu d travail txt brut txt nrichi 2. Aotation manull d phénomèn linguitiqu xprion référntil la gnè éditorial 4. 3. Aotation manull d chaîn Viualiation d aotation chaîn d coréférnc utiliation d calcul tatitiqu n é Collctr t prod

Aotation manull d xprion référntil Un nmbl d trait pour chaqu xprion n é Collctr t prod

Aotation manull d chaîn Un nmbl d trait pour la chaîn idntifiant du référnt ; typ d référnt (individu, group) Et plu particulièrmnt pour l prmir maillon typ d introduction : par rgroupmnt, xtraction, aociation c t là qu font lin anaphoriqu non coréférntil (anaphor aociativ) n é Collctr t prod

Définition d un chéma d aotation Définition d un méthod d aotation Exploitation d é aoté n é Collctr t prod

Calcul d fréqunc Prmir d typ d intrrogation d corpu = impl calcul d fréqunc Particularité = vérifir aotation, corrigr n é Collctr t prod

Viualiation d fréqunc A partir du momnt où fréqunc ont calculé, on put mttr n form d graphiqu n é Collctr t prod

Calcul d corrélation 2 typ d intrrogation : ttr d aociation d champ n é Collctr t prod

Viualiation d corrélation n é Collctr t prod

Viualiation d corrélation n é Collctr t prod

Viualiation d corrélation Utiliation 1 : rpérr d aotation bizarr, vérifir i tou champ ont corrct, t corrigr i boin Utiliation 2 : rpérr d nmb d xmp qui comportnt d manièr imilair, t idntifir valur commun n é Collctr t prod

Viualir la uit d référnc Suit linéair d référnc aoté, rprénté avc un cod coulur t un cod (alphabt) Intérêt = à part illutrr d artic, tntr d détctr d comportmnt n é Collctr t prod

Viualir la uit d référnc n é Collctr t prod

Périation t valoriation d é aoté n é Collctr t prod

n é Collctr t prod

Concluion : Contitur un corpu d référnc Fair d rquêt (intrrogr) l corpu aoté Détrminr t ttr la procédur d aotation ratioll, applicabl à d autr état d langu... t lit d problèm (d déciion, d tmp, d rgonomi, tchniqu) calcul d fréqunc ont trè uti mai rtnt imp... Vr un aotation automatiqu n é Collctr t prod

Mrci Bibliographi : Fort K., L rourc aoté, un nju pour l'analy d contnu : vr un méthologi d l'aotation manull d corpu, thè, 2012. Fuch C., Gréillon A., Lbrav J.-L., Pytard J., Ry-Dbov J., Culioli A., La Gnè du txt : modè linguitiqu / Préfac d'antoin Culioli, Pari, Édition du CNRS, «Txt t Manucrit», 1982, 175p. Ganaia J.-G., Fnoglio I. t Lbrav J-L., Manucrit, gnè t cumnt numérié. EDITE : un étud informatié du travail d l écrivain, Documnt numériqu, 2004/4, Volum 8, pp.91-110. Landragin F., Anaphor t coréférnc : analy aité par ordinatur, Nouvl prpctiv ur l'anaphor. Point d vu linguitiqu, pycholinguitiqu t acquiitiol, Ptr Lang, 2014. Landragin F., Poibau T. & Victorri B., ANALEC: a Nw Tool for th Dynamic Aotation of Txtual Data. Eighth Intrnational Confrnc on Languag Rourc and Evaluation, Itanbul, Turqui, 2012, pp. 357-362. Mélani-Bcqut F. & Landragin F., Linguitiqu outillé pour l'étud d chaîn d référnc : qution méthologiqu t olution tchniqu., Langag 195, Armand Colin, Pari, 2014, pp. 117-137. Widlöchr A., Matht Y. (2009), La plat-form Glozz : nviromnt d aotation t d xploration d corpu, Act d la conférnc TALN 2009, Snli. n é Collctr t prod