Corpus de textes écrits et oraux

Documents pareils
N SIMON Anne-Catherine

OUVERTURE DE VACANCE

Master européen en traduction spécialisée. Syllabus - USAL

MASTER LPL : LANGUE ET INFORMATIQUE (P)

Master Etudes françaises et francophones

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

De la tâche à sa réalisation à l aide d un document plus qu authentique. Cristina Nagle CEL UNICAMP cnagle@unicamp.br

Formation intensive sur 10 jours + une journée d études + possibilité de préparer/passer la certification en langues slaves

CATALOGUE Formations courtes PARCOURS TRADUCTION

MASTER LANGUES, LITTÉRATURES ET CIVILISATIONS ETRANGÈRES ET RÉGIONALES. Parcours Langues et Technologies (LT)

ÉCOLE SECONDAIRE PÈRE-RENÉ-DE-GALINÉE

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

LES LANGUES EN DANGER : UN DÉFI POUR LES TECHNOLOGIES DE LA LANGUE

ISTEX, vers des services innovants d accès à la connaissance

Le SMS fait entendre sa voix... Énergie solaire, énergie du futur? Recherche et développement technologique

Le Cadre Européen Commun de Références pour les Langues

eduscol Ressources pour la voie professionnelle Français Ressources pour les classes préparatoires au baccalauréat professionnel

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

Le mécanisme du processus de traduction *

Une discipline scolaire

RÉSUMÉ DES NORMES ET MODALITÉS D ÉVALUATION AU SECONDAIRE

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

Licence de langues, littératures et civilisations étrangères (LLCE)

Les poursuites d études en lettres modernes? I Que faire après une L2?

MICROSTAGE COM602 Département des lettres et communications. Automne 2015 (10 juin 2015)

Retour d'expérience avec : OCS Inventory & GLP

MASTER ECONOMIE APPLIQUEE

GRILLE D ANALYSE D UNE SEQUENCE D APPRENTISSAGE

Profiel Toeristische en Informele Taalvaardigheid Profiel Maatschappelijke Taalvaardigheid

UNIVERSITÉ PARIS-SORBONNE

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

Initiation à la recherche documentaire

Contacts presse : Académie : Nathalie Champlong Medef : Patrick Lecurieux Durival

Intégrer la traduction/interprétation à l Université Saint-Louis Bruxelles : difficultés, appréhensions et contraintes

Le retour des maîtres d EPS, provocation ou réalité?

Les documents primaires / Les documents secondaires

Pearson - Fle 2013 Collection Tendances

LA RECHERCHE DOCUMENTAIRE

DÉPARTEMENT DE LETTRES ET LANGUES. Master Didactique des Langues Français Langue Etrangère, Technologies Educatives. 1 ère année

[FORMATIONS] IRDECOF

Spécialité Stratégie et conseil en communication

LYCEE GRANDMONT Avenue de Sévigné TOURS Tel : Fax : Site :

SCIENCES DE L ÉDUCATION

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

1 On peut consulter et interroger ce corpus sur le site de l équipe DELIC :

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

SITES WEB GRATUITS D APPRENTISSAGE EN ANGLAIS ET EN D AUTRES LANGUES

E-TVA : de la facturation au recouvrement Sous la présidence de Christian Amand. Mardi 30 septembre 2008, de 08h50 à 16h30 FEB, Bruxelles

Avant-propos Le problème de la spécificité du texte dramatique... 7 Genres du dramatique et descriptions linguistiques Conclusion...

LES OUTILS DU CONSEIL DE L EUROPE EN CLASSE DE LANGUE


Catalogue DIF. Formations linguistiques

Management : les contributions du système d information. Pôle européen Économie-Gestion 11 décembre 2013

Arts, Lettres, Langues. Langues, Littératures et Civilisations Etrangères (LLCE) spécialité Anglais

Plates-formes de téléformation et modèles pédagogiques

Des banques de données terminologiques en Afrique francophone

Référentiel d'activités professionnelles et référentiel de certification Diplôme d'état de professeur de musique

Evaluation des cursus «Information & Communication»

LECTURE CRITIQUE. Accompagner les enseignants et formateurs dans la conception d une formation en ligne

sentée e et soutenue publiquement pour le Doctorat de l Universitl

CYCLE DIRIGEANT FEDESAP/HEC

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

UFR Lettres et Langues à l université de Lorraine

Joëlle Bolot, Stéphane Cipriani.

MASTERS L OFFRE DES ARTS, LETTRES ET LANGUES DE L UNIVERSITÉ DE LORRAINE 2014 >> 2015

Les tablettes numériques, véritable outil d'apprentissage? Exemples d'activités pour la classe

Formation Méthode MDM. Architecture et procédés de modélisation des données de référence

Créer un mémento grammatical portatif et évolutif pour tablettes et smartphones

Présentation Cette bi-licence combine les exigences et les objectifs des deux licences disciplinaires :

Le master en administration publique (MPA) à l IDHEAP : Une formation multidisciplinaire pour les directeurs d établissements scolaires

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

ACCORD. Apprendre le français à Paris ECOLE DE LANGUES PARIS

RÈGLEMENT FACULTAIRE SUR LA RECONNAISSANCE DES ACQUIS. Faculté des lettres et sciences humaines

Université de Haute Alsace. Domaine. Sciences Humaines et Sociales. MASTER Mention Éducation, Formation, Communication UHA, ULP, Nancy 2

La traduction automatique des articles de l anglais au français

Scénario n 24 : QUOI FAIRE AVEC MON BAC PRO TRANSPORT /LOGISTIQUE?

sciences de l information et du document

Étude sémantique du pronom ON dans une perspective textuelle et contextuelle. Thèse de doctorat Anje Müller Gjesdal Université de Bergen

Préparer la formation

Termes de référence pour le recrutement d un Assistant pour la gestion des bases de données

Programme de la formation. Écrit : 72hdepréparation aux épreuves d admissibilité au CRPE

UFR Lettres et Langues à l université de Lorraine

COMPTE RENDU OU NOTES DE LECTURE SUR LA LITTERATURE ORALE AFRICAINE

DESCRIPTEURS NIVEAU A2 du Cadre européen commun de référence pour les langues

THOT - Extraction de données et de schémas d un SGBD

Des métiers et des études de langues. Service d Information et d Orientation Universitaire. Octobre 2012

PRÉPARER LA PREMIÈRE ÉPREUVE ORALE D ADMISSION OPTION EPS. DEVOIRS SUPPLÉMENTAIRES 1 et 2

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES

SYSTRAN 7 Guide de démarrage

Passeport pour ma réussite : Mentorat Vivez comme si vous mourrez demain. Apprenez comme si vous vivrez éternellement Gandhi

Comment traduire Proust? Problématiques traductologiques et réflexions théoriques

UE11 Phonétique appliquée

PROGRAMME DE FORMATION. Etre Coach professionnel en entreprise

Travaux dirigés - Exercices de grammaire et traduction grammaticale

Les idées. Albums pour aborder ce trait. Présco-1 er cycle (À partir de 5 ans) 1 er cycle et 2 e cycle. 2 e cycle Livres ouverts

Programme détaillé MASTER DE MANAGEMENT ET DE STRATEGIE D ENTREPRISE. Objectifs de la formation. Les métiers. Niveau et durée de la formation

Étude sémantique du pronom ON dans une perspective textuelle et contextuelle.

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

Transcription:

Plan d accès Université de Mons Campus Plaine de Nimy Avenue du Champs de Mars à 7000 Mons Bâtiment FTI-EII - salle polyvalente Le Service Cultures & Médiations linguistiques (FTI-EII) propose une journée d étude Corpus de textes écrits et oraux Quels usages pour la recherche? 4 en linguistique 4 en traduction 4 en littérature 4 en didactique Lundi 31 mars 2014 Campus plaine de Nimy, avenue du Champ de Mars, 7000 Mons, bâtiment FTI-EII, salle polyvalente

Programme 08h30-9h Accueil des participants et mot de bienvenue des autorités académiques 9h - 10h30 Frantext : un corpus et des outils de recherche 4 Présentation générale et mode de fonctionnement, par Véronique Montémont (Université de Lorraine / ATILF Analyse et Traitement Informatique de la Langue Française) 45 4 Exemples de recherches possibles, par Véronique Montémont (Université de Lorraine / ATILF Analyse et Traitement Informatique de la Langue Française) 45 10h30-11h Pause 11h - 12h British National Corpus 4 Présentation, contenu et fonctionnalités du BNC : le point de vue des utilisateurs, par Christine Michaux (UMONS, FTI-EII, chef du Service de Terminologie & traduction spécialisée) 30 4 Corpus et études de cas : la conceptualisation métaphorique des bactéries et des virus en français et en anglais, par Christine Michaux et Alessandra Dubois (UMONS, FTI- EII) 30 12h - 13h30 Repas en commun Accès gratuit. Inscription obligatoire pour le jeudi 27 mars au plus tard. 13h30-15h DPC (Dutch Parallel Corpus) 4 La composition et l exploitation d un corpus parallèle multilingue. Le cas du Dutch Parallel Corpus, par Maribel Montero Perez, Hans Paulussen & Piet Desmet (KU Leuven) 40 4 Le DPC au service de la linguistique contrastive du français et du néerlandais : trois études de cas, par Gudrun Vanderbauwhede (UMONS, FTI-EII) 30 4 L adjectif en français et en néerlandais dans les corpus de traduction : observations stylistiques, linguistiques et traductionnelles, par Amandine Léonard (UMONS, FTI-EII) 20 15h - 15h30 Pause 15h30-16h45 LANCOM (le français comme LANgue de COMmunication) 4 Compétence interactionnelle en français langue étrangère: l éclairage du corpus Lancom, par Danièle Flament- Boistrancourt (Université Paris Ouest Nanterre La Défense) 45 4 Enseigner le français parlé : quelques résultats à partir du corpus Lancom, par Juliette Delahaie (Université Paris Ouest Nanterre La Défense) 30 16h45-17h30 VALIBEL (VAriétés LInguistiques du français en BELgique) 4 Le corpus oral VALIBEL : de la variation aux variétés, par Alice Bardiaux, (Université catholique de Louvain FNRS) 45 Cocktail de clôture Personnes de contact : 4 michel.berre@umons.ac.be 4 gudrun.vanderbauwhede@umons.ac.be

Journée d études Corpus de textes écrits et oraux Quels usages pour la recherche? 4 en linguistique 4 en traduction 4 en littérature 4 en didactique Lundi 31 mars 2014 Campus plaine de Nimy, avenue du Champ de Mars, 7000 Mons, bâtiment FTI-EII, salle polyvalente 1

Programme Frantext : un corpus et des outils de recherche. De 9h à 10h30 Présentation générale et mode de fonctionnement. Par Véronique Montémont, Université de Lorraine / ATILF Analyse et Traitement Informatique de la Langue Française. Cette communication présentera Frantext, l une des plus anciennes base de données numériques avec Gutenberg. Créée pour servir de réservoir d exemple à un dictionnaire, cette base a évolué vers le grand public, fournissant à la fois un corpus échantillonné et des outils de recherches. Depuis 2000, Frantext a subi une importante modernisation, liée au contexte concurrentiel des grandes bases de données numériques telles Google Livres ou Gallica ; elle a dû aussi faire face à une interprétation de plus en plus restrictive de la législation appliquée au droit d auteur quand il s agit de numérique. Nous retracerons les grandes lignes de cette évolution et des améliorations sur lesquelles elle a débouché. Cette présentation générale sera suivie d un exposé sur les outils proposés et leur application à différents types de recherche, en linguistique et en littérature. Ces exemples seront l occasion de s interroger sur l apport, au regard de la recherche, de ces bases de données numériques, et de proposer quelques pistes herméneutiques quant à leur usage. Pause 2

British National Corpus De 11h à 11h30 Présentation, contenu et fonctionnalités du BNC : le point de vue des utilisateurs. Par Christine Michaux, UMONS, FTI-EII, chef du Service de Terminologie & traduction spécialisée. Le British National Corpus est un corpus d anglais britannique d une taille de 100 millions de mots puisés dans des sources tant orales qu écrites. Il est un incontournable pour toute recherche sur la langue anglaise britannique contemporaine. Le but de l exposé est de familiariser le public avec les outils de recherche du BNC afin d en démontrer le potentiel. De 11h30 à 12h Corpus et études de cas : la conceptualisation métaphorique des bactéries et des virus en français et en anglais. Par Christine Michaux et Alessandra Dubois, UMONS, FTI-EI. La métaphore est un phénomène très courant en langue de spécialité. Dans les textes écrits par des experts pour des experts, la métaphore joue un rôle constitutif : elle sert à élaborer les théories en asseyant leurs concepts fondamentaux. Dans les textes de vulgarisation scientifique, la métaphore aide à expliciter des phénomènes complexes auprès de lecteurs non-experts. Le projet de recherche qui sera exposé se concentre sur l usage de la métaphore dans des textes de vulgarisation scientifique, dans le domaine des sciences du vivant, et en se limitant aux contextes restreints des bactéries et des virus. Son but est de déterminer, en passant par la constitution d un corpus, d éventuelles différences de conceptualisation métaphorique, tant en intralinguistique qu en interlinguistique. Déjeuner 3

DPC (Dutch Parallel Corpus) De 13h30 à 14h La composition et l exploitation d un corpus parallèle multilingue. Le cas du Dutch Parallel Corpus. Par Maribel Montero Perez, Hans Paulussen et Piet Desmet, KU Leuven. DPC (Dutch Parallel Corpus) est un corpus parallèle multilingue (néerlandais-français et néerlandais-anglais) de 10 millions de mots, enrichi d annotations linguistiques et aligné au niveau de la phrase. Le projet DPC a été piloté conjointement par la KU Leuven KULAK et la HoGent dans le cadre du programme STEVIN de l Union linguistique néerlandaise (Nederlandse Taalunie). Les corpus parallèles alignés sont le matériau de base indispensable à un grand nombre d applications, parmi lesquelles la traduction automatique, la traduction assistée par ordinateur, l extraction d information, l extraction de terminologie multilingue et l enseignement des langues assisté par ordinateur. Par ailleurs, des disciplines comme la linguistique descriptive et contrastive aussi bien que la traductologie profitent largement de l emploi de tels corpus. Dans cette présentation, nous offrirons d abord un aperçu des principales caractéristiques du corpus DPC et des principes qui sous-tendent sa composition. Ensuite, nous présenterons les étapes décisives lors du traitement des matériaux textuels, à savoir la normalisation, la standardisation et l enrichissement des textes. Par ailleurs, nous montrerons comment le corpus peut être consulté. Nous présenterons notre concordancier contrastif, qui est accessible comme interface web et qui permet à l utilisateur d exploiter le corpus à des fins de recherche, d enseignement et de développement. Le corpus DPC est aussi disponible en format XML, ce qui rend les données facilement exploitables en utilisant des scripts de programmation. Finalement, nous illustrerons l utilité d un tel corpus pour la linguistique descriptive aussi bien que pour la linguistique appliquée à travers quelques exemples concrets. 4

De 14h10 à 14h40 Le DPC au service de la linguistique contrastive du français et du néerlandais : trois études de cas. Par Gudrun Vanderbauwhede, UMONS, FTI-EII. L objectif de cette intervention est de montrer, à travers trois études de cas concrètes fondées sur une comparaison des emplois en français et en néerlandais, comment le Dutch Parallel Corpus offre une application quasi complète pour l analyse en matière de données, d outils et de méthodes dans les domaines de la linguistique contrastive et de la traductologie. Ces trois études, portant sur les adjectifs référentiels actuel et présent, les marqueurs discursifs en fait, en effet, de fait et en réalité, et le déterminant démonstratif, permettent en particulier de souligner l innovation du Dutch Parallel Corpus sur trois points : (i) la sélection, l alignement et l annotation des textes, (ii) l utilité immédiate de l interface web et (iii) la facilité d application de toutes sortes de méthodes quantitatives et qualitatives pour l analyse linguistique. De 14h40 à 15h L adjectif en français et en néerlandais dans les corpus de traduction : observations stylistiques, linguistiques et traductionnelles. Par Amandine Léonard, UMONS, FTI-EII. Ce travail consiste en une courte étude contrastive entre l emploi de l adjectif en français et en néerlandais. L étude est principalement basée sur les 50 premières pages du roman néerlandais De joodse Messias d Arnon Grunberg et sa traduction Le messie juif par Olivier Van Wersch-Cot ainsi que sur DPC (Dutch Parallel Corpus), un corpus de traduction de très haute qualité contenant dix millions de mots pour les paires de langues néerlandais-anglais et néerlandais-français présentant différents types de textes alignés au niveau de la phrase. L intérêt de cette recherche réside dans l observation des phénomènes de traduction en cas d incompatibilité de traduction littérale. Pour ce faire, nous nous approprions au préalable quelques références en la matière (notamment Zajicek 1973, Goes 1999 et Noailly 1999). Notre travail consiste en trois parties : l étude contrastive des adjectifs privatifs néerlandais affixés en -in, -loos et niet et leurs correspondants en français, la question de la traduisibilité dans le cas de l adjectif néerlandais et enfin, un aperçu des possibilités de traduction plus générales de l adjectif néerlandais à destination d étudiants en traduction. Pause 5

LANCOM (le français comme LANgue de COMmunication) De 15h30 à 16h15 Compétence interactionnelle en français langue étrangère : l éclairage du corpus Lancom. Par Danièle Flament-Boistrancourt, Université Paris Ouest Nanterre La Défense. (15h30-16h15) Le projet LANCOM (dir. M. M. Debrock, Université de Leuven, D. Flament, Université de Paris Ouest) a été une entreprise de constitution de corpus à visée à la fois didactique (rénovation de l enseignement du français en Belgique néerlandophone) et linguistique (contribution aux recherches sur corpus dans le domaine des interactions verbales et du français parlé). LANCOM est aujourd hui un corpus différentiel (natifs vs non-natifs) et automatisé d interactions verbales qui fait partie d un ensemble de plus d un million de mots disponible sur internet (http://bach. arts.kuleuven.ac.be/elicop). LANCOM a donné lieu à nombre de publications et de conférences (voir les pages internet de Flament : http://www.kuleuven-kortrijk. be/~dboistra et de Delahaie). De 16h15 à 16h45 Enseigner le français parlé : quelques résultats à partir du corpus Lancom. Par Juliette Delahaie, Université Paris Ouest Nanterre La Défense. (16h15-16h45) Le corpus Lancom offre de réelles avancées en matière d enseignement du français parlé en classe de FLE, non seulement au niveau des contenus à enseigner, mais aussi au niveau de l enseignement lui-même. C est ce que montre notre étude qualitative du discours didactique de quatre enseignants de FLE d écoles secondaires de Belgique flamande, filmés en 2006 lors de séances d évaluation des performances orales de leurs élèves. Nous verrons en effet que les erreurs pointées par les enseignants ne correspondent pas toujours à des structures syntaxiques, des unités grammaticales ou lexicales typiques du français parlé, mais qu elles renvoient souvent à une représentation traditionnelle de la grammaire, plutôt orientée vers des structures écrites de la langue. L exception notable d un enseignant, dont les évaluations sont résolument centrées sur les caractéristiques grammaticales du français parlé, nous permettra de montrer que ces résultats ne témoignent pas d un quelconque refus, de la part des enseignants, des approches communicative ou actionnelle. Ils peuvent en fait s expliquer par la présence encore trop faible de la grammaire du français parlé dans les manuels et la formation universitaire des futurs professeurs de FLE. 6

VALIBEL (VAriétés LInguistiques du français en BELgique) De 16h45 à 17h30 Le corpus oral VALIBEL : de la variation aux variétés. Par Alice Bardiaux, Université catholique de Louvain FNRS. La variation est inhérente au langage : cette variation de la langue, tout locuteur en fait l expérience dans sa pratique quotidienne et peut la constater dans toute situation de communication, d échange linguistique. Elle est perçue par les locuteurs qui construisent, à partir des différences perçues, des représentations et des jugements linguistiques. L on comprend dès lors que l étude de la variation occupe une place non négligeable dans le champ des disciplines s intéressant au langage et à son fonctionnement. Les travaux s intéressant à la variation tentent d en expliquer les ressorts, de dégager des régularités et, le cas échéant, d en proposer une modélisation. Quelle que soit la dimension linguistique ou extralinguistique au centre de l attention, l étude de la variation comporte un certain nombre de risques et de pièges méthodologiques. La présente communication propose une réflexion autour des notions liées à la variation et aux variétés linguistiques telles qu elles sont couramment utilisées dans les études empiriques afin d une part de mettre en évidence les défis et les risques méthodologiques que présentent les approches mobilisées dans ces études, et d autre part de souligner les implications sensiblement différentes de ces approches. Nous terminerons par une présentation de la base de données orales VALIBEL qui mettra l accent sur la méthodologie de constitution de ce corpus et ses atouts pour l étude de la variation et des variétés linguistiques en français. Cocktail de clôture 7

Plan d accès Université de Mons Campus Plaine de Nimy Avenue du Champs de Mars à 7000 Mons Bâtiment FTI-EII - salle polyvalente Pour tout renseignement 4 michel.berre@umons.ac.be 4 gudrun.vanderbauwhede@umons.ac.be 8