Plan d accès Université de Mons Campus Plaine de Nimy Avenue du Champs de Mars à 7000 Mons Bâtiment FTI-EII - salle polyvalente Le Service Cultures & Médiations linguistiques (FTI-EII) propose une journée d étude Corpus de textes écrits et oraux Quels usages pour la recherche? 4 en linguistique 4 en traduction 4 en littérature 4 en didactique Lundi 31 mars 2014 Campus plaine de Nimy, avenue du Champ de Mars, 7000 Mons, bâtiment FTI-EII, salle polyvalente
Programme 08h30-9h Accueil des participants et mot de bienvenue des autorités académiques 9h - 10h30 Frantext : un corpus et des outils de recherche 4 Présentation générale et mode de fonctionnement, par Véronique Montémont (Université de Lorraine / ATILF Analyse et Traitement Informatique de la Langue Française) 45 4 Exemples de recherches possibles, par Véronique Montémont (Université de Lorraine / ATILF Analyse et Traitement Informatique de la Langue Française) 45 10h30-11h Pause 11h - 12h British National Corpus 4 Présentation, contenu et fonctionnalités du BNC : le point de vue des utilisateurs, par Christine Michaux (UMONS, FTI-EII, chef du Service de Terminologie & traduction spécialisée) 30 4 Corpus et études de cas : la conceptualisation métaphorique des bactéries et des virus en français et en anglais, par Christine Michaux et Alessandra Dubois (UMONS, FTI- EII) 30 12h - 13h30 Repas en commun Accès gratuit. Inscription obligatoire pour le jeudi 27 mars au plus tard. 13h30-15h DPC (Dutch Parallel Corpus) 4 La composition et l exploitation d un corpus parallèle multilingue. Le cas du Dutch Parallel Corpus, par Maribel Montero Perez, Hans Paulussen & Piet Desmet (KU Leuven) 40 4 Le DPC au service de la linguistique contrastive du français et du néerlandais : trois études de cas, par Gudrun Vanderbauwhede (UMONS, FTI-EII) 30 4 L adjectif en français et en néerlandais dans les corpus de traduction : observations stylistiques, linguistiques et traductionnelles, par Amandine Léonard (UMONS, FTI-EII) 20 15h - 15h30 Pause 15h30-16h45 LANCOM (le français comme LANgue de COMmunication) 4 Compétence interactionnelle en français langue étrangère: l éclairage du corpus Lancom, par Danièle Flament- Boistrancourt (Université Paris Ouest Nanterre La Défense) 45 4 Enseigner le français parlé : quelques résultats à partir du corpus Lancom, par Juliette Delahaie (Université Paris Ouest Nanterre La Défense) 30 16h45-17h30 VALIBEL (VAriétés LInguistiques du français en BELgique) 4 Le corpus oral VALIBEL : de la variation aux variétés, par Alice Bardiaux, (Université catholique de Louvain FNRS) 45 Cocktail de clôture Personnes de contact : 4 michel.berre@umons.ac.be 4 gudrun.vanderbauwhede@umons.ac.be
Journée d études Corpus de textes écrits et oraux Quels usages pour la recherche? 4 en linguistique 4 en traduction 4 en littérature 4 en didactique Lundi 31 mars 2014 Campus plaine de Nimy, avenue du Champ de Mars, 7000 Mons, bâtiment FTI-EII, salle polyvalente 1
Programme Frantext : un corpus et des outils de recherche. De 9h à 10h30 Présentation générale et mode de fonctionnement. Par Véronique Montémont, Université de Lorraine / ATILF Analyse et Traitement Informatique de la Langue Française. Cette communication présentera Frantext, l une des plus anciennes base de données numériques avec Gutenberg. Créée pour servir de réservoir d exemple à un dictionnaire, cette base a évolué vers le grand public, fournissant à la fois un corpus échantillonné et des outils de recherches. Depuis 2000, Frantext a subi une importante modernisation, liée au contexte concurrentiel des grandes bases de données numériques telles Google Livres ou Gallica ; elle a dû aussi faire face à une interprétation de plus en plus restrictive de la législation appliquée au droit d auteur quand il s agit de numérique. Nous retracerons les grandes lignes de cette évolution et des améliorations sur lesquelles elle a débouché. Cette présentation générale sera suivie d un exposé sur les outils proposés et leur application à différents types de recherche, en linguistique et en littérature. Ces exemples seront l occasion de s interroger sur l apport, au regard de la recherche, de ces bases de données numériques, et de proposer quelques pistes herméneutiques quant à leur usage. Pause 2
British National Corpus De 11h à 11h30 Présentation, contenu et fonctionnalités du BNC : le point de vue des utilisateurs. Par Christine Michaux, UMONS, FTI-EII, chef du Service de Terminologie & traduction spécialisée. Le British National Corpus est un corpus d anglais britannique d une taille de 100 millions de mots puisés dans des sources tant orales qu écrites. Il est un incontournable pour toute recherche sur la langue anglaise britannique contemporaine. Le but de l exposé est de familiariser le public avec les outils de recherche du BNC afin d en démontrer le potentiel. De 11h30 à 12h Corpus et études de cas : la conceptualisation métaphorique des bactéries et des virus en français et en anglais. Par Christine Michaux et Alessandra Dubois, UMONS, FTI-EI. La métaphore est un phénomène très courant en langue de spécialité. Dans les textes écrits par des experts pour des experts, la métaphore joue un rôle constitutif : elle sert à élaborer les théories en asseyant leurs concepts fondamentaux. Dans les textes de vulgarisation scientifique, la métaphore aide à expliciter des phénomènes complexes auprès de lecteurs non-experts. Le projet de recherche qui sera exposé se concentre sur l usage de la métaphore dans des textes de vulgarisation scientifique, dans le domaine des sciences du vivant, et en se limitant aux contextes restreints des bactéries et des virus. Son but est de déterminer, en passant par la constitution d un corpus, d éventuelles différences de conceptualisation métaphorique, tant en intralinguistique qu en interlinguistique. Déjeuner 3
DPC (Dutch Parallel Corpus) De 13h30 à 14h La composition et l exploitation d un corpus parallèle multilingue. Le cas du Dutch Parallel Corpus. Par Maribel Montero Perez, Hans Paulussen et Piet Desmet, KU Leuven. DPC (Dutch Parallel Corpus) est un corpus parallèle multilingue (néerlandais-français et néerlandais-anglais) de 10 millions de mots, enrichi d annotations linguistiques et aligné au niveau de la phrase. Le projet DPC a été piloté conjointement par la KU Leuven KULAK et la HoGent dans le cadre du programme STEVIN de l Union linguistique néerlandaise (Nederlandse Taalunie). Les corpus parallèles alignés sont le matériau de base indispensable à un grand nombre d applications, parmi lesquelles la traduction automatique, la traduction assistée par ordinateur, l extraction d information, l extraction de terminologie multilingue et l enseignement des langues assisté par ordinateur. Par ailleurs, des disciplines comme la linguistique descriptive et contrastive aussi bien que la traductologie profitent largement de l emploi de tels corpus. Dans cette présentation, nous offrirons d abord un aperçu des principales caractéristiques du corpus DPC et des principes qui sous-tendent sa composition. Ensuite, nous présenterons les étapes décisives lors du traitement des matériaux textuels, à savoir la normalisation, la standardisation et l enrichissement des textes. Par ailleurs, nous montrerons comment le corpus peut être consulté. Nous présenterons notre concordancier contrastif, qui est accessible comme interface web et qui permet à l utilisateur d exploiter le corpus à des fins de recherche, d enseignement et de développement. Le corpus DPC est aussi disponible en format XML, ce qui rend les données facilement exploitables en utilisant des scripts de programmation. Finalement, nous illustrerons l utilité d un tel corpus pour la linguistique descriptive aussi bien que pour la linguistique appliquée à travers quelques exemples concrets. 4
De 14h10 à 14h40 Le DPC au service de la linguistique contrastive du français et du néerlandais : trois études de cas. Par Gudrun Vanderbauwhede, UMONS, FTI-EII. L objectif de cette intervention est de montrer, à travers trois études de cas concrètes fondées sur une comparaison des emplois en français et en néerlandais, comment le Dutch Parallel Corpus offre une application quasi complète pour l analyse en matière de données, d outils et de méthodes dans les domaines de la linguistique contrastive et de la traductologie. Ces trois études, portant sur les adjectifs référentiels actuel et présent, les marqueurs discursifs en fait, en effet, de fait et en réalité, et le déterminant démonstratif, permettent en particulier de souligner l innovation du Dutch Parallel Corpus sur trois points : (i) la sélection, l alignement et l annotation des textes, (ii) l utilité immédiate de l interface web et (iii) la facilité d application de toutes sortes de méthodes quantitatives et qualitatives pour l analyse linguistique. De 14h40 à 15h L adjectif en français et en néerlandais dans les corpus de traduction : observations stylistiques, linguistiques et traductionnelles. Par Amandine Léonard, UMONS, FTI-EII. Ce travail consiste en une courte étude contrastive entre l emploi de l adjectif en français et en néerlandais. L étude est principalement basée sur les 50 premières pages du roman néerlandais De joodse Messias d Arnon Grunberg et sa traduction Le messie juif par Olivier Van Wersch-Cot ainsi que sur DPC (Dutch Parallel Corpus), un corpus de traduction de très haute qualité contenant dix millions de mots pour les paires de langues néerlandais-anglais et néerlandais-français présentant différents types de textes alignés au niveau de la phrase. L intérêt de cette recherche réside dans l observation des phénomènes de traduction en cas d incompatibilité de traduction littérale. Pour ce faire, nous nous approprions au préalable quelques références en la matière (notamment Zajicek 1973, Goes 1999 et Noailly 1999). Notre travail consiste en trois parties : l étude contrastive des adjectifs privatifs néerlandais affixés en -in, -loos et niet et leurs correspondants en français, la question de la traduisibilité dans le cas de l adjectif néerlandais et enfin, un aperçu des possibilités de traduction plus générales de l adjectif néerlandais à destination d étudiants en traduction. Pause 5
LANCOM (le français comme LANgue de COMmunication) De 15h30 à 16h15 Compétence interactionnelle en français langue étrangère : l éclairage du corpus Lancom. Par Danièle Flament-Boistrancourt, Université Paris Ouest Nanterre La Défense. (15h30-16h15) Le projet LANCOM (dir. M. M. Debrock, Université de Leuven, D. Flament, Université de Paris Ouest) a été une entreprise de constitution de corpus à visée à la fois didactique (rénovation de l enseignement du français en Belgique néerlandophone) et linguistique (contribution aux recherches sur corpus dans le domaine des interactions verbales et du français parlé). LANCOM est aujourd hui un corpus différentiel (natifs vs non-natifs) et automatisé d interactions verbales qui fait partie d un ensemble de plus d un million de mots disponible sur internet (http://bach. arts.kuleuven.ac.be/elicop). LANCOM a donné lieu à nombre de publications et de conférences (voir les pages internet de Flament : http://www.kuleuven-kortrijk. be/~dboistra et de Delahaie). De 16h15 à 16h45 Enseigner le français parlé : quelques résultats à partir du corpus Lancom. Par Juliette Delahaie, Université Paris Ouest Nanterre La Défense. (16h15-16h45) Le corpus Lancom offre de réelles avancées en matière d enseignement du français parlé en classe de FLE, non seulement au niveau des contenus à enseigner, mais aussi au niveau de l enseignement lui-même. C est ce que montre notre étude qualitative du discours didactique de quatre enseignants de FLE d écoles secondaires de Belgique flamande, filmés en 2006 lors de séances d évaluation des performances orales de leurs élèves. Nous verrons en effet que les erreurs pointées par les enseignants ne correspondent pas toujours à des structures syntaxiques, des unités grammaticales ou lexicales typiques du français parlé, mais qu elles renvoient souvent à une représentation traditionnelle de la grammaire, plutôt orientée vers des structures écrites de la langue. L exception notable d un enseignant, dont les évaluations sont résolument centrées sur les caractéristiques grammaticales du français parlé, nous permettra de montrer que ces résultats ne témoignent pas d un quelconque refus, de la part des enseignants, des approches communicative ou actionnelle. Ils peuvent en fait s expliquer par la présence encore trop faible de la grammaire du français parlé dans les manuels et la formation universitaire des futurs professeurs de FLE. 6
VALIBEL (VAriétés LInguistiques du français en BELgique) De 16h45 à 17h30 Le corpus oral VALIBEL : de la variation aux variétés. Par Alice Bardiaux, Université catholique de Louvain FNRS. La variation est inhérente au langage : cette variation de la langue, tout locuteur en fait l expérience dans sa pratique quotidienne et peut la constater dans toute situation de communication, d échange linguistique. Elle est perçue par les locuteurs qui construisent, à partir des différences perçues, des représentations et des jugements linguistiques. L on comprend dès lors que l étude de la variation occupe une place non négligeable dans le champ des disciplines s intéressant au langage et à son fonctionnement. Les travaux s intéressant à la variation tentent d en expliquer les ressorts, de dégager des régularités et, le cas échéant, d en proposer une modélisation. Quelle que soit la dimension linguistique ou extralinguistique au centre de l attention, l étude de la variation comporte un certain nombre de risques et de pièges méthodologiques. La présente communication propose une réflexion autour des notions liées à la variation et aux variétés linguistiques telles qu elles sont couramment utilisées dans les études empiriques afin d une part de mettre en évidence les défis et les risques méthodologiques que présentent les approches mobilisées dans ces études, et d autre part de souligner les implications sensiblement différentes de ces approches. Nous terminerons par une présentation de la base de données orales VALIBEL qui mettra l accent sur la méthodologie de constitution de ce corpus et ses atouts pour l étude de la variation et des variétés linguistiques en français. Cocktail de clôture 7
Plan d accès Université de Mons Campus Plaine de Nimy Avenue du Champs de Mars à 7000 Mons Bâtiment FTI-EII - salle polyvalente Pour tout renseignement 4 michel.berre@umons.ac.be 4 gudrun.vanderbauwhede@umons.ac.be 8