Extracting (good) discourse examples from an oral specialised corpus of wine tasting interactions

Documents pareils
Completed Projects / Projets terminés

Instructions Mozilla Thunderbird Page 1

UN PEU DE VOTRE CŒUR EST TOUJOURS À LYON... A PIECE OF YOUR HEART IS FOREVER IN LYON...

04/05/2011 Amundi Liquidity A creative market introduction Date

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

Application Form/ Formulaire de demande

Guide d'installation rapide TFM-560X YO.13

Jean-Philippe DANGLADE

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

Cliquez pour modifier les styles du texte du masque

MANAGEMENT SOFTWARE FOR STEEL CONSTRUCTION

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

ETUI Formation Cours de langues et de communication. Devenir un communicateur efficace dans le monde syndical

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

AOC Insurance Broker Compare vos Assurances Santé Internationale Economisez jusqu à 40 % sur votre prime

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Bourses d excellence pour les masters orientés vers la recherche

Contents Windows

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

TABLE DES MATIERES A OBJET PROCEDURE DE CONNEXION

We Generate. You Lead.

Summer School * Campus d été *

POSITION DESCRIPTION DESCRIPTION DE TRAVAIL

UNIVERSITE DE YAOUNDE II

Notice Technique / Technical Manual

SERVEUR DÉDIÉ DOCUMENTATION

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

PRODUCTS LIST (updated 11th January 2010)

Le projet WIKIWATER The WIKIWATER project

How to Login to Career Page

La solution idéale de personnalisation interactive sur internet

EMPLOYMENT OPPORTUNITY

D E S C R I P T I O N D E S É L É M E N T S C L E F S D ' U I M A

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

Editing and managing Systems engineering processes at Snecma

RAPID Prenez le contrôle sur vos données

Relions les hommes à l entreprise Linking people to companies

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Plateforme Technologique Innovante. Innovation Center for equipment& materials

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

Fonctions intégrées. Nouvelles solutions universelles & système de communication

AGROBASE : un système de gestion de données expérimentales

Tier 1 / Tier 2 relations: Are the roles changing?

«Rénovation des curricula de l enseignement supérieur - Kazakhstan»

GIGABIT PCI DESKTOP ADAPTER DGE-530T. Quick Installation Guide+ Guide d installation+

1 Description générale. Résumé

PLM 2.0 : Mise à niveau et introduction à l'offre version 6 de Dassault systèmes

BNP Paribas Personal Finance

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

Préconisations pour une gouvernance efficace de la Manche. Pathways for effective governance of the English Channel

valentin labelstar office Made-to-measure label design. Conception des étiquettes sur mesure. Quality. Tradition. Innovation DRUCKSYSTEME

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

SHAREPOINT PORTAL SERVER 2013

Programming Server-Side Web Applications with Object-Oriented PHP NC Group Syllabus. Duration: 75 hours 1-2-2

Institut Supérieur Africain d Enseignement Managérial et Technologique

PEINTAMELEC Ingénierie

Geoffrey Clive WILLIAMS.

INGÉNIEUR LOGICIEL JAVAEE / GROOVY 8 ANS D EXPÉRIENCE

Dafoe Présentation de la plate-forme UIMA

L installation a quelque peu changée depuis les derniers tutos, voici une actualisation.

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Comment Accéder à des Bases de Données MySQL avec Windows lorqu'elles sont sur un Serveur Linux

E 2 O : Oracle Enterprise 2.0

Informatique / Computer Science

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Compléter le formulaire «Demande de participation» et l envoyer aux bureaux de SGC* à l adresse suivante :

Institut d Acclimatation et de Management interculturels Institute of Intercultural Management and Acclimatisation

Projet de Master en Informatique: Web WriteIt!

Mon Odyssée Lean Startup

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

F1 Security Requirement Check List (SRCL)

lundi 3 août 2009 Choose your language What is Document Connection for Mac? Communautés Numériques L informatique à la portée du Grand Public

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Forthcoming Database

COULEE D ALLIAGES METALLIQUES : MODELISATION DES STRUCTURES ET SEGREGATIONS CHIMIQUES

Roger Barbeau Spécialiste en technologie

1-Introduction 2. 2-Installation de JBPM 3. 2-JBPM en action.7

Comment Créer une Base de Données Ab Initio

Nice. Convention Bureau

Cedric Dumoulin (C) The Java EE 7 Tutorial

Gouvernance IT : par où commencer? Hubert Lalanne DE, Chief Architect for Industries IBM Software France

Summary / Sommaire. 1 Install DRIVER SR2 USB01 Windows seven 64 bits / Installation du DRIVER SR2 USB01 Windows seven 64 bits 2

L hypertexte, le multimédia, c est quoi?

Must Today s Risk Be Tomorrow s Disaster? The Use of Knowledge in Disaster Risk Reduction

THE OUAGADOUGOU RECOMMENDATIONS INTERNET INFRASTRUCTURE FOR AN AFRICAN DIGITAL ECONOMY 5-7 MARCH 2012

Contrôle d'accès Access control. Notice technique / Technical Manual

Petit guide pour l installation de CVW sous Linux

Gestion des prestations Volontaire

THALES et le Logiciel Libre

Francoise Lee.

e-leadership for the Digital Economy

Anticiper et prédire les sinistres avec une approche Big Data

Digital Marketing : 14 et 15 septembre Retargeting : Garder le contact avec son audience

L évaluation de la qualité d un dispositif d apprentissage en ligne. Quelles traces mobiliser? Comment les interpréter?

L art d ordonnancer. avec JobScheduler. François BAYART

Pratiques induites par les réunions à distance : discours, identités et organisation des actions

Introduction de la journée

pythonocc: une plateforme de développement agile d applications CAO.

Transcription:

UNIVERSITE DE BOURGOGNE Extracting (good) discourse examples from an oral specialised corpus of wine tasting interactions Patrick Leroyer 1, Arnaud Millereux 2, Hedi Maazaoui 3, Laurent Gautier 4 1 Aarhus University, Jens Chr. Skous Vej 4, DK-8000 Aarhus 2 Université de Bourgogne, 6 esplanade Erasme, BP 26 611, F-21066 Dijon Cedex 3 Université de Bourgogne, 6 esplanade Erasme, BP 26 611, F-21066 Dijon Cedex 4 Université de Bourgogne, 6 esplanade Erasme, BP 26 611, F-21066 Dijon Cedex ENeL Herstmonceux 13 August 2015

The Oenolex dictionary of wine-tasting Commissioned by the wine-industry of Burgundy For experts (teaching wine-tasting) and non-experts (learning wine-tasting) Industrial information tool: What do they say about our wines? What do we say? Corpus of oral interactions: wine-tasting courses, fairs, wineries o In-house entries and expertise labelling (expert/non-expert) o Definitions and collocations o Examples/audio files o Links Work in progress EneL Herstmonceux, WG3, 13 August 2015 Leroyer, Millereux, Maazaoui, Gautier

Data recording and processing TASCAM DR-07 MKI digital recorder. Data format = French standards for Digital Humanities (Huma-Num 2015). Uncompressed 24-bit/96 khz WAV; AUDACITY software for deleting irrelevant data Preservation of spontaneous discourse (no noise reduction, clipping or signal amplification); orthographic transcription with annotation of turn takings, overlaps, pauses, non-verbal productions, etc. Data processing with SONAL : transcription formatting, synchronisation of transcription and speech-data, annotation and tagging of segments Double tagging: themes ( process, action, definition, ) and discourse markers EneL Herstmonceux, WG3, 13 August 2015 Leroyer, Millereux, Maazaoui, Gautier

Discourse markers phases, directives, negatives On va continuer la dégustation par un Bourgogne Aligoté 2012.; Au premier nez, on est sur des fruits plus mûrs, on n est pas sur le côté citronné, agrume, mais sur le côté prune. le vin a vieilli, mais il a vieilli combien? C est ça la question, chauffez-le bien dans vos mains. On n est pas sur le côté citron, agrume, mais sur le côté prune. EneL Herstmonceux, WG3, 13 August 2015 Leroyer, Millereux, Maazaoui, Gautier

Data management system Language: Java v8, XML and XSL(T) IDE: NetBeans v8.0.2 Frameworks : Java Server Faces v2.2, Prime Faces v5.x Linux Debian 7 (Wheezy) 64 bits Apache Tomcat 8.x RDBMS : MySQL 5.x EneL Herstmonceux, WG3, 13 August 2015 Leroyer, Millereux, Maazaoui, Gautier

Workflows Event Tagging Data automation Interview Audio warp and annotation Converters Audio recording Transcription Publish and browse EneL Herstmonceux, WG3, 13 August 2015 Leroyer, Millereux, Maazaoui, Gautier

Data acquisition, access and display Data provided by Sonal 1.9.3 and exported to convenient format Correction of output files for syntax errors. Errors are localized during content analysis and simplify next automation treatments Conversion to flat standard XML, and XML/TEI open format Access to audio data through linking of associated lemmas in transcription corpus and dictionary Interactively retrieved by search engine (buttons and links) Dynamically added to web pages EneL Herstmonceux, WG3, 13 August 2015 Leroyer, Millereux, Maazaoui, Gautier

Search engine and nodes Data storage according to predefined lexicographic scheme by project team and computing managers Development of semantic web techniques Nodes: transcription sequences lemmas audio segments Connections using XML and automatically built-in annotations during data import with dictionary data help

In short Corpus at heart of dictionary = fully fledged functional component Discourse examples = knowledge of discourse = central data category Lemmas are access nodes

2 search modes wine-tasting term or wine (AOC) Term = citron AOC = bourgogne

Thank you for your attention pl@asb.dk Arnaud.Millereux@u-bourgogne.fr Laurent.gautier@u-bourgogne.fr Hedi.Maazaoui@u-bourgogne.fr

Literature Books: Gunnarsson, B. L. (2009). Professional Discourse. London: Continuum. Book sections: Gautier, L. & Leroyer, P. (2015). Construction, communication, représentation et réappropriation des discours vitivinicoles dans un nuancier lexicographique en ligne. In C. Condei et al. (eds). Situations professionnelles, discours et interactions en traduction spécialisée. Berlin: Frank und Timme, in press. Meyer, I. (2001). Extracting knowledge-rich contexts for terminography. In D. Bourigault et al. (eds.) Recent Advances in Computational Terminology. Amsterdam/Philadelphia: Benjamins, pp. 279 302. Paper in conference proceedings: Leroyer, P. & Valentina, H. & Maazaoui, H. & Chevalier, F. & Gautier, L. (2015). Faire déguster et parler de son vin pour le faire aimer et le vendre : quelques stratégies dans des interactions producteur-client. Actes de International Wine Symposium of Toulouse, Université Toulouse Jean Jaurès. Websites: Audacity. Accessed at: http://www.audacity.fr (25 May 2015) Guide méthodologiques pour le choix de formats numériques pérennes dans un contexte de données orales et visuelles. Accessed at http://www.huma-num.fr/ressources/guides (25 May 2015) Guide des bonnes pratiques du numérique. Accessed at http://www.huma.num.fr/ressources/guides (25 May 2015) Michelfeit, J. GDEX in Sketch Engine. ENeL 12 February 2015, WG3, Vienna, Accessed at : http://www.elexicography.eu/working-groups/working-group-3/wg3-workshops/automatic-extraction-of-gooddictionary-examples/ (25 May 2015) Sonal. Accessed at http://www.sonal-info.com (25 May 2015) Journal articles: Gautier, L. & Hohota, V. (2014). Construire et exploiter un corpus oral de situations de dégustation : l exemple d OenoLexBourgogne. Studia Universitatis Babes-Bloyai, Philologia 59/4, pp.157-173. Leroyer. P. (2013). Proposals for the Design of Integrated Online Wine Industry Dictionaries. Lexikos 23, pp. 1-18. Teubert, W. (1996). Comparable or Parallel Corpora? IJL 9/3, pp.238-264. Dictionaries: Bottlenotes. Wine glossary and encyclopedia. Accessed at : http://www.bottlenotes.com/winecyclopedia/glossary (13 May 2015) Coutier, M. (2011). Dictionnaire de la langue du vin. Paris: CNRS Editions.