La traduction automatique : de la technologie aux traducteurs. Michel Mellinger Collaborations et transfert technologique CNRC-Gatineau



Documents pareils
Application Form/ Formulaire de demande

How to Login to Career Page

Instructions Mozilla Thunderbird Page 1

Editing and managing Systems engineering processes at Snecma

Fiche produit ifinance v4

PACKZ System Requirements. Version: Version: Copyright 2015, PACKZ Software GmbH. 1

lundi 3 août 2009 Choose your language What is Document Connection for Mac? Communautés Numériques L informatique à la portée du Grand Public

Relions les hommes à l entreprise Linking people to companies

HSCS 6.4 : mieux appréhender la gestion du stockage en environnement VMware et service de fichiers HNAS Laurent Bartoletti Product Marketing Manager

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

Compte-rendu technique complet et détaillé des cookies

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Forthcoming Database

: Machines Production a créé dès 1995, le site internet

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

AGROBASE : un système de gestion de données expérimentales

Bourses d excellence pour les masters orientés vers la recherche

SYSTRAN 7 Guide de démarrage

F1 Security Requirement Check List (SRCL)

Face Recognition Performance: Man vs. Machine

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

European IPR Helpdesk

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

La post-édition : l'avenir incontournable du traducteur?

MANAGEMENT SOFTWARE FOR STEEL CONSTRUCTION

TABLE DES MATIERES A OBJET PROCEDURE DE CONNEXION

Archived Content. Contenu archivé

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Petit guide pour l installation de CVW sous Linux

Cloud Computing: de la technologie à l usage final. Patrick CRASSON Oracle Thomas RULMONT WDC/CloudSphere Thibault van der Auwermeulen Expopolis

Stratégie DataCenters Société Générale Enjeux, objectifs et rôle d un partenaire comme Data4

Logiciel Libre & qualité. Présentation

D R A F T (a work in progress destined to always be incomplete, the way all dictionaries are, because people and languages constantly evolve )

EN UNE PAGE PLAN STRATÉGIQUE

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

CLOUD COMPUTING et Relation Client/Fournisseur Une Révolution culturelle?

Cycle Innovation & Connaissance 12 petit déjeuner Mardi 15 mai Cloud Computing & Green IT : nuages ou éclaircies?

Exemple PLS avec SAS

Compte-rendu technique complet et détaillé des cookies

Contents Windows

CEPF FINAL PROJECT COMPLETION REPORT

Logitech Tablet Keyboard for Windows 8, Windows RT and Android 3.0+ Setup Guide Guide d installation

Once the installation is complete, you can delete the temporary Zip files..

Arguments et exigences quelques exemples Arguments and demands some examples

Francoise Lee.

ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*

CONVENTION DE STAGE TYPE STANDART TRAINING CONTRACT

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

Qy y a-t-il de nouveau? NetSupport ServiceDesk v3

Aspects de droit anglais

Acce s aux applications informatiques Supply Chain Fournisseurs

NOM ENTREPRISE. Document : Plan Qualité Spécifique du Projet / Project Specific Quality Plan

Frequently Asked Questions

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Present Tense (1) masc = masculine fem = feminine sing = singular pl = plural

TRANSLATION & INTERPRETATION

Quick start. User guide TEAM EDITION

SHAREPOINT PORTAL SERVER 2013

calls.paris-neuroscience.fr Tutoriel pour Candidatures en ligne *** Online Applications Tutorial

ENOVIA 3DLive. IBM PLM Solutions 1 er Octobre Philippe Georgelin Sébastien Veret

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

APPENDIX 6 BONUS RING FORMAT

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

General Import Permit No. 13 Beef and Veal for Personal Use. Licence générale d importation n O 13 bœuf et veau pour usage personnel CONSOLIDATION

Academic Project. B2- Web Development. Resit Project. Version 1.0 Last update: 24/05/2013 Use: Students Author: Samuel CUELLA

USB 598. Quick Start Guide (Windows) Guide de démarrage rapide (Windows) USB Modem. Modem USB.

Tammy: Something exceptional happened today. I met somebody legendary. Tex: Qui as-tu rencontré? Tex: Who did you meet?

Stakeholder Feedback Form January 2013 Recirculation

Dans une agence de location immobilière...

Les Ontariens rejettent catégoriquement le projet de création d une école afrocentriste

COPYRIGHT 2014 ALCATEL-LUCENT. ALL RIGHTS RESERVED.

Stéphane Lefebvre. CAE s Chief Financial Officer. CAE announces Government of Canada participation in Project Innovate.

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Cedric Dumoulin (C) The Java EE 7 Tutorial

Soumission des articles pour l ICOFOM Study Series

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

Module de paiement Ogone pour Magento Commerce

Tech-savvy, multilingual problem solver with strong communication skills, an aptitude for organization, and a strategic mindset.

Projet de réorganisation des activités de T-Systems France

WEB page builder and server for SCADA applications usable from a WEB navigator

Telecharger gratuitement convertisseur de fichier word en pdf

Consultants en coûts - Cost Consultants

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

Business Process Management

La solution idéale de personnalisation interactive sur internet

France SMS+ MT Premium Description

AOC Insurance Broker Compare vos Assurances Santé Internationale Economisez jusqu à 40 % sur votre prime

THE SUBJUNCTIVE MOOD. Twenty-nineth lesson Vingt-neuvième leçon

Get Instant Access to ebook Cest Maintenant PDF at Our Huge Library CEST MAINTENANT PDF. ==> Download: CEST MAINTENANT PDF

SERVEUR DÉDIÉ DOCUMENTATION

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

Informatique / Computer Science

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

Formulaire d inscription (form also available in English) Mission commerciale en Floride. Coordonnées

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

Completed Projects / Projets terminés

Transcription:

La traduction automatique : de la technologie aux traducteurs Michel Mellinger Collaborations et transfert technologique CNRC-Gatineau

Plan Rappel TABR et TAS Rappel Fidélité et fluidité TABR + TAS +? scénarios de combinaisons, quelques exemples La TA au service des traducteurs professionnels?... la TABR, la TAS Constats et sujets d actualité en TAS

Plan > Rappel TABR et TAS Rappel Fidélité et fluidité TABR + TAS +? scénarios de combinaisons, quelques exemples La TA au service des traducteurs professionnels?... la TABR, la TAS Constats et sujets d actualité en TAS

Rappel TABR et TAS Les techniques de traduction automatique (TA) suivent l une de deux approches : - systèmes à base de règles (TABR) - systèmes statistiques (TAS) Question : quelle est la différence fondamentale entre ces deux approches?

Plan Rappel TABR et TAS > Rappel Fidélité et fluidité TABR + TAS +? scénarios de combinaisons, quelques exemples La TA au service des traducteurs professionnels?... la TABR, la TAS Constats et sujets d actualité en TAS

Rappel Fidélité et fluidité La performance d un système de TA est jugée selon deux aspects : fidélité et fluidité - fidélité... contenu = «s'attacher au texte de départ tout en respectant la destination de sa traduction» (Translation Journal, October 2001) St Jérôme : «c'est le sens qu'il faut rendre et tout le sens et non les mots» («Non verbum e verbo sed sensum exprimere de sensu») - fluidité... forme = la traduction du texte source se lit aisément

Rappel Fidélité et fluidité La TABR produit typiquement une bonne fluidité ; mais elle est difficilement adaptable à un domaine (limitée aux dictionnaires), donc fidélité «générique» La TAS vise à la fois une bonne fidélité (entraînement pour le domaine ciblé) et une bonne fluidité (utilisation de modèles de langue),... mais ceci dépend grandement de la qualité de l entraînement (corpus utilisés et soin apporté à l entraînement)

Plan Rappel TABR et TAS Rappel Fidélité et fluidité > TABR + TAS +? scénarios de combinaisons, quelques exemples La TA au service des traducteurs professionnels?... la TABR, la TAS Constats et sujets d actualité en TAS

TABR + TAS +? La combinaison de différents systèmes d aide à la traduction est un domaine de r-d très actif, qui vise à mettre à profit les caractéristiques complémentaires de ces systèmes 1. TABR améliorée par la TAS : = systèmes «hybrides» = «post-édition statistique/automatique» Exemple : «SYSTRAN Enterprise Server 7», dont la sortie a été annoncée en juin 2009...

TAS simple Paires <S,T> corpus d apprentissage texte source PORTAGE trad. auto

TAS pour PÉS utilisant la post-édition humaine Paires <TABR, PÉH> corpus d apprentissage texte source TABR TABR brute trad. PÉH

TAS pour PÉS utilisant la post-édition humaine Paires <TABR, PÉH> corpus d apprentissage trad. PÉH texte source TABR TABR brute Post-éditeur PORTAGE statistique trad. PÉS

TAS pour PÉS sans post-édition humaine Il est difficile d obtenir des corpus de TABR post-éditée par des traducteurs, mais nous pouvons utiliser un corpus habituel : on entraîne alors la TAS à traduire une sortie TABR de la source connaissant la traduction faite indépendamment par un traducteur et ça marche! Texte source S SYSTRAN TABR --------------- ------------- -------------- ---------- Post-éditeur statistique T T Traduction PORTAGE

TAS pour PÉS sans post-édition humaine Il est difficile d obtenir des corpus de TABR post-éditée par des traducteurs, mais nous pouvons utiliser un corpus habituel : on entraîne alors la TAS à traduire une sortie TABR de la source connaissant la traduction faite indépendamment par un traducteur et ça marche! Texte source S SYSTRAN TABR --------------- ------------- -------------- ---------- Post-éditeur statistique trad. PÉS etc.

TABR + TAS +? SYSTRAN Enterprise Server 7 Présentation (site Web) de SYSTRAN Enterprise Server 7 : «Premier moteur de traduction «hybride» du marché qui combine les qualités de la technologie à base de règles ( rule-based ) et du traitement statistique. «Nouveaux outils : SYSTRAN Training Manager permet aux entreprises d entraîner le logiciel pour lui apprendre la terminologie spécifique de l entreprise. SYSTRAN Corpus Manager permet de collecter et gérer les contenus utilisés dans l entraînement statistique. Nouvelle interface de révision des traductions intégrée au Translation Project Manager pour une meilleure productivité en post-édition.»

TABR + TAS +? SYSTRAN Enterprise Server 7 «Comprendre en temps réel [ compréhension = TABR ] «Produire rapidement des traductions cohérentes. Des outils puissants de révision et d'assurance-qualité aident à contrôler la qualité et l'homogénéité des traductions. [? ] «Réduire les coûts de traduction. Les traducteurs peuvent augmenter considérablement leur productivité en révisant les traductions SYSTRAN pour produire leurs traductions finales.» [ grâce à la TAS : post-édition productive ] «Réutiliser et collaborer. Les bases terminologiques et les traductions déjà validées sont stockées sur le serveur.» [ fonction de mémoire de traduction? ]

TABR + TAS +? SYSTRAN Enterprise Server 7 «Personnaliser pour une entreprise ou un secteur d'activité. Le module d'entraînement permet d'apprendre au logiciel la terminologie spécifique à chaque client et d'améliorer ainsi considérablement la qualité de la traduction. [ TAS >> TABR réf. fidélité dans un domaine spécifique ] «Accroître la productivité. Workflow efficaces pour la traduction, la création de terminologie et la post-édition. [ aspects intégration système ] «Traiter les volumes. Déploiement sur plusieurs serveurs,... Intégrer la traduction dans toutes les applications métiers de l'entreprise.» [ intégration dans l environnement applicatif du client ]

TABR + TAS +? 1. TABR améliorée par la TAS 2. TABR au secours des mémoires de traduction : la TABR intervient lorsque les correspondances sont < seuil x% Exemple : étude de cas de SYSTRAN concernant leur projet avec Symantec...

TABR + TAS +? SYSTRAN chez Symantec SYSTRAN : «Dans Idiom WorldServer, le Fuzzy Score est défini à 75%. SYSTRAN traduit automatiquement les segments situés en dessous de ce seuil. Les traducteurs révisent les segments colorés dans l'interface Browser Workbench.» Symantec : «Nos indicateurs affichent une augmentation de 100% du volume géré par notre équipe interne de traduction depuis l'introduction des technologies SYSTRAN dans notre workflow de localisation. La traduction automatique est une innovation très performante lorsqu'elle est intégrée dans un flux de travail rationalisé.»

TABR + TAS +? 1. TABR «corrigée par» la TAS 2. TABR au secours des mémoires de traduction (TABR lorsque les correspondances sont < seuil x%) 3. TAS au secours des mémoires de traduction : la TAS est intégrée à l intérieur même d un environnement de mémoire de traduction Exemple : travaux actuels au CNRC (incluant les «estimations de confiance» TAS vs. MT)

Plan Rappel TABR et TAS Rappel Fidélité et fluidité TABR + TAS +? scénarios de combinaisons, quelques exemples > La TA au service des traducteurs professionnels?... la TABR, la TAS Constats et sujets d actualité en TAS

La TA au service des traducteurs professionnels? < la TABR > La TABR n a guère réussi à s imposer aux traducteurs professionnels et elle n évolue plus ou peu d elle-même : l effort requis n est pas rentable, mais la TABR peut néanmoins fournir une traduction suffisamment compréhensible. Exemple : étude de cas de SYSTRAN concernant leur projet avec le Lincolnshire County Council

La TA au service des traducteurs professionnels? < la TABR > Lincolnshire County Council (réf. la TABR SYSTRAN ) : «We quickly concluded that whilst manual translations by a specialist translator or translation agency would be more grammatically perfect, with around 10,000 documents and 10 languages to address, the cost would be astronomic. To date, the quality of output has been good. We were never naive enough to believe that our pages would be as fluent or literal as a manual translation, but if visitors understand enough of the web content to get a flavour of its meaning, then there can be no argument for not using it.»

La TA au service des traducteurs professionnels? < la TABR > PAHO (Pan American Health Organization) a développé un environnement «élargi» autour de son système de TABR et utilise la TABR en production; leur système, appelé PAHOMTS est un système convivial qui évolue grâce à l intégration des traducteurs dans le contrôle de qualité : «PAHOMTS is a fully automatic Machine Translation (MT) program, developed and maintained by PAHO's computational linguists, translators, and programmers. «The translation unit has used PAHOMTS to process over 88 million words since 1980. Staff and freelance translators postedit the raw output to produce high-quality translations with a 30-50% gain in productivity.»

La TA au service des traducteurs professionnels? < la TABR > PAHOMTS... «The software includes a completely trilingual graphical user interface. The extensive context-sensitive online Help in English, Spanish, and Portuguese simplifies the process of browsing and updating the PAHOMTS dictionaries. Each of the MT dictionaries contains over 150,000 words, phrases, and context-sensitive rules. Both the programs and the dictionaries are constantly being enhanced based on feedback from the users of the systems.»

La TA au service des traducteurs professionnels? < la TABR > PAHOMTS... Cycle d amélioration continue chez PAHO : rétroaction de la part des traducteurs : les traducteurs participants sont une source d amélioration continue équipe de linguistes : est-ce que les difficultés observées sont systématiques et pourraient être exprimées en règles plus ou moins générales, ou spécifiques? équipe de programmeurs : implantation d améliorations selon les instructions des linguistes (= nouvelles règles) équipe de linguistes : validation des améliorations avec les traducteurs participants

La TA au service des traducteurs professionnels? < la TAS > La TAS a dépassé la TABR en performance et évolue vers des résultats «post-éditables», mais : - (négatif) la mise en œuvre de la TAS n est pas simple : la phase d entraînement est cruciale et requiert un degré avancé d expertise : = TI (environnement TI, virtualisation, TI distribuée), = collecte et gestion de grands corpus multilingues (plusieurs dizaines/centaines de millions de mots), = linguistique computationnelle (pré-traitement de corpus), = compréhension de l univers de la traduction, excellent service technique et excellent service aux traducteurs.

La TA au service des traducteurs professionnels? < la TAS > La TAS a dépassé la TABR en performance et évolue vers des résultats «post-éditable», mais... - (positif) les progrès de la TAS sont constants et les traducteurs professionnels commencent à l adopter Exemples : Google Translate, essais PORTAGE - (positif) les techniques de post-édition sont en plein développement Exemple... ici, à l UQO! - (positif ou négatif?!) le métier de traducteur va évoluer en conséquence... Question : qu en pensez-vous?

Plan Rappel TABR et TAS Rappel Fidélité et fluidité TABR + TAS +? scénarios de combinaisons, quelques exemples La TA au service des traducteurs professionnels?... la TABR, la TAS > Constats et sujets d actualité en TAS

Constats et sujets d actualité en TAS (Réf. Roland Kuhn et Pierre Isabelle, MT Summit XII, Ottawa, 2009) - de plus en plus de recherche par des laboratoires de plus en plus nombreux à travers le monde - des logiciels libres fournissent aux chercheurs un environnement ouvert de TAS (essentiellement «Moses») - Google Translate est devenu l étalon en traduction disponible publiquement ; il est utilisé assez largement par les étudiants... et par certains traducteurs - la qualité de la TAS est maintenant acceptable, et on peut envisager une post-édition productive, pour certains couples de langues : En-Fr, En-Sp

Constats et sujets d actualité en TAS (Réf. Roland Kuhn et Pierre Isabelle, MT Summit XII, Ottawa, 2009) - la combinaison de systèmes TAS + TABR est efficace (la TABR contribue une base de connaissance linguistique) - la collecte de grands corpus bilingues et multilingues s accélère : Exemples : Hansard (historique), GC.CA (En-Fr), sites Web EU (23 langues), GigaFrEn (En 575 M mots, Fr 672M mots) - introduction de concepts syntaxiques dans les systèmes de TAS : entraînement contraint par la décomposition syntaxique des phrases / entraînement de TAS sur des arbres syntaxiques puis recomposition

Constats et sujets d actualité en TAS (Réf. Roland Kuhn et Pierre Isabelle, MT Summit XII, Ottawa, 2009) - intérêts variés dans le choix des langues et couples de langues : États-unis : chi, ara, urd, pus,... VERS l anglais Europe : langues européennes (diverses directions) Asie : langues asiatiques Microsoft et autres multinationales = eng comme source chi => eng est de plus en plus populaire en recherche Question : comment définir la «qualité» en traduction? Et comment mesurer la «qualité» d une traduction?

La traduction automatique : de la technologie aux traducteurs un peu démystifiée?

La traduction automatique : de la technologie aux traducteurs un peu démystifiée? Merci pour votre attention! Questions? Commentaires?