Évaluation de G-LexAr pour la traduction automatique statistique



Documents pareils
Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Adaptation d un Système de Traduction Automatique Statistique avec des Ressources monolingues

Traduction automatique à partir de corpus comparables: extraction de phrases parallèles à partir de données comparables multimodales

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

Traitement automatique des entités nommées en arabe : détection et traduction

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

1 Description générale. Résumé

Aide : publication de décisions VS

Principe de symétrisation pour la construction d un test adaptatif

Application d un algorithme de traduction statistique à la normalisation de textos

Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil*

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Expériences de formalisation d un guide d annotation : vers l annotation agile assistée

RI sociale : intégration de propriétés sociales dans un modèle de recherche

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE

Classification Automatique de messages : une approche hybride

ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*

Ressources lexicales au service de recherche et d indexation des images

Trois approches du GREYC pour la classification de textes

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Entreposage de données complexes pour la médecine d anticipation personnalisée

Vers des outils robustes et interopérables pour le TAL : la piste UIMA

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

Bourses d excellence pour les masters orientés vers la recherche

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Forthcoming Database

d évaluation Objectifs Processus d élaboration

e-recrutement : recherche de mots-clés pertinents dans le titre des annonces d emploi

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

Une méthode d apprentissage pour la composition de services web

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

DOCUMENTATION - FRANCAIS... 2

! Text Encoding Initiative

Formula Negator, Outil de négation de formule.

DESCRIPTION DES PRODUITS ET MÉTRIQUES

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

ÉVALUATION PRIMAIRE D UN SYSTÈME D AIDE AU CONTRÔLE AÉRIEN EN ROUTE

ISTEX, vers des services innovants d accès à la connaissance

Évaluation d outils de Text Mining : démarche et résultats

données en connaissance et en actions?

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES

BANQUES DE DONNÉES PÉDAGOGIQUES

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

COULEE D ALLIAGES METALLIQUES : MODELISATION DES STRUCTURES ET SEGREGATIONS CHIMIQUES

LIVRE BLANC Décembre 2014

N SIMON Anne-Catherine

Observation statistique

Construction et maintenance d une ressource lexicale basées sur l usage

Interférences lexicales entre deux langues étrangères: anglais et français

Qu est-ce qu une probabilité?

BIG Data et R: opportunités et perspectives

Analyse de la dynamique d un lit fluidisé gaz-solide en interaction acoustique avec son système de ventilation : comparaison théorie/expérience.

Fiche produit ifinance v4

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Once the installation is complete, you can delete the temporary Zip files..

Prototype de canal caché dans le DNS

Contents Windows

Bulletin de service Bureaux d agents, de courtiers en immeubles et d évaluateurs de biens immobiliersetdes autres activités liées à l immobilier

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

Rapport. Examen des méthodes de paiement et des tendances des paiements au Canada Octobre 2012

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

1. Rappel des engagements - Roadmap actuelle (RM) Action 8

Probabilités Loi binomiale Exercices corrigés

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

Le ranking de Augure Influencers La méthodologie AIR en détails

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

Thématique : Insertion Professionnelle LES DIFFERENTS PARCOURS OFFERTS PAR L EDUCATION NATIONALE PROCURENT-ILS LES MEMES CHANCES D ACCEDER A L EMPLOI?

I. Présentation générale des épreuves écrites

THE OUAGADOUGOU RECOMMENDATIONS INTERNET INFRASTRUCTURE FOR AN AFRICAN DIGITAL ECONOMY 5-7 MARCH 2012

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Archived Content. Contenu archivé

M. F. PITA Departamento de Geografía Física. Universidad de Sevilla. C/ María de Padilla s.n SEVILLA (Espagne).

Internet & la recherche marketing : état des lieux. Présenté par Raymond Cyr Fondateur VOXCO

L Excellence Achats et l Evaluation 360

L import massif introduit plusieurs nouvelles fonctionnalités, selon que l on importe un thésaurus, un ensemble de valeurs contrôlées ou un corpus.

COORDONNÉES PROFESSIONNELLES PARCOURS PROFESSIONNEL FORMATION

Ordonnancement en temps réel d un jobshop par métaheuristique hybride : étude comparative

SYSTRAN 7 Guide de démarrage

CCNA Discovery Travailler dans une PME ou chez un fournisseur de services Internet

Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs.

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

Plan du cours : Zippers. Des fonctions sur les listes avec position. Des fonctions sur les listes avec position

Qualité de la conception de tests logiciels : plate-forme de conception et processus de test

Compte bancaire ou assurance vie? 5. Amortissement direct ou indirect?

Organiser les informations ( approche technique )

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Big Data et Graphes : Quelques pistes de recherche

Exemple PLS avec SAS

Instructions Mozilla Thunderbird Page 1

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Transcription:

TALN 2011, Montpellier, 27 juin 1 er juillet 2011 Évaluation de G-LexAr pour la traduction automatique statistique Wigdan Mekki (1), Julien Gosme (1), Fathi Debili (2), Yves Lepage (3), Nadine Lucas (1) (1) GREYC, UMR 6072, CNRS, Université de Caen Basse-Normandie, Caen, France (2) LLACAN, UMR 8135, CNRS, Villejuif, France (3) IPS, Université Waseda, Japon Résumé. G-LexAr est un analyseur morphologique de l arabe qui a récemment reçu des améliorations substantielles. Cet article propose une évaluation de cet analyseur en tant qu outil de pré-traitement pour la traduction automatique statistique, ce dont il n a encore jamais fait l objet. Nous étudions l impact des différentes formes proposées par son analyse (voyellation, lemmatisation et segmentation) sur un système de traduction arabe-anglais, ainsi que l impact de la combinaison de ces formes. Nos expériences montrent que l utilisation séparée de chacune de ces formes n a que peu d influence sur la qualité des traductions obtenues, tandis que leur combinaison y contribue de façon très bénéfique. Abstract. G-LexAr is an Arabic morphological analyzer that has recently been improved for speed. This paper gives an assessment of this analyzer as a preprocessing tool for statistical machine translation. We study the impact of the use of its possible outputs (vocalized, lemmatized and segmented) through an Arabic-English machine translation system, as well as the impact of the combination of these outputs. Our experiments show that using these outputs separately does not influence much translation quality. However, their combination leads to major improvements. Mots-clés : traduction automatique statistique, analyse morphologique, pré-traitement de l arabe. Keywords: statistical machine translation, morphological analysis, arabic preprocessing. 1 Introduction L arabe est une langue à morphologie riche dont la complexité présente des défis pour la traduction automatique (voir (Habash, 2007) pour une description des problèmes morphologiques relatifs à cette tâche). Des expériences utilisant l analyse morphologique pour améliorer la traduction automatique ont déjà été menées pour l allemand (p. ex. Nießen & Ney, 2004) ou le turc (p. ex. Bisazza & Federico, 2009). Ces travaux utilisent diverses sortes de segmentation, lemmatisation et étiquetage grammatical. Dans le cas de l arabe, les travaux de Lee (2004), utilisant une approche de segmentation en racines et affixes, puis de Habash & Sadat (2006), avec une approche de tokenization linguistiquement motivée, ont montré que le pré-traitement morphologique peut être utile à la traduction automatique statistique. D un autre côté, Diab et al. (2007) ont montré que l utilisation de la voyellation seule ne conduit à aucune amélioration (voyellation partielle), voire à de moins bons résultats (voyellation complète). Dans cet article, nous évaluons l analyseur morphologique de l arabe G-LexAr (Debili et al., 2002) sur des tâches de traduction automatique statistique arabe-anglais, en utilisant l analyse morphologique comme étape de pré-

WIGDAN MEKKI, JULIEN GOSME, FATHI DEBILI,YVES LEPAGE, NADINE LUCAS traitement. G-LexAr version 3 n a encore jamais fait l objet d une telle évaluation, et a récemment été optimisé. Cet article est organisé comme suit : la section 2 décrit l analyseur morphologique G-LexAr et l analyseur de référence que nous utilisons, BAMA ; la section 3 présente les détails de la conception d un système de traduction automatique de référence ainsi que les résultats obtenus avec ces deux analyseurs ; la section 4 conclut ces travaux. 2 Analyse morphologique Cette section présente une vue globale des deux analyseurs comparés : G-LexAr et BAMA. Pour une description détaillée de G-LexAr version 2, voir (Debili et al., 2002) et pour BAMA utilisé comme référence voir (Buckwalter, 2002). 2.1 G-LexAr G-LexAr est un programme d analyse morpho-grammaticale de l arabe (arabe classique et standard moderne), pouvant traiter des textes d entrée voyellés ou non. Il produit en sortie des analyses où les mots peuvent être indépendamment segmentés, voyellés, lemmatisés ou étiquetés. Il est fondé sur la mise en œuvre d un grand nombre de dictionnaires et règles qui privilégient la rapidité des traitements à l espace mémoire. Il opère en trois étapes. La première segmente le texte d entrée en unités morphologiques, c est-à-dire en formes simples et agglutinées de l arabe (hyper-formes), puis filtre les chaînes de caractères qui ne relèvent pas de l analyse morphologique de l arabe proprement dite. La deuxième étape analyse ces hyper-formes indépendamment de leur contexte. À chaque hyper-forme est attribué, sous forme d un arbre, l ensemble de ses segmentations, voyellations, lemmatisations et étiquettes grammaticales possibles. Les lemmes résultants de la lemmatisation sont en fait des hyper-lemmes dans la mesure où ils sont associés à des formes simples ou agglutinées. De façon analogue, les hyper-formes correspondent à des hyper-catégories grammaticales, car elles sont elles aussi associées indifféremment à des formes simples ou agglutinées. L approche fondée sur l utilisation de dictionnaires de formes simples et de règles assure une large couverture, mais s avérait en pratique assez lente dans la version 2. Pour gagner en temps d analyse, une nouvelle architecture a tout récemment été développée (G-LexAr v. 3). Elle met en œuvre en frontal un dictionnaire d hyper-formes où chaque entrée est accompagnée de sa propre arborescence lexicale. Dans ces conditions, l analyse morphologique de l arabe est comparable à celle du français ou de l anglais : elle consiste en un simple accès. Ainsi, elle n est soumise à une analyse traditionnelle en <proclitique + forme simple + enclitique> que lorsque l unité morphologique n est pas reconnue, c est-à-dire lorsqu elle ne figure pas dans le dictionnaire d hyper-formes. Le résultat de cette deuxième étape est une succession de mots accompagnés de leurs arborescences lexicales. La figure 1 en donne un exemple, avec le résultat de l analyse morphologique du mot placé à la racine de de l arbre signifiant leur livre "ktabhm". Dans cette figure, on distingue : 1. les découpages potentiels du mot en <proclitique + forme simple + enclitique>, ici au nombre de deux : <k + tab + hm> ou <ktab + hm> (premier niveau après la racine) ; 2. les voyellations potentielles associées produites par la deuxième étape (deuxième niveau, "kitabihim" leur livre, ou "kuttabuhum" leurs écrivains ; 3. les lemmes associés à ces deux voyellations (troisième niveau, un seul lemme pour "kitabihim" qui est "kitab" livre et deux lemmes possible pour "kuttabuhum", le premier est "kuttab" et le second est "katib"). Ces lemmes se présentent sous la forme <proclitique voyellé + lemme voyellé + enclitique voyellé> ;

ÉVALUATION DE G-LEXAR POUR LA TRADUCTION AUTOMATIQUE STATISTIQUE [ktabhm] leur livre [k + tab + hm] [ktab + hm] [kitaabihim] leur livre [kuttabuhum] leurs écrivains [kitaab + him] [kaatib + him] [kuttab + hum] FIGURE 1 Exemple de représentation arborescente résultant de la deuxième étape avec l unité morphologique, la forme voyellée, la forme lemmatisée et l hyper-forme. 4. les étiquettes grammaticales potentielles associées à l un de ces lemmes (feuilles de l arbre) ; Enfin, dans la troisième étape, on procède à l étiquetage grammatical à proprement parler en élaguant ces arborescences lexicales. L élagage consiste à ne retenir que les branches dont les feuilles ont des étiquettes vérifiant un certain nombre de règles portant sur la légitimité de la succession de ces étiquettes. Pour rendre ces traitements plus rapides, l élagage met en œuvre un dictionnaire pré-compilé qui associe aux couples (mot, ensemble d étiquettes) les arborescences lexicales élaguées qui leur correspondent. À performance linguistique identique et relativement à la version 2 de l analyseur, cette nouvelle architecture a permis les améliorations suivantes : de 1,3 à 2,2 ko/seconde, la vitesse est passée de 5,7 à 10,8 ko/seconde, soit une analyse trois à cinq fois plus rapide. 2.2 BAMA Dans les expériences suivantes, nous comparons G-LexAr à l analyseur morphologique de Buckwalter (BAMA), qui est considéré comme l un des meilleurs analyseurs de l arabe, et qui est par conséquent très répandu. Contrairement à G-LexAr, il utilise une approche concaténative du lexique, où les règles morphologiques et orthographiques sont intégrées directement dans le lexique au lieu d être précisées en fonction des règles générales qui interagissent pour produire la sortie. Pour chaque chaîne d entrée, l analyseur fournit une solution (systématiquement en translittération Buckwalter,

WIGDAN MEKKI, JULIEN GOSME, FATHI DEBILI,YVES LEPAGE, NADINE LUCAS alors que G-LexAr traite le texte arabe sous sa forme brute), comprenant un lemme sous la forme d un identifiant unique, une ventilation des morphèmes constituants (préfixes, racine, et suffixes), leurs étiquettes grammaticales et la traduction correspondante en anglais. Un exemple est donné dans la figure 2. SOLUTION 1: >alogaz POS: >alogaz/noun GLOSS: mysteries/enigmas SOLUTION 2: >alogazu POS: >alogaz/noun+u/case_def_nom GLOSS: mysteries/enigmas + [def.nom.] SOLUTION 3: >alogaza POS: >alogaz/noun+a/case_def_acc GLOSS: mysteries/enigmas + [def.acc.] SOLUTION 4: >alogazi POS: >alogaz/noun+a/case_def_gen GLOSS: mysteries/enigmas + [def.gen.] INPUT STRING:. FIGURE 2 Exemple de sortie de BAMA : chaque solution consiste ici en un identifiant de lemme (LEMMA_ID), une étiquette grammaticale (POS) et une traduction (GLOSS). 3 Évaluation des analyseurs en traduction automatique statistique Nous comparons l analyseur G-LexAr avec BAMA en les utilisant comme outils de pré-traitement sur des tâches de traduction automatique statistique, à l aide du système open source Moses (Koehn et al., 2007). Nous utilisons comme données d entraînement un échantillon de 251 000 couples de phrases parallèles arabe-anglais extraites d un corpus constitué d articles de journaux (Arabic-English Automatically Extracted Parallel Text) publié par le LDC (Linguistic Data Consortium). Le corpus ainsi constitué, sous sa forme brute et sans pré-traitement, est appelé «original» par la suite. Les deux analyseurs produisent une liste de solutions possibles pour chaque hyper-forme, classées selon le score de pertinence. Dans les expériences suivantes, nous ne conservons que la première. Les sorties de l analyseur G-LexAr comprennent des formes voyellées, lemmatisées et segmentées. BAMA quant à lui ne fournit pas de forme voyellée, aussi nous ne considérons que les deux formes (translittérées) lemmatisées et segmentées. Nous construisons ainsi 6 systèmes de traductions : un en utilisant le corpus original, trois en traitant ce corpus avec chacune des analyses de G-LexAr séparément, et deux avec chacune des analyses de BAMA séparément également. Les jeux de développement et de test sont constitués respectivement de 500 couples de phrases. Les mesures utilisées pour l évaluation sont BLEU, TER et mwer. Nous calculons des intervalles de confiance à l aide de la méthode par ré-échantillonnage par amorce décrite dans (Koehn, 2004) : 1 000 corpus de test de 500 phrases sont constitués par échantillonnage uniforme avec remise à partir des 500 phrases de test mentionnées ci-dessus. Les résultats sont présentés au tableau 1. Le score de confiance global atteint 95 % dans cette première expérience. Le recours aux analyseurs ne semble pas apporter d amélioration par rapport au corpus original, et semble même avoir tendance à dégrader légèrement les scores. En particulier, le système ayant recours à la forme voyellée obtient systématiquement de moins bons

ÉVALUATION DE G-LEXAR POUR LA TRADUCTION AUTOMATIQUE STATISTIQUE TABLE 1 Scores médians et intervalles de confiance (entre crochets) obtenus par les systèmes de traduction, sur la base de 1 000 corpus de test. Les meilleurs scores selon les mesures TER et mwer sont les plus faibles, les meilleurs selon BLEU sont les plus élevés. mwer BLEU TER original 0.4874 [0.4772, 0.4985] 0.2121 [0.1990, 0.2250] 0.8239 [0.8032, 0.8480] voyellée 0.4962 [0.4855, 0.5071] 0.1978 [0.1847, 0.2113] 0.8394 [0.8175, 0.8634] G-LexAr lemmatisée 0.5000 [0.4896, 0.5106] 0.1973 [0.1850, 0.2092] 0.8451 [0.8237, 0.8699] segmentée 0.4823 [0.4722, 0.4929] 0.2066 [0.1850, 0.2092] 0.8165 [0.7955, 0.8400] BAMA lemmatisée 0.4869 [0.4774, 0.4972] 0.2091 [0.1963, 0.2214] 0.8111 [0.7905, 0.8332] segmentée 0.4822 [0.4721, 0.4924] 0.1957 [0.1835, 0.2091] 0.8430 [0.8208, 0.8689] intersection [0.4896, 0.4924] [0.1990, 0.2091] [0.8237, 0.8332] résultats, conformément aux expériences de Diab et al. (2007). Les différences entre les scores médians selon chacune des trois mesures sont cependant très faibles, et n évoluent pas toujours dans le même sens d une mesure à l autre. En fait, d après les intervalles de confiance, elles ne sont pas significatives : pour une mesure donnée, les intervalles de scores des systèmes G-LexAr, BAMA et original se chevauchent (les intervalles spécifiés sur la ligne intersection du tableau ne sont pas vides). Les deux analyseurs produisent donc des sorties de qualité similaire. Dans cette première expérience, l utilisation séparée des formes voyellée, lemmatisée ou segmentée avec l un ou l autre des analyseurs n a pas apporté d amélioration notable. Par conséquent, dans une deuxième expérience, nous combinons ces formes afin de créer deux nouveaux systèmes que nous appelons «combinés», c est-à-dire ayant recours à toutes les analyses d un même analyseur simultanément (voyellée + lemmatisée + segmentée pour G-LexAr, lemmatisée + segmentée pour BAMA). Pour une entrée, toutes les formes correspondantes sont traduites et l hypothèse de traduction ayant le meilleur score à la sortie de Moses est gardée comme hypothèse finale. Les résultats sont présentés dans le tableau 2. TABLE 2 Comparaison des systèmes combinés avec le système original. mwer BLEU TER original 0.4876 0.2121 0.8244 G-LexAr combiné 0.4312 0.2072 0.7300 BAMA combiné 0.4261 0.2095 0.7164 On constate une nette amélioration des scores par rapport au tableau 1. Les deux systèmes combinés sont désormais bien meilleurs que le système original selon TER et mwer (-11 % ou -12 % relativement au système original pour G-LexAr, -13 % pour BAMA sur ces deux mesures), et ne sont que légèrement en retrait selon BLEU (moins d un-demi point en retrait, soit seulement 2 %). Le gain selon TER et mwer est bien plus important que la légère perte en BLEU. Par conséquent, le recours simultané à toutes les formes produites par un analyseur améliore les résultats d un système de traduction automatique, alors que le recours à ces formes prises séparément les dégrade, comme l a montré la première expérience. 4 Conclusion Cet article a donné un aperçu de l analyseur G-LexAr, dont la version 3 est plus performante en vitesse de traitement que la version 2. Dans nos expériences en traduction automatique statistique, ses performances se sont

WIGDAN MEKKI, JULIEN GOSME, FATHI DEBILI,YVES LEPAGE, NADINE LUCAS révélées comparables à celles de BAMA, considéré comme la référence en analyse morphologique de l arabe. G-LexAr a comme avantage indéniable pour les arabisants de traiter directement un texte brut arabe sans nécessiter de translitération intermédiaire. Les expériences présentées ici confirment les résultats de Diab et al. (2007) : la voyellation de l arabe ne serait pas bénéfique en traduction automatique statistique. Plus généralement, nous avons vu que l utilisation séparée des formes que peut produire un analyseur (voyellation, segmentation et lemmatisation) n améliore pas les scores, alors qu une utilisation combinée serait bénéfique. Pour aller plus loin, nous envisageons d étudier plus précisément les contributions positives ou négatives de chacune des formes analysées au sein même des systèmes combinés. L extension de ces expériences à d autres domaines ou couples de langues, y compris en utilisant l arabe en cible, permettra également d affiner ces résultats. Enfin, des expériences non rapportées dans cet article ont montré que l une des faiblesses de l analyseur G-LexAr est qu il n indexe pas encore les mots d emprunt (voir Gosme et al., 2010). Nous pensons que la résolution de ce problème permettra des résultats encore meilleurs. Références BISAZZA A. & FEDERICO M. (2009). Morphological pre-processing for Turkish to English statistical machine translation. In Proceedings of the International Workshop on Spoken Language Translation, p. 129 135. BUCKWALTER T. (2002). Buckwalter Arabic Morphological Analyzer Version 1.0. LDC catalog number LDC2002L49. Rapport interne, ISBN 1-58563-257-0. DEBILI F., ACHOUR H. & SOUISSI E. (2002). De l étiquetage grammatical à la voyellation automatique de l arabe. Correspondances, 71, 10 28. DIAB M., GHONEIM M. & HABASH N. (2007). translation. In Proceedings of MT-Summit. Arabic diacritization in the context of statistical machine GOSME J., MEKKI W., LEPAGE Y. & DEBILLI F. (2010). Evaluation of GLexAr through Arabic-English Statistical Machine Translation Systems. In Proceedings of the 7th International Workshop on Spoken Language Translation (IWSLT 2010), Paris, France. HABASH N. (2007). Arabic Morphological Representations for Machine Translation, In Arabic Computational Morphology, volume 38 of Text, Speech and Language Technology, p. 263 285. Springer Netherlands. HABASH N. & SADAT F. (2006). Arabic preprocessing schemes for statistical machine translation. In Proceedings of the Human Language Technology Conference of the NAACL, p. 49 52 : Association for Computational Linguistics. KOEHN P. (2004). Statistical significance tests for machine translation evaluation. In Proceedings of EMNLP, volume 4, p. 388 395. KOEHN P., HOANG H., BIRCH A., CALLISON-BURCH C., FEDERICO M., BERTOLDI N., COWAN B., SHEN W., MORAN C., ZENS R., DYER C., BOJAR O., CONSTANTIN A. & HERBST E. (2007). Moses : Open source toolkit for statistical machine translation. In Proceedings of ACL 2007 demonstration session. LEE Y. (2004). Morphological analysis for statistical machine translation. In Proceedings of HLT-NAACL 2004, p. 57 60 : Association for Computational Linguistics. NIESSEN S. & NEY H. (2004). Statistical machine translation with scarce resources using morpho-syntactic information. Computational linguistics, 30(2), 181 204.