Un système de lissage linéaire pour la synthèse de la parole arabe : Discussion des résultas obtenus

Documents pareils
2 ième partie : MATHÉMATIQUES FINANCIÈRES

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Sommaire Chapitre 1 - L interface de Windows 7 9

Chapitre 3 : Fonctions d une variable réelle (1)

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Chap. 5 : Les intérêts (Les calculs financiers)

Les Nombres Parfaits.

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Statistique descriptive bidimensionnelle

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Dénombrement. Chapitre Enoncés des exercices

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Limites des Suites numériques

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

20. Algorithmique & Mathématiques

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

SÉRIES STATISTIQUES À DEUX VARIABLES

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Séquence 5. La fonction logarithme népérien. Sommaire

Logiciel de synchronisation de flotte de baladeurs MP3 / MP4 ou tablettes Androïd

Chapitre 3 : Transistor bipolaire à jonction

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

1 Mesure et intégrale

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Nous imprimons ce que vous aimez!

Compte Sélect Banque Manuvie Guide du débutant

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Comportement d'une suite

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Le chef d entreprise développe les services funéraires de l entreprise, en

Principes et Méthodes Statistiques

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

STATISTIQUE : TESTS D HYPOTHESES

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Neolane Message Center. Neolane v6.0

Statistique Numérique et Analyse des Données

Les algorithmes de tri

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Etude de la fonction ζ de Riemann

STATISTIQUE AVANCÉE : MÉTHODES

Augmentation de la demande du produit «P» Prévision d accroître la capacité de production (nécessité d investir) Investissement

CHAPITRE 2 SÉRIES ENTIÈRES

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

La maladie rénale chronique

Comment les Canadiens classent-ils leur système de soins de santé?

Processus et martingales en temps continu

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Séries réelles ou complexes

Télé OPTIK. Plus spectaculaire que jamais.

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

EXERCICES : DÉNOMBREMENT

Baccalauréat S Asie 19 juin 2014 Corrigé

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Risque de longévité et détermination du besoin en capital : travaux en cours

Processus géométrique généralisé et applications en fiabilité

Donnez de la liberté à vos données. BiBOARD.

COMMENT ÇA MARCHE GUIDE DE L ENSEIGNANT 9 E ANNÉE

Création et développement d une fonction audit interne*

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

55 - EXEMPLES D UTILISATION DU TABLEUR.

Simulations interactives de convertisseurs en électronique de puissance

Suites et séries de fonctions

Notes de version. Neolane v6.0

Les études. Recommandations applicables aux appareils de levage "anciens" dans les ports. Guide Technique

Initiation à l analyse factorielle des correspondances

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Mécanismes de protection contre les vers

Neolane Leads. Neolane v6.0

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Un accès direct à vos comptes 24h/24 VOTRE NUMÉRO CLIENT. Centre de Relations Clients (0,12 /min)

DETERMINANTS. a b et a'

Formation d un ester à partir d un acide et d un alcool

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Microscope de mesure sans contact pour inspection et mesures de précision

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

CPNEFP Commission Paritaire Nationale pour l'emploi et la Formation Professionnelle de la branche des services funéraires

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

Université Pierre et Marie Curie. Biostatistique PACES - UE

4 Approximation des fonctions

Coefficient de partage

La Journée de l Innovation Collaborative

GUIDE METHODOLOGIQUE INDUSTRIES, OUVREZ VOS PORTES

Rêver, y croire, réussir! Un guide de planification d'études supérieures pour les apprenants de l anglais et leurs familles

MESURE DE L'INFORMATION

Ouverture à la concurrence du transport ferroviaire de voyageurs

sçíêé=ã~áëçå L ABC des fenêtres

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

Transcription:

RÉCITAL 2005, Dourda, 6-10 jui 2005 U système de lissage liéaire pour la sythèse de la parole arabe : Discussio des résultas obteus Tahar SAIDANE (1), Mouir ZRIGUI (2), Mohamed BEN AHMED (3) (1) Cetre de productio de Sousse, Société Tuisiee d Electricité et du Gaz, Tuisie saidae.tahar@plaet.t (2) Labaoratoire RIADI, Uité Moastir Faculté des Scieces de Moastir, Tuisie mouir.zrigui@fsm.ru.t (3) Labaoratoire RIADI, Ecole Natioale des Scieces de l iformatique, Tuis, Tuisie Mohamed.BeAhmed@riadi.ru.t Mots clés Keywords Sythèse de la parole arabe, Phoèmes, Diphoes, Triphoes, Uités acoustiques, Dictioaire de polyphoes. Arabic speech sythesis, Phoeme, Diphoes, Triphoes, Acoustic uits, Polyphoes dictioary. Résumé Abstract Notre article s'itègre das le cadre du projet ititulé "Oréodule" : u système embarqué temps réel de recoaissace, de traductio et de sythèse de la parole. L'objet de otre itérêt das cet article est la présetatio de otre système de sythèse hybride de la parole arabe. Nous préseteros, das ce papier, les différets modules et les différets choix techiques de otre système de sythèse hybride par cocatéatio de polyphèmes. Nous détailleros égalemet les règles de trascriptio et leurs effets sur le traitemet liguistique, les règles de syllabatio et leurs impacts sur le coût (temps et difficulté) de réalisatio du module acoustique et ous poursuivros par l'exposé de os choix au iveau du module de cocatéatio. Nous décriros le module de lissage, u traitemet acoustique, post cocatéatio, écessaire à l'amélioratio de la qualité de la voix sythétisée. Efi, ous préseteros les résultats de l'étude statistique de compréhesio, réalisée sur u corpus. This research paper is withi the project etitled "Oreillodule" : a real time embedded system of speech recogitio, traslatio ad sythesis. The core of our iterest i this work is the presetatio of the hybrid system of the Arabic speech sythesis ad more precisely of the liguistic ad the acoustic treatmet. Ideed, we will focus o the grapheme-phoeme

U système de lissage liéaire pour la sythèse de la parole arabe : Discussio des résultas obteus trascriptio, a itegral stage for the developmet of this speech sythesis system with a acceptable quality. The, we will preset some of the rules used for the realizatio of the phoetic treatmet system. These rules are stocked i a data base ad browsed several times durig the trascriptio. We will also preset the module of syllabicatio i acoustic uits of variable sizes (phoeme, diphoe ad triphoe), as well as the correspodig polyphoes dictioary. We will list the stages of the establishmet of this dictioary ad the difficulties faced durig its developmet. Fially, we will preset the results of the statistical survey of uderstadig, achieved o a corpus. 1 Itroductio Notre étude porte sur la coceptio et la réalisatio d u système de sythèse de la parole arabe qui doe la voix la plus aturelle possible tout e teat compte des particularités de la lague. Cet objectif a écessité l étude de toutes les étapes de la sythèse de la parole et le choix des solutios les plus adaptées à chaque tâche. Le résultat de ces études ous a guidé vers u système de sythèse hybride utilisat la cocatéatio d uités acoustiques de tailles variables tout e utilisat des règles établies. Cet article présetera les modules de ce système de sythèse à savoir le trascripteur, le module de syllabatio, le dictioaire d uités acoustiques et le module de cocatéatio mui de so système de lissage (Dutoit, 1993). 2 LA TRANSCRIPTION L'aalyse liguistique ous a permis d'établir u esemble de 133 règles. Il est à oter que l'ordre d'applicatio de ces règles est très importat et iflue sur le résultat fial. E ce qui suit la descriptio de quelques règles élaborées (Saidae, 2004) : 1. [CC]={ }+{C} Lorsqu ue cosoe est suivie par la, elle est doublée, o obtiet alors le phoème [CC].. و د, ر وج : Exemple 2. ال}+{ V}+{CL}={CL }+{ل}+{ CL } }+{CL} 3. ال}+{ V}+{CS}={CL }+{ل}+{ CL } }+{CS}.أ est etre suivi par ue cosoe luaire, il est équivalet à la o présece du ال Lorsque le Exemple : م ن ع الا آ ل, أ آ ل الا آ ل (Zrigui 1991). 3 LA SYLLABATION Les uités acoustiques de otre système de sythèse sot de trois types : les triphoes, les diphoes et les phoèmes. O a établi u esemble de règles de cocatéatio à partir desquelles les différetes occurreces de trois phoèmes pouvaiet se trasformer e : u triphoe, u diphoe suivi d'u phoème, u phoème suivi d'u diphoe, ou évetuellemet trois phoèmes. La sélectio dyamique des uités se traduit alors par la recherche de la séquece optimale de représetats, visat à miimiser les discotiuités au poit de cocatéatio (Boula, 2001). Le schéma suivat présete u exemple de syllabatio pour l'expressio أ ي ن الم س اف ر ون»» (eaj.a.lmusaafiruua 1 : Où sot les voyageurs) (Saidae, 2004): 1 Suivat l'alphabet phoétique iteratioale IPA 96

Tahar SAIDANE, Mouir ZRIGUI, Mohamed BEN AHMED eaj.a.lmusaafiru أ ي ن الم س اف ر ون ea j. a.l mu saa fi ru Fig. 1. Exemple de syllabatio La problématique de la sélectio des uités a été formalisée e utilisat des règles. Ces règles de syllabatio peuvet se résumer e ce qui suit : 1. [CVV] ={V}+{V}+{C} : lorsqu'ue cosoe est suivie de deux voyelles les trois graphèmes costituet ue uité acoustique de otre système. 2. [CV]={C}+{V}+{C} : lorsqu'ue cosoe est suivie d'ue voyelle puis d'ue cosoe les deux premiers graphèmes costituet ue uité acoustique. 3. [CC]={C}+{C}+{C} : lorsque ous avos ue successio de trois cosoes les deux premiers graphèmes costituet ue uité acoustique. 4. [C]={V}+{C}+{C} : lorsque ous avos deux cosoes suivies par ue voyelle seul le premier graphème costitue ue uité acoustique. 5. [VV]={V}+{V} : lorsque ous avos ue successio de deux voyelles, les deux costituet ue uité acoustique. 6. [V]={V} : lorsque ous avos ue voyelle isolée elle costitue ue uité acoustique. Il est à oter que l'ordre d'applicatio de ces règles aisi établies est très importat pour ue boe syllabatio et doc ue meilleure cocatéatio soore (Emerard, 1977). Ces six règles de syllabatio élaborées vot imposer les types d'uités acoustiques à utiliser pour la sythèse de la parole. Le dictioaire aisi établi cotiet 196 uités acoustiques suffisates pour la réalisatio des différetes occurreces possibles. Le ombre de phoèmes est de 28, le ombre de diphoes est de 84 et le ombre de triphoes est de 84.Néamois, la pratique et l'étude de la lague arabe ot permis de dégager ue dizaie d'autres uités dues pricipalemet aux cotraites de la lague. Le module de cocatéatio a besoi de la totalité des uités acoustiques sous la forme d'eregistremets soores (Lemmety, 2000). Ces eregistremets costituet le dictioaire de otre système. Le dictioaire d'uités acoustiques aisi établi a ue taille de 9 MØ (e moyee u phoème pred 20 kø, u diphoe 40 kø et u triphoe 60 kø)..lmusaafiruu الم س اف ر ون.l mu saa fi ruu saa ma saa fa tu م س اف ة saa.wav Fig. 2. U exemple de traitemet pour l'obtetio du triphoe «saa»

U système de lissage liéaire pour la sythèse de la parole arabe : Discussio des résultas obteus 4 LA CONCATENATION Pour otre système ous avos voulu commecer par u traitemet de lissage temporel pour mesurer l'effet d'u post traitemet sur la qualité de la parole obteue. Après l'aalyse des différetes uités acoustiques de l'arabe, il s'avère que celles-ci présetet ue attéuatio aux iveaux de leurs extrémités. L'idée reteue cosiste alors à procéder, lors de la cocatéatio, à ue accetuatio aux iveaux d'u certai ombre de valeurs d'extrémités avat le collage e bout à bout. Ce traitemet touchera évidemet la fi de la première uité et le début de la suivate.u sigal umérique de la parole état : N s ( t ) = s δ ( t T ) (1) 1 s(t) : sigal umérisé de la parole (échatilloé), s = s(t) : la valeur du sigal à l'istat T et δ(t) : impulsio de Dirac. La cocatéatio de deux uités sera : N M s ( t ) = s 1 ( t ) + s 2 ( t ) = s δ ( t T ) + s δ ( t T ) (2) 1 1 1 2 L'idée cosiste alors à isoler X valeurs du premier sigal et Y valeurs du secod. Ces valeurs subirot alors ue attéuatio proportioelle défiie par : Le résultat se présetera sous la forme : attéué K i s i s i i = 1.. K K = (3) N X N N Y Y M Y s δ ( t T ) + s δ ( t T ) + s δ ( t T ) + s ( t T ) (4) 1 1 s( t) = 1 N X + 1 1 Y + 1 2 δ N 2 Y La foctio d'attéuatio aisi défiie a été appliquée pour u ombre de poits représetats 10 % de la durée du sigal de l'uité acoustique. Les résultats obteus sot motrés e ce qui suit : Sas lissage Lissage 10% Lissage10% et pause Fig. 3. Effet du lissage temporel sur la forme d'ode au iveau des poits de discotiuités.

Tahar SAIDANE, Mouir ZRIGUI, Mohamed BEN AHMED Les courbes précédetes motret l'effet de ce lissage temporel sur u exemple de sythèse du mot «م س اف ة» (masaafatu : distace). E effet, la première courbe motre ue cocatéatio bout à bout ous y costatos ue discotiuité flagrate aux iveaux des poits de joitures. La courbe du bas itroduit, quat à elle, le résultat d'ue cocatéatio lissée et la fluidité aux iveaux des poits de cocatéatio. Le résultat obteu a sesiblemet amélioré la qualité de la voix sythétisée. Néamois, ous costatos u chevauchemet etre les uités. Pour éviter u tel problème ous avos itroduit u temps de silece de 10 millièmes de secode. L'isertio d'ue pause etre les uités avec ous a alors permis d'obteir ue meilleure itelligibilité. 5 RESULTATS DES TESTS Afi d'évaluer otre système, ous avos établi ue procédure de test basée sur l'écoute et l'idetificatio de phrases sythétisées. Nous avos utilisé 20 phrases, soit 53 mots, 211 uités acoustiques dot 73 différetes ce qui costitue 37.2 % de la totalité des uités acoustiques qu'utilise otre système. Nous les avos fait écouter à 8 persoes (4 femmes et 4 hommes) ce qui a permis ue évaluatio statistique réaliste du résultat. Chaque phrase est écoutée trois fois, à chaque passage le sujet doit orthographier ce qu'il eted. E ce qui suit les résultats obteu : Taux de recoaissace Résultats des tests 100,0% 80,0% 60,0% 40,0% 20,0% 0,0% 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Phrases 1er Essai 2ème Essai 3ème Essai Fig. 4. Les résultats de la phase de test Nous avos alors pu coclure à u pourcetage d'idetificatio de plus de 81 % dès la première écoute, ce taux passe à plus de 92% pour la troisième phase. Par ailleurs ous avos remarqué qu'ue phase d'adaptatio de 2 à 3 phrases a été écessaire pour avoir ue stabilisatio des taux de recoaissace. De ces relevés ous avos aussi costaté que les mots o courats sot difficilemet idetifiables (exp : ل ذ ع ت ه phrase 4), et que quelques caractères sot plus difficiles que d'autres pour l'idetificatio (exp ذ: phrase 3, 4 et 11). 6 CONCLUSION Nous avos préseté das cet article otre système de sythèse de la parole, ces différets costituats, les différetes phases de so élaboratio et les choix techiques reteus pour chaque module. Le module de syllabatio costitue à otre ses le poit de départ pour ue autre visio de la lague arabe, vue la rupture totale avec les méthodes jusque là utilisées e

U système de lissage liéaire pour la sythèse de la parole arabe : Discussio des résultas obteus lague arabe. Nous avos aussi exposé l'opératio de cocatéatio aisi que le poste traitemet que ous avos choisi pour remédier aux problèmes de discotiuités. La comparaiso des résultats obteus par rapport à l'existat demeure difficile. Les travaux sur les systèmes de sythèse de la parole arabe sot peu ombreux et les résultats d'évaluatio e fot pas l'objet d'articles publiés. Néamois ous avos relevé que otre système a permis de se restreidre à trois types de syllabes seulemet (CVV, CV et C) cotrairemet aux autres travaux précoisat ciq voir six types de syllabes différets (Be Sassi, 2001). Nous 'utilisos que 196 uités acoustiques pour sythétiser 'importe quelle occurrece de l'arabe stadard alors que le miimum jusque là était de 310 uités (Elshafei, 2002). Référeces 1 Zrigui M., Mili A, Jemi M. 1991. Vers u système automatique de sythèse de la parole arabe, Maghrebi symposium o programmig ad system, Alger. p 180-197. 2 Saidae Tahar, Zrigui Mouir, Pr Be Ahmed Mohamed. 2004. La Trascriptio Orthographique-Phoétique de la Lague Arabe. RÉCITAL 2004, Fès, Maroc. 3 Emerard Froçoise. 1977. Les diphoes et le traitemet de la prosodie das la sythèse de la parole. Bulleti de l'istitut de phoétique de greoble. 4 Dutoit Thierry. 1993. High quality text to speech sythesis of the frech laguage. Thèse. Faculté polytechique de Mos. 5 Elshafei M., Al-Muhtaseb, H., Al-Gamdi M. 2002. Techiques for high quality Arabic speech sythesis, Iformatio scieces, Vol.140, 255-267. 6 Be Sassi S., Braham R., Belgith A. 2001. Neural speech sythesis system for Arabic laguage usig celp algorithm, Proc. Coferece o Computer Systems ad Applicatios. 7 Saidae Tahar, Haddad Ahmed, Zrigui Mouir, Pr Be Ahmed Mohamed. 2004. Réalisatio d u système hybride de sythèse de la parole arabe utilisat u dictioaire de polyphoes. JEP-TALN 2004, Traitemet Automatique de l Arabe, Fès, Maroc. 8 Boula de Mareuil Philippe, Célérier Philippe, Cesses Thierry, Fabre Serge, Jobi Carie, Le Meur Pierre-Yves, Obadia David, Soulage Beoît, Toe Jacques. 2001. Ela text to speech : u système multiligue de sythèse de la parole à partir du texte. Ela TTS Toulouse. 9 Lemmety Sami. 2000. Review of speech sythesis techology. Thèse. Helsiki Uiversity of Techology.