Mohamed Khairallah KHOUJA (1), Mounir ZRIGUI (2) (1) et (2) Laboratoire RIADI (unité de Monastir) (1)

Documents pareils
UE11 Phonétique appliquée

Le modèle standard, SPE (1/8)

La syllabe (1/5) Unité intuitive (différent du phonème) Constituant essentiel pour la phonologie au même titre que phonème et trait

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Étude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l adaptation des systèmes de RAP

Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014

Phonologie, Master LFA Professeur : André THIBAULT

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Analyse de la dynamique d un lit fluidisé gaz-solide en interaction acoustique avec son système de ventilation : comparaison théorie/expérience.

Une proposition de séquence relative à l étude des sons /an/, /on/ et de leurs graphies. Cadre général

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

SUR LES DEFORMATIONS ELASTIQUES DE QUELQUE CONSTRUCTIONS DES OUTILS DE TOURNAGE PAR LA METHODE D ELEMENT FINI

Une méthode d apprentissage pour la composition de services web

L évaluation de la qualité d un dispositif d apprentissage en ligne. Quelles traces mobiliser? Comment les interpréter?

1. Qu est-ce que la conscience phonologique?

COORDONNÉES PROFESSIONNELLES PARCOURS PROFESSIONNEL FORMATION

Apprentissage Automatique

Big Data et Graphes : Quelques pistes de recherche

Note d orientation : La simulation de crise Établissements de catégorie 2. Novembre This document is also available in English.

Présentation du programme. de physique-chimie. de Terminale S. applicable en septembre 2012

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

L enseignement/apprentissage de la prononciation des langues assisté par ordinateur : le cas du français langue étrangère.

«Rénovation des curricula de l enseignement supérieur - Kazakhstan»

Compte-rendu de Hamma B., La préposition en français

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

Corps des nombres complexes, J Paul Tsasa

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Document d aide au suivi scolaire

Parce que, dans sa construction, le sujet est directement rattaché au verbe sans recours à un auxiliaire quelconque.

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Forthcoming Database

ÉVALUATION DES RÉTROACTIONS DONNÉES PAR UN LOGICIEL D AIDE À L APPRENTISSAGE DE L ÉCRITURE MANUSCRITE

ÉVALUATION PRIMAIRE D UN SYSTÈME D AIDE AU CONTRÔLE AÉRIEN EN ROUTE

Prototype de canal caché dans le DNS

Etude et conception d un serveur vocal :

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

Bourses d excellence pour les masters orientés vers la recherche

Big Data et Graphes : Quelques pistes de recherche

TPE et PME : comment me situer et justifier de mon statut?

En ce qui concerne les marques figuratives, vous devez contrôler la similarité sur deux plans: qu est-il représenté?

Votre conférencier. Christian Martineau

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Tutoriels. 01 Utiliser Praat. 02 Transcrire sous Praat en utilisant les conventions VALIBEL. Sylviane Bachy. Rédaction octobre 2005

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Résolution d équations non linéaires

Modélisation géostatistique des débits le long des cours d eau.

Filtrage stochastique non linéaire par la théorie de représentation des martingales

User guide Conference phone Konftel 100

Université de XY University of XY. Faculté XY Faculty of XY

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

PORTFOLIO Immersion linguistique et culturelle. Année d étude en cours (HEB) :..

Spécialité auxiliaire en prothèse dentaire du brevet d études professionnelles. ANNEXE IIb DEFINITION DES EPREUVES

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

TPE/PME : comment me situer et justifier de mon statut?

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

TP Service HTTP Serveur Apache Linux Debian

Exemple PLS avec SAS

UN DISPOSITIF DE FORMATION PARENTALE DANS UN MUSEE

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

L ESCALIER UNE ACTIVITÉ SUR LES MULTIPLES ET DIVISEURS EN FIN DE PRIMAIRE EN SUISSE ROMANDE

Évaluation de G-LexAr pour la traduction automatique statistique

Ce que vaut un sourire

CARACTERISTIQUE D UNE DIODE ET POINT DE FONCTIONNEMENT

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

Méthodologies de développement de logiciels de gestion

Entreposage de données complexes pour la médecine d anticipation personnalisée

Présentation du Modèle de Référence pour les Bibliothèques FRBR

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Industrial Phd Progam

1.The pronouns me, te, nous, and vous are object pronouns.

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

Qualité perçue de parole transmise par voie téléphonique large-bande

Analyse dialectométrique des parlers berbères de Kabylie

Gulliver.com by mobeo 1

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*

Chapitre 2 Les ondes progressives périodiques

CHAPITRE VIII : Les circuits avec résistances ohmiques

M. F. PITA Departamento de Geografía Física. Universidad de Sevilla. C/ María de Padilla s.n SEVILLA (Espagne).

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Dessin assisté par ordinateur en lycée professionnel

N SIMON Anne-Catherine

AGROBASE : un système de gestion de données expérimentales

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole

GUIDE PRATIQUE DU REFERENCEMENT NATUREL

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

Convention de transcription CIEL-F

Règlement relatif à l examen fait conformément à la Déclaration canadienne des droits. Canadian Bill of Rights Examination Regulations CODIFICATION

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Natixis Asset Management Response to the European Commission Green Paper on shadow banking

Ships Elevator Regulations. Règlement sur les ascenseurs de navires CODIFICATION CONSOLIDATION. C.R.C., c C.R.C., ch. 1482

Transcription:

RÉCITAL 2005, Dourdan, 6-10 juin 2005 Durée des consonnes géminées en parole arabe : mesures et comparaison Mohamed Khairallah KHOUJA (1), Mounir ZRIGUI (2) (1) et (2) Laboratoire RIADI (unité de Monastir) (1) khairallah_k@yahoo.fr (2) Faculté des Sciences de Monastir, mounir.zrigui@fsm.rnu.tn Mots-clefs Keywords Analyse acoustique, arabe standard, gémination, durée, reconnaissance de la parole. Acoustic analyze, standard Arabic, gemination, duration, speech recognition. Résumé Abstract Dans ce papier, nous présentons les résultats d une étude expérimentale de la durée des consonnes géminées de l arabe. Nous visons à déterminer la durée, pour une séquence VCCV, de la consonne géminée CC ainsi que de la voyelle qui la précède. Nous comparons ces valeurs à celles mesurées pour une séquence VCV. Les résultats ont prouvé que la durée de la consonne simple était sensiblement différente de celle géminée, ainsi que la durée de la voyelle précédant la consonne. A la base, ce travail est entrepris dans un but d étudier l utilisation des durées de phonèmes comme une source d information pour optimiser un système de reconnaissance, donc introduire des modèles explicites de durée des phonèmes, et mettre en application ces modèles comme partie du modèle acoustique du système de reconnaissance. In this paper, we represent the results of an experimental study concerning the duration of geminated consonants in the Arabic language. We are seeking to determine the duration of a sequence VCCV, of the geminated consonant CC and of the vowel that precedes it. We are comparing these items with those measured for a sequence VCV. The results have shown that the duration of the simple consonant was so apparently different from that geminated and the same was true for the duration of the vowel that precedes such consonant. Basically, this work is undertaken with an aim of studying the use of the durations of phonemes like a source of information to optimize a recognition system, therefore to introduce explicit models of duration of the phonemes, and to apply these models like part of the acoustic model of the recognition system.

Khouja Khairallah, Zrigui Mounir 1 Introduction L arabe est une langue dans laquelle les durées des phonèmes jouent un rôle distinctif dans la reconnaissance automatique de la parole (RAP). L'information en durée est la plupart du temps négligée dans les systèmes de RAP dus à l'utilisation des modèles cachés de Markov qui sont déficients pour une modélisation correcte des durées des phonèmes (Selouani S-A., 2000). 2 La gémination dans l arabe La gémination est définie comme étant la succession de deux consonnes identiques prononcées consécutivement. En arabe, la gémination est exprimée à l aide du symbole mots. ). Ce symbole joue un rôle important dans la définition et le sens de certains الشد ة ( Pour la langue arabe le paramètre de durée est très important tant au niveau sémantique qu'au niveau grammatical. Il caractérise non seulement les voyelles, mais également les consonnes géminées. Concernant ce trait, un double problème se pose en RAP de l'arabe : il faut déceler les phonèmes allongés tout en s'assurant que ce prolongement est pertinent, c'est à dire en le distinguant des allongements dus au débit d'élocution, à un accent particulier du locuteur, etc.» صلا «racine /salla:/ (prier) dérivé de la» صل ى «mot En effet si l'on observe l'exemple du qui ne s'oppose que par la gémination de la consonne «ل» au mot «صلى» /sala :/ (griller) dérivé de la racine «صلى», nous mesurons à la fois l'importance et la difficulté d'un système automatique à déceler ce trait. La gémination se manifeste par le renforcement de l'articulation et une prolongation de la fermeture de la plosive ou du continuant des autres consonnes (Barkat M., 2000). Plusieurs études similaires à ce travail ont été présentées pour d autres langues, ou la gémination est considérée comme un trait remarquable, notamment celle pour l italien (Giovanardi M., Di Benedetto M-G., 1998), le grec (Arvaniti A., Tserdanelis G., 2000) et l indien (Samudravijaya K., 2003). Pour l arabe standard aucune étude n est faite à nos connaissances dans le cadre de la parole spontanée. Les travaux de Jomaa (Jomaa M., 1993) et Allatif (Allatif O., Abry C., 2004), sont intéressés par l effet de la quantité de contraste pour les séquences VVC et CCV et à la quantité vocalique pour l arabe dialectale. 3 Données et mesures 3.1 Acquisition des données Vu l absence d un corpus annoté, nous étions amenés à effectuer nos propres enregistrements à l aide du logiciel PRAAT 1 et d un microphone professionnel mis à la même distance de la bouche de chacun des quatre locuteurs (2 hommes et 2 femmes) participant aux enregistrements, tous dans la même salle pratiquement isolée. On a demandé aux locuteurs de 1 Logiciel développé à l institut des sciences phonétiques de l université d Amsterdam par P. Boersma et D. Weenink.

Durée des consonnes géminées en parole arabe : mesures et comparaison lire avec une vitesse moyenne tout en assurant une bonne articulation et en évitant les perturbations dus aux hésitations, les reprises, les respirations,, dans de tel cas le locuteur est invité à reprendre sa lecture. La fréquence d échantillonnage des enregistrements est 22050 Hz. Des phrases contenant les mots choisis pour l étude sont lus les unes après les autres sans arrêt. La durée totale des enregistrements est de 1 h 27 min. Les mots sont choisie afin d avoir au moins, si possible, deux fois la couverture de toutes les consonnes dans le cas de gémination et simple. Le nombre total des mots analysés a atteint 520 mots. 3.2 Analyse acoustique Les données étudiées ont été extraites manuellement à l aide du logiciel PRAAT. Le fait que tous les relevés aient été opérés par la même personne, garantie l unicité de la méthode et des principes de base et donc l homogénéité des données. Notre découpage a été fait manuellement sur la base d indices visuels (spectre, amplitude, formant) le contrôle étant perceptif. 3.3 Mesures La durée des différentes unités est considérée en générale comme le phénomène central pour la prosodie. En effet chaque variation de fréquence fondamentale ou d'intensité s'établit sur un certain laps de temps, durée mesurable. Etudier l'organisation temporelle de la parole est incontournable. Etudier la durée c'est observer et modéliser les durées d'unités bien déterminées. L effort produit lors de l articulation ne peut être infini, la séquence est toujours la même : effort et relâchement. Cet effort et ses variations sont véhiculés à travers le signal, ils permettent une segmentation temporelle de la parole en unités. Dans notre cas les unités à mesurer sont les phonèmes. Pour chaque mot extrait des enregistrements on commence par en extraire les unités à mesurer donc la voyelle, la consonne où la consonne géminée. Chaque unité est éditer (signal + spectre + formants) séparément afin de pouvoir raffiner les limites et calculer la durée. Une moyenne de la durée pour chaque unité est calculée sur les quatre locuteurs. 4 Résultats Les durées des diverses unités de la parole ont été calculées et employées pour étudier les caractéristiques en durée des consonnes et des voyelles qui les précèdes. Les changements observés des durées dues à la gémination sont présentés et discutés dans cette section. 4.1 Durée de la voyelle La Figure 1 présente la durée moyenne pour les différents tests sur les trois voyelles courtes. Pour chaque couple de mots (simple et géminé) nous calculons la durée de la voyelle précédant la consonne sujet de la gémination. La durée pour les voyelles longues est calculée sur d autres mots composant le corpus, elle est donnée à titre indicatif.

Khouja Khairallah, Zrigui Mounir Nous constatons que la durée de la voyelle précédant une gémination diminue par rapport à son homologue (consonne simple) pour 86% des mots étudiés. En moyenne on a une diminution de 11 ms pour le /a/, 13 ms pour /u/ et 12 ms pour /i/. Cette diminution peut être expliquée par une tendance du locuteur à insister sur la gémination plutôt que sur la voyelle qui la précède. Ce résultat est trouvé pour d autres langues tels que l italien et l indien (diminution de 10 à 15 ms) et il confirme les résultats présentés dans (Zeki M. Hassan 2002). 140 120 100 80 60 40 avec gémination sans gémination longue 20 0 a u i Figure 1 Représentation des durées moyennes (ms) des voyelles précédant une consonne simple ou géminé et celle d'une voyelle longue. 4.2 Durée des consonnes L'un des exercices les plus périlleux du traitement de la parole consiste à déterminer les frontières des différentes unités phonétiques contenues dans un énoncé. Cette difficulté tient à la nature même de la parole continue : les unités sont fortement coarticulées, et l'on passe souvent de l'une à l'autre de manière continue. Comme précisé en 3.3, nous avons mesuré la durée pour chaque consonne simple et son homologue géminée en conservant la même séquence qui précède et qui suit la consonne.,(فع ل ( en et nous la dérivons (فعل) Cela est possible puisque nous partons d une racine verbale en plus de quelques noms et leurs dérivés. Les résultats des moyennes de quelques unes de ces durées sont donnés par la Figure 2. Les valeurs sont arrondies et exprimées en ms. Le rapport (G/S) donne une idée sur la différence entre une consonne simple et la même géminée. La thèse classique considérant ce rapport égal à 2, (Bonnot J.F., 1979), reste comme une moyenne mais n est pas vraie pour toutes les consonnes puisque les résultats expérimentaux obtenus donnent un rapport variant entre 1,48 et 2,24. Pour mieux cerné les caractéristiques en durée des consonnes nous avons établis la Figure 3, qui présente les durées suivant le type des consonnes.

Durée des consonnes géminées en parole arabe : mesures et comparaison Consonne Simple Géminé G/S Consonne Simple Géminé G/S /b/ ب 58 99 1,71 /t/ ت 62 105 1,69 /T/ ث 65 123 1,89 /Z/ ج 70 121 1,73 /x/ خ 65 110 1,69 / / ح 63 102 1,62 /d/ د 69 145 2,10 /D/ ذ 68 139 2,04 /r/ ر 64 95 1,48 /h/ ه 59 116 1,97 /s/ س 70 130 1,86 /S/ ش 72 131 1,82 /ˇ/ ط 69 134 1,94 / / ع 61 113 1,85 /f/ ف 62 129 2,08 /q/ ق 52 101 1,94 /k/ ك 67 129 1,93 /l/ ل 68 141 2,07 /m/ م 62 116 1,87 /n/ ن 60 124 2,07 Figure 2 Extrait des moyennes des durées des consonnes simples et géminées et leurs rapports 160 140 120 100 80 60 40 20 0 Dentales Alveolaires Bilabliales simple géminée Figure 3 Représentation des durées (ms) pour certains types de consonnes dans les cas simples et géminés. Le classement des consonnes suivant leurs types donne une vision plus claire sur la notion de durée. Cette classification montre bien la différence entre les différentes classes de consonnes puisque le rapport géminé/simple est plus caractérisant : 2,04 pour les dentales, 1,94 pour les alvéolaires et 1,78 pour les bilabiales. Ces résultats restent préliminaires puisqu une étude plus complète sur un corpus plus important sera plus consistante.

Khouja Khairallah, Zrigui Mounir 5 Conclusion Dans cet article nous avons présenté les résultats des mesures en durée des consonnes géminées pour la parole arabe. Les résultats statistiques obtenus montrent bien que nous pouvons caractériser une consonne simple d une géminée d un point de vu durée. Les résultats ont prouvé que la durée de la consonne géminée était sensiblement différente que celle simple avec les rapports présentés, ainsi que la durée de la voyelle précédant cette consonne. Pour pouvoir résoudre le problème de la gémination, dans un système de (RAP) continu pour la langue arabe, il faudrait différencier entre une gémination et une consonne simple suivie d une voyelle longue. Cela passe par une bonne approche automatique acoustique pour la détermination des frontières entre consonne et voyelle. Références Allatif O., Abry C., (2004) Adaptabilité des paramètres temporels et spectraux dans l'opposition de quantité vocalique de l'arabe de Mayadin (Syrie), JEP'2004, 2004. Arvaniti A., Tserdanelis G., (2000) On the phonetics of geminates: evidence from cypriot greek, In proceedings of 6th International Conference on Spoken Language Processing, volume 2, p: 559-562. Beijing, China, 2000. Barkat M. (2000) Détermination d indices acoustiques robustes pour l identification automatique des parlers arabes, Thèse de doctorat, Université Lumière LYON 2, 2000. Bonnot J.F. (1979) étude expérimentale de certains aspects de la gémination et de l emphase en arabe, travaux de l institut phonétique de Strasbourg, N 11, pp. 109-118, 1979. Giovanardi M., Di Benedetto M-G. (1998) Acoustic Analysis of Singleton and Geminate Fricative in Italien, The European Student Journal of Language and Speech, 1998. Jomaa M. (1993) Effect of quantity contrasts on the temporal regulation of mandibular movements in Arabic, Actes du colloque du 2ième congrés : Langue arabe et technologies informatiques avancées, pages : 141-169, 1993. Samudravijaya K. (2003) Durational Characteristics of Hindi Stop Consonants, EUROSPEECH 2003, 2003. Selouani S-A. (2000) Reconnaissance automatique de la parole par des techniques multiagents, connexionnistes et hybrides, Thèse d état, Université des Sciences et Technologie Houari Boumediènne, 2000. Zeki M. Hassan (2002) Gemination in swedish & arabic with a particular reference to the preceding vowel duration. An instrumental & comparative approach, TMH-QPSR vol. 44 Fonetik 2002.