Conventions de segmentation pour la construction de diphones



Documents pareils
Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014

La syllabe (1/5) Unité intuitive (différent du phonème) Constituant essentiel pour la phonologie au même titre que phonème et trait

UE11 Phonétique appliquée

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

[FORMAT AGRANDI DE LA POLITIQUE D ACCESSIBILITÉ POUR LES PERSONNES HANDICAPÉES]

mémo santé du bâtiment Chef d entreprise artisanales Le bruit est un son désagréable et gênant.

ACADÉMIE D ORLÉANS-TOURS NOTE D INFORMATION n 50

LE CODE-BARRES EN MOUVEMENT

N SIMON Anne-Catherine

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

Apprentissage Automatique

Bandes Critiques et Masquage

Phonologie, Master LFA Professeur : André THIBAULT

MONTAGE DE L UNITÉ MOBILE. Montage de l unité mise en onde Couverture événementielle

1. Qu est-ce que la conscience phonologique?

Transmission de données. A) Principaux éléments intervenant dans la transmission

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

Plate-formes inclinées SUPRA & SUPRA LINEA

Son et Mathématiques

Plate-formes inclinées SUPRA & SUPRA LINEA

Qualité perçue de parole transmise par voie téléphonique large-bande

Le guide pinta de l acoustique

LIAISON CHARLIE FASTMAG

Ministère des Affaires étrangères et européennes. Direction de la politique culturelle et du français. Regards VII

Kit émetteur/récepteur pour moto avec système mains libres pour téléphone portable ou branchement audio

Cours d Acoustique. Niveaux Sonores Puissance, Pression, Intensité

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

Goodyear Les pneumatiques longue distance qui font économiser du carburant

Un silence d avance! Innovation TECUMSEH. 7dB(A) de réduction sonore * Installation et SAV facilités. Performances optimisées

Défauts dan les sachets souples état date stérilisables en autoclave nouveau 31/05/2002 Caractérisation et classification

Manuel d entraînement à l éducation auditivo-verbale de l adulte sourd implanté cochléaire

AIC N 10/A/15GO 19 MARS 2015

On considérera que le matériel/logiciel de conversion A/N est installé et configuré pour récupérer 4 canaux : original+anglais+français+espagnol.

VOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET

Visitez notre page Internet credit-suisse.com/accessibilite ou contactez-nous par téléphone au

Notice d emploi Sonomètre PCE-353

Câblage des réseaux WAN.

Le modèle standard, SPE (1/8)

RELEVE D ETAT DU PONT DES GRANDS-CRÊTS. On a procédé une auscultation visuelle entre le 23 et le 29 mars 2007.

1. Productions orales en continu après travail individuel

-1- SOUNDMAN. Fabrication et distribution. SOUNDMAN e.k. Bornimer Str Berlin (Allemagne) Tél & Fax (+49)

La famille de microphones USB polyvalents de Blue Microphones est la gamme de microphones USB à condensateur avec câble la plus vendue de la planète.

Consulter le Modèle d Accessibilité de référence. Le modèle a considéré quatre types de diversité fonctionnelle :

MESURES de BRUIT. Chantier A63 Rechargement

Pompes à Chaleur & environnement acoustique. Recommandations pour la mise en œuvre des pompes à chaleur. Fiche technique n 1

MARKETING MIX. Politique Produit. Les composantes d un produit POLITIQUE PRODUIT

Système de contrôle d installations photovoltaïques


Systèmes de transmission

L enseignement/apprentissage de la prononciation des langues assisté par ordinateur : le cas du français langue étrangère.

Rencontrer des personnes en situation de handicap

Traitement bas-niveau

Brady Mobile Application

Le bruit. Le bruit Page 1 sur 10

Chapitre 2 Les ondes progressives périodiques

COURS AUTOCAD. Création et utilisation des blocs. b leclerc. ERP Jean Moulin METZ

ballons ECS vendus en France, en 2010

Systèmes de conférence

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

Université de La Rochelle. Réseaux TD n 6

Infolettre #18 : Les graphiques avec Excel 2010

InterCall Unified Meeting

Analyse des bruits de clavier d ordinateur

OpenOffice.org IMPRESS. Notes de cours Novembre 2005 Version 1.0

Lucile Cognard. S identifier à son symptôme

Vidia La solution de visioconférence de Swisscom & astuces

CAHIER DES CHARGES ETIQUETTES MP06-EU (FORMAT ODETTE)

Manuel KBC-Online Local

CT-DECT GateCom 3W avec Fonction CT-ASR CT-DECT Bluetooth / tablette tactile et téléphones GSM Geschäftsbericht 09/10 I 1

Méthode SOBANE: Bruit NIVEAU 3: ANALYSE

NORMES DE LIVRAISON DES MESSAGES PUBLICITAIRES ET MESSAGES D INTÉRÊT PUBLIC COMMERCIAUX APTN

MACHINE A SOUDER MANUEL D UTILISATION

Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)

Mode d emploi Konftel 220 FRANÇAIS

Accueillir un sourd en entreprise

Guide pédagogique. L ADEME contribue à la lutte contre le bruit. Collection Planète Précieuse

Observatoires du Bruit. Import des données du Classement sonore : Utilisation de l'outil VSMAP

ACTIVITÉ DE PRODUCTION ORALE. Niveau A1. Qui est-ce?

Installations classées pour la protection de l'environnement Campagne de mesure de bruit SOMMAIRE I. OBJET DE L ETUDE... 3

Parking. Les places accessibles devront être les plus proches de l entrée.

Amélioration des structures de recherche par les Pôles de recherche nationaux PRN

École : Maternelle. Livret de suivi de l élève. Nom : Prénom : Date de naissance : Année d entrée à l école maternelle :

Application en classe de la progression des apprentissages en musique 1 er cycle du secondaire

Notions d acoustique contexte réglementaire et solutions de prévention

Expérience 3 Formats de signalisation binaire

SAVOIR SE RECENTRER : UN ATOUT AU QUOTIDIEN

Offre Adwords MOONDA. Boostez l efficacité de vos campagnes Adwords grâce aux conseils de nos experts en référencement!

Parcours FOAD Formation EXCEL 2010

ULC-S Inspection et mise à l essai des réseaux avertisseurs d incendie

Université CLAUDE BERNARD LYON1 INSTITUT DES SCIENCES et TECHNIQUES DE READAPTATION. MEMOIRE présenté pour l obtention du

UE 503 L3 MIAGE. Initiation Réseau et Programmation Web La couche physique. A. Belaïd

FICHE METIER. «Assistant son» Assistant son APPELLATION(S) DU METIER DEFINITION DU METIER

MODULES ÉLECTRIQUES. - systèmes électriques DC - onduleurs - convertisseurs - interrupteurs statiques. Notre alimentation Votre confiance

Chaine de transmission

2012 LE NOUVEAU LABEL PNEUMATIQUE EUROPÉEN

Transcription:

Conventions de segmentation pour la construction de diphones LAIP - Lettres, Université de Lausanne Version 1.0, 31.8.98 Contribuants: Sandra Schwab, Eric Keller, Brigitte Zellner, Pierre-Yves Connan, Beat Siebenhaar Note: Afin d éviter des problèmes d impression, ce document utilise l alphabet phonétique à 7 bits du LAIP (document séparé) A. Objectif L objectif de ces conventions est de spécifier les critères de segmentation des signaux de la parole, afin d assurer une cohérence optimale pour la génération automatique de diphones à partir de cette segmentation. B. Conventions générales Définition d un diphone. En général, un diphone s étend du milieu d un premier segment au milieu d un second, afin de capter les éléments essentiels d une transition phonétique. Un exception à ce principe est faite pour les occlusives où nous calculons le début du diphone à partir du début du burst de plosion. Par conséquent un diphone débutant par une occlusive (p.ex., le diphone [ps]) commence au début du burst, tandis qu un diphone terminant sur une occlusive (p.ex., [sp]) achève sur la fin de la période (plus ou moins) silencieuse. Placement des étiquettes. Nous délimitons les deux segments participant au diphone en plaçant une étiquette après chaque segment concerné. Par conséquent, trois étiquettes seront placées pour un diphone donné (Figure 1): 1) Une étiquette au point de transition entre le segment précédant la transition visée et le premier segment de la transition en question. 2) Une étiquette au point de transition entre le premier et le deuxième segment de la transition visée. 3) Une étiquette au point de transition entre le deuxième segment de la transition visée et le segment suivant la transition en question. Etiquette 1 pour Segment 0 Diphone Segment 1 Segment 2 Etiquette 2 pour Segment 1 Figure 1. Placement des étiquettes Etiquette 3 pour Segment 2 Figure 2. La séquence [y-m] dans «allumette»

Le cas particulier des occlusives. Lorsqu une occlusive sourde ou sonore fait partie de la transition ou qu elle précède la transition, on place une étiquette supplémentaire pour marquer la fin du silence des occlusives sourdes [#] et la fin du silence voisé (du pré-voisement) des occlusives sonores [V]. Comme indiqué, ceci est nécessaire pour la construction subséquente des diphones (Figure 2). Il arrive cependant que la barre de prévoisement d une occlusive sonore [V] soit remplacée par le pré-voisement d une autre consonne, p., dans membre [m@mbr%]. Dans ce cas, l étiquetage montrera la suite [@] [m] [b], et non pas la suite [@] [m] [V] [b] ou [@] [V] [b] (Figure 3). Figure 4. Segmentation de [y] dans «cohue». Deux voyelles voisines. Dans le cas de deux voyelles voisines ayant des structures formantiques distinctes, la segmentation s effectue au milieu de la transition, au point de la pente la plus forte (Figure 5). Figure 3. La séquence [kyb] du mot concubin est étiquettée [#kyvb], où l étiquette [#] marque la partie silencieuse de l occlusive [k] et l étiquette [V] marque la partie sonore et préplosive de l occlusive [b]. Point de transition [e-i] C. Voyelles Début et fin de voyelles (Figure 4). Pour l identification des débuts et fins de voyelles, la segmentation s effectue généralement en fonction des 2ème et 3ème formants (particulièrement si la voyelle est en fin d énoncé). Ceci tient compte de la sensibilité maximale de l oreille entre 1000 et 2000 Hz, ainsi que des diminutions de cette sensibilité de chaque côté de cette plage de fréquences (diminution rapide en dessous de 1000 Hz et diminution moins rapide au-dessus de 2000 Hz). Conventions de segmentation LAIP-UNIL 31.8.98 2

Point de transition [e-^] Figure 5. Quelques exemples de segmentation dans les voyelles. Deux voyelles très semblables ou identiques. Dans le cas de deux voyelles très semblables ou identiques, une différentiation entre les deux voyelles est parfois possible, soit au niveau de la fréquence fondamentale, soit au niveau de l amplitude globale du signal. Dans ce cas, choisir le point de transition en fonction de ces indicateurs. Dans tous les autres cas, la segmentation d effectue au milieu arithmétique entre les frontières latérales des deux voyelles (Figure 6). Points de transition [e-o] et [o-i] D. Semi-voyelles Figure 6. La transition [e-e] dans «créer» Point de transition [e-@] Les semi-voyelles peuvent être délimitées généralement entre deux états pseudo-stables. Dans le cas d une voyelle suivie d une semi-voyelle, la segmentation se fait après et avant la partie pseudo-stable de la voyelle (et non au milieu de la transition entre la voyelle et la semi-voyelle). Ceci assure une saisie satisfaisante de la semi-voyelle (Figure 7). Conventions de segmentation LAIP-UNIL 31.8.98 3

Les occlusives sonores, indépendamment de leur emplacement dans l énoncé sont décrites en deux étapes. La première étape se compose d un silence voisé (c.-à-d., d une barre de pré-voisement), représenté par [V] (Figure 9). La deuxième étape se compose de l effet acoustique de la plosion associée l articulation de la consonne en question (soit b, d, g). Une plosion mineure, ou un burst mineur, est souvent visible sous forme d une barre de plosion. Figure 7. Segmentation de la semi-voyelle [j] dans «impayé». E. Consonnes Les occlusives sourdes, indépendamment de leur emplacement dans l énoncé, sont décrites en deux étapes, afin de permettre la resynthèse satisfaisante à partir de ces deux étapes. La première étape se compose d un silence non voisé, représenté par [#]. La deuxième étape se compose de l effet plosif (du burst ) associé l articulation de la consonne en question (soit p, t, k) (Figure 8). points de segmentation Figure 9. Les trois points de segmentation de l occlusive sonore [d] dans «érudition». La transcription montrera donc [yvd]. Remarque: Le pré-voisement peut ne pas être présent, par exemple dans le cas d une consonne nasale suivie d une consonne occlusive sonore. points de segmentation Latérales. En règle générale, les consonnes latérales ne posent pas de problèmes particuliers de segmentation, étant donné leur représentation spectrographique caractéristique (Figure 10). Figure 8. Les trois points de segmentation de l occlusive sourde [p] dans «impayé». La transcription montrera donc [5#p]. Conventions de segmentation LAIP-UNIL 31.8.98 4

Segmentation de [R] dans Segmentation de [l] «érudition» dans «accumulateur» Fricatives. En élocution lente, un petit silence apparaît avant et/ou après la consonne; la segmentation s effectue alors au milieu du silence (Figure 12). Figure 10. Exemples de segmentation de latérales. Néanmoins, si un silence apparaît avant ou après la consonne, la segmentation se fait au milieu du silence (Figure 11). Figure 12. Segmentation de [s] dans «adolescent» Si aucun silence n apparaît, la segmentation s appuit sur les indices de bruit (Figure 13). Figure 11. Illustration d une latérale avec un petit silence séparant la latérale du segment précédent. Figure 13. Segmentation de [Z] dans «déjeuner» Conventions de segmentation LAIP-UNIL 31.8.98 5

Nasales. En règle générale les consonnes nasales ne posent pas de problèmes de segmentation étant donné leur représentation spectrographique caractéristique (Figure 14). Segmentation de [n] Segmentation de [m] dans «déjeuner» dans «également» Figure 15. Etiquetage du silence à la fin d un énoncé. Si la transition donnée concerne un silence suivi d une voyelle (généralement en début d énoncé), l étiquette du silence se place à 200 msec avant le début de l énoncé (en y incluant les bruits d aspiration ou déglutition, s il y en a) (Figure 15). Si le signal achève moins que 200 ms après la fin de la parole, on place une étiquette initiale aussi proche de la fin du signal que possible. Figure 14. Exemples de segmentation des nasales. F. Silences et bruits secondaires Si la transition donnée concerne une voyelle suivie d un silence [#] (généralement en fin d énoncé), l étiquette du silence se place à 200 ms de l étiquette de la voyelle précédente (en y incluant les bruits d aspiration ou déglutition, s il y en a). Si le signal débute moins que 200 ms avant le début de la parole, on place une étiquette initiale aussi proche du début du signal que possible. Dans le cas d un silence impur, c est-à-dire un silence comprenant des bruits d aspiration ou de déglutition, il est considéré comme un silence normal. Remarque: les coups de glotte sont marqués comme segment (symbole [q]) seulement s ils sont linguistiquement pertinents (p. hibou [qibu], où le [q] est linguistiquement pertinent, car il empêche la liaison [leqibu]) (Figure 16). Figure 16. Illustration d un silence bruité. Conventions de segmentation LAIP-UNIL 31.8.98 6