Traitement de la Parole



Documents pareils
Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014

UE11 Phonétique appliquée

ACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS

Chapitre 2 Les ondes progressives périodiques

Son et Mathématiques

La syllabe (1/5) Unité intuitive (différent du phonème) Constituant essentiel pour la phonologie au même titre que phonème et trait

Rapport d acoustique : La hauteur d un son

SONS. Dossier pédagogique. Enseignants Niveau lycée

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

Phonologie, Master LFA Professeur : André THIBAULT

Fonctions non ventilatoires

ACADÉMIE D ORLÉANS-TOURS NOTE D INFORMATION n 50

Ordonnance du DFJP sur les instruments de mesure audiométriques

Arlette Osta (1) «Chauffer sa voix» (1) Orthophoniste 1, Avenue du Dr. Roux Nice

Le modèle standard, SPE (1/8)

P2: Perception auditive

Cours d Acoustique. Niveaux Sonores Puissance, Pression, Intensité

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

Chapitre 5 Émetteurs et récepteurs sonores

Etude et conception d un serveur vocal :

Caractéristiques des ondes

TACHES N 1. Escalier : Taper des pieds en faisant le crocodile, souffler, immerger le visage... S asseoir au fond de l eau, tête hors de l eau

Notions d acoustique contexte réglementaire et solutions de prévention

Manuel d entraînement à l éducation auditivo-verbale de l adulte sourd implanté cochléaire

La Perception Auditive

CHAP 07-COURS Emetteurs et récepteurs sonores

La chanson lumineuse ou Peut-on faire chanter la lumière?

Traitement numérique du son

Appareil de type fauteuil monte-escalier

COMMENT PROTEGER SA VOIX?

Bandes Critiques et Masquage

Analyse des bruits de clavier d ordinateur

Séquence 1. Sons et musique. Sommaire

Université du Québec à Chicoutimi THESE. Présentée à l'université du Québec à Chicoutimi Département des Sciences Appliquées

Le Bon Accueil Lieu d art contemporain - Sound Art INTERFÉRENCES ATELIERS / EXPOSITION / CONCERT

Vous disiez? Dossier d enseignement sur le bruit et les lésions de ľouïe Exercices de consolidation 120 minutes, moyen

Les cancers des voies aérodigestives supérieures

Enregistrement et transformation du son. S. Natkin Novembre 2001

Tutoriels. 01 Utiliser Praat. 02 Transcrire sous Praat en utilisant les conventions VALIBEL. Sylviane Bachy. Rédaction octobre 2005

Le son est une vibration aérienne, une onde, qui se caractérise par sa hauteur (aigu ou grave) et son intensité (son fort, son faible).

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

CH Marches de Bretagne/Mme ROUANET 05/06/2015 2

Sons et ultrasons applications: échographie et doppler PACES

Étude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l adaptation des systèmes de RAP

C est quoi la surdité? Une histoire à partager entre petits et grands

Qualité perçue de parole transmise par voie téléphonique large-bande

Le bruit. Le bruit Page 1 sur 10

Le guide pinta de l acoustique

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Questionnaire pour enfants avec trouble de voix

CODE DE SÉCURITÉ SAFETY CODE. Publié par: Le Directeur général Date de publication: 1993 Original: français PROTECTION CONTRE LE BRUIT

Cours n 2 d Energétique SON, COULEUR ET ONDES DE FORME. Toute reproduction partielle ou totale est interdite sans autorisation écrite des auteurs.

Manuel d'utilisation Version abrégée

Dérivées et différentielles des fonctions de plusieurs variables

APPUIS-COUDES MOBILES POUR RÉDUIRE LE TRAVAIL STATIQUE DE LA CEINTURE SCAPULAIRE DU PERSONNEL DENTAIRE

COMMENT SURMONTER SON ANXIÉTÉ

LES SOINS D HYGIENE l hygiène bucco dentaire. Formation en Hygiène des EMS de la Somme EOH CH ABBEVILLE JUIN 2015

mémo santé du bâtiment Chef d entreprise artisanales Le bruit est un son désagréable et gênant.

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

THÈSE DE DOCTORAT. Ecole Doctorale «Sciences et Technologies de l Information des Télécommunications et des Systèmes»

Electron S.R.L. - MERLINO - MILAN ITALIE Tel ( ) Fax Web electron@electron.it

LA QUESTION DE LA PRISE DE POIDS CHEZ LE FUMEUR EN SEVRAGE TABAGIQUE

Atelier «son» Séance 2

Numérisation du signal

& BONNES POSTURES TMS TROUBLES MUSCULO-SQUELETTIQUES. Le guide. Guide offert par la MNT

Appareil d expansion palatine

ANALYSE ACOUSTIQUE de la VOIX. pour la. DÉTECTION de PERTURBATIONS PSYCHOPHYSIOLOGIQUES. APPLICATION au CONTEXTE AÉRONAUTIQUE

Archiver des messages

lecture : LE SON [an]

Calcul des indicateurs de sonie : revue des algorithmes et implémentation

RENCONTRES EFFRAYANTES

Risques liés à l'activité physique au travail. Mireille Loizeau

Chaine de transmission

Application en classe de la progression des apprentissages en musique 1 er cycle du secondaire

Chapitre I La fonction transmission

Concours d Internat et de Résidanat

VOITURE A REACTION. Kart à réaction réalisé par un bricoleur «fou» (Bruce Simpson)

Nouvelles pistes pour revisiter la production de la parole et son développement : données, modèles, représentation

PRÉSERVEZ DES MAINTENANT VOTRE AUDITION!

Une fréquence peut-elle être instantanée?

L enseignement/apprentissage de la prononciation des langues assisté par ordinateur : le cas du français langue étrangère.

Analyses psychoacoustiques dans ArtemiS SUITE

La pompe cardiaque, le débit cardiaque et son contrôle

.( /.*!0) %1 2"+ %#(3004) 05' 203 .(.*0"+ ) '!2"+ %#(30+ 0!"%) 4!%2) 3 '!%2"+ %#(30! &' 4!!% .+.*0%!!'!(!%2" !

Une proposition de séquence relative à l étude des sons /an/, /on/ et de leurs graphies. Cadre général

Comment ça va? Quand ça ne va pas. 4 comment ça va?

UNIVERSITÉ JOSEPH FOURIER - GRENOBLE I THÈSE. pour obtenir le grade Docteur de l université Joseph Fourier - Grenoble I

6. PHONETIQUE ARTICULATOIRE

Les effets nocifs du bruit sur l'homme

THEME 2 : CORPS HUMAIN ET SANTE : L EXERCICE PHYSIQUE

TD séance n 10 Multimédia Son

La langue, constituant la majeure partie de la partie inférieure de la cavité orale,

LE LARYNX VUE ANTERIEURE DU LARYNX : Décembre 2007 Sources Étudiantes. Faculté de Médecine Montpellier-Nîmes

Production de documents audio-numériques

Psychoacoustique. VI. Localisation. VI.2 Latéralisation: différences temporelles (ITDs) VI.1 Position du problème. VI.

déglutition-respiration : couple fondamental et paradoxal Article paru dans : kinéréa, 2005;42:1

SUJET ZÉRO Epreuve d'informatique et modélisation de systèmes physiques

«La gestion des douleurs», l après TMS

Transcription:

Traitement de la Parole Cours 2: Signal de parole Production Perception Analyse 19/03/2007 Plan 1. Processus de production et de perception de la parole chez les humains 2. Production de la parole Définition L appareil phonatoire Vue d ensemble Larynx et cordes vocales Représentation schématique Définition de la parole: point de vue physiologique Les types de sons produits 3. Perception de la parole Perception humaine Le système auditif Analyse fréquentielle Réponse en fréquence de l oreille: seuil de l audition et de la douleur 4. Analyse de la parole Traits acoustiques caractéristiques Evolution temporelle Quasi-stationnarité Analyse fréquentielle court-terme Distribution des formants pour les voyelles Note: certains schémas de ce support proviennent de 1. Rabiner et Juang, «Fundamentals of Speech Recognition», Prentice Hall, 1993 2. Boite et al., «Traitement de la parole», Presses Polytechniques et Universitaires Romandes, Collection électricité, 2000 3. http://catalogue.ircam.fr/sites/voix/decrire/index.html 1

1. Processus de production et de perception de la parole chez les humains 2

2. Production de la parole Définition L appareil phonatoire Vue d ensemble Larynx et cordes vocales Représentation schématique Définition de la parole: point de vue physiologique Les types de sons produits Production de la parole définition Production de la parole: action volontaire et coordonnée d un certain nombre de muscles du système articulatoire. 1. L appareil respiratoire fournit l énergie nécessaire à la production de sons, en poussant l air à travers l appareil phonatoire. 2. L appareil phonatoire inclut le larynx, les cordes vocales, différentes cavités (la bouche, le pharynx, le nez) et différents muscles ou mécanismes qui contrôlent la forme et l occlusion de ces cavités (la langue, la mâchoire, la luette, les lèvres). 3

Recette de production d un son Pour produire un son, il faut 1. produire un souffle 2. faire vibrer les cordes vocales 3. modeler et faire résonner les vibrations Appareil phonatoire vue d ensemble 4

Appareil phonatoire: les éléments Les «modulateurs» et «résonateurs» de l'appareil vocal sont : le larynx : mouvements souples et verticaux ; le voile du palais : obturation ou pas des cavités nasale; les mâchoires : position plus ou moins ouvertes ; la langue : formes très différentes; les dents : plus ou moins fermées, plus ou moins obturées par la langue, plus ou moins obturées par les lèvres ; les lèvres : plus ou moins fermées, plus ou moins pincées, plus ou moins étirées Appareil phonatoire le larynx - Sons voisés: lorsque les cordes vocales sont tendues, le flux d air les fait vibrer, c est la phonation. - Le flux d air est découpé en un train d impulsion quasi périodique qui «résonnent» dans les différentes cavités: pharynx, bouche et optionnellement nez. - Physiquement, le train d impulsion quasi périodique subit une modulation en fréquence en passant par les différentes cavités. - Différents muscles et mécanismes (mâchoire, langue, luette, lèvres, bouche) modifient la configuration des cavités pour produire les différents types de sons voisés. - Sons non-voisés: lorsque les cordes vocales sont relâchées, l air passe librement au niveau du larynx - De façon similaire aux sons voisés, différents muscles et mécanismes (mâchoire, langue, luette, lèvres, bouche) modifient la configuration des cavités pour produire les différents types de sons non-voisés. 5

Représentation schématique de la production de parole La parole d un point de vue physiologique Parole: séquence de sons qui correspond à une succession d états de l appareil phonatoire. Les états de l appareil phonatoire sont définis par : État des cordes vocales: tendues / relâchées Position, forme, taille des diverses cavités (pharynx, bouche, nez) et de leurs mécanismes d occlusion 6

Les types de sons produits (1/2) - Les états de l appareil phonatoire déterminent les natures des sons produits: 1. Voyelles: - Des voyelles sont produites lorsque le conduit vocal est ouvert - les cordes vocales vibrent (sons voisés) - la forme des cavités (essentiellement la bouche) modifie le timbre - les voyelles sont orales ou nasales selon que la cavité nasale n est pas ou est mise en parallèle à la cavité buccale - Orales: idée, ému, modèle, alarme, pâte, corps, beau, élu, loup, deux, peur, petite - Nasales: matin, temps, bon, brun Les types de sons produits (2/2) 2. Consonnes: - Des consonnes sont produites lorsqu un rétrécissement apparaît dans l appareil phonatoire - les cordes vocales peuvent vibrer ou laisser passer librement l air (sons voisés et non voisés) - les consonnes sont fricatives si le rétrécissement est partiel ou occlusives (plosives) si une occlusion totale apparaît dans l appareil phonatoire, causant une augmentation de la pression et un relâchement brutal de celle-ci lors de l ouverture - Fricatives non-voisées: chanter, soupe, facile - Fricatives voisées: jouer, zéro, vélo - Occlusives non-voisées: papa, tapis, carte - Occlusives voisées: bébé, début, gauche - Liquides: lapin, rayon - Nasales: maman, nord, grogner 7

Phonèmes Voyelles Semiconsonnes Consonnes Orales Nasales Fricatives Occlusives Liquides Nasales Voisées Non-voisées Voisées Non-voisées /a/ (a) /i/ (i) /e/ (é) /e/ (è) /f/ (eu) /œ/ (oe) /y/ (u) ~ / e/ (in) /œ/ ~ (un) /j/ (y) / / (ui) h /v/ (v) /z/ (z) / / (j) /f/ (f) /s/ (s) /Û/ (ch) /b/ (b) /d/ (d) /g/ (g) /k/ (k) /p/ (p) /t/ (t) /l/ (l) /r/ (r) /m/ (m) /n/ (n) / / (gn) / / (e) e /w/ (w) /u/ (ou) /o/ (au) / / (o) /a/ (â) c / / (on) ~ / a / (an) Alphabet phonétique international (1/2) 8

Alphabet phonétique international (2/2) 3. Perception de la parole Perception humaine Le système auditif Analyse fréquentielle Réponse en fréquence de l oreille seuil de l audition seuil de la douleur 9

Perception humaine L humain qualifie les sons suivants différents facteurs liés à des mesures physique: Intensité: - cause: une énergie plus ou moins forte en provenance du diaphragme ; - conséquence : cette énergie provoque une pression plus ou moins forte de l'air sous la glotte ; - résultat sonore : la variation de l'amplitude du son émis est plus ou moins grande. Hauteur : - cause : périodicité plus ou moins grande du battement des cordes vocales; - conséquence : cette périodicité produit une fréquence de la variation de pression de l'air plus ou moins grande ; - résultat sonore: le son est grave ou aigu Timbre : - cause : positionnement du voile du palais ; - conséquence : le son est plus ou moins riche en harmoniques graves ou aiguës ; - résultat sonore : le son semble clair ou pas, «riche», «sombre», «couvert» Le système auditif Les vibrations mécaniques du signal sont converties en impulsion nerveuses du nerf auditif par les cellules ciliées au niveau de la cochlée. 10

Analyse fréquentielle Il y a environ 25000 cellules ciliées qui sont réparties au niveau de la cochlée Une cellule ciliée «vibre» à une certaine fréquence dite de résonance La fréquence de résonance dépend de la position sur la cochlée. L oreille effectue donc une sorte d analyse en fréquence du signal acoustique La transformation en impulsion nerveuse est sensible à la fréquence mais est insensible à la phase. Réponse en fréquence de l oreille L oreille ne répond pas de manière égale à toutes les fréquences. La limite supérieure en fréquence est d environ 16000-20000 Hz Fréquence d échantillonnage Fe = 2 Fmax = 40000 Hz 11

4. Analyse de la parole Traits acoustiques caractéristiques Evolution temporelle Quasi-stationnarité Analyse fréquentielle court-terme Distribution des formants pour les voyelles Traits acoustiques du signal de parole Les traits acoustiques du signal de parole sont liés à sa production L énergie du son est liée à la pression de l air en amont du larynx Pour les sons voisés, la fréquence fondamentale correspond à la fréquence du cycle d ouverture/fermeture des cordes vocales La fréquence est déterminée par la tension du muscle qui les contrôle Sans action musculaire volontaire, cette fréquence varie peu Son spectre résulte du filtrage dynamique du signal en provenance du larynx (signal glottique) par le conduit vocal qui peut être considéré comme une succession de tubes ou de cavités acoustiques de sections diverses. Chaque trait acoustique est lui-même intimement lié à une grandeur perceptuelle : intensité, pitch (hauteur), et timbre. 12

Evolution temporelle d un signal (1/2) Evolution temporelle du signal de parole pour le mot «accumulation» prononcé en anglais Cette figure représente l évolution temporelle, ou audiogramme, du signal vocal On y constate une alternance de zones assez périodiques et de zones bruitées, les zones voisées et non voisées. L évolution temporelle ne fournit cependant pas directement les traits acoustiques du signal. Il est nécessaire, pour les obtenir, de mener à bien un ensemble de calculs ad-hoc. Evolution temporelle d un signal (2/2) Son voisé Son non-voisé 13

Quasi stationnarité La séquence de sons correspond à une succession d états de l appareil phonatoire Le signal est non-stationnaire au long-terme Le signal est quasi stationnaire à court terme Une analyse fréquentielle dite à «courtterme» peut donc s effectuer sur des tranches de signal d environ 30 ms. On utilise pour cela la transformée de Fourier. Analyse fréquentielle court-terme (1/3) 14

Analyse fréquentielle court-terme (2/3) Fréq fond (Pitch) Formants Exemple de son voisé: [a] de baluchon Analyse fréquentielle court-terme (2/3) Exemple de son non-voisé: [ch] de baluchon 15

Distribution des formants F1 et F2 pour les voyelles Compléments http://catalogue.ircam.fr/sites/voix/decrir e/index.html L. Rabiner, B. Juang, «Fundamentals of Speech Recognition», Prentice Hall, 1993 R. Boite et al., «Traitement de la parole», PPUR 2000 16