Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008



Documents pareils
Apprentissage Automatique

Théorie et codage de l information

Optimisation, traitement d image et éclipse de Soleil

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Modélisation du comportement habituel de la personne en smarthome

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Exercices Corrigés Premières notions sur les espaces vectoriels

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

CarrotAge, un logiciel pour la fouille de données agricoles

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Programmation linéaire

Plus courts chemins, programmation dynamique

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

1 Complément sur la projection du nuage des individus

Initiation à LabView : Les exemples d applications :

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

Limitations of the Playstation 3 for High Performance Cluster Computing

(Quelle identité par la parole?) Thèse. présentée à la section. Systèmes de Communication. par. Dominique Genoud

Chapitre 5 : Flot maximal dans un graphe

Projet de Traitement du Signal Segmentation d images SAR

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Exercice : la frontière des portefeuilles optimaux sans actif certain

Probabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Fonctions de plusieurs variables

Ministère de l Enseignement Supérieur et de la Recherche Scientifique

Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Extraction d informations stratégiques par Analyse en Composantes Principales

Algorithmes de recherche

Cours 02 : Problème général de la programmation linéaire

Optimisation Discrète

Identification de nouveaux membres dans des familles d'interleukines

Annexe 6. Notions d ordonnancement.

La classification automatique de données quantitatives

Physique quantique et physique statistique

Correction du baccalauréat ES/L Métropole 20 juin 2014

Module 7: Chaînes de Markov à temps continu

Eléments de Théorie des Graphes et Programmation Linéaire

Problème 1 : applications du plan affine

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Théorèmes de Point Fixe et Applications 1

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

INF6304 Interfaces Intelligentes

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Résolution d équations non linéaires

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

MCMC et approximations en champ moyen pour les modèles de Markov

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Application 1- VBA : Test de comportements d'investissements

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Agrégation des portefeuilles de contrats d assurance vie

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

ITIL V2. La gestion des niveaux de services

Analyse en Composantes Principales

Introduction à MATLAB R

INTRODUCTION AUX SYSTEMES D EXPLOITATION. TD2 Exclusion mutuelle / Sémaphores

Université du Québec à Chicoutimi THESE. Présentée à l'université du Québec à Chicoutimi Département des Sciences Appliquées

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Programmation linéaire

Comment développer et intégrer un module à PhpMyLab?

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

CHAPITRE 5 L AMORTISSEMENT DEGRESSIF

Reconnaissance du locuteur

Rapport : Base de données. Anthony Larcher 1

TELEVISION NUMERIQUE

INITIATION AU LANGAGE C SUR PIC DE MICROSHIP

Géoréférencement et RGF93

CNAM léments de cours Bonus-malus et Crédibilité

L'analyse des données à l usage des non mathématiciens

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Leçon 18 Coupes et sections

FORMATION INDIVIDUALISEE A LA GESTION. Classe de terminale technologique hôtellerie IMMOBILISATIONS. 1/3 l amortissement linéaire

Simulation de variables aléatoires

Mesure agnostique de la qualité des images.

Enjeux mathématiques et Statistiques du Big Data

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Une empreinte audio à base d ALISP appliquée à l identification audio dans un flux radiophonique

Correction de l examen de la première session

Reconnaissance de gestes : approches 2D & 3D

L isomorphisme entre les tours de Lubin-Tate et de Drinfeld et applications cohomologiques par Laurent Fargues

Expérience 3 Formats de signalisation binaire

Note:... Q1 :... Q2 :... Q3 :... Q4 :... Bonus :... Total :...

Codage de la parole à bas et très bas débit 1

Master Informatique Spécialité Développement et Applications sur Plateformes Mobiles

Introduction au Data-Mining

Résolution de systèmes linéaires par des méthodes directes

C f tracée ci- contre est la représentation graphique d une

Raisonnement probabiliste

Transcription:

Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1

Reconnaissance de la parole Introduction Approches pour la reconnaissance vocale Paramétrisation Distances et mesures de distortion spectrale Alignement Temporel et Programmation dynamique (DTW) Introduction aux modèles de Markov Cachés Base de données pour la reconnaissance Exemples d applications Gaël RICHARD Master IAD-PS Février 2008 2

Distorsions temporelles Un même locuteur ne peut pas prononcer plusieurs fois une même séquence vocale avec exactement le même rythme et la même durée totale Les échelles temporelles de deux occurences d'un même mot ne coïncident pas Les suites de vecteurs issus de la paramétrisation ne peuvent pas être comparées entre elles Gaël RICHARD Master IAD-PS Février 2008 3

Alignement Cas (irréaliste) où les deux séquences sont prononcées avec exactement le même rythme et la même durée (T y =T x ) Gaël RICHARD Master IAD-PS Février 2008 4

Alignement temporel linéaire Cas (un peu plus réaliste) où la déformation est linéaire: un mot et chacun de ses segments est prononcé plus rapidement et dans la même proportion Gaël RICHARD Master IAD-PS Février 2008 5

Alignement temporel linéaire Distance entre les séquences Gaël RICHARD Master IAD-PS Février 2008 6

Alignement temporel dynamique Cas (beaucoup plus réaliste) où la déformation entre les séquences est dynamique Gaël RICHARD Master IAD-PS Février 2008 7

Alignement temporel dynamique Fonctions de déformation Mesure de similarité entre les séquences Choix du meilleur chemin Gaël RICHARD Master IAD-PS Février 2008 8

Programmation dynamique (DTW) Permet (sous certaines conditions) d obtenir la solution optimale sans devoir considérer toutes les solutions possibles Principe de base: la solution optimale peut être obtenue à partir de solutions intermédiaires optimales La distance optimale est obtenue en calculant, pour chaque point, la distance cumulée correspondant à la distance optimale que l'on obtient en comparant les deux sous-séquences (sous-politiques) Gaël RICHARD Master IAD-PS Février 2008 9

Programmation dynamique (DTW) Distance accumulée minimale entre (1,1) et où Le facteur de normalisation sera utilisé une fois que le point final aura été atteint Gaël RICHARD Master IAD-PS Février 2008 10

Programmation dynamique (DTW) Rajout de contraintes Avec la distance pondérée définie par: Ls est le nombre de déplacements dans le chemin pour aller de à Gaël RICHARD Master IAD-PS Février 2008 11

Exemples de contraintes locales Gaël RICHARD Master IAD-PS Février 2008 12

Utilisation en reconnaissance vocale Repose sur l utilisation de contraintes supplémentaires: Des contraintes de monocité Point de départ (début des deux mots): (1,1) Point d arrivée (fin des deux mots): (T x,t y,) Des contraintes globales Réduction de l espace de recherche Des contraintes locales Prédécesseurs limités à quelques éléments proches Chemins uniquement Gauche-droite Utilisation de poids (pénalités) suivant les chemins Gaël RICHARD Master IAD-PS Février 2008 13

Implémentation (DTW) Initialisation de la matrice D des distances cumulées Calculer les distance locales pour tous les autres éléments de la première colonne de D: Si la transition verticale est autorisée, calculer les distances accumulées de la première colonne: Sinon les distances sont égales à l infini. Passer à la colonne suivante et ainsi de suite. Lorsque le dernier point est atteint, réinjecter le coefficient de normalisation Gaël RICHARD Master IAD-PS Février 2008 14

Exemple (DTW) Soit les séquences A=(1 2 2 4 6) (séquence test)) B =(2 3 4 5 6 7 ) (référence en mémoire) C= (1 2 4 4 6 6) (référence en mémoire) Calculer la matrice des distances locales avec d(i,j) = (s(i) s(j)) 2 Calculer la matrice des distances cumulées avec la contrainte locale suivante: Retrouver le chemin optimal en suivant les valeurs les plus faibles (et au besoin en favorisant la diagonale) Gaël RICHARD Master IAD-PS Février 2008 15

Exemple: corrigé (DTW) Distances locales Distances cumulées B 7 6 5 4 3 2 36 25 25 9 25 16 16 4 16 9 9 1 9 4 4 0 4 1 1 1 1 0 0 4 1 0 1 2 2 4 6 A 1 4 9 16 C= 4 / 9 91 66 66 16 55 31 31 7 30 15 15 3 14 6 6 2 5 2 2 3 1 1 1 5 4 3 4 6 12 21 Gaël RICHARD Master IAD-PS Février 2008 16

Exemple: corrigé (DTW) C 6 6 4 4 2 1 Distances locales 25 16 16 4 25 16 16 4 9 4 4 0 9 4 4 0 1 0 0 4 0 1 1 9 0 0 1 2 2 4 6 A 4 4 16 25 C= 0 /9 =0 Distances cumulées 69 40 40 8 44 24 24 4 19 8 8 0 10 4 4 0 1 0 0 4 0 1 2 11 0 0 4 4 20 36 Possibilité d initialiser D(0,0) à 1 Gaël RICHARD Master IAD-PS Février 2008 17

Région de recherche du chemin optimal (d après Rabiner93) Gaël RICHARD Master IAD-PS Février 2008 18

Relâchement de contraintes aux extrémités Gaël RICHARD Master IAD-PS Février 2008 19

Reconnaissance de mots connectés Séquence reconnue: K K 1 K k Gaël RICHARD Master IAD-PS Février 2008 20

DTW: discussion Très utilisé dès les années 70. Actuellement moins utilisée mais est à la base des systèmes utilisant les HMM Nombreuses améliorations développées: Adaptation à la variabilité Multi-références Références obtenues par Quantification Vectorielle (k-means) Adaptation multi-locuteur Gaël RICHARD Master IAD-PS Février 2008 21