Débruitage de la parole (Speech enhancement)

Documents pareils
Projet de Traitement du Signal Segmentation d images SAR

Intérêt du découpage en sous-bandes pour l analyse spectrale

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Enregistrement et transformation du son. S. Natkin Novembre 2001

Calcul des indicateurs de sonie : revue des algorithmes et implémentation

Chaine de transmission

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Analyses psychoacoustiques dans ArtemiS SUITE

TP Modulation Démodulation BPSK

Transmission d informations sur le réseau électrique

Analyse des bruits de clavier d ordinateur

Systèmes de transmission

Communications numériques

Bandes Critiques et Masquage

Echantillonnage Non uniforme

10ème Congrès Français d'acoustique Lyon, Avril 2010


Chapitre I La fonction transmission

Quantification Scalaire et Prédictive

Mesure agnostique de la qualité des images.

La couche physique de l ADSL (voie descendante)

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Expérience 3 Formats de signalisation binaire

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

La nouvelle dimension de l analyse acoustique et vibratoire

Soutenance de stage Laboratoire des Signaux et Systèmes

2 g Net - 36 g emballé 2 tips silicone anallergique small + 2 medium + 2 filtres à membrane. 2 tailles d embouts

Projet audio. Analyse des Signaux ELE2700

Partie 1: Gestion de l interférence entre symboles

LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION

P2: Perception auditive

Recherche De Coalescences Binaires Étalonnage Du Détecteur

Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014

Logiciel d analyse et de gestion du bruit OUIE2000

Scanner acoustique NoiseScanner

CT-DECT GateCom 3W avec Fonction CT-ASR CT-DECT Bluetooth / tablette tactile et téléphones GSM Geschäftsbericht 09/10 I 1

Le concept cellulaire

Qualité perçue de parole transmise par voie téléphonique large-bande

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

ASSISTANCE TECHNIQUE INTERACTIVE TC

Les techniques de multiplexage

La structure du mobile GSM

Filtrage stochastique non linéaire par la théorie de représentation des martingales

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

8563A. SPECTRUM ANALYZER 9 khz GHz ANALYSEUR DE SPECTRE

Traitement du signal avec Scilab : transmission numérique en bande de base

La Perception Auditive

Rapport de stage. Implantation en virgule fixe d un codeur audio. Romain Serizel

TD1 Signaux, énergie et puissance, signaux aléatoires

Cours d Acoustique. Niveaux Sonores Puissance, Pression, Intensité

Transmission de données. A) Principaux éléments intervenant dans la transmission

Scarlett Plug-in Suite

«Le Dolby Digital 5.1 et les tests en champ libre par ordinateur»

Compatibilité Électromagnétique

2 Sur les Méthodes d Évaluation de la Qualité de la VoIP

REPRÉSENTATIONS ANALYTIQUES AVANCÉES AVEC EANALYSIS

J AUVRAY Systèmes Electroniques TRANSMISSION DES SIGNAUX NUMERIQUES : SIGNAUX EN BANDE DE BASE

Mise en pratique : Etude de spectres

Chapitre 2 Les ondes progressives périodiques

Traitement des plaintes sur le bruit et exigences aux entreprises qui le génèrent

Son et Mathématiques

LABO PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB

LISACode. Un simulateur opérationnel pour LISA. Antoine PETITEAU LISAFrance - le 16 mai 2006

COMPTE RENDU DE MESURES ACOUSTIQUES. Audibilité sirène PPI Presqu'île d' AMBES

Modélisation et simulation des performances de nœuds de routage optique dans les réseaux dorsaux hybrides

Telecommunication modulation numérique

Des HRTF aux Object-RTF : Système de prise de son 3D pour dispositifs nomades

Benchmark Accès Internet

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

ArtemiS 12 HEAD Data Portal 2.0 HEAD Recorder

Systèmes de communications numériques 2

Ordonnance du DFJP sur les instruments de mesure audiométriques

Internet et Multimédia Exercices: flux multimédia


SONS. Dossier pédagogique. Enseignants Niveau lycée

CHAPITRE V. Théorie de l échantillonnage et de la quantification

MAGTROL. Frein à courant de Foucault haute vitesse WB 23. WB 23 Fiche Technique CARACTÉRISTIQUES COMMANDE PAR PC DESCRIPTION

ISO/CEI NORME INTERNATIONALE

Acoustique - Vibrations

Technique de codage des formes d'ondes

Approche par marquage pour l évaluation de la qualité d image dans les applications multimédias

Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test

INTERPRÉTATION ET ANOMALIES DE LA PROSPECTION À RÉSONANCE MAGNÉTIQUE (MRS)

M1107 : Initiation à la mesure du signal. T_MesSig

Systèmes de communications numériques 2

Mesure de facteur de bruit sur analyseur de réseaux vectoriel corrigée en Paramètres-S. Frédéric Molina

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux

Travaux pratique (TP2) : simulation du canal radio sous ADS. Module FIP RT321 : Architectures des émetteurs-récepteurs radio

Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

TP SIN Traitement d image

Spectrophotométrie. Spectrophotomètre CCD2. Réf : Version 1.0. Français p 2. Version : 4105

Glossaire technique Veditec

PROTOCOLE SUR LE PARAMÉTRAGE DES INSTRUMENTS DE MESURE DU BRUIT

find your space Oreillettes Bluetooth de Plantronics Des solutions mains libres pour tous

RADIOBOX web radio Plan des émissions (Classe : élèves)

V corr Jacques Ferber. LIRMM - Université Montpellier II 161 rue Ada Montpellier Cedex 5

TP N 57. Déploiement et renouvellement d une constellation de satellites

Transcription:

Débruitage de la parole (Speech enhancement) Asmaa AMEHRAYE Sous l encadrement de: Mr D.Pastor Journée Scientifque TP'05 1

Plan Introduction Méthodes classiques Problématiques Apport de la psycho-acoustique Travaux effectués Démonstration Conclusion & Perspectives Journée Scientifque TP'05 2 1

Introduction Débruitage de la parole Pourquoi? Comment? Journée Scientifque TP'05 1 2

Système mono capteur Hypothèses: 1- Bruit additif s(n) + y(n) b(n) 2- Décorrélation entre bruit b(n) et parole propre s(n). Journée Scientifque TP'05 4 3

Méthodes classiques Soustraction spectrale Filtrage de Wiener Journée Scientifque TP'05 5 4

Soustraction spectrale Deux types de soustraction: SSA SSP Vue sous un angle de filtrage: Tel que: Journée Scientifque TP'05 6 5

Filtrage de Wiener L estimateur minimisant l'erreur quadratique moyenne entre le signal d'entrée et celui en sortie. Où Journée Scientifque TP'05 1 6

Problématiques 1- Estimation du bruit 2- Détection de l activité vocale (DAV) 3- Artéfacts: Bruit musical et Distorsions du signal Journée Scientifque TP'05 8 7

Estimation du bruit Moyenne du signal bruité durant les instants de silence Limitations DAV Bruit coloré Solutions: Un système fiable de Détection d Activité Vocal. Mise à jour de l estimation du bruit même en présence de la parole. Journée Scientifque TP'05 9 9

Détection de l activité vocale (DAV) 1.5 DAV idéal 1 0.5 0 0.5 0 0.5 1 1.5 2 2.5 3 x 10 5 Techniques: Taux de passage par zéro Seuillage d énergie Mesure de périodicité Statistiques d ordre supérieur Journée Scientifque TP'05 10 8

Bruit musical Bruit musical Gênant à la perception humaine Structure aléatoire Premières tentatives de réduire le bruit musical: Berouti [1] Boll [2] Tendance actuelle : Méthodes perceptuelles Journée Scientifque TP'05 11 10

Apport de la psycho-acoustique La présence physique d un son ne garantit pas sa perception auditive. Notions en psycho-acoustique Phénomène du masquage? Comment peut on se servir du masquage pour débruiter? Journée Scientifque TP'05 12 11

Notions de psychoacoustique L aire d audition absolu Courbes d isosonie Journée Scientifque TP'05 13 Bandes critiques 12

Phénomène du masquage Masquage fréquentiel: Bruit masquant une Tonale : BMT Tonale Masquant un Bruit : TMB Bruit masquant un Bruit : BMB Masquage temporel: Pré masquage Post masquage 80 db 70 60 50 40 30 20 10 f(hz) 0 0 1000 2000 3000 4000 5000 6000 7000 8000 Journée Scientifque TP'05 14 13

Q: Comment peut on exploiter le phénomène de masquage pour débruiter? Idée du filtrage perceptuel: Ne tenir compte que du bruit audible Intérêt: Le bruit inaudible servira de masquant pour le bruit résiduel Importance d une estimation précise de la courbe de masquage Journée Scientifque TP'05 15 14

Deux cas limite de l estimée de la courbe de masquage: 50 40 db Sur estimation de la courbe de masquage 70 60 db 30 50 20 10 0 10 Courbe de masquage réelle dsp du signal bruité f(hz) 20 0 1000 2000 3000 4000 5000 6000 7000 8000 40 30 20 Sous estimation de la courbe de masquage f(hz) 10 0 1000 2000 3000 4000 5000 6000 7000 8000 Le bruit résiduel augmente Les distorsions du signal augmentent Besoin d un compromis Journée Scientifque TP'05 16 15

Travaux effectués Etat de l art des algorithmes de débruitage perceptuel. L évaluation des performances des débruiteurs par des mesures objectives perceptuelles. Utiliser Wiener pour le calcul de la courbe de masquage. Pourquoi? Coupler l utilisation de Wiener, pour l estimation de la courbe de masquage, avec un filtrage perceptuel [3]. Et évaluation avec les critères MBSD et SSNR. Journée Scientifque TP'05 17 16

Filtre perceptuel Le filtre perceptuel proposé dans [3] est donné par: Où T k : La courbe de masquage dans le canal FFT k γ Bˆ : Densité spectrale de puissance du bruit Journée Scientifque TP'05 18 17

Démonstration Comparaison entre : Filtrage de Wiener Filtrage perceptuel Eléments d expérience: Fichiers parole de la Base Timit. RSB db ={-5; 0; 5; 10;15;20} Deux types de bruit : Babble de la base NOISEX Bruit Blanc Gaussien Bruit estimé pendant les silences d un DAV idéal Journée Scientifque TP'05 19 18

White noise & Résultats audio: Wiener Méthode perceptuelle Entrée-5dB -5dB Sortie-5dB Sortie-5dB Entrée0dB 0dB Sortie0dB Sortie0dB Entrée5dB 5dB Sortie5dB Sortie5dB Entrée10dB 10dB Sortie10dB Sortie10dB Journée Scientifque TP'05 20 19

Babble noise Résultats audio: Wiener Méthode perceptuelle Entrée-5dB -5dB Sortie-5dB Sortie-5dB Entrée0dB 0dB Sortie0dB Sortie0dB Entrée5dB 5dB Sortie5dB Sortie5dB Entrée10dB 10dB Sortie10dB Sortie10dB Journée Scientifque TP'05 21 20

Evaluation objective (white noise) Résultats MBSD Résultats SNR segmental Journée Scientifque TP'05 22 21

Conclusion L apport de la psycho-acoustique est net. Le besoin d un système de DAV fiable. L estimation du bruit dépend en grande partie de la fiabilité du DAV. Journée Scientifque TP'05 23 22

Perspectives Etude de l'apport d'outils nouveaux de détection et d'estimation non paramétriques [4]. Etude des potentialités des ondelettes dans le débruitage perceptuel. Améliorer l estimation de la courbe de masquage; voir si des corrections sont possibles. L'application de ces approches pour l'amélioration de l'intelligibilité audio et la reconnaissance automatique de la parole pour des applications de téléphonie mobile et de téléphonie main libre. Journée Scientifque TP'05 24

Perspectives Etude de l'apport d'outils nouveaux de détection et d'estimation non paramétriques [4]. Etude des potentialités des ondelettes dans le débruitage perceptuel. Améliorer l estimation de la courbe de masquage; voir si des corrections sont possibles. L'application de ces approches pour l'amélioration de l'intelligibilité audio et la reconnaissance automatique de la parole pour des applications de téléphonie mobile et de téléphonie main libre. Journée Scientifque TP'05 24

Références [1] M. Berouti, R. Schwartz, and J. Makhoul, Enhancement of speech corrupted by acoustic noise, in Proc. IEEE Int. Conf. on Acoustics,Speech, Signal Processing, Washington DC, 1979, pp. 208-211. [2] S. Boll, Suppression of acoustic noise in speech using spectral subtraction, IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 27, no. 2, 1979. [3] Te-Won Lee and Kaisheng Yao," Speech enhancement by perceptual filter with sequential noise parameter estimation ", Acoustics, Speech, and Signal Processing, 2004. Proceedings. (ICASSP 04). IEEE International Conference on Volume 1, Page(s): I - 693-6 vol.1, 17-21 May 2004 [4] D. Pastor On the detection of signals with unknown distributions and priors in white Gaussian noise, Collection des Rapports de Recherche de l ENST Bretagne, RR- 2006001-SC, 2006. Journée Scientifque TP'05 25 24