Reconnaissance des sons de l environnement dans un contexte domotique

Documents pareils
Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Apprentissage Automatique

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole

Transmission d informations sur le réseau électrique

Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté

PRODUIRE DES SIGNAUX 1 : LES ONDES ELECTROMAGNETIQUES, SUPPORT DE CHOIX POUR TRANSMETTRE DES INFORMATIONS

Ministère de l Enseignement Supérieur et de la Recherche Scientifique

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Modélisation du comportement habituel de la personne en smarthome

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

1. PRESENTATION DU PROJET

Caractéristiques des ondes

Chaine de transmission

DOMONIAL CRT 500 HF. Notice Utilisateur EKZ C SECOM AUTOPROTECTION PILE A U SUPERVISION OUVERTURE ALARME INTRUSION ALARME TECHNIQUE

UNE PLATEFORME MULTI-MODALE POUR LA TÉLÉVIGILANCE MEDICALE

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Paramétrisation adaptée de transitoires pour la reconnaissance d instruments de musique

Extraction de descripteurs musicaux: une approche évolutionniste

Les techniques de multiplexage

Initiation à LabView : Les exemples d applications :

P2: Perception auditive

Téléinformatique. Chapitre V : La couche liaison de données dans Internet. ESEN Université De La Manouba

EMETTEUR ULB. Architectures & circuits. Ecole ULB GDRO ESISAR - Valence 23-27/10/2006. David MARCHALAND STMicroelectronics 26/10/2006

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

SCL LOGICIEL DE CONTROL

Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014

DETECTOR BICANAL FG2 1. DIMENSIONS ET CONNEXIONS ELECTRIQUES 2. GENERALITES. 24 VDC Alimentat. 24 Vcc. Contact Boucle Contact Boucle 1 6 7

Chapitre 2 Les ondes progressives périodiques

L efficience énergétique...

MANUEL D UTILISATION (simplifié) DE LA CENTRALE LS-30

Rapport. Mesures de champ de très basses fréquences à proximité d antennes de stations de base GSM et UMTS

Ordonnance du DFJP sur les instruments de mesure audiométriques

Votre Réseau est-il prêt?

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Repérage de l artillerie par le son.

Chapitre 5 Émetteurs et récepteurs sonores

Notice Utilisateur EKZ A STORIA CRT 600 HF

Mini_guide_Isis.pdf le 23/09/2001 Page 1/14

Multichronomètre SA10 Présentation générale

Monitoring continu et gestion optimale des performances énergétiques des bâtiments

DESCRIPTIF DES PROJETS 3EME ANNEE QUI SERONT PRESENTES LORS DE LA JOURNEE DE PROJET DE FIN D ETUDE LE 26/01/2012

Câblage des réseaux WAN.

Scopia Desktop. Sommaire

Interactions sonores et vocales dans l habitat

FICHE PRODUIT CSI 6500 Machinery Health TM Monitor

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

Calcul des indicateurs de sonie : revue des algorithmes et implémentation

NOTICE D EMPLOI SLT-TR

SMS-COM LT RAILS DIN V Manuel d installation, de programmation et d utilisation.

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

TeamConnect. SL TeamConnect CU1, Unité centrale SL TeamConnect CB1, Combox CARACTÉRISTIQUES

Détection des deux roues motorisés par télémétrie laser à balayage

Efficacité énergétique pour les particuliers : une solution pour le monitoring énergétique

Bandes Critiques et Masquage

Algorithmique I. Algorithmique I p.1/??

CT-DECT GateCom 3W avec Fonction CT-ASR CT-DECT Bluetooth / tablette tactile et téléphones GSM Geschäftsbericht 09/10 I 1

Contributions à l expérimentation sur les systèmes distribués de grande taille

Table des matières. 1. But. 2. Scénario de base. 3. Simulations

CLASSE VIRTUELLE UTILISATION DE CENTRA

Efficace et ciblée : La surveillance des signaux de télévision numérique (2)

TP Modulation Démodulation BPSK

Internet et Multimédia Exercices: flux multimédia

Chapitre I La fonction transmission

Solutions logicielles de gestion énergétique coopérante smart building in smart grid : Exemple CANOPEA. Xavier Brunotte info@vesta-system.

Introduction au Data-Mining

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

INTRODUCTION AUX TESTS DE PERFORMANCE ET DE CHARGE

Programme de réhabilitation respiratoire

Date De Création 14/05/2013. PIC Poitou Charente. Préparé par : Cécilia CHARTIER. Modification 14/05/2013

Mini_guide_Isis_v6.doc le 10/02/2005 Page 1/15

Scanner acoustique NoiseScanner

Comparatif entre Matrox RT.X2 et Adobe Premiere Pro CS3 (logiciel seul)

SIMPL'VOX. Notice d'utilisation. Transmetteur téléphonique vocal. Version 1.1

ScoopFone. Prise en main rapide

SEMINAIRES & ATELIERS EN TÉLÉCOMMUNICATIONS RESEAUX

EPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE

Quantification Scalaire et Prédictive

Vérification audiovisuelle de l identité

Chapitre 2 Caractéristiques des ondes

Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)

Expérience 3 Formats de signalisation binaire


Résonance Magnétique Nucléaire : RMN

Logiciel d analyse et de gestion du bruit OUIE2000

Réussir son installation domotique et multimédia

ÉTUDE ET DÉVELOPPEMENT D UN SYSTÈME EXPERT BASÉ SUR LES RÉSEAUX DE NEURONES POUR LE DIAGNOSTIC DES DÉFAUTS DE ROULEMENTS

ACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur

Numérisation du signal

Touch PC tébis: L écran tactile pour le montage encastré et en paroi creuse

Commutateur statique de transfert Liebert La solution incontournable pour vos systèmes d alimentation à haute disponibilité

ADSL. Étude d une LiveBox. 1. Environnement de la LiveBox TMRIM 2 EME TRIMESTRE LP CHATEAU BLANC CHALETTE/LOING NIVEAU :

Relever les défis des véhicules autonomes

Intérêt du découpage en sous-bandes pour l analyse spectrale

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

Le rôle de l assureur Accident du Travail en Belgique

Limitations of the Playstation 3 for High Performance Cluster Computing

TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3 & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3. SIMULATION 7 " - 4.

Transcription:

Reconnaissance des sons de l environnement dans un contexte domotique Mohamed El Amine SEHILI ESIGETEL-TSP Le 05 Juillet 2013 Directeur de thèse : Bernadette Dorizzi (Télécom SudParis) Co-encadrants : Dan Istrate (Esigetel), Jérôme Boudy (Télécom SudParis) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 1

Plan 1 Contexte : Projet Sweet-Home 2 Objectifs de la thèse 3 État de l art en classification des sons de l environnement 4 Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 5 Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 6 Conclusions et Perspectives Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 2

Plan Contexte : Projet Sweet-Home 1 Contexte : Projet Sweet-Home 2 Objectifs de la thèse 3 État de l art en classification des sons de l environnement 4 Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 5 Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 6 Conclusions et Perspectives Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 3

Changements démographiques : un aperçu Contexte : Projet Sweet-Home Un taux de vieillissement en croissance... Figure: Personnes âgées de 65 ans et plus en Europe en 2010 (Basé sur les données du CIA World Factbook) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 4

Contexte : Projet Sweet-Home Problématique : maintien des personnes âgées au domicile Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 5

Contexte : Projet Sweet-Home Problématique : maintien des personnes âgées au domicile Télé-vigilance médicale : Utiliser plusieurs types de capteurs (informations sur l environnement et sur la personne) Image Détection de chute Tension artérielle Son Température Détection de présence Taux de glycémie Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 5

Contexte : Projet Sweet-Home Problématique : maintien des personnes âgées au domicile Télé-vigilance médicale : Utiliser les avancées en télécommunications et en technologies de l information Personne âgée Médecins / Aides-soignants Collecte locale D informations Réseau Plate-forme logicielle Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 6

Contexte : Projet Sweet-Home Problématique : maintien des personnes âgées au domicile Télé-vigilance médicale : Utiliser les avancées en télécommunications et en technologies de l information Secours Personne âgée Famille Médecins / Aides-soignants Collecte locale D informations Réseau Plate-forme logicielle Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 7

Projet Sweet-Home Contexte : Projet Sweet-Home Un projet ANR (Agence Nationale de la Recherche) VERSO de recherche industrielle (2010-2013) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 8

Projet Sweet-Home Contexte : Projet Sweet-Home Un projet ANR (Agence Nationale de la Recherche) VERSO de recherche industrielle (2010-2013) Télé-vigilance médicale Domotique Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 9

Projet Sweet-Home Contexte : Projet Sweet-Home Un projet ANR (Agence Nationale de la Recherche) VERSO de recherche industrielle (2010-2013) Télé-vigilance médicale Domotique Détection des situations de détresse : Reconnaissance et analyse de la parole Reconnaissance des sons de l environnement Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 10

Projet Sweet-Home Contexte : Projet Sweet-Home Un projet ANR (Agence Nationale de la Recherche) VERSO de recherche industrielle (2010-2013) Télé-vigilance médicale Détection des situations de détresse : Reconnaissance et analyse de la parole Reconnaissance des sons de l environnement Domotique Automatisation de la maison : Commande vocale Commande tactile Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 11

Plan Objectifs de la thèse 1 Contexte : Projet Sweet-Home 2 Objectifs de la thèse 3 État de l art en classification des sons de l environnement 4 Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 5 Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 6 Conclusions et Perspectives Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 12

Motivations et défis de la thèse Objectifs de la thèse Objectif : Reconnaître les sons de l environnement dans une maison intelligente. Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 13

Motivations et défis de la thèse Objectifs de la thèse Objectif : Reconnaître les sons de l environnement dans une maison intelligente. C est à dire : Séparer la parole des autres sons améliorer les performances de la reconnaissance de la parole Reconnaître des sons de la vie courante aider le système de décision à détecter des situations anormales Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 13

Motivations et défis de la thèse Objectifs de la thèse Objectif : Reconnaître les sons de l environnement dans une maison intelligente. C est à dire : Défis : Séparer la parole des autres sons améliorer les performances de la reconnaissance de la parole Reconnaître des sons de la vie courante aider le système de décision à détecter des situations anormales Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 13

Motivations et défis de la thèse Objectifs de la thèse Objectif : Reconnaître les sons de l environnement dans une maison intelligente. C est à dire : Défis : Séparer la parole des autres sons améliorer les performances de la reconnaissance de la parole Reconnaître des sons de la vie courante aider le système de décision à détecter des situations anormales Nombre élevé de classes de sons Variations entre les sons d une même classe et similitudes entre les sons de classes différentes Bruit de l environnement (tout son sans intérêt) Acquisition multi-canaux (plusieurs micros dans la maison) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 13

Classes de sons Objectifs de la thèse Sons humains Sons non humains Respiration Bris de glace Sèche Cheveux Toux Éternuement Clés Rire Pleur Claquement de porte Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 14

Architecture d un système de reconnaissance du son Objectifs de la thèse Production du son Acquisition Signal audio numérique Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 15

Architecture d un système de reconnaissance du son Objectifs de la thèse Production du son Acquisition Signal audio numérique Fenêtre de signal de très courte durée (~20ms) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 16

Architecture d un système de reconnaissance du son Objectifs de la thèse Production du son Acquisition Signal audio numérique Fenêtre de signal de très courte durée (~20ms) Extraction des paramètres Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 17

Architecture d un système de reconnaissance du son Objectifs de la thèse Production du son Acquisition Signal audio numérique Fenêtre de signal de très courte durée (~20ms) Extraction des paramètres Format de données utilisable pour la reconnaissance du son (exemple de coefficients : MFCC) Vecteurs de coefficients acoustiques Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 18

Architecture d un système de reconnaissance du son Objectifs de la thèse Production du son Acquisition Signal audio numérique Fenêtre de signal de très courte durée (~20ms) Extraction des paramètres Format de données utilisable pour la reconnaissance du son (exemple de coefficients : MFCC) Vecteurs de coefficients acoustiques Algorithme d apprentissage Modèles Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 19

Voies de recherche Objectifs de la thèse Extraction des paramètres Algorithme d apprentissage Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 20

Voies de recherche Objectifs de la thèse Extraction des paramètres Première voie de recherche : Exploration et utilisation de plusieurs méthodes de reconnaissance Algorithme d apprentissage Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 21

Voies de recherche Objectifs de la thèse Seconde voie de recherche : Utilisation de plusieurs familles de coefficients acoustiques Extraction des paramètres Première voie de recherche : Exploration et utilisation de plusieurs méthodes de reconnaissance Algorithme d apprentissage Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 22

Plan État de l art en classification des sons de l environnement 1 Contexte : Projet Sweet-Home 2 Objectifs de la thèse 3 État de l art en classification des sons de l environnement 4 Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 5 Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 6 Conclusions et Perspectives Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 23

Domaines les plus influents État de l art en classification des sons de l environnement Peu de travaux spécifiques... Reconnaissance de la parole Reconnaissance du locuteur Reconnaissance des événements acoustiques Reconnaissance d objets sur des images Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 24

Domaines les plus influents État de l art en classification des sons de l environnement Peu de travaux spécifiques... Coefficients MFCC Modèles de Markov Cachés (HMMs) Reconnaissance de la parole Reconnaissance du locuteur Reconnaissance des événements acoustiques Reconnaissance d objets sur des images Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 25

Domaines les plus influents État de l art en classification des sons de l environnement Peu de travaux spécifiques... Coefficients MFCC Modèles de Markov Cachés (HMMs) Reconnaissance de la parole Reconnaissance du locuteur Reconnaissance des événements acoustiques Reconnaissance d objets sur des images GMMs SVMs Noyaux SVM de classification de séquences Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 26

Domaines les plus influents État de l art en classification des sons de l environnement Peu de travaux spécifiques... Coefficients MFCC Modèles de Markov Cachés (HMMs) Reconnaissance de la parole Reconnaissance du locuteur Reconnaissance des événements acoustiques Reconnaissance d objets sur des images GMMs SVMs Noyaux SVM de classification de séquences Techniques de reconnaissance appliquées à une représentation 2D du signal audio (Spectrogramme) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 27

Plan Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 1 Contexte : Projet Sweet-Home 2 Objectifs de la thèse 3 État de l art en classification des sons de l environnement 4 Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 5 Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 6 Conclusions et Perspectives Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 28

Motivations Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Pourquoi s inspirer de la Reconnaissance Automatique du Locuteur (RAL)? Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 29

Motivations Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Pourquoi s inspirer de la Reconnaissance Automatique du Locuteur (RAL)? Domaine plus ou moins proche (un locuteur une classe de sons) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 29

Motivations Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Pourquoi s inspirer de la Reconnaissance Automatique du Locuteur (RAL)? Domaine plus ou moins proche (un locuteur une classe de sons) État de l art assez riche Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 29

Motivations Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Pourquoi s inspirer de la Reconnaissance Automatique du Locuteur (RAL)? Domaine plus ou moins proche (un locuteur une classe de sons) État de l art assez riche Méthodes retenues Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 29

Motivations Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Pourquoi s inspirer de la Reconnaissance Automatique du Locuteur (RAL)? Domaine plus ou moins proche (un locuteur une classe de sons) État de l art assez riche Méthodes retenues Modèles de Mélanges Gaussiens (GMM pour Gaussian Mixture Models) Machines à Vecteurs de Support (SVM pour Support Vector Machines). Deux variantes utilisées : Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 29

Motivations Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Pourquoi s inspirer de la Reconnaissance Automatique du Locuteur (RAL)? Domaine plus ou moins proche (un locuteur une classe de sons) État de l art assez riche Méthodes retenues Modèles de Mélanges Gaussiens (GMM pour Gaussian Mixture Models) Machines à Vecteurs de Support (SVM pour Support Vector Machines). Deux variantes utilisées : Utilisation directe des vecteurs acoustiques en entée Utilisation des vecteurs acoustiques après transformation Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 29

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons GMM pour la reconnaissance du son GMM : un modèle probabiliste représentant un mélange de plusieurs distributions. Extraction des paramètres Modèle GMM Classe 1 Modèle GMM Classe 2 Sortie : classe la plus probable Modèle GMM Classe N Reconnaissance reco-scheme-gmm des sons de l environnement dans un contexte domotique M.A.SEHILI 30

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons SVM pour la reconnaissance du son SVM : une méthode classification supervisée permettant de discriminer deux classes Première variante : classification directe des vecteurs acoustiques Extraction des paramètres Sortie : meilleure classe A B C D Classe 1 VS Classe 2 Classe 3 VS Classe 4 Classe 5 VS Classe 6 Classe 7 VS Classe 8 E A VS B F C VS D G E VS F Approche peu efficace et coûteuse en temps de calcul Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 31

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons SVM pour la reconnaissance du son Seconde variante : avant la classification, transformer la séquence de vecteurs acoustiques en un seul grand vecteur, appelé Super Vecteur Extraction des paramètres Sortie : meilleure classe Transformation La séquence de vecteurs est transformée en un seul vecteur (Super Vecteur) A B C D Classe 1 VS Classe 2 Classe 3 VS Classe 4 Classe 5 VS Classe 6 Classe 7 VS Classe 8 E A VS B F C VS D G E VS F Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 32

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Méthode de transformation retenue Noyau SVM-GSL (SVM GMM Super Vector Linear Kernel) [Campbell et al, 2006] Signal audio Extraction Extraction des des paramètres paramètres Vecteur composé des moyennes du modèle GMM UBM adapté Modèle GMM UBM initial Séquence de Vecteurs acoustiques Adaptation Adaptation Maximum Maximum A Posteriori Posteriori Modèle GMM UBM adapté μ 1 μ 2 μ K Super Vecteur Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 33

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons SVM : utilisation d un noyau de classification de séquences Transformation en Super Vecteur Transformation en Super Vecteur Classe +1 Transformation en Super Vecteur SVM Vecteurs Acoustiques Super Vecteurs Transformation en Super Vecteur Transformation en Super Vecteur Classe -1 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 34

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Tests et résultats Base de données de l Esigetel : Classe de sons Nombre de fichiers Durée totale (sec). Conditions d enreg. variables Breathing 50 106.44 Oui Cough 62 181.69 Oui Dishes 98 303.77 Oui DoorClapping 114 62.70 Oui DoorOpening 21 138.94 Non ElectricalShaver 62 420.33 Non FemaleCry 36 268.19 Oui FemaleScream 70 216.83 Oui GlassBreaking 101 99.52 Oui HairDryer 40 224.86 Non HandsClapping 54 218.65 Oui Keys 36 166.34 Oui Laugh 49 272.65 Oui MaleScream 87 202.11 Oui Paper 63 330.66 Oui Sneeze 32 51.67 Oui Water 54 484.72 Oui Yawn 20 95.87 Oui Total 1049 3845.94 - Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 35

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Tests et résultats Fréquence d échantillonage des fichiers audio : 16KHz Coefficients acoustiques utilisés : MFCC Taille de fenêtre : 16ms La base de données est divisée en trois parties : Une partie pour créer les modèles GMM et le modèle UBM Une partie pour créer les Super Vecteurs Une partie pour les tests Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 36

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Tests et résultats Fréquence d échantillonage des fichiers audio : 16KHz Coefficients acoustiques utilisés : MFCC Taille de fenêtre : 16ms La base de données est divisée en trois parties : Une partie pour créer les modèles GMM et le modèle UBM Une partie pour créer les Super Vecteurs Une partie pour les tests Résultats (comparaison entre GMM et SVM-GSL) : Méthode Taux de Reconnaissance (%) GMM 71.1 SVM-GSL (taille UBM = 256) 74.0 SVM-GSL (taille UBM = 512) 75.4 SVM-GSL (taille UBM = 1024) 75.1 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 36

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Tests et résultats Résultats par classe de sons : Classe de sons Taux de bonnes reconnaissances Breathing 9/17 Cough 15/21 Dishes 14/33 DoorClapping 36/38 DoorOpening 7/7 ElectricalShaver 20/21 FemaleCry 8/12 FemaleScream 19/24 GlassBreaking 25/34 HairDryer 14/14 HandsClapping 17/18 Keys 10/12 Laugh 2/17 MaleScream 27/29 Paper 19/21 Sneeze 10/11 Water 12/18 Yawn 3/7 Les classes présentant peu de variabilité sont très bien reconnues Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 37

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Tests et résultats Résultats par classe de sons : Classe de sons Taux de bonnes reconnaissances Breathing 9/17 Cough 15/21 Dishes 14/33 DoorClapping 36/38 DoorOpening 7/7 ElectricalShaver 20/21 FemaleCry 8/12 FemaleScream 19/24 GlassBreaking 25/34 HairDryer 14/14 HandsClapping 17/18 Keys 10/12 Laugh 2/17 MaleScream 27/29 Paper 19/21 Sneeze 10/11 Water 12/18 Yawn 3/7 Certaines classes présentant des variabilités sont également très bien reconnues Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 38

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Tests et résultats Résultats par classe de sons : Classe de sons Taux de bonnes reconnaissances Breathing 9/17 Cough 15/21 Dishes 14/33 DoorClapping 36/38 DoorOpening 7/7 ElectricalShaver 20/21 FemaleCry 8/12 FemaleScream 19/24 GlassBreaking 25/34 HairDryer 14/14 HandsClapping 17/18 Keys 10/12 Laugh 2/17 MaleScream 27/29 Paper 19/21 Sneeze 10/11 Water 12/18 Yawn 3/7 Certaines classes restent difficiles à reconnaître Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 39

Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons Tests et résultats Il existe des classes sons très mal séparées par les coefficients MFCC quel que soit le classifieur. Notre contribution originale : Définir des familles de coefficients variées pour la classification du son. Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 40

Plan Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 1 Contexte : Projet Sweet-Home 2 Objectifs de la thèse 3 État de l art en classification des sons de l environnement 4 Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 5 Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 6 Conclusions et Perspectives Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 41

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Différences entres classes de sons : un aperçu A l écoute, certains types de sons sont très différents Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 42

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Différences entres classes de sons : un aperçu A l écoute, certains types de sons sont très différents Les différences au niveau du signal peuvent aussi être importantes Toux Claquement de porte Rasoir éléctrique Cris Figure: Spectrogrammes de 4 enregistrements de 4 classes différentes Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 42

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Différences entres classes de sons : un aperçu Enveloppe d amplitude pour des enregistrements de bris de glace Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 43

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Différences entres classes de sons : un aperçu Enveloppe d amplitude pour des enregistrements de bris de glace registrements d un sèche Enveloppe d amplitude pour des en- cheveux Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 43

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Aller au-delà des MFCC : utiliser d autres familles de coefficients acoutiques Motivations : Améliorer les performances : extraire des caractéristiques du signal non représentées par les MFCC Opter pour des familles moins complexes si elles permettent d obtenir les mêmes performances Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 44

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Aller au-delà des MFCC : utiliser d autres familles de coefficients acoutiques Motivations : Améliorer les performances : extraire des caractéristiques du signal non représentées par les MFCC Opter pour des familles moins complexes si elles permettent d obtenir les mêmes performances Approche : Utiliser des familles de coefficients acoustiques différentes Utiliser le savoir faire acquis en matière de méthodes de reconnaissance (GMM, SVM) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 44

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Familles de coefficients retenues Famille de coefficients Nombre de caractéristiques MFCC 16 Loudness 24 Spectral Crest Factor Per Band 19 Spectral Flatness Per Band 19 Complex Domain Onset Detection 1 Perceptual Sharpness 1 Perceptual Spread 1 Spectral Roll-Off 1 Spectral Decrease 1 Spectral Flatness 1 Spectral Variation 1 Spectral Slope 1 Spectral Shape Statistics 4 Temporal Shape Statistics 4 Total 94 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 45

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Utilisation de plusieurs familles avec des GMMs Utiliser des vecteurs contenant toutes les familles de coefficients : Extraction de plusieurs familles de coefficients Famille de coeff. 1 Famille de coeff. 2 GMM Famille de coeff. N Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 46

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Utilisation de plusieurs familles avec des SVMs Une transformation des données est nécessaire... Séquences de vecteurs Un seul vecteur Famille de coeff. 1 Famille de coeff. 2 Transf. en un seul vecteur Transf. en un seul vecteur SVM Famille de coeff. N Transf. en un seul vecteur Deux méthodes de transformations proposées : SVM-StatVect et SVM-ProbVect Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 47

SVM-StatVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Transformer une séquence de vecteurs acoustiques en un un seul vecteur de coefficients statistiques 1 Caract. Calcul des coefficients statistiques Séquence de vecteurs acoustiques Moyenne μ Écart-Type σ Rapport μ/σ Centroid Spread Skewness Kurtosis 7 Coefficients statistiques Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 48

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Comment exploiter les familles de coefficients à une seule caractéristique? Spectral Roll-Off : La fréquence au-dessous de laquelle se trouve 95% du signal Une seule valeur par fenêtre de signal Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 49

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Comment exploiter les familles de coefficients à une seule caractéristique? Spectral Roll-Off : La fréquence au-dessous de laquelle se trouve 95% du signal Une seule valeur par fenêtre de signal Exemple : variation dans le temps du Spectral Roll-Off pour deux classes de sons 8000 7000 6000 Spectral Roll-Off 5000 4000 3000 2000 1000 0 Temps (ms) EShaver-001 EShaver-002 EShaver-003 FScream-001 FScream-002 FScream-003 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 49

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons A Deux classes peuvent être aisément séparables Classe X Temps Classe Y Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 50

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons A Intervalle 2 Seuil Θ1 Intervalle 1 Méthode simple de séparation : trouver un seuil et définir deux intervalles Classe X Temps Classe Y Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 51

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons A La séparation entre les deux classes peut être plus difficile Classe X Temps Classe Y Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 52

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons A Intervalle 2 Seuil Θ1 Intervalle 1 Un seul seuil peut générer beaucoup d erreurs de classification Classe X Temps Classe Y Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 53

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Seuil Θ3 A Intervalle 4 Intervalle 3 Seuil Θ2 Intervalle 2 Seuil Θ1 Intervalle 1 Une solution : trouver plusieurs seuils pour minimiser les erreurs de classification Classe X Temps Classe Y Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 54

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Intervalle 4 Seuil Θ3 Intervalle 3 Seuil Θ2 Intervalle 2 Seuil Θ1 Intervalle 1 P(X, i4) P(Y, i4) P(X, i3) P(X, i2) P(X, i1) P(Y, i3) P(Y, i2) P(Y, i1) SVM-ProbVect : une classe est représentée par un vecteur contenant la probabilité de la classe dans chaque intervalle Classe X Classe Y Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 55

SVM-ProbVect Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Intervalle 4 Seuil Θ3 P(X, i4) P(Y, i4) Intervalle 3 P(X, i3) P(Y, i3) SVM-ProbVect : les Seuil Θ2 vecteurs de probabilités Intervalle 2 Seuil Θ1 P(X, i2) P(Y, i2) sont utilisés en entrée d un SVM Intervalle 1 P(X, i1) P(Y, i1) Classe X Classe Y SVM Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 56

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Comment trouver les intervalles? En utilisant des méthodes de discrétisation supervisées : Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 57

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Comment trouver les intervalles? En utilisant des méthodes de discrétisation supervisées : Méthodes utilisées pour transformer des valeurs continues en valeurs discrètes Peuvent être utilisées pour créer des arbres de décision Permettent de trouver les seuils qui donnent une bonne corrélation entre un intervalle donné et une classe particulière Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 57

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Comment trouver les intervalles? En utilisant des méthodes de discrétisation supervisées : Méthodes utilisées pour transformer des valeurs continues en valeurs discrètes Peuvent être utilisées pour créer des arbres de décision Permettent de trouver les seuils qui donnent une bonne corrélation entre un intervalle donné et une classe particulière Méthode retenue Méthode de Fayyad et Irani (1993) Méthode basée sur la minimisation de l entropie Bonnes performances pour plusieurs problèmes de classification [Dougherty 95, Liu Huan 2002] Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 57

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Résultats : comparaison entre GMM et SVM-StatVect Famille de Coefficients GMM SVM-StatVect MFCC 75.9 63.2 Loudness 70.3 66.9 Spectral Crest F. P. B. 67.7 66.6 Spectral Flatness P. B. 64.1 65.5 Spectral Shape Stat. 46.8 55.3 Toutes les Familles 72.3 76.5 GMM : une baisse en performances est observée si toutes les familles de coefficients sont fusionnées SVM-StatVect : Les meilleures performances sont utilisées lorsque toutes les familles sont fusionnées Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 58

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Comparaison de toutes les méthodes En utilisant toutes les familles de coefficients ensemble : GMM : 72.3% SVM-StatVect : 76.5% SVM-ProbVect : 76.2% Fusion entre SVM-StatVect et SVM-ProbVect : 79.0% Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 59

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Comparaison de toutes les méthodes En utilisant toutes les familles de coefficients ensemble : GMM : 72.3% SVM-StatVect : 76.5% SVM-ProbVect : 76.2% Fusion entre SVM-StatVect et SVM-ProbVect : 79.0% Conclusions : Les méthodes SVM-StatVect et SVM-ProbVect sont mieux adaptées à l utilisation de plusieurs familles de coefficients ensemble La fusion des deux méthodes permet d améliorer les performances Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 59

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Résultats expérimentaux : SVM-StatVect Performances par famille de coefficients Famille de Coefficients Dimension Taux de Reco. (%) Loudness 168 66.9 Spectral Crest F. P. B. 133 66.6 Spectral Flatness P. B. 133 65.5 MFCC 112 63.27 Spectral Shape Stat. 12 55.3 Spectral Roll-Off 7 48.0 Spectral Flatness 7 48.0 Spectral Slope 7 45.4 Complex D. O. D. 7 44.6 Spectral Variation 7 43.7 Perceptual Sharpness 7 43.5 Perceptual Spread 7 41.8 Envelope Shape Stat. 7 38.1 Spectral Decrease 7 36.7 Temporal Shape Stat. 4 33.3 Tous les Coefficients 625 76.5 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 60

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Performances des familles de coefficients pour 3 classes Certaines classes de sons sont mieux reconnues avec des familles de coefficients spécifiques Classes de sons Familles de coefficients Door Clap. Keys Water MFCC 0.9 0.8 0.4 Loudness 0.9 1 0.6 Spectral Crest Factor Per Band 0.9 0.9 0.5 Spectral Flatness Per Band 0.9 0.7 0.6 Complex Domain Onset Detection 0.7 0 0.7 Perceptual Sharpness 0.9 0.08 0.6 Perceptual Spread 0.8 0 0.9 Spectral Roll-Off 0.7 0 0.5 Spectral Decrease 0.7 0 0.9 Spectral Flatness 0.7 0.7 0.4 Spectral Variation 0.7 0 0.3 Spectral Slope 1 0 0.9 Spectral Shape Statistics 0.9 0.8 0.2 Temporal Shape Statistics 0.7 0 0.9 Envelope Shape Stat. 0.6 0 0.7 Tous les coefficients 1 0.9 0.6 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 61

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Sélection de caractéristiques Méthode de sélection : SVM Wrapper [Guyon et al, 2002] Sélection itérative des caractéristiques les moins significatives d un modèle SVM Un apprentissage et une évaluation sont nécessaires à chaque itération Peut être coûteuse en temps de calcul Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 62

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Sélection de caractéristiques Méthode de sélection : SVM Wrapper [Guyon et al, 2002] Sélection itérative des caractéristiques les moins significatives d un modèle SVM Un apprentissage et une évaluation sont nécessaires à chaque itération Peut être coûteuse en temps de calcul Variante utilisée : Le taux de caractéristiques à éliminer est figé Une seule sélection est faite Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 62

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Résultats de la sélection de caractéristiques Provenance des coefficients SVM-StatVect Taux de sél. SVM-StatVect SVM-ProbVect + (%) SVM-ProbVect 100 76.5 76.2 79.0 50 76.5 76.5 77.6 20 77.9 75.1 79.0 15 78.5 72.5 78.5 10 75.9 73.4 77.6 Un nombre plus réduit de caractéristiques permet de maintenir ou d améliorer les performances Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 63

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Description du corpus : Enregistrement des activités de la vie quotidienne dans une maison intelligente (appartement Domus, Grenoble) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 64

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Description du corpus : Enregistrement des activités de la vie quotidienne dans une maison intelligente (appartement Domus, Grenoble) Sept microphones installés dans l appartement durée d un enregistrement : une heure environ Nombre de sujets : 21 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 64

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Description du corpus : Enregistrement des activités de la vie quotidienne dans une maison intelligente (appartement Domus, Grenoble) Sept microphones installés dans l appartement durée d un enregistrement : une heure environ Nombre de sujets : 21 Exemples d activités : Parler au téléphone Préparer une boisson chaude Utiliser l aspirateur Se brosser les dents Etc. Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 64

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Objectif des expérimentations : Évaluer les différentes composantes du système Architecture du système : Microphones M1 M2 Mn Détection et Extraction du Son Séparation entre Parole et autres Sons Sons Classification des Sons de l'environnement Parole Reconnaissance de la Parole Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 65

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Protocole de test : Trois scénarios utilisés en apprentissage Cinq scénarios utilisés pour évaluer la séparation entre la parole et les autres sons Dont quatre utilisés pour évaluer la reconnaissance des sons de l environnement Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 66

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Protocole de test : Trois scénarios utilisés en apprentissage Cinq scénarios utilisés pour évaluer la séparation entre la parole et les autres sons Dont quatre utilisés pour évaluer la reconnaissance des sons de l environnement 18 classes de sons prises en considération : Ouverture/fermeture de portes Aspirateur Écoulement d eau Etc. Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 66

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Protocole de test : Trois scénarios utilisés en apprentissage Cinq scénarios utilisés pour évaluer la séparation entre la parole et les autres sons Dont quatre utilisés pour évaluer la reconnaissance des sons de l environnement 18 classes de sons prises en considération : Ouverture/fermeture de portes Aspirateur Écoulement d eau Etc. Coefficients acoustiques : MFCC Méthode de reconnaissance : SVM-GSL Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 66

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Performances de la détection du son : τ (%) 20 50 80 100 Sensibilité (%) 96.1 93.4 90.3 88.6 Sensibilité de détection pour différentes valeurs du taux de recouvrement (τ ) avec les références Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 67

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Performances de la séparation entre la parole et les autres sons : Sujet # de phrases Canal FN Det. FN Reco. TP D+R C6 0 4 40 S01 44 C7 1 2 41 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 68

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Performances de la séparation entre la parole et les autres sons : Sujet # de phrases Canal FN Det. FN Reco. TP D+R S01 44 C6 0 4 40 C7 1 2 41 S03 41 C6 0 2 39 C7 1 7 33 S07 45 C6 4 5 36 C7 6 3 36 S09 40 C6 0 0 40 C7 0 0 40 S13 42 C6 0 4 38 C7 1 0 41 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 68

Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons Tests sur le corpus du projet Sweet-Home : Reconnaissance des sons de la vie courante par canal : Canal C1 C2 C3 C4 C5 C6 C7 Fusion de tous les canaux Moy. TP D+R(%) 31.3 33.3 14.9 24.1 21.8 13.3 9.6 59.1 Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 69

Plan Conclusions et Perspectives 1 Contexte : Projet Sweet-Home 2 Objectifs de la thèse 3 État de l art en classification des sons de l environnement 4 Première contribution : Mise en œuvre de différents classifieurs issus de la RAL, pour la classification des sons 5 Deuxième contribution : Utilisation de représentations adaptées aux différentes classes de sons 6 Conclusions et Perspectives Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 70

Conclusions : Conclusions et Perspectives La reconnaissance des sons de l environnement est un domaine de recherche assez récent : il existe très peu de travaux Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 71

Conclusions : Conclusions et Perspectives La reconnaissance des sons de l environnement est un domaine de recherche assez récent : il existe très peu de travaux Les méthodes utilisées en reconnaissance du locuteur fonctionnent visiblement bien Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 71

Conclusions : Conclusions et Perspectives La reconnaissance des sons de l environnement est un domaine de recherche assez récent : il existe très peu de travaux Les méthodes utilisées en reconnaissance du locuteur fonctionnent visiblement bien SVM-StatVect et SVM-ProbVect s avèrent efficaces pour l utilisation de plusieurs familles de coefficients ensemble en entrée d un SVM Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 71

Conclusions : Conclusions et Perspectives La reconnaissance des sons de l environnement est un domaine de recherche assez récent : il existe très peu de travaux Les méthodes utilisées en reconnaissance du locuteur fonctionnent visiblement bien SVM-StatVect et SVM-ProbVect s avèrent efficaces pour l utilisation de plusieurs familles de coefficients ensemble en entrée d un SVM Certaines classes de sons sont reconnues plus efficacement avec des familles de coefficients spécifiques Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 71

Conclusions : Conclusions et Perspectives La reconnaissance des sons de l environnement est un domaine de recherche assez récent : il existe très peu de travaux Les méthodes utilisées en reconnaissance du locuteur fonctionnent visiblement bien SVM-StatVect et SVM-ProbVect s avèrent efficaces pour l utilisation de plusieurs familles de coefficients ensemble en entrée d un SVM Certaines classes de sons sont reconnues plus efficacement avec des familles de coefficients spécifiques Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 71

Perspectives : Conclusions et Perspectives Enrichir la base de données Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 72

Perspectives : Conclusions et Perspectives Enrichir la base de données Explorer les autres avancées en reconnaissance du locuteur Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 72

Perspectives : Conclusions et Perspectives Enrichir la base de données Explorer les autres avancées en reconnaissance du locuteur Utiliser d autres familles de coefficients acoustiques Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 72

Perspectives : Conclusions et Perspectives Enrichir la base de données Explorer les autres avancées en reconnaissance du locuteur Utiliser d autres familles de coefficients acoustiques Inclure d autres sources d information (dépendance temporelle) Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 72

Perspectives : Conclusions et Perspectives Enrichir la base de données Explorer les autres avancées en reconnaissance du locuteur Utiliser d autres familles de coefficients acoustiques Inclure d autres sources d information (dépendance temporelle) Utiliser d autres méthodes de fusion et de sélection pour une meilleure exploitation des familles de coefficients Reconnaissance des sons de l environnement dans un contexte domotique M.A.SEHILI 72