Factorisation matricielle non-négative pour la classification des instruments de musique



Documents pareils
Résolution de systèmes linéaires par des méthodes directes

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Transmission d informations sur le réseau électrique

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

IMAGES NUMÉRIQUES MATRICIELLES EN SCILAB

Travaux pratiques avec RapidMiner

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

La classification automatique de données quantitatives

Extraction d informations stratégiques par Analyse en Composantes Principales

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Analyse en Composantes Principales

Initiation à LabView : Les exemples d applications :

1 Complément sur la projection du nuage des individus

Introduction au Data-Mining

Projet Matlab : un logiciel de cryptage

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Exercices Corrigés Premières notions sur les espaces vectoriels

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

2 Serveurs OLAP et introduction au Data Mining

LES DÉTERMINANTS DE MATRICES

Information utiles. webpage : Google+ : digiusto/

1 - Se connecter au Cartable en ligne

Chapitre 2 Les ondes progressives périodiques

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Introduction à MATLAB R

Vérification audiovisuelle de l identité

Objectifs de la séquence Contenus de la séquence Méthode d accompagnement pédagogique Matériels, ressources, outils - Présentation des

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi

L'analyse des données à l usage des non mathématiciens

avec des nombres entiers

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

Document d accompagnement pour l utilisation du Cartable en ligne Lycée des Métiers Fernand LÉGER 2013/2014

Cours 7 : Utilisation de modules sous python

Définitions. Numéro à préciser. (Durée : )

INF6304 Interfaces Intelligentes

Organiser le disque dur Dossiers Fichiers

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Démonstration d utilisation De NesmaCom

Laboratoire 4 Développement d un système intelligent

Fonctions de plusieurs variables

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

MONTAGE DE L UNITÉ MOBILE. Montage de l unité mise en onde Couverture événementielle

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements

1 Introduction au codage

TSTI 2D CH X : Exemples de lois à densité 1

Correction de l examen de la première session

Big Data et Graphes : Quelques pistes de recherche

Géographie CM2. Guide pédagogique. Ressources vidéoprojetables & 14 animations interactives. Jacques Arnaud Nicole Darcy Daniel Le Gal

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

ACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS

Apprentissage Automatique

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Séance 0 : Linux + Octave : le compromis idéal

Lettre TICC'Édu n 15 Avril-Mai 2014

Logiciel XLSTAT version rue Damrémont PARIS

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

Introduction à la théorie des graphes. Solutions des exercices

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS =

Intérêt du découpage en sous-bandes pour l analyse spectrale

MAP 553 Apprentissage statistique

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

Mini_guide_Isis_v6.doc le 10/02/2005 Page 1/15

FORMATION MULTIMÉDIA LVE

données en connaissance et en actions?

Recherche d Information(RI): Fondements et illustration avec Apache Lucene. par Majirus

Boîte électronique. Découverte des principales fonctions d une messagerie électronique. (et les pièces jointes)

Objectifs du TP : Initiation à Access

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

DOCM Solutions officielles = n 2 10.

LECTEUR DE COMPACT DISC CDJ-400

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Par : Abdel YEZZA, Ph.D. Date : avril 2011 / mise à jour oct (ajout de la section 3 et augmentation de la section 1)

Module 16 : Les fonctions de recherche et de référence

Cryptographie et fonctions à sens unique

ESIEA PARIS

Mesures en réception télévision

Systèmes et algorithmes répartis

Partie 1. Fonctions plus complexes dans Excel. Fonctions Si(), Et(), Ou() et fonctions imbriquées. Opérateurs logiques. I.1.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Capital économique en assurance vie : utilisation des «replicating portfolios»

Chapitre 6 La lumière des étoiles Physique

Quick Start Guide. Nokia 6288

Formation à l utilisation des réseaux sociaux et d internet. Protéger sa vie privée

Exercices - Nombres complexes : corrigé. Formes algébriques et trigonométriques, module et argument

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits

LES DECIMALES DE π BERNARD EGGER


Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

SEANCE 4 : MECANIQUE THEOREMES FONDAMENTAUX

Cours Microfer Chartres

Évaluation de la régression bornée

Transcription:

Factorisation matricielle non-négative pour la classification des instruments de musique Objectif Ce projet a pour but d appliquer la NMF à l analyse des instruments de musique. Supposons que l on possède un ensemble de morceaux musicaux (en format *.wav) où chacun d entre eux correspond à un des instruments de musique (piano, flûte, violon etc). 1. Créez une matrice dans laquelle chaque ligne correspond à un des morceaux musicaux. (a) Sauvegardez quelques examples de chaque instrument de musique dans les variable séparées en utilisant la fonction wavread. Combien de canaux audio est-ce qu on retrouve dans chaque fichier? (b) Concatenez toutes les variables dans une seule matrice en utilisant la concatenation verticale [variable 1;variable 2]. (c) Créez un vecteur des étiquettes instr labels. (d) Visualisez dans une figure séparée les données qui correspondent à deux instruments différents en utilisant la fonction plot. Qu est-ce qu on peut en déduire? 1

Figure 1: Un des fichiers qui correspond au piano Figure 2: Un des fichiers qui correspond à la flûte 2. Pour appliquer la NMF à un ensemble de données en grandes dimensions on effectue la selection de features. 2

(a) Calculez les caractristiques du format audio telles que: energy entropy, short time energy, spectral rolloff, spectral centroid et spectral flux pour chaque fichier en utilisant la commande computeallstatistics. (b) Visualisez la vraie partition de données avec des étiquettes sauvegardées dans instr labels. Utilisez l ACP (commande pcaproj) pour réduire le nombre de dimensions à 3. Figure 3: La partition initiale en 3D (c) Appliques la NMF à la matrice obtenue précédemment en utilisant la fonction nmfrule. Interpretez les résultats de NMF. (d) Ecrivez un programme pour transformer la matrice de partition obtenue à une vraie matrice de partition I (On cherche un élément maximale dans chaque ligne et on le remplace par 1. Tous les autres éléments sont remplacés par 0.) (e) Quelle est la signification de ce remplacement? (f) Calculez la pureté et la matrice de confusion en utilisant les matrices I et instr labels. 3

Figure 4: La partition obtenue en 3D 3. Analysez les résultats obtenus et faites les conclusions concernant des avantages et des inconvenients de NMF appliquée à la classification des instruments de musique. 4

Factorisation Matricielle Non-Négative pour la détection de faux billets Objectif Ce projet a pour but d appliquer la NMF à la détection de faux billets. 1. Supposons que l on possède un ensemble de photos où chacune d entre elles correspond à un des billets (vrai ou faux). Après avoir appliqué la transformée en ondelettes aux images de billets, on obtient une matrice où chaque image est décrite par 4 caractèristiques: la variance, l asymétrie, le kurtosis et l entropie. (a) Sauvegardez cet ensemble de données dans deux variables : bank data pour les données et bank labels pour les étiquettes. (b) Créez deux matrices A faux (que des faux billets) et A vrais (que des vrais billets). (c) Ensuite, créez deux matrices bank train (500 objets de A vrais et 600 objets de A faux) et bank test (le reste). (d) Visualisez les données dans une figure séparée en utilisant la fonction PlotClusters? 1

Figure 1: La partition initiale en 2D 2. Appliquez la Semi-NMF à la matrice bank train en utilisant la fonction seminmfnnls. Sauvegardez la matrice de prototypes obtenue dans W train. (a) Ecrivez un programme show clusters pour transformer la matrice de partition obtenue à une vraie matrice de partition I (On cherche un élément maximal dans chaque ligne et on le remplace par 1. Tous les autres éléments sont remplacés par 0.). Calculez la pureté pour la matrice de partition obtenue précédemment. (b) Classifiez les objets sauvegardés dans bank test en utilisant la matrice de prototypes W train apprise précédemment (H test = W train 1 bank test). Attention! Au cas où la matrice W train est une matrice non carrée, on utilise le pseudo-inverse de Moore- Penrose (la commande pinv). (c) Calculez les indices externes (la pureté et l entropie pour la matrice de partition H test). Pour cela, on utilise les commande purity et entropy. (d) Calculez les indices internes (l indice DB de Davies et Bouldin, l indice CH de Calinsky et Harabsz, l indice KL de Krzanowski 2

et Lai et l indice de Dunn) pour la matrice de partition H test. Pour cela, on utilise la commande valid internal deviation. (e) Visualisez les données avec les étiquettes obtenues en utilisant la fonction PlotClusters. 3. Faites la séquence de commandes (2a)-(2e) avec la NMF (commande nmfrule). 4. Appliquez Symmetric NMF à la matrice K test. (a) Calculez la matrice de Gram K test en utilisant la commande kernelrbf avec σ = 1. (b) Calculez les indices externes et internes pour la matrice de partition. (c) Visualisez les données avec les étiquettes obtenues en utilisant la fonction PlotClusters? (d) Faites la séquence de commandes (4a)-(4c) avec la matrice de Gram d un noyau polynomiale avec les paramètres [1;0;2]. 5. Comparez les résultats obtenus. 3

Factorisation Matricielle Non-Négative pour la reconnaissance de visages Objectif Ce projet a pour but d appliquer la NMF à l analyse des images de Yale Faces Dataset. 1. Téléchargez la base de données Yale Database (http://www.cad.zju.edu.cn/home/dengcai/data/facedata.html). On va travailler avec des images 32x32 (32x32 Data File). 2. Sauvegardez cet ensemble de données dans deux variables : yale data pour les données et yale labels pour les étiquettes. 3. Créez une fonction show face qui visualise des images de toutes les personnes de telle façon qu on ait 11 images par ligne (chaque ligne correspond aux photos d une seule personne). Pour cela, on utilise les commandes reshape,imagesc et colormap. Figure 1: Exemple avec des photos de deux personnes 4. Appliquez PCA à la matrice yale data. (a) Calculez les moyennes {M i } 15 i=1 pour toutes les photos de chaque personne. (b) Créez une matrice A en soustrayant les moyennes calculées précédemment de chaque ligne de la matrice yale data. (i.e. A(:, 1 : 11) = yale data(:,1:11) - M 1 ) (c) Utilisez la commande pcaproj pour calculer les vecteurs propres de A. 1

(d) Visualisez le résultat obtenu en utilisant la fonction show face. (e) Sauvegardez l image obtenue dans un fichier pca eigenfaces.jpg. Figure 2: PCA eigenfaces 5. Appliquez NMF à la matrice yale data en utilisant la commande nmfrule. Visualisez la matrice de prototypes obtenue en utilisant la fonction show face. Figure 3: Vecteurs-prototypes obtenus par NMF 6. Appliquez Projective NMF à la matrice yale data. Visualisez la matrice de prototypes obtenue en utilisant la fonction show face. Figure 4: Vecteurs-prototypes obtenus par Projective NMF 7. Comparez les résultats obtenus. Que remarquez-vous? 2

Factorisation Matricielle Non-Négative pour le Text Mining Objectif Ce projet a pour but d appliquer la NMF au Text Mining. 1. Supposons que l on possède un ensemble des émissions de télévision Reuters. Après avoir appliqué la lemmatisation ( Porter stemming ) et l élimination des mots fréquents ( stop words ), on obtient une matrice où chaque ligne est décrite par 18933 caractèristiques: chaque caractèristique est le nombre d apparition d un terme dans une émission de télévision. (a) Téléchargez la base de données Reuters21578. (http://www.cad.zju.edu.cn/home/dengcai/data/textdata.html). (b) Sauvegardez cet ensemble de données dans deux variables : reuters data pour les données et reuters labels pour les étiquettes. Utilisez 1

la fonction tfidf pour transformer les données au format term frequency-inverse document frequency. (c) Créez deux matrices reuters4 (avec 400 objets de 4 premières classes(100 par classe)) et labels4 (avec des étiquettes qui correspondent aux données sauvegardées dans reuters4). (d) Ensuite, créez deux matrices reut train (75 objets par classe) et reut test (le reste). Sauvegardez galement les tiquettes pour les deux matrices. (e) Ecrivez un programme qui retourne des indices de k éléments les plus fréquents dans des colonnes d une matrice. Utilisez ce programme pour réduire le nombre de dimensions à 3. (f) En utilisant la matrice réduite visualisez les données dans une figure séparée en utilisant la fonction PlotClusters? 2. Appliquez la NMF à la matrice reut train en utilisant la fonction nmfrule. Sauvegardez la matrice de prototypes obtenue dans W train. (a) Ecrivez un programme show clusters pour transformer la matrice de partition obtenue à une vraie matrice de partition I (On cherche un élément maximal dans chaque ligne et on le remplace par 1. Tous les autres éléments sont remplacés par 0.). Calculez la pureté pour la matrice de partition obtenue précédemment. (b) Classifiez les objets sauvegardés dans reut test en utilisant la matrice de prototypes W train apprise précédemment (H test = W train 1 reut test). Attention! Au cas où la matrice W train est une matrice non carrée, on utilise le pseudo-inverse de Moore- Penrose (la commande pinv). (c) Calculez les indices externes (la pureté et l entropie pour la matrice de partition H test). Pour cela, on utilise les commande purity et entropycluster. (d) Calculez les indices internes (l indice DB de Davies et Bouldin, l indice CH de Calinsky et Harabsz, l indice KL de Krzanowski et Lai et l indice de Dunn) pour la matrice de partition H test. Pour cela, on utilise la commande valid internal deviation. (e) Visualisez les données avec les étiquettes obtenues en utilisant la fonction PlotClusters. 2

3. Appliquez la tri-nmf à la matrice reuters4 en utilisant la fonction orthnmfrule. (a) Faites la séquence de commandes (2c)-(2e) pour les résultats retournés par orthnmfrule. (b) Analysez la matrice F. (La matrice F répresente les clusters de variables trouvés par la NMF Orthogonale) (c) Faites la séquence de commandes (3a)-(3b) en imposant les contraintes d orthogonalité seulement à la matrice F. (d) Faites la séquence de commandes (3a)-(3b) en imposant les contraintes d orthogonalité seulement à la matrice G. 4. Appliquez Symmetric NMF à la matrice K test. (a) Calculez la matrice de Gram K test en utilisant la commande kernelrbf avec σ = 1. (b) Calculez les indices externes et internes pour la matrice de partition. (c) Visualisez les données avec les étiquettes obtenues en utilisant la fonction PlotClusters? (d) Faites la séquence de commandes (4a)-(4c) avec la matrice de Gram d un noyau polynomiale avec les paramètres [1;0;2]. 5. Comparez les résultats obtenus. 3