Séparation de sources par factorisation en matrices non-négatives informée

Documents pareils
Descriptif des examens

QUELQUES PROPOSITIONS POUR EVALUER LES PRATIQUES MUSICALES AU CYCLE 3. Didier Louchet CPEM

PIANO. Division inférieure 2 ème cycle 1 ère mention. Texte coordonné

SI350 Indexation Audio

PIANO. Division inférieure 1 er cycle. Texte coordonné

L écoute ritualisée au cycle 3

Règlement d études et d examens concernant la formation de musiciens et musiciennes d Eglise non professionnels

ÉCOLE PRÉPARATOIRE DE MUSIQUE DE L UNIVERSITÉ DE MONCTON PROGRAMME DE PIANO

Compétences souhaitées à la fin des trois cycles de l enseignement spécialisé (musique)

Chapitre 2 Les ondes progressives périodiques

Enregistrement et transformation du son. S. Natkin Novembre 2001

FORD C-MAX + FORD GRAND C-MAX CMAX_Main_Cover_2013_V3.indd /08/ :12

Cryptologie et physique quantique : Espoirs et menaces. Objectifs 2. distribué sous licence creative common détails sur

CARACTÉRISTIQUES TECHNIQUES THE ARTIST CINE-CONCERT LIVE

EIP 2012 Projet Livepad. Documentation technique 1.5

V corr Jacques Ferber. LIRMM - Université Montpellier II 161 rue Ada Montpellier Cedex 5

Application en classe de la progression des apprentissages en musique 1 er cycle du secondaire

Navigation dans les bases de données musicales

UN CONCEPT INNOVANT POUR APPRENDRE LA MUSIQUE

REFERENTIELS DE COMPETENCE


accompagnement au piano

FICHES TECHNIQUES. tel:

STRUCTURE D ETUDES

CONSERVATOIRE DE MUSIQUE DE LA GARENNE-COLOMBES PROGRAMME PÉDAGOGIQUE - Département Piano -

PLAN D ÉTUDES DU PIANO

En UEL uniquement. Jour/ horaire. Programme. Découverte du langage musical autour du piano. Musique à l école. Création sonore et radiophonique

À côté de ces trois formules mélodiques principales, plusieurs éléments mélodiques secondaires, présents dans notre corpus, peuvent avoir une

Extraction de descripteurs musicaux: une approche évolutionniste

L accompagnement pour piano

Formula Negator, Outil de négation de formule.

Reconnaissance des instruments dans la musique polyphonique par décomposition NMF et classification SVM

J'aime pas du tout comment tu chantes

Reconnaissance automatique d accords et modélisation des logiques d enchaînement dans un logiciel d improvisation

Paramétrisation adaptée de transitoires pour la reconnaissance d instruments de musique

le diplôme d Etat de professeur de musique, le diplôme d Etat de professeur de danse.

Exclusion Mutuelle. Arnaud Labourel Courriel : arnaud.labourel@lif.univ-mrs.fr. Université de Provence. 9 février 2011

Cours Microfer Chartres

Ce document a pour but d aider à planifier l achat d équipement en éducation pour les niveaux primaire et secondaire.

SOMMAIRE. ENREGISTREMENT...24 Programmer un enregistrement...24 Enregistrement manuel...25 Timeshift...25 Regarder un programme enregistré...

A.Gt M.B Le Gouvernement de la Communauté française,

Cours Informatique Master STEP

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Cégep Régional de Lanaudière à Joliette. Cahier de préparation pour l audition DÉPARTEMENT DE MUSIQUE

Soirées «L&A» Nous aurons des réussites en commun

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

ACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS

AwoX StriimLIGHT WiFi Color

Toute reproduction de ce matériel pédagogique à des fins commerciales est interdite. Tous droits réservés. École de musique, Université de Sherbrooke.

Une fabrication traditionnelle de pianos d excellence

Eclipse Process Framework et Telelogic Harmony/ITSW

Architecture des Systèmes d Information Architecture des Systèmes d Information

1 Recherche en table par balayage

TABLE DES MATIÈRES CHAPITRE I. Les quanta s invitent

Semaine du 21 avril 2012 LILLE-NAPLOUSE-SAFED MUSIC & PEACE. [Projet Lille-Naplouse-Safed 2012] Music & Peace

Base de données Eros : Portail musiques et traditions du monde : Site Internet de la médiathèque de la Cité de la musique : TRANS'TYFIPAL :

Règlement d admission Annales des concours Règlement de l examen

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Livrable 2.1 Rapport d analyse et de restructuration de code monothread des modules P, T, Q et F de l encodage MPEG-4 AVC

MICHEL DEBRULLE. Bruxelles, MARS 2009

Le Conservatoire de musique

Modélisation de l interprétation des pianistes & Applications d auto-encodeurs sur des modèles temporels

Viesperen

Cursus Jazz. 1 er cycle Certification : Attestation de fin de 1 er cycle Durée du cycle 4 ans maximum

VISION PAR ORDINATEUR ET APPRENTISSAGE STATISTIQUE : VERS UN INSTRUMENT DE MUSIQUE IMMATERIEL

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Cours 1 : La compilation

Musique imprimée & PCDM4 (version février 2008) 1.3 AUT 1.3 AUT 04 3 COM 05M 2 AUT 11/1R 6.11 AUT

Guide d utilisation. séries NW-A1000 / séries A Sony Corporation (1)

Mika : Elle me dit. Paroles et musique : Mika/Doriand Universal Music France. Thèmes. Objectifs. Vocabulaire. Note. Liste des activités

GUIDE RAPIDE FONCTION MAINS LIBRES AVEC RECONNAISSANCE VOCALE

Cours d analyse numérique SMI-S4

Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines)

La classification automatique de données quantitatives

Initiative H «DEUS EX MACHINA»

Algorithmes pour la planification de mouvements en robotique non-holonome

Caractéristiques des ondes

MUSIQUE AMU3M. 11 e année

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

L application est utilisable pour toute personne disposant d un compte Qobuz.

I n s c r i p t i o n S E M A I N E D E S T A G E H A T T E M E R - A V R I L

PROGRAMME D ETUDE LECTURE/DECHIFFRAGE PIANO

Bandes Critiques et Masquage

Repères historiques MUSIQUE ET VARIATION. Objectifs. Léonard de Vinci W.A.Mozart G.Bizet

Les musiciens : Frédérique REZZE Clarinette. Véronique SOUBRE-LANABERE Violon et chant. Pascale PAULY Accordéon, piano et chant

3 Approximation de solutions d équations

Stage Ingénieur en développement logiciel/modélisation 3D

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Laboratoire 4 Développement d un système intelligent

Laboratoire d Automatique et Productique Université de Batna, Algérie

Fiche technique Big Band Christian Garros. 1/5. La scène, vue en plan

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

LE/LES SON(S) DU SAXOPHONE : CLASSIQUE, JAZZ,

Andrei A. Pomeransky pour obtenir le grade de Docteur de l Université Paul Sabatier. Intrication et Imperfections dans le Calcul Quantique

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Présentation du PL/SQL

1 Année LMD-STSM Algorithmique et Programmation. Série de TD 2

Transcription:

Séparation de sources par factorisation en matrices non-négatives informée 1 Introduction Le problème séparer les différentes sources qui composent un signal de musique dans le cas où l on dispose uniquement d un signal monophonique est un sujet de recherche qui suscite un grand intérêt depuis plusieurs années. Ce problème difficile a de nombreuses applications telles que la transcription automatique des morceaux de musique [1], la reconnaissance d instruments [2], ou l estimation de la mélodie [3]. De nombreux éléments contribuent à faire de la séparation de sources un problème difficile. On peut citer parmi eux la complexité des sources musicales qui interfèrent dans les mélanges polyphoniques, les conditions variables d enregistrement, le bruit, les effets digitaux appliqués pour les enregistrements en studio, etc. Une approche populaire au problème de séparation de sources est d utiliser une technique de Factorisation en matrices non-négatives (en anglais Non-Negative Matrix Factorization NMF). La NMF est une technique de factorisation qui permet d expliquer les données par un petit nombre d objets représentatifs. On se propose dans ce projet d utiliser cette technique pour faire de la séparation de sources en musique. 2 Rappels théoriques sur la NMF Mathématiquement, on formule la NMF de la façon suivante. Soit V R M N + une matrice non-négative, c est-à-dire dont tous les coefficients sont positifs ou nuls, de taille M N (dans les applications en musique V sera très souvent le spectrogramme d amplitude). La factorisation en matrices non-négatives approxime V par Ṽ de la manière suivante : Ṽ = WH (1) avec W R M K + et H R K N +, et où K est le rang de factorisation, généralement choisi tel que K(M + N) << MN. La matrice W est appelée dictionnaire. Les vecteurs colonnes de W sont appelés templates ou atomes. La matrice H est appelée matrice d activation : la kème ligne de H correspond en effet à l activation du kème atome. Voir la figure 1 pour un exemple de décomposition d un morceau de musique. 1

Figure 1 Exemple de factorisation d un spectrogramme d amplitude d un extrait du Prélude de Chopin Op. 28 No. 15, adapté de [5]. L approximation de l équation (2) est généralement quantifiée au moyen d une divergence entre V et WH. Un algorithme de NMF est donc un algorithme de minimisation de cette divergence. min D(V W H) W,H 0 L article [6] propose un algorithme avec des règles de mise à jour multiplicatives qui permettent de converger vers un minimum local. Les matrice W et H sont optimisées de manière successive. Cet algorithme est très couramment utilisé en raison de sa grande simplicité d implémentation et de la rapidité de calcul des itérations. Ces règles peuvent s écrire de la manière suivante (notation matricielle) : Avec la divergence euclidienne : H H W T V W T (WH) W W V HT (WH) H T Avec la divergence de Kullback-Leibler : V W H H H W T W T J W W V W H HT J H T L opérateur dénote le produit de Hadamard (multiplication point par point), J R M N + dénote une matrice unitaire, et la division se fait point par point. La procédure globale d optimisation se fait de la manière suivante : 1. Initialiser les entrées W et H avec des values aléatoires (positives) 2. Mettre à jour W 3. Mettreà jour H 4. Répéter de manière itérative les étapes 2 et 3 jusqu à convergence 2

Reconstruction des sources séparées : étant donné un mélange de deux sources X = S 1 + S 2, X, S 1, S 2 C M N (2) On calcule la décomposition NMF du spectrogramme d amplitude : On estime chaque source à l aide de masques : Ŝ 1 = 3 Travail demandé V = X WH = W 1 H 1 + W 2 H 2 (3) W 1 H 1 W 1 H 1 + W 2 H 2 X Ŝ 2 = W 2 H 2 W 1 H 1 + W 2 H 2 X (4) Le but de ce projet est d implémenter une méthode de séparation de sources basée sur la NMF informée, c est-à-dire qui prend en compte de l information musicale afin d obtenir des résultats de séparation de sources qui sont physiquement et musicalement interprétables. On reprendra l idée développée dans l article [4] qui propose d utiliser une partition MIDI pour initialiser l algorithme, non pas avec matrices W et H aléatoires, mais avec des matrices qui reflètent la partition. Voir aussi l article [5] pour plus de détails. On étudiera les variantes suivantes (voir la Figure 2). Initialisation aléatoire de W et H. Initialisation avec des templates harmonique de W et initialisation aléatoire de H. Initialisation aléatoire de W et initialisation avec la position des notes midi pour H. Initialisation avec des templates harmonique de W et initialisation avec la position des notes midi pour H. Initialisation avec des templates harmonique, et la position des onsets de W et initialisation avec la position des notes midi pour H. 4 Outils On utilisera pour l algorithme de base de NMF le code du TP fait en cours (ne pas prendre en compte le terme de pénalité supplémentaire qui favorise la parcimonie de H). Dans ce projet, il s agit de modifier l initialisation de W et H. Pour récupérer l information des fichiers MIDI, on pourra utiliser la toolbox MIDI, qu on trouvera à l adresse suivante : https://www.jyu.fi/hum/laitokset/musiikki/en/research/coe/ materials/miditoolbox/ Remarque Il faudra faire attention au réglage des différents paramètre. En particulier la nature de la décomposition dépend du choix du rang K, c est à dire du nombre de lignes dans H et W respectivement. 3

Figure 2 Exemple de factorisation d un spectrogramme d amplitude d un extrait du Prélude de Chopin Op. 28 No. 4, avec différentes initialisations, adapté de [4]. 5 Morceaux de test On donne en pièce jointe de ce projet deux extraits de chorals de Bach à quatre voix (Soprano, Alto, Tenor, Basses), joués par 4 instruments (violon, clarinette, saxophone et basson). On dispose des pistes séparées pour chaque instrument ainsi que du fichier midi correspondant 1. On pourra tester l algorithme sur d autres morceaux de différents types (par exemple piano seul, morceaux avec de la batterie), et comparer les résultats en fonction de l instrumentation, du style de musique etc. On trouvera facilement sur Internet des fichiers MIDI correspondant à l audio sélectionné. Vérifier en écoutant les fichiers MIDI qu ils sont acceptables. Références [1] Plumbley, M.D. and Abdallah, S.A. and Bello, J.P. and Davies, M.E. and Monti, G. and Sandler, M.B. Automatic music transcription and audio source separation. In Cybernetics and Systems, 33(6), pp 603 627, (2002). [2] Heittola,T. and Klapuri, A.P. and Virtanen, T. Musical instrument recognition in polyphonic audio using source-filter model for sound separation. In Proceedings of the International Society for Music Information Retrieval Conference (ISMIR), pp 327 332, Kobe, Japan, 2009. 1. Ces fichiers sont extraits du Bach10 dataset http://music.cs.northwestern.edu/data/bach10.html. 4

[3] Durrieu, J.L. and Richard, G. and David, B. and and Févotte, C. Source/filter model for unsupervised main melody extraction from polyphonic audio signals. IEEE Trans. Audio, Speech, Language Process., 18(3) :564 575, 2010. [4] Ewert, S. and Müller, M. Using score-informed constraints for NMF-based source separation. Proc. ICASSP, Kyoto, Japan, 2012. [5] Ewert, S. and Müller, M. Score-Informed Source Separation for Music Signals. In Multimodal Music Processing, Schloss Dagstuhl Leibniz-Zentrum für Informatik, pp 73 94, Dagstuhl, Germany, 2012. [6] Lee, D.D. and Seung, H.S. Algorithms for non-negative matrix factorization. In MIT Press, Advances in Neural Information Processing Systems (Eds.), vol.13, pp 556 562, 2000. 5