UE SI350 :Travaux Pratiques sur l indexation audio



Documents pareils
Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Chapitre 2 Les ondes progressives périodiques

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Transmission d informations sur le réseau électrique

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014

Paramétrisation adaptée de transitoires pour la reconnaissance d instruments de musique

Projet de Traitement du Signal Segmentation d images SAR

Chaine de transmission


Mode d emploi ALTO MONITOR PROCESSEUR D ÉCOUTE. Version 1.0 Juillet 2003 Français

LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION

TP Modulation Démodulation BPSK

Systèmes de transmission

J AUVRAY Systèmes Electroniques TRANSMISSION DES SIGNAUX NUMERIQUES : SIGNAUX EN BANDE DE BASE

LABO 5 ET 6 TRAITEMENT DE SIGNAL SOUS SIMULINK

FAG Detector III la solution pour la surveillance et l équilibrage. Information Technique Produit

Compatible Mac et Windows. Logiciel DJ pour le mixage et l analyse des chansons. Guide d utilisation

Enregistrement et transformation du son. S. Natkin Novembre 2001

Analyse des bruits de clavier d ordinateur

ACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS

Caractéristiques des ondes

Analyses psychoacoustiques dans ArtemiS SUITE

Extraction de descripteurs musicaux: une approche évolutionniste

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Régler les paramètres de mesure en choisissant un intervalle de mesure 10µs et 200 mesures.

Son et Mathématiques

DJM-707 Table de mixage Hip Hop DJM-909 Table de Mixage avec Effets

SYSTEME DE PALPAGE A TRANSMISSION RADIO ETUDE DU RECEPTEUR (MI16) DOSSIER DE PRESENTATION. Contenu du dossier :

LABO PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB

TD1 Signaux, énergie et puissance, signaux aléatoires

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

Scarlett Plug-in Suite

Expérience 3 Formats de signalisation binaire

- Instrumentation numérique -

PREMIERS PAS AVEC DJ CONTROL AIR ET DJUCED. Plus d'informations (forum, tutoriels, vidéos,...) sur

EFFET DOPPLER EXOPLANETES ET SMARTPHONES.

Mesure agnostique de la qualité des images.

10ème Congrès Français d'acoustique Lyon, Avril 2010

Chapitre I La fonction transmission

UE 503 L3 MIAGE. Initiation Réseau et Programmation Web La couche physique. A. Belaïd

LÕenregistrement Enregistrement analogique et enregistrement numžrique

Créative Cloud - Perfectionnement

TD séance n 10 Multimédia Son

Network musical jammin

Transmission de données. A) Principaux éléments intervenant dans la transmission

Manipulation N 6 : La Transposition de fréquence : Mélangeur micro-ondes

Intérêt du découpage en sous-bandes pour l analyse spectrale

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

Filtres passe-bas. On utilise les filtres passe-bas pour réduire l amplitude des composantes de fréquences supérieures à la celle de la coupure.

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

1. PRESENTATION DU PROJET

Automatique Linéaire 1 Travaux Dirigés 1A ISMIN

5.2 Théorème/Transformée de Fourier a) Théorème

Initiation au logiciel imovie HD

Exemple d acquisition automatique de mesures sur une maquette de contrôle actif de vibrations

: seul le dossier dossier sera cherché, tous les sousdomaines

Fonctions de la couche physique

Chapitre 2 : communications numériques.

8563A. SPECTRUM ANALYZER 9 khz GHz ANALYSEUR DE SPECTRE

SI350 Indexation Audio

Exercices d application

Ecole Centrale d Electronique VA «Réseaux haut débit et multimédia» Novembre 2009

Production de documents audio-numériques

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

Université de La Rochelle. Réseaux TD n 6

Information. BASES LITTERAIRES Etre capable de répondre à une question du type «la valeur trouvée respecte t-elle le cahier des charges?

CHAPITRE V. Théorie de l échantillonnage et de la quantification

EMETTEUR ULB. Architectures & circuits. Ecole ULB GDRO ESISAR - Valence 23-27/10/2006. David MARCHALAND STMicroelectronics 26/10/2006

Spectrophotométrie. Spectrophotomètre CCD2. Réf : Version 1.0. Français p 2. Version : 4105

Electron S.R.L. - MERLINO - MILAN ITALIE Tel ( ) Fax Web electron@electron.it

Initiation à LabView : Les exemples d applications :

MUNIA Manuel de l'utilisateur

Observer TP Ondes CELERITE DES ONDES SONORES

Mode d emploi ALTO MONITOR PROCESSEUR D ÉCOUTE. Version 1.0 Juillet 2003 Français

Calcul des indicateurs de sonie : revue des algorithmes et implémentation

Traitement d un AVI avec Iris

Systèmes de communications Aastra Poste Aastra Guide de l utilisateur

CINEMA SB100 barre de son amplifiée

EIP 2012 Projet Livepad. Documentation technique 1.5

Géométrie discrète Chapitre V

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

ETUDE D IMPACT ACOUSTIQUE

A. N(p) B + C p. + D p2

P2: Perception auditive

Synchroniser le son et la vidéo dans Lightworks

LECTEUR DE COMPACT DISC CDJ-400

Scanner acoustique NoiseScanner

TP 7 : oscillateur de torsion

Quantification Scalaire et Prédictive

ÉVALUATION FORMATIVE. On considère le circuit électrique RC représenté ci-dessous où R et C sont des constantes strictement positives.

La structure du mobile GSM

TITRE : LES JEUX OLYMPIQUES UN OBJECTIF UNE PREPARATION

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)

INDICES DE PRIX EXPÉRIMENTAUX DES SERVICES FINANCIERS

Telecommunication modulation numérique

7 bis impasse Denis Dulac Maisons-Alfort FRANCE Tél. : / Fax : : promattex@promattex.com

MODE D EMPLOI. Enregistrement. Réalisation - Audacity. Les formats audio dans Audacity

Transcription:

UE SI35 :Travaux Pratiques sur l indexation audio Gaël RICHARD - Miguel ALONSO Détection du tempo et Mixage audio avec ajustement rythmique Introduction Signal Extraction du tempo Modification du tempo Signal 2 Extraction du tempo Mixage Figure : Mixage avec ajustement du tempo L objectif est de réaliser un algorithme de détection du tempo Ceux qui auront du temps ou qui souhaiteront aller un peu plus loin pourront réaliser un module de mixage audio permettant de passer de manière souple entre deux morceaux de musique successifs en adaptant progressivement le tempo du premier morceau à celui du second morceau (voir figure ) Le fichier tp index audiozip contient un ensemble de programmes Matlab utiles ainsi que quelques signaux courts (voir paragraphe 4) 2 Réalisation du module de détection du tempo Il s agit de réaliser un module de détection du tempo Ce module doit être capable de retrouver l organisation musicale interne d un temps (l intervalle allant d un beat à l autre), en termes des relations temporelles et de position des accents Sous Matlab, ce module sera une fonction function tempo=extract tempo(sig,fs) qui retournera la valeur du tempo en fonction du signal sig et de la fréquence d échantillonnage Fs Le schema de fonctionnement de l algorithme de détection du rythme contient les étapes suivantes (voir figure 2) Fenêtrage: on extraira une fenêtre de signal de longueur wlen correspondant à secondes du signal Si le signal d entrée sig est plus court que secondes, la totalité du signal d entrée sera utilisé Signal audio Détection d attaques Estimation de la periodicité Détermination du tempo et de la phase Figure 2: Schema de fonctionnement du système d extraction du tempo

traitement par canal signal audio TFCT Σ fonction de detection traitement par canal filtrage passe bas compress non linéaire calculer la dérivée redressement demi onde traitement par canal Figure 3: Principe de fonctionnement de l extraction d attaques Détection d attaques : On développera ensuite un module de détection d attaques (onsets en anglais) Celui-ci a pour but de fournir l emplacement temporel des notes musicales dans le signal audio Pour cela, on écrira une fonction function [fonc det,fs2] = fonc detection(sig, Fs) qui calculera la fonction de détection échantillonnée à la fréquence d échantillonnage Fs2 à partir du signal musical sig échantillonné à une cadence Fs Le calcul de cette fonction de détection utilise la notion de flux spectral (dérivée par rapport au temps de la transformée de Fourier à court terme) Les différentes étapes pour la détection d attaques sont résumées sur la figure 3): Calcul du spectrogramme: Analyser la fonction spectrom qui est donnée et qui permet d obtenir le spectrogramme du signal sig En particulier, on s attachera à préciser: ce que représente le coefficient kc 2 la taille de fenêtre (lfen) et la valeur du paramètre FFTSIZE qui vous paraissent raisonnable? 3 ce que représente la variable win shift et quel est son intérêt dans le calcul du spectrogramme? Traitement non-linéaire par canal: Afin d amélioration la détection des attaques, il est important d effectuer plusieurs étapes de prétraitement dans chaque canal de TFCT (voir bas de la figure 3) Filtrage passe-bas: De manière générale, nous recherchons une information rythmique (tempo) qui possède une périodicité à basse-fréquence (< Hz), ainsi la première étape est un filtrage passe-bas Néanmoins, il est nécessaire, malgré ce filtrage de conserver l impulsivité des attaques On utilise pour cela un filtre dont la réponse impulsionnelle est l arche descendante d une demi-fenêtre de Hanning dont la discontinuité aide à préserver l allure de l attaque (voir figure 4 pour une fenêtre volontairement trop grande pour faciliter la visualisation) Quelle doit être la taille (en échantillons) de la réponse impulsionnelle pour obtenir une fréquence de coupure aux alentours de Hz? Quelle est la nouvelle fréquence d échantillonnage à l intérieur de chaque canal de la TFCT? 2

8 6 demi fenêtre de Hanning 4 2 5 5 2 25 8 6 4 2 5 5 2 25 Temps (s) Figure 4: Filtrage passe-bas avec une demi-fenêtre de Hanning 2 Compression dynamique: La sensibilité du système auditif humain aux variations de l intensité sonore peut être approximée en utilisant une loi de compression logarithmique Ainsi, la dynamique du signal à l intérieur de chaque canal est compressée à travers une conversion en décibels (db) (y k db (t) = log (a k (t)) où a k (t) est l amplitude du signal du k ieme canal issu de l analyse par TFCT) 3 Calcul du flux spectral: Le flux spectral est calculé en dérivant les signaux compressés de chaque canal de l analyse par TFCT On utilisera pour cela le filtre différentiateur dont la réponse impulsionnelle est donnée dans le fichier fdiffmat Vérifier que c est bien un filtre différentiateur Introduit-il un retard? 4 Redressement demi-onde: En pratique, on ne souhaite détecter que les attaques de notes (partie positive de la dérivée) et non à détecter les fins de notes (partie negative de la dérivée) Le redressement demi-onde consistera ainsi à annuler les valeurs négatives du flux spectral La fonction de détection est ensuite obtenue en sommant la contribution de tous les canaux fréquentiels Détection de périodicités: Lissage de la fonction de détection: La première étape consiste à lisser la fonction de détection On peut, pour cela utiliser le même filtre passe-bas (demi-fenêtre de Hanning) déjà utilisé précédemment (Voir figure 5 pour un exemple de fonction de détection après lissage) 2 Calcul du tempo: On écrira une fonction tempo = calcule periodicite(fonc det,fs2) qui donnera le tempo à partir de la fonction de détection échantillonnée à Fs2 Le calcul de la périodicité s effectuera en recherchant le maximum de l autocorrélation normalisée dans un interval [Tmin - Tmax] que l on déterminera (Variante possible pour ceux qui ont du temps: Des études dans la perception du rythme montrent que nous avons une préférence pour les tempi proches de 2 battements par minute (BPM) Il est ainsi possible de rechercher parmi tous les pics de l autocorrélation celui qui répresente le mieux le rythme musical (selon la perception humaine) Pour cela, 3

Fonction de detection 8 6 4 2 5 5 2 25 3 Temps (s) Figure 5: Aspect général de la fonction de détection Les pics indiquent les instants où le changement du contenu fréquentiel est plus élevé on utilise une courbe de pondération perceptuelle que l on pourra obtenir avec le program ponderation rayleigh fourni avec le TP Son utilisation est : [poids,lags] = ponderation rayleigh(tmin,tmax,fs2), où poids donne la pondération correspondante au décalage indiqué par lags (voir courbe rouge dans la partie haute de la figure 6) Le tempo est alors donné par le maximum de l autocorrelation pondérée entre Tmin et Tmax) 3 Réalisation du module de mixage (Optionnel) Le module de mixage va consister à effectuer un passage souple entre les deux morceaux successifs On réalisera une fonction [mix,sig mod]=mixage(sig,tempo,sig2,tempo2,fs) qui implémentera ce module Il est ici proposé de jouer sur 3 paramètres qui permettront d adoucir la transition: Mixage par OverLap and Add (OLA) Le principe consiste à additionner la fin du premier signal fenêtré par l arche descendante d une demi-fenêtre de Hanning au début du second signal fenêtré par l arche montante d une demi-fenêtre de Hanning (voir figure 7) On définira pour cela un paramètre lmix qui réglera la durée de la transition entre les deux signaux Ajustement progressif du tempo On utilisera pour cela la fonction anasyn psola donnée (programme anasyn psolam) qui réalise une modification de l échelle temporelle par l algorithme PSOLA Cette fonction est appelée sous la forme sigm=anasyn psola(sig, Tempo,Tempo2,Fs); où Tempo est le tempo du premier signal, Tempo2 le tempo du second signal et Fs la fréquence d échantillonnage sigm est le signal modifié temporellement que l on mixera avec le signal 2 à l aide de la fonction de mixage par Overlap and Add Ajustement du point de jonction Afin d améliorer le mixage, on se propose de calculer un meilleur point de raccordement de telle sorte que la rupture dans la périodicité du tempo soit moins sensible Pour cela, on prendra les deux dernières secondes du premier son modifié (sigm) et les 2 premières secondes du deuxième signal (sig2) On calculera leur fonction de détection (fonc det) (en utilisant la méthode implémentée aux paragraphes antérieures) On calculera ensuite le meilleur point de jonction en recherchant le maximum 4

Autocorrelation et courbe de ponderation 5 2 4 6 8 2 Decalage (s) Autocorrelation ponderee 5 2 4 tempo 6 8 2 Decalage (s) Figure 6: En haut : autocorrélation et courbe de pondération En bas : autocorrélation pondérée pondération pondération lmix lmix signal signal 2 Figure 7: mixage OLA delacorrélation entrefonc detmdupremiersignalmodifiéetfonc det2dusecondsignal Le maximum de cette inter-correlation nous donnera finalement l indice de début du sig2 que l on doit considérer Dans certains cas, les tempos des deux morceaux à mixer sont très différents Que pourriez vous faire pour garantir un mixage au mieux dans ce cas? 4 Signaux et programmes fournis Le fichier tp index audiozip contient un ensemble de programmes Matlab et quelques signaux courts sigwav et sig2wav le deux signaux initiaux à considérer sig3wav, sig4wav, sig4wav qui sont trois autres signaux 5

On privilégiera l utilisation les signaux sig, et sig2 pour mettre au point les différents modules 6