Identification audio pour la reconnaissance de la parole
|
|
- Franck Marchand
- il y a 6 ans
- Total affichages :
Transcription
1 Identification audio pour la reconnaissance de la parole Matthieu Camus Encadrants au DIADEX LIPADE Marie-José Caraty Claude Montacié Encadrants à Orange Labs Patrice Collen Jean-Bernard Rault
2 Introduction Identification audio par empreinte Représentation acoustique du signal audio sous forme d empreinte Principe d identification audio par l exemple Applications : indexation audio, identification d extraits de musique Adaptation à la Reconnaissance Automatique de la Parole (RAP) Avantage : faible complexité (rapidité d exécution) Problématique : gestion de la variabilité du signal de parole? Application envisagée : détection de mots-clés Système de reconnaissance de mots isolés [Vasiloglou et al, 2004] Matthieu Camus Identification audio pour la reconnaissance de la parole page 2
3 Plan Identification audio par empreinte et adaptation à la RAP Principe d un système d identification audio par empreinte Méthodes d identification audio de Philips et de Shazam Adaptation au Décodage Acoustico-Phonétique (DAP) Variabilité du signal de parole et robustesse de sousempreintes Variabilité extrinsèque et variabilité intrinsèque Robustesse de types de sous-empreinte issus de l identification audio et de paramètres MFCCs Perspective et conclusion Matthieu Camus Identification audio pour la reconnaissance de la parole page 3
4 Principe de l identification audio par empreinte Objectif : déterminer si deux éléments audio différents sont issus du même document Exemple : identifier un morceau de musique au format MP3 à partir d une base d apprentissage de CDs audio [Haitsma et al, 2002] Méthode d association d une signature caractéristique à un signal audio analysé Pas d altération du signal d origine ( watermarking) Extraction de caractéristiques acoustiques conservées dans une base d apprentissage Matthieu Camus Identification audio pour la reconnaissance de la parole page 4
5 Empreinte audio Caractéristiques idéales d une empreinte audio Unique valeur de représentation différente pour deux signaux audio différents Compacte faible taille en mémoire pour le stockage dans une base d apprentissage Robuste résistance aux dégradations du signal acoustique par traitement audio : compression, filtrage, égalisation, contrôle de la dynamique [Haitsma et al, 2002] (exemple : signal de test issu d une diffusion radiophonique) Recherche d un compromis entre unicité et compacité, qui soit le plus robuste possible Matthieu Camus Identification audio pour la reconnaissance de la parole page 5
6 Identification d extraits de musique extraits de musique création d'empreinte base d apprentissage métadonnées d identification apprentissage test signal audio de test création d'empreinte extrait identifié comparaison Matthieu Camus Identification audio pour la reconnaissance de la parole page 6
7 Méthode de Philips Empreinte issue d une analyse spectrale en banc de filtres [Haitsma et al, 2001] Banc de filtres passe-bande sur la plage [300, 2000] Hz selon une échelle perceptuelle (type Bark) Empreintes obtenues à partir de trames de 370 ms avec un taux de recouvrement de 97 % Matthieu Camus Identification audio pour la reconnaissance de la parole page 7
8 Méthode de Philips : empreinte Représentation compacte d une trame : la sous-empreinte Bit du signe de la double dérivée temps-fréquence de l énergie entre deux trames et deux sous-bandes adjacentes [Haitsma, 2001] T : opérateur de délai pour conserver la trame précédente signal audio analyse en sous-bandes valeur d énergie signe signe binarisation E T - + >0 E T - + >0 B 0 B 1 calcul du vecteur acoustique calcul de la sous-empreinte Matthieu Camus Identification audio pour la reconnaissance de la parole page 8
9 index binaire Méthode de Philips : comparaison Empreinte = bloc de sous-empreintes de taille fixe Accès rapide pour l identification (table de hachage) Distance entre empreintes : le Bit Error Rate (BER) issu de la distance locale de Hamming a) empreinte d origine b) empreinte altérée temps (en s) différence entre a) et b) BER = 0,1 Matthieu Camus Identification audio pour la reconnaissance de la parole page 9
10 Méthode de Shazam Empreinte issue d une recherche des points à haute amplitude énergétique dans un voisinage [Wang, 2003] Analyse du signal ré-échantillonné à 8000 Hz sur des trames de 64 ms avec un recouvrement de 50 %, en sousbandes de fréquence [Ellis, 2009] Application commerciale pour l identification de morceaux de musique : Shazam [Wang, 2006] Matthieu Camus Identification audio pour la reconnaissance de la parole page 10
11 fréquence (Hz) Méthode de Shazam : empreinte Recherche de points d intérêt temps (s) Point d intérêt : présence d énergie par rapport au voisinage local Appariement de points d intérêt avec un seuil sur les temps et fréquence Conservation des points appariés contenant les plus grandes valeurs d énergie (environ 5 par seconde) Matthieu Camus Identification audio pour la reconnaissance de la parole page 11
12 Méthode de Shazam : comparaison Sous-empreinte issue de valeurs quantifiées (e.g. 20 bits) 8 bits pour la fréquence du 1 er point d intérêt 6 bits pour la fréquence du 2 nd point d intérêt 6 bits pour l intervalle temporel entre les deux points d intérêt Identification entre segments de sous-empreintes directement sur les valeurs quantifiées 1. recherche de sous-empreintes identiques dans la base d apprentissage retournant les empreintes candidates 2. comparaison des empreintes candidates avec le segment de test 3. calcul d un histogramme des décalages temporels sur sous-empreintes à fréquence similaire 4. identification valide si la vraisemblance sur l histogramme est supérieure à un seuil Matthieu Camus Identification audio pour la reconnaissance de la parole page 12
13 Caractéristiques Philips - Shazam Sous-empreinte Caractéristiques Paramétrisation Philips Moyen terme, fort recouvrement Shazam Court terme, recouvrement moyen Extraction Toutes les trames Points d intérêt Mode de calcul Bit du signe de doubles dérivées en tempsfréquence de l énergie Valeurs quantifiées de couples de points d intérêt et leur distance temporelle Matthieu Camus Identification audio pour la reconnaissance de la parole page 13
14 Identification audio et DAP sous-empreintes et métadonnées d apprentissage phonèmes b D Z u { (le bonjour) comparaison identification des unités linguistiques signal de parole de test extraction de sous-empreintes (le rouge) { u Z Matthieu Camus Identification audio pour la reconnaissance de la parole page 14
15 Sous-empreintes pour le DAP Adaptation de la méthode de Philips (AP-DAP) Paramétrisation acoustique adaptée au signal de parole (trames de 25 ms toutes les 10 ms sur l intervalle [40 Hz, 3700 Hz]) Simplification du calcul de dérivée temps-fréquence pour favoriser la similarité des sous-empreintes contigües Relâchement de la contrainte d identification : recherche des sousempreintes similaires à N-bits près dans la base d apprentissage (N défini par le seuil sur le BER) Matthieu Camus Identification audio pour la reconnaissance de la parole page 15
16 Sous-empreintes pour le DAP (2) Sous-empreintes à partir de vecteurs MFCCs (QV et QVS) Paramètres acoustiques MFCCs + C0, dérivées 1 res et 2 ndes Quantification vectorielle non-supervisée (QV) Segmentation par k-moyenne avec répartition équilibrée Calcul de centroïde C avec la distance au vecteur MFCC x Sous-empreinte = index de valeur du centroïde le plus proche du vecteur Quantification vectorielle supervisée non-uniforme (QVS) Apprentissage supervisé : quantification pour chaque phonème Regroupement des centroïdes contigus de même phonème Suppression des centroïdes isolés Matthieu Camus Identification audio pour la reconnaissance de la parole page 16
17 Principe d identification pour le DAP Empreinte = segment de sous-empreintes de taille variable selon la segmentation phonétique segments de sous-empreintes + phonèmes candidat 1 : phonème D candidat 2 : phonème u sous-empreintes de test appariement de sous-empreintes Choix de la meilleure séquence phonétique (level-building) maximiser la similarité entre segments de sous-empreintes minimiser le nombre de changements de séquences d empreintes Matthieu Camus Identification audio pour la reconnaissance de la parole page 17
18 Expériences de DAP Expériences sur les corpus TIMIT, NTIMIT et BREF80 Apprentissage et test homogènes (même base de données) Taille commune de sous-empreinte sur 16 bits Comparaison à un système de référence HMM-GMM à 3 états (paramètres MFCCs, monophones, 512 gaussiennes par état) Résultats en terme de taux de reconnaissance (accuracy) Accuracy (%) TIMIT NTIMIT BREF80 HMM-GMM 61,2 43,7 74,4 AP-DAP 17,6 13,0 19,0 QV 26,2 13,6 41,1 QVS 46,2 28,2 55,3 Matthieu Camus Identification audio pour la reconnaissance de la parole page 18
19 2 Variabilité du signal de parole et robustesse de sous-empreintes Matthieu Camus Identification audio pour la reconnaissance de la parole page 19
20 Variabilité extrinsèque Perturbation du signal audio lors de sa transmission et de son acquisition Bruits additifs liés à l environnement (bruit extérieur) Bruits convolutifs liés à des effets acoustiques de type écho ou lors du passage par un canal de transmission (canal téléphonique) Enregistrement et restitution lors d une conversion (fonction de transfert du microphone, numérisation) Matthieu Camus Identification audio pour la reconnaissance de la parole page 20
21 Evaluation de la variabilité extrinsèque Analyse de la robustesse de sous-empreintes issues de la reproduction d un signal de parole dégradé Signal de test obtenu à partir du signal de parole de l apprentissage ayant subi une dégradation audio (enregistrement studio et restitution à travers un réseau téléphonique) Seuil de validation sur la distance entre sous-empreintes robustesse à la dégradation du signal (gestion du critère de similarité entre sous-empreintes) Est-ce que la distance entre une sous-empreinte de test et sa correspondance dans l apprentissage est inférieure au seuil de validation? Matthieu Camus Identification audio pour la reconnaissance de la parole page 21
22 Robustesse et variabilité extrinsèque apprentissage segment phonétique comparaison < seuil? Mesure de distance entre la sous-empreinte de test et sa correspondance dans l apprentissage test sous-empreinte Prise en compte d un possible décalage temporel Mesure par Précision Extrinsèque PE = NI / NTest NI = nombre de sous-empreintes de test inférieures au seuil NTest = nombre de sous-empreintes de test Matthieu Camus Identification audio pour la reconnaissance de la parole page 22
23 Variabilité intrinsèque Liée au mode de production de la parole Effets de coarticulation (contexte phonétique, débit de parole) Intra-locuteur Type de parole (lue, spontanée, conversationnelle) Etat émotionnel, stress (effet Lombard), fatigue Inter-locuteur Caractéristiques morphologiques : sexe, âge, taille Origines géographiques, langue Matthieu Camus Identification audio pour la reconnaissance de la parole page 23
24 Evaluation de la variabilité intrinsèque Analyse de la robustesse de sous-empreintes de test issues d une nouvelle production de signal de parole Signal de test obtenu à partir d un signal de parole différent de celui de l apprentissage (nouvelle prononciation) Seuil de validation sur la distance entre sous-empreintes robustesse à la discrimination phonétique (compromis entre fausse alarme et faux rejet) Les sous-empreintes de l apprentissage, dont la distance avec une sous-empreinte de test est inférieure au seuil, retournent-elles la bonne étiquette phonétique? Matthieu Camus Identification audio pour la reconnaissance de la parole page 24
25 Robustesse et variabilité intrinsèque apprentissage Mesure de distance entre une sous-empreinte de test et tout l apprentissage comparaison < seuil? sous-empreinte de test test Mesure de Précision Intrinsèque Locale PIL = N / NT N = nombre de bonnes étiquettes phonétiques retournées NT = nombre total d étiquettes phonétiques retournées Précision intrinsèque : moyenne des précisions locales PIL Matthieu Camus Identification audio pour la reconnaissance de la parole page 25
26 Robustesse de sous-empreintes Bases de données Apprentissage sur un signal de parole propre : TIMIT Tests sur un signal de parole dégradé : NTIMIT, CTIMIT Types de sous-empreinte Paramétrisation : fenêtre de 25 ms calculées toutes les 10 ms AP : Philips (20 bits, sous-bandes sur l intervalle [40, 3700] Hz) AS : Shazam (20 bits, 100 sous-empreintes/seconde en moyenne) MFCC : paramètres MFCCs + C0, dérivées 1 res et 2 ndes QV : quantification vectorielle non-supervisée (12 bits, paramètres MFCCs) Evaluation sur les trames sélectionnées par Shazam (AS) Matthieu Camus Identification audio pour la reconnaissance de la parole page 26
27 Critère de similarité Limiter le biais sur les mesures de distance AP et AS : distance de Hamming MFCC : distance euclidienne, QV : distance de Bhattacharyya Recherche d un nombre de plus proches voisins dans un espace de recherche donné sous-empreinte de test pour la recherche des plus proches voisins sous-empreintes d apprentissage mesure de distance maximale zone de recherche des plus proches voisins Matthieu Camus Identification audio pour la reconnaissance de la parole page 27
28 précision extrinsèque (en %) Identification audio Adaptation DAP Variabilités Robustesse Conclusion Variabilité extrinsèque (1) apprentissage : TIMIT test : NTIMIT Augmentation de la précision extrinsèque suivant la distance maximale AS : sous-empreintes les plus robustes distance de Hamming maximale AP AS QV MFCC MFCC : bonne résistance aux bruits convolutifs QV : peu robuste et avec une faible évolution selon la distance maximale répartition des centroïdes dans l espace de recherche? Matthieu Camus Identification audio pour la reconnaissance de la parole page 28
29 précision extrinsèque (en %) Identification audio Adaptation DAP Variabilités Robustesse Conclusion Variabilité extrinsèque (2) apprentissage : TIMIT test : CTIMIT AS : maintien de la robustesse par rapport au test NTIMIT robuste aux bruits additifs distance de Hamming maximale AP AS QV MFCC AP : évolution similaire à AS MFCC : forte diminution de la robustesse non-adapté aux bruits additifs QV : très faiblement robuste Matthieu Camus Identification audio pour la reconnaissance de la parole page 29
30 précision moyenne (en %) Identification audio Adaptation DAP Variabilités Robustesse Conclusion Variabilité extrinsèque/intrinsèque (1) apprentissage : TIMIT test : NTIMIT Diminution de la précision moyenne avec augmentation de la distance maximale QV : discrimination à la classification phonétique distance de Hamming maximale AP AS QV MFCC AS et AP : faiblement robuste MFCC : robustesse proche du hasard Matthieu Camus Identification audio pour la reconnaissance de la parole page 30
31 précision moyenne (en %) Identification audio Adaptation DAP Variabilités Robustesse Conclusion Variabilité extrinsèque/intrinsèque (2) apprentissage : TIMIT test : CTIMIT QV : diminution de la robustesse par rapport au test NTIMIT peu robuste aux bruits additifs AS et AP : maintien des performances bonne résistance aux bruits additifs distance de Hamming maximale AP AS QV MFCC AS : la plus robuste sur CTIMIT Matthieu Camus Identification audio pour la reconnaissance de la parole page 31
32 Variabilités et sous-empreintes Etude des variabilités extrinsèque et intrinsèque Reproduction d un signal dégradé nouvelle production d un signal Paradigmes d évaluation : précisions extrinsèque et moyenne Evolution de la robustesse suivant la distance maximale Partitionnement de l espace différent selon le type de sous-empreinte Résultats contrastés Sous-empreintes MFCC robustes sur NTIMIT (bruit convolutif) Sous-empreintes Shazam meilleures sur CTIMIT (bruit additif) Matthieu Camus Identification audio pour la reconnaissance de la parole page 32
33 3 Conclusion et perspective Matthieu Camus Identification audio pour la reconnaissance de la parole page 33
34 Conclusion Principe de l identification audio adapté à la RAP Apprentissage : base de données en mémoire avec sous-empreintes et unités linguistiques associées Test : comparaison de segments de sous-empreintes DAP fonctionnel mais aux performances inférieures à un HMM Variabilités extrinsèque et intrinsèque spécifique à la parole MFCCs quantifiés robustes à la variabilité intrinsèque et bruit convolutif (NTIMIT) adaptation de Shazam robuste aux bruits additifs (CTIMIT) Performance de telles sous-empreintes dans un système de détection de mots-clés? Matthieu Camus Identification audio pour la reconnaissance de la parole page 34
35 FOM (en %) Détection de mots-clés Système de référence [Rose, 1990] Représentation phonétique par modélisation HMM-GMM Modèles de mots-clés et modèle poubelle avec pénalité pénalité TIMIT NTIMIT CTIMIT Apprentissage TIMIT, test sur signal de parole propre et dégradé Problème de discrimination lors de l apparition de bruit Adaptation de l identification audio? Matthieu Camus Identification audio pour la reconnaissance de la parole page 35
36 Détection de mots-clés apprentissage b D Z u { mot 1 mot 2 sous-empreintes transcription phonétique positions de mot-clé comparaison signal de parole de test Matthieu Camus Identification audio pour la reconnaissance de la parole page 36
37 Merci de votre attention Matthieu Camus Identification audio pour la reconnaissance de la parole page 37
Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier
Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration
Plus en détailChaine de transmission
Chaine de transmission Chaine de transmission 1. analogiques à l origine 2. convertis en signaux binaires Échantillonnage + quantification + codage 3. brassage des signaux binaires Multiplexage 4. séparation
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailIntérêt du découpage en sous-bandes pour l analyse spectrale
Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,
Plus en détailISO/CEI 11172-3 NORME INTERNATIONALE
NORME INTERNATIONALE ISO/CEI 11172-3 Première édition 1993-08-01 Technologies de l information - Codage de l image animée et du son associé pour les supports de stockage numérique jusqu à environ Ii5 Mbit/s
Plus en détailEnregistrement et transformation du son. S. Natkin Novembre 2001
Enregistrement et transformation du son S. Natkin Novembre 2001 1 Éléments d acoustique 2 Dynamique de la puissance sonore 3 Acoustique géométrique: effets de diffusion et de diffraction des ondes sonores
Plus en détailBandes Critiques et Masquage
Bandes Critiques et Masquage A. Almeida Licence Pro Acoustique et Vibrations Octobre 2012 Au Menu Au programme 1 Observations du masquage 5 Application du masquage 2 Conséquences du Masquage 3 Interprétation
Plus en détailINTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE
INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE Le schéma synoptique ci-dessous décrit les différentes étapes du traitement numérique
Plus en détailTraitement bas-niveau
Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.
Plus en détailLes techniques de multiplexage
Les techniques de multiplexage 1 Le multiplexage et démultiplexage En effet, à partir du moment où plusieurs utilisateurs se partagent un seul support de transmission, il est nécessaire de définir le principe
Plus en détailAbdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole
ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES (ORLEANS) FACULTÉ de TECHNOLOGIE (Sétif) Laboratoire PRISME THÈSE EN COTUTELLE INTERNATIONALE présentée par : Abdenour Hacine-Gharbi soutenue le : 09 décembre 2012
Plus en détailUne empreinte audio à base d ALISP appliquée à l identification audio dans un flux radiophonique
Une empreinte audio à base d ALISP appliquée à l identification audio dans un flux radiophonique H. Khemiri 1,2 D. Petrovska-Delacrétaz 1 G. Chollet 2 1 Département Electronique et Physique TELECOM SudParis,
Plus en détailÉtude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test
11 juillet 2003 Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test Mariane Comte Plan 2 Introduction et objectif
Plus en détailLES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES
LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES Compétences mises en jeu durant l'activité : Compétences générales : S'impliquer, être autonome. Compétence(s) spécifique(s) : Reconnaître des signaux de nature
Plus en détailTS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S
FICHE Fiche à destination des enseignants TS 35 Numériser Type d'activité Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S Compétences
Plus en détailTransmission de données. A) Principaux éléments intervenant dans la transmission
Page 1 / 7 A) Principaux éléments intervenant dans la transmission A.1 Equipement voisins Ordinateur ou terminal Ordinateur ou terminal Canal de transmission ETTD ETTD ETTD : Equipement Terminal de Traitement
Plus en détailSystèmes de transmission
Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un
Plus en détailEtudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté
Compétences travaillées : Mettre en œuvre un protocole expérimental Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique
Plus en détailLES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION
LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION ) Caractéristiques techniques des supports. L infrastructure d un réseau, la qualité de service offerte,
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailSYSTEME DE PALPAGE A TRANSMISSION RADIO ETUDE DU RECEPTEUR (MI16) DOSSIER DE PRESENTATION. Contenu du dossier :
SYSTEME DE PALPAGE A TRANSMISSION RADIO ETUDE DU RECEPTEUR (MI16) DOSSIER DE PRESENTATION Contenu du dossier : 1. PRESENTATION DU SYSTEME DE PALPAGE A TRANSMISSION RADIO....1 1.1. DESCRIPTION DU FABRICANT....1
Plus en détailA la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique
A la découverte du Traitement des signaux audio METISS Inria Rennes - Bretagne Atlantique Les conférences scientifiques au Lycée Descartes Imagerie médicale et neuronavigation par Pierre Hellier Le respect
Plus en détailUniversité de La Rochelle. Réseaux TD n 6
Réseaux TD n 6 Rappels : Théorème de Nyquist (ligne non bruitée) : Dmax = 2H log 2 V Théorème de Shannon (ligne bruitée) : C = H log 2 (1+ S/B) Relation entre débit binaire et rapidité de modulation :
Plus en détailProjet de Master en Informatique: Web WriteIt!
Projet de Master en Informatique: Web WriteIt! Web WriteIt! Baris Ulucinar Supervisé par le Prof. Rolf Ingold, Dr. Jean Hennebert, Andreas Humm et Robert Van Kommer Avril 2007 Table des matières 2 1. Introduction
Plus en détailCodage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur
Codage hiérarchique et multirésolution (JPEG 000) Codage Vidéo Représentation de la couleur Codage canal et codes correcteurs d erreur Format vectoriel (SVG - Scalable Vector Graphics) Organisation de
Plus en détailNumérisation du signal
Chapitre 12 Sciences Physiques - BTS Numérisation du signal 1 Analogique - Numérique. 1.1 Définitions. Signal analogique : un signal analogique s a (t)est un signal continu dont la valeur varie en fonction
Plus en détailMesure agnostique de la qualité des images.
Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire
Plus en détailUE11 Phonétique appliquée
UE11 Phonétique appliquée Christelle DODANE Permanence : mercredi de 11h15 à 12h15, H211 Tel. : 04-67-14-26-37 Courriel : christelle.dodane@univ-montp3.fr Bibliographie succinte 1. GUIMBRETIERE E., Phonétique
Plus en détailMinistère de l Enseignement Supérieur et de la Recherche Scientifique
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Institut National de Formation en Informatique (I.N.I) Oued Smar Alger Direction de la Post Graduation et de la Recherche Thème : Inférence
Plus en détailInformation. BASES LITTERAIRES Etre capable de répondre à une question du type «la valeur trouvée respecte t-elle le cahier des charges?
Compétences générales Avoir des piles neuves, ou récentes dans sa machine à calculer. Etre capable de retrouver instantanément une info dans sa machine. Prendre une bouteille d eau. Prendre CNI + convocation.
Plus en détailLABO 5-6 - 7 PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB
LABO 5-6 - 7 PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB 5.1 Introduction Au cours de séances précédentes, nous avons appris à utiliser un certain nombre d'outils fondamentaux en traitement du
Plus en détailVotre Réseau est-il prêt?
Adapter les Infrastructures à la Convergence Voix Données Votre Réseau est-il prêt? Conférence IDG Communications Joseph SAOUMA Responsable Offre ToIP Rappel - Définition Voix sur IP (VoIP) Technologie
Plus en détailP2: Perception auditive
P2: Perception auditive Daniel Pressnitzer Laboratoire des Systèmes Perceptifs, CNRS & Département d études cognitives, Ecole normale supérieure 29 rue d Ulm, 75230 Paris cedex 05 daniel.pressnitzer@ens.fr
Plus en détailExtraction de descripteurs musicaux: une approche évolutionniste
Extraction de descripteurs musicaux: une approche évolutionniste Thèse de Doctorat de l Université Paris 6 Spécialité: Informatique Aymeric ZILS Sony CSL Paris, 6 rue Amyot 75005 Paris Laboratoire d Informatique
Plus en détailExpérience 3 Formats de signalisation binaire
Expérience 3 Formats de signalisation binaire Introduction Procédures Effectuez les commandes suivantes: >> xhost nat >> rlogin nat >> setenv DISPLAY machine:0 >> setenv MATLABPATH /gel/usr/telecom/comm_tbx
Plus en détailTP Modulation Démodulation BPSK
I- INTRODUCTION : TP Modulation Démodulation BPSK La modulation BPSK est une modulation de phase (Phase Shift Keying = saut discret de phase) par signal numérique binaire (Binary). La phase d une porteuse
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailChapitre 2 : Systèmes radio mobiles et concepts cellulaires
Chapitre 2 : Systèmes radio mobiles et concepts cellulaires Systèmes cellulaires Réseaux cellulaires analogiques de 1ère génération : AMPS (USA), NMT(Scandinavie), TACS (RU)... Réseaux numériques de 2ème
Plus en détailCalcul des indicateurs de sonie : revue des algorithmes et implémentation
Calcul des indicateurs de sonie : revue des algorithmes et implémentation Stéphane Molla 1, Isabelle Boullet 2, Sabine Meunier 2, Guy Rabau 2, Benoît Gauduin 1, Patrick Boussard 1 1 GENESIS S.A., Domaine
Plus en détailCâblage des réseaux WAN. www.ofppt.info
Office de la Formation Professionnelle et de la Promotion du Travail Câblage des réseaux WAN C-D-002.doc Mars 1-7 Sommaire 1. Couche physique WAN... 3 1.1. Connexions série WAN... 4 1.2. Routeurs et connexions
Plus en détailAnalyse des bruits de clavier d ordinateur
Analyse des bruits de clavier d ordinateur Introduction 1 Enregistrement des bruits de clavier 2 Analyse des bruits de clavier 3 Analyse du niveau de pression acoustique vs. temps 4 Sonie vs. temps 4 Acuité
Plus en détailCompression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette
Compression et Transmission des Signaux Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette 1 De Shannon à Mac Donalds Mac Donalds 1955 Claude Elwood Shannon 1916 2001 Monsieur X 1951 2 Où
Plus en détailChapitre 18 : Transmettre et stocker de l information
Chapitre 18 : Transmettre et stocker de l information Connaissances et compétences : - Identifier les éléments d une chaîne de transmission d informations. - Recueillir et exploiter des informations concernant
Plus en détailChapitre 2 : communications numériques.
Chapitre 2 : communications numériques. 1) généralités sur les communications numériques. A) production d'un signal numérique : transformation d'un signal analogique en une suite d'éléments binaires notés
Plus en détailUne fréquence peut-elle être instantanée?
Fréquence? Variable? Instantané vs. local? Conclure? Une fréquence peut-elle être instantanée? Patrick Flandrin CNRS & École Normale Supérieure de Lyon, France Produire le temps, IRCAM, Paris, juin 2012
Plus en détailApproche par marquage pour l évaluation de la qualité d image dans les applications multimédias
UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Approche par marquage pour l évaluation de la qualité d image dans les applications multimédias MÉMOIRE (INF6021) pour l obtention
Plus en détailTeamConnect. SL TeamConnect CU1, Unité centrale SL TeamConnect CB1, Combox CARACTÉRISTIQUES
TeamConnect SL TeamConnect CU1, Unité centrale SL TeamConnect CB1, Combox CARACTÉRISTIQUES 8 Connectivité par ligne téléphonique terrestre et PC/Voix sur IP (VoiP) pour téléconférence via téléphone et
Plus en détailCommunication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014
Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO 20 mars 2014 La phonétique acoustique La phonétique acoustique étudie les propriétés physiques du signal
Plus en détailMultimedia. Systèmes, Communications et Applications. Ahmed MEHAOUA
Multimedia Systèmes, Communications et Applications Ahmed MEHAOUA Professeur - Laboratoire CRIP5 Ahmed.mehaoua@math-info.univ-paris5.fr Plan 1. Multimedia : principes et définitions 2. Algorithmes et normes
Plus en détailOn distingue deux grandes catégories de mémoires : mémoire centrale (appelée également mémoire interne)
Mémoire - espace destiné a recevoir, conserver et restituer des informations à traiter - tout composant électronique capable de stocker temporairement des données On distingue deux grandes catégories de
Plus en détailSystèmes de conférence
Systèmes de conférence Sennheiser vous propose des solutions globales performantes pour équiper vos salles de conférences. Quels que soient vos besoins, Sennheiser France vous propose une gamme de produits
Plus en détailL analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :
La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.
Plus en détailManageEngine Netflow Analyser
Supervision des flux Netflow Eléments à surveiller : flux provenant de la carte NAM, CISCO Routeur, Enterasys Il est souhaitable de paramétrer les équipements réseaux pour renvoyer les flux Netflow sur
Plus en détailRapport : Base de données. Anthony Larcher 1
Rapport : Base de données Anthony Larcher 1 1 : Laboratoire d Informatique d Avignon - Université d Avignon Tél : +33 (0) 4 90 84 35 55 - Fax : + 33 (0) 4 90 84 35 01 anthony.larcher@univ-avignon.fr 14
Plus en détailCLIP. (Calling Line Identification Presentation) Appareil autonome affichant le numéro appelant
1. Besoin CLIP (Calling Line Identification Presentation) Appareil autonome affichant le numéro appelant ETUDE FONCTIONNELLE De très nombreux abonnés du réseau téléphonique commuté ont exprimé le besoin
Plus en détail1. PRESENTATION DU PROJET
Bac STI2D Formation des enseignants Jean-François LIEBAUT Denis PENARD SIN 63 : Prototypage d un traitement de l information analogique et numérique (PSoC) 1. PRESENTATION DU PROJET Les systèmes d éclairage
Plus en détail«Le Dolby Digital 5.1 et les tests en champ libre par ordinateur»
«Le Dolby Digital 5.1 et les tests en champ libre par ordinateur» Introduction : Jusqu à présent les tests en champ libre transitaient par un audiomètre et un dispatcher pour sortir sur la localisation
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailTHÈSE. présentée à l Université d Avignon et des Pays de Vaucluse pour obtenir le diplôme de DOCTORAT
ACADÉMIE D AIX-MARSEILLE UNIVERSITÉ D AVIGNON ET DES PAYS DE VAUCLUSE THÈSE présentée à l Université d Avignon et des Pays de Vaucluse pour obtenir le diplôme de DOCTORAT SPÉCIALITÉ : Informatique École
Plus en détailParamétrisation adaptée de transitoires pour la reconnaissance d instruments de musique
Paramétrisation adaptée de transitoires pour la reconnaissance d instruments de musique Pierre LEVEAU Mémoire de stage de DEA ATIAM année 2003-2004 Mars - Juillet 2004 Université Pierre et Marie Curie
Plus en détailUE 503 L3 MIAGE. Initiation Réseau et Programmation Web La couche physique. A. Belaïd
UE 503 L3 MIAGE Initiation Réseau et Programmation Web La couche physique A. Belaïd abelaid@loria.fr http://www.loria.fr/~abelaid/ Année Universitaire 2011/2012 2 Le Modèle OSI La couche physique ou le
Plus en détailChapitre I La fonction transmission
Chapitre I La fonction transmission 1. Terminologies 1.1 Mode guidé / non guidé Le signal est le vecteur de l information à transmettre. La transmission s effectue entre un émetteur et un récepteur reliés
Plus en détailSystèmes de communications numériques 2
Systèmes de Communications Numériques Philippe Ciuciu, Christophe Vignat Laboratoire des Signaux et Systèmes CNRS SUPÉLEC UPS SUPÉLEC, Plateau de Moulon, 91192 Gif-sur-Yvette ciuciu@lss.supelec.fr Université
Plus en détailCapacité étendue d utilisation en réseau
Fiche technique n VIBOFF_1A_f Emonitor Odyssey introduit une nouvelle conception de la maintenance conditionnelle (prédictive) en automatisant les opérations de routine afin d améliorer les vitesses de
Plus en détailProduction de documents audio-numériques
Technique de l Information et de la Communication Production de documents audio-numériques 1. Technique Acoustique : --------------------------------------------------- 2 notions de base sur le son. Fréquence,
Plus en détailProjet de Traitement du Signal Segmentation d images SAR
Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,
Plus en détailEchantillonnage Non uniforme
Echantillonnage Non uniforme Marie CHABERT IRIT/INP-ENSEEIHT/ ENSEEIHT/TéSASA Patrice MICHEL et Bernard LACAZE TéSA 1 Plan Introduction Echantillonnage uniforme Echantillonnage irrégulier Comparaison Cas
Plus en détailwww.ceotronics.fr CT-DECT GateCom 3W avec Fonction CT-ASR CT-DECT Bluetooth / tablette tactile et téléphones GSM Geschäftsbericht 09/10 I 1
www.ceotronics.fr CT-DECT avec Fonction CT-ASR CT-DECT Bluetooth / tablette tactile et téléphones GSM Geschäftsbericht 09/10 I 1 NOUVEAU! 3W (3-voies) avec CT-DECT GateCom Fonction CT-ASR CT-DECT Bluetooth
Plus en détailManual de l utilisateur
Manual de l utilisateur Noms des pièces Bouton d enregistrement Micro Indicateur d'état Emplacement pour Carte SD Micro Haut-parleur Port USB Micro Crochet pour Bandoulière Mode Vidéo Mode Photo Mode Local
Plus en détailUtilisation d informations visuelles dynamiques en asservissement visuel Armel Crétual IRISA, projet TEMIS puis VISTA L asservissement visuel géométrique Principe : Réalisation d une tâche robotique par
Plus en détailCodage de la parole à bas et très bas débit 1
Codage de la parole à bas et très bas débit 1 Geneviève Baudoin (1), J. Cernocký (2), P. Gournay (3), G. Chollet (4) (1) Département Signaux et Télécommunications, ESIEE BP 99 93162 Noisy Le Grand CEDEX
Plus en détailLa PSBT Optique : Un candidat sérieux pour augmenter le débit sur les installations existantes.
La PSBT Optique : Un candidat sérieux pour augmenter le débit sur les installations existantes. Farouk Khecib, Olivier Latry, Mohamed Ketata IUT de Rouen, Université de Rouen Département Génie Électrique
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailScanner acoustique NoiseScanner
Scanner acoustique NoiseScanner «Des yeux et des oreilles pour localiser les sources de bruit...» Scanner acoustique NoiseScanner Décibel d Or 2014 Caractéristiques générales Originalités Fruit de 20 ans
Plus en détailLes Réseaux sans fils : IEEE 802.11. F. Nolot
Les Réseaux sans fils : IEEE 802.11 F. Nolot 1 Les Réseaux sans fils : IEEE 802.11 Historique F. Nolot 2 Historique 1er norme publiée en 1997 Débit jusque 2 Mb/s En 1998, norme 802.11b, commercialement
Plus en détailProjet audio. Analyse des Signaux ELE2700
ÉCOLE POLYTECHNIQUE DE MONTRÉAL Département de Génie Électrique Projet audio Analyse des Signaux ELE2700 Saad Chidami - 2014 Table des matières Objectif du laboratoire... 4 Caractérisation du bruit...
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailMesures en réception télévision
1. Télévision terrestre analogique Rappels En bande terrestre analogique pour une prise utilisateur le niveau doit être compris entre 57 et 74 dbµv Ces niveaux sont donnés pour un signal de grande qualité.
Plus en détailGéométrie discrète Chapitre V
Géométrie discrète Chapitre V Introduction au traitement d'images Géométrie euclidienne : espace continu Géométrie discrète (GD) : espace discrétisé notamment en grille de pixels GD définition des objets
Plus en détailConservation des documents numériques
Conservation des documents numériques Qu'est ce qu'un document numérique? Matthieu GIOUX matthieu.gioux@bnf.fr Contexte de la préservation des documents numériques Une croissance en expansion Développement
Plus en détailChapitre 2 Les ondes progressives périodiques
DERNIÈRE IMPRESSION LE er août 203 à 7:04 Chapitre 2 Les ondes progressives périodiques Table des matières Onde périodique 2 2 Les ondes sinusoïdales 3 3 Les ondes acoustiques 4 3. Les sons audibles.............................
Plus en détailEtude et conception d un serveur vocal :
République Algérienne Démocratique et Populaire Ministère de l enseignement supérieur et de la recherche Scientifique Université Hadj Lakhdar Batna Faculté de Technologie Département de Génie Industriel
Plus en détailAnalyses psychoacoustiques dans ArtemiS SUITE
Analyses psychoacoustiques dans ArtemiS SUITE La psychoacoustique est l étude du rapport existant entre les grandeurs physiques du son et la sensation auditive qu elles provoquent. Des paramètres physiques
Plus en détailRégler les paramètres de mesure en choisissant un intervalle de mesure 10µs et 200 mesures.
TP Conversion analogique numérique Les machines numériques qui nous entourent ne peuvent, du fait de leur structure, que gérer des objets s composés de 0 et de. Une des étapes fondamentale de l'interaction
Plus en détailUniversité du Québec à Chicoutimi THESE. Présentée à l'université du Québec à Chicoutimi Département des Sciences Appliquées
Université du Québec à Chicoutimi THESE Présentée à l'université du Québec à Chicoutimi Département des Sciences Appliquées pour le grade de: Doctorat en Ingénierie Discrimination Parole/Musique et étude
Plus en détailTD 1 - Transmission en bande de passe
Claude Duvallet Université du Havre UFR Sciences et Techniques 25 rue Philippe Lebon - BP 540 76058 LE HAVRE CEDEX Claude.Duvallet@gmail.com Claude Duvallet 1/10 Transmission en bande de passe (1/2) Description
Plus en détailMesures de temps de propagation de groupe sur convertisseurs de fréquence sans accès aux OL
Mesures de temps de propagation de groupe sur convertisseurs de fréquence sans accès aux Comment mesurer le temps de propagation de groupe sur des convertisseurs de fréquence dans lesquels le ou les oscillateurs
Plus en détailCe document a pour but d aider à planifier l achat d équipement en éducation pour les niveaux primaire et secondaire.
Ce document a pour but d aider à planifier l achat d équipement en éducation pour les niveaux primaire et secondaire. Point de départ : Il n y a pas une sorte de microphone qui convient à toutes les situations
Plus en détailEMETTEUR ULB. Architectures & circuits. Ecole ULB GDRO ESISAR - Valence 23-27/10/2006. David MARCHALAND STMicroelectronics 26/10/2006
EMETTEUR ULB Architectures & circuits David MARCHALAND STMicroelectronics 26/10/2006 Ecole ULB GDRO ESISAR - Valence 23-27/10/2006 Introduction Emergence des applications de type LR-WPAN : Dispositif communicant
Plus en détailArchitecture des ordinateurs
Architecture des ordinateurs Cours 4 5 novembre 2012 Archi 1/22 Micro-architecture Archi 2/22 Intro Comment assembler les différents circuits vus dans les cours précédents pour fabriquer un processeur?
Plus en détailTELEVISION NUMERIQUE
REPUBLIQUE DU CAMEROUN Paix - Travail Patrie --------------------- UNIVERSITE DE YAOUNDE I ---------------------- ECOLE NATIONALE SUPERIEURE POLYTECHNIQUE ---------------------- REPUBLIC OF CAMEROUN Peace
Plus en détailLes réseaux cellulaires
Les réseaux cellulaires Introduction Master 2 Professionnel STIC-Informatique Module RMHD 1 Introduction Les réseaux cellulaires sont les réseaux dont l'évolution a probablement été la plus spectaculaire
Plus en détailMorphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations
U Université dumaine Faculté des Lettres, Langues et Sciences humaines Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations Carole Lailler 1 L interrogation : une modalité
Plus en détailPrésentation et installation PCE-LOG V4 1-5
PCE-LOG V4 version borne externe type PC50 mesures U, I + 3 TS version coffret mural mesures U, U, I + 3TS PRESENTATION 1-5 1 Presentation PCE-LOG V4 est un datalogger pour la télésurveillance de la protection
Plus en détailElectron S.R.L. - MERLINO - MILAN ITALIE Tel (++ 39 02) 90659200 Fax 90659180 Web www.electron.it, e-mail electron@electron.it
Electron S.R.L. Design Production & Trading of Educational Equipment B3510--II APPLIICATIIONS DE TRANSDUCTEURS A ULTRASONS MANUEL D IINSTRUCTIIONS POUR L ETUDIIANT Electron S.R.L. - MERLINO - MILAN ITALIE
Plus en détailArchitectures et Protocoles des Réseaux
Chapitre 5 - Les réseaux xdsl Claude Duvallet Université du Havre UFR Sciences et Techniques 25 rue Philippe Lebon - BP 540 76058 LE HAVRE CEDEX Claude.Duvallet@gmail.com Claude Duvallet 1/32 Plan de la
Plus en détailOptimisation, traitement d image et éclipse de Soleil
Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement
Plus en détailNotice d emploi Sonomètre PCE-353
Notice d emploi Sonomètre PCE-353 PCE Instruments France EURL 76, Rue de la Plaine des Bouchers 67100 Strasbourg France Tel: +33 (0) 972 3537 17 Fax: +33 (0) 972 3537 18 info@pce-france.fr www.pce-france.fr
Plus en détail