Techniques de conversion de voix appliquées à l imposture
|
|
- Rémy Grenon
- il y a 7 ans
- Total affichages :
Transcription
1 Techniques de conversion de voix appliquées à l imposture Patrick Perrot 1,2, Joseph Razik 2, Mathieu Morel 2, Houssemeddine Khemiri 2, et Gérard Chollet 2 1 Institut de Recherche Criminelle de la Gendarmerie Nationale, Département Signal-Image-Parole, 1 boulevard Théophile Sueur, Rosny sous bois, France. 2 CNRS-LTCI-Institut Telecom, Telecom-ParisTech, rue Dareau, Paris, France. prenom.nom@telecom-paristech.fr Résumé L objet de cet article est de présenter une étude comparative à la fois subjective et objective de deux méthodes de conversion de voix et de proposer une nouvelle approche fondée sur une mise en cascade de ces deux techniques. Les critères d évaluation objectifs reposent sur un calcul de distorsion spectrale normalisée et une mesure de vraisemblance alors que les critères subjectifs se concentrent sur une information perceptive. L objectif de notre nouvelle approche est d améliorer le résultat de la conversion d un point de vue perceptif et du point de vue de plusieurs mesures spectrales. Les deux méthodes de base que nous étudions montrent un effet de conversion aux performances semblables. L approche en cascade que nous proposons donne des performances supérieures à ces deux méthodes quelques soient les critères choisis : 6% d amélioration pour la distorsion spectrale et 82% pour la vraisemblance, ainsi qu un léger accroissement de la qualité perceptive. Mots clés Conversion de voix, ALISP, GMM. 1 Introduction Le but de la conversion de voix est de transformer les caractéristiques du signal sonore d un locuteur source vers les caractéristiques d un locuteur cible afin qu un auditeur ou qu un système de reconnaissance automatique ne puisse pas détecter l imposture. La conversion de voix a de nombreuses applications : synthèse, doublage et personnalisation vocale. Les études en conversion de voix permettent également de mettre à l épreuve les systèmes de reconnaissance automatique du locuteur. Différentes méthodes ont été développées au sein de la littérature fondées par exemple sur une quantification vectorielle [1] ou une déformation dynamique du spectre [10]. Toutefois, la plupart de ces approches, bien qu efficace, génère généralement des artefacts dus à des problèmes de phases ou à la conversion des parties non voisées du signal sonore. Nous allons tout d abord nous intéresser à la méthode à base de mélanges de gaussiennes GMM (Gaussian Mixture Model) décrite par Stylianou [8] et améliorée par Kain et Toda [5,9] qui nous a servi de base. Puis nous présenterons la méthode utilisée par Perrot [6] fondée sur l utilisation du codeur-décodeur ALISP (Automatic Language Independent Speech Processing) [2,4]. Enfin, nous réaliserons une combinaison de ces deux approches afin de
2 P. Perrot, J. Razik, M. Morel, H. Khemiri et G. Chollet proposer une nouvelle technique de conversion indépendante du texte. L évaluation de ces différentes approches s effectuera à la fois de façon subjective par des tests perceptifs, et de façon objective par le calcul de mesures de similarités comme la vraisemblance et la distorsion spectrale normalisée. 2 Principe de la conversion de voix Le processus de conversion de voix se décompose en deux étapes : l apprentissage et la transformation. Durant la phase d apprentissage, une séquence de vecteurs spectraux est extraite d enregistrements parallèles alignés de la voix source et de la voix cible. L objectif de cette phase est de déterminer une fonction de conversion optimale qui permet de transformer les vecteurs sources en vecteurs cibles tout en minimisant l erreur quadratique moyenne entre ces vecteurs. La phase de transformation consiste à appliquer cette fonction de conversion aux paramètres de la voix source prononçant un texte quelconque. La plupart des techniques proposées dans la littérature s appuie sur une transformation de paramètres tels que les MFCC (Mel Frequency Cepstral Coefficient) ou les LSF (Linear Spectral Frequency). Concernant la fonction de transformation, différentes possibilités ont été étudiées : la quantification vectorielle [1], la régression linéaire multivariée LMR (Linear Multivariate Regression) [10], la déformation fréquentielle dynamique DFW (Dynamic Frequency Warping) [10], les GMM à partir de l estimation de l erreur quadratique [8] ou de l estimation de la probabilité conjointe entre source et cible [5,9]. 3 Conversion à base de mélanges de gaussiennes Initialement proposée par Stylianou, Kain et Toda [8,5,9], cette méthode constitue la base de nombreux systèmes de conversion de voix dont celui que nous proposons dans cet article. La paramétrisation des signaux acoustiques des voix source et cible est fondée sur une analyse HNM (Harmonic + Noise Model) [7]. Les paramètres HNM des trames voisées sont les amplitudes complexes des harmoniques et la fréquence fondamentale du signal. Les trames non voisées sont représentées par un bruit blanc filtré. A partir de ces paramètres, les MFCC discrets [3] sont calculés par la résolution d un système linéaire. Soit X = [x 1,..., x n ] la séquence de vecteurs spectraux caractéristiques des paroles prononcées par le locuteur source et Y = [y 1,..., y n ], la séquence correspondant à la même phrase prononcée par le locuteur cible. Afin que les séquences X (source) et Y (cible) aient la même taille n, elles ont été préalablement temporellement alignées par programmation dynamique DTW (Dynamic Time Warping). Soit x un vecteur source et y le vecteur cible correspondant, au lieu de déterminer une fonction de conversion entre les modélisations GMM de la voix source et de la voix cible, un seul modèle GMM de la probabilité de
3 Techniques de conversion de voix appliquées à l imposture densité conjointe P (x, y) est appris. C est-à-dire, soit z = [x y] le vecteur conjoint : Q P (z) = α q N q (z, µ q, Σ q ) (1) q=1 Où Q est le nombre de gaussiennes et α q, µ q, Σ q les poids et paramètres de la gaussienne q. Ces paramètres sont estimés par l algorithme itératif EM (Expectation Maximization) sur les données d apprentissage. La fonction de conversion F (x) qui minimise l erreur quadratique est alors définie comme l espérance E(y x) : F (x) = E(x y) = N q=1 P (x q)(µ y q + Σq yx (Σq xx ) 1 (x µ x )) (2) Avec P (x q) la probabilité a posteriori que x soit générée par la q ieme gaussienne. Pour l étape de transformation du signal source les paramètres HNM et MFCC discrets sont également extraits. La fonction de conversion F nous permet donc de prédire pour chaque vecteur x de la source, le vecteur y correspondant de la cible via l équation 2. Une fois les vecteurs MFCC discrets sources transformés, ils sont inversés afin de calculer l enveloppe spectrale du signal et ainsi d en estimer l amplitude des harmoniques et la fréquence fondamentale. Toutefois, la phase de ces harmoniques est estimée à partir de l enveloppe de la phase du signal source. Les trames non voisées ne sont pas converties car celles-ci ont une faible influence sur la perception de l identité de la voix. Enfin, une synthèse HNM par interpolation des phases et des amplitudes des harmoniques, ainsi que du pitch entre les trames contiguës est réalisée afin d obtenir le signal converti. 4 Conversion de voix à partir d ALISP ALISP est un codeur-décodeur de voix à très bas débit qui repose sur le principe d indexation de la voix au sein d une mémoire cliente d unités acoustiques [2]. Son principe est de coder, puis de synthétiser, le signal de parole à partir d unités acoustiques élémentaires issues d une décomposition temporelle du signal. Cette décomposition est indépendante de connaissances linguistiques a priori. A partir d un corpus d apprentissage constitué d exemples de la voix à coder, l ensemble des segments résultant de la décomposition temporelle est découpé en 64 classes par quantification vectorielle. Ces 64 classes permettront de définir 64 modèles de Markov cachés HMM (Hiden Markov Model) qui représenteront les unités acoustiques élémentaires constituant le dictionnaire de segments de cette voix. Un nouveau signal de parole pourra ainsi être codé en une séquence d index sur ce dictionnaire et c est cette séquence qui sera transmise à la place du signal lui-même. De plus, chaque segment du dictionnaire est codé par analyse HNM de façon à permettre une concaténation plus fine lors de l étape de synthèse.
4 P. Perrot, J. Razik, M. Morel, H. Khemiri et G. Chollet L application du principe de codeur-décodeur d ALISP à la conversion de voix nécessite plusieurs étapes. Tout d abord, le dictionnaire et les modèles HMM doivent être créés à partir d un corpus de la voix cible. Après une analyse HNM du signal de la voix source, la sélection des segments les plus proches spectralement de ceux de la voix cible est effectuée par les HMM et le signal est ainsi codé. Lors de la phase de décodage, les données alignées par DTW sont tout d abord concaténées, puis modifiées de façon à se rapprocher le plus possible des informations de prosodie cible. Ces données sont ensuite resynthétisées pour obtenir le signal converti. L impact de cette méthode de conversion sur un système automatique de reconnaissance de locuteur a été étudié dans un précédent article [6]. 5 Conversion combinée Dans cet article, nous proposons de combiner les deux méthodes précédemment décrites afin de prendre avantage de chacune des méthodes. En effet, la méthode ALISP est sensible au spectre du signal à coder afin de générer la meilleure suite d index qui corresponde à la voix cible. Or, en codant directement la voix source avec les paramètres (dictionnaire, HMMs) de la voix cible, la séquence obtenue n est pas assurément la meilleure. Ainsi, en effectuant préalablement une conversion de la voix source vers la voix cible par GMM, le signal résultant est spectralement bien plus proche de la voix cible. Effectuer le codage sur ce signal permettra donc d obtenir un codage-décodage plus précis et un signal convertie de meilleure qualité. 6 Expérimentation et résultats Nous avons évalué les différents systèmes de conversion décrits dans cet article à partir d un même protocole, d une même base de données et selon 3 critères. Pour un scénario d imposture plus réaliste, nous avons extrait 40 minutes d un discours énoncé par un homme politique qui constitue la voix cible. 10 minutes du discours ont été prononcées par trois hommes et une femme, dont 8 minutes pour l apprentissage des GMM (corpus parallèle) et 2 minutes pour les tests. Le dictionnaire ALISP a été construit à partir de 35 minutes du discours de la voix cible. Les phrases de tests sont distinctes de celles utilisées pour les apprentissages. Nous mesurons les performances des trois systèmes étudiés selon 3 critères : la distorsion spectrale normalisée, la vraisemblance et un sondage perceptif. 6.1 Evaluation de la conversion par la distorsion spectrale normalisée La mesure de distorsion spectrale normalisée est un critère couramment utilisé dans le domaine de la conversion de voix pour mesurer l écart entre la voix convertie et la voix cible. La distance spectrale entre les enveloppes de deux signaux x et y pour un instant t est donné par : p d x,y (t) = c x,k (t) c y,k (t) 2 (3) k=1
5 Techniques de conversion de voix appliquées à l imposture où c x,k (t) est le k ieme coefficient MFCC de x au temps t (resp. pour y). Soit x le signal source, y le signal converti et z le signal cible, alors la distance spectrale normalisée entre la source et la cible pour un signal de N trames est : DSN = Ni=1 d y,z (i) Ni=1 d x,z (i) (4) Cette distance vaut 1 si la voix convertie correspond à la voix source, 0 si elle correspond à la voix cible. La tableau 1 montre une amélioration des résultats fondés sur la conversion combinée. Même si la voix convertie est toujours plus proche de la voix source, elle se rapproche significativement de la voix cible par rapport aux deux autres techniques de conversion. 6.2 Evaluation de la conversion par la vraisemblance Une seconde mesure objective consiste à calculer la log-vraisemblance entre un modèle de la voix source, un modèle de la voix cible et les paramètres extraits de la voix convertie. Cette mesure est définie par l équation suivante : LLK(X) = log(p (X M c )) log(p (X M s )) (5) où P (X M s ) et P (X M c ) sont les probabilités que le signal converti X ait été produit respectivement par la voix source ou par la voix cible. Cette mesure montre également une amélioration significative des résultats pour la conversion combinée des deux méthodes GMM et ALISP (Tableau 1). Ces deux méthodes appliquées individuellement obtiennent des performances équivalentes. 6.3 Evaluation perceptive Outre les mesures objectives précédentes, nous proposons également une évaluation plus subjective mais indispensable car l écoute est également un critère important dans la détection d imposture. L objectif est aussi de mesurer le rendu qualitatif de ces conversions. Pour cela, nous avons demandé à 10 personnes d évaluer sur une échelle de 0 à 5 la qualité de la conversion de morceaux de phrases d environ 30 secondes. Pour chaque échantillon, le signal cible est présenté, puis le signal source et enfin le signal converti. Les 6 niveaux d évaluation (et leur pourcentage de perception respectif) se déclinent ainsi : 0 : impossible de déterminer si la voix correspond à la source ou à la cible, 1 : le signal ne semble pas avoir été converti (ressemble à la source) (0% à 20%), 2 : le signal commence à ressembler à la voix cible (20% à 40%), 3 : qualité de conversion assez bonne, rapprochement de la voix cible perçu (40% à 60%), 4 : perception significative de l effet de conversion (60% à 80%), 5 : conversion très réaliste (80% à 100%).
6 P. Perrot, J. Razik, M. Morel, H. Khemiri et G. Chollet Au regard de cette étude perceptive, la méthode en cascade révèle un niveau de qualité de conversion légèrement supérieur au deux autres méthodes, même si les synthèses proposées en matière d intelligibilité et d audibilité sont encore à améliorer (Tableau 1). Table 1. Ceci est la légende du tableau. Système de conversion GMM Mesure ALISP GMM+ALISP Confiance Distorsion spectrale 0,77 0,78 0,73 ±0,02 Score LLK 0,32 0,34 0,60 ±0,05 Test perceptif 1,5 1,5 2-7 Conclusion Les travaux présentés au sein de cet article propose une nouvelle approche pertinente de la conversion de voix. Celle-ci repose sur une utilisation de la conversion GMM qui déplace l espace acoustique de la voix source vers celle de la voix cible avant de transformer les nouveaux vecteurs par indexation au sein d un dictionnaire de la voix cible. L approche en cascade montre des performances supérieures aux deux méthodes utilisées individuellement (GMM, ALISP) quelques soient les critères choisis : 6% d amélioration pour la distorsion spectrale et 82% pour la vraisemblance. La perception de l intelligibilité n est pas encore parfaite mais la conversion est mieux ressentie par l approche combinée. Références 1. M. Abe, S. Nakamura, K. Shikano, and H. Kuwabara. Voice conversion through vector quantization. In ICASSP, pages , F. Bimbot, G. Chollet, P. Deleglise, and C. Montacie. Temporal decomposition and acoustic-phonetic decoding of speech. In ICASSP, pages , O. Cappé, J. Laroche, and E. Moulines. Regularized estimation of cepstrum envelope from discrete frequency points. In Proc. IEEE ASSP Workshop on applications of signal processing to audio and acoustics, G. Chollet, J. Cernocký, A. Constantinescu, S. Deligne, and F. Bimbot. Toward ALISP : Automatic Language Independent Speech Processing. Springer Verlag, A. Kain and M.W. Maccon. Spectral voice conversion for text to speech synthesis. In ICASSP, pages , P. Perrot, G. Aversano, R. Blouet, M. Charbit, and G. Chollet. Voice forgery using alisp :indexation in a client memory. In ICASSP, pages 17 20, Y. Stylianou. Applying the harmonic plus noise model in concatenative speech synthesis. Transaction SAP, 9(1) :21 29, Y. Stylianou and O. Cappé. Statistical methods for voice quality transformation. In EUROSPEECH, pages , T. Toda, A.W. Black, and K. Tokuda. Voice conversion based on maximum-likelihood estimation of spectral parameter trajectory. Trans Audio, Speech, and Language Processing, 15(8) : , H. Valbret, E. Moulines, and J.P. Tubach. Voice transformation using psola technique. In ICASSP, pages , 1992.
Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier
Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailUne empreinte audio à base d ALISP appliquée à l identification audio dans un flux radiophonique
Une empreinte audio à base d ALISP appliquée à l identification audio dans un flux radiophonique H. Khemiri 1,2 D. Petrovska-Delacrétaz 1 G. Chollet 2 1 Département Electronique et Physique TELECOM SudParis,
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailAbdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole
ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES (ORLEANS) FACULTÉ de TECHNOLOGIE (Sétif) Laboratoire PRISME THÈSE EN COTUTELLE INTERNATIONALE présentée par : Abdenour Hacine-Gharbi soutenue le : 09 décembre 2012
Plus en détailMinistère de l Enseignement Supérieur et de la Recherche Scientifique
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Institut National de Formation en Informatique (I.N.I) Oued Smar Alger Direction de la Post Graduation et de la Recherche Thème : Inférence
Plus en détail(Quelle identité par la parole?) Thèse. présentée à la section. Systèmes de Communication. par. Dominique Genoud
Reconnaissance et transformation de locuteurs (Quelle identité par la parole?) Thèse présentée à la section Systèmes de Communication de l Ecole Polytechnique Fédérale de Lausanne (EPFL) par Dominique
Plus en détailChaine de transmission
Chaine de transmission Chaine de transmission 1. analogiques à l origine 2. convertis en signaux binaires Échantillonnage + quantification + codage 3. brassage des signaux binaires Multiplexage 4. séparation
Plus en détailINTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE
INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE Le schéma synoptique ci-dessous décrit les différentes étapes du traitement numérique
Plus en détailTHÈSE. présentée à l Université d Avignon et des Pays de Vaucluse pour obtenir le diplôme de DOCTORAT
ACADÉMIE D AIX-MARSEILLE UNIVERSITÉ D AVIGNON ET DES PAYS DE VAUCLUSE THÈSE présentée à l Université d Avignon et des Pays de Vaucluse pour obtenir le diplôme de DOCTORAT SPÉCIALITÉ : Informatique École
Plus en détailCommunication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014
Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO 20 mars 2014 La phonétique acoustique La phonétique acoustique étudie les propriétés physiques du signal
Plus en détailChapitre 2 Les ondes progressives périodiques
DERNIÈRE IMPRESSION LE er août 203 à 7:04 Chapitre 2 Les ondes progressives périodiques Table des matières Onde périodique 2 2 Les ondes sinusoïdales 3 3 Les ondes acoustiques 4 3. Les sons audibles.............................
Plus en détailREPRÉSENTATIONS ANALYTIQUES AVANCÉES AVEC EANALYSIS
REPRÉSENTATIONS ANALYTIQUES AVANCÉES AVEC EANALYSIS Pierre Couprie IReMus (UMR 8223), Université Paris-Sorbonne pierre.couprie@paris-sorbonne.fr RÉSUMÉ Le logiciel EAnalysis est développé depuis 2010 pour
Plus en détailCodage de la parole à bas et très bas débit 1
Codage de la parole à bas et très bas débit 1 Geneviève Baudoin (1), J. Cernocký (2), P. Gournay (3), G. Chollet (4) (1) Département Signaux et Télécommunications, ESIEE BP 99 93162 Noisy Le Grand CEDEX
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailDidier Pietquin. Timbre et fréquence : fondamentale et harmoniques
Didier Pietquin Timbre et fréquence : fondamentale et harmoniques Que sont les notions de fréquence fondamentale et d harmoniques? C est ce que nous allons voir dans cet article. 1. Fréquence Avant d entamer
Plus en détailACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS
Matériel : Logiciel winoscillo Logiciel synchronie Microphone Amplificateur Alimentation -15 +15 V (1) (2) (3) (4) (5) (6) ACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS Connaissances et savoir-faire
Plus en détailContributions à la reconnaissance robuste de la parole
École doctorale IAE + M Département de formation doctorale en informatique Contributions à la reconnaissance robuste de la parole Mémoire présenté et soutenu publiquement le 8 décembre 2005 pour l obtention
Plus en détailRapport : Base de données. Anthony Larcher 1
Rapport : Base de données Anthony Larcher 1 1 : Laboratoire d Informatique d Avignon - Université d Avignon Tél : +33 (0) 4 90 84 35 55 - Fax : + 33 (0) 4 90 84 35 01 anthony.larcher@univ-avignon.fr 14
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailParamétrisation adaptée de transitoires pour la reconnaissance d instruments de musique
Paramétrisation adaptée de transitoires pour la reconnaissance d instruments de musique Pierre LEVEAU Mémoire de stage de DEA ATIAM année 2003-2004 Mars - Juillet 2004 Université Pierre et Marie Curie
Plus en détailUne fréquence peut-elle être instantanée?
Fréquence? Variable? Instantané vs. local? Conclure? Une fréquence peut-elle être instantanée? Patrick Flandrin CNRS & École Normale Supérieure de Lyon, France Produire le temps, IRCAM, Paris, juin 2012
Plus en détailVérification audiovisuelle de l identité
Vérification audiovisuelle de l identité Rémi Landais, Hervé Bredin, Leila Zouari, et Gérard Chollet École Nationale Supérieure des Télécommunications, Département Traitement du Signal et des Images, Laboratoire
Plus en détailChapitre I La fonction transmission
Chapitre I La fonction transmission 1. Terminologies 1.1 Mode guidé / non guidé Le signal est le vecteur de l information à transmettre. La transmission s effectue entre un émetteur et un récepteur reliés
Plus en détailIntérêt du découpage en sous-bandes pour l analyse spectrale
Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,
Plus en détailSI350 Indexation Audio
SI350 Indexation Audio Gaël RICHARD Télécom ParisTech Département Traitement des signaux et des images Juin 2012 Contenu Introduction Outils pour l indexation audio Exemple d architecture d un système
Plus en détailEtude et conception d un serveur vocal :
République Algérienne Démocratique et Populaire Ministère de l enseignement supérieur et de la recherche Scientifique Université Hadj Lakhdar Batna Faculté de Technologie Département de Génie Industriel
Plus en détailwww.ceotronics.fr CT-DECT GateCom 3W avec Fonction CT-ASR CT-DECT Bluetooth / tablette tactile et téléphones GSM Geschäftsbericht 09/10 I 1
www.ceotronics.fr CT-DECT avec Fonction CT-ASR CT-DECT Bluetooth / tablette tactile et téléphones GSM Geschäftsbericht 09/10 I 1 NOUVEAU! 3W (3-voies) avec CT-DECT GateCom Fonction CT-ASR CT-DECT Bluetooth
Plus en détailExtraction de descripteurs musicaux: une approche évolutionniste
Extraction de descripteurs musicaux: une approche évolutionniste Thèse de Doctorat de l Université Paris 6 Spécialité: Informatique Aymeric ZILS Sony CSL Paris, 6 rue Amyot 75005 Paris Laboratoire d Informatique
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailLes techniques de multiplexage
Les techniques de multiplexage 1 Le multiplexage et démultiplexage En effet, à partir du moment où plusieurs utilisateurs se partagent un seul support de transmission, il est nécessaire de définir le principe
Plus en détailV 1.0 2006 corr. 2009. Jacques Ferber. LIRMM - Université Montpellier II 161 rue Ada 34292 Montpellier Cedex 5
V 1.0 2006 corr. 2009 Jacques Ferber LIRMM - Université Montpellier II 161 rue Ada 34292 Montpellier Cedex 5 Email: ferber@lirmm.fr Home page: www.lirmm.fr/~ferber Problématique: Comment créer des sons
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailLe plan d action marketing et commercial : De la réflexion marketing à l action commerciale
Le plan d action marketing et : De la réflexion marketing à l action e Un document qui oblige à réfléchir et à prendre du recul sur l activité, en mêlant l analyse marketing à l action e 1 L analyse marketing
Plus en détailMini_guide_Isis.pdf le 23/09/2001 Page 1/14
1 Démarrer...2 1.1 L écran Isis...2 1.2 La boite à outils...2 1.2.1 Mode principal...3 1.2.2 Mode gadgets...3 1.2.3 Mode graphique...3 2 Quelques actions...4 2.1 Ouvrir un document existant...4 2.2 Sélectionner
Plus en détailLES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION
LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION ) Caractéristiques techniques des supports. L infrastructure d un réseau, la qualité de service offerte,
Plus en détailTP Modulation Démodulation BPSK
I- INTRODUCTION : TP Modulation Démodulation BPSK La modulation BPSK est une modulation de phase (Phase Shift Keying = saut discret de phase) par signal numérique binaire (Binary). La phase d une porteuse
Plus en détailContrôle par commande prédictive d un procédé de cuisson sous infrarouge de peintures en poudre.
Contrôle par commande prédictive d un procédé de cuisson sous infrarouge de peintures en poudre. Isabelle Bombard, Bruno da Silva, Pascal Dufour *, Pierre Laurent, Joseph Lieto. Laboratoire d Automatique
Plus en détailReconnaissance du locuteur
Reconnaissance du locuteur Claude Barras! Master, Université Paris-Sud Plan Introduction Vérification du locuteur Structuration en tours de parole Recherches en cours 2/46 Introduction Plan Introduction
Plus en détailProjet de Traitement du Signal Segmentation d images SAR
Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,
Plus en détailReconnaissance automatique de la parole à l aide de colonies de fourmis
Reconnaissance automatique de la parole à l aide de colonies de fourmis Benjamin Lecouteux Didier Schwab Groupe d Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole Laboratoire
Plus en détailBandes Critiques et Masquage
Bandes Critiques et Masquage A. Almeida Licence Pro Acoustique et Vibrations Octobre 2012 Au Menu Au programme 1 Observations du masquage 5 Application du masquage 2 Conséquences du Masquage 3 Interprétation
Plus en détailNumérisation du signal
Chapitre 12 Sciences Physiques - BTS Numérisation du signal 1 Analogique - Numérique. 1.1 Définitions. Signal analogique : un signal analogique s a (t)est un signal continu dont la valeur varie en fonction
Plus en détailTechnologies mobiles pour la reconnaissance vocale des langues africaines
Technologies mobiles pour la reconnaissance vocale des langues africaines Rapport de projet professionnel UE de Génie logiciel Nom : GAUTHIER Prénom : Elodie UFR SHS - IMSS Master 2 Professionnel Spécialité
Plus en détailEchantillonnage Non uniforme
Echantillonnage Non uniforme Marie CHABERT IRIT/INP-ENSEEIHT/ ENSEEIHT/TéSASA Patrice MICHEL et Bernard LACAZE TéSA 1 Plan Introduction Echantillonnage uniforme Echantillonnage irrégulier Comparaison Cas
Plus en détailTraitement numérique de l'image. Raphaël Isdant - 2009
Traitement numérique de l'image 1/ L'IMAGE NUMÉRIQUE : COMPOSITION ET CARACTÉRISTIQUES 1.1 - Le pixel: Une image numérique est constituée d'un ensemble de points appelés pixels (abréviation de PICture
Plus en détailExpérience 3 Formats de signalisation binaire
Expérience 3 Formats de signalisation binaire Introduction Procédures Effectuez les commandes suivantes: >> xhost nat >> rlogin nat >> setenv DISPLAY machine:0 >> setenv MATLABPATH /gel/usr/telecom/comm_tbx
Plus en détailFormula Negator, Outil de négation de formule.
Formula Negator, Outil de négation de formule. Aymerick Savary 1,2, Mathieu Lassale 1,2, Jean-Louis Lanet 1 et Marc Frappier 2 1 Université de Limoges 2 Université de Sherbrooke Résumé. Cet article présente
Plus en détailUniversité du Québec à Chicoutimi THESE. Présentée à l'université du Québec à Chicoutimi Département des Sciences Appliquées
Université du Québec à Chicoutimi THESE Présentée à l'université du Québec à Chicoutimi Département des Sciences Appliquées pour le grade de: Doctorat en Ingénierie Discrimination Parole/Musique et étude
Plus en détailVotre Réseau est-il prêt?
Adapter les Infrastructures à la Convergence Voix Données Votre Réseau est-il prêt? Conférence IDG Communications Joseph SAOUMA Responsable Offre ToIP Rappel - Définition Voix sur IP (VoIP) Technologie
Plus en détailCaractéristiques des ondes
Caractéristiques des ondes Chapitre Activités 1 Ondes progressives à une dimension (p 38) A Analyse qualitative d une onde b Fin de la Début de la 1 L onde est progressive puisque la perturbation se déplace
Plus en détailManuel utilisateur «VisioJeunes»
Manuel utilisateur «VisioJeunes» pour une utilisation rapide du logiciel e-conf Le 26/01/04 Informations : L assemblage de ce document a été réalisé par assemblage des textes et des dessins contenus dans
Plus en détail1 Démarrer... 3 1.1 L écran Isis...3 1.2 La boite à outils...3 1.2.1 Mode principal... 4 1.2.2 Mode gadget...4 1.2.3 Mode graphique...
1 Démarrer... 3 1.1 L écran Isis...3 1.2 La boite à outils...3 1.2.1 Mode principal... 4 1.2.2 Mode gadget...4 1.2.3 Mode graphique... 4 2 Quelques actions... 5 2.1 Ouvrir un document existant...5 2.2
Plus en détailÉtude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l adaptation des systèmes de RAP
Étude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l adaptation des systèmes de RAP Frédéric Aman, Michel Vacher, Solange Rossato, Remus Dugheanu, François Portet,
Plus en détailGestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE
Gestion du niveau de la franchise d un contrat avec bonus-malus Pierre THEROND & Stéphane BONCHE SOMMAIRE 1. Réduction de franchise en l absence de système bonus-malus A - Bonnes propriétés du modèle collectif
Plus en détailMesure agnostique de la qualité des images.
Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire
Plus en détailMini_guide_Isis_v6.doc le 10/02/2005 Page 1/15
1 Démarrer... 2 1.1 L écran Isis... 2 1.2 Les barres d outils... 3 1.2.1 Les outils d édition... 3 1.2.2 Les outils de sélection de mode... 4 1.2.3 Les outils d orientation... 4 2 Quelques actions... 5
Plus en détailLA COUCHE PHYSIQUE EST LA COUCHE par laquelle l information est effectivemnt transmise.
M Informatique Réseaux Cours bis Couche Physique Notes de Cours LA COUCHE PHYSIQUE EST LA COUCHE par laquelle l information est effectivemnt transmise. Les technologies utilisées sont celles du traitement
Plus en détailnom : Collège Ste Clotilde
UNE CONFIGURATION INFORMATIQUE Objectif : Identifier les éléments principaux d une configuration L ordinateur enregistre des données qu il traite pour produire un résultat Sifflements 20 Notice 12 attache
Plus en détailÉquations non linéaires
Équations non linéaires Objectif : trouver les zéros de fonctions (ou systèmes) non linéaires, c-à-d les valeurs α R telles que f(α) = 0. y f(x) α 1 α 2 α 3 x Equations non lineaires p. 1/49 Exemples et
Plus en détailVisitez notre page Internet credit-suisse.com/accessibilite ou contactez-nous par téléphone au 0848 880 842.
1, 0$# #%&$ 1+ (%- #5*# ("% *("$ 20 0%+0##%0 ) #("$ *($ 3,10*#$ 0# %($ 03#$ "* 533&$ $5*$ 45%- %1&%0 ) *($ %(- 2"1#$/ $0%!130$ 0# 1*.(%+5#1(*$ Il est très important pour nous de permettre à tous nos clients
Plus en détailExercices Alternatifs. Une fonction continue mais dérivable nulle part
Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version
Plus en détailOrdonnance du DFJP sur les instruments de mesure audiométriques
Ordonnance du DFJP sur les instruments de mesure audiométriques (Ordonnance sur l audiométrie) 941.216 du 9 mars 2010 (Etat le 1 er janvier 2015) Le Département fédéral de justice et police (DFJP), vu
Plus en détailExercices Alternatifs. Une fonction continue mais dérivable nulle part
Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copyleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version
Plus en détailÉTUDE ET DÉVELOPPEMENT D UN SYSTÈME EXPERT BASÉ SUR LES RÉSEAUX DE NEURONES POUR LE DIAGNOSTIC DES DÉFAUTS DE ROULEMENTS
ÉTUDE ET DÉVELOPPEMENT D UN SYSTÈME EXPERT BASÉ SUR LES RÉSEAUX DE NEURONES POUR LE DIAGNOSTIC DES DÉFAUTS DE ROULEMENTS B. Badri 1 ; M. Thomas 1 ; S. Sassi 2 (1) Department of Mechanical Engineering,
Plus en détailEnregistrement et transformation du son. S. Natkin Novembre 2001
Enregistrement et transformation du son S. Natkin Novembre 2001 1 Éléments d acoustique 2 Dynamique de la puissance sonore 3 Acoustique géométrique: effets de diffusion et de diffraction des ondes sonores
Plus en détailProjet de Master en Informatique: Web WriteIt!
Projet de Master en Informatique: Web WriteIt! Web WriteIt! Baris Ulucinar Supervisé par le Prof. Rolf Ingold, Dr. Jean Hennebert, Andreas Humm et Robert Van Kommer Avril 2007 Table des matières 2 1. Introduction
Plus en détailA la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique
A la découverte du Traitement des signaux audio METISS Inria Rennes - Bretagne Atlantique Les conférences scientifiques au Lycée Descartes Imagerie médicale et neuronavigation par Pierre Hellier Le respect
Plus en détailADSL. Étude d une LiveBox. 1. Environnement de la LiveBox TMRIM 2 EME TRIMESTRE LP CHATEAU BLANC 45120 CHALETTE/LOING NIVEAU :
LP CHATEAU BLANC 45120 CHALETTE/LOING THEME : ADSL BAC PROFESSIONNEL MICRO- INFORMATIQUE ET RESEAUX : INSTALLATION ET MAINTENANCE ACADÉMIE D ORLÉANS-TOURS 2 EME TRIMESTRE NIVEAU : TMRIM Étude d une LiveBox
Plus en détailM1107 : Initiation à la mesure du signal. T_MesSig
1/81 M1107 : Initiation à la mesure du signal T_MesSig Frédéric PAYAN IUT Nice Côte d Azur - Département R&T Université de Nice Sophia Antipolis frederic.payan@unice.fr 15 octobre 2014 2/81 Curriculum
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailhttp://www.u-bourgogne.fr/monge/e.busvelle/teaching.php
TP1 Traitement numérique du son 1 Introduction Le but de ce TP est de mettre en pratique les notions de traitement numérique vues en cours, TDs et dans le précédent TP. On se focalisera sur le traitement
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailIntensité sonore et niveau d intensité sonore
ntensité sonore et niveau d intensité sonore Dans le programme figure la compétence suivante : Connaître et exploiter la relation liant le niveau d intensité sonore à l intensité sonore. Cette fiche se
Plus en détailChapitre 3. Mesures stationnaires. et théorèmes de convergence
Chapitre 3 Mesures stationnaires et théorèmes de convergence Christiane Cocozza-Thivent, Université de Marne-la-Vallée p.1 I. Mesures stationnaires Christiane Cocozza-Thivent, Université de Marne-la-Vallée
Plus en détailMinistère de l Enseignement Supérieur et de la Recherche Scientifique Université Ferhat ABBAS Sétif UFAS - Algérie THESE
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Université Ferhat ABBAS Sétif UFAS - Algérie THESE présentée à la faculté de technologie Département Electronique pour l obtention
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailLes Réseaux sans fils : IEEE 802.11. F. Nolot
Les Réseaux sans fils : IEEE 802.11 F. Nolot 1 Les Réseaux sans fils : IEEE 802.11 Historique F. Nolot 2 Historique 1er norme publiée en 1997 Débit jusque 2 Mb/s En 1998, norme 802.11b, commercialement
Plus en détailLe téléphone de voiture. professionnel. «Téléphonez en toute simplicité et en toute sécurité» Systèmes PTCarPhone www.ptcarphone.
«Téléphonez en toute simplicité et en toute sécurité» Excellente qualité acoustique en mode mains-libres Qualité de réception optimale avec une antenne extérieure Rayonnement exclu au sein du véhicule
Plus en détailÉtude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test
11 juillet 2003 Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test Mariane Comte Plan 2 Introduction et objectif
Plus en détailANALYSE ACOUSTIQUE de la VOIX. pour la. DÉTECTION de PERTURBATIONS PSYCHOPHYSIOLOGIQUES. APPLICATION au CONTEXTE AÉRONAUTIQUE
LA.R.A ANALYSE ACOUSTIQUE de la VOIX pour la DÉTECTION de PERTURBATIONS PSYCHOPHYSIOLOGIQUES APPLICATION au CONTEXTE AÉRONAUTIQUE Robert Ruiz Laboratoire de Recherche en Audiovisuel (LA.R.A) - Université
Plus en détailTABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3 & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3. SIMULATION 7 " - 4.
TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3! " #$ % & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3' & 3. SIMULATION 7 0 ( 0, - 0 - " - & 1 4. LA SOURIS 11 5. LES RACCOURCIS CLAVIER 11 STI Electronique
Plus en détailConception systematique d'algorithmes de detection de pannes dans les systemes dynamiques Michele Basseville, Irisa/Cnrs, Campus de Beaulieu, 35042 Rennes Cedex, bassevilleirisa.fr. 1 Publications. Exemples
Plus en détailLa Voix Sur IP (VoIP)
La Voix Sur IP (VoIP) Sommaire 1. INTRODUCTION 2. DÉFINITION 3. POURQUOI LA TÉLÉPHONIE IP? 4. COMMENT ÇA MARCHE? 5. LES PRINCIPAUX PROTOCOLES 6. QU'EST-CE QU'UN IPBX? 7. PASSER À LA TÉLÉPHONIE SUR IP 8.
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailVous souhaitez vos documents de manière à pouvoir y accéder pour, ou non, et ce, depuis le lieu et l ordinateur de votre choix.
Voici quelques fonctions et outils efficaces pour diversifier les enseignements à distance. Présentées de manière à correspondre à des intentions, les références de ce document sont des inspirations, des
Plus en détailFonctions de deux variables. Mai 2011
Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs
Plus en détailTéléphone IP Cisco 7942G
Téléphone IP Cisco 7942G Présentation du produit Les solutions Cisco Unified Communications réunissent applications vocales, vidéo, mobiles et de données sur réseaux fixes et mobiles, afin de proposer
Plus en détailAccédez au test ici http://myspeed.visualware.com/index.php
Test de vitesse VoIP Pourquoi faire le test? Un test de vitesse VoIP est un moyen efficace d évaluer la capacité de votre connexion Internet à prendre en charge un système de téléphonie VoIP. D autres
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailChapitre 5 Émetteurs et récepteurs sonores
Chapitre 5 Émetteurs et récepteurs sonores Manuel pages 79 à 96 Choix pédagogiques Ce chapitre est dans la continuité du chapitre précédent «Instruments de musique» du thème «Son et musique». En effet,
Plus en détailToute personne souhaitant maîtriser les techniques liées à la conception de produits multimédia et à la création de sites Web.
Web Designer Durée 90 jours (630 h) Public Toute personne souhaitant maîtriser les techniques liées à la conception de produits multimédia et à la création de sites Web. Objectifs La formation Web designer
Plus en détailUE11 Phonétique appliquée
UE11 Phonétique appliquée Christelle DODANE Permanence : mercredi de 11h15 à 12h15, H211 Tel. : 04-67-14-26-37 Courriel : christelle.dodane@univ-montp3.fr Bibliographie succinte 1. GUIMBRETIERE E., Phonétique
Plus en détailLABO 5-6 - 7 PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB
LABO 5-6 - 7 PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB 5.1 Introduction Au cours de séances précédentes, nous avons appris à utiliser un certain nombre d'outils fondamentaux en traitement du
Plus en détailLa sécurité dans un réseau Wi-Fi
La sécurité dans un réseau Wi-Fi Par Valérian CASTEL. Sommaire - Introduction : Le Wi-Fi, c est quoi? - Réseau ad hoc, réseau infrastructure, quelles différences? - Cryptage WEP - Cryptage WPA, WPA2 -
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détail10ème Congrès Français d'acoustique Lyon, 12-16 Avril 2010
10ème Congrès Français d'acoustique Lyon, 12-16 Avril 2010 Monitoring du bruit des avions : une détection à partir du signal audio Christophe Rosin 1, Bertrand Barbo 1, Boris Défréville 2 1 Aéroports de
Plus en détail10ème Congrès Français d'acoustique Lyon, 12-16 Avril 2010
10ème Congrès Français d'acoustique Lyon, 12-16 Avril 2010 Le compressed sensing pour l holographie acoustique de champ proche II: Mise en œuvre expérimentale. Antoine Peillot 1, Gilles Chardon 2, François
Plus en détail