TP OP3 - Traitement Automatique de la Parole
|
|
|
- Laurent Bibeau
- il y a 9 ans
- Total affichages :
Transcription
1 TP OP3 - Traitement Automatique de la Parole Master 1 informatique [email protected] Institut de Recherche en Informatique de Toulouse Université Paul Sabatier 5 mars 2009 [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
2 Présentation des TPs 6 séances de TP de 2h Evaluation : mini dossier (moins de 10 pages) synthétisant ce que vous avez appris lors de ces deux parties) Détail des parties : 1 Rappels (prérequis M1 info TC4) 2 TP1 : Analyse du signal de parole (sous windows+matlab) Manipulation du signal sous matlab, compréhension des mécanismes de base de la paramétrisation audio 3 TP2-4 : Modélisation GMM (reconnaissance du locuteur) (sous linux+mistral) : Modélisation acoustique des locuteurs et mise en place d un outil de vérification. 4 TP5-6 : Modélisation HMM (décodage acoustique) (sous linux+wavesurfer+htk) : Réalisation d un système de reconnaissance de phonème, élément de base des système de reconnaissance de la parole grand vocabulaire [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
3 Première partie I Rappels [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
4 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
5 Numérisation du signal de parole Objectif : reproduire un signal sonore analogique dans un fichier informatique numérique Intensité Temps [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
6 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
7 Fréquence d échantillonnage Intensité Temps Le signal est échantillonné avec un pas de mesure T = 1/F ech [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
8 Fréquence d échantillonnage Théorème de Shannon La fréquence d échantillonnage assurant un non repliement du spectre doit être supérieure à 2 fois la fréquence haute du spectre du signal analogique. F ech = 2 F max Signal audio pleine bande à un spectre s étalant de 20 Hz à 20 khz Bandes de fréquences couramment utilisées pour réduire F ech : Spectre du signal F ech Applications Qualité téléphonique [ Hz] 8 khz Téléphonie Qualité bande élargie [ Hz] 16 ou 22 khz PC, audio-conférence (ADPCM) Haute qualité en radiodiffusion [ Hz] 32 khz DAB, NICAM Qualité Hi-Fi [ Hz] 44.1 ou 48 khz CD Audio, Studio numérique, DAT [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
9 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
10 Quantification Intensité Temps Le signal numérisé est représenté en rouge, l erreur de quantification en pointillé rouge [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
11 Quantification Nombre n de bits utilisés pour le codage des échantillons Erreur de quantification maximale proportionnelle à 1 2 n Dans le cas d une quantification linéaire (pas de quantification constant sur toute la plage de conversion), on exprime l erreur due à la quantification sous la forme d un rapport Signal à Bruit (SNR : Signal to Noise Ratio) dont l expression est la suivante 1 : SNR db = 6.02 n dB Q SNR db Qualité Hi-Fi bits 95 Codage la parole, NICAM 14 bits 80 Codage son PC 8 bits 40 1 Calcul SNR : [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
12 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
13 Fichiers informatiques Il existe de nombreux formats de fichiers son Parmi les plus courant : raw : fichier binaire nu wav : introduit par Microsoft aiff : utilisé sur Silicon Graphics et Macintosh au : format SUN En plus du fichier brut, ces formats encapsulent des informations complémentaires, comme la valeur de la fréquence d échantillonnage, la quantification utilisée, le nombre de canaux... [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
14 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
15 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
16 Lancer Matlab se connecter sur Windows lancer matlab (IRIT) TP OP3 / TAP 5 mars / 52
17 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
18 Charger un fichier audio cd T :\M1OP3\ ; [signal,fs,q,options] = wavread( Signal/essai.wav ) ; Quelles sont les valeurs de fs et q? Que contient options? Affichez les 10 premières valeurs de signal. Quel est l intervalle de variation des échantillons du signal? Comment ramener le vecteur à des valeurs entières? [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
19 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
20 Afficher un signal audio plot(signal) ; Calculez la longueur en secondes du signal Affichez dans une nouvelle fenêtre le vecteur converti en entier Affichez la portion de signal comprise entre les échantillons et en bleu Figez l affichage et affichez avec des croix rouge la même portion [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
21 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
22 Spectre d un signal 1 Charger le fichier Signal/note.wav dans la variable note. 2 Affichez le signal de note avec l axe des abscisses en secondes. 3 Affichez le spectre de note (avec la fonction fft) avec l axe des abscisses en Hertz. Que remarquez-vous? 4 Quelle est la fréquence de base de cette note de musique? 5 Calculez la transformée de Fourier rapide de l extrait du signal de parole (signal) et affichez le résultat sur une demi-période, avec les abscisses en Hertz. 6 Comparez le spectre de note et celui de signal. [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
23 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
24 Spectrogramme du signal figure ; specgram(signal,1024,fs,hamming(1024)) ; [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
25 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
26 Echelle MEL en = canaux(signal,11300,512,16,24, voyelle o ) ; 1 fenêtre d analyse (512 points de signal) 2 Module du spectre sur 256 points 3 Canaux d énergies dans les 24 bandes réparties selon l échelle MEL [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
27 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
28 Calcul du spectre et fenêtrage de Hamming figure ; extrait = signal(11300 :12323) ; subplot(511) ; plot(extrait) ; subplot(512) ; plot(hamming(1024)) ; subplot(513) ; plot(hamming(1024).*extrait) ; subplot(514) ; f=abs(fft(extrait)) ; plot(f(1 :512)) ; subplot(515) ; h=abs(fft(extrait.*hamming(1024))) ; plot(h(1 :512)) ; Expliquez ces différents tracés. Quel est l intérêt de l utilisation d une fenêtre de Hamming? [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
29 Plan 1 Numérisation du signal de parole Fréquence d échantillonnage Quantification Fichiers informatiques 2 Analyse du signal de parole Lancer Matlab Charger un fichier audio Afficher un signal audio Spectre du signal Spectrogramme du signal Echelle MEL Application : spectre du signal Application : analyse cepstrale [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
30 Calcul du cepstre 1 Réalisez le calcul du cepstre sur l extrait de signal de parole. 2 Affichez l extrait, son spectre et son cepstre dans la même fenêtre. 3 Affichez le spectre lissé du signal. 4 Pourquoi la valeur du premier coefficient cepstral est-elle aussi élévée? [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
31 Deuxième partie II Modélisation GMM (locuteur) (IRIT) TP OP3 / TAP 5 mars / 52
32 Plan 3 Enregistrement fichiers audio 4 Analyse triangle vocalique des locuteurs 5 Modélisation GMM des locuteurs Théorie Mise en pratique [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
33 La bise et le soleil La bise et le soleil se disputaient, chacun assurant qu il était le plus fort, quand ils ont vu un voyageur qui s avançait, enveloppé dans son manteau. Ils sont tombés d accord que celui qui arriverait le premier à faire ôter son manteau au voyageur serait regardé comme le plus fort. Alors, la bise s est mise à souffler de toute sa force mais plus elle soufflait, plus le voyageur serrait son manteau autour de lui et à la fin, la bise a renoncé à le lui faire ôter. Alors le soleil a commencé à briller et au bout d un moment, le voyageur, réchauffé a ôté son manteau. Ainsi, la bise a du reconnaître que le soleil était le plus fort des deux. [email protected] (IRIT) TP OP3 / TAP 5 mars / 52 Enregistrement fichiers audio En utilisant wavesurfer (sous linux) vous allez enregistrer 3 versions différentes d un texte équilibré phonétiquement («la bise et le soleil») : une version sera lue normalement (nom du fichier : nom-prenom_2009_normal.wav), une version lue rapidement (nom-prenom_2009_rapide.wav), une version lente et hyper-articulée (nom-prenom_2009_lent.wav).
34 Plan 3 Enregistrement fichiers audio 4 Analyse triangle vocalique des locuteurs 5 Modélisation GMM des locuteurs Théorie Mise en pratique [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
35 Analyse du triangle vocalique Chaque locuteur doit extraire de l enregistrement lent les valeurs des formants F1 et F2 afin de représenter leur propre triangle vocalique Les phonèmes à isoler sont : /a/ /i/ et /u/ («ou») Afin d isoler ces valeurs, le plus facile est d activer le suivi de formants sous wavesurfer. Vous pouvez également utiliser l affichage d une fenetre LPC pour isoler les formants Comparez les triangles obtenus par les différents locuteurs : que concluez-vous? Réfaites cette manipulation en utilisant la version lue à vitesse normale (sur la meme partie du texte). Est-ce que le triangle est modifié? [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
36 Plan 3 Enregistrement fichiers audio 4 Analyse triangle vocalique des locuteurs 5 Modélisation GMM des locuteurs Théorie Mise en pratique [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
37 Plan 3 Enregistrement fichiers audio 4 Analyse triangle vocalique des locuteurs 5 Modélisation GMM des locuteurs Théorie Mise en pratique [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
38 Principe général de la modélisation de locuteurs Source : exposé Najim Dehac [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
39 Modélisation du monde l ensemble des locuteurs qui vont servir a l apprentissage vont former un modèle du monde (appelé GMM-UBM : Universal Background Model, cf. [Reynolds QuatieriDunn 2000] utilité du modèle GMM-UBM : permettra l adaptation à un locuteur permettra de normaliser les scores afin de permettre des comparaisons entre systèmes Il s agit d un modèle de mélange de lois Gaussiennes (GMM) apris par l algorithme EM (Expectation-Maximisation). En général 5 itérations EM sont nécessaires. [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
40 Modélisation du locuteur le modèle du monde peut-etre adapté au locuteur par : adaptation MAP (Maximum A Posteriori) : adaptation fondée sur le maximum de vraisemblance Bayésien. Cela revient à modifier les variances des modèles. adaptation MLLR (Maximun Likelihood Linear Regression) : utilisation des données de test pour modifier le modèle. Cela revient à modifier els moyennes des modèles. [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
41 Reconnaissance du locuteur Calcul du score : rapport de log vraisemblance (LLR) : S x (Y ) = 1 N N n=1 log p(y m/x ) p(y m /Ω) θ avec X modèle à évaluer et Ω modèle du monde Y représente l opservation qui se décompose en N paramètres que l on suppose indépendants. le seuil θ est défini lors de l apprentissage (sur l ensemble de développement) [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
42 Plan 3 Enregistrement fichiers audio 4 Analyse triangle vocalique des locuteurs 5 Modélisation GMM des locuteurs Théorie Mise en pratique [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
43 Installation Mistral IHM Récupérez l archive contenant le programme (Mistral démo pour Lia Spk Det) et décompressez-la : tar xzvf tpspk.tar.gz placez-vous dans le repertoire tpgmm lancez le programme : java -jar SpkIHM [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
44 Enregistrement locuteur un locuteur correspond a un seul enregistrement audio il faut au moins 2 minutes de parole pour obtenir un bon modèle appuyez sur Add User saisissez un nom de locuteur (le fichier actuelement en cours d édition sera renommé nom du locuteur.wav) [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
45 Modélisation et reconnaissance Après avoir rajouté tous les locuteurs voulus, lancez la modélisation du modèle du monde : Train World Puis lancez la modélisation des locuteurs : Train Users Vous pouvez ensuite enregistrer un ficheir de test et appuyer sur Reco : le genre est détecté (Male/Female), et la vraisemblance est calculée (LLR) [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
46 Troisième partie III Modélisation HMM (décodage acoustique) (IRIT) TP OP3 / TAP 5 mars / 52
47 Plan 6 Variabilité du signal de parole 7 Paramétrisation de la collection audio 8 Modélisation par Modèles de Markov Cachés [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
48 Variabilité du signal de parole Sous linux, installer les fichiers et l arborescence : ~farinas/m1op3/install En vous aidant de la transcription du signal de parole, analysez un fichier d une heure de radio avec wavesurfer (vérifiez que wavesurfer ne charge pas tous les fichiers en mémoire : Préférences -> Sound I/O -> Sound storage = keep on disk). Quels sont les facteurs qui contribuent à rendre variable le signal de parole? Est-ce lié : au locuteur? au sexe de la personne qui parle? aux bruits environants? Affichez le signal de parole avec un étiquetage en phonème et tracez le triangle vocalique du chroniqueur «Pierre Le Marc». Regardez dans le répertoire Listes/ quels sont les fichiers qui correspondent à ce critère. [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
49 Plan 6 Variabilité du signal de parole 7 Paramétrisation de la collection audio 8 Modélisation par Modèles de Markov Cachés [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
50 Paramétrisation de la collection audio Vous allez travailler sur les fichiers audio découpé en utilisant la boite à outils HTK. Les labels phonétiques se trouvent rassemblés dans le fichier «Labels/LABELSalignes.mlf» Utiliser le script «HTKparametrisation» pour réaliser la paramétrisation (les fichiers résultats sont stockés sur votre compte dans le répertoire Parametres/) Questions : Quelle est la paramétrisation appliquée? Où pourriez-vous agir pour modifier la paramétrisation? Comment est structuré le fichier de labels? Quelle autre représentation des labels aurait-été possible? [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
51 Plan 6 Variabilité du signal de parole 7 Paramétrisation de la collection audio 8 Modélisation par Modèles de Markov Cachés [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
52 Modélisation par Modèles de Markov Cachés A quoi va correspondre un modèle de Markov caché? Réalisez l apprentissage des modèles avec le programme HTKinitialisation (utilisez les fichiers du 14 au 16 avril 2003) Testez votre apprentissage (fichier HTKreco.mlf) avec le fichier du 17 avril Comment pourriez-vous améliorer les résultats? Quelles modélisations pourriez-vous utiliser? Quels paramètres? [email protected] (IRIT) TP OP3 / TAP 5 mars / 52
INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE
INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE Le schéma synoptique ci-dessous décrit les différentes étapes du traitement numérique
Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier
Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration
Transmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Chaine de transmission
Chaine de transmission Chaine de transmission 1. analogiques à l origine 2. convertis en signaux binaires Échantillonnage + quantification + codage 3. brassage des signaux binaires Multiplexage 4. séparation
TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S
FICHE Fiche à destination des enseignants TS 35 Numériser Type d'activité Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S Compétences
Outils permettant la diffusion de l information. Un point sur le droit numérique
Technologies de l Information et de la Communication Introduction aux NTE/TICE Présentation des UNR UNT Outils permettant la diffusion de l information Conceptualisation d un module d apprentissage numérique
Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté
Compétences travaillées : Mettre en œuvre un protocole expérimental Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique
UE 503 L3 MIAGE. Initiation Réseau et Programmation Web La couche physique. A. Belaïd
UE 503 L3 MIAGE Initiation Réseau et Programmation Web La couche physique A. Belaïd [email protected] http://www.loria.fr/~abelaid/ Année Universitaire 2011/2012 2 Le Modèle OSI La couche physique ou le
Enregistrement et transformation du son. S. Natkin Novembre 2001
Enregistrement et transformation du son S. Natkin Novembre 2001 1 Éléments d acoustique 2 Dynamique de la puissance sonore 3 Acoustique géométrique: effets de diffusion et de diffraction des ondes sonores
Apprentissage Automatique
Apprentissage Automatique Introduction-I [email protected] www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Numérisation du signal
Chapitre 12 Sciences Physiques - BTS Numérisation du signal 1 Analogique - Numérique. 1.1 Définitions. Signal analogique : un signal analogique s a (t)est un signal continu dont la valeur varie en fonction
Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole
ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES (ORLEANS) FACULTÉ de TECHNOLOGIE (Sétif) Laboratoire PRISME THÈSE EN COTUTELLE INTERNATIONALE présentée par : Abdenour Hacine-Gharbi soutenue le : 09 décembre 2012
http://www.u-bourgogne.fr/monge/e.busvelle/teaching.php
TP1 Traitement numérique du son 1 Introduction Le but de ce TP est de mettre en pratique les notions de traitement numérique vues en cours, TDs et dans le précédent TP. On se focalisera sur le traitement
Technique de codage des formes d'ondes
Technique de codage des formes d'ondes Contenu Introduction Conditions préalables Conditions requises Composants utilisés Conventions Modulation par impulsions et codage Filtrage Échantillon Numérisez
Etude et conception d un serveur vocal :
République Algérienne Démocratique et Populaire Ministère de l enseignement supérieur et de la recherche Scientifique Université Hadj Lakhdar Batna Faculté de Technologie Département de Génie Industriel
Transmission de données. A) Principaux éléments intervenant dans la transmission
Page 1 / 7 A) Principaux éléments intervenant dans la transmission A.1 Equipement voisins Ordinateur ou terminal Ordinateur ou terminal Canal de transmission ETTD ETTD ETTD : Equipement Terminal de Traitement
Outils informatiques de manipulation de la vidéo et du son : une introduction
MULTIMODAL DIALOGUE MANAGEMENT http://www.im2.ch http://www.issco.unige.ch/projects/im2/mdm/ ISSCO/TIM/ETI, Université de Genève Outils informatiques de manipulation de la vidéo et du son : une introduction
Multimedia. Systèmes, Communications et Applications. Ahmed MEHAOUA
Multimedia Systèmes, Communications et Applications Ahmed MEHAOUA Professeur - Laboratoire CRIP5 [email protected] Plan 1. Multimedia : principes et définitions 2. Algorithmes et normes
Analyse des bruits de clavier d ordinateur
Analyse des bruits de clavier d ordinateur Introduction 1 Enregistrement des bruits de clavier 2 Analyse des bruits de clavier 3 Analyse du niveau de pression acoustique vs. temps 4 Sonie vs. temps 4 Acuité
Chapitre 2 Les ondes progressives périodiques
DERNIÈRE IMPRESSION LE er août 203 à 7:04 Chapitre 2 Les ondes progressives périodiques Table des matières Onde périodique 2 2 Les ondes sinusoïdales 3 3 Les ondes acoustiques 4 3. Les sons audibles.............................
Ministère de l Enseignement Supérieur et de la Recherche Scientifique
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Institut National de Formation en Informatique (I.N.I) Oued Smar Alger Direction de la Post Graduation et de la Recherche Thème : Inférence
Projet audio. Analyse des Signaux ELE2700
ÉCOLE POLYTECHNIQUE DE MONTRÉAL Département de Génie Électrique Projet audio Analyse des Signaux ELE2700 Saad Chidami - 2014 Table des matières Objectif du laboratoire... 4 Caractérisation du bruit...
Expérience 3 Formats de signalisation binaire
Expérience 3 Formats de signalisation binaire Introduction Procédures Effectuez les commandes suivantes: >> xhost nat >> rlogin nat >> setenv DISPLAY machine:0 >> setenv MATLABPATH /gel/usr/telecom/comm_tbx
SCL LOGICIEL DE CONTROL
SCL LOGICIEL DE CONTROL Version 1.3 MRC AUDIO LD- 500 www.mrcaudio.com 1 Contenu 1 - Bienvenu a MRC AUDIO SCL v1.3 2 - Installation du logiciel 3 - Configuration du programme SCL 4 - Contrôle des installations
Chapitre 13 Numérisation de l information
DERNIÈRE IMPRESSION LE 2 septembre 2013 à 17:33 Chapitre 13 Numérisation de l information Table des matières 1 Transmission des informations 2 2 La numérisation 2 2.1 L échantillonage..............................
Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <[email protected]> 20 mars 2014
Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO 20 mars 2014 La phonétique acoustique La phonétique acoustique étudie les propriétés physiques du signal
http://www.icp.inpg.fr/~savario/_activite/zip/trap_v4.zip Hélène Lœvenbruck, Christophe Savariaux, Dorothée Lefebvre
TRAP : TRAITEMENT DES SIGNAUX DE PAROLE http://www.icp.inpg.fr/~savario/_activite/zip/trap_v4.zip Hélène Lœvenbruck, Christophe Savariaux, Dorothée Lefebvre Institut de la Communication Parlée Les différents
Chapitre 18 : Transmettre et stocker de l information
Chapitre 18 : Transmettre et stocker de l information Connaissances et compétences : - Identifier les éléments d une chaîne de transmission d informations. - Recueillir et exploiter des informations concernant
Mini_guide_Isis.pdf le 23/09/2001 Page 1/14
1 Démarrer...2 1.1 L écran Isis...2 1.2 La boite à outils...2 1.2.1 Mode principal...3 1.2.2 Mode gadgets...3 1.2.3 Mode graphique...3 2 Quelques actions...4 2.1 Ouvrir un document existant...4 2.2 Sélectionner
Université de La Rochelle. Réseaux TD n 6
Réseaux TD n 6 Rappels : Théorème de Nyquist (ligne non bruitée) : Dmax = 2H log 2 V Théorème de Shannon (ligne bruitée) : C = H log 2 (1+ S/B) Relation entre débit binaire et rapidité de modulation :
Tutoriels. 01 Utiliser Praat. 02 Transcrire sous Praat en utilisant les conventions VALIBEL. Sylviane Bachy. Rédaction octobre 2005
Tutoriels 01 Utiliser Praat 02 Transcrire sous Praat en utilisant les conventions VALIBEL Sylviane Bachy Rédaction octobre 2005 Table des matières 1. Installation et démarrage...2 2. Ouvrir un fichier
Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test
11 juillet 2003 Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test Mariane Comte Plan 2 Introduction et objectif
Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)
1/5 Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN) Objectifs : Reconnaître des signaux de nature analogique et des signaux de nature numérique Mettre en
Les techniques de multiplexage
Les techniques de multiplexage 1 Le multiplexage et démultiplexage En effet, à partir du moment où plusieurs utilisateurs se partagent un seul support de transmission, il est nécessaire de définir le principe
LABO 5-6 - 7 PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB
LABO 5-6 - 7 PROJET : IMPLEMENTATION D UN MODEM ADSL SOUS MATLAB 5.1 Introduction Au cours de séances précédentes, nous avons appris à utiliser un certain nombre d'outils fondamentaux en traitement du
Régler les paramètres de mesure en choisissant un intervalle de mesure 10µs et 200 mesures.
TP Conversion analogique numérique Les machines numériques qui nous entourent ne peuvent, du fait de leur structure, que gérer des objets s composés de 0 et de. Une des étapes fondamentale de l'interaction
GUIDE DE PRODUCTION DES STEMS
GUIDE DE PRODUCTION DES STEMS 1. Contexte Ce document s adresse aux compositeurs et producteurs qui veulent livrer une série de stems au studio de mastering plutôt qu un mixage stéréo ou multicanal. Cette
Qualité perçue de parole transmise par voie téléphonique large-bande
Université Pierre et Marie Curie Mémoire pour le Master Sciences et Technologie de l UPMC, Mention SDI, Spécialité MIS, Parcours ATIAM. Qualité perçue de parole transmise par voie téléphonique large-bande
Chap17 - CORRECTİON DES EXERCİCES
Chap17 - CORRECTİON DES EXERCİCES n 3 p528 Le signal a est numérique : il n y a que deux valeurs possibles pour la tension. Le signal b n est pas numérique : il y a alternance entre des signaux divers
Reconnaissance du locuteur
Reconnaissance du locuteur Claude Barras! Master, Université Paris-Sud Plan Introduction Vérification du locuteur Structuration en tours de parole Recherches en cours 2/46 Introduction Plan Introduction
Comment enregistrer simplement toute musique restituée par votre PC
Comment enregistrer simplement toute musique restituée par votre PC Il s'agit, vous l'avez compris d'enregistrer tout ce qui passe par la carte son de votre machine : musique ou paroles, chansons ou commentaires
LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES
LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES Compétences mises en jeu durant l'activité : Compétences générales : S'impliquer, être autonome. Compétence(s) spécifique(s) : Reconnaître des signaux de nature
TP Modulation Démodulation BPSK
I- INTRODUCTION : TP Modulation Démodulation BPSK La modulation BPSK est une modulation de phase (Phase Shift Keying = saut discret de phase) par signal numérique binaire (Binary). La phase d une porteuse
TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne
Objectifs : Ce TP est relatif aux différentes méthodes de codage d une information binaire, et à la transmission en bande de base de cette information. Les grandes lignes de ce TP sont l étude des méthodes
TD séance n 10 Multimédia Son
Ce TD est dédié aux chaînes de traitements audio, un des objets multimédia de base. Il se déroulera sous Windows, bien que les logiciels utilisés ou équivalents soient aussi disponibles sous Unix. Les
Tuto pour connecter une source RVB RGB à un moniteur Commodore / Amiga
Tuto pour connecter une source RVB RGB à un moniteur Commodore / Amiga Il faut 1 moniteur Commodore 1084S / 1083S-D1 Ecran 1084S (au dos, il est indiqué 1083S-D1), je l ai eut avec un Amiga 600 et on va
«Le Dolby Digital 5.1 et les tests en champ libre par ordinateur»
«Le Dolby Digital 5.1 et les tests en champ libre par ordinateur» Introduction : Jusqu à présent les tests en champ libre transitaient par un audiomètre et un dispatcher pour sortir sur la localisation
FAG Detector III la solution pour la surveillance et l équilibrage. Information Technique Produit
FAG Detector III la solution pour la surveillance et l équilibrage Information Technique Produit Principe Utilisation Hautes performances utilisation simple Le FAG Detector III est, à la fois, un appareil
Systèmes de transmission
Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un
1 Démarrer... 3 1.1 L écran Isis...3 1.2 La boite à outils...3 1.2.1 Mode principal... 4 1.2.2 Mode gadget...4 1.2.3 Mode graphique...
1 Démarrer... 3 1.1 L écran Isis...3 1.2 La boite à outils...3 1.2.1 Mode principal... 4 1.2.2 Mode gadget...4 1.2.3 Mode graphique... 4 2 Quelques actions... 5 2.1 Ouvrir un document existant...5 2.2
T500 DUAlTACH. JAQUET T500 DualTach Instrument de mesure et de surveillance équipé de 2 entrées fréquence TACHYMETRE 2 CANAUX
02-09 T500 DUAlTACH JAQUET T500 DualTach Instrument de mesure et de surveillance équipé de 2 entrées fréquence JAQUET T500 DualTach Instrument multi canal de mesure et de surveillance pour applications
Production de documents audio-numériques
Technique de l Information et de la Communication Production de documents audio-numériques 1. Technique Acoustique : --------------------------------------------------- 2 notions de base sur le son. Fréquence,
M1107 : Initiation à la mesure du signal. T_MesSig
1/81 M1107 : Initiation à la mesure du signal T_MesSig Frédéric PAYAN IUT Nice Côte d Azur - Département R&T Université de Nice Sophia Antipolis [email protected] 15 octobre 2014 2/81 Curriculum
Scarlett Plug-in Suite
Scarlett Plug-in Suite Mode d emploi FA0000-01 1 Contents Installation... 3 Activation du Logiciel... 3 Modules Scarlett Plug-in Suite... 5 Compressor... 5 EQ... 6 Gate... 7 Reverb... 9 2 Installation
xdsl Digital Suscriber Line «Utiliser la totalité de la bande passante du cuivre»
xdsl Digital Suscriber Line «Utiliser la totalité de la bande passante du cuivre» Le marché en France ~ 9 millions d abonnés fin 2005 ~ 6 millions fin 2004 dont la moitié chez l opérateur historique et
Traitement numérique du son
Traitement numérique du son 1/ - QU'EST-CE QU'UN SON? 1.1 Définition D'un point de vue physique, un son est une énergie qui se propage sous forme de vibrations dans un milieu compressible (dans l'eau,
ISO/CEI 11172-3 NORME INTERNATIONALE
NORME INTERNATIONALE ISO/CEI 11172-3 Première édition 1993-08-01 Technologies de l information - Codage de l image animée et du son associé pour les supports de stockage numérique jusqu à environ Ii5 Mbit/s
2 g Net - 36 g emballé 2 tips silicone anallergique small + 2 medium + 2 filtres à membrane. 2 tailles d embouts
Pacato protecteurs auditifs Description Développé et conçu pour répondre aux exigences des musiciens, Pacato est muni d un filtre acoustique qui permet une réduction du niveau sonore, sans déformer la
1. PRESENTATION DU PROJET
Bac STI2D Formation des enseignants Jean-François LIEBAUT Denis PENARD SIN 63 : Prototypage d un traitement de l information analogique et numérique (PSoC) 1. PRESENTATION DU PROJET Les systèmes d éclairage
Leçon 1 : Les principaux composants d un ordinateur
Chapitre 2 Architecture d un ordinateur Leçon 1 : Les principaux composants d un ordinateur Les objectifs : o Identifier les principaux composants d un micro-ordinateur. o Connaître les caractéristiques
ASSISTANCE TECHNIQUE INTERACTIVE TC
MODE D EMPLOI ASSISTANCE TECHNIQUE INTERACTIVE TC Le site Internet d assistance interactive TC www.tcsupport.tc a été conçu pour vous aider à résoudre vos problèmes en ligne et regroupe de nombreuses informations.
Systèmes de communications numériques 2
Systèmes de Communications Numériques Philippe Ciuciu, Christophe Vignat Laboratoire des Signaux et Systèmes CNRS SUPÉLEC UPS SUPÉLEC, Plateau de Moulon, 91192 Gif-sur-Yvette [email protected] Université
Mini_guide_Isis_v6.doc le 10/02/2005 Page 1/15
1 Démarrer... 2 1.1 L écran Isis... 2 1.2 Les barres d outils... 3 1.2.1 Les outils d édition... 3 1.2.2 Les outils de sélection de mode... 4 1.2.3 Les outils d orientation... 4 2 Quelques actions... 5
Matériel & Logiciels (Hardware & Software)
CHAPITRE 2 HARDWARE & SOFTWARE P. 1 Chapitre 2 Matériel & Logiciels (Hardware & Software) 2.1 Matériel (Hardware) 2.1.1 Présentation de l'ordinateur Un ordinateur est un ensemble de circuits électronique
Le concept cellulaire
Le concept cellulaire X. Lagrange Télécom Bretagne 21 Mars 2014 X. Lagrange (Télécom Bretagne) Le concept cellulaire 21/03/14 1 / 57 Introduction : Objectif du cours Soit un opérateur qui dispose d une
TIC. Tout d abord. Objectifs. L information et l ordinateur. TC IUT Montpellier
Tout d abord TIC TC IUT Montpellier Nancy Rodriguez Destruel Dans la salle de cours (et partout ailleurs ) : Ponctualité et assiduité exigées Ne pas manger, ni boire, ni dormir, ni travailler à autre chose
I. TRANSMISSION DE DONNEES
TD I. TRANSMISSION DE DONNEES 1. QU'EST-CE QU'UN CANAL DE TRANSMISSION? 1.1 Rappels Une ligne de transmission est une liaison entre les deux machines. On désigne généralement par le terme émetteur la machine
BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1
TP A.1 Page 1/5 BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1 Ce document comprend : - une fiche descriptive du sujet destinée à l examinateur : Page 2/5 - une
Prise en main. Prise en main - 0
Prise en main 0404 Prise en main - 0 1- Introduction Creative Professional Merci d avoir choisi le Digital Audio System 0404 d E-MU. Nous avons conçu ce produit E-MU pour qu il soit logique, intuitif et
WWW.ELCON.SE Multichronomètre SA10 Présentation générale
WWW.ELCON.SE Multichronomètre SA10 Présentation générale Le SA10 est un appareil portable destiné au test des disjoncteurs moyenne tension et haute tension. Quoiqu il soit conçu pour fonctionner couplé
TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3 & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3. SIMULATION 7 " - 4.
TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3! " #$ % & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3' & 3. SIMULATION 7 0 ( 0, - 0 - " - & 1 4. LA SOURIS 11 5. LES RACCOURCIS CLAVIER 11 STI Electronique
La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)
La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA) I. L'intérêt de la conversion de données, problèmes et définitions associés. I.1. Définitions:
USB TableMike de SpeechWare
USB TableMike de SpeechWare Microphone de bureau à portée étendue et variable pour Windows et Mac OS 1. Introduction La sortie de Dragon NaturallySpeaking 11 avec le moteur de reconnaissance vocale le
TeamConnect. SL TeamConnect CU1, Unité centrale SL TeamConnect CB1, Combox CARACTÉRISTIQUES
TeamConnect SL TeamConnect CU1, Unité centrale SL TeamConnect CB1, Combox CARACTÉRISTIQUES 8 Connectivité par ligne téléphonique terrestre et PC/Voix sur IP (VoiP) pour téléconférence via téléphone et
BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :
BASE BioArray Software Environment (BASE) est une base de données permettant de gérer l importante quantité de données générées par des analyses de bio-puces. BASE gère les informations biologiques, les
THÈSE. présentée à l Université d Avignon et des Pays de Vaucluse pour obtenir le diplôme de DOCTORAT
ACADÉMIE D AIX-MARSEILLE UNIVERSITÉ D AVIGNON ET DES PAYS DE VAUCLUSE THÈSE présentée à l Université d Avignon et des Pays de Vaucluse pour obtenir le diplôme de DOCTORAT SPÉCIALITÉ : Informatique École
Récupérer au format AVI un extrait d'un DVD à l'aide du logiciel FlaskMpeg
Récupérer au format AVI un extrait d'un DVD à l'aide du logiciel FlaskMpeg Préambule : Les supports analogiques (cassettes VHS, cassettes audio...) sont progressivement remplacés par leurs équivalents
LA COUCHE PHYSIQUE EST LA COUCHE par laquelle l information est effectivemnt transmise.
M Informatique Réseaux Cours bis Couche Physique Notes de Cours LA COUCHE PHYSIQUE EST LA COUCHE par laquelle l information est effectivemnt transmise. Les technologies utilisées sont celles du traitement
Guide des fonctions avancées de mywishtv
Guide des fonctions avancées de mywishtv Table des matières Présentation des fonctionalités avancées de mywishtv 3 Raccorder au réseau domestique et à Internet 4 Logiciel serveur dlna pour votre pc 6 Navigation
CHAPITRE V. Théorie de l échantillonnage et de la quantification
CHAPITRE V Théorie de l échantillonnage et de la quantification Olivier FRANÇAIS, SOMMAIRE I INTRODUCTION... 3 II THÉORIE DE L ÉCHANTILLONNAGE... 3 II. ACQUISITION DES SIGNAUX... 3 II. MODÉLISATION DE
Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques
Didier Pietquin Timbre et fréquence : fondamentale et harmoniques Que sont les notions de fréquence fondamentale et d harmoniques? C est ce que nous allons voir dans cet article. 1. Fréquence Avant d entamer
Intérêt du découpage en sous-bandes pour l analyse spectrale
Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,
Extraction de descripteurs musicaux: une approche évolutionniste
Extraction de descripteurs musicaux: une approche évolutionniste Thèse de Doctorat de l Université Paris 6 Spécialité: Informatique Aymeric ZILS Sony CSL Paris, 6 rue Amyot 75005 Paris Laboratoire d Informatique
Information. BASES LITTERAIRES Etre capable de répondre à une question du type «la valeur trouvée respecte t-elle le cahier des charges?
Compétences générales Avoir des piles neuves, ou récentes dans sa machine à calculer. Etre capable de retrouver instantanément une info dans sa machine. Prendre une bouteille d eau. Prendre CNI + convocation.
TP sauvegarde et restauration avec le logiciel Cobian Backup
TP sauvegarde et restauration avec le logiciel Cobian Backup But : Étudier les différences entre les différents types de sauvegarde Etudier les différences entre Cobian et le système de Windows 7 Étape
AudioSculpt. Manuel de l utilisateur. Alain LITHAUD
AudioSculpt Manuel de l utilisateur Alain LITHAUD AudioSculpt: Manuel de l utilisateur par Alain LITHAUD Publié par Karim Haddad Publié le: 2005/03/25 16:34:04 Conception et Développement AudioSculpt:
Les réseaux cellulaires
Les réseaux cellulaires Introduction Master 2 Professionnel STIC-Informatique Module RMHD 1 Introduction Les réseaux cellulaires sont les réseaux dont l'évolution a probablement été la plus spectaculaire
Connaissances VDI 1 : Chapitres 1 2 3 4 5 6 7 + annexe
Connaissances VDI 1 : Chapitres 1 2 3 4 5 6 7 + annexe Page 1 sur 8 COMMENT FONCTIONNE UN RESEAU DOMESTIQUE COMMUNIQUANT? BEP : Identifier les composants et S informer sur l évolution des matériels. BAC
ENVOI EN NOMBRE DE MESSAGES AUDIO
ENVOI EN NOMBRE DE MESSAGES AUDIO 2 Téléchargement 3 Installation 7 Ecran d accueil 12 Importation d un fichier d adresses à partir d Excel 15 Création des messages téléphoniques 17 Création du planning
sommaire Archives... Archiver votre messagerie... Les notes... Les règles de messagerie... Les calendriers partagés... 15 Les listes de diffusions...
sommaire Votre solution de messagerie Futur Office évolue. Pour préparer au mieux la migration qui aura lieu le week-end du 23-24 Juin, nous vous conseillons de réaliser les actions préalables décrites
Manuel Utilisateur RF Monitor Tracker
Manuel Utilisateur RF Monitor Tracker Propos: Guide d installation et d utilisation du logiciel RF-Monitor Premium de NEWSTEO, pour Trackers. Assistance technique : Pour toute question, remarque ou suggestion
Document rédigé par Alexis Michaud (en janvier 2005), réactualisé par Angélique Amelot (septembre 2009)
Mode d emploi de l électroglottographe & démarrage rapide Glottal Enterprises Two-Channel Electroglottograph Model EG2 UMR 7018 CNRS/Université Sorbonne Nouvelle, 19 rue des Bernardins, 75005 Paris Document
LABO 5 ET 6 TRAITEMENT DE SIGNAL SOUS SIMULINK
LABO 5 ET 6 TRAITEMENT DE SIGNAL SOUS SIMULINK 5.1 Introduction Simulink est l'extension graphique de MATLAB permettant, d une part de représenter les fonctions mathématiques et les systèmes sous forme
J ai peur des souris mais je me soigne Petit manuel à l attention des profs de langues vivantes désireux d affronter le Monstre Informatique
J ai peur des souris mais je me soigne Petit manuel à l attention des profs de langues vivantes désireux d affronter le Monstre Informatique Les Fondamentaux du Prof de Langues Pourquoi ce manuel? Pour
Maintenir un service de traitement de son ou d image d ordinateur
Maintenir un service de traitement de son ou d image d ordinateur Dominique Pagnier Table des matières 1. Introduction... 3 2. Les formats d image... 3 2.1. Formats d infographie : EPS et TIF... 4 2.2.
1 Démarrage de Marionnet
Institut Galilée Administration Système Année 2011-2012 INFO 2ème année Master Info 1 Master Image & Réseau 1 T.P. 1 Administration Système Le logiciel Marionnet (www.marionnet.org) offre la possibilité
FAG Detector II le collecteur et l analyseur de données portatif. Information Technique Produit
FAG II le collecteur et l analyseur de données portatif Information Technique Produit Application La maintenance conditionnelle Principe de fonctionnement Application Le FAG II est, à la fois, un appareil
