Numériser le signal audio

Numériser le signal audio Séance 2, cours, 1 heure auteur : Jean-Paul Stromboni Idées clefs de la séance De nombreuses applications utilisent les sons numériques, téléphone, CD audio, ordinateur multimédia, radio,... L objectif ici est d introduire le concept de signal numérique, expliquer comment un ordinateur numérise un son, définir la qualité de numérisation donner des conséquences. Savez vous répondre aux questions suivantes? Où trouve t on un CAN dans un ordinateur? Sur la carte son Pourquoi respecter la contrainte de Shannon? Pour ne pas perdre d information Comment échantillonner un son de fréquence 10kHz? Il faut une fréquence d échantillonnage d au moins 20000Hz Combien de pas de quantification avec B=12 bits? Le bruit de quantification est-il un bruit audible? Oui, il peut être gênant même Que signifie PCM? Pulse Coded Modulation, Format non compressé On numérise un signal sur 8bit, en monophonie, à 8kHz, durant 180s. Taille du fichier PCM nécessaire? 8x1x8000x180 bit Si B=8 bit, quelle est la taille du pas de quantification? 4096 pas soit 2 12 C est 2/ 2 8 = 0.008 à peu près Page 1

Les objets traités par l'ordinateur multimédia et le web sont numériques Numérique s'oppose à analogique multimédia numérique égale son et/ou images (=> vidéo) son : illustration de ce cours, les domaines d'application sont la musique et la parole traiter: enregistrer ou jouer, stocker, analyser, télécharger, filtrer, etc... par programmation «one, two, three, four» Guitare LA3 Page 2

Numériser un son, c'est échantillonner et quantifier le signal audio signal : mesure d'une grandeur physique par un capteur signal audio : mesure par un microphone de la pression de l'air fonction du temps. microphone : capteur transformant en tension électrique la vibration de l'air propageant le son échantillonner = prendre des mesures ou échantillons périodiques on note Te la période d'échantillonnage (seconde) on note fe= 1/Te la fréquence d'échantillonnage, fe (s'exprime en Hertz ou Hz). s(t) Te t Page 3

Numériser un son, c'est échantillonner et quantifier le signal audio quantifier = coder en binaire les échantillons on note B le nombre de bits d un échantillon L intervalle [-1,1] des valeurs possibles du signal audio est découpé en 2 B pas de quantification égaux (cas d une loi de quantification uniforme). on associe à l échantillon s(nte) le niveau de quantification s i, valeur choisie dans le pas : 1. la valeur centrale du pas (cas étudié, tracer en bleu) 2. la valeur minimum (cas du C.A.N. tracer en rouge) 1 s(t) t -1 Page 4

L'ordinateur utilise sa carte son pour enregistrer et pour jouer les sons numériques stockés dans sa mémoire. une carte son contient un CAN et un CNA [plus parfois un DSP] le CAN (Convertisseur Analogique Numérique) numérise l'entrée micro de la carte son. le CNA (Convertisseur Numérique Analogique) réalise l'opération inverse pour jouer en temps réel un son numérique sur la sortie haut-parleur de la carte son haut-parleur = actionneur transformant une tension électrique en vibrations de l'air (ou sons) [le DSP (Digital Signal Processor) est un microprocesseur spécialisé dans le traitement du signal Digital signifie numérique en anglais et Signal Processing signifie traitement du signal] Son, vibration de l air son micro HP s(t) signal électrique rbl(t) bloqué CAN CNA s(nte) B bit DSP r(nte) microproc Mémoire, Traitement, Filtre Carte son Page 5

L'ordinateur utilise sa carte son pour enregistrer et pour jouer les sons numériques stockés dans sa mémoire. Compléter le schéma ci-dessous, après avoir mémorisé la feuille précédente. Préciser la nature et les propriétés de temps et d amplitude des signaux. Allure de r bl (t)? Page 6

La qualité de numérisation d'un son croît avec fe et B contrainte de Shannon : la fréquence d'échantillonnage fe doit être au moins deux fois la largeur du spectre du signal à échantillonner le spectre est la composition fréquencielle du signal (voir le chapitre Spectre et TFD) par exemple, le signal s(t)=cos(2*440*pi*t) contient la seule fréquence 440 Hz (ou LA3 musical) et doit être échantillonné à fe= 880 Hz au moins. Hertz (Hz) : unité de fréquence, comme radian par seconde (rd/s), on a : 1 rd/s = 2*pi Hz. Application de Shannon : comment faut-il échantillonner le signal x(t)=cos(2*880*pi*t) (LA4)? Au moins à 1760Hz L appareil auditif humain sait percevoir des fréquences allant au mieux de 20Hz à 20kHz. Justifier en conséquence la fréquence d échantillonnage de 44100Hz des CD audios. On prend au moins 2 fois 20kHz, plus une marge de sécurité Le téléphone grand public transmet sur la bande de fréquence 300 Hz, 3300Hz, proposer une fréquence d échantillonnage en conséquence Même raisonnement, 2 fois 3300 Hz plus une marge Page 7

La qualité de numérisation d'un son croît avec fe et B l'erreur de quantification croît quand B décroît et peut créer un bruit audible erreur de quantification = signal - signal quantifié ε = s( nt e ) s i le rapport signal sur bruit (anglais SNR pour Signal to Noise Ratio) mesure l'importance relative du signal et de l'erreur SNR db = 20log10 ( σ s σ ε Questions : 1. si B= 8bits, quelle est la hauteur du pas de quantification? 2. si on utilise la valeur centrale du pas pour quantifier, quelles sont alors les bornes de l erreur? Le pas valant 2/2 B, l erreur varie Entre -1/2 B et 1/2 B 3. SNR = 72dB, quelles sont les importances relatives du signal et de l erreur? 72 c est 6 fois 12, le signal est 2 12 fois plus grand que l erreur ) Page 8

La qualité de numérisation d'un son croît avec fe et B Ordres de grandeurs utiles l'audition humaine s'étend sur trois décades, de 20 Hz à 20 khz décade = intervalle de fréquences [f0, 10*f0] octave = intervalle de fréquence [f0, 2*f0] la phonation (spectre de la voix humaine) s étend de 50 Hz à 7 khz (bande élargie) La bande téléphonique grand public de 300 Hz à 3300 Hz qualité téléphonique : B = 8 bits, fe = 8000 Hz, monophonie, soit 64000 bits par seconde (bps) qualité CD audio: 16 bits, 44100 Hz, stéréo entrée micro de la carte son : entre -1 et 1, Question: on souhaite télécharger un air de musique de durée 3 mn et qualité CD : Prévoir la taille du fichier à télécharger La durée du téléchargement sur une ligne téléphonique grand public sans compression le taux de compression à atteindre pour télécharger et jouer en temps réel. Page 9

L'ordinateur utilise sa carte son pour enregistrer et pour jouer les sons numériques stockés dans sa mémoire. pour stocker un son numérique dans un fichier, on adopte un format, règle de rangement à respecter pour récupérer les données ultérieurement le format PCM (pour Pulse Coded Modulation) est non compressé le format mp3 (MPEG audio Layer 3) est compressé, comme au, ogg, la mémoire occupée par un son numérique non compressé est donnée par la formule taille = Nbvoies B fe durée le débit à soutenir pour alimenter la carte son est donné en bit par seconde (bps) par débit [ bps] = Nbcanaux B[ bit] fe[ Hz] Page 10