Le CD Audio Un cas exemplaire de codage et de traitement numérique d un phénomène physique Le constat Le CD Audio, Compact Disc à lecture optique, s est imposé comme le support idéal pour le stockage de musiques. Son succès fut tel qu il a été étendu au stockage de données non musicales (CD-Rom, puis DVD). Les questions sont donc les suivantes : Pourquoi un support optique devient-il le moyen privilégié pour stocker des données acoustiques? Comment convertir du son en informations optiques, et vice versa? Dans ce dossier, nous aborderons les points suivants : La nature physique du son La conversion du son en numérique Le principe de lecture optique du CD Le séquencement du flux informationnel La généralisation aux autres types de données numériques Page 1 sur 12
La nature physique du son Nature du son Le son est une onde produite par la vibration mécanique d'un support fluide ou solide et propagée grâce à l'élasticité du milieu environnant sous forme d'ondes longitudinales. Le son est une onde d'énergie résultant de la vibration mécanique d une "source sonore" et propagée de proche en proche grâce à l élasticité du milieu environnant. Sans milieu, et donc sans matière, il ne peut y avoir de son. Le son ne peut donc pas se propager dans le vide. La science qui étudie les sons s'appelle l'acoustique. L électroacoustique s intéresse au traitement des sons en utilisant des moyens électroniques (ordinateurs, échantillonneurs, synthétiseurs ) Production du son Un son peut être produit par tout objet engendrant une vibration de l air, une corde, une membrane par exemple. Il y a des sons secs (chocs) et des sons tenus (vibrations), des sons purs (une seule fréquence comme le diapason) et des sons complexes (une musique, une voix ). Caractéristiques d un son Tous les sons simples, tels qu'une note de musique, peuvent être décrits par trois paramètres : - la hauteur, fréquence de l onde (plus ou moins aigu) - l'intensité amplitude ou volume (plus ou moins fort) - le timbre. Constitution harmonique (plus ou moins complexe) Page 2 sur 12
La chaine de traitement numérique du son Page 3 sur 12
Les raisons du succès de l audio-numérique Manutention LE PARADOXE : La mise en œuvre d une chaîne de traitement audio-numérique nécessite une technologie moderne, puissante et coûteuse. Pourtant on ne peut plus penser «son» sans penser «électro-acoustique». Le CD est un support rigide et peu fragile qui permet une manipulation (contrairement aux disques vinyls et aux bandes magnétiques d autrefois) Mémorisation Le son mémorisé en numérique bénéficie de tous les avantages du stockage numérique : duplication, migration vers d autres supports (clé USB, cartes SD, Disque durs ). De plus, un son numérisé ne se dégrade pas avec le temps, il conserve donc toute sa qualité d origine. Traitement Les outils numériques permettent de corriger, nettoyer ou modifier un son avec des effets, ouvrant la porte à une nouvelle pratique : «Le design sonore». Il existe une grande variété de logiciels pour le traitement du son, l aide à la composition musicale, la synthèse sonore, la gestion de biblithèques de sons Communication et échange Un son numérique, sous la forme d un fichier, peut être transmis et échanger par l intermédiaire de n importe quel réseau informatisé (réseau local, internet, intranet ). Un son numérique peut être compresser afin d être «moins lourd» pour sa transmission, mais il y a alors une perte de qualité sonore. Interopérabilité Un fichier son peut être enregistré, traité et joué par toute sorte de dispositifs numériques : ordinateur (PC, Apple ou Linux), tablette, téléphone, ipod, lecteur mp3 Page 4 sur 12
Conversion du son en numérique Conversion du son en signal électrique Pour pouvoir capter un son, il est nécessaire de transformer les variations de pression du milieu ambiant en grandeur électrique. Cette tâche est réalisée par le microphone dont la membrane provoque le mouvement d un électro-aimant. Ce dispositif convertit de façon fidèle le son en tension électrique : En général, la source d un son est de nature très complexe, qui traduit sa richesse qualitative d un son (harmoniques, tessiture ). Par exemple, le spectre de modulation de l'amplitude d'une voix humaine en fonction du temps pourra avoir cette forme : Page 5 sur 12
Echantillonnage L échantillonnage consiste à prélever, à intervalles de temps réguliers, l amplitude du spectre de modulation. Une fréquence d échantillonnage élevée donne une restitution plus fidèle et de meilleure qualité. Fréquences d échantillonnage les plus utilisées : Fréquence d'échantillonnage Téléphone 8 Khz 8 000 échantillonnages par seconde Radio FM 32 khz 32 000 échantillonnages par seconde CD-Audio 44,1 khz 44 100 échantillonnages par seconde DAT 48 khz 96 Khz 48 000 échantillonnages par seconde 96 000 échantillonnages par seconde La fréquence d échantillonnage du son d un CD étant de 44,1 Khz, cela veut dire qu il y a 44 100 échantillons traités en une seconde, soit : 3600 x 44100 = 158,76 millions d échantillons pour une heure de musique. Le temps séparant 2 prises d échantillon est de 22,6 µs. Page 6 sur 12
Numérisation La numérisation du son consiste à transformer la valeur de l amplitude d un échantillon en une valeur numérique. La fidélité du son numérisé dépend du nombre de bits choisi pour la numérisation Le CD utilise une numérisation sur 16 bits. Le son étant stéréophonique, on utilise deux canaux sur lesquels on enregistre individuellement un son qui sera fourni au haut-parleur de gauche, ainsi qu'un son qui sera diffusé sur celui de droite. Page 7 sur 12
Résultat de la conversion analogique / numérique On obtient donc après la Conversion Analogique / Numérique (échantillonnage puis numérisation), une suite de mots binaires codés sur 16 bits pour chacune des 2 canaux (droite et gauche) : Echantillon # 1 Echantillon # 2 Echantillon # 3 Echantillon # 4 Echantillon # 5 Echantillon # 6 Temps 0 µs 22,6 µs 45,2 µs 67,8 µs 90,4 µs Canal de droite 0111010111000110 1011011100000111 0111010111000000 1011011100000110 1010000000001111 Mot D1 Mot D2 Mot D3 Mot D4 Mot D5 Mot D6 Canal de gauche 1011011100000110 0111010111001111 1011011101110110 1111000011110001 1011011100000110 Mot G1 Mot G2 Mot G3 Mot G4 Mot G5 Mot G6 En général, les mots binaires sont mis bout à bout, ce qui veut dire que 2 mots binaires de 16 bits (donc 32 bits), transitent en 22,6 µs. On obtient donc une longue queue de 0 et de 1 dont l organisation est la suivante : Mot G1 Mot D1 Mot G2 Mot D2 Mot G3 Mot D3 Mot G4 Mot D4 Mot G5 Mot D5 0 µs 22,6 µs On rappelle que la qualité de reproduction du son augmente : - si la fréquence d échantillonnage augmente (44,1 Khz, 48 Khz ) - si le codage se fait sur davantage de bits (8 bits, 16 bits, 32 bits ) REMARQUE : Un son peut être convertit en numérique par la chaine : microphone -> Convertisseur Analogique vers Numérique -> CD Audio Un son peut-être restitué du numérique par la chaine : CD Audio -> Convertisseur Numérique vers Analogique -> Haut-Parleur Page 8 sur 12
Le CD Audio Format physique et numérique du CD Audio Le CD Audio a été lancé par Sony et Philips en 1982 afin de constituer un support audio compact de haute qualité permettant un accès direct aux pistes numériques. En 1984, les spécifications du Compact Disc ont été étendues afin de lui permettre de stocker des données numériques sous la forme du CD- ROM ou CD-R Le CD est un disque optique de 12 cm de diamètre et de 1.2 mm d'épaisseur permettant de stocker des informations numériques : sa capacité est de 650 Mo (Méga-octets), soit 74 minutes de musique échantillonnée à 44,1 khz sur 16 bits. Les données sont inscrites sur une piste en spirale qui fait près de 5 km de long, qui part du centre vers l extérieur et compte 22 188 tours. Page 9 sur 12
Ecriture des données numériques par pressage Les CD et CD-ROM sont constitués de 4 couches : - un substrat en matière plastique (polycarbonate) pourvu de bosses obtenues par pressage - une fine pellicule métallique (alu, or ou argent) constituant la couche réfléchissante - une couche de laque acrylique anti-uv créant un film protecteur pour les données - une couche en polymère servant de support aux informations imprimées. Les bosses du support en polycarbonate dessinent la longue spirale des données numériques succession de creux et de plats qui définissent la localisation des niveaux binaires 0 et 1. La taille d'un bit sur le CD est normalisée et correspond à la distance de 0,278 µm. Page 10 sur 12
Principe de la lecture des données Un rayon lumineux est émis par une diode laser (diode à faisceau très étroit) qui est pointé sur la piste gravée du CD. Les données gravées agissent comme des miroirs plus ou moins réfléchissants, et la lumière réfléchie d amplitude variable est mesurée à l aide d une photodiode : En sortie, on récupère un signal électrique dont l amplitude dépend directement de la donnée éclairée. Ce dispositif de lecture optique doit suivre la piste en spirale gravée sur le CD. Au départ, la piste centrale est lue et petit à petit, le lecteur optique, monté sur un charriot mobile, avance vers l extérieur du disque. Il est à noter que le saut d un morceau de musique à un autre se traduit par un mouvement ultra-rapide de la tête de lecture optique, et que la nouvelle position doit être atteinte avec une précision extrême. La mise au point du CD n aurait pu se faire sans une maîtrise parfaite en micromécanique (c est le cas également pour les disques durs). Page 11 sur 12
Principe de l interprétation des données LE PROBLEME : Le CD Audio contient une longue piste de 5 kms de trous et de bosses qui doivent être traduits en musique à la sortie du Convertisseur Numérique/Analogique. Il est nécessaire de connaître le scénario de lecture pour comprendre On distingue donc 3 zones : Quand on insert un CD dans un lecteur (que ce soit un CD Player, un ordinateur ou un lecteur DVD), l appareil de lecture ignore évidemment le contenu du CD. Ce que le lecteur sait, c est que le début de la piste à lire est au centre du CD. Donc à partir de cette extrémité, le lecteur va devoir connaître la nature et les propriétés des informations gravées sur le disque. - Le début de la piste gravée (Lead In) fournit, dans un ordre précis, la table des contenus du disque (TOC : Table Of Contents) : Il s agit d un CD Audio, qui doit être lu à telle vitesse, son titre est, il a été créé le, avec le logiciel, il contient des fichiers du type, échantillonnés à.khz, sur bits, il contient morceaux : Le morceau 1 commence à la position., dure secondes et son titre est, le morceau 2 commence à la position., dure secondes et son titre est La zone Lead-in s'étend du rayon 23 mm au rayon 25 mm. Cette taille est imposée par le besoin de pouvoir stocker des informations concernant un maximum de 99 pistes. Après avoir pris connaissance de toutes les informations du TOC, le lecteur est capable de se repérer dans le disque et de lire chaque morceau «les yeux fermés» - La zone centrale (Program Area) contient toutes les informations sonores à la queue leu-leu (voir plus haut). Elle commence à partir d'un rayon de 25 mm, s'étend jusqu'à un rayon de 58 mm et peut contenir l'équivalent de 74 minutes de données. La zone programme peut contenir un maximum de 99 pistes d'une durée minimale de 4 secondes. - La zone de fin (Lead Out) qui est une zone vierge, de silence. Elle commence au rayon 58 mm et mesure 0,5 mm d'épaisseur. Tout support de stockage de fichiers informatiques (disque dur, mémoire Flash, clé USB, DVD ) est conçu de la même manière qu un CD Audio, avec, en tête une TOC, puis la succession des données décrites dans la TOC, et, pour finir, une courte zone de fin. Il est évident que toute information détériorée dans la zone du TOC entraîne l impossibilité de lire le média. Page 12 sur 12