Enseignement (M21) «Numérisation des signaux audio-vidéo, compression et stockage» Cours 1/4
Cette matière fait partie du module M3.21 «Culture scientifique et traitement de l information» (4CM, 2TD, 3TP) Objectifs de cette matière : «Introduire une alternative au traitement analogique en insistant sur les avantages et inconvénients du traitement numérique de l information en vue de la traiter, stocker, diffuser et représenter» Contenu Les codecs audio-vidéo-parole, la compression vidéo. La transmission numérique (multiplexage...) Stockage numérique
Cette matière fait partie du module M3.21 «Culture scientifique et traitement de l information» (4CM, 2TD, 3TP) Modalités de contrôle des connaissances Une épreuve théorique de 1h30 (sans document) Une note pratique : QCM(s) donné(s) en TP, une note liée aux 3 TP.
La vidéo sera utilisée pour illustrer la compression numérique Le signal analogique Le signal numérique Conversion analogique-numérique Format 4:2:2 Généralités sur la compression numérique
Le signal analogique : représente le plus naturellement et le plus fidèlement les variations d un phénomène physique de manière continue. Intensité lumineuse 0,7 Volt Image du noir au blanc 0 Volt Début de ligne de l image t Fin de ligne de l image Tension électrique Pression acoustique t
Le signal analogique : représente le plus naturellement et le plus fidèlement les variations d un phénomène physique de manière continue. Intensité lumineuse Inconvénient 0,7 Volt 0 Volt Le signal analogique souffre d un inconvénient majeur : il est très fragile. t Son enregistrement, Image son traitement ou sa Début transmission de ligne Fin lui de ligne font desubir de l image l image différents types de dégradations, qui altèrent rapidement sa qualité. du noir au blanc Tension électrique Pression acoustique t
Le signal analogique vidéo : est un signal composite. Les standards PAL, SECAM (625/50) et NTSC (525/60) sont tous trois nés de la nécessité d assurer le passage de la télévision en noir et blanc à la télévision en couleurs de façon totalement compatible. Luminance+Chrominance A Luminance Chrominance 1,5MHz 1,5MHz 64µs 52µs 4,43MHz 6MHz L œil est moins sensible aux fins détails de couleurs qu aux fins détails de luminance. f
Le signal analogique vidéo : R V B Primaires R,V,B Matriçage Y U V Modulation sous-porteuse Y/C Composantes analogiques (Y,U,V) normes PAL Y = 0,299*R + 0,587*V + 0,114*B U = 0,492*(B-Y) V = 0,877*(R-Y) + Composite analogique
Le signal numérique : n a pas de nature physique. Il se présente sous la forme d un message composé d une suite de symboles, et est discontinue. Il représente la valeur arrondie d une grandeur physique analogique à un instant donné.
Le signal numérique : n a pas de nature physique. Il se présente sous la forme d un message composé d une suite de symboles, et est discontinue. Avantage Il représente la valeur d une grandeur physique à un instant Le signal numérique est particulièrement donné. stable. Il se prête remarquablement aux traitements les plus complexes et aux copies cumulatives au travers desquelles l information qu il porte est totalement préservée. Inconvénient...
Conversion analogique/numérique : MONDE ANALOGIQUE MONDE NUMERIQUE
Conversion analogique/numérique : MONDE ANALOGIQUE MONDE NUMERIQUE Filtre Anti-Repliement Convertisseur Analogique-Numérique Échantillonneur
Le signal numérique vidéo : pour supprimer les différents systèmes de couleurs liés au signal composite et favoriser l échange international des programmes, il a été décidé de numériser des données communes à tous les pays. Ce qui a été décidé c est numériser les composantes Y, Cb, Cr. R V B Matriçage Y Cb Cr Numérisation Signal numérique vidéo Normes R601 Primaires R,V,B Composantes analogiques (Y,Cb,Cr) Y = 0,299*R + 0,587*V + 0,114*B Cb = 0,564*(B-Y) Cr = 0,713*(R-Y)
Le signal numérique vidéo : La numérisation doit impérativement préserver l information. Tout doit être fait pour que le rythme de numérisation soit suffisamment rapide pour être à l affût de la variation la plus brève du signal d origine. Quel est le principal paramètre de la numérisation qui joue sur cette préservation?
Le signal numérique vidéo : La numérisation doit impérativement préserver l information. Tout doit être fait pour que le rythme de numérisation soit suffisamment rapide pour être à l affût de la variation la plus brève du signal d origine. Quel est le principal paramètre de la numérisation qui joue sur cette préservation? C est la fréquence d échantillonnage. Comment doit être définie cette fréquence?
Le signal numérique vidéo : La numérisation doit impérativement préserver l information. Tout doit être fait pour que le rythme de numérisation soit suffisamment rapide pour être à l affût de la variation la plus brève du signal d origine. Quel est le principal paramètre de la numérisation qui joue sur cette préservation? C est la fréquence d échantillonnage. Comment doit être définie cette fréquence? C est le critère de Shannon qui détermine la fréquence d échantillonnage : F e > 2.F max
Le signal numérique vidéo : L information de luminance dispose d une bande passante de 6MHz. La fréquence d échantillonnage du signal de luminance doit donc être au moins égale à 12MHz. Il a été adopté comme norme mondiale une fréquence d échantillonnage du signal de luminance égale à : F e (Y) = 13,5MHz Normes R601
Le signal numérique vidéo : L information de luminance dispose d une bande passante de 6MHz. La fréquence d échantillonnage du signal de luminance doit donc être au moins égale à 12MHz. Il a été adopté comme norme mondiale une fréquence d échantillonnage du signal de luminance égale à : F e (Y) = 13,5MHz Normes R601 Les signaux de couleurs ont une bande passante de 3MHz. La fréquence d échantillonnage des signaux de couleurs doivent donc être au moins égale à 6MHz. On a adopté comme norme mondiale une fréquence d échantillonnage des signaux de couleurs égale à : F e (Cr) = F e (Cb) = 6,75MHz Au niveau international, une ligne active numérique renferme 720 échantillons de luminance et 360 échantillons pour chaque information de chrominance. Une image numérique présente 575 lignes utiles.
Le signal numérique vidéo : Le filtrage anti-repliement a pour rôle de supprimer, avant l échantillonnage, les fréquences du signal vidéo supérieures à la moitié de la fréquence d échantillonnage. A(dB) 0 Luminance Signal analogique vidéo -12dB A(dB) 0 f 5,5 6,75 Chrominance Fe/2 Conversion Analogique/ Numérique Signal numérique vidéo -12dB 2,75 3,375 f
Le signal numérique vidéo : Format 4:2:2 La norme de codage numérique destinée aux applications de studio a été baptisé «4:2:2». La plus faibles sensibilité de l œil humain à la couleur qu au niveau de luminosité autorise de prélever deux fois moins d échantillons de chrominance que d échantillons de luminance. Il existe plusieurs structures de placement des échantillons dans une trame. Voici la plus courante : Y Cr Cb Y Y Cr Cb Y Y Cr Cb Trame 1 Y Cr Cb Y Y Cr Cb Y Y Cr Cb Trame 2
Le signal numérique vidéo : 4:2:2 4:1:1 4:2:0 4:4:4 Échantillon de chrominance Échantillon de luminance Réduction de la résolution horizontale en chrominance Réduction de la résolution verticale en chrominance Même résolution en chrominance qu en luminance «4» = 13,5MHz «2» = 6,75MHz «1» = 3,375MHz
La compression numérique La compression numérique : pourquoi? Calcul du débit numérique d'une vidéo au format 4:2:2 taille d'une image au format 4:2:2 8 bits 1440 échantillons * 8 bits *575 lignes utiles = 6,3 Mbits/image 6,3Mbits/image *25 images/s = 156Mbits/s = 20Mo/s débit numérique d'une vidéo au format 4:2:2 156 Mbits/s!!! Ordre de grandeur : pour transmettre une vidéo numérique au format 4:2:2 à plein débit il faudrait 160 lignes ADSL à 1Mbits/s
La compression numérique La compression numérique : pourquoi? Apparue au début des années 1980, la numérisation des images vidéo conformément à la norme 4:2:2 donne naissance à des fichiers gigantesques, donc à des débits extrêmement élevés au regard de la capacité relativement limitée des supports de stockage et de transmission classiques de l'époque. Un CD-Rom de 650 Mo ne peut contenir que 30 secondes de vidéo au format 4:2:2 8 bits Ordre de grandeur : un espace mémoire de 1Go peut contenir 50 secondes d images 4:2:2 sur 8 bits. La réduction du débit du signal vidéo est un passage obligé pour autoriser le stockage d une grande quantité d images sur un support de stockage numérique et pour permettre la diffusion de ces images numériques dans un canal de fréquence conventionnel.
La compression numérique La compression numérique : pourquoi? La numérisation d'une vidéo analogique pose deux problèmes : 1. le problème du stockage 2. le problème de la transmission Ces deux problématiques ont longtemps été un frein au développement du numérique en audiovisuel. La solution : la compression numérique En plus de ces économies en matière de stockage et de transmission, la numérisation des images ouvre la voie à des fonctionnalités totalement nouvelles dans les applications courantes (cryptage, pay per view).
La compression numérique La compression numérique : comment? Les algorithmes de compression se basent sur les deux principes suivants : Ne pas transmettre des informations redondantes Ne pas transmettre des informations non ou peu perceptibles par l œil ou l oreille humaine Cela est d autant plus difficile que le débit final que l on cherche à obtenir est faible. Les compressions numériques éliminent les données redondantes, simplifie ou supprime certaines informations peu importantes en fonction de l application visée.
La compression numérique La compression numérique : deux grandes catégories? Les algorithmes «sans pertes» (lossless) effectuent un traitement totalement transparent, permettant de retrouver intégralement les données d origine après décompression. Avantage : pas de perte Inconvénient : taux de compression faible, pas adapté pour les vidéos Les algorithmes «avec pertes» (lossy) imposent de négliger certaines informations. Si cela se fait dans des proportions limitées, l élimination de ces informations peut passer inaperçues. Avantage : taux de compression plus élevé Inconvénient : pertes d information plus ou moins visibles ou audibles
La compression numérique Mesure de la performance d'un algorithme de compression Le taux de compression est une mesure de la performance d'un algorithme de compression de données numériques. Il existe plusieurs définition du taux de compression. La définition la plus courante est le rapport entre le volume de données non compressées et le volume de données compressées. Un taux de compression de 40:1 appliquée sur une vidéo au format 4:2:2 8 bits permet de descendre le débit de transmission de 156Mbits/s à 4 Mbits/s.
La compression numérique Notion Un de algorithme codec/decodec compression (respectivement décompression) fait appel à toute une série de mécanismes paramétrés de manière très précise. Un algorithme de compression/décompression est décrit par un codec (COdage / DECodage ou COmpression / DECompression ou COmpresseur / DECompresseur). Pour lire correctement un fichier compressé il faut absolument le codec utilisé pour la génération de ce fichier. Il existe d innombrables algorithmes de compression et par conséquent d innombrables codecs. Codec d'images : PNG, JPEG, GIFF, TIFF Codec audio : MP3, Ogg Vorbis, Codec vidéo : MPEG -1,-2,-4
La compression numérique Quelques ordres de grandeur Dans le cas d une image fixe, on peut typiquement supprimer jusqu à 70% de ses informations sans toucher à sa qualité. On dit qu un taux de compression de 3:1 est totalement transparent. Si l on accepte quelques pertes, généralement peu décelables par un œil non averti, le taux de compression peut atteindre 10:1. Dans le cas d une séquence vidéo animée, on peut obtenir des facteurs de compression nettement supérieurs en tenant compte de la forte parenté entre les images contiguës. Par exemple, pour les applications de diffusion, il est courant d utiliser des taux de compression compris entre 15:1 et 40:1. En studio cependant, les exigences plus sévères en matière de qualité du signal imposent de limiter le taux de compression à 5:1. Dans le cas d une séquence audio, on peut obtenir des facteurs de compression de l'ordre de 4:1 à 14:1 suivant la qualité du fichier numérique final souhaité. Rappel : le débit audio qualité CD est égal à 1,3Mbits/s 1 minute d'audio en qualité CD c'est environ 10Mo.
La compression numérique La compression numérique : Les redondances de l image vidéo La redondance spatiale La redondance temporelle La redondance subjective La redondance statistique
La compression numérique La compression numérique : la redondance spatiale Toute plage uniforme sur une image renferme des pixels identiques. Il est donc inutile de coder séparément chacun de ces pixels puisqu un seul peut les caractériser tous. Il suffit alors de transmettre deux données, l une représentant la valeur du pixel, l autre indiquant le nombre de fois qu elle se répète. Nous verrons comment une technique comme la Transformée en Cosinus Discrète (souvent noté DCT) peut mettre en évidence cette redondance spatiale à l intérieur de chaque image. cf. TP1 et TP2
La compression numérique La compression numérique : la redondance temporelle Dans une séquence vidéo, il existe une très forte corrélation entre les images successives. Entre deux images successives, les différences peuvent être minimes. Les techniques d estimation de mouvement permettent de coder une image par rapport à sa voisine, en ne transmettant que les informations relatives au déplacement de ses composantes. L élimination des redondances temporelles peut conduire à des taux de compression très élevés. En revanche, le codage s applique non plus à des images isolées, mais à des groupes d images rendues indissociables les unes des autres. Il est donc bien adapté à la diffusion d un flux continu.
La compression numérique La compression numérique : la redondance subjective L exploitation de la redondance subjective fait appel à la notion de codage perceptuel, tirant parti des faiblesses de la vision ou de l'audition humaine. Elle consiste à coder avec un nombre réduit de bit les éléments de l image jugés les moins significatifs.
La compression numérique La compression numérique : la redondance statistique Il s agit d une notion purement mathématique : si certains codes reviennent plus fréquemment que d autres, autant leur réserver les mots numériques les plus courts. Cette opération, appelée codage entropique, n entraîne aucune perte. Exemple : codage Huffman cf TD2 et TP3
Ce qu'il faut retenir de ce cours RAPPEL SUR LA NUMÉRISATION PROBLÉMATIQUE DE LA NUMÉRISATION GÉNÉRALITÉS SUR LA COMPRESSION LES ORDRES DE GRANDEUR