Schéma de compression vidéo



Documents pareils
Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Livrable 2.1 Rapport d analyse et de restructuration de code monothread des modules P, T, Q et F de l encodage MPEG-4 AVC

Codage vidéo par block matching adaptatif

ISO/CEI NORME INTERNATIONALE

Transmission d informations sur le réseau électrique

Approche par marquage pour l évaluation de la qualité d image dans les applications multimédias

Quantification Scalaire et Prédictive

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Enregistrement et transformation du son. S. Natkin Novembre 2001

Chapitre 2 : communications numériques.

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

Technique de codage des formes d'ondes

Communications immersives : Enjeux et perspectives

1 THALES Land & Joint Systems, EDS/SPM WaveForm Design group

En DV (PAL ou NTSC), la largeur est toujours de 720 pixels, c'est la proportion du pixel qui change la proportion de l'image.

Représentation des Nombres

DEVANT L UNIVERSITE DE RENNES 1

Compression scalable d'images vidéo par ondelettes 2D+t

Informatique Générale

Chap17 - CORRECTİON DES EXERCİCES

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Projet d informatique M1BI : Compression et décompression de texte. 1 Généralités sur la compression/décompression de texte

INF6304 Interfaces Intelligentes

Digital Subscriber Line

La couche physique de l ADSL (voie descendante)

Formats d images. 1 Introduction

Technique de compression des images médicales 4D

Cinéma Numérique : État de l art d un point de vue Art et Essai

Conversion d un entier. Méthode par soustraction

Université de La Rochelle. Réseaux TD n 6

Transmission de données. A) Principaux éléments intervenant dans la transmission

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Multimedia. Systèmes, Communications et Applications. Ahmed MEHAOUA

Codage d information. Codage d information : -Définition-

Introduction à l approche bootstrap

Projet Matlab : un logiciel de cryptage

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Maintenir un service de traitement de son ou d image d ordinateur

Mesure agnostique de la qualité des images.

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

L EXPORTATION d un PROJET.MVP

Un schéma de compression avec pertes efficace pour les images médicales volumiques

La vidéosurveillance sur réseau qui surpasse vos attentes

Limitations of the Playstation 3 for High Performance Cluster Computing

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Les tablettes. Présentation tablettes Descriptif Fournisseurs Caractéristiques Comparatifs Conseils Perspectives Démonstration

Réalisation d un diaporama en haute définition avec. Adobe Premiere Elements 3.0 ou Adobe Premiere Pro 2.0. Encodage pour Internet

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Chapitre 13 Numérisation de l information

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

QoS et Multimédia SIR / RTS. Introduction / Architecture des applications multimédia communicantes

Continuité et dérivabilité d une fonction

Programmation linéaire

J AUVRAY Systèmes Electroniques TRANSMISSION DES SIGNAUX NUMERIQUES : SIGNAUX EN BANDE DE BASE

Les portes logiques. Voici les symboles des trois fonctions de base. Portes AND. Portes OR. Porte NOT

كر اس الشروط الفني ة اخلاص ة

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

UE 503 L3 MIAGE. Initiation Réseau et Programmation Web La couche physique. A. Belaïd

Optimisation, traitement d image et éclipse de Soleil

Rapport de stage. Implantation en virgule fixe d un codeur audio. Romain Serizel

Le poids et la taille des fichiers

Les techniques de multiplexage

PARAMÉTRAGE BOSCH SOMMAIRE DE LA CAMÉRA OSCH DINION-IP-NWC : CONFIGURATION POUR DE L ENREGISTREMENT PERMANENT... 2

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Errata et mises à jour

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

TP SIN Traitement d image

Plan du cours Cours théoriques. 29 septembre 2014

Equipement. électronique

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Communications numériques

Chaine de transmission

6 ème. Rallye mathématique de la Sarthe 2013/ ère épreuve de qualification : Problèmes Jeudi 21 novembre 2013

On distingue deux grandes catégories de mémoires : mémoire centrale (appelée également mémoire interne)

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Vidéo Haute définition pour Station Service

LA COUCHE PHYSIQUE EST LA COUCHE par laquelle l information est effectivemnt transmise.

xdsl Digital Suscriber Line «Utiliser la totalité de la bande passante du cuivre»

LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION

note technique 1RWLRQVVXUODFRPSUHVVLRQ GHVGRQQpHVGDQV OHVDSSOLFDWLRQVPXOWLPpGLDV Direction de l'ingénierie éducative

1 Introduction au codage

1 Recherche en table par balayage

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

ÉPREUVE COMMUNE DE TIPE Partie D

Introduction à MATLAB R

Réseaux Multimédia et Qualité de Service

Plus courts chemins, programmation dynamique

Glossaire technique Veditec

Chapitre 22 : (Cours) Numérisation, transmission, et stockage de l information

Licence Sciences et Technologies Examen janvier 2010

IFT2880 Organisation des ordinateurs et systèmes

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Technologies xdsl. 1 Introduction Une courte histoire d Internet La connexion à Internet L évolution... 3

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Transcription:

Plan Schéma de compression vidéo G. Laroche 04/0/2006 Introduction Étapes de compression Codage du résiduel Calcul du résiduel Autres étapes Conclusion Questions Plan Introduction Qu est ce qu un codec vidéo? Introduction Étapes de compression Codage du résiduel Calcul du résiduel Autres étapes Conclusion Questions Ensemble d outils. Entrée : séquences vidéo. Sortie : bitstream. Seul le décodeur est standardisé : Doit pouvoir décoder tout bitstream standard. Et doit rendre une qualité équivalente au autres décodeurs standardisés. Introduction A quoi sert un codec vidéo? Introduction Instituts et organisation Deu instituts de normalisation: ITU ISO Compresser un dont on connaît les caractéristiques, les redondances spatiales et temporelles ( de ZIP). H.26 993 ITU-T ISO-IEC H.262 = MPEG-2 995 MPEG- 99 Applications vidéo de plus en plus nombreuses (TV, Cinéma, DVD, Visio). Permet une augmentation des qualités et résolutions. H.263 998 H.263+ 2000 H.265 200 MPEG-4 999 H.264/MPEG-4 AVC 2003 SVC H.264+/JSVC 2006

6 5 4 3 2 0 Introduction Évaluation Profil Average PSNR (db) Évaluation d une technique de compression 35 34 33 32 3 30 29 Codage avec perte: courbe débit-distorsion (R-D) Evaluation Objective 0 00 200 300 400 500 600 700 800 900 Bit-rate (kbits/s) Visual Quality Evaluation Subjective 0 2 3 4 5 6 7 8 Bit-rate (Mbits/s) Recommandation normalisée (ITU) Profil : Ensemble d outils liés à une application. Eemple : H.264 7 profils différents : Baseline : Application mobile, visiophonie. Main : Streaming/broadcast. Etended : Mobile video services. High : High 0 High 4:2:2 : High 4:4:4 : Fidelity Range Etension, TVHD, Digital Cinema, Blue Ray/HDDVD. Evaluation Objective moins fiable/subjective très coûteuse Profil Plan PSNR 45 40 35 30 25 20 R-D Evaluation Objective HIGH BASELINE Introduction Étapes de compression Codage du résiduel Calcul du résiduel Autres étapes Conclusion Questions 5 0,00 00,00 200,00 300,00 400,00 500,00 600,00 700,00 Bit-rate (kbits/s) - - vectors vectors

Transformations - Généralités Transformations - Généralités Entropie : valeur moyenne de la quantité d information associée à une variable aléatoire. Objectif : dé-corréler le. Pourquoi? Codage entropique + efficace. Domaine piel Pourquoi ça marche? Corrélation spatiale dans l image «un piel ressemble souvent à son (ses) voisin(s)» Équiprobabilité des valeurs sur [0 ; 255] Énergie concentrée sur les basses fréquences, proba faible sur les grandes amplitudes dans les hautes fréquences Domaine transformé Entropie en chute libre! + d énergie dans les basses fréquences Transformations - Transformations - Transformée fréquentielle Formule : Implémentation simple Algorithmes rapides Efficace Dans la pratique : (I) = P - IP Utilisée dans JPEG, MPEG-, MPEG-2... Transformations - I est une combinaison linéaire des éléments de la base suivante : Eemple I : (i) :

Transformation H.264 Transformation DWT En pratique : Discrete Wavelet Transform : utilisé dans le standard JPEG2000. 2 2 2 2 00 0 20 30 0 2 3 02 2 22 32 03 3 23 33 2 2 2 2 Pas utilisé (pour l instant) dans les codeurs vidéo STANDARD. H.264 décalages et additions Permet un scalabilité en résolution. Transformation DWT Discrete Wavelet Transform : utilisé dans le standard JPEG2000. Pas utilisé (pour l instant) dans les codeurs vidéo STANDARD. - Permet un scalabilité en résolution. Outil pour la scalabilité vectors Introduction de pertes - quantification Eemple quantification Matrice de quantification en fonction du pas de quantification. (i) : Division entière des coefficients de la matrice par les coefficients de la matrice de quantification. Objectif : réduire l alphabet de la matrice. Entraîne une perte de données. Q((i)) :

Codage entropique - Suite à la quantification on a beaucoup de valeurs proches de 0. Le codage entropique va permettre de réduire la quantité d information. vectors 2 types de codage: Variable Length Coding. Codage Arithmétique. Codage entropique VLC (Variable Length Coding) Codage entropique - Huffman (952) Longueur d une séquence donnée (bits) : L = Nb _ symboles * Entropie de cette séquence (bits/symbole): h = p i log ( p i ) N i= 0 p i. l i Nb de valeurs prises par les symboles Nb de bits attribués à la valeur i Probabilité de la valeur i. 2 i Codage de Huffman (952) = optimal au sens de l entropie(bits/symbole): 0 0 B (p = 0.25) BC (p = 0.45) C (p = 0.2) 0 D (p = 0.5) DE (p = 0.27) E (p = 0.2) ADE (p = 0.55) 0 A (p = 0.28) A = 0 B = 00 C = 0 D = 0 E = On attribue -[log 2 (p i )] bits au symbole i Le RLC Zig-zag scanning Codage entropique - RLC+VLC DC Séquence : 0004000000-300000000000-3 (3,4) (6,-3) (8,) (,) (2,) (0,-3) Ordre de parcours des coefficients quantifiés Matrice (N,N) Vecteur (NN,) 000000000000000000000000 Balayage par ordre croissant des fréquences spatiales. RLC efficace Chaque couple codé par l algorithme de Huffman. plus la fréquence d apparition d un symbole est forte, plus la chaîne est courte.

Codage Arithmétique - IBM, début 80 s Codage Arithmétique - IBM, début 80 s Limite du codage de Huffman : nb de bits entier par symbole. E: p A = 90% A codé sur bit au lieu de 0.5 bit (6 fois trop). Codage arithmétique : on code une suite de symboles par un intervalle en virgule flottante sur [0,[. Eemple 0 /2 7/8 A B C /2 /6 53/64 7/8 A B C /2 9/32 85/28 /6 A (p = 0.500) Symboles : B (p = 0.375) C (p = 0.25) On veut transmettre BAB Probabilités connues du codeur et du décodeur A B C ]9/32 ; 85/28[ Codage Arithmétique - IBM, début 80 s On code 9/32 5 bits. Au décodage on connaît la table de probabilité. On a : /2 > 9/32 > 7/8 premier caractère est B (9/32-/2)/(intervalle de B) = 3/32/(7/8-/2) = 0.25 0 > 0.25 > /2 2ième caractère est A Etc La chaîne est donc BAB - vectors JPEG Plan - Introduction Étapes de compression Codage du résiduel Calcul du résiduel Autres étapes Conclusion Questions vectors

Résiduel? Recherche d un prédicteur à partir de l information déjà connue. Puis codage de la différence entre le prédicteur et le bloc de départ. e(, = p(, pˆ(, Et inversion au décodage. p (, = pˆ(, + e(, - vectors Redondances temporelles Redondances temporelles Compression d image fie : redondance spatiale. Compression d image vidéo : redondance spatiale et temporelle. Entre 2 images successives, peu de différences. il doit y avoir moyen de déduire l une de l autre... Image (t 0 ) Image 2 (t 0 +40 ms) Image Type Temporel - Schémas prédictifs I : (INTRA) Codage uniquement spatial. Équivalent à JPEG. P : (PREDICTED) Codage temporel, en fonction d'une image précédente. B : (BIDIRECTIONAL) Codage temporel, en fonction de 2 images. Débit(I)>Débit(P)>Débit(B) On prédit une image par rapport à une (plusieurs). autre(s) de référence ; on code la. E: images P et B. Suppose une boucle de décodage dans le codeur. Et qu une image soit codée en Intra (I).

Estimation de mouvement nécessaire? Le block matching Zone immobile : Zone en mouvement : Très faible erreur de prédiction Skipping Mouvement trop rapide pour l œil Forte quantification Principe : Mise en correspondance par minimisation de la MSE sur des blocs de taille fie. Avantages : Pas de segmentation à transmettre. Simplicité. Bonne compatibilité avec le codage spatial (block based). Block matching - full search Non normatif Compensation de mouvement - Intérêt Principe : Mise en correspondance par minimisation d une fonction coût sur des blocs de taille fie. V (i,j) Ae temporel (k,l) Iref(n-) Icur(n) Pour chaque bloc B[i][j] centré en (i,j), recherche dans l image de référence du bloc B[k][l] lui ressemblant le plus. Le vecteur est V(B[i][j]) = (i-k, j-l). t0-t Compensation de mouvement entre t0 & t Block Shapes Anciens codeurs : bloc 88 H.264 : 4 modes principau pour la de mouvement. 66 68 86 88 Sub-Piel Prediction Pourquoi?: Mouvement non pielique. Engendre plus de détails. En mode 88, un bloc peut être divisé. Estimation au piel entier, au ½ et au ¼ de piel 88 84 48 44 mise en compétition

Prédiction Intra - BUT : Eploiter la redondance spatiale. H.263 : Prédiction domaine Bloc 88 : 3 modes H.264 : Prédiction domaine piel Bloc 44 : 9 modes Bloc 66 : 4 modes Bloc 88 (high) : 9 modes vectors H.264 plus efficace que H.263 et JPEG2000 Prediction Intra 66 H.264 Plan Le macrobloc est prédit en fonction de la ligne du haut et la colonne de gauche. 4 modes de prédiction : DC Horizontal Vertical Plane Introduction Étapes de compression Codage du résiduel Calcul du résiduel Autres étapes Conclusion Questions mise en compétition Temporel - Codage des vecteurs! - En général: Les vecteurs sont codés sans perte MV et MV y séparément MV et MV y sont codés à l aide d un prédicteur qui est la médiane des vecteurs voisins déjà enregistrés. Résiduel VM = VM Médian ( a, b, c) b c vectors a VM

filter - Pourquoi? Amélioration de la qualité visuelle. Gommage des effets de bloc. Compensation de mouvement plus efficace. Comment? Dans la boucle de de mouvement. Moyenne pondérée des piels en bordure de bloc. Organisé par filtre. Choi des filtres en fonction des caractéristiques des blocs. vectors filter - Beaucoup de tests, clips, très coûteu, très efficace. vectors Conclusion Non normatif Mise en compétition de tous les modes possibles. Minimisation d une fonction coût respectant : La qualité Le bit-rate J = D + λr Compression toujours nécessaire. Eploitation des redondances spatiales et temporelles. Schéma de codage vidéo calqué sur celui du codage d'image. Distortion (qualité) Rate (bit-rate) L enjeu des prochaines années : HD, consommation mobile, la vidéo 3D.

La bibliographie Chiffres et Résultats Jean-Alain Hernandez,René Joly, Les normes et les standards du multimédia, Dunod 2000. Compression d images fies et animées JPEG et MPEG, conférence ENST Bretagne 2003. Un film de h30 : 25 Go non compressé. 650 Mo en MPEG4. 350 Mo en H.264. 75 Mo en H.265 soit 4 films sur un CD de 700 Mo T. Wiegand, G.J. Sullivan, Overview of the H.264/AVC Video Coding Standard, IEEE 2003.