Block-matching, MPEG. Guillaume Coppens, Cléa Martinez. Mars 2016

Documents pareils
Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Codage vidéo par block matching adaptatif

Livrable 2.1 Rapport d analyse et de restructuration de code monothread des modules P, T, Q et F de l encodage MPEG-4 AVC

Approche par marquage pour l évaluation de la qualité d image dans les applications multimédias

DEVANT L UNIVERSITE DE RENNES 1

Multimedia. Systèmes, Communications et Applications. Ahmed MEHAOUA

Groupe Eyrolles, 2000, 2004, ISBN :

Technique de compression des images médicales 4D

Réseaux Multimédia et Qualité de Service

Maintenir un service de traitement de son ou d image d ordinateur

QoS et Multimédia SIR / RTS. Introduction / Architecture des applications multimédia communicantes

Object Removal by Exemplar-Based Inpainting

Chapitre 13 Numérisation de l information

ISO/CEI NORME INTERNATIONALE

Glossaire technique Veditec

La Vidéo. S.Natkin/CNAM 1

كر اس الشروط الفني ة اخلاص ة

Continuité et dérivabilité d une fonction

Compression scalable d'images vidéo par ondelettes 2D+t

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

L exclusion mutuelle distribuée

Transmission d informations sur le réseau électrique

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Représentation des Nombres

1 Introduction au codage

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

En DV (PAL ou NTSC), la largeur est toujours de 720 pixels, c'est la proportion du pixel qui change la proportion de l'image.

Programmation sous QT

NWD Caméras FlexiDome IP

Chap17 - CORRECTİON DES EXERCİCES

Conventions d écriture et outils de mise au point

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

Dans l Unité 3, nous avons parlé de la

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Programmation linéaire

Errata et mises à jour

Les images et les animations sur le web. Guérineau Chloé BTS2 Année 2001/2012

Enregistrement et transformation du son. S. Natkin Novembre 2001

ASR1 TD7 : Un microprocesseur RISC 16 bits

Interception des signaux issus de communications MIMO

Chapitre 22 Optimisation pour diffusion à l'écran, pour le web

Les portes logiques. Voici les symboles des trois fonctions de base. Portes AND. Portes OR. Porte NOT

Safe Browsing: to Track, Censor and Protect

Qu est-ce que l analyse des données qualitatives? TAMS Analyzer n est: Projets collaboratifs. TAMS Analyzer permet:

18 TCP Les protocoles de domaines d applications

Traitement numérique de l'image. Raphaël Isdant

Les fonctions de hachage, un domaine à la mode

Q6 : Comment calcule t-on l intensité sonore à partir du niveau d intensité?

Cinéma Numérique : État de l art d un point de vue Art et Essai

Chapitre 18 : Transmettre et stocker de l information

G.P. DNS02 Septembre Réfraction...1 I.Préliminaires...1 II.Première partie...1 III.Deuxième partie...3. Réfraction

Projet d informatique M1BI : Compression et décompression de texte. 1 Généralités sur la compression/décompression de texte

Differential Synchronization

MASTER. Transmission Vidéo dans les Réseaux Sans Fils et Mobiles. Challenges et Solutions

Fabricant. 2 terminals

Compression Compression par dictionnaires

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

La conservation à long terme de contenus numériques

Les tablettes. Présentation tablettes Descriptif Fournisseurs Caractéristiques Comparatifs Conseils Perspectives Démonstration

Chapitre 1. Introduction aux applications multimédia. 1. Introduction. Définitions des concepts liés au Multimédia (1/2)

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Catégories de format d'optimisation

Tutoriel code::blocks

Les types de fichiers

1 Comment faire un document Open Office /writer de façon intelligente?

Programmation C. Apprendre à développer des programmes simples dans le langage C

TD : Codage des images

Gestion réactive des opérations de maintien et d actualisation réglementaire et technologique des systèmes complexes.

JPEG, PNG, PDF, CMJN, HTML, Préparez-vous à communiquer!

Windows Live Movie Maker

Sécurité des applications Retour d'expérience

NORMES DE LIVRAISON DES MESSAGES PUBLICITAIRES ET MESSAGES D INTÉRÊT PUBLIC COMMERCIAUX APTN

Mesure agnostique de la qualité des images.

Construction d un fichier de zone Déboguage et dépannage

Outils permettant la diffusion de l information. Un point sur le droit numérique

SNC-RZ25P. Caméra réseau motorisée MJPEG / MPEG-4

1/24. I passer d un problème exprimé en français à la réalisation d un. I expressions arithmétiques. I structures de contrôle (tests, boucles)

Introduction aux systèmes temps réel

Cahier des charges. driver WIFI pour chipset Ralink RT2571W. sur hardware ARM7

Tarif IPCAM Caméras IP. Septembre 2007

Technologie de Déduplication Progressive

Spécifications techniques

Géométrie discrète Chapitre V

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

TP 2 : Chiffrement par blocs

NWD Caméras FlexiDome IP

Types de fichiers multimédias pris en charge sur les smartphones BlackBerry Guide de référence Version: 14.0

Référentiel Général d Interopérabilité

TP SIN Traitement d image

Algorithme. Table des matières

Mesures de performances Perspectives, prospective

Comment intégrer des images dans un texte

Introduction à MATLAB R

LES IMPACTS SUR VOTRE SYSTEME DE FACTURATION DE LA SIGNATURE ELECTRONIQUE COMME OUTIL DE SECURISATION DE VOS ECHANGES DEMATERIALISES

Cours 1 : Introduction Ordinateurs - Langages de haut niveau - Application

Voix sur IP Étude d approfondissement Réseaux

Les Réseaux Informatiques

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

REALISATION d'un. ORDONNANCEUR à ECHEANCES

Transcription:

Block-matching, MPEG Guillaume Coppens, Cléa Martinez Mars 2016 1

Plan 1. Introduction 1.1 Pourquoi le MPEG? 1.2 Redondance spatiale 1.3 Redondance temporelle 2. Block -matching 2.1 Principe du block-matching 2.2 Algorithmes de recherche de bloc 3. MPEG 3.1 Images I, P, B 3.2 GOP (Group of Pictures) 4. H-264 2

1. Introduction Pourquoi le MPEG? Vidéo : succession d images mais on ne peut pas se permettre de compresser chaque image une à une. Beaucoup de redondances dans une vidéo : On sait déjà comment exploiter les redondances spatiales avec la compression d image (ex : JPEG). On veut pouvoir exploiter les redondances temporelles MPEG : Motion Picture Expert Group (1988). Format MPEG-2 (1994) 3

Redondance spatiale : retour sur la compression JPEG Différences avec JPEG : mêmes tables de quantification pour luminance et chrominance table de quantification peut changer pour chaque bloc 4

Redondance temporelle et éléments d une séquence vidéo 5

2. Principe du block matching Paramètres : Sortie : 1. fonction de distorsion 2. zone de recherche 3. taille d un bloc à analyser 1. vecteur de mouvement 2. différence entre deux macro-blocs 6

Fonctions de distorsions Mean Absolute Difference Mean Squared Error MAD = MSE = demande peu de calculs plus proche de notre vision : pixel (i, j) image courante : pixel (i, j) image de référence N : taille du bloc 7

Zone de recherche : W w << 1 : mauvaise qualité de prédiction lors de déplacements rapides w >> 1 : meilleur qualité contre une plus grande complexité temporelle Dans le format MPEG : W = 16 pixels Taille du bloc à analyser 8x8 pour le format MPEG 8

Méthodes de parcours de blocs Les principaux : Full Search (FS) Three Step Search (TSS) 2D Logarithmic Search (2DLS) Autres parcours : Four Step Search (FSS) Simple and Efficient Search (SES) Adaptative Rood Pattern Search (ARPS) 9

Three Step Search (TTS), Koga et. al.( 1981) Démarre de la position où il n y a pas de déplacements Le pas initial d entre les points de recherche vaut W/2 9 points sont testés, le point d'erreur minimale est choisis comme le centre de l étape suivante. L étape suivante s effectue avec un pas de d/2 On s'arrête lorsque le pas vaut 1 10

2D Logarithmic Search (2DLS) ain et. al. (1981) Démarre de la position où il n y a pas de déplacements Le pas initial entre les points de recherche vaut W/2 5 points en forme de croix sont utilisés à chaque étape la taille entre les points de la croix est réduite de moitié si le point d erreur minimale se trouve sur le centre, sinon il reste inchangé. On arrête lorsque le pas vaut 1 11

Comparatif des algorithmes de recherche Nombre de points de recherche : Cas où W = 7 Full Search (2*W+1)^2 = 225 Three Step Search 1 + 8*log2(d+1) = 17 2D Logarithmic Search (on ne peut pas déterminer le nombre de points) nombre minimal : 13 nombre maximal : 26 12

Compression MPEG Le flux de sortie MPEG possède 3 types d images : Images I ou Intra frames (images intracodées) Images P ou Predictive frames Images B ou Bidirectional frames 13

I Frames Image complète codée en JPEG Utilisée notamment lors d un changement de scène Une image I toutes les 12 images environ (2 images I par seconde) Permet d éviter la propagation d erreur Permettent la lecture en avance rapide. 14

P frames : images prédictives Codées par rapport à l image précédente, différence bloc par bloc Différence entre les deux images codée spatialement Utile pour les redondances temporelles 15

Syntaxe d une image P : Problèmes: si erreur lors du codage d une image P, toutes les images P suivantes seront erronées si perte d image I, aucune image P ne pourra être décodée 16

B frames On ne peut pas tout prédire, parfois il est plus efficace de chercher les données dans l image suivante. codées par rapport à deux images (P ou I, jamais B) ne propagent pas leurs propres erreurs 17

Codage d une image bi-directionnelle 18

GOP : Group of pictures 19

Taux de compression Si l on utilise un GOP de la forme IBBP plutôt que IIII : 60% de bits en moins Taux de compression : I frame : 7:1 P frame : 20:1 B frame : 50:1 20

H264 vs MPEG-2 H264 utilise jusqu à 32 images pour construire une image prédictive (contre 2 pour MPEG-2) Codage arithmétique pour H264, Huffman pour MPEG-2 La taille des blocs est variable : de 4x4 à 16x16 pixels Précision jusqu au quart de pixel pour H264 Environ 2 fois plus efficace au niveau de la compression 21

Sources http://screspin.free.fr/mpeg/ http://profesores.fi-b.unam. mx/maixx/biblioteca/librero_telecom/blockmatchingalgorithmsformotionestim ation.pdf http://serv.yanchick.org/books/dsp_books/video%20processing%20and% 20Communication/Chapter%206_2D%20motion%20estimation.pdf https://trac.ffmpeg.org/wiki/debug/macroblocksandmotionvectors 22

Un exemple à l aide du debug de ffmpeg 23