Master Info deuxième année Introduction au Format d Images Fixes Partie 1 Alain Trémeau Laboratoire d Informatique Graphique et d Ingénierie de la Vision 1
2 Introduction - Un format d'image comprend en général un en-tête qui contient des données sur l'image (taille de l'image en pixels par exemple) suivie des données de l'image. La structuration des données est différente pour chaque format d'image. - Quelques précautions à prendre concernant les formats d'images: Si possible ne pas utiliser les formats propriétaires; leur préférer des formats libres de tous droits, Prendre garde aux différentes versions que peut recouvrir un format particulier. Exemple: il existe plusieurs versions du format TIFF versions; certaines versions de TIFF ne sont pas reconnues par certains logiciels. Avantages Inconvénients
3 Introduction - Une image peut être codée soit sous forme matricielle (format bitmap) soit sous forme vectorielle. - A chacun des ces modes correspondent des familles distinctes de logiciels, e.g. Photoshop pour les images matricielles, ou Illustrator pour les images vectorielles. - Quelques logiciels peuvent travailler avec les deux modes (e.g. SuperPaint d Aldus), ou convertir une image bitmap en image vectorielle (e.g. Corel Trace) et inversement (e.g. Corel 7, opération de rastérisation).
4 Les images matricielles - Les images matricielles sont naturellement plus adaptées pour effectuer des opération de traitement d image (e.g. un rehaussement de contours, i.e. toute modification locale). - Une image matricielle ayant subit des dégradations minimes de ses données (mais pas de son en-tête) peut être plus facilement en partie récupérée. - Une image matricielle a une résolution fixe qui, suivant le périphérique utilisé, sera considérée comme optimale ou pas. Elle supporte mal les opérations de réduction ( effets d escaliers plus marqués) ou d agrandissement ( perte de définition) car celles-ci génèrent une perte d information.
5 Les images vectorielles - Les images vectorielles correspondent à une description géométrique sous forme de primitives élémentaires (carrés, rectangles, ellipses, cercles, courbes, etc.). A chaque primitive est associé un ensemble d attributs (couleur, épaisseur du trait, type de trait, etc.). - Les images vectorielles nécessitent moins d espace mémoire, les données sont codées suivant leur typologie symbolique. - Les images vectorielles se peuvent représenter des images complexes, de plus la décomposition en primitives élémentaires n est pas toujours aisée. - Une image vectorielle ayant subit la moindre dégradation de ses données (notamment de son en-tête) est souvent irréparable. - Des problèmes d incompatibilité entre formats existent, chaque logiciel (format) possède en effet ses propres primitives vectorielles.
Exemple: 6 Axe selon lequel la courbe va être modifiée / point de contrôle Les images vectorielles Point de contrôle de la courbe - Quelque soit la résolution du périphérique utilisé, une image vectorielle aura toujours la même apparence. - Les images vectorielles sont naturellement adaptées pour effectuer des opérations de re-dimensionnement ou des opérations géométriques (e.g. translation, rotation, etc.).
7 Exemples de formats d image 1. BMP 2. GIF 3. TIFF 4. JPEG 5. JPEG2000 6. PNG 7. EPS 8. PSD 9. Animation (succession rapide d images fixes): GIF animé, SVG (Scalable Vector Graphics, description interactive avec XML), Macromedia Flash,
8 1. BMP (BitMaP) R = 0 V = 0 B = 0 - Une image bitmap (ou image en mode point) est une représentation sous forme d'une matrice de bits. Le mode BMP est bien adapté pour coder des images complexes. - A chaque pixel de l'image correspond un groupe de bits du bitmaps. Il supporte un code de couleurs jusqu'à 24 bits par pixel (16.7 M). - Rappel: L opération de numérisation (digitalisation) d une image consiste à passer d une représentation continue à un nombre fini de points élémentaires codés sur un nombre fini de couleurs ( des problèmes de crénelage par exemple).
9 1. BMP (BitMaP) - Les images ne sont pas compressées. - Le format BMP est le format par défaut des logiciels sous Windows.
10 2. GIF (Graphics Interchange Format) C'est un format à l'origine adapté au transfert d'image sur le réseau Compuserve; il est très répandu pour sa facilité et sa rapidité de lecture. Ce format était à l origine uniquement compatible avec le monde IBM, puis a été étendu au monde MacinTosh. Ce format est sous brevet Unisys. Il s'agit donc d'un format «propriétaire», ce qui pose des problèmes de droits d utilisation sur Internet.
11 2. GIF (Graphics Interchange Format) Son faible volume est dû: d'une part à la compression systématique (LZW), d'autre part au codage de la couleur sur 8 bits/pixel. Ce format ne gère donc que 256 couleurs ou niveaux de gris, on parle alors de couleurs indexées. Le format GIF est assez bien adaptée aux images graphiques tels que les logos, qui ne nécessitent pas une palette de couleurs très étendue.
12 2. GIF - L'algorithme de compression permet une compression sans perte mais dont l'efficacité dépend de plusieurs facteurs: de l'existence de zones «homogènes», de l'orientation de l'image. - Une image avec des zones très homogènes permettra une compression importante alors qu'une image avec des zones hétérogènes permettra une compression beaucoup moins importante. Cf. http://www.w3.org/graphics/gif/spec-gif89a.txt
13 2. GIF Exemples : 1385 octets 3956 octets La lecture des données de l'image se fait en commençant par le pixel en haut et à gauche et se fait en ligne. Pour l'image de gauche, la couleur des pixels de la première ligne est homogène (donc facile à compresser), alors que pour celle de droite, la couleur des pixels de la première ligne varie grandement (plus difficile à compresser).
14 3. TIFF (Tagged Image File Format) - Ce format permet une représentation matricielle en vraies couleurs (16 millions en RGB, YCrCb, CMYK, CIELab). - Ce format support de nombreuses informations additionnelles sur les couleurs, utiles pour le calibrage couleur (e.g. correction gamma). Exemple : image originale image gamma corrigée
15 3. TIFF (Tagged Image File Format) - Format «propriétaire» mis au point par Aldus corporation. - Attention il existe de nombreuses versions de ce format d'images, toutes ne sont pas nécessairement compatibles. - Ce format d'images peut être avec (compression LZW, JPEG, ) ou sans compression (Brut). De plus, il existe différents modes de compressions (sans perte) possibles que l'on peut choisir (ou pas) lors de l'enregistrement du fichier.
16 3. TIFF (Tagged Image File Format) - Toutes ces possibilités expliquent la multitude des formats TIFF que l'on peut rencontrer et qui est à l'origine de problèmes de compatibilités entre logiciels. - Tout usage, sauf Internet car trop volumineux, de plus aucun navigateur Web ne le lit directement. Cf. ftp://ftp.sgi.com/graphics/tiff/tiff6.ps
17 4. JPEG (Joint Photographic Expert Group) - Le format JPEG a été mis au point pour répondre au besoin de compression pour les images photographiques de haute qualité. - Le format JPEG est un des formats les plus utilisés sur Internet. - Ce format permet une représentation en vraies couleurs (16 millions). - Une image JPEG visualisée avec 256 couleurs sera de moins bonne qualité qu une image GIF.
18 4. JPEG (Joint Photographic Expert Group) - La compression JPEG est une méthode de compression dite avec perte : elle assure un stockage plus économique (gain d espace disque, temps de compression/décompression faible) des données basé sur la suppression des données "récurrentes" dans le fichier image. - La compression des images au format JPEG supprime certaines informations qui ne peuvent être récupérées au moment de la décompression. La qualité de l'image peut donc être altérée. Cf. http://www.jpeg.org/
19 4. JPEG - La compression des images au format JPEG est ajustable. Plus la compression est élevée (et donc plus le fichier est petit), plus la qualité de l'image baisse. Qualité de l'image et ratio de compression sont donc inversement proportionnel. - L'utilisateur peut faire varier le taux de compression de 1% (qualité la meilleure) à 99% (qualité la moins bonne). Exemple: Compression minimale 1% Compression maximale 99% (taille 1559 octets) (taille 371 octets) Modifications invisibles à l'œil. Modifications visibles à l'oeil
20 4. JPEG - Attention, une compression de 10% ne signifie pas une perte de 10% des informations (la perte n'est pas linéaire, et dépend des données de chaque image). - Ce format est libre de droits. Ce format à fait l objet d une norme ISO. Attention, l'échelle de compression n'est pas forcément la même selon les logiciels. Selon le logiciel utilisé, les taux de compression sont très difficilement comparables. - Attention, il n'est pas possible d'utiliser le format JPEG sans perte de données (même avec le taux de compression le plus faible). - Le format JPEG2000 est en cours de remplacer le format JPEG, JPEG2000 utilise un mode de compression différent qui permet notamment de stocker plusieurs résolutions d'une même image dans un même fichier.
21 5. JPEG2000 - Le format JPEG 2000 permet de dégrader les régions les moins stratégiques de l'image tout en gardant intact certaines zones présélectionnées. - Le format JPEG 2000 est basé sur la décomposition multi-échelle en ondelettes qui permet une compression plus importante tout en préservant la qualité de l'image (la perte de qualité est imperceptible à l'oeil nu). Le seul point faible de la compression en ondelettes est le téléchargement obligatoire d'un plug-in.
22 5. JPEG2000 - Le format JPEG 2000 permet d'incorporer des méta-données (un dossier est associé à l'image contenant des informations relatives à la sécurité, à l'auteur...). - Le coût de la licence risque de freiner sa diffusion. Seuls de nouveaux navigateurs pourront lire des fichiers JPEG2000. Cf. http://www.jpeg.org/jpeg2000/index.html
23 6. PNG (Portable Network Graphics) - Ce format est l'émanation de recommandations du consortium W3 (1996), il est donc recommandé de l'utiliser, il n est cependant pas reconnu par les navigateurs d'ancienne génération. - Le format PNG étant très récent, son principal inconvénient est d'être inconnu de la plupart des logiciels. - Ce format est libre de droits. Il a été conçu pour remplacer GIF, Unisys ayant imposé en 1994 des royalties sur la compression LZW (ce qui ne sera plus en 2006). Cf. http://www.w3.org/graphics et http://www.libpng.org/pub/png/
24 6. PNG (Portable Network Graphics) - La compression (Gzip) est sans perte, réputée pour sa qualité mais pas pour son efficacité (taille mémoire trop importante). - 3 types d'images sont possibles: vraies couleurs, niveaux de gris et 8 bits basée sur l'utilisation d'une palette.
25 7. EPS (Encapsulated PostScipt) - Ce format utilise le langage postscript qui est un langage de description de page (textes, images, etc.). - Chaque fichier EPS vectoriel contient une représentation matricielle en basse résolution (TIFF ou PICT) et peut ainsi être visualisé. - Tout fichier EPS vectoriel est verrouillé (ne peut donc être modifié), seul un document Illustrator exporté en EPS vectoriel peut être ré-ouvert dans ce même logiciel et être modifié. - Adobe Photoshop peut modifier le contenu d un fichier EPS vectoriel mais il le transforme au préalable en EPS matriciel. - Il peut coder la couleur sur 8, 16, 24 ou 32 bits. Ce format est capable de gérer le noir et blanc, le RVB, et le CMJN.
26 8. PSD - C'est un format natif au logiciel Adobe Photoshop mais, vu la grande diffusion des produits Adobe dans le domaine de l'image, le PSD est reconnu par plusieurs logiciels de traitement d'image. - C'est surtout un format de travail, car il permet de conserver les calques, les masques et les couches de transparence. - Il peut coder la couleur sur 8, 16, 24 ou 32 bits. Ce format est capable de gérer le noir et blanc, le RVB, et le CMJN.
27 Synthèse Format Bitmap /vectoriel Compression des données Nombre de couleurs supportées BMP Bitmap Non 16 millions GIF Bitmap Oui (sans perte) 256 (palette) TIFF Bitmap Oui (sans perte) ou non (au choix) 16 millions JPG / JPEG2000 Bitmap Oui, réglable (avec perte) 16 millions / Oui, sans perte PNG Bitmap Oui (sans perte) De 256 (palette) jusqu'à 16 millions (et +) EPS Vectoriel Non De 256 (palette) jusqu'à 16 millions (et +) PSD Bitmap Non De 256 (palette) jusqu'à 16 millions (et +)
28 Le choix d un format. Ce choix influe: sur la capacité de stockage, selon le degré de compression des données, sur les logiciels qui vont permettre de visualiser l'image (selon qu'il s'agit d'un format propriétaire ou libre), sur l'usage de l'image selon les caractéristiques et les performances propres à ce format (possibilité d'affichage progressif, de transparence continue, etc.), sur la qualité.
29 GIF - Graphics Interchange Format PNG - Portable Network Graphics TIFF Tagged Image File Format JFIF(JPEG) File Interchange Format RAW Type de format Format propriétaire Recommandation du consortium W3C Format propriétaire Norme (Joint Photographic Experts Group) Format propriétaire Quantification Sur 8 bits, soit 256 couleurs Sur 8 ou 24 bits Sur 24 bits, soit 16 M de couleurs Sur 24 bits, soit 16 M de couleurs Compression Sans perte Sans perte Pas de compression, ou compression sans perte Avec perte : - prise en compte de la perception visuelle - compression par transformée en cosinus discrète - qualité réglable Caractéristiques - Affichage progressif - Possibilité de transparence sur une couleur - Possibilité d'animation - Affichage progressif - Possibilité de transparence continue (canal alpha) - Affichage progressif - Format JPEG 2000 - Meilleure utilisation de la capacité des cartes mémoires - Meilleure dynamique (12 bits) - Pas exploitable (visible) nécessité d un post-traitement Utilisation Très utilisé sur le web pour les graphismes Très utilisé, mais de très nombreuses variantes
30 Le choix d un format. Le format soulève également le problème de la pérennité des fichiers numériques : les logiciels de lecture évoluent, de nouveaux formats apparaissent ; chaque migration d'un fichier numérique vers un nouveau format risque d'altérer ce fichier, de plus comment lire le fichier original si le lecteur ou le logiciel n'existe plus?
Les métadonnées 31 A une image on peut associer des métadonnées utiles au posttraitement du document : Les métadonnées EXIF sont des données techniques relatives à la prise de vue et fournies automatiquement par un appareil photo par exemple. Les métadonnées IPTC (International Press and Telecommu-nications Council) ont trait à la sémantique de l'image : tels que la légende, les mots clés, les catégories, les crédits, l'origine (date, lieu), le copyright, une URL, etc.
Les métadonnées 32 Les informations IPTC (saisies manuellement puis encapsulée dans le format) sont indispensables au traitement documentaire et à la diffusion de photos notamment. Pour faciliter le traitement documentaire des images, il est impératif de demander à l'auteur de remplir systématiquement le formulaire IPTC. Afin d'éviter les problèmes d'interprétation des couleurs selon les différents périphériques, il faut exiger de recevoir les images avec un profil intégré.
Les métadonnées 33 D'autres métadonnées imperceptibles à l'œil ayant trait au tatouage (watermarking) sont également utiles. Elles résistent aux divers traitements et aux attaques. Elles donnent des informations sur les titulaires des droits de l'image et sur les droits de reproduction, ainsi que des informations personnalisées sur chaque copie.
34 Toute intervention sur l image (e.g. amélioration de contraste, balance des couleurs, etc.) soulève un problème : doit-on non uniquement enregistrer la nouvelle image créée? ou non seulement enregistrer le fichier original mais également recenser toutes les opérations intermédiaires effectuées? dans ce cas, quel est le statut des deux fichiers? quel est l'original?