BTS INFORMATIQUE DE GESTION BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 1 / 13 Lycée Jean Rostand CHANTILLY Cardoni Jean-Marie 3 Architecture matérielle des systèmes informatiques (1 ère année) La représentation des données Conditions de réalisation En classe Seul Groupe Contenus du référentiel S11 Technologies des composants o Connaissance sur les systèmes de numérotation et de codification de l information. Points forts 1 La représentation des caractères - Le code ASCII - Le code ANSI - Le code EBCDIC - Le code UNICODE 2 La représentation des informations "multimédia" La représentation du son La représentation des images fixes La compression des données Complément TP n 3
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 2 / 13 INTRODUCTION Les informations que doivent traiter les ordinateurs sont composées de nombres, de lettres, de chiffres ou de symboles particuliers. L information à traiter doit être utilisable par la machine. Pour cela, il faut coder ces informations afin, qu assimilables par l homme elles le deviennent par la machine. Remarques : Conséquence
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 3 / 13 A/ La représentation des caractères Le code ASCII (American Standard Code of Information Interchange) Le code ASCII est à. Ce code comprend : - les chiffres, - les majuscules, - les minuscules, - quelques symboles usuels en informatique ($,@,*,..), - des fonctions de commandes (tabulations, Retour chariot, sonnette..), - des symboles de ponctuations (!,",},...). 0 1 2 3 4 5 6 7 0 NUL DLE SP 0 @ P ` p 1 SOH DC1 1 A Q a q 2 STX DC2 2 B R b r 3 ETX DC3 # 3 C S c s 4 EOT DC4 $ 4 D T d t 5 ENQ NAK % 5 E U e u 6 ACK SYN & 6 F V f v 7 BEL ETB 7 G W g w 8 BS CAN ( 8 H X h x 9 HT EM ) 9 I Y i y A LF SUB * : J Z j z B VT ESC + ; K [ k { C FF FS, < L \ l! D CR GS - = M ] m } E SO RS. > N n ~ F SI US /? O - o DEL NUL Absence de caractère, blanc, espace SOH Début en-tête STX Début du texte ETX fin du Texte EOT fin de Transmission ENQ Demande ACK Accusé réception BEL Sonnette BS Marche arrière 1 caractère HT Horizontale Tabulation LF Retour à la nouvelle ligne VT Tabulation verticale FF Passage page suivante CR Retour chariot SO Caractère suivant non std SI Retour au caractères std DLE Change les caractères suivants. NAK Réponse négative SYN Caractère de synchro. ETB Fin de transmission de bloc CAN Annulation de la donnée précédente SUB Substitution ESC Escape caractère de ctrl d extension FS Séparateur de fichiers GS Séparateur de groupes RS Séparateur d enregistrements US Séparateur unitaire SP Barre espace DEL Suppression DC1 à DC4 : Caractères de commandes Lecture d un nombre Pour coder par exemple la lettre A en ASCII il faut rechercher l intersection de la colonne et de la ligne en hexadécimal. On trouve alors en hexadécimal (on peut également écrire.).
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 4 / 13 Remarques : Certains constructeurs, dont IBM suivis par tous les fabricants de compatibles, ont enrichi cette table ASCII en utilisant un 8ème bit, ce qui double le nombre de caractères représentables (256). Les caractères supplémentaires sont essentiellement : - les caractères accentués utilisés dans la langue française notamment, - un jeu de caractères utilisés dans quelques langues (,,...), - quelques symboles mathématiques (,), - caractères semi-graphiques qui permettent de réaliser des petits dessins géométriques (cadres, soulignés, etc..). Le code ASCII 8 bits existe en 2 variantes : le jeu de caractères IBM PC (c est le jeu de caractères standard du DOS) et le jeu de caractères ISO-ANSI (jeu de caractères international utilisé dans Windows). Ces deux jeux diffèrent notamment au niveau des caractères nationaux accentués et des caractères semi-graphiques. Le code ANSI (American National Standard Institute) utilisé par Windows Les logiciels sous Windows utilisent la norme ANSI, qui reprend en grande partie le code ASCII, et propose des extensions différentes selon le «code de page» retenu. Ainsi, le code page 850 est très employé en France, alors que le code page 864 définit un jeu de caractères «arabe». L utilisation du code ANSI se fait de la même manière que pour un code ASCII (intersections colonne-ligne).
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 5 / 13 Le code EBCDIC (Extended Binary Coded Decimal Interchange Code)
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 6 / 13 L Unicode (UNIversal CODE) Compte-tenu de l extension mondiale de l informatique et de la diversité de plus en plus importante des caractères à stocker, les organismes de normalisation ISO travaillent depuis 1988 à la création d un code universel (UNIversal CODE). Il se représente sous 2 formes : o Une forme 31 bits (UCS-4) pour Universal Charactere Set. o Une forme 16 bits (UCS-2) ce qui permet de représenter théoriquement 65 535 caractères différents. o Ces caractères couvrent la majeure partie des principaux langages écrits du monde.
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 7 / 13 B/ La représentation des informations multmédia Représentation du son Un son est un signal. (c est-à-dire le signal peut prendre une infinité de valeur au cours du temps). Temps Pour pouvoir stocker un son sur un ordinateur (forme numérique) on va mesurer à intervalle régulier la valeur de l amplitude du signal analogique (échantillonnage). La courbe va être remplacée par des segments de droites, l infinité de valeurs possibles va être remplacée par un ensemble de niveaux. 40 30 20 10 0-10 -20 Remarques : 11 10 9 8 7 6 5 4 3 2-1 01-2 -3-4 -5-6 -7-8 -9 Pour un CD audio, la fréquence d échantillonnage est de 44 Khz, c est-à-dire qu une seconde de musique est représentée par 44 100 valeurs différentes par seconde. Chaque prise sera ramenée à un entier codé sur un octet.
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 8 / 13 Exemple : pour une séquence de 20 secondes avec un son à 44 Khz cela nous donne : 1 seconde = octets 20 secondes = Représentation par des images fixes Toute image affichée sur un écran ou sur une imprimante est constituée de pixels (abréviation de Picture Element). Il existe 2 grands modes de stockage des images :. BITMAP Chaque point de l image est mémorisé. L image devra être utilisée dans la dimension dans laquelle elle a été créée, sinon un effet d escalier sera inévitable. Remarques : Une image occupe beaucoup de place en mémoire. 1 octet = 3 octets = Pour une image 640 x 480 avec 16,7 millions de couleurs cela donne une image qui va nécessiter : Cette taille passera à plus de 2 Mo pour une image 1024 x 768
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 9 / 13 VECTORIEL Application : Sachant que nous voulons stocker dans une base de données des séquences vidéo sonores, l administrateur de la base de données nous demande de faire une étude qui devra nous permettre de choisir une solution matérielle en terme de supports de stockage. Ces séquences vidéos auront une durée moyenne de 15 secondes et concerneront 1 500 n- uplets. Nous disposons des informations suivantes : Carte d acquisition vidéo Image 640 * 480 en 256 couleurs 25 images / seconde Taux de compression 1 pour 20 (20 octets occupent 1 octet après compression) Carte sonore Echantillonnage du son 44 Khz qualité 8 bits mono Déterminez l espace disque nécessaire pour stocker ce complément de données (images animées et son). Vous exprimerez vos résultats dans des unités de mesure cohérentes en prenant soin de détailler vos calculs. Partie Vidéo Partie audio
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 10 / 13 La compression des données Les problèmes de stockage du son, de l image ou plus généralement des fichiers binaires posent des problèmes de place mémoire pour le stockage ou la transmission. Il en existe 2 grandes catégories : La compression avec perte d informations : Image et son peuvent se passer d une restitution parfaite car de toute façon l œil ne perçoit pas toutes les nuances, l oreille n entend pas toutes les fréquences. Les taux de compression peuvent atteindre 100 pour 1. Les formats s appelle par exemple JPEG (Joint Photographic Expert Group) pour les images fixes, MPEG (Moving Picture Expert Group) pour la vidéo. La compression sans perte d informations : Un fichier correspondant à un exécutable ou à un texte ne peut se permettre la moindre altération. Les logiciels de compression s appellent ARJ, RAR ou PKZIP. Le principe de la compression sans perte est de repérer les séquences répétitives (suite de valeurs identiques très fréquentes dans les images bitmap par exemple). Il existe différentes techniques (notamment celle de Huffman).
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 11 / 13 LA METHODE D HUFFMAN On va codifier chaque caractère non pas avec un octet (8 bits), mais avec un nombre de bits variable. Les caractères les plus fréquents bénéficieront d un codage avec peu de bits, alors que les moins fréquents seront codés avec beaucoup de bits. Ce codage doit être bijectif, si l on veut pouvoir, après décompression récupérer le contenu du fichier original. Exemple Considérons un texte dont le nombre d apparition des différents caractères a été calculé. Le codage d une lettre se fait par défaut actuellement sur 1 octet Caractère Fréquence E 430 A 392 S 387 M 135 O 122 L 85 T 53 Taille normale du fichier = A partir de ce tableau on va générer d autres tableaux puis on fabriquera un arbre binaire qui donnera enfin le code de chaque caractère.
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 12 / 13
BTS Informatique de Gestion AMSI 1 ère année Chapitre 3 Page 13 / 13 Application 1 Le vidage d un fichier fait apparaître les informations suivantes en ASCII. Procéder à leur conversion en clair 4C 65 20 42 54 53 20 65 73 74 20 75 6E 65 20 22 65 78 63 65 6C 6C 65 6E 74 65 22 20 46 6F 72 6D 61 74 69 6F 6E 2E Application 2 Coder le texte suivant en utilisant le code ASCII sous sa forme hexadécimale : BTS IG de Rostand Application 3 Le vidage d un fichier fait apparaître les informations suivantes en EBCDIC E5 89 84 81 87 85 40 C6 C9 C3 C8 C9 C5 D9 40 F1 F9 F8 F7 40 85 95 40 C5 C2 C3 C4 C9 C3 40 5B 7A C5 E7 D6 7A 5B Application 4 Coder le texte suivant en utilisant le code EBCDIC sous sa forme hexadécimale : BTS IG Application 5 Elaborer l arbre binaire de compression à partir de la fréquence de caractères suivante: Le codage d une lettre se fait par défaut sur 8 bits (1 octet) E 300 A 280 L 150 M 30 P 28 F 5 Une fois l arbre réalisé compléter le tableau ci-dessous E 300 A 280 L 150 M 30 P 28 F 5 Lettre Fréquence Code Longueur Quelle est l économie réalisée?