Plan : - Codage hexadécimal - Encodage du texte - Quelques mots sur la saisie au clavier. Système hexadécimal

Documents pareils
Codage d information. Codage d information : -Définition-

Jeux de caracte res et encodage (par Michel Michaud 2014)

TP Codage numérique des caractères. Un ordinateur ne manipule que des 0 et des 1 : Comment alors code-t-il du texte?

1 Introduction au codage

Le codage informatique

USTL - Licence ST-A 1ère année Codage de l information TP 1 :

Une version javascript sera disponible directement dans le cours prochainement.

Partie 1. Professeur : Haouati Abdelali. CPGE Lycée Omar Ibn Lkhattab - Meknès haouaticpge@gmail.com

Informatique Générale

Algorithme. Table des matières

Conversion d un entier. Méthode par soustraction

Support pour les langues s écrivant de droite à gauche

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Avant-propos. Omniprésence d Unicode. À qui s adresse ce livre?

Cours Informatique 1. Monsieur SADOUNI Salheddine

Logiciel de Base. I. Représentation des nombres

TP 1 : 1 Calculs en binaire, octal et hexadécimal

CHRONIQUE de la société royale LE VIEUX-LIÈGE

Introduction à l algorithmique et à la programmation (Info 2)

Programmation C. Apprendre à développer des programmes simples dans le langage C

nom : Collège Ste Clotilde

Les opérations binaires

Représentation d un entier en base b

Structure du format BMP, sa lecture, sa construction et son écriture

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS =

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Activité 1. Compter les points Écriture binaire des nombres. Résumé. Liens pédagogiques. Compétences. Âge. Matériel

I- Définitions des signaux.

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

Informatique : Création de site Web Master 2 ANI TP 1

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

GPA770 Microélectronique appliquée Exercices série A

Info0101 Intro. à l'algorithmique et à la programmation. Cours 3. Le langage Java


Licence Sciences et Technologies Examen janvier 2010

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

Skype (v2.5) Protocol Data Structures (French) Author : Ouanilo MEDEGAN

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits

Informatique. Les réponses doivent être données en cochant les cases sur la dernière feuille du sujet, intitulée feuille de réponse

Traitement numérique de l'image. Raphaël Isdant

Le chiffre est le signe, le nombre est la valeur.

Projet d informatique M1BI : Compression et décompression de texte. 1 Généralités sur la compression/décompression de texte

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007


Architecture des ordinateurs Introduction à l informatique

Chapitre 10 Arithmétique réelle

CODAGE DES SMS. 2 Commandes «AT» 25 3 Matériels utilisés 55 4 Interfacer un téléphone GSM 73 5 Réalisations électroniques 101

TD : Codage des images

Enregistreur sans papier avec écran TFT et carte Compact Flash. B Description des interfaces 07.07/

INFO 2 : Traitement des images

Déclaration des postes SIP 67xxi

Le poids et la taille des fichiers

Documentation SecurBdF

DU BINAIRE AU MICROPROCESSEUR - D ANGELIS CIRCUITS CONFIGURABLES NOTION DE PROGRAMMATION

Représentation des Nombres

Audit SEO. I / Les Tranquilles d Oléron

Chap17 - CORRECTİON DES EXERCİCES

Formats d images. 1 Introduction

Les conseils et les procédures pour utiliser divers programmes francophones avec de l'hébreu

Enregistreur sans papier. Interface LON. B Description des interfaces 10.99/

Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté

L'essentiel de XML. Cours XML. Olivier Carton

LA SECURITE DES CARTES A BANDE MAGNETIQUE

Bases de programmation. Cours 5. Structurer les données

PROJET ALGORITHMIQUE ET PROGRAMMATION II

Cours 1 : Introduction Ordinateurs - Langages de haut niveau - Application

UFR de Mathématiques et Informatique Année 2009/2010. Réseaux Locaux TP 04 : ICMP, ARP, IP

ANALYSE TRAMEs LIAISON SERIE

AMICUS 18 (2ème partie) 4) Présentation du logiciel Amicus IDE

La mémoire. Un ordinateur. L'octet. Le bit

Le format OpenPGP. Traduit par : Sébastien Person. personseb@yahoo.fr. Matthieu Hautreux. matthieu.hautreux@insa-rouen.fr.

HMTL. Exemple de fichier HTML. Structure d un document HTML. Exemple de fichier HTML. Balises HTML. IFT1147 Programmation Serveur Web avec PHP

Certificat Informatique et internet Niveau 1 TD D1. Domaine 1 : Travailler dans un environnement numérique évolutif. 1. Généralités : Filière

Réf. : Normes : ST.10/C page : NORME ST.10/C PRÉSENTATION DES ÉLÉMENTS DE DONNÉES BIBLIOGRAPHIQUES. Note du Bureau international

Recharger la carte de votre compteur à budget

TIC. Tout d abord. Objectifs. L information et l ordinateur. TC IUT Montpellier

Gestion de gros fichiers binaires (images) en APL*PLUS III

Chapitre 1 I:\ Soyez courageux!

V- Manipulations de nombres en binaire

Adobe Premiere Pro Exportation

Cours d Informatique

Rappels Entrées -Sorties

FORMATS DE FICHIERS. Quels sont les différents types d informations numériques dans un document multimédia?

Projet Matlab : un logiciel de cryptage

Installer Joomla Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring

Concevoir son microprocesseur

ET LO GICIEL D UN S YS T EME IN FORMATIQUE

Rapports d activités et financiers par Internet. Manuel Utilisateur

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Introduction 2 Environnement de travail... 2 Rappels : les Fichiers «texte»... 2 Les Fichiers «binaire»... 2 Les métadonnées... 3

Localisation. Cours 1 Généralités. E. Planas, UCO

Fonctions de deux variables. Mai 2011

Microprocesseur + Logiciel

WORLD LIBRARY AND INFORMATION CONGRESS: 75TH IFLA GENERAL CONFERENCE AND COUNCIL

Conventions d écriture et outils de mise au point

Architecture de l ordinateur

Introduction à NetCDF

Initiation au binaire

Plan du cours. Historique du langage Nouveautés de Java 7

Transcription:

Info 1, Cours 2 Plan : - Codage hexadécimal - Encodage du texte - Quelques mots sur la saisie au clavier Bibliographie : www.wikipedia.org Système hexadécimal Codage naturel de nombres : binaire (naturel, car compris par l électronique) Décimal Binaire Décimal Binaire 0 0 8 1000 1 1 9 1001 2 10 10 1010 3 11 11 1011 4 100 12 1100 5 101 13 1101 6 110 14 1110 7 111 15 1111

Système hexadécimal Codage naturel de nombres : binaire (naturel, car compris par l électronique) Décimal Binaire Hexadéci mal Décimal Binaire Hexadéci mal 0 0 0 8 1000 8 1 1 1 9 1001 9 2 10 2 10 1010 A 3 11 3 11 1011 B 4 100 4 12 1100 C 5 101 5 13 1101 D 6 110 6 14 1110 E 7 111 7 15 1111 F Système hexadécimal Très pratique pour écrire les codes informatiques : 1 octet = 8 bits. Les deux fois 4 bits sont codés par deux chiffres héxadécimaux Ex. : 1111 0000 b = 0xF0 1101 0011 b = 0xD3 1010 1001 b =?? = 0xA8 C est quoi LSB et MSB?

Encodage de caractères (character encoding) Objectif : traduire les symboles graphique vers la représentation binaire Exemple : a=0000, b=0001, c=0010, etc En réalité, il y a plus de caractères que ceux d alphabet (a-z et A-Z). Ponctuation!,; mathématiques +-*/=, typographie, commerciaux $ ASCII table : Le premier jeu de caractères standard Chaque caractère est codé sur 7 bits Seulement les caractères latins de base Englais : OK, français : KO, langues à alfabet cyrillic (serbe/russe/bulgare...) : une catastrophe chinois : n y pensons même pas...

ASCII table : 128 symboles Table ASCII étendu On stoque un code ASCII dans un octet mais dans un octet on peut stoquer 256 codes différents! Donc, on élargie la table ASCII à 256. Les premier 128 codes sont ceux de ASCII de base 0x00-0x7F Les autres : les caractères manquants, 0x80-0xFF

ASCII élargie : Latin-1 ASCII élargie : Cyrillic

Mais que faire si l on souhaite mélanger dans un même document : du russe, du français, et, pour finir, du chinois? Il faut changer le système Solution : séparer les taches - Identifier tous les symboles existants, possibles et imaginables - avec les variantes calligraphiques etc, linguistiques, typographiques, musicaux - Attribuer un numéro à chaque symbole - Prévoir de la réserve pour des symboles qui ne sont pas encore connus (des langues que l on n a pas encore découvertes ou à écriture pas encore inventée ) - Faire de cette table (base de donnée) un standard - Laisser les applications gérer l encodage au niveau «!ordinateur!»

Unicode : standard industriel Unicode est une norme informatique, développée par le Consortium Unicode, qui vise à donner à tout caractère de n'importe quel système d"écriture de langue un nom et un identifiant numérique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel. Cette base de donnée s appelle «!Universal Character Set!» et contient près d un million de caractères avec, pour chacun, un code et une description. Ex. : pour la symbole æ, U+0x00E6, «!latin small letter AE!» Plans UNICODE La table Unicode peut être divisé en 17 parties (plans), chacune contenant 65 536 codes (code points). En pratique peu de parties sont utilisées Plan 0 (0000 FFFF): Basic Multilingual Plane (BMP). Ce plan contient la plupart des caractères «!connu!» et «!largement utilisés!». Le but de la BMP est de permettre une unification des caractères et jeux de caractères futurs et les jeux de caractères pour les systèmes d"écruture utilisés actuellement. Plane 1 (10000 1FFFF): Supplementary Multilingual Plane (SMP). Plane 2 (20000 2FFFF): Supplementary Ideographic Plane (SIP) Planes 3 to 13 (30000 DFFFF) non attribués Plane 14 (E0000 EFFFF): Supplementary Special-purpose Plane (SSP) Plane 15 (F0000 FFFFF) reserved for the Private Use Area (PUA) Plane 16 (100000 10FFFF), reserved for the Private Use Area (PUA) How many unassigned codes contain the planes 3 to 13?

Basic Multilingual Plane Unicode est une base de données de caractères - un répertoire Il répertorie (numérote) 17!!2 16 ~ 1 million (1,114,112) symboles. Quid du codage niveau ordinateur? Première possibilité (naturelle) : chaque symbole est codé par son numéro unicode. Mauvaise solution : il faut prévoir une possibilité pour coder 17!!2 16 caractères Combien il faut de bits? (on calcule )

Unicode est une base de données de caractères - un répertoire Il répertorie (numérote) 17!!2 16 ~ 1 million (1,114,112) symboles. Quid du codage binaire? En réalité : La plupart de fichiers texte français utilisent les caractères latines simples codées en ASCII (0-127) sur 7 bits. D autres, utilisent les caractères cyrilliques et diacritiques appartenant à la BMP : entre 128 et 2 16 (codé sur 16 bits). Le reste, c est anecdotique Unicode est une base de données de caractères - un répertoire Il répertorie (numérote) 17!!2 16 ~ 1 million (1,114,112) symboles. Quid du codage binaire? Deuxième possibilité : on introduit un codage qui s adapte au contexte : encodage à longueur variable. On découpe notre plan UNICODE en quatres zones (codage UTF-8)

Codage UTF-8 : principe Chaque caractère est codé avec entre 1 et 4 octets. 1. Un octet est nécessaire pour coder un caractère ASCII (0 à 128, ou 0 à 0x7F ) 2. Deux octets sont nécessaire pour encoder les caractères latins avec des diacritiques et les caractères appartenant aux alphabets Grèque, Cyrillique, Armenien, Hebreux, Arabe, Syrien et Thaana (numéros Unicode 0080 à 07FF). 3. Trois octets sont nécessaire pour encoder le reste de la BMP (Basic Multilinguial Plane) 4. Quatre pour les autres caractères Unicode, qui sont rarement utilisés. Mécanisme de transcription des codes Unicode en codes binaire En résumé, le codes les plus courts sont utilisés pour stoquer les caractères les plus «!fréquents!» (latin - occidentaux!)

Numéros Unicode des 256 premiers caractères : ACSII et Latin 1 Numéros Unicode des caractères cyrillique : N en haut + N à gauche

Petite exercice: on encodera en Unicode le mot bé! b : ASCII standard, donc, b= U+0x62=U+ 0110 0010 b é : ASCII élargi, latin 1 : é= U+0xE9=U+ 1110 1001 b! : Cyrillic, donc,!= U+0x0444=U+0000 0100 0100 0100 b b est codé par 1 octet, tel quel : 0110 0010 b é est codé sur deux octets : 110x xxxx 10xx xxxx, à la place des 11 x on doit mettre les 11 bits du numéro Unicode de é: 000 1110 1001 On obtient pour é : 1100 0011 1010 1001 b =0x C3A9! est codé sur deux octets : 110x xxxx 10xx xxxx, à la place des 11 x on doit mettre les 11 bits du numéro Unicode de! : 100 0100 0100 b On obtient pour!: 1101 0001 1000 0100 b = 0xD184 Bien saisir sur le clavier (AZERTY) : chaque doigt reste dans sa zone 5 4 3 2 2 3 4 5 Dactylographie : très important!!! Deux principes : 1) La position du repos des doigts (qsdf et jklm), les pouces sur «!Espace!», les indexes sur f et j (les touches balisées) 2 ) Chaque doigt a une «!zone d influence!», et après chaque mouvement retrouve la position du repos

Position de repos des doigts