INF Z10 - Cours Théorique n 8 TRAITEMENT ELECTRONIQUE DES TEXTES 1 Bref historique de l'écrit L'écriture peut se définir comme la représentation de la pensée par des signes graphiques conventionnels. C'est un moyen de sauvegarde et de communication des connaissances. Autant la mémoire ne dure que la vie d'un être humain, autant l'écrit lui survit. Les écrits pouvant être enregistrés sur un support et reproduits ou communiqués, ils sont un des vecteurs principaux de l'information. La persistance du savoir dépend alors de la solidité du support auquel il est confié. Le matériau a énormément évolué avec les civilisations (depuis la pierre brute jusqu'aux supports numériques). Les moyens efficaces de reproduire et de multiplier les écrits ont été inventés très tard (il y a 500 ans seulement), tandis que l'homme écrit depuis 8 fois plus longtemps... En effet, Gutenberg met au point son procédé (des caractères mobiles fondus en alliage) vers 1440. Il cherche alors à concurrencer l'écriture manuscrite gothique. En 1455, il termine l impression d une Bible en latin qu'il fait enluminer. Le premier livre imprimé en français (1470), sur les presses de la Sorbonne, est le Recueil des histoires de Troyes, de Raoul Le Fèvre. La dynastie d'imprimeurs et éditeurs humanistes Estienne, édite le premier dictionnaire latin-français en 1539. La mécanique et l'électricité permettent en 1900 de construire des presses certes imposantes mais à très gros tirage si nécessaire. En 1904, un imprimeur américain nommé Ira Rubel découvre l'offset. Ce procédé en double décalque connaît un gros succès car il est plus économique que les presses métalliques. De plus, il peut imprimer sur des supports variés. Ce procédé est encore utilisé sous une forme modernisée. En 1946 apparaît la première génération des systèmes de photocomposition. Une matrice permet d'insérer par le côté des négatifs de lettres pour composer les lignes. Un papier photosensible est placé derrière et le tout et exposé à la lumière. Mais il faut attendre l'électronique pour obtenir des procédés plus performants. En 1954, une machine baptisée Photon 2000 est commercialisée. Elle s'inspire du principe de l'offset pour préparer la page que l'on va mettre sous presse (système de seconde génération). Très tôt, l'ordinateur a su apporter son aide à l'imprimerie. Il a offert son concours dans la saisie des textes, dans la typographie et dans le contrôle des processus d'impression. L'intégration de l'image au texte mis en page, les calculs d'index et de tables des matières (tâches particulièrement pénibles à l'homme) parachèvent cette évolution. INF Z10 - Cours 8 page 1 CILSH - 2002/2003
L'ensemble ordinateur + imprimante remplace progressivement la machine à écrire. C'est alors un programme chargé en mémoire qui lui donne les fonctions de traitement de textes. Au-delà du texte, d'autres programmes offrent, sur la même machine, la réalisation de calculs complexes et en série, la gestion de bases de données, et enfin, l'échange des informations entre ces diverses applications. On est déjà loin de la machine à écrire, et l'ordinateur n'est plus un outil de substitution amélioré, mais un nouvel outil de travail. Entre la pierre et l'ordinateur, entre le messager et les réseaux numériques, il s'est écoulé 4000 ans seulement. Représentation électronique d'un texte La frappe de la touche "A" du clavier déclenche des processus assez complexes qui vont provoquer un affichage de ce caractère "A" à l'écran. Or l'ordinateur ne sait pas ce qu'est un "A". Lorsque l'on tape sur la touche "A" du clavier un signal est envoyé à un circuit spécialisé de l'unité centrale indiquant quelle touche a été enfoncée. Ce signal est seulement interprété comme correspondant à l'un des caractères d'une table (ici le caractère de numéro 65). 128 64 32 16 8 4 2 1 0 1 0 0 0 0 0 1 L'affichage ne peut se produire que par la définition en points lumineux (pixels) de ce caractère sur l'écran. En simplifiant à l extrême considérons qu un caractère est défini dans une matrice de 8x14 pixels. Le caractère «A» est ainsi déterminé par la suite de nombres : (0, 0, 66, 66, 66, 126, 66, 66, 66, 36, 24, 0, 0, 0) Un autre circuit spécialisé envoie alors l'ordre d'allumer sur l'écran les pixels ainsi définis qui formeront un symbole connu pour être la lettre "A". Dans le même temps la mémoire centrale conserve la trace électronique de ce caractère "A". En effet, lorsqu'on frappe un texte au clavier, une représentation électronique de ce texte est construite en mémoire vive. INF Z10 - Cours 8 page 2 CILSH - 2002/2003
Si l'utilisateur demande de mettre un mot en caractères "gras", cette instruction est traitée par le microprocesseur qui donnera un ordre de modification de la représentation en mémoire vive et un ordre au périphérique de sortie (écran) pour obtenir l'aspect visuel de cette modification. Le caractère «A» en gras sera alors déterminé par la suite de nombres : (0, 0, 102, 102, 102, 126, 126, 102, 102, 126, 60, 24, 0, 0) Il n'est certes pas nécessaire de connaître tout cela pour taper un texte correctement mais il n'est pas inutile d'en avoir une idée. En effet : savoir qu'un "retour à la ligne" ou une "tabulation" correspond à un caractère tapé au clavier par action de la touche " Entrée " ou de la touche "Tab" sera enregistré dans le document permettra certainement à un utilisateur de comprendre quelques phénomènes étranges qui pouvaient lui sembler mystérieux. INF Z10 - Cours 8 page 3 CILSH - 2002/2003
Fonctions de base d un traitement de texte La première de ces fonctions est la frappe du texte. Un texte peut être décomposé en caractères, en mots, en phrases, en lignes, en paragraphes ou en pages. Le scripteur ne doit pas se préoccuper du découpage en lignes ou en pages, cette tâche étant prise en charge automatiquement par le traitement de textes. Par contre il doit se soucier de composer des paragraphes en les délimitant par la frappe de la touche Entrée ce qui introduit dans le texte le caractère «fin de paragraphe», représenté par le signe. On doit d'abord taper le texte «au kilomètre» c'est à dire respecter simplement : Les MAJUSCULES et les minuscules La ponctuation Les fins de paragraphes Éventuellement les lignes blanches (ou vides) Pour l'organisation générale des caractères il s'agit de respecter quelques règles typographiques élémentaires et principalement celles concernant les espaces. espace avant signe espace après non, oui non. oui oui : oui oui ; oui oui! oui oui? oui non - non non non oui ( [ { «non non ) ] }» oui Mais certaines de ces fonctions sont des fonctions-système, que l'on trouve déjà dans le système d'exploitation. mode insertion/refrappe : Le mode insertion est le mode de fonctionnement par défaut : c'est lui qui donne au TT l'avantage sur les modes traditionnels : une séquence de caractères frappée au milieu du texte déplace ce qui suit vers la droite, à l'infini. sélectionner : Cette opération fondamentale consiste à marquer la zone à laquelle s'applique une action. Le marquage peut se faire par le clavier ou la souris et se matérialise par une inversion vidéo. La sélection peut aller du caractère unique au document entier. copier/coller ou couper/coller : Ces actions supposent la sélection préalable d'un bloc de texte. Elles mettent en jeu une mémoire annexe qui ne peut contenir qu'une seule sélection, le presse-papiers. Par coller, on insère le bloc à sa nouvelle place ; on peut coller le même bloc autant de fois qu'on veut. En revanche, les procédures directes d'effacement ne mémorisent pas l'élément supprimé. INF Z10 - Cours 8 page 4 CILSH - 2002/2003
se déplacer : On peut se déplacer sur l'intégralité du document : la meilleure méthode est la souris, mais le clavier permet aussi des déplacements (petites flèches du clavier). annuler/répéter : Toute opération peut être immédiatement annulée ou répétée. Les versions les plus récentes des TT permettent d'annuler/répéter séquentiellement un nombre très important d'opérations. rechercher - remplacer : Ces fonctions peuvent porter sur tout le document ou sur une sélection : la recherche permet le déplacement vers une séquence de caractères ou une partie du texte affectée d'un format particulier. La fonction remplacement ajoute à la recherche la possibilité d'une modification soit globale et automatique, soit séquentielle et contrôlée. mode d'affichage : Les traitements de texte offrent plusieurs modes d'affichage : - mode normal : visualisation des caractéristiques graphiques essentielles (affichage rapide) - mode page : matérialise les pages, affiche les notes de bas de page, signale les en-tête et pieds de page, etc. (affichage plus lent, mais en "wysiwyg") - mode lecture à l'écran : permet de définir une taille minimale pour que le document soit toujours lisible à l'écran - mode plan : permet de travailler sur un document hiérarchisé. imprimer : Cette commande est paramétrable (nombre d'exemplaires, fractionnement du texte, choix de l'imprimante, etc.). Il est conseillé de la faire précéder de la commande aperçu avant impression et de la commande mise en page qui permet notamment de décider de l'orientation du papier (portrait ou paysage). enregistrer : L'avantage du traitement de texte par rapport à la machine à écrire réside entre autres dans la possibilité de sauvegarder le travail de frappe, en vue d'une réutilisation. Il est donc indispensable d enregistrer ses documents, sur disque dur ou sur disquette en fonction de l'importance qu'on accorde à son travail. Il est bon de donner un nom significatif au fichier ainsi créé. L'enregistrement sous un nouveau nom permet de conserver plusieurs versions. L'utilisation d'un même nom "écrase" (c est à dire supprime) le fichier correspondant. INF Z10 - Cours 8 page 5 CILSH - 2002/2003