Installation, partitionnement et formatage de disques durs. 1 Préliminaires. 1.1 Principe. 1.2 Formatage bas niveau

Département d'informatique DUT Informatique 1A Introduction aux systèmes informatiques Installation, partitionnement et formatage de disques durs Dans ce document nous faisons une description de la mise en uvre d'un disque dur. Nous faisons une présentation du principe d'un disque dur, du formatage bas niveau, des diérentes interfaces, de ce que sont le partitionnement et un système de chiers. 1 Préliminaires Les disques durs permettent de conserver de grandes quantités de données de manière permanente, à l'opposé de la mémoire vive qui s'eace lorsque l'ordinateur n'est plus alimenté électriquement, on les désigne également sous le terme de périphériques de type mémoire de masse. Un disque dur est relié à la carte mère par l'intermédiaire d'un contrôleur de disque, ce dernier fait oce d'interface entre le microprocesseur et le disque dur. On distingue les interfaces suivantes : Serial ATA (Advanced Technology Attachment) ; IDE ; SCSI (Small Computer System Interface) et SAS (Serial Attached SCSI) qui sont présentes surtout sur des serveurs. 1.1 Principe Un disque dur est constitué de plusieurs plateaux (disques rigides pouvant être en métal ou en céramique) empilés à une très faible distance les uns des autres. Entre les plateaux se déplace un bras comportant plusieurs têtes de lecture / écriture (une par face). Chaque plateau est recouvert d'une ne couche magnétique sur ses deux faces et tourne à une vitesse comprise entre 4000 et 15000 tours par minute. Une tête de lecture / écriture consiste en un électro-aimant, ainsi les 0 / 1 sont stockés en polarisant les surfaces des plateaux. La gure 1(a) illustre ces diérents points. 1.2 Formatage bas niveau Le formatage bas niveau dénit la géométrie du disque, c'est-à-dire l'organisation des surfaces du disque dur en éléments simples (en l'occurrence pistes et secteurs) qui permettront de localiser l'information. L'intersection d'une piste et d'un secteur sur une face d'un plateau forme un bloc de 512 octets qui est donc référencé par trois chires : le numéro de piste (ou de cylindre) ; le numéro de plateau (ou de tête) ; le numéro de secteur (sur le plateau sous la tête). On parle alors de géométrie CHS (pour Cylinders Heads Sectors). De plus, il est à noter que ce bloc de 512 octets est également appelé lui-même un secteur. Toutefois, un secteur étant trop petit, on regroupe les secteurs en une unité de base appelée cluster. Une autre unité de lecture / 1

(a) (b) Figure 1 Description des éléments d'un disque dur IDE (a) et de son organisation après formatage bas niveau (b). écriture est le cylindre. Ce dernier est constitué de toutes les pistes superposées verticalement et qui sont simultanément sous les têtes de lecture / écriture. Il est en eet plus simple d'écrire sur les mêmes pistes de diérents plateaux plutôt que de déplacer l'ensemble des têtes de lecture. 1.3 Interface IDE (notée P-ATA ou PATA) 1.3.1 Variété et confusion de termes Un grand nombre de termes se rapportant aux interfaces IDE recouvrent la même réalité. Illustration : IDE (Integrated Drive Electronics), bus AT et ATA (pour AT Attachment). À l'origine de cette confusion on trouve les constructeurs, de fait plutôt que d'utiliser les termes standards ils choisissaient des termes de leur cru. D'un côté on a donc des termes résultants de spécications très précises, soit ATA, ATA-2, ATA-3,... et ATAPI (ATA Packet Interface). De l'autre côté, des termes qui se sont imposés par leur usage, en l'occurrence IDE, E-IDE, Fast- ATA ou Ultra-DMA. Depuis l'émergence de la norme Serial ATA, le terme Parallel ATA (noté P-ATA ou PATA) remplace parfois l'appellation ATA an de mettre en évidence la diérence entre les deux normes. 1.3.2 Le système IDE et E-IDE La première norme I(ntegrated) D(rive) E(lectronics) (ou ATA) a été proposée en 1986. Puis, en 1994 fut introduit l'extension E(nhanced)-IDE (ou encore Fast-IDE, Fast-ATA ou ATA-2). Celle-ci permettait des débits beaucoup plus élevés entre les périphériques et le PC (jusqu'à 2

13,3 Mio/s), prenait également en charge des disques de plus grande capacité et permettait de gérer jusqu'à 4 périphériques. 1.3.3 Fast-ATA, Fast-ATA 2 et Ultra-ATA La spécication des débits des disques durs se fait par l'intermédiaire des standards ATA. Leur diérence se situe au niveau des performances. Le premier standard fut l'ata, suivi du Fast-ATA ou ATA-2. Les versions du Fast-ATA se caractérisent par leur mode de transfert et par le débit maximum qu'elles autorisent. Fast-ATA Regroupe deux standards : le mode P(rogrammed) I(nput/)O(utput) 3 qui autorise un débit de 11,1 Mio/s. L'échange de données avec la mémoire se fait à travers des commandes gérées directement par le processeur ; le Multiword-DMA ou DMA-1 avec un débit de 13,3 Mio/s. D(irect) M(emory) A(ccess) signie qu'il est possible de transférer des données en mémoire en sollicitant très peu le microprocesseur. Fast-ATA 2 Avec la croissance des performances des microprocesseurs, il fut également nécessaire d'améliorer celles des disques durs. Pour ce faire a été déni le standard Fast-ATA 2, celui-ci combine le mode PIO 4 et le DMA-2. Le débit théorique qu'il est possible d'atteindre est de 16,6 Mio/s. Ultra-ATA L'Ultra-ATA (ou ATA-33) ou Ultra-DMA (ou encore Ultra DMA/33, DMA-33) est le standard qui suivit le Fast-ATA 2. L'IDE standard et notamment le Fast-ATA 2 transfère les données en utilisant uniquement les fronts montants. L'Ultra-DMA utilise lui également les fronts descendants, envoyant ainsi deux blocs de 16 bits en un cycle d'horloge. L'ATA-33 permet ainsi de doubler le débit par rapport au Fast-ATA 2, son débit théorique est de l'ordre de 33 Mio/s (UDMA 2). À la suite de l'ata-33 fut introduit l'ata-66 ou Ultra DMA/66 (débit d'environ 66 Mio/s - UDMA 4), puis plus récemment l'ata-100 (UDMA 5) et l'ata-133 (UDMA 6). 1.3.4 Canaux IDE, maître et esclave Les contrôleurs E-IDE utilisent deux canaux. Chaque canal peut recevoir deux périphériques de type IDE, soit un maximum de 4 périphériques. Les canaux fonctionnent indépendamment l'un de l'autre, en revanche deux périphériques installés sur un même canal fonctionneront l'un après l'autre (partage du bus parallèle). Le premier canal est appelé Primary Channel (canal primaire) et le second Secondary Channel (canal secondaire). Un canal utilise des ressources qui lui sont propres (comme une IRQ : 14 pour le canal primaire et 15 pour le canal secondaire). Sur chaque canal un périphérique est maître, tandis que l'autre est l'esclave. 1.3.5 ATAPI À la n des années 80 sont apparus des périphériques diérents des disques dur et du lecteur de disquette, cherchant à exploiter le concept IDE (par exemple les lecteurs de CD-ROM). Ce fut le point départ du standard ATAPI : un pilote se charge de déclarer le périphérique ATAPI au contrôleur E-IDE. Sans pilote ATAPI et sans prise en charge directe par le BIOS, le périphérique ne pouvait être reconnu. 3

1.4 Interface Serial ATA (notée S-ATA ou SATA) L'interface Serial ATA est apparue en 2003, an de pallier les limitations de l'interface IDE ou Parallel ATA qui utilise un mode de transmission en parallèle. De fait, des problèmes d'interférences électromagnétique entre les ls limitent le mode de transmission parallèle (elles peuvent provoquer des erreurs de transfert) ; de synchronisation des données. D'ailleurs, les câbles pour l'ultra DMA/66, 100 et 133 ne comportent plus 40 ls, mais 80 ls (mais il y a toujours 40 broches). Le standard S-ATA utilise le mode de transmission série. Il comporte donc deux liaisons séries unidirectionnelles : émission et réception. Sur une liaison, les informations sont transmises à l'aide deux ls, ainsi une communication bidirectionnelle utilise 4 ls (le câble utilisé comporte au total 7 ls, du fait de la présence de 3 ls de masse). Le transport des bits se fait en utilisant l'encodage 8b/10b introduit en travaux dirigés. Au niveau des performances le SATA permet d'obtenir des débits de l'ordre de 187,5 Mio/s., ce qui correspond à un débit utile de 150 Mio/s (la diérence provient des bits supplémentaires utilisés pour transmettre un octet). L'évolution SATA II permet d'atteindre des débits de 300 Mio/s, pour le SATA Revision 3.0 c'est 600 Mio/s utiles théoriques. Un avantage du SATA est que ce débit théorique est disponible pour chaque périphérique, contrairement au PATA où deux périphériques branchés sur le même connecteur doivent partager. Autre avantage du SATA : le hot-plug - branchement à chaud, à condition que la carte mère le supporte et d'utiliser des câbles qui ont des connecteurs de masse un peu plus long. En eet, ces connecteurs doivent être plus long an qu'ils entrent en contact avant les connecteurs de données (sinon le matériel risque de ne pas apprécier). Enn, l'e-sata est une adaptation du protocole SATA au branchement de périphériques externes. En pratique le débit réel d'un périphérique PATA ou SATA est relativement éloigné des débits théoriques. Un bon indicateur des performances d'un disque dur est son rendement. 1.5 Disques virtuels, SSD et hybrides Un disque virtuel (ou RAM disque) émule un disque dur en mémoire, sa gestion étant faite par l'intermédiaire d'appels systèmes. Son principal avantage est sa rapidité, bien entendu sa taille est relativement limitée. On utilise essentiellement un disque virtuel pour stocker des chiers en lecture seule, vu la volatilité de la mémoire (perte des données en cas de coupure électrique). Un disque SSD (Solid State Disk) ressemble à un disque dur classique, toutefois du point de vue mécanique ils sont diérents. En eet, dans un disque SSD les données sont stockées dans de la mémoire ash, ce qui permet d'avoir un taux de transfert plus important et un temps d'accès plus faible. Toutefois, les disques SSD orent des capacités moindres et à un coût élevé (un disque SSD de 54 Gio coûte un peu moins cher qu'un disque SATA II de 2 Tio). Enn, il faut noter que l'on trouve également des disques durs hybrides. Ils sont hybrides dans le sens où il s'agit de disques durs classiques comportant un module de mémoire ash. Ce type de disque permet de bénécier des performances de la mémoire ash, tout en réduisant la consommation électrique et en augmentant la durée de vie du disque dur. 1.6 Capacité exacte d'un disque dur - Caractéristiques M. X vient d'acheter un nouveau disque dur qui d'après les indications du constructeur aurait une capacité de 160 Go. Toutefois, après avoir installé et partitionné le disque, à son 4

grand étonnement, la capacité n'est que de 149 Gio. L'explication est simple : les constructeurs utilisent les préxes de capacité en puissances de 10 (nouvelle norme), alors que l'ordinateur compte en puissances de 2. À noter que le partitionnement et le formatage consomment également de l'espace disque, puisque les informations qui y sont relatives sont enregistrées sur le disque. Les caractéristiques d'un disque dur sont : capacité en Go (puissances de 10) et interface (IDE, SATA ou SCSI) ; format en pouces (3,5 ; 2,5 ou 1,8) ; taux de transfert moyen en Mio/s et vitesse de rotation en tours par minute ; taille de la mémoire cache et temps d'accès moyen en millisecondes. 1.7 Partitionnement Le partitionnement se fait après le formatage bas niveau (formatage physique) et avant le formatage qui va créer un système de chiers (formatage logique). Cela consiste à créer des zones sur le disque dur dont les données seront séparées. C'est surtout utile dans le cas où on veut installer plusieurs systèmes d'exploitation, auquel cas il y aura au minimum autant de partitions que de systèmes d'exploitation. On distingue trois types de partition : la partition primaire ou principale, la partition étendue et les lecteurs logiques. Un disque dur peut comporter jusqu'à 4 partitions principales (1 seule pouvant être active), ou bien encore 3 principale et 1 étendue. Au sein de la partition étendue on peut créer des lecteurs logiques. Attention : cette contrainte concerne les tables de partition au format MSDOS, cela n'est pas vrai pour d'autres format. Le partitionnement va construire la table des partitions qui contient les informations sur les partitions primaires. Cette table suit le secteur d'amorce ou Master Boot Record qui est constitué des 446 premiers octets. Le MBR contient notamment une routine d'amorçage (code machine) qui a pour but de charger un système d'exploitation ou un chargeur d'amorçage (boot loader). Ce dernier permet de choisir un système d'exploitation à démarrer parmi plusieurs. Attention : la suppression d'une partition entraîne la perte des données qu'elle contient. Toutefois, cela n'est vrai que si on touche au système de chiers. En eet, si on recrée une partition avec les mêmes caractéristiques (type, taille et position) que celle supprimée on retrouvera les données. Il est à noter qu'avec un logiciel adéquat il est possible de redimensionner une partition (augmenter ou réduire sa taille). 1.8 Système de chiers Le système de chiers est construit à la suite du formatage, il permet de localiser les informations. C'est lui qui va permettre au système d'exploitation d'utiliser l'espace disque pour stocker et utiliser les chiers. Pour cela, le système de chiers est basé sur la gestion des clusters, un cluster étant la plus petite unité d'allocation gérable par le système d'exploitation. Quelques exemples de système de chiers par système d'exploitation : Windows 2000 / XP / Vista : FAT16, FAT32, NTFS ; Linux : Ext2, Ext3, Ext4, ReiserFS, Linux Swap, FAT16, FAT32, NTFS ; MacOS : HFS, MFS. Caractéristiques du système NTFS (basé sur une structure appelée table de chier maître comportant des informations détaillées sur les chiers) : support des noms longs avec respect de la casse (diérence minusc./majusc.) ; accès plus rapide que sur une partition FAT, grâce à un arbre binaire de recherche ; 5

la limite théorique de la taille d'une partition est de 16 exbioctets (attention : puissances de 2 1 Eio/exbioctet = 1024 Pio/pébioctet = 1024 1024 Tio) ; attributs pour chaque chier ; etc. La taille maximale en octets d'une partition dépend de la taille en octets d'un cluster et du nombre d'adresses logiques (Logical Block Addressing) disponibles. Par exemple, pour une adresse logique sur 4 octets (32 bits) et une taille de cluster de 4 Kio on obtient une taille maximale de 16 Tio. Ce qui est le cas des partitions de type Ext3 sous Linux, son successeur Ext4 peut aller jusqu'à 1 Eio. La conversion d'une adresse logique en adresse physique est réalisée par le contrôleur de disque (partie intégrante du disque dur). 2 L'installation facile d'un disque dur 2.1 Installation physique 2.1.1 Conguration du disque dur dans le cas d'un IDE La première étape de l'installation est la conguration du disque dur, pour cela le disque possède des cavaliers. En général, vous devrez choisir entre deux ou quatre options, ces dernières étant décrites dans le manuel et sur le disque. Les caractéristiques techniques sont également inscrites sur le disque (nombre de cylindres, têtes, etc.). Les options possibles pour la conguration sont : 1. MA - Master (maître) ou Stand-Alone est l'option à retenir dans le cas d'un seul disque, utilisé notamment comme disque de démarrage. 2. SL - Slave (esclave) pour installer un second disque sur le même canal. 3. CS - Cable Select est une option rarement utilisée, le choix du disque maître et du disque esclave se fait par logiciel. 4. Parity on/o est en général sur ON. Elle est utilisée pour dénir la parité et doit être conguré comme le cavalier de parité du contrôleur E-IDE (si ce dernier en a un). Les options 3 et 4 sont très rarement utilisées. D'autre part, si un disque est déjà installé sur le canal, il est préférable d'installer le disque le plus rapide en tant que maître. 2.1.2 Installation du disque dur dans le boîtier Après avoir éventuellement conguré le disque dur, il faut : 1. débrancher le câble d'alimentation du boîtier, puis l'ouvrir ; 2. mettre en place les câbles nécessaires : câble d'alimentation et nappe (la marque rouge de la nappe en regard de la broche 1 du connecteur, également rouge) ; 3. placer et verrouiller le disque dur dans son logement (utiliser des vis courtes) ; 4. fermer le boîtier et rebrancher le câble d'alimentation. 2.1.3 Déclaration du disque dur dans le BIOS Le moment est venu d'indiquer au BIOS les caractéristiques du disque dur. 1. Démarrer le PC et aller dans le BIOS. 2. Déclarer le disque dur dans le menu STANDARD CMOS Features : 6

trouver le disque suivant sa hiérarchie (canal primaire, maître ou esclave) ; congurer le paramétrage du disque en mode Auto ou User. Dans le premier cas, les caractéristiques du disque sont détectées à chaque démarrage. Tandis que pour la seconde option, il faut saisir les caractéristiques du disque (voir l'étiquette) : cylindres (C), têtes (H) et secteurs (S). Pour cela, on peut utiliser la commande du BIOS permettant une reconnaissance automatique des caractéristiques du disque dur. 3. Sauvegarder les modications faites dans le BIOS et redémarrer. 2.2 Installation logique Lors de la création d'une partition il faut préciser le type de système de chiers qu'elle accueillera. Aussi, la division en partitions d'un disque, puis leur formatage est une étape qui apparaît lors de l'installation d'un système d'exploitation (Windows, Linux, ou autre). Toutefois, il existe des outils permettant de créer, redimensionner, ou supprimer des partitions quelconques en dehors de l'installation d'un système d'exploitation. gparted (Gnome Partition Editor - http://gparted.sourceforge.net) est, par exemple, un tel outil. Avant toute installation, il est préférable de disposer d'un support amovible (un CD, etc.) permettant de démarrer le système. Ceci est d'autant plus vrai en cas de remplacement du disque dur contenant le système d'exploitation. Deux programmes importants doivent se trouver sur le support amovible : l'un permettant de partitionner un disque dur, l'autre de formater une partition. Lors du partitionnement, vous devrez choisir le type de la partition : FAT16 ou FAT32 (F(ile) A(llocation) T(able) ou table d'allocation des chiers), NTFS, celles relatives à Linux, etc. Le formatage va subdiviser et adresser le disque de manière à permettre au système d'exploitation de gérer les chiers. L'adressage constitue ce que l'on appelle le système de chiers ( File System). Par exemple, chez Microsoft dans le cas des FAT16 ou FAT32, ce dernier est composé de la FAT qui est stockée sur les pistes extérieures et de clusters (unités d'allocation). Un cluster est la plus petite entité que peut gérer l'os, sa taille est conditionnée par le type et la taille de la partition (voir ci-dessous pour une FAT16). Taille partition FAT16 Taille des clusters Jusqu'à 127 Mio 2 Kio 128 à 255 Mio 4 Kio 256 à 511 Mio 8 Kio 512 à 1023 Mio 16 Kio Jusqu'à 2 Gio 32 Kio Le choix de la taille de la partition en FAT16 est donc très important, car une taille de cluster inadéquate peut entraîner un gaspillage de l'espace disque. Par exemple, si les clusters ont une taille de 32 Kio, un chier de 1 Kio occupant un cluster se traduira par une inutilisation de 31 Kio. 2.3 Formatage du Master Boot Record Le M(aster) B(oot) R(ecord) est le premier élément bootable du disque dur. Les informations qu'il contient sont très importantes pour le démarrage (on y trouve notamment la liste des 7

partitions). Des OS tels que Windows XP ou Linux, de même que les programmes de multiboot (voire des virus) y écrivent des données. Pour formater (eacer) le MBR on peut par exemple utiliser l'outil Microsoft fdisk : fdisk /mbr. 8