Fonctionnement d un Système de Gestion de Fichiers (SGF) - les disques. christophe.cerin@iutv.univ-paris13.fr 27 décembre 2012



Documents pareils
Gestion de mémoire secondaire F. Boyer, Laboratoire Sardes

EX4C Systèmes d exploitation. Séance 14 Structure des stockages de masse

1. Systèmes d entrée/sortie 2. Systèmes de fichiers 3. Structure de mémoire de masse (disques)

Systèmes d Exploitation - ENSIN6U3. Aix-Marseille Université

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

Partie 7 : Gestion de la mémoire

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Présentation du module Base de données spatio-temporelles

Techniques de stockage. Techniques de stockage, P. Rigaux p.1/43

PARAGON Disk Wiper. Guide de l utilisateur. Paragon Technology GmbH, System Programmierung. Copyright Paragon Technology GmbH

Chapitre V : La gestion de la mémoire. Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

Concepts et systèmes de stockage

Effacement d'un disque dur avant mise au rebut. Denis PUGNÈRE IN2P3/IPNL A3IMP - La Grande Motte /09/2007

Structure fonctionnelle d un SGBD

Fonctions De Base D un Système D Exploitation. I- introduction : II- Gestion des processus :

LES SYSTÈMES DE FICHIERS

Acquisition des données

Cloner un disque dur

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Informatique pour scientifiques hiver Plan général Systèmes d exploitation

Le Raid c est quoi? Comment ca marche? Les différents modes RAID :

Système de Gestion de Fichiers

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Mise en oeuvre TSM 6.1

Linux Partition Mini-HOWTO

Distinguer entre «Enregistrer» et «Sauvegarder»

SYSTÈME DE GESTION DE FICHIERS SGF - DISQUE

Stockage des machines virtuelles d un système ESXi jose.tavares@hesge.ch & gerald.litzistorf@hesge.ch

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Cours 13. RAID et SAN. 2004, Marc-André Léger

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Chapitre 3 : Système de gestion de fichiers

<Insert Picture Here> Exadata Storage Server et DB Machine V2

Acronis True Image 10 Home Edition

SYSTÈME DE GESTION DE FICHIERS

DEPLOIEMENT 1. IMAGEX. IMAGEX est le nom de la ligne de commande fournie pour gérer les fichiers WIM. 1. Créer un fichier WIM : capture


Tests de performance du matériel

Systemes d'exploitation des ordinateurs

Backup , l intégration du backup sur disque

Cours de Système : Gestion de Fichiers

Micro ordinateur & Périphériques Mémoire de masse Disque dur (SOLUTION)

Mise à jour : February 4, / 93

Samsung Magician v.4.3 Guide d'introduction et d'installation

Windows XP niveau 2. D. Hourquin, Médiapôle St Ouen l'aumône

Sur un ordinateur portable ou un All-in-One tactile, la plupart des éléments mentionnés précédemment sont regroupés. 10) 11)

La gestion des disques

TP3 : Manipulation et implantation de systèmes de fichiers 1

Stockage Réseau. Le stockage s'échappe du système pour devenir une fonction réseau

ASR3. Partie 4 Le système de fichier. Arnaud Clérentin, IUT d Amiens, département Informatique

Comment faire reconnaître l espace disque ajouté à votre OS?

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Installation d un poste i. Partage et Portage & permissions NTFS

Serveur de sauvegarde à moindre coût

Manuel de l utilisateur de HP Array Configuration Utility

SERVEUR DE SAUVEGARDE POUR BCDI3. par. G.Haberer, A.Peuch, P.Saadé

Unix/Linux I. 1 ere année DUT. Université marne la vallée

Livre blanc Haute disponibilité sous Linux

Guide pour l Installation des Disques Durs SATA et Configuration RAID

Tarifs 15 juin 2015 REF MATRIX APPLIANCES. DESIGNATION RAID CAPACITE EN RAID Prix Public Unitaire HT.

Fonctionnalités d Acronis :

G4L (Ghost for Linux) Clonage vers FTP Version: août 2006

TP11 - Administration/Tuning

Protection des données avec les solutions de stockage NETGEAR

Architectures haute disponibilité avec MySQL. Olivier Olivier DASINI DASINI - -

--- Le Fusion RX1600Fibre. un stockage partagé haute performance optimisé pour l'édition vidéo

Spécifications détaillées

Analyse et réalisation d un système de disques répartis à forte disponibilité

Cloner nativement Windows 8.x (mode EFI)

Système de Sauvegarde et d Archivage Backup Smart Way TM

Administration de Parc Informatique TP07 : Installation de Linux Debian

SAN AoE (ATA over Ethernet)

GESTION DE LA MEMOIRE

Réparer un disque dur passé en RAW

Commandes Linux. Gestion des fichiers et des répertoires. Gestion des droits. Gestion des imprimantes. Formation Use-IT

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Sauvegarde des fichiers

A -Systèmes de fichiers 1 - FAT vs NTFS

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

Remplacer le disque dur d'un ordinateur portable par un SSD

Présentation du SC101

Agenda. Exemple : données et back à Eurecom SANs and NAS. Les bases: SANs. Back-up Partage de fichier. Disques et Raid SCSI et FCP

L'organisation du système de fichier NTFS est encore plus complexe, fonctionnant un peu à la façon d'une base de données.

INSTALL ATION D UNE D I S T RIBUTION

LE DISQUE DUR : IDE (Integrated Device Electronique) : La nouvelle référence.

Systèmes informatiques

Tout le monde parle du Cloud Computing, Mais qui offre une solution complète? Copyright IBM Corporation, 2009 All Rights Reserved

Consolidation de stockage

Effacement des supports de données

Bienvenue sur Lab-Windows Il n'y a de vents favorables que pour ceux qui ont un cap

Howto: Comment faire cohabiter Backtrack et un Windows?

Systèmes d Exploitation - ENSIN6U3. Aix-Marseille Université

environnements SQL Server?

STRUCTURE DES ORDINATEURS - Le disque dur -

Transcription:

Fonctionnement d un Système de Gestion de Fichiers (SGF) - les disques christophe.cerin@iutv.univ-paris13.fr 27 décembre 2012 1

Systèmes de fichiers Propriétés attendues : Stocker de très grandes quantités d'information L'information doit survivre à la fin du processus qui l'a créée Plusieurs processus doivent pouvoir y accéder concurremment Vue abstraite: tableau dont les cases (blocs) sont de taille fixe : Comment trouver? Comment s'assurer qu'un utilisateur accède uniquement aux données d'un fichier donné? Comment savoir quels sont les blocs libres? 2

I- Organisation d un PC (ancien) 3

Le chemin des données Remarques technologiques : S-ATA, PCI Express et PCI-X (sont des normes récentes concernant les I/O) L envoi d octets depuis un disque vers la carte réseaux passe par la RAM et le bus mémoire (2 fois) Ceci est dû à la méthode d accès (les choix pour sauvegarder et gérer les données entre composants différents) 4

Structures logiques de fichiers Figure 1. Three kinds of files. (a) Byte sequence. (b) Record sequence. (c) Tree. 5

Organisation d un fichier Le fichier séquentiel : 1. Un format fixé est utilisé pour les enregistrements 2. Les enregistrements sont de même longueur 3. Tous les champs sont les mêmes 4. Un champs est appelé la clé pour identifier l enregistrement 5. Nouveaux enregistrements sont traités par lots pour être fusionnés 6

Organisation d un fichier Le fichier (séquentiel) indexé : 1. Une table (un indexe) est utilisé pour retrouver rapidement un enregistrement 2. Le reste est inchangé 3. Exemple d indexe : (clé, ensemble des numéros des blocs ou apparaissent la clé). Si l ensemble est trié, on peut faire une recherche dichotomique de coût O(log n). Discussion : coût associé pour un ajout/suppression? On peut avoir plusieurs indexes pour une même clé : compliqué!!! 7

Fichier indexé Ici on a plusieurs indexes et des records de taille variable RQ : les indexes sont aussi rangés sur les disques 8

Fichier à accès direct (hash) Objectif : accéder avec un coût constant (en une seule opération d I/O : idéal) et pas fonction de la taille du fichier ; H(key_field) => adresse du bloc Problème des collisions 9

Organisation physique d'un système de gestion de données 10

Allocation contiguë Figure 2. (a) Contiguous allocation of disk space for 7 files. (b) The state of the disk after files D and F have been removed. 11

Méthodes d allocation des blocs sur le disque Allocation contiguë permet de ne garder comme information pour l acces qu une seule adresse et le nombre de blocs. C est bon pour les performances mais quand on supprime, on crée des «trous» d où la nécessité de faire autrement. 12

Allocation contiguë 13

Allocation contiguë et compactage 14

Allocation chainée 15

Allocation chainée Il suffit de connaître le bloc de début et la longueur (nobre de blocs) Le principe de localité n est pas respecté 16

Allocation chainée et consolidation 17

Allocation par liste chainée utilisant une table en mémoire 18

Allocation des indexes Que se passe t il si le nombre de blocs est grand? 19

Allocation des indexes 20

I-nodes (terme du monde Unix) 21

Le cas d Unix 22

II- Structure d un disque Un disque peut être vu comme un tableau à 1 dimension de blocs logiques ; Le bloc est la plus petite unité de transfert (512 octets?) ; Le tableau à 1 dimension est «mappé» dans les secteurs physiques Le secteur 0 est mappé avec le premier secteur de la première piste du cyclindre extérieur 23

Organisation physique QuickTime et un décompresseur TIFF (non compressé) sont requis pour visionner cette image. Cylindres Pistes Secteurs Plateaux Têtes de lecture Exemple : pour un disque de 1024 cylindres, 16 têtes et 63 secteurs (de 512 k), on aura donc une capacité totale de disque dur de 1024 * 16 *63 * 512 = 528 482 304 octets soit environ 504 Mo ((528 482 304 / 1024) / 1024). 24

Organisation physique CFDISK(8) Linux Programmer's Manual NAME cfdisk - Curses based disk partition table manipulator for Linux SYNOPSIS cfdisk [ -agvz ] [ -c cylinders ] [ -h heads ] [ -s sectors-per-track ] [ -P opt ] [ device ] Les commandes de gestion dépendent de la version utilisée d Unix!!! 25

Organisation physique cfdisk 0.8i Disk Drive: /dev/hda Heads: 64 Sectors per Track: 63 Cylinders: 528Name Flags Part Type FS Type Size (MB) --------------------------------------------------------------------------- /dev/hda1 Boot Primary DOS FAT16 [NO NAME ] 127.97 /dev/hda2 Primary Linux Swap 33.47 /dev/hda3 Primary Linux 878.07 [Bootable] [ Delete ] [ Help ] [Maximize] [ Print ] [ Quit ] [ Type ] [ Units ] [ Write ] Toggle bootable flag of the current partition 26

Système de fichier consistant Imaginons une panne avant que toutes les modifications (écritures) sur un bloc aient eu lieu Unix fsck (réponse pratique pour Linuxien) Définitions : Table «Blocks in use» : combien de fois un block est présent dans un fichier ; Table «Free blocks» : combien de fois chaque bloc est présent dans la liste des blocs disponibles Trois cas : (b) bloc manquant. Free block passe à 1 (c) 4 apparaît deux fois. 2 1 (d) le bloc 5 est présent dans 2 fichiers : allouer un nouveau bloc et copier le contenu de 5 dedans 27

Système de fichier consistant Figure 3. File system states. (a) Consistent. (b) Missing block. (c) Duplicate block in free list. (d) Duplicate data block. 28

Débit, performance d un disque Le temps d accès à un disque est modélisé par la somme du seek time et rotational latency : Seek time: temps pour positionner les têtes sur le bon cylindre ; Rotational latency: temps pour que la tête se positionne sur le bon secteur ; Disk bandwidth: nombre total d octets transférés / (T fin - T début ) 29

Transfert T début T fin data transfert << wait+seek+rotational => poor bandwidth On a donc besoin d un cache 30

Calcul plus précis Estimated seek time T s = n*m+s (n=nombre de pistes traversées, m=cte propre au disque, s=startup time) Rotational delay : s exprime en RPM (7200, 5400, 4200) Transfer Time T=b/(r*N) avec b=nombre d octets à transférer, N=nombre d octets par piste, r=vitesse de rotation en rpm) Total average seek time T a = T s +1/2r+b/(r*N) 31

Ordonnancement des accès au disque Si les données d un même fichier sont un «peu partout» sur le disque alors la somme des T accès est grande! Plusieurs algorithmes existent pour ordonnancer les requêtes d I/O Imaginons qu une file de requêtes contienne les blocs suivants : 98, 183, 37, 122, 14, 124, 65, 67 et que la tête soit positionnée sur le bloc 53. 32

Politique First Come Fist Serve Illustration shows total head movement of 640 cylinders. FCFS 33

Shortest Service Time First (SSTF) Select requête avec le minimum seek time à partir de la position courrante de la tête Il peut y avoir famine (si on réalimente la file) Ici : 236 movements 34

Politique SCAN (balayage) Le bras de la tête va «au début» du disque puis «à la fin» Principe de l ascensseur Ici : 208 mouvements 35

Politique C-SCAN (circular) Fournit un temps d attente plus uniforme que SCAN Gestion par liste circulaire de cylindres Quand on «atteint» la fin du disque on revient au début sans rien faire Balayage dans un sens unique 36

Politique C-LOOK Version de C-SCAN Quand on «atteint» la dernière position la tête revient à la première position sans rien faire Balayage dans un sens unique 37

Politique N-step-SCAN & FSCAN L ordonnanceur gère des files de taille N Au moment d un ajout, on dépose dans une file qui n est pas en cours de traitement Chaque file a une politique SCAN Deux files Une file vide pour recevoir les nouvelles requêtes 38

Quel choix pour des performance? Le meilleur algorithme est à choisir en fonction du motif d accès mais il est inconnu à priori Le système de fichier devrait tous les implémenter et être capable de commuter de l un à l autre pendant l exécution SSTF ou LOOK sont choisis par défaut 39

Exemple de système de fichiers : ext3 ext3 alloue les blocs libres juste à côté des autres blocs utilisés par le fichier, ce qui a pour effet de minimiser l'espace physique entre les blocs. ext3 est néanmoins par définition fragmenté, c'est pourquoi son successeur ext4 inclut un utilitaire de défragmentation natif travaillant au niveau des bits et gérant la défragmentation à chaud. Un système de fichiers ext3 est créé dans une partition or le format de table de partition géré par fdisk6 ne permet pas de créer des partitions de plus de 2,2 Tio (2^32*512)7. Utilisez la commande parted et le format de table de partitions GPT8 pour s'affranchir de cette limite de 2,2 Tio. 40

Technique du RAID pour augmenter les performances et la sureté (pérénité des données) Principe : un contrôleur qui supervise plusieurs disques en autorisant des requêtes simultanées + sureté via la redondance Il y a différents niveaux de RAID RAID=Redundant Array of Inexpensive Disks 41

RAID-0 (non redondant) C est bon pour les perfs, pas pour la pérénité! 42

RAID-0 43

RAID-1 (mirroir) 44

RAID-2 (redondance via code de Hamming) 45

RAID-5 (calcul parité+distribution de la comme de contrôle) Et si un seul disque tombe en panne? 46

Conclusion http://en.wikipedia.org/wiki/comparison_of_file_systems et les systèmes de fichiers pour lecteurs de CD, disques SSD, lecteurs de bandes... le noyau du système d'exploitation doit aussi pouvoir les gérer! 47