et restauration des données : Introduction Février 2002 René J. Chevance Introduction Présentation de différentes politiques de sauvegarde Plusieurs types de granularité en fonction de la fonctionnalité des systèmes d exploitation ou des SGBDs : Niveau volume physique Niveau fichier Niveau bloc Les politiques présentées sont fondées sur les offres de différents fournisseurs : Hitachi Oracle Tivoli Storage Manager - TSM Veritas Network Appliances. Page 2 Page 1
Technologies Capacité et temps de sauvegarde de différents supports Note : Capacité native (hors compression, facteur typique ~2) Temps nécessaire à la sauvegarde complète d'un média (minutes) Page 3 Temps (minutes) 500,00 450,00 400,00 350,00 300,00 250,00 200,00 150,00 100,00 50,00 0,00 0 50 100 150 200 Capacité native (GB) DTF-2 9840 Super DLT LTO-Ultrium LTO-Accelis 3590(E) Mammoth-2 AIT-2 VA DDS-4 DAT Marché des robots Parts du marché mondial des fournisseurs de robots Parts de marché mondiales des fabricants de lecteurs de bande en 2000 (en revenu engendré) Exabyte 2,5% Tanberg 2,9% Seagate 7,9% HP 12,4% Autres 5,7% Quantum 24,4% IBM 12,6% Sony 12,9% Storagetek 18,7% Page 4 Page 2
Politiques de sauvegarde complète + incrémentale J0 J1 J2 J3 J4 J5 J6 complète s incrémentales Restauration à J4 Page 5 Restauration à Jx : On restaure la dernière sauvegarde complète et on applique les sauvegardes incrémentales jusqu à Jx Problème : temps de restauration Politiques de sauvegarde(2) complète + différentielle J0 J1 J2 J3 J4 J5 J6 complète s différentielle Restauration à J4 Page 6 Restauration à Jx : On restaure la dernière sauvegarde complète et on applique la sauvegarde différentielle correspondant à Jx Problème : volume croissant des sauvegardes différentielles Page 3
Politiques de sauvegarde(3) incrémentale + différentielle J0 J1 J2 J3 J4 J5 J6 complète incrémentale incrémentale différentielle incrémentale Restauration à J4 Page 7 Restauration à Jx : On restaure la dernière sauvegarde complète et on applique la dernière sauvegarde différentielle (le cas échéant) et ensuite les sauvegardes incrémentales. progressive Politiques de sauvegarde(4) Fichier A Fichier B Fichier C Fichier D J0 J1 J2 J3 J4 J5 J6 A0 B0 D0 B1 C1 C2 D2 A3 D3 B4 C4 B5 D5 A6 D6 Page 8 Page 4
Politiques de sauvegarde(5) progressive(2) Restauration à J4 Fichier A Fichier B Fichier C Fichier D Fichier A Fichier B Fichier C Fichier D J0 J1 J2 J3 J4 J5 J6 A0 B0 D0 B1 C1 C2 D2 A3 D3 B4 C4 B5 D5 A6 D6 Page 9 Restauration à Jx : On sélectionne sur l archive les fichiers à restaurer en fonction de la date choisie. On ne restaure que les fichiers nécessaires. Politiques de sauvegarde(6) instantanée (Instant Archive de Tivoli) Principe : création d une sauvegarde complète à partir d une sauvegarde complète précédente et des sauvegardes partielles Réalisation : opération de restauration dont la destination n est pas le stockage sur s mais le stockage sur une archive. Restauration rapide (Rapid Recovery) Principe : restauration des données à partir d une sauvegarde instantanée Page 10 Page 5
en temps réel en environnement RAID1 sans impact sur les performances et la disponibilité Fonctionnement normal 3 copies identiques Opération de sauvegarde complète = détachement De l un des copies Ré-intégration du après l opération de sauvegarde Synchronisation des données Page 11 en environnement SAN Concept de sauvegarde LAN-Free et Server-Free Allègement de la charge sur les réseaux locaux Allègement de la charge sur les serveurs Réseau d'entreprise Schéma «classique» en environnement DAS Plates-formes d'applications Administration du stockage Schéma LAN-free et Server-Free SAN Fibre Channel Page 12 unité de s librairie unité de s Page 6
Techniques de copie en temps réel Page 13 Contexte d utilisation : copie sur site distant (Disaster Recovery) Concept Copie synchrone type miroir (RAID 1) sur un système distant Opère au niveau volume Connexion entre systèmes par liens spécialisés à haute vitesse (Fibre) Produits : Peer-to-Peer Remote Copy - PPRC et RC (IBM) Hitachi s Remote Copy - HRC et HRC Symmetrix Remote Data Facility - SRDF (EMC) Techniques de copie en temps réel(2) Illustration de PPRC/HRC/SRDF primaire de secours (optionnel) 4 Mainframe 1 Mainframe 2 3 Impact important sur la performance Page 14 Page 7
Techniques de copie en temps réel(3) Illustration de RC (etended Remote Copy) et HRC primaire Volume logique primaire Mainframe 1 Mainframe (Données 2 4 + estampille) 3 (Données + estampille) de secours (recréation des données) Volume logique secondaire Page 15 Re-création de la séquence des mises à jour au moyen de l estampille Diminution de l impact sur la performance Techniques de copie en temps réel(4) Hitachi Asynchronous Remote Copy (HARC) primaire de secours (optionnel) 2 Mainframe 1 (Données + estampille) Mainframe Volume logique primaire 3 (Données + estampille) (recréation des données) Volume logique secondaire Page 16 La recréation des données est implémentée dans le soussystème secondaire Évite le système de secours Nécessite des sous-systèmes homogènes Page 8
Oracle : et Restauration Principe BD SCN = 100 200 300 BD de la BD Archived Redo Log Files BD BD Restaurée SCN = 300 Restauration Page 17 SCN = System Change Number Snapshot - Network Appliance NetApp Filer NFS Serveurs NT ou Unix CIFS Fast Ethernet ou Gigabit Ethernet NetApp NetApp Filer Filer Fibre Channel Serveurs HTTP Page 18 Architecture matérielle classique fondée sur un processeur Alpha Page 9
Architecture du logiciel Snapshot - Network Appliance(2) Fibre Channel Mass Storage Storage Appliance Watch NV RAM Journaling Integrated RAID Manager WAFL File System Snapshots SnapMirror System Administration and Monitoring Windows File Service (CIFS) NetBIOS (NBT) Unix File Service (NFS) Web Service (HTTP) Backup & Restore (NDMP) TCP/IP SNMP 10/100 Mb Ethernet Gigabit Ethernet ATM Network Page 19 WAFL = Write Anywhere File Layout (optimisé pour l écriture) CIFS = Common Internet File System Snapshot - Network Appliance(3) Concept de Log Structured File System Principe : remplacer les accès aléatoires lors des mises à jour des s en les remplaçant par des entrées-sorties séquentielles Super Block Data block 1 File i Data block 2 File i Data block k File i inode File inode inode File i inode File j Data block 1 File j Data block 2 File j Data block m File j Data block N File j inode File inode inode File i inode File j Data block 1 File i Data block m File j Data block k File i Data block N File j Ensemble de blocs écrit en une seule entrée-sortie séquentielle Data block M File i Page 20 Avant écriture des blocs modifiés Après écriture des blocs modifiés Page 10
Création de snapshots Snapshot - Network Appliance(4) Avant snapshot Après snapshot Après modification d un bloc Root inode Snapshot Root inode Snapshot Root inode A B C D A B C D A B C D C Blocs de données sur Bloc modifié Page 21 Avantage : Temps de création du snapshot très rapide Inconvénient : Espace Page 11