«Qui parmi vous teste ses backups et effectue un restore complet de ses systèmes?»



Documents pareils
TIVOLI STORAGE MANAGER. Denis Vandaele

arcserve r16.5 Protection des données hybride

Nouvelles stratégies et technologies de sauvegarde

DOSSIER SOLUTION : CA ARCserve r16. Recours au Cloud pour la continuité d'activité et la reprise après sinistre

FAMILLE EMC RECOVERPOINT

SAUVEGARDE ET RESTAURATION

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

Architecture complète de protection du stockage et des données pour VMware vsphere

Artica. La déduplication. Révision Du 08 Février 2011 version

Pourquoi OneSolutions a choisi SyselCloud

SQL Server 2008 solutions de sauvegarde et de continuité

Clients et agents Symantec NetBackup 7

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

EMC Data Domain Boost for Oracle Recovery Manager (RMAN)

Backup Exec 2010 vs. BackupAssist V6

La Continuité d Activité

Les méthodes de sauvegarde en environnement virtuel

UNIFIED. Nouvelle génération d'architecture unifiée pour la protection des données D TA. dans des environnements virtuels et physiques PROTECTION

Les sauvegardes de l ordinateur

Architecture des ordinateurs. Environnement Windows : sauvegarde

UNIFIED D TA. architecture nouvelle génération pour une restauration garantie (assured recovery ) que les données soient sur site ou dans le cloud

Symantec Backup Exec 2012

Introduction. René J. Chevance

Archives, backup, DRP. Archivage, sauvegarde, PRA. (plan de reprise d'activité) 04 Octobre

Sauvegarde et archivage

Dossier Solution - Virtualisation CA arcserve Unified Data Protection

Le data center moderne virtualisé

Le stockage unifié pour réduire les coûts et augmenter l'agilité

ITIL Gestion de la continuité des services informatiques

AdBackup Entreprise. Solution de sauvegarde pour Moyennes et Grandes Entreprises. Société Oodrive

WHITE PAPER. Quels avantages la déduplication offre-t-elle aux entreprises? Livre blanc Acronis

Technologie de déduplication de Barracuda Backup. Livre blanc

EMC DATA DOMAIN OPERATING SYSTEM

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

Symantec Backup Exec 11d pour Windows Small Business Server Editions Standard et Premium

VMWare Infrastructure 3

Veeam Backup and Replication

Protection des données avec les solutions de stockage NETGEAR

Moteur de réplication de fichiers BackupAssist

Description du logiciel Acronis Backup & Recovery 11.5

EMC AVAMAR. Logiciel et système de sauvegarde avec déduplication

DES SAUVEGARDES ET DES RESTAURATIONS DE DONNEES SANS CONTRAINTES DE LIEU NI DE TEMPS

Veeam Backup & Replication v6

Lettre d annonce ZP d IBM Europe, Moyen-Orient et Afrique,, datée du 20 octobre 2009

100% Swiss Cloud Computing

EVault Software. Solution globale de protection des données sur disque. Pierre Aguerreberry Directeur Alliances Europe, Moyen-Orient, Afrique

CA ARCserve Backup Option NAS (Network Attached Storage) NDMP (Network Data Management Protocol)

Sauvegarder automatiquement ses documents

Tivoli Storage Manager version TSM Server

Technologie Netapp. Novembre 2010

EMC AVAMAR. Logiciel et système de sauvegarde avec déduplication AVANTAGES CLÉS INCONVÉNIENTS DE LA SAUVEGARDE ET DE LA RESTAURATION TRADITIONNELLES

Synthèse sur la solution : La protection des données modernisée avec les solutions de stockage HP et Veeam

Veeam Backup & Replication

EMC DATA DOMAIN HYPERMAX

Analyse Concurrentielle Retrospect et ses concurrents

AdBackup Laptop. Solution de sauvegarde pour flotte nomade. Société Oodrive

Solution de sauvegarde pour flotte nomade

VIRTUALISATION : MYTHES & RÉALITÉS

CA ARCserve r16 devance Symantec Backup Exec 2012

Non-Stop. de vos Données. Acronis Backup & Recovery 11. Pouvoir compter sur ses données est indispensable!

Concepts et systèmes de stockage

LES 5 PRINCIPALES RAISONS DE DÉPLOYER MICROSOFT SQL SERVER SUR LE SYSTÈME DE STOCKAGE UNIFIÉ EMC VNX

Protection des données en environnement Windows

Copyright Arsys Internet E.U.R.L. Arsys Backup Online. Guide de l utilisateur

Symantec Backup Exec.cloud

Créca. Ajout aux livrets d informatique. Hiver 2014

Virtualisation CITRIX, MICROSOFT, VMWARE OLIVIER D.

Sauvegarde EMC pour solutions SAP HANA prêtes pour le datacenter. EMC Data Domain avec DD Boost

Analyse Concurrentielle Retrospect et ses concurrents

Gestion des sauvegardes

CA arcserve Unified Data Protection Livre blanc technique

Symantec NetBackup 7.5

Data Protection for EMC VSPEX Proven Infrastructure

EMC Retrospect 7.5 pour Windows. Logiciel de sauvegarde

MIGRATION ANNEXE SAINT YVES. 1 : L existant. Pourquoi cette migration Schéma et adressage IP. 2 : Le projet. Schéma et adressage IP.

Etat de l art de la déduplication. Copyright 2009 EMC Corporation. All rights reserved.

Symantec NetBackup 7 Plate-forme Symantec NetBackup : Une protection complète pour les informations stratégiques de l'entreprise

Livre blanc. Au cœur de Diskeeper 2010 avec IntelliWrite

Section I: Le Contexte du DATA CENTER Pourquoi l AGILITE est Nécessaire dans le DataCenter

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

Date : 01/10/12 Cours SISR1 Greta Lycée La Tournelle La Garenne Colombes

Sauvegarde de VMs : Veeam vs outils de sauvegarde traditionnels Les 10 meilleures raisons de choisir Veeam

Unitt Zero Data Loss Service (ZDLS) La meilleure arme contre la perte de données

Continuité de services et plan de reprise d activité

EVault Endpoint Protection en détails : Gestion de l entreprise, Sauvegarde, Restauration et Sécurité

Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long,

CA ARCserve Backup r12

OFFRES DE SERVICES SDS CONSULTING

Sauvegarde en ligne sécurisée SRXBackup 100 % Automatique. Disponible 24/7. Cryptage 256 bits.

ASSUREZ VOTRE CONTINUITÉ DE SERVICE EN CAS DE SINISTRE. Sauvegarde Restauration Migration Virtualisation P.R.A

stockage, pour des économies en termes de temps et de coûts. Avantages principaux

ASSUREZ VOTRE CONTINUITÉ DE SERVICE EN CAS DE SINISTRE. Sauvegarde Restauration Migration Virtualisation P.R.A

GSB/LOT 3 : Logiciel de backup

DATA VIRTUALIZATION ENGINE

Restauration rapide et fiable sur des plates-formes matérielles différentes, dans des environnements virtuels ou sur des sites distants.

Utiliser le cloud pour manager son PRA et son PCA (DRaaS ou PRA dans le Cloud)

SQL Server 2008 et YourSqlDba

Technologie SDS (Software-Defined Storage) de DataCore

VMWare. Vmware: machine virtuelle Un véritable pc avec : VmWare

Transcription:

Un backup est une copie supplémentaire des données pouvant être utilisée à des fins de restauration ou de reprise. Une copie de sauvegarde est utilisée en cas de perte ou de corruption de la copie primaire. Un backup est une copie des données (structurées et/ou non structurées) qui est stockée séparément des originaux. Premier constat, la plupart du temps, les personnes en charge du backup acceptent un rapport de backup réussi comme preuve que les données sont sécurisées, qu il n y aura pas de problème récupération des données en cas d incident majeur dans l infrastructure. «Qui parmi vous teste ses backups et effectue un restore complet de ses systèmes?» Attention, pour moi un backup traditionnel ne peut être considéré comme réussi qu à partir du moment ou vous avez effectué un restore des données et effectué une restauration complète d un serveur (bare metal restore). Un rapport du programme de backup n est pas une preuve suffisante. Il n est pas toujours nécessaire d effectuer un restore complet des données, on n a pas toujours l espace nécessaire pour cela, ni le temps. C est pour cela que dans la plupart des programmes se trouve l option d effectuer un test de

validation des données qui garanti que les données sélectionnées dans le jeu de backup sont complètes et restaurables en cas de crash du système. Cela ne permet pas de s affranchir d un test de restauration mais cela permet de ne pas le faire de façon trop régulière. Cette procédure peut être intégrée à l ensemble des processus de vérification quotidiens et automatiques de votre système de backup.

Un des facteurs les plus importants de perte de données est le facteur humain, c est-à-dire le formatage intempestif d un disque dur, bouger un rack de serveurs allumés, renverser un café, un employé mécontent qui supprime des données. Que faire contre cela? Un bon backup! Les autres types de source de perte de données sont pour la plupart du temps hardware, software, malveillant (virus), contre tout cela, on peut se prémunir, plus ou moins facilement avec des outils de monitoring du hardware, des antivirus Mais un backup peut aussi servir à retrouver une ancienne version d un document. Le plus important dans un backup, c est la restauration!

L histoire du backup est bien entendu liée au développement de l informatique. Très vite on s est rendu compte du coût en temps humain et en argent de la perte de données. On a donc cherché assez vite à se prémunir contre ce type de désagrément. Les premières sauvegardes ont été effectuées dans les années 50 sur des cartes perforées. Assez rapidement les sauvegardes se sont faites sur support magnétique. Les premiers disques dur étant extrêmement chers et volumineux, il n était pas concevable de les utiliser pour faire du backup. Il y a bien sûr eu l apparition de la disquette dans les années 70 qui a joué son rôle dans les backups (jusqu au Zip drive d Iomega ). Les CD-ROM, DVD et Blu-ray ont aussi eu leur succès mais surtout pour les particuliers. Depuis quelques années on assiste à un basculement du backup sur tape, qui fut le plus plébiscité, vers le backup sur disque beaucoup plus souple. On va revenir sur cette bataille tape vs disque un peu plus tard.

Aujourd hui et plus qu hier, le backup est confronté à de nombreux challenges d importance: L augmentation exponentielle du volume de données La dépendance de plus en plus grande du business à l IT La virtualisation Les Branch-Offices Les desktops/laptops Nous allons revenir plus en détails sur ces différents challenges dans les prochains slides.

Quelques faits et chiffres pour illustrer la croissance des données digitales dans le monde aujourd hui : Aujourd hui, tous les deux jours, l homme crée plus de données qu il n en a créé entre l aube des temps et 2003! (citation d Eric Smith, patron de Google) D ici 2020, le volume de données créé dans le monde va augmenter de 45 % par an pour atteindre un volume de 35 Zo (zetta octets, 10 exposant 21). Cette augmentation exponentielle du volume des données pose bien sûr la question de leur sauvegarde. Comment résoudre ce problème? Au CERN, lorsque le Large Hadron Collider tourne à plein régime il produit environ 40 To de données par secondes! Le flot de données généré est bien au-delà de la capacité de traitement actuel. Une majorité d évènements sont donc traités en ligne et éliminés. Au final, aujourd hui le LHC produit tout de même 15 million de Gigas soit 15 Peta octects de données chaque année.

Aujourd hui, il n est presque plus concevable de créer et de faire tourner un business sans une infrastructure IT. Cette dépendance ne fait que croître avec la multiplication des appareils connectés. Il est de plus en plus difficile pour un IT manager de pouvoir prévoir des plages de temps pour redémarrer un serveur. Le business demande aujourd hui une disponibilité maximale. Les fenêtres de backup se réduisent donc de plus en plus. Il faut donc que les programmes de backup soient les plus rapides possible et aient un impact minimum sur les systèmes de production.

La virtualisation des serveurs est maintenant devenue courante, voire généralisée en entreprise de par les bénéfices qu elle apporte. Mais elle pose aussi de nouveaux challenges : comment prendre en backup de manière la plus efficace possible les machines virtuelles? On peut distinguer deux méthodes pour prendre les backups : Guest level backup : prise du backup de la VM de façon classique, c est-à-dire via un agent installé dans la VM. Image level backup : prise du backup de la VM toute entière en général via des snapshots à partir de l hyperviseur. Attention, la majorité des programmes de backup qui proposent de prendre un image level backup, demandent quand même un guest level backup afin d assurer la cohérence des databases présentes dans les VM s. Tous les programmes de backup à l heure actuelle ne sont pas capable d offrir une restauration granulaire à partir d une image. Il est donc fréquent de devoir effectuer un backup «guest» ainsi qu un backup «image» afin de pouvoir effectuer une restauration granulaire des données ou de pouvoir restaurer une database de façon consistante.

La virtualisation de plusieurs machines sur un seul serveur physique entraîne également un niveau de charge très élevé au moment de la sauvegarde (CPU, RAM, Storage). Il faut donc trouver une solution efficace pour les sauvegardes.

Comment faire lorsque la société dont on doit prendre le backup a un site central sur lequel se trouve la majorité des serveurs et plusieurs petits sites sur lequel se trouvent un ou deux petits serveurs de fichiers? Une solution assez simple peut-être de répliquer les fichiers via par exemple le DFS de Windows. Cette solution est valide tant qu il n y a pas de base de données à répliquer. De plus, une bande passante assez importante est nécessaire pour effectuer ce type de réplication. Avec le DFS, les outils de reporting sont très pauvres et savoir si tout est bien répliqué relève du cauchemar. Le meilleur système à ce jour pour effectuer le backup de sites distants reste le backup avec déduplication à la source. Il permet de réduire drastiquement le volume de données à transmettre sur la ligne et réduit la fenêtre de backup. Cela permet aussi de centraliser la gestion et le reporting du backup. Suivant les systèmes, il est souvent possible de conserver une copie sur place (en général la dernière version) afin d accélérer la restauration des données.

Doit-on se fier aux utilisateurs afin de toujours bien copier leurs données sur les disques réseaux à leur disposition? Que faire avec les vendeurs qui sont rarement au bureau et qui donc ne vont peu ou pas utiliser les espaces réseau à leur disposition. Le volume de données critiques stocké en local sur les pc s et laptop s des utilisateurs est important. Comment faire pour en prendre la sauvegarde de façon transparente pour l utilisateur? Backup non-intrusif (se déroule en background) L utilisateur peut effectuer un restore lui-même Possibilité de recherche sur un document Fenêtre de backup réduite grâce à la déduplication à la source Démarrage automatique du backup dès la détection d une connexion internet

Voici quelques termes souvent utilisés dans le langage du backup : Incrémentiel : Exemple : une sauvegarde complète est réalisée le jour J. Le jour J+1, la sauvegarde incrémentielle est réalisée par référence au jour J. Le jour J+2, la sauvegarde incrémentielle est réalisée par référence au jour J+1. Et ainsi de suite. Si la restauration se porte sur un disque complet qui a été sauvegardé le jour J+4, on doit alors recopier sur disque la sauvegarde du jour J et les sauvegardes incrémentielles des jours J+1, J+2, J+3 et J+4 afin d'obtenir la dernière version de la totalité des données. Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+3, seule la dernière sauvegarde, ici l'incrémentielle, est utile. (source Wikipédia) Détail technique : Lors d'une sauvegarde incrémentielle, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci se voit attribuer la position de son marqueur à "faux". Différentiel : La restauration faite à partir de ce type de sauvegarde nécessite la recopie sur disque de la dernière sauvegarde complète et de la sauvegarde différentielle la plus récente. Avec notre exemple, si la restauration se porte sur un disque complet qui a été

sauvegardé le jour J+2, on doit alors recopier sur disque la sauvegarde complète du jour J et la sauvegarde différentielle du jour J+2 afin d'avoir la dernière version des données. Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+2 seule la dernière sauvegarde, ici la différentielle, est utile. Détail technique: Lors d'une sauvegarde différentielle, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci garde la position de son marqueur tel qu'il l'avait avant la sauvegarde. (source Wikipédia) Complet : La méthode la plus simple est la sauvegarde complète ou totale (appelée aussi "full backup") ; elle consiste à copier toutes les données à sauvegarder que celles-ci soient récentes, anciennes, modifiées ou non. Cette méthode est aussi la plus fiable mais elle est longue et très coûteuse en termes d'espace disque, ce qui empêche de l'utiliser en pratique pour toutes les sauvegardes à effectuer. Détail technique: Lors d'une sauvegarde complète, on va remettre à "0" l'attribut du fichier pour mémoriser le fait que le fichier a été enregistré. (source Wikipédia) Déduplication : En informatique, la déduplication (également appelée factorisation ou stockage d'instance unique) est une technique de sauvegarde de données, consistant à factoriser des séquences de données identiques afin d'économiser l'espace utilisé. Chaque fichier est découpé en une multitude de tronçons. À chacun de ces tronçons est associé un identifiant unique, ces identifiants étant stockés dans un index. L'objectif de la déduplication est de ne stocker qu'une seule fois un même tronçon. Aussi, une nouvelle occurrence d'un tronçon déjà présent n'est pas à nouveau sauvegardée, mais remplacée par un pointeur vers l'identifiant correspondant. Il existe différentes méthodes de déduplication : La déduplication hors ligne Les données à sauvegarder sont recopiées sur un espace disque tampon, et dans un deuxième temps une recherche des blocs en double est réalisée. Cette méthode nécessite un espace de stockage important. C'est le principe des solutions Falconstor ou Quantum DXi en firmware 1.x par exemple. 2. La déduplication en ligne Les données à sauvegarder sont analysées "à la volée", et une table d'index

des blocs identiques est gérée (solution EMC² Data Domain ou IBM ProtecTIER) La déduplication à la source Des agents répartis sur les serveurs à sauvegarder analysent les données à la source (solution EMC Avamar notamment) La déduplication est encore différenciée suivant le type de block en quels sont découpés les fichiers, c.à.d. de taille fixe ou de taille variable, par l algorithme qui permet le hashage des données (SHA1, MD5 ou propriétaire) La déduplication est variable aussi suivant le type de données. (Photos, fichiers, databases, films ) Synthetic backup : Un synthetic backup est le processus qui conduit à la création d un backup complet (full backup) à partir d une copie complète d un fichier effectuée dans le passé et d un ou plusieurs backup incrémentaux de ce fichier. Bare metal restore : Bare Metal Restore (BMR) est une expression anglaise du monde informatique désignant une technique où les données sont sauvegardées sous une forme telle que l'on peut restaurer un ordinateur "nu" (en anglais : bare), et le faire fonctionner sans aucune installation préalable (système ou logicielle). L'enjeu actuel est de permettre de restaurer très rapidement sur du matériel différent (par exemple d'une machine Dell vers une machine HP, ou autre) et sur des machines virtuelles (VMware, Microsoft-Virtual Server, etc.) en un minimum de temps d'immobilisation. Typiquement les données sauvegardées pour faire du BMR incluent le système d'exploitation nécessaire, les applications et les composants de données permettant de reconstruire ou de restaurer le système sauvegardé sur un matériel entièrement différent. Dans certains cas la machine cible destinée à recevoir la restauration doit disposer du matériel exactement identique à la machine source de la sauvegarde. (source Wikipedia)

La déduplication s assure que chaque objet unique n est sauvegardé qu une seule fois sur le serveur de backup. Les objets redondants sont éliminés à la source (sur le client) cela réduit donc drastiquement le volume de données à transférer sur les lignes réseau. Une fois que les données ont été prises en backup une fois, elles ne le seront jamais une deuxième fois. A l origine, le système de déduplication des données a été imaginé afin de diminuer l espace disque nécessaire pour stocker les backups, cela a eu comme effet collatéral de diminuer le temps nécessaire pour faire le backup ainsi que la charge imposée au réseau. Typiquement la déduplication offre les résultats suivants (pour la déduplication avec le système Avamar) : Le taux de déduplication sur un premier backup de fichiers est d environ 65% Le taux déduplication sur un premier backup d une base de données est de 35% Lors du backup journalier des données fichier on atteint un taux de 99,7% de déduplication des données. Lors du backup journalier d une base de donnée, on atteint un taux de 97% de déduplication. Il faut savoir que chaque constructeur utilise son propre algorithme de déduplication plus ou moins performant selon le cas.

Nous allons maintenant passer en revue les différents types de backup disponibles: Backup sur tape Backup VTL Backup sur disque, D2D (avec réplication) Backup vers disque et vers x (D2D2x) Snapshots et réplication

Les tapes sont le média historique le plus connu et sans doute encore un des plus utilisés pour effectuer le backup des données d une société. Qui parmi vous utilise encore un backup sur bande? Voyons ensemble les avantages du backup sur bande : Media solide, facilement transportable, beaucoup moins fragile qu un disque dur. Durée de vie très longue (30 ans sans problème). Un disque dur arrêté pendant un certain temps ne redémarrera sans doute pas, huile figée Coût faible du média. Coût plus faible que les disques pour le refroidissement, l alimentation électrique. Le groupe Gartner a estimé que 10 à 50 pour cent de l'ensemble des restaurations depuis une bande échouaient. Storage Magazine et Gartner ont signalé que 34 % des compagnies interrogées ne testent jamais une restauration depuis une bande, et que parmi celles qui la teste, 77 % ont fait l'expérience de dysfonctionnements. Un effet indésirable appelé «patinage» (en anglais shoe-shining, pour «

cirage de chaussures») se produit quand la bande est lue ou écrite par petits bouts. En effet, comme les têtes du lecteur sont conçues pour transférer les données depuis ou vers une bande qui se déroule de façon continue à une vitesse minimale, les lecteurs modernes rapides sont incapables d'arrêter la bande de façon instantanée. Le lecteur doit décélérer, puis arrêter la bande, rembobiner un peu en arrière, redémarrer et avancer à nouveau la bande au point où l'opération de lecture ou d'écriture s'est arrêtée. Si cette suite d'opérations se répète, le mouvement d'avant en arrière résultant ressemble au lustrage d'un objet avec un chiffon. Le patinage diminue les taux de transfert que l'on peut atteindre, ainsi que la durée de vie des bandes et du lecteur. Linear Tape-Open (ou LTO) est une technique de stockage sur bande magnétique au format ouvert. Elle a été développée à la fin des années 1990, conjointement par HP, IBM et la division magnetic tape de Seagate. Cette dernière entité a pris son indépendance quelques années plus tard, puis est devenue Certance, avant d'être rachetée par Quantum Corporation, qui était elle-même à l'origine du SDLT, le format qui dominait le marché avant le développement du LTO. Les différentes générations de LTO sont: LTO-1 : 2000, capacité native 100 Go, débit 20 Mo/s LTO-2 : 2002, capacité native 200 Go, débit 40 Mo/s LTO-3 : 2004, capacité native 400 Go, débit 80 Mo/s, ajout de la fonctionnalité WORM LTO-4 : 2006, capacité native 800 Go, débit 120 Mo/s, ajout de chiffrement matériel (256-bit AES-GCM) LTO-5 : 2010, capacité native 1,5 To, débit 140 Mo/s LTO-6 : annoncé, capacité prévue 3,2 To, débit prévu 210 Mo/s LTO-7 : annoncé, capacité prévue 6,4 To, débit prévu 315 Mo/s LTO-8 : annoncé, capacité prévue 12,8 To, débit prévu 472 Mo/s Les capacités et les débits indiqués correspondent à des données non compressées. On considère un ratio de 2:1 pour les 5 premières générations. Un ratio de 2,5:1 est attendu pour les générations suivantes. Les tapes ont certes un coût de revient assez faible au média mais il faut démultiplier ces médias. Il faut également tenir compte de la manutention de ces tapes (roulement des tapes, délocalisation en externe Merak par exemple.) Attention, le RPO avec un système de tape traditionnel peut être d une

semaine et non comme souvent perçu de 24 heures. En effet, si comme cela se passe souvent, les tapes du full backup du week-end sont envoyées chez Merak le lundi, que le tape library ou la salle serveur prend feu, tous les backups incrémentaux de la semaine, restés dans le robot, sont irrémédiablement perdus

Le backup vers disque représente la nouvelle génération de programmes de sauvegarde. Les backups vers disques doivent toujours être répliqués vers un deuxième site si l on veut s assurer d une parfaite redondance du backup et de la plus grande sécurité possible. Passons maintenant les différents types de backup vers disque en revue : VTL ou Virtual Tape Library Il s agit d un système d émulation de tape sur un stockage disque. Avantage du VTL, pas besoin de changer le programme de backup. Beaucoup plus rapide que les tapes drives. Peut être cloné vers des tapes réelles (D2D2T) La solution VTL est une solution intermédiaire entre les tapes et le D2D Disk to Disk (D2D) Backup directement vers un disque, supporté par la plupart des éditeurs de programme de backup Accès aux fichiers plus facile Plus de limitations liées aux tapes (random access storage et pas séquentiel), de plus le D2D supporte plus de streams concurrents de données que le tape. On peut par exemple effectuer un backup et un restore en même temps

Snapshots Image presque instantanée des données à un instant T Prennent de la place sur le stockage de production souvent très cher Sont dépendants des données d origine Permettent de revenir à un état précédent Continuous data protection ou CDP Copie et réplique les changements de fichiers en temps réel. Le CDP est seulement possible sur disque parce qu il a besoin d un accès aléatoire vers ses données sauvegardées.

Le backup vers disque tout seul, bien que déjà fiable, ne peut exister sans être répliqué vers un deuxième média. Il s agit du même principe appliqué depuis toujours avec le backup sur tape, on sort de la société un full backup une fois par semaine pour le placer dans un lieu sûr. De cette façon en cas de désastre majeur dans l entreprise, les données de celle-ci ne sont pas perdues. Il faut donc avec le backup vers disque penser à une réplication, sauf qu à la différence du backup sur tape, cette réplication peut s effectuer plusieurs fois par jour. Plusieurs options existent pour cela : L export des données du backup vers un système de tapes. La plupart des systèmes de backup D2D offrent cette option en standard ou via un plugin. La réplication asynchrone des données du backup vers un deuxième datacenter. Une réplication des données vers le cloud, par exemple Amazon S3.

On constate que de plus en plus de sociétés utilisent les fonctions de snapshot et réplication de leur système de stockage comme solution de backup. Ceci ne peut en aucun cas être considéré comme une solution de sauvegarde fiable, car une corruption à la source peut entrainer l indisponibilité des données sur les réplicas. Cette solution est par contre idéale dans le cas d une récupération après désastre. Il existe deux types de réplication, la réplication synchrone et la réplication asynchrone. Voyons maintenant en détail le snapshot et les différents types de réplication.

Qu est-ce qu un snapshot? Un snapshot est une image d un système logique prise à un instant «T». Un snapshot peut être utilisé pour revenir à une situation précédente. La création d un snapshot consiste à prendre une «photo» du volume logique cible (c est un processus presque immédiat) et de commencer à enregistrer les modifications apportées à ce volume. Avantage : peut-être utilisé comme solution de sauvegarde. Les snapshots permettent de stocker une image statique d un volume logique à un instant précis. On peut prendre un backup de ces snapshots et il contiendra les données présentes sur le volume logique au moment de la prise du snapshot. Limites des snapshots : Un snapshot n est pas une sauvegarde complète d un système. Il enregistre uniquement les changements apportés au volume logique mais ne contient pas les données de celui-ci. Un snapshot va occuper en moyenne 15 à 20% de la taille du volume de base. Comme l espace disque sur les systèmes performants tels que les SAN s est fort cher, c est une donnée à prendre en compte lors de la mise en place des snapshots. Pour des SAN s de grande taille ou d autres environnements de stockage de grande capacité, la prise de snapshots et leurs réplications vers un deuxième

SAN est souvent la seule manière d effectuer une sauvegarde de ces systèmes.

Dans le cas d une réplication synchrone, lorsque qu un IO est généré par un programme et est écrit sur le système primaire, il est répliqué immédiatement vers le système secondaire et une fois que cet IO est écrit sur le second système, l acquittement est envoyé à l application qui a généré l IO. Afin de ne pas ralentir le système et de ne pas générer des temps de réponses trop lents, une réplication synchrone implique une bande passante très élevée. Typiquement, entre deux systèmes qui se trouvent dans le même réseau local (LAN). On utilise la réplication synchrone pour augmenter la disponibilité d une base de données critique (la réplication synchrone n entraine pas de perte de données non comitées et donc pas de perte de cohérence de la database).

Lors d une réplication asynchrone, les IO sont mis dans une file d attente et sont envoyés par paquets vers le serveur de réplication. L acquittement vers l application se fait immédiatement. Une réplication asynchrone va utiliser beaucoup moins de bande passante qu'une réplication synchrone (les données peuvent être compressées, dédupliquées). La réplication asynchrone est parfois utilisée pour faire le backup (d un SAN par exemple) mais il ne faut pas oublier que comme il s agit d une réplication, tout est répliqué, y compris les erreurs, suppressions accidentelles

Un backup est plus qu'une simple copie de vos données, un backup vous permet de revenir en arrière, ceci implique donc une période de rétention des données qui sera plus ou moins longue suivant le type de données et suivant les besoins de votre entreprise. Un snapshot, un robocopy, de la réplication, sont des exemples de ce qui dans l esprit de beaucoup passe pour être du backup mais qui en définitive ne l est pas. Par contre, ces différentes méthodes peuvent faire partie d une stratégie générale de protection des données d une société, d une stratégie de Disaster Recovery.

Depuis le début de l informatique, les backups ont été pris sur support magnétique : les tapes. En 1990, les disques durs avaient une capacité de 100MB environ, les tapes avaient une capacité de 5GB, cela donnait un ratio de 1:50 en faveur de la tape. En 2010, les disques durs ont une capacité de 2TB et les tapes LTO5 ont une capacité de 1,5TB, le ratio est donc de 1:0,75. Cette diminution du ratio donne déjà une bonne indication sur la viabilité des tapes aujourd hui. Avantage des tapes : Media solide, facilement transportable, beaucoup moins fragile qu un disque dur. Durée de vie très longue (30 ans sans problème), un disque dur arrêté pendant un certain temps ne redémarrera sans doute pas, huile figée Coût faible du média Coût plus faible que pour les disques pour le refroidissement, l alimentation électrique. Avantage du backup D2D : Vitesse du backup et donc diminution des fenêtres de backup ce qui permet

de faire plusieurs backups par jour si nécessaire (RPO plus court). Vitesse de restauration des fichiers et disponibilité du système (pas besoin de faire revenir des tapes d un stockage externe). Le gros avantage des disques est d être un système à accès aléatoire comparé aux tapes qui doivent être indexées et qui sont lues et écrites de façon séquentielle. Automatisation complète des procédures de sauvegarde y compris l externalisation des données (suppression de la rotation des tapes et de leur externalisation). Diminution du RPO. Veritas a démontré que les backups sur disque sont en moyenne 7 fois plus rapides que les tapes et que les restaurations sont généralement 20 fois plus rapides. Tout cela bien entendu en fonction du hardware utilisé. Il est bon de tenir compte lors du choix d un système de backup que malgré un coût encore plus élevé pour le backup D2D ce dernier permet une reprise des activités de la société plus rapide que si la restauration doit se faire à partir de tapes. Cela signifie que les utilisateurs sont à nouveau productifs plus rapidement après un gros crash. On peut se permettre l analogie suivante : Au début du 20 e siècle, le cheval était le moyen de transport le plus populaire, le plus fiable et le moins cher par rapport à l automobile naissante

Pour définir la stratégie de backup qui correspond le mieux à votre entreprise, il y a un certain nombre de points dont il faut tenir compte. La valeur des données. Il est très difficile d estimer la valeur globale de vos données. La plupart des dirigeants d entreprise sont hésitants à investir beaucoup d argent dans un système de backup performant et ne voient pas le backup pour ce qu il est : une assurance. Une assurance, cela coûte cher, mais on se rend compte de la plus value de celle-ci le jour où son appartement est cambriolé par exemple. Imaginez que vous perdiez un an de données de comptabilité, que se passera-t-il pour votre entreprise? Ou un an de contrats? Le département IT n est pas toujours en mesure de juger de la valeur des données de toutes les entités de la société. Une étude récente de Gartner montre que 90% des entreprises qui ont souffert d une perte de données majeure mettent la clef sous la porte dans les deux années qui suivent. La valeur de vos données est la valeur de votre entreprise. Le RPO et RTO sont deux notions fondamentales, je les aborderai dans le slide suivant. Le reporting. Il est indispensable que votre système de backup soit livré avec un système de reporting intégré et performant. Cela vous permet bien sûr de savoir si vos backups tournent correctement, mais au-delà cela peut

vous permettre de vérifier que vous sauvegardez bien l ensemble de vos données Une solution unifiée? L utilisation d une solution unifiée qui permet de prendre en backup le plus grand nombre de plateformes et de programmes ou databases différents vous fera gagner du temps et de l argent.

Après avoir passé en revue quelques notions essentielles du backup, en voici une autre qui est primordiale dans la définition de votre stratégie de backup et de disaster recovery. Le Recovery Point Objective, c est-à-dire la durée maximale d enregistrement des données qu il est acceptable de perdre en cas de sinistre. Le RPO va définir la fenêtre de sauvegarde et l intervalle entre deux sauvegardes. Cela va également définir le type de backup que votre entreprise va devoir utiliser afin d atteindre ce RPO. En effet un backup toutes les 24 heures ne va pas demander la même infrastructure ni le même type de programme qu une sauvegarde en continu. Le RTO ou Recovery Time Objective définit la durée acceptable avant la reprise d activité après un crash du système. Il s agit donc du temps nécessaire à la remise en ligne, à la restauration des données de votre entreprise, voire à la réinstallation des serveurs Malheureusement, plus les temps du RPO et du RTO sont courts, plus chère sera la solution à mettre en œuvre pour atteindre ces objectifs. Il est également bon de se rendre compte que toutes les données et systèmes de l entreprise n ont pas besoin du même RPO-RTO. L ERP de votre entreprise aura un RTO beaucoup plus court que le système de messagerie interne ou que votre serveur FTP par exemple.

«Qui a défini cela dans votre entreprise?» «Est-ce que cela a été discuté lors de la mise en place de votre système de backup?» «N oubliez pas d impliquer les responsables du business dans cette discussion»

Quels sont les points à vérifier lors de l évaluation de votre système de backup? Vérifier que vos backups tournent dans la fenêtre qui leur est allouée Vérifier que toutes les données et applications sont bien sauvegardées Vérifier que toutes les données non critiques ne sont pas sauvegardées (fichiers ISO, programmes d installation, photos de vacances des employés) Vérifier que les données peuvent être restaurées de façon efficace et exacte Identifier les limitations et les besoins de l infrastructure de backup Identifier les faiblesses du backup (single point of failure) Vérifier que les programmes et les agents sont bien mis à jour Identifier le moyen de prolonger la vie de vos équipements Identifier les nouvelles technologies dont votre infrastructure pourrait bénéficier Fournir les informations nécessaires pour effectuer un budget Vérifier que tous les processus de restauration (BMR ) sont bien décrits

Une fois que vous avez un backup D2D qui est répliqué vers un site externe, en cas de problème majeur, vous pouvez, grâce à la copie externe de votre backup, rétablir relativement rapidement et facilement un environnement de travail fonctionnel. Si vous avez pris des images complètes de vos serveurs, vous pourrez les virtualiser dans le cloud, soit chez votre provider, si celui-ci fourni cette option, soit chez Microsoft Azure, soit chez tout autre fournisseur d infrastructure cloud. Cette option vous permet de reprendre vos activités le plus vite possible après un désastre majeur ; RTO plus court.

Pour conclure cette présentation, je vais répéter la phrase d introduction : «le backup : faites les bons choix». Nous avons vu tout au long de la présentation que les solutions sont multiples et variées afin d effectuer un bon backup. Toutes ne vous conviendront pas. Chaque entreprise a un environnement informatique différent qui demandera un type de backup différent suivant les RPO et RTO voulus. Il est important de retenir que l IT manager seul ne doit pas prendre la décision mais qu il est bon d également y inclure les responsables du business. Enfin, Connectis est là pour vous conseiller et vous aider à définir vos besoins dans le domaine du backup. Merci de votre présence et de votre écoute attentive.