Technologie de déduplication de Barracuda Backup Livre blanc
Résumé Les technologies de protection des données jouent un rôle essentiel au sein des entreprises et ce, quelle que soit leur taille. Toutefois, elles posent de nombreux défis en termes d optimisation de l activité. Barracuda Backup offre une solution entièrement intégrée et aux capacités optimisées, à la fois simple à déployer, robuste et sécurisée. La technologie de déduplication de Barracuda, fonctionnalité inhérente à tous les produits Barracuda Backup, permet aux entreprises de réduire considérablement leurs besoins en matière de capacité et de bande passante, ainsi que leurs coûts de sauvegarde. Pour les entreprises protégeant plusieurs sites, les technologies de stockage sur le cloud et de déduplication globale de Barracuda permettent d assurer la protection des réseaux distribués tout en réduisant l encombrement du stockage de sauvegarde. RELEASE 1 Défis relatifs au stockage de sauvegarde Tant qu il y aura des données et que leur croissance ne cessera d augmenter, des efforts seront déployés pour les protéger. Bien que les défis relatifs à la croissance des données ne soient pas nouveaux, ces dernières évoluent à un rythme très rapide. De nombreuses entreprises ont donc essayé de répondre à leurs besoins croissants de conservation et de stockage à l aide de moyens classiques de sauvegarde et de stockage sur des supports externes (sur bande ou réseau SAN/NAS, par exemple). Non seulement ces pratiques sont souvent complexes et longues, mais des défaillances matérielles et des erreurs humaines sont susceptibles de se produire. Le fait d utiliser des supports externes standard pour stocker les sauvegardes ne permet pas de résoudre efficacement le problème de stockage. À long terme, cette solution s avère plus coûteuse pour les entreprises que si ces dernières investissaient dans une solution plus efficace dès le départ. L optimisation des capacités joue un rôle crucial, quelle que soit la plateforme de sauvegarde. Au-delà des contraintes en matière de capacité, de nombreuses entreprises ne peuvent pas centraliser leur infrastructure informatique, ce qui génère des frais importants liés au personnel informatique ou une protection insuffisante, voire inexistante au niveau du site distant. Les supports sur bande et autres supports externes n évoluent pas de manière efficace sur les sites et requièrent une intervention supplémentaire du personnel informatique local/distant afin d assurer des sauvegardes cohérentes et de favoriser la croissance. Les entreprises qui déploient des connexions site à site ont tendance à sauvegarder les sites distants dans un centre de données principal, entraînant ainsi la saturation de la bande passante ainsi que de longs délais de sauvegarde et de restauration. Une technologie telle que la déduplication, qui peut réduire considérablement le volume de données à transmettre, peut éviter la surcharge des réseaux d entreprise et réduire les délais de sauvegarde/restauration. Qu est-ce que la déduplication? La déduplication est un processus qui répartit les fichiers et autres données en «segments» et qui utilise une base de données de suivi pour s assurer qu une seule copie de chaque segment est stockée parmi toutes les données de sauvegarde. Pour les sauvegardes client suivantes, les données entrantes sont comparées à celles de la base de données de suivi afin de déterminer les segments ayant été protégés. Seuls les segments uniques sont transférés et stockés. Par exemple, si cinq serveurs différents sauvegardent des données sur une appliance Barracuda et s il s avère qu un même segment de fichiers est présent sur chacun de ces serveurs, une seule copie du segment est alors stockée sur l appliance, alors que de petits pointeurs évaluent la façon dont ce segment doit être réhydraté (recompilé) sur les cinq périphériques au cours d une restauration. La base de données de suivi garantit que ces segments sont conservés jusqu à ce que toutes les sauvegardes renvoyant à un segment donné aient été supprimées. Étant donné que seule la portion unique de données est stockée par le serveur, les besoins en matière de capacité s en trouvent considérablement réduits. Au cours d une restauration, un fichier est réhydraté en fonction des informations contenues dans la base de données de suivi. Il est ensuite soumis à des fins de récupération. Technologie de déduplication de Barracuda Les fournisseurs proposent plusieurs types de technologies de déduplication. Les différences que cela implique peuvent avoir un impact sur les résultats des administrateurs informatiques. Une technologie de déduplication plus ancienne et plus simpliste, appelée «post-traitement», consiste à attendre qu une tâche de sauvegarde finisse la procédure d écriture sur le disque avant de lancer le processus de déduplication et de réplication, prolongeant ainsi le délai jusqu à ce que les données soient entièrement protégées. La charge sur les systèmes locaux s en trouve accrue. En effet, les données 2
doivent être traitées sur le disque à trois reprises avant d être répliquées (écriture en tant que données de sauvegarde, lecture à des fins de déduplication et écriture en tant que données dédupliquées). Étant donné que la déduplication post-traitement requiert la duplication de la capacité de stockage, pour le stockage de l ensemble de données de sauvegarde et le stockage des données dédupliquées, cette technologie entraîne une utilisation inefficace des capacités. Dans certains cas, les fournisseurs utilisant la déduplication post-traitement doivent délester le stockage en transférant les données sur des supports externes (bande ou disque, par exemple) afin de répondre aux exigences en matière de conservation des données. Au lieu d utiliser la déduplication post-traitement, Barracuda Backup a créé sa propre technologie de déduplication en ligne (Illustration 1). Cette technologie permet à l appliance de procéder à la déduplication en une seule étape. Les données sont alors absorbées et la capacité de stockage superflue requise par la déduplication post-traitement (processus en deux étapes et plus lent) n est alors plus nécessaire. La technologie de déduplication en ligne de Barracuda permet aux entreprises de réaliser des économies. En effet, il n est plus nécessaire de disposer d un dispositif de stockage plus volumineux, dédié à la conservation des données absorbées, pour que la déduplication puisse commencer. Cette méthode de déduplication permet également de réduire les risques de perte de données, en accélérant le traitement des sauvegardes et la réplication complète. En effet, les données sont mises en attente à des fins de réplication pendant le traitement de la tâche de sauvegarde. Le déploiement d une appliance Barracuda Backup améliore considérablement la reprise après sinistre en réduisant le temps nécessaire pour obtenir les données hors site via la déduplication en ligne et la réplication instantanée. Étant donné que les données sont dédupliquées en ligne, elles peuvent être prêtes pour la réplication plus rapidement qui si elles devaient être traitées à la fin du processus de sauvegarde. En outre, comme il est inutile d absorber l ensemble de données dans son intégralité avant le début de la réplication, il est possible de transférer les données hors site lors de leur sauvegarde et de leur déduplication, assurant ainsi une protection hors site plus rapide. Points de comparaison entre la déduplication post-traitement et la déduplication en ligne de Barracuda : Coût: étant donné que la déduplication post-traitement requiert un espace de stockage avant que les données ne puissent être dédupliquées (selon la taille de votre ensemble de données), un périphérique plus volumineux et plus coûteux est souvent requis. Grâce à la solution en ligne de Barracuda, un périphérique plus volumineux s avère inutile. Durée: pour la déduplication post-traitement, il est nécessaire d attendre la fin de la tâche de sauvegarde avant de pouvoir lancer le processus de déduplication et répliquer les données. Même si cela semble accélérer le processus de sauvegarde, en réalité les données ne sont pas complètement protégées car les processus de déduplication et de réplication ne sont pas encore terminés. Ce traitement séquentiel et cette méthode en plusieurs étapes peuvent retarder considérablement la protection des données par rapport à la déduplication en ligne en temps réel et à la réplication simultanée. Risques encourus: avec la déduplication post-traitement, le délai de reprise après sinistre est prolongé et des défaillances au sein du processus post-traitement en trois étapes peuvent favoriser la corruption d un ensemble de données. En cas de problème réseau ou de panne d un site, une perte de données est possible, même si la tâche de sauvegarde est signalée comme étant terminée. Illustration 1. Déduplication en ligne Déduplication en ligne Déduplication Déduplication post-traitement 2. Déduplication 1. Stockage 3. Stockage Écriture Lecture Écriture 3
Méthodologie de déduplication de Barracuda Barracuda Backup s appuie sur une déduplication en trois étapes afin de réduire la consommation de bande passante et les frais de traitement des sauvegardes, mais aussi d optimiser l utilisation des capacités : déduplication source,. Déduplication source: les données locales sont dédupliquées à la source, envoyées à l appliance Barracuda Backup sous leur forme dédupliquée, réduisant ainsi la consommation de bande passante LAN, puis envoyées au serveur local. On appelle également cette étape la «déduplication côté client». Déduplication cible: les données sont dédupliquées directement sur l appliance de sauvegarde des différentes sources, réduisant ainsi le volume de données devant être mis en cache et répliqué. Déduplication globale: les données sont dédupliquées sur tous les serveurs locaux ayant été répliqués vers une appliance centrale ou dans le cloud. Source : La déduplication source est mise en œuvre via l agent Barracuda Backup Agent. Lors de son installation, une petite base de données est créée sur le serveur afin de conserver une trace des segments de données, de sorte que seules les données uniques détectées par l agent soient compressées et envoyées à l appliance à des fins de traitement, réduisant ainsi le trafic réseau et la fenêtre de sauvegarde (Illustration 2). Illustration 2. Déduplication source client Barracuda Backup Base de données Compression et de suivi BBA déduplication des données Données dédupliquées Pour les sauvegardes VMware, Barracuda utilise VADP (vstorage APIs for Data Protection) de VMware pour sauvegarder les disques virtuels. Grâce à VADP, Barracuda peut utiliser la fonction CBT (Changed Block Tracking, suivi des blocs modifiés) pour n envoyer que les segments uniques à l appliance Barracuda Backup (Illustration 3). Illustration 3. Fonction CBT A B C A B C D A B C D E Bloc 1 Bloc 2 Bloc 3 Déduplication VMware vsphere VMware vsphere A B C D E Déduplication côté client Données dédupliquées Stockage dédupliqué A B C D E 4
Pour les sauvegardes Microsoft Hyper-V, l agent Barracuda Backup Agent réduit la fenêtre de sauvegarde en dédupliquant les fichiers VHD sur le serveur hôte afin de réduire le volume de données envoyé à l appliance de sauvegarde. Cible : La déduplication cible s exécute sur l appliance Barracuda Backup afin d éliminer la redondance entre tous les agents locaux et de réduire la capacité cloud et le volume de cache local requis pour stocker les sauvegardes. Les entreprises sauvegardant des systèmes de fichiers SAN ou NAS (Illustration 4), des environnements VMware et des partages de fichiers ne peuvent pas utiliser la déduplication source, laissant alors la déduplication cible comme méthodologie principale. Illustration 4. Déduplication cible Analyse des données pour les parties en double Envoi des données à l'appliance Barracuda Backup Conservation des parties uniques seulement Globale : La déduplication globale est mise en œuvre sur une appliance utilisée comme cible de réplication centrale ou dans le cloud. Elle permet d éliminer la redondance entre les appliances de sauvegarde de l infrastructure mondiale et permet aux entreprises de réduire la capacité requise pour stocker les données de stockage sous forme compressée et chiffrée (Illustration 5). Illustration 5. Déduplication globale Globally Deduplicated Data Stored in Compressed/Encrypted State Barracuda Backup Servers Deduplicated Data Client Client Client Barracuda Backup s appuie sur la déduplication en trois étapes pour les sources de données multiples, comme décrit dans le tableau suivant: 5
Type de source de données Méthode de sauvegarde Méthode de déduplication Microsoft Exchange Server Microsoft SQL Server Microsoft Hyper-V Microsoft Windows Microsoft Active Directory Microsoft SharePoint Barracuda Windows Backup Agent Lotus Domino Server Systèmes Linux Novell Open Enterprise Server 2 SP2.0+ Mac OS X Windows Volume Shadow Copy Service (VSS) Barracuda Linux Backup Agent Barracuda Linux Backup Agent Barracuda Macintosh Backup Agent Unix CIFS/SSHFS Déduplication Network Addressable Storage Serveur VMware et invités CIFS/Listes de contrôle d'accès (ACL) VDAP avec fonction CBT (Changed Block Tracking) Mise en œuvre de la déduplication Barracuda Déduplication Barracuda Backup offre une technologie de déduplication en ligne au niveau des blocs, de longueur variable et axée sur les applications, permettant ainsi une réduction maximale des données et des besoins minimum en matière de capacité. Elle permet donc de réduire l encombrement de stockage, les exigences relatives à la bande passante et les délais de sauvegarde/restauration. Pour les ensembles de données standard sauvegardés au fil du temps, les utilisateurs peuvent constater une réduction des données de 20 à 50 fois, en moyenne, suite à l utilisation du processus de déduplication en trois étapes. La longueur des segments de données sauvegardées utilisés lors de la déduplication dépend du type et de la taille du fichier. Trois hachages uniques (empreintes numériques) sont ensuite attribués à chaque segment : MD5sum, SHA1 et taille du fichier. Chaque hachage est unique à chaque segment est stocké dans une base de données par l agent Barracuda Backup Agent qui s exécute sur le serveur local, ainsi que dans une base de données de l appliance locale. Au cours de la sauvegarde, chaque valeur de hachage calculée est comparée aux valeurs des segments déjà traités. Si la valeur est unique, le segment est transmis à l appliance. Dans le cas contraire, seul un petit pointeur est envoyé à l appliance. Une fois les données ajoutées à l appliance Barracuda Backup locale, les hachages sont de nouveau comparés entre tous les agents. En cas de détection de doublons, l appliance stocke une seule copie des données sur l appliance locale et prend note qu elles ont été sauvegardées et qu il est possible de les restaurer sur tout serveur demandant le hachage. Il est nécessaire de respecter les informations suivantes pour obtenir des performances optimales de l agent Barracuda Backup Agent: Taille de la base de données de déduplication La base de données de déduplication locale constitue une petite partie de la taille totale du système de fichiers. Elle augmente de manière linéaire en fonction du volume total de données dédupliquées stockées. Lors du dimensionnement, prévoyez une base de données d environ 1 à 3 Go par téraoctet de données dédupliquées stockées (par exemple, 2 To de données dédupliquées équivaut à une base de données de déduplication de 4 Go). Utilisation du processeur L agent Barracuda Backup Agent peut utiliser davantage le processeur lors d une sauvegarde. En effet, il utilise le processeur de la machine client lors du processus de déduplication source, ainsi que lors de la compression. L agent Barracuda Backup Agent local ne définit aucune limite pour restreindre les ressources de processeur de la machine client lors d une sauvegarde et d une restauration. 6
Utilisation de la mémoire L agent Barracuda Backup Agent utilise davantage la mémoire du système lors d une sauvegarde. L agent utilise la mémoire de la machine client pour stocker les données de sauvegarde avant de commencer la compression et d envoyer les hachages à l appliance Barracuda Backup. Il utilise jusqu à 512 Mo de mémoire lors du processus de sauvegarde pour stocker les segments de données, lui permettant ainsi de parcourir rapidement le système de fichiers. Comparaison de la solution Barracuda et des autres méthodes de déduplication Les produits non dotés de fonctions de déduplication et de détection de changements sauvegardent sans cesse les mêmes données, créant ainsi de longues fenêtres de sauvegarde et imposant des exigences excessives en matière de stockage et de bande passante. La technologie de déduplication de Barracuda Backup réduit le délai de sauvegarde et permet aux clients de répliquer leurs sauvegardes pendant la nuit. Barracuda intègre trois types d options de déduplication, offrant ainsi une solution à la fois robuste et facile à utiliser. Cette section étudie les caractéristiques spécifiques de la technologie de Barracuda. Blocs fixes/blocs variables La déduplication à blocs fixes constitue la méthode de déduplication la plus simple. Cette méthode examine les segments spécifiques d une taille donnée de l ensemble de données en cours de sauvegarde. Étant donné que la taille des segments ne change jamais, la déduplication à blocs fixes utilise un volume limité du processeur et du traitement de disque. Toutefois, la réduction est limitée car un bloc prédéfini manque les données en double sur certains ensembles de données par rapport à des types de déduplication plus avancés. La déduplication à blocs variables et axée sur les applications est une méthode avancée qui examine l ensemble de données/l application en cours de sauvegarde, puis augmente ou diminue la taille du bloc en conséquence afin d obtenir des résultats optimaux. Étant donné que la taille des segments change en fonction des données sauvegardées, des ressources de processeur et de disque supplémentaires sont requises pour exécuter la déduplication. Cependant, la réduction des données s en trouve optimisée. Barracuda Backup utilise la déduplication à blocs variables pour les trois étapes. La technologie avancée de déduplication à blocs variables de Barracuda analyse le type de données et la taille des segments, définissant alors une taille de bloc afin d obtenir le meilleur niveau de déduplication, sans nuire au processeur et au traitement de disque au cours du processus. En tant qu appliance matérielle, Barracuda Backup peut fournir une déduplication à blocs variables sans pour autant charger les ressources de processeur et de disque, optimisant ainsi les caractéristiques matérielles et logicielles sous-jacentes de l appliance de sauvegarde, pour un taux maximum d absorption de données. Déduplication logicielle/déduplication matérielle Déduplication logicielle En règle générale, la déduplication logicielle est un module complémentaire/plug-in fourni par un vendeur de logiciels afin de réduire l encombrement de stockage requis pour stocker les données de sauvegarde sur des supports. Elle est souvent utilisée en complément de la compression avant l écriture sur un support. Avec la déduplication logicielle, les entreprises doivent respecter une configuration matérielle stricte pour leur déploiement en raison des frais supplémentaires qu engendre la déduplication sur un environnement. Même si la déduplication logicielle est souvent moins coûteuse et est fournie avec un logiciel de sauvegarde, le logiciel ne représente qu une fraction du déploiement de sauvegarde réel. Il n est pas rare que les entreprises ignorent les exigences générales du modèle strict de déduplication logicielle. Déduplication matérielle La déduplication matérielle représente un dispositif de stockage dédié qui fait office de cible pour le logiciel de sauvegarde ou qui dispose de sa propre solution logicielle intégrée. Cette solution est devenue la méthode de déduplication la plus utilisée par la plupart des moyennes et grandes entreprises en raison de son efficacité et de ses performances. Grâce à la déduplication matérielle, les ressources supplémentaires requises pour dédupliquer les données ne sont plus nécessaires. L appliance matérielle fonctionne en réduisant l utilisation intensive du processeur et du traitement de stockage liée à la déduplication, éliminant ainsi la nécessité de disposer de plusieurs périphériques pour protéger l environnement. 7
Barracuda Networks Technologie de déduplication de Barracuda Backup Conclusion La technologie de déduplication de Barracuda Backup simplifie la protection des données et réduit les frais généraux, le nombre de supports requis et les coûts de réseau. La solution de déduplication à longueur variable, en ligne et en trois étapes de Barracuda permet un stockage à long terme efficace des serveurs protégés, et la réduction du délai de sauvegarde. La technologie de déduplication de Barracuda permet aux entreprises de protéger des bureaux distants avec des ressources limitées et ce, depuis un site centralisé. Les entreprises souhaitant protéger des environnements virtuels peuvent atteindre leur objectif de point de reprise et réduire leur encombrement de stockage en utilisant la fonction CBT dans les environnements VMware et Hyper-V et en stockant uniquement les changements nécessaires dans l ensemble de données. À propos de Barracuda Networks Inc. (NYSE: CUDA) Barracuda Networks protège les utilisateurs, les applications et les données de plus de 150 000 sociétés à travers le monde. L entreprise s est ainsi forgé une réputation de leader et de fournisseur de référence pour tous ceux qui recherchent des solutions puissantes et simples d utilisation à prix attractif. Barracuda Networks place le client au cœur de ses activités, une approche qui a fait ses preuves et qui permet au client de bénéficier de solutions IT à haute valeur ajoutée, basées sur un principe d abonnement, pour la protection de ses données et de l ensemble de son infrastructure. Pour plus d informations, rendez-vous sur barracuda.com. Barracuda Networks et le logo Barracuda Networks sont des marques déposées de Barracuda Networks, Inc. aux États-Unis. Toutes les autres marques sont la propriété de leurs détenteurs respectifs. Barracuda Networks 16 Place Vendome 75001 Paris France t: +33 (0) 153 45 28 18 e: office@barracuda.com w: barracuda.com