Nouvelles stratégies et technologies de sauvegarde Boris Valera Laurent Blain
Plan Contexte Les nouveaux enjeux de la sauvegarde La sauvegarde des machines virtuelles La déduplication Les architectures à base de disques durs La sauvegarde des postes nomades Nos choix
Contexte Nos anciennes architectures de sauvegarde Une «grosse» robotique avec lecteurs LTO2 ou SDLT600 Un SAN Fiber Channel d'interconnexion Un serveur de sauvegarde Pourquoi ce changement? Fin de garantie de l'ensemble Problèmes de performances Manque de capacité Prise en compte des postes nomades
Nouveaux enjeux Plus de données à sauvegarder L'explosion de la volumétrie La virtualisation Des usages différents Le nomadisme Autonomie des utilisateurs D'autres fonctionnalités PRA Archivage
Nouveaux enjeux L'explosion de la volumétrie Ex: chez nous entre +20% et +25% par an Fenêtre de sauvegarde trop courte Restauration de plusieurs To? La virtualisation Création facile de serveurs virtuels «Multiplication des serveurs Sauvegarde de VM Gestion des serveurs Coût du logiciel
Les postes nomades Nouveaux enjeux Poste de travail standard du chercheur Les données importantes aussi sur ces portables Sauvegarde des nomades avec leurs contraintes Des utilisateurs autonomes Volonté d'autonomie des utilisateurs pour restaurer eux mêmes leurs fichiers, en particulier les fichiers effacés Mécanisme de gestion de versions («snapshots», «clichés») Restauration ergonomique
Nouveaux enjeux Plan de Reprise d'activité De plus en plus évoqué Repose sur la sauvegarde Archivage Sauvegarde de très longue durée L'intégrer dans la sauvegarde
Les machines virtuelles Le fonctionnement sans VCB
Les machines virtuelles Le fonctionnement avec VCB
Principe de base La déduplication Fichier 1 A B C C A Sans déduplication A B C C A Fichier 2 A C B B C A C B B C Fichier 1 A B C C A Avec déduplication A B C Fichier 2 A C B B C
Types de déduplication : La déduplication En ligne Hors ligne Blocs de taille fixe ou variable Embarquée ou logicielle Déduplication à la source Réduction du temps et volume des transferts Attention aux gains annoncés! Taux inférieur à 7:1 lors de nos tests
La sauvegarde sur disques durs Disques > Bandes + souples temps d'accès meilleurs, accès multiples robustesse par redondance + cher : en fait pas tant que ça... Choix de l'insa et du LAAS Possibilité de garder une robotique en secondaire
La sauvegarde sur disques durs Baies simples moins coûteuses simples à mettre à oeuvre connectivité réduite Baies intelligentes (Virtual Tape Library) Robotique virtuelle adaptées à l'extension d'un système existant intègrent souvent des fonctionnalités avancées performantes chères Attachement SAS Attachement FC Attachement réseau (iscsi, NFS) pas cher bonnes performances se connecte uniquement au serveur de sauvegarde adapté au SAN performantes plus cher que le SAS partageable par plusieurs serveurs de sauvegarde peut aussi être utilisé pour le stockage fonctionnalités avancées (ex: déduplication) performances suffisantes plus cher
Sauvegarde des postes nomades Mobilité interne et externe au site Sauvegarde hors site Restauration autonome Arrêt et reprises fréquents Sauvegarde initiée par le client Hors connexion parfois Système de cache Volumétrie globale importante Ex au LAAS : 500 * 30 Go = 15 To Optimisation du stockage et du flux de sauvegarde
Synchronisation Fichiers hors connexion Windows Basé sur Active Directory Synchronisation entre original sur le serveur et cache sur le portable Ne fonctionne qu'en LAN Pas de gestion de versions Fonctionne mal sous Windows XP Scripts «Rsync» Facilement déployables sur les Unix (Linux, MacOS X) et peut fonctionner hors site Déclenchement par cron à fréquence régulière (ex: 1h) Interface utilisateur «réduite», sans gestion de versions Paramétrage complexe et contrôle difficile Pas de sauvegarde déconnectée
Sauvegarde en continu Chaque modification de fichier est enregistrée dans un cache Le cache est transmis de manière asynchrone au serveur Toujours actif, supporte les interruptions Fonctionne hors connexion Client stable et robuste, sans perturber l'utilisateur Beaucoup de versions donc beaucoup de volumes donc optimisation du stockage et du transfert Serveur performant en continu avec beaucoup d'accès simultanés
Sauvegarde en continu Solution au LAAS : Live Backup d'atempo (Windows et Mac OS X) Peu perturbateur et efficace Sauvegarde chiffrée sur le port 80 Bonne ergonomie de sauvegarde et de restauration Mécanismes de déduplication performants Solution de CDP est la plus adaptée à la sauvegarde des portables Avantages - sauvegarde et restauration à distance - support du mode déconnecté - peu perturbateur sur le poste client - ergonomique Inconvénients - peu de systèmes supportés - pas d'implémentation libre - serveur puissant nécessaire
Nouvelles organisations pour la sauvegarde Externalisation à la mode, car censé réduire les coûts, mais : Volume important à transférer par Internet pour la sauvegarde et la restauration Gestion de l'hétérogénéité de nos parcs, de nos messageries hors standard... Mutualisation entre labos et entre universités Déporter le stockage de la sauvegarde pour éviter qu'ils soient au même endroit que les données Les réseaux de campus sont performants Nous avons l'habitude de travailler ensemble
Le LAAS 20 serveurs 2 baies Netapp (8,1 To) 3 serveurs Vmware ESX 30 serveurs virtuels 500 portables Total : 9,4 To
La solution de sauvegarde du LAAS Snapshots NetApp sur baies primaires Sauvegarde propriétaire NetApp (incrémentale bloc) Le plus efficace : vitesse et volumétrie Sauvegarde générique pour les serveurs, stockage sur le NetApp Sauvegarde en continu des portables sur un serveur dédié
L'INSA 40 serveurs 2 baies Netapp (8 To) 6 serveurs Vmware ESX 40 serveurs virtuels 250 portables Total : 18 To + portables
La solution de sauvegarde de l'insa Snapshots NetApp sur baies primaires Copie propriétaire NetApp sur baie secondaire (incrémentale bloc) pour PRA Sauvegarde propriétaire NetApp (incrémentale bloc) Le plus efficace : vitesse et volumétrie Sauvegarde générique pour les serveurs, via VCB pour les machines virtuelles stockage sur un DataDomain Sauvegarde en continu des portables stockage sur le NetApp
Réponses à tout? INSA LAAS Volumétrie, fenêtre de sauvegarde Virtualisation - Sauvegarde incrémentale bloc - Déduplication - Sauvegarde traditionnelle et utilisation de VCB - Sauvegarde incrémentale bloc - Déduplication - Instantanés et sauvegarde incrémentale bloc Postes nomades - Sauvegarde en continu - Sauvegarde en continu Autonomie des utilisateurs - Instantanés - Sauvegarde en continu - Instantanés - Sauvegarde en continu Archivage - Pas vraiment - Espace réservé : rétention infinie PRA - Déjà en place, conservé en l'état - Très partiel
Conclusion Architecture plus complexe qu'avant Futur Peer to Peer Sauvegarde dans le «nuage» Sauvegarde intégrée au stockage primaire