Etat de l art de la déduplication
Agenda Les enjeux de la sauvegarde Pourquoi La déduplication Offre EMC Cas Clients 2
Contexte Datacenter: Croissance de la volumétrie, Virtualisation des serveurs, Consolidation et centralisation des données, Nouveaux SLAs imposés par les métiers sites distant et mobiles Sauvegarde via le WAN Amélioration des niveaux de services, Standardisation des moyens, Impacts sur l infrastructure de sauvegarde et la production IT Problèmes Dépassement des fenêtres de sauvegarde, Données non restituées, Données non sauvegardées, Incidents récurrents par manque de fiabilité des moyens, Défaillance du PRA Pertes, dégradation et vols de cartouches lors des opérations notamment pendant les phases d externalisation, 3
Les conséquences: La sécurité des données Administration i i SLA Coûts (Opex, Capex, Exploitation) i Charge d exploitation importante: Complexité des infrastructures Manipulation des bandes Gestion d incidents Incapacité à anticiper les évolutions SLAs de sauvegardes et de restitutions non respectés Incapacité à atteindre les SLAs du PRA ou à les faire évoluer: Fraicheur des données (RPO) Temps de restitution de la donnée (RTO) Achats récurrents et non planifiés de switchs, disques, cartouches, lecteurs,etc Contrat d externalisation et de PRA, Temps consacré à la gestion d incidents et à l externalisation, Risques opérationnels: Pertes de données, Redémarrage d application, Pénalités financières pour certains métiers en cas de non respect des SLA 4
Les causes Insuffisances de l infrastructure de backup à délivrer simplement, efficacement et durablement de la performance et de la capacité (débits et volumétrie), Inadéquation des outils à certains environnements : Les serveurs virtualisés Les NAS, La messagerie, Les bases de données, Les laptop, Les sites distants, Externalisation par des moyens traditionnels (transports des bandes et stockage distant) Des équipes de production restreintes avec de multiples outils pour administrer l ensemble des composants de l infrastructure de backup, 5 Confidential 5
Références dans le secteur Automobile L approche BRS Garantir les performances et la scalabilité de l infrastructure de backup par l architecture de nos produits, Réduire le périmètre de la bande pour : Augmenter le niveau de sécurité des données, Améliorer les niveaux de services de la sauvegarde et de la restitution, Simplifier l exploitation, Automatiser l externalisation des données, Atteindre les objectifs du PRA (RPO/RTO), Optimiser les coûts et le ROI sur l infrastructure de backup : Simplification Réduction de l Opex Capex liés au backup, La mutualisation des moyens du stockage secondaire, Supervision et Capacity planning, 6
Déduplication Complexe? Data De-DuplicationD 7
Déduplication Eliminer les données redondantes Stockage traditionnel O 1:1 O H H Où Compression (LZ) H H A la Suppression source :Sur le client / serveur ~ 2:1 O A la cible d espace : sur le stockage Single Instance O H H Storage ~ H 3:1 H Fichier O Bloc fixe H H Comment ~ 5:1 Segmentation Bloc de taille variable fixe Data Segmentation de taille fixe Dedupe Quelle granularité ~ 20:1 Fichiers (SIS) Bloc Segments Variable O H 8
Offre : Solutions éprouvées Source Agent logiciel nécessaire. Reconnaissance du contenu des fichiers possible Réduit le transfert réseau. Permet donc la sauvegarde sur un WAN ou décharge le LAN Réduit également la fenêtre de sauvegarde Cible C est une Appliance Disque qui fait le travail. Pas de modification du logiciel de sauvegarde ni des processus et habitudes. Indépendant du protocole : VTL,NFS,CIFS, OST Permet la réplication. DE-DUPLICATION a la SOURCE DE-DUPLICATION a la CIBLE LAN / WAN LAN 9
EMC AVAMAR
EMC Avamar Solution intégrée Sauvegarde dédupliquée, Sur disques En environnement TCP/IP Adaptée pour Sites distants VMWare Fenêtre de sauvegarde réduite 11
EMC AVAMAR Client AVAMAR AVAMAR Sauvegardes Avamar : Données Moyenne 24k 12K DATA DATA 64K 0100101 110011 111000 Découpage Compression Empreinte numérique - environ ~2 à 7 % des données transferées par semaine! - des totales tous les jours Serveur AVAMAR 0100101 = 0100101 110011 =? 111000 =? 0100101 110011 111000 110011= 110011 111000 =? Table d empreintes 12
Architecture innovante Architecture RAIN (Redundant Array of Independent Nodes) Protège contre la défaillance de nœud et fournit une tolérance de panne Evolutivité en ligne Approche brevetée CAS Nœud de serveur EMC Avamar (2U) Chacun avec ses propres disques internes et processeurs Architecture Grid pour permettre une évolutivité et des performances optimales Parité distribuée sur l ensemble de nœuds Serveur EMC Avamar Vérification des check points Vérification d intégrité journalière Protection des disques en RAID Nœud utilitaire et nœud de spare 13
Solution tout en un EMC Avamar DataStore EMC Avamar DataStore «single node» 14
Bande passante Client Mélange de données Volume des données principales (Go) Volume des données transférées/jour (Go) A Systèmes de fichiers Windows 3 573 6,1 B C D E Mélange de systèmes de fichiers Windows, Linux et UNIX Fichiers d étude sur serveurs de fichiers NetApp Filer (sauvegardes NDMP) Mélange constitué de 20 pour cent de bases de données, 80 pour cent de systèmes de fichiers (Windows et UNIX) Mélange de systèmes de fichiers et de bases de données Linux 5 097 11,7 3 265 24,2 9 583 80,0 7 831 104,2 Source : Avamar 15
Sites distants A Data Center Systèmes primaires Site de DR et de Réplication A Systèmes primaires (crypté) (crypté) Serveur EMC Avamar Gros sites distants WAN Serveur EMC Avamar Stockage externe Archivage sur bande A Petits sites distants Systèmes primaires Serveur EMC Avamar (crypté) (crypté) A Agents EMC Avamar uniquement A Agent logiciel EMC Avamar 16
Environnement VMWARE ESX 3 Agent logiciel dans la VM Agent logiciel dans la console ESX Agent logiciel sur le proxy VCB Vsphere 4 Sauvegarde Image Restauration au niveau fichier (Windows) Intégration complète VSTORAGE API 17 17
Sauvegarde Image (VSTORAGE API) Seulement avec Avamar 5.0, ESX 4.0 Pré Requis vcenter Avamar Server ESX Server VM1 vcenter Server (Possible en VM) TCP/IP VM2 Proxy Appliance VM4 VM5 DD630 DD630 Clients vcenter Proxy Appliance VM1 VM2 VM4 VM5 FC ESX - COS Datastore 18 18
Impossible d'afficher l'image. Votre ordinateur manque peut-être de mémoire pour ouvrir l'image ou l'image est endommagée. Redémarrez l'ordinateur, puis ouvrez à nouveau le fichier. Si le x rouge est toujours affiché, vous devrez peut-être supprimer l'image avant de la réinsérer. Change Block tracking Avec Change-Block Sans Change-Block 19
Avantages EMC Avamar Réduit de 95 % le trafic réseau Application Operating System Application Operating System Réduit de 90 % les fenêtres de sauvegarde Réduit de 50 % la charge disque (I/O) VMware Virtualization Layer x86 Architecture Réduit de 80 % la charge CPU CPU APP OS Memory APP OS APP OS NIC APP OS Disk APP OS Réduit de 50 % l usage des ressources mémoire APP OS APP OS APP OS APP OS APP OS VMware Virtualization Layer x86 Architecture CPU Memory NIC Disk 20
Sauvegarde traditionnelle VS EMC Avamar EMC Avamar permet de limiter l utilisation CPU pour les clients sensibles 21
Clients et applications supportées Clients Microsoft Windows Server 2003 Standard and Enterprise Microsoft Windows 2000 Server and Advanced Server Applications Microsoft Office SharePoint Server 2007 Microsoft Exchange 2000, 2003, 2007 Microsoft Windows Server 2008 Microsoft SQL Server 7.0, 2000, 2005, 2008 Microsoft Windows XP, XP Professional, Vista Oracle 9i, 10g, 10gR2, 11g Red Hat Linux 9.0 IBM DB2 8.2.x, 9.5 Red Hat Enterprise Linux (RHEL) 3.0, 4.0, 5.0 NDMP (EMC Celerra with DART 5.5, 5.6) Solaris 8, 9, 10 SUSE Linux Enterprise Server 8.2, 9, 10 IBM AIX 5.2, 5.3, 6.1 HP-UX 11.0, 11iV1, 11iV2, 11iV3 Mac OS X 10.4x, 10.5x NDMP (NetApp Data ONTAP 6.5, 7.0.4, 7.0.5, 7.0.6, 7.1x. 7.2) IBM Lotus Domino VMware infrastructure NetWare 6.5 VMware ESX server 3.0.x, 3.5, 3i Free BSD 6.2 vsphere 4 Novell Storage Services (NSS) OES 2 SCO UNIX 7.1.3 Licenses au stockage pas au client et modules! 22
EMC DATADOMAIN
Stockage Capacitif Optimisé Sauvegarde Protection Acces direct Archivage EMC/Networker Symantec/NetBackup Atempo/Tina IBM/TSM Oracle/RMAN VMWare/VCB SQL DUMP Exports Oracle Versioning R&D Archivage de projets EMC Source one Enterprise Vault Mimosa Atempo/ADA ADAM Baie de stockage Data Domain Protocoles CIFS/NFS VTL OpenStorage Sécurité Snapshot Intégrite des données Réplication WORM/Archivage 24
Stockage optimisé Déduplication INLINE Performant : 450 Go/h-> 86 To/h Stockage utile Réplica disponible CPU Dedupe + Compression Solutions: Réduction fenêtre sauvegarde Amélioration des niveaux de service Diminution des Médias 25
Performances Performances liées à la CPU (et non pas aux disques) Traitement effectué à 99% par la CPU & Memoire Requiert peu de disques, disques SATA Requiert peu de RAM Brevet 7065619 Lecture rapide Structure de données sur disque permettant t d optimiser i le nombre d accès en lecture Brevet 6928526 26
Cas Client Français Accroissement Stockage primaire(nouvelle Application) Avec DataDomain Pas d impact Sans DataDomain Ajout Disques Caches Ajout de lecteurs/cartouches Full 3 To DataDomain 2.5 To de disque utiles Sans DataDomain Disque cache 4To Rétention 30 Jours DataDomain Réduction de 92 % espace Sans DataDomain 60 cartouches LTO3 27
Exemple : Messagerie Serveur de Sauvegarde WAN replication Restauration granulaire Rétention longue (Archives) Restauration rapide de BAL s ou/et de messages Espace disque maitrisé Restauration Serveur Fort débit disponible Restauration Garantie Maintien du Niveau de service Plan de reprise Réplica disponible à la fin de la sauvegarde Faible bande passante Maintien PR/TR Poste de Travail Stockage PSTs 28
Exemple : Base de données Bkup Server Database Réplication Mode de sauvegarde impacte le mode de restauration Full à froid Full à chaud Logs (Archive, redo,.) Base de données de pré-production p Génération DUMP Récupération DataDomain Espace Unifiée Sauvegarde : BDD et Logs Images : Dump et Logs Administration unique Accès multiples Périmètre sous contrôle Plan de reprise Amélioration TR Amelioration PR Gestion simplifiée Bénéfices Espace consommé Libération sur Stockage primaire Pas d impact sur DD Performance Gestion du cycle de vie 29
Compte-rendu automatique journalier Taux d occupation Données Bénéfices sauvegardées: Stocké : Nouvelles données «capacity planning» disponible 27 To par semaine Performance Restauration plus rapide : Disque VS bande 1/4 bande LTO4 Pas de cache Incrémentales de 2.8 To Rétention 2 mois Gestion Simplifiée 310 Cartouches LTO4 30
Interopérabilité transparente Time Navigator Galaxy NetVault BrightStor Arcserve EZX- Backbox Data Protector Networker Amanda RMAN Secure backup Veritas NetBackup Veritas Backup Exec Backup Exec System Recovery True Image TSM VCB NTBackup DPM 31
Sauvegarde VTL SAN/NAS FC Backup NFS/CIFS GbE / 10 GbE FC/VTL DataBase MultiMedia File Email Production - Gig-E Cuivre & Fibre 32
Intégrité des données Matériel NVRAM Logiciel Données Vérification de bout en bout (cheksum) Déduplication écriture sur disque Vérification Système de Fichier auto curatif Expiration des données Nettoyage Défragmentation à chaud Vérification Bénéfices Contrôles intégrés indépendant des solutions logicielles Rapport journalier et signalement des erreurs immédiat Administration simplifiée Restaurations garanties 33
Réplication DR multi-sites jusqu à 180 sites vers 1 site Réplication bidirectionnelle Resynchronisation automatique et rapide Réplication sélective (répertoire, pool) WAN 1 vers N, N vers 1, bidirectionnelle, cascadée Modulation de bande passante Les données sont immédiatement exploitables sur le site distant Supervision détaillée Backu p D Server s Backup Clients DD D Restorer Site1 Restorer Site2 Backu Dp Server s Backup Clients DD D Backu p D Server s Backup Clients DD Restorer Site3 Restorer Site4 Backu p D Server s Backup Clients D DD Confidential 34 34
Gamme Version de logiciel Identique Famille DD600 DD690 DD660 DD630 DD610 DD880 DD140 DDX Array Jusque 16 Contrôleurs Licences optionnelles: OST, VTL, Replicator,& Retention Lock (WORM) DD140 DD610 DD630 DD660 DD690 DD880 DDX Array Perf (GB/hr) 450 675 1,1 TB/hr 2 TB/hr 2,7 TB/hr 5,4 TB/hr 86,4 TB/hr Cap. Logique (TB) 8,6-17,2 40-80 84-168 260-520 350-710 710-1,4 1,4 PB 11,3-22,6 PB Cap. Utile (TB) 0,86 3,98 Max 8,4 Max 26,1 Max 35,3 Max 71 max 1,13 PB Max 35
Une solution ne convient pas à tout EMC propose des technologies éprouvées Data Protection Advisor Produits matures NetWorker Expertise dans l accompagnement Sécurité Unstructured Data Des infrastructures Des données Virtualized Servers App OS App OS Structured Data Offre complète adaptée Avamar ESX Server Data Domain / Disk Library Avamar VM 2TB Industries 1 st Virtual Backup Server 36