LES MEILLEURES PRATIQUES POUR DÉPLOYER L'OPTIMALISATION WAN AVEC LA RÉPLICATION DES DONNÉES LES CLÉS D'UNE PROTECTION DES DONNÉES RÉUSSIE SUR L'ENSEMBLE DU WAN
LES MEILLEURES PRATIQUES POUR DÉPLOYER L'OPTIMALISATION WAN AVEC LA RÉPLICATION DES DONNÉES LES CLÉS D'UNE PROTECTION DES DONNÉES RÉUSSIE SUR L'ENSEMBLE DU WAN LE MAILLON FAIBLE DE LA PROTECTION DES DONNÉES Trop souvent, le Wide Area Network (WAN) est le maillon faible de la protection des données. Bande passante limitée, latence élevée, paquets perdus ou dans le désordre : voilà tout ce qui peut compromettre des initiatives stratégiques de sauvegarde et de réplication des données. Au final, ce sont les objectifs de perte de données maximale admise (Recovery Point Objective, ou RPO) et de durée maximale d'interruption admissible (Recovery Time Objective, ou RTO) qui ne sont pas atteints. Alors que les quantités de données augmentent et que les centres de données sont de plus en plus distants les uns des autres pour assurer une meilleure protection contre les catastrophes graves, le WAN fait l'objet d'une attention grandissante. En conséquence, la demande s'est exacerbée en matière d'outils d'optimisation capables d'améliorer les temps de réplication des données sur le WAN tout en maximisant l'efficacité de la bande passante lors de ces opérations. Le déploiement de l'optimisation WAN dans un environnement de reprise après sinistre a des exigences particulières. Ainsi, la réplication implique une quantité importante de trafic soutenu, ce qui augmente fortement la probabilité de paquets perdus ou remis dans le désordre. Les temps nécessaires au transfert sont très bien définis pour respecter les fenêtres attribuées et le trafic lié à la reprise après sinistre est souvent chiffré afin de protéger les données sensibles. Les solutions de réplication sont compatibles avec TCP et UDP, et dans certains cas avec des protocoles de transport propriétaires et encapsulés (selon la solution). Elles ont souvent leurs propres techniques d'optimisation, lesquelles peuvent affecter les performances des dispositifs d'optimisation WAN situés en aval. Une fois ces exigences bien comprises et les directives établies en conséquence, l'optimisation WAN peut être déployée avec un maximum d'efficacité. En tant que telle, elle a le potentiel pour favoriser des initiatives stratégiques de reprise après sinistre. SE POSER LES BONNES QUESTIONS La première étape du déploiement d'une solution réseau, quelle qu'elle soit, consiste à se poser les bonnes questions. Dans le domaine de l'optimisation WAN, voici celles qui sont primordiales au moment de l'évaluation : Connaissez vos applications et protocoles. Il est impossible de mesurer les résultats sans commencer par faire le point sur la situation existante. Combien de trafic génère un flux de réplication ou un processus de sauvegarde «moyen»? Combien de trafic génère un seul ensemble delta? Que sont les pics de charge, et combien de fois par jour se produisent-ils? Combien de temps faut-il pour transférer les données du point A au point B? Plus vous pouvez recueillir d'informations quantifiables, plus il vous sera facile d'estimer les dimensions d'un dispositif d'optimisation WAN approprié et d'évaluer précisément les améliorations qu'il apporte. Soyez prévoyant. Tenez compte du taux de croissance des données prévu afin que la solution d'optimisation WAN puisse évoluer en même temps que les besoins en matière de réplication/sauvegarde. Il est également très utile de savoir comment fonctionnent les applications de réplication/sauvegarde. S'exécutent-elles sur TCP (comme EMC SRDF/A, NetApp SnapMirror/SnapVault, Double-Take) ou sur UDP (comme Veritas Volume Replicator, les librairies de disques EMC CLARiiON, Aspera/Isilon)? Des protocoles propriétaires ou encapsulés sont-ils utilisés, comme cela arrive parfois avec certaines mises en œuvre FCIP (Fibre Channel over IP)? Si un autre protocole que le TCP standard est utilisé pour les communications entre les périphériques hôtes, assurez-vous que les appliances d'optimisation WAN peuvent le prendre en charge. 2
Connaissez votre réseau. Il est facile de déterminer combien de bande passante vous achetez, mais il est plus difficile de connaître le débit exact atteint en réalité sur le WAN. Dans de nombreux environnements, tels que les MPLS et VPN IP, des paquets sont perdus ou remis dans le désordre en raison des trop nombreuses sollicitations que subit le routeur. Cela peut aboutir à des retransmissions excessives qui auront pour effet de diminuer le débit efficace (le «bon» débit) du trafic sur l'ensemble du WAN. Comme l'indique la figure 1, il suffit d'une perte de paquets minime (0,075 %) pour faire descendre le débit efficace à moins de 5 Mbit/s, quelle que soit la bande passante disponible sur la liaison WAN. Une telle baisse de débit est fatale pour les opérations de sauvegarde/réplication les plus importantes. Les technologies d'optimisation WAN telles que la correction anticipée des erreurs (Forward Error Correction, ou FEC) et la correction de l'ordre des paquets (Packet Order Correction, ou POC) sont donc très utiles dans certains environnements de réplication/sauvegarde. Outre la perte de bande passante et de paquets, la latence peut être un fléau silencieux pour de nombreuses applications dans le cadre d'une reprise après sinistre. Les lois de la physique sont incontournables : lorsqu'une grande distance sépare les périphériques hôte et cible, il faut du temps aux paquets pour faire les allers et retours sur le WAN. C'est encore plus problématique du fait que les entreprises cherchent à augmenter la distance qui sépare les centres de données, que ce soit pour une meilleure protection en cas de grave catastrophe ou pour bénéficier de tarifs d'électricité plus avantageux en zone rurale. Souvent, les techniques d'accélération TCP telles que les accusés de réception sélectifs et les tailles de fenêtre ajustables aideront à résoudre les problèmes de latence sur le WAN. Si une mise à niveau du WAN est en cours, ce qui inclut l'adoption d'une nouvelle technologie WAN (MPLS ou VPN IP par exemple) ou la construction d'un nouveau centre de données, il est conseillé de simuler des conditions WAN potentielles dans le cadre de l'évaluation d'une optimisation WAN. Un bon émulateur de réseaux WAN reproduira correctement la bande passante, la latence, la perte de paquets et leur remise dans le désordre pour fournir les conditions réelles. Connaissez vos limites. Combien de flux simultanés sont générés lors d'une opération de réplication classique? Combien sont générés alors que plusieurs processus ont lieu simultanément, par exemple la sauvegarde de dizaines de sites distants? Si un autre type de trafic utilise le même WAN que votre opération de reprise après sinistre, combien de flux génère-t-il? En sachant combien de flux circulent sur le réseau, vous pouvez faire en sorte que les dispositifs d'optimisation WAN gèrent le volume de données convenablement. Assurez-vous que vous comprenez parfaitement comment réagit un dispositif d'optimisation WAN lorsque son seuil de flux est atteint. Cela provoque-t-il un blocage ou un ralentissement du trafic? Il est également utile de savoir s'il existe des limites de débit pour les flux individuels en provenance des routeurs, pare-feu et autres équipements réseau. Par exemple, un routeur peut restreindre le débit par flux pour garantir qu'ils seront tous traités correctement. Un pare-feu peut faire de même pour empêcher des applications malveillantes de monopoliser une bande passante précieuse. Qu'elles soient délibérées ou non, ces limitations imposées au débit peuvent causer des ravages sur un trafic intense et doivent être gérées en conséquence (soit en reconfigurant l'équipement réseau, soit par le biais des techniques d'optimisation WAN telles que le «packet striping», qui consiste à séparer le trafic en plusieurs flux qui seront rassemblés à l'arrivée). «Des transferts plus rapides et un débit LAN/WAN plus élevé améliorent le RPO. Plus les périphériques de stockage peuvent envoyer de données sur le WAN, plus il est possible d'en protéger dans un intervalle de temps donné.» Figure 1 : Le débit efficace descend en dessous de 5 Mbit/s sur l'ensemble du WAN avec une perte de paquets très faible (0,075 %). 3
GUIDE DES MEILLEURES PRATIQUES DE CONFIGURATION De nombreuses techniques d'optimisation WAN (réduction des données, QoS, compression, diminution de la latence et du taux de perte, etc.) sont transparentes pour les périphériques de stockage et les logiciels de reprise après sinistre. Dans des conditions normales, le support de stockage ne devrait même pas savoir que le trafic envoyé sur le WAN est accéléré. Toutefois, les niveaux de performance peuvent varier selon le type de déploiement. Les recommandations fournies ci-dessous pour la configuration permettent de maximiser les performances de bout en bout lors d'une réplication des données sur le WAN : Haute disponibilité. Lorsque l'optimisation WAN est utilisée dans le cadre de la reprise après sinistre, elle devient plus importante encore. Des temps de transfert médiocres peuvent faire échouer les opérations de réplication/sauvegarde, ce qui met davantage en péril les données de l'entreprise. Pour éviter cela, il est souvent recommandé de déployer l'optimisation WAN selon une configuration redondante lorsqu'elle contribue à la reprise après sinistre. La redondance entre les appliances est généralement obtenue par des techniques de redirection standard, telles que le routage à base de règles (Policy Based Routing, ou PBR) et le protocole WCCP (Web Cache Coordination Protocol), qui peuvent servir à rediriger le trafic en cas d'incident. Des alimentations, des disques et d'autres modules redondants contribueront à assurer une disponibilité maximale au sein de l'appliance. Compression / déduplication. De nombreux périphériques de stockage effectuent une compression basique de la charge utile (par exemple LZ). Cela n'empêche pas des dispositifs d'optimisation WAN situés en aval de fonctionner, mais leur efficacité globale peut s'en trouver réduite en raison de la limitation de la visibilité sur les données «brutes». Étant donné que cette fonctionnalité n'est pas réservée au périphérique de stockage (autrement dit, la plupart des mécanismes d'optimisation WAN produiront une compression au moins égale à celle d'une baie de stockage), il est généralement conseillé de la désactiver dans la baie. Les performances nettes globales s'en trouvent améliorées en ce qui concerne la compression. En outre, comme cette dernière est très gourmande en CPU, le fait de l'effectuer en dehors de l'hôte (la baie) et sur une appliance d'optimisation WAN dédiée peut aboutir à une meilleure évolutivité au sein du support de stockage. C'est un peu différent pour la déduplication, car dans de nombreux environnements, on la préfère dans le support de stockage et il n'est pas envisageable de la désactiver. À condition que le dispositif d'optimisation WAN dispose d'une granularité au niveau des octets lorsqu'il effectue sa propre réduction de données, l'utilisation de la déduplication ne devrait pas poser de problème. En fait, les performances sont même 10 à 20 fois supérieures lorsque la réduction de données WAN est faite en même temps que la déduplication. UN DÉPLOIEMENT VERS L'EXTÉRIEUR GARANTIT UNE DISPONIBILITÉ ÉLEVÉE Figure 2 : des techniques de redirection courantes peuvent être utilisées pour déployer des appliances d'optimalisation WAN de manière redondante. 4
C'est particulièrement vrai lorsque plusieurs applications sont envoyées sur le même WAN parce que le dispositif d'optimisation doit échantillonner et recréer un plus grand ensemble de données. Par exemple, si un utilisateur envoie un e-mail sur le WAN, celui-ci sera identifié précisément et stocké par un dispositif d'optimisation WAN effectuant la réduction des données. Lors de la sauvegarde de cet e-mail, l'équipement en question aura déjà vu les données, ce qui permettra d'optimiser immédiatement l'opération de réduction. En revanche, il peut s'agir de la première sauvegarde de ces données, aussi la déduplication peut être minime. Sans surprise, l'utilisation conjointe d'un dispositif d'optimisation WAN et de la déduplication donne les meilleurs résultats nets globaux. Chiffrement. Pour leurs communications sur le WAN, de nombreuses entreprises considèrent le chiffrement comme un outil indispensable à la protection des informations sensibles. Toutefois, lorsque l'optimisation WAN est déployée avec des supports de stockage, l'endroit où a lieu ce chiffrement est très important. Si c'est «en amont» du dispositif d'optimisation WAN, des actions spéciales doivent être effectuées pour mettre fin à la session de chiffrement sur l'appliance, et déchiffrer, puis chiffrer à nouveau le trafic. Sinon, le dispositif en question n'a pas la visibilité sur les données et ne peut pas exécuter ses fonctions d'optimisation. Comme cette opération peut être difficile à coordonner et avoir un effet néfaste sur les performances, elle n'est généralement pas recommandée, à moins que le chiffrement soit absolument nécessaire au niveau de la source. Il est préférable de laisser le dispositif d'optimisation WAN se charger du chiffrement. Selon les meilleures pratiques, celui-ci en effectue de deux types. L'un d'eux concerne les données inactives (celles qui sont stockées sur l'appliance). L'autre est pour les données envoyées entre les appliances. Le premier est particulièrement nécessaire lorsque le dispositif d'optimisation WAN utilise des disques locaux pour la réduction des données. Ceux-ci peuvent stocker plusieurs téraoctets d'informations. Le deuxième est le plus souvent requis sur des réseaux partagés, tels que des VPN IP, où IPsec et d'autres solutions VPN peuvent fournir une couche de sécurité supplémentaire. Dans les deux cas, il est préférable que le chiffrement soit réalisé sur un matériel dédié afin de ne pas affecter les performances. COMPRENDRE LES CRITÈRES DE SUCCÈS Avec les informations précédentes, vous pouvez définir les critères d'évaluation d'une optimisation WAN réussie. Plus précisément, les entreprises peuvent recueillir des données quantitatives qui justifieront le bien-fondé d'un tel investissement pour leur environnement de reprise après sinistre. Elles doivent en particulier se pencher sur les questions suivantes : Réduction des temps de transfert. Quels sont les bénéfices en termes de vitesse pour les opérations de réplication/ sauvegarde? Le gain est facile à mesurer et à comparer aux chiffres de référence (qui doivent avoir été collectés avant la mise en place de l'optimisation WAN). Augmentation du débit côté LAN. Souvent, l'élimination d'un goulot d'étranglement du WAN permet d'envoyer davantage de données à partir du support de stockage. Autrement dit, plus de données peuvent être protégées dans les fenêtres allouées. «L'optimisation WAN améliore au mieux les performances dans les environnements avec reprise après sinistre avec le coût total de possession le plus bas.» Figure 3 : le suivi des performances des applications au fil du temps nécessite des outils de gestion efficaces. 5
Optimisation de l'utilisation du WAN (c'est-à-dire plus de «bande passante virtuelle»). Si le débit est constant côté LAN, l'utilisation du WAN devrait diminuer grâce à son optimisation. Toutefois, on constate souvent une augmentation du débit côté LAN, ce qui peut entraîner une hausse du trafic WAN global. Cela peut paraître aller à l'encontre de l'objectif de l'optimisation WAN, mais en réalité cela dénote un emploi plus efficace de la bande passante WAN disponible. Revenons aux goulots d'étranglement du WAN. L'élimination de l'un d'eux peut en fait en révéler d'autres ailleurs dans l'entreprise. Par exemple, une carte réseau de serveur défectueuse ou un hub LAN obsolète auront peut-être «bien» fonctionné avec un débit WAN limité à 10 Mbit/s, mais avoir du mal à suivre maintenant que le WAN peut gérer 100 Mbit/s de trafic. De la même manière, un logiciel de réplication peut être matériellement limité pour la quantité de données qu'il peut envoyer. Il peut aussi avoir été configuré manuellement pour restreindre le débit en fonction des conditions du WAN. Cela peut entraîner des gains de performance moins élevés lorsque l'optimisation WAN est déployée. Par exemple, le volume de trafic sur le WAN peut être considérablement réduit avec l'optimisation WAN, mais les temps de transfert sur le WAN risquent de ne pas être améliorés beaucoup. Quelques changements dans la configuration du support de stockage peuvent résoudre ce problème, mais il se peut qu'il s'agisse d'une limitation inhérente à ce matériel. Pour finir, signalons l'importance de l'utilisation d'outils de gestion efficaces au moment de l'évaluation, puis lors du déploiement d'une solution d'optimisation WAN. Ils permettront en effet d'établir un point de référence pour le comportement du réseau et des applications, d'optimiser la configuration pour un déploiement sans heurts et de surveiller régulièrement le fonctionnement pour évaluer les performances dans la durée. FAIRE L'ANALYSE DE LA RENTABILITÉ Des transferts plus rapides et un débit LAN/WAN plus élevé améliorent le RPO. Plus les périphériques de stockage peuvent produire de données, puis les envoyer sur le WAN, plus il est possible d'en protéger dans un intervalle de temps donné. Des transferts plus rapides optimisent également le RTO. L'optimisation WAN n'accélère pas seulement les opérations de réplication et de sauvegarde, elle garantit aussi que les transferts dans l'autre sens, c'est-à-dire lors d'une récupération, sont effectués aussi vite que possible. Quelle importance accordez-vous à l'amélioration des objectifs RPO et RTO? À quel point cela vaut-il la peine de protéger plus de données et de les récupérer plus vite? Est-ce que ces bénéfices pèsent plus lourd que l'investissement dans les équipements assurant l'optimisation WAN? Envisagez l'autre solution : l'ajout de bande passante pour le WAN. Cela peut sembler plus simple à justifier lorsque la protection des données n'est pas assurée convenablement sur le WAN, mais il y a plusieurs inconvénients majeurs. Pour les débutants, cela suppose que la bande passante est le seul problème à résoudre lors des opérations de réplication et de sauvegarde sur le réseau. Toutefois, si une perte de paquets ou leur remise dans le désordre, ou une latence incorrecte sont également à déplorer, ajouter de la bande passante ne résoudra pas le problème. (En fait, le taux de perte augmente souvent lorsque les liaisons WAN prennent de l'ampleur.) Par ailleurs, dans de nombreuses régions il faut attendre un certain temps avant qu'une connexion WAN de grande envergure soit choisie et mise en place par un fournisseur de services. Si la situation est déjà problématique, il n'est pas forcément envisageable d'attendre plusieurs mois une installation OC-3 ou OC-12. Enfin, si l'on tient compte de tous les facteurs, le coût que représente l'ajout de bande passante WAN est souvent supérieur à celui du déploiement de l'accélération WAN. Outre une augmentation considérable des frais récurrents liés à la bande passante (de 30 à 60 % en moyenne), il faudra peut-être aussi ajouter des routeurs et autres équipements réseau, ou moderniser le matériel existant, mettre à niveau les supports de stockage, acheter de nouvelles licences pour la réplication/sauvegarde à cause des liaisons WAN supplémentaires et prévoir d'éventuelles dépenses de fonctionnement liées à la complication des connexions WAN nouvelles et plus étendues. Même si les frais liés à la bande passante diminueront avec le temps, les coûts récurrents restent élevés, et ceux liés à la modernisation du WAN, tangentiels ceux-là, peuvent être plutôt importants. Au final, l'optimisation WAN offre les meilleurs gains de performance dans les environnements de reprise après sinistre, avec le coût total de possession le plus bas. Si elle est déployée correctement, ses bénéfices sont très concrets. Cela va d'une accélération des transferts de données à une utilisation plus efficace de la bande passante WAN disponible. Avec les meilleures pratiques recommandées, elle constitue un outil indispensable dans les opérations quotidiennes de reprise après sinistre. 6
ANNEXE A : LES INFORMATIONS DE RÉFÉRENCE Application : Trafic généré lors d'un transfert «moyen» Mo Durée réelle d'un transfert d'ensemble delta «moyen» minutes Temps de transfert souhaité pour un ensemble delta «moyen» minutes Protocoles de transport utilités (entourez une réponse) TCP / UDP / Autre Bande passante totale du WAN Latence moyenne Pic de latence Mbit/s ms ms Perte de paquets moyenne % Pic de perte de paquets % Nombre de flux TCP simultanés Limite de débit par flux Mbit/s ANNEXE B : LISTE DE CONTRÔLE DE LA CONFIGURATION La compression est-elle désactivée en amont du dispositif d'optimisation WAN? La déduplication est-elle effectuée par le logiciel de réplication/sauvegarde? Le chiffrement est-il désactivé en amont du dispositif d'optimisation WAN? Oui _ Non _ Oui _ Non _ Oui _ Non _ Les appliances d'optimisation WAN sont-elles déployées avec le reste (inline) ou vers l'extérieur? Si c'est vers l'extérieur, quelle technique de redirection est utilisée? 7
ANNEXE C : COMPARATIF DES RÉSULTATS DE L'OPTIMISATION WAN Quantité de trafic envoyé sur le WAN lors du transfert de données : Mo Mo % de réduction des données (quantité de trafic optimisé / quantité de trafic de référence * 100) % % Quantité de trafic côté LAN lors du transfert de données Mo Mo Temps requis pour transférer un ensemble delta «moyen» minutes minutes Gain de temps (durée de référence temps optimisé) minutes minutes 8
ANNEXE D : COMPARATIF DES FONCTIONNALITÉS D'OPTIMISATION WAN FONCTIONNALITÉ CONDITION REQUISE FOURNISSEUR : FOURNISSEUR : (O/N) PERFORMANCES Bande passante WAN maximale prise en charge (Toutes les fonctions d'optimisation activées) Flux TCP pris en charge Taille du disque (Réduction des données) APPLICATIONS La plus grande partie de TCP (ex. :, sauvegarde, fichiers, e-mails, web) TCP temps réel (ex. :, réplication, SQL, Citrix) UDP (ex. :, réplication, VoIP, vidéo) Propriétaire (ex. :, FCIP) SÉCURITÉ Chiffrement sur le WAN? Chiffrement des données sur les appliances? Accélération matérielle ATTÉNUATION DES PERTES Correction anticipée des erreurs Correction de l'ordre des paquets DÉPLOIEMENT In band WCCP PBR VRRP 888.598.7325 www.silver-peak.com Silver Peak Systems, Inc. Tous droits réservés. Tous les autres noms de marque, produit ou service sont, ou peuvent être, des marques ou des marques de service, et sont utilisés pour les identifier, des produits ou des services de leurs détenteurs respectifs. 9