Définition Le plan de continuité de service PCA est mis en place pour faire face à une situation de crise pouvant perturber ou interrompre l activité de l entreprise. Le PCA est donc l ensemble des procédures et moyens techniques visant à maintenir ou rétablir l activité de l entreprise. On parle également de Plan de Reprise d Activité (PRA) lorsque la durée de rétablissement de l activité est moins critique (quelques jours) alors que le PCA implique des temps reprise très courts (1 h voir transparent).le PRA est moins contraignant techniquement car la bascule vers le site de secours est réalisée par restauration des sauvegardes sur bandes. Démarche projet Un projet de PRA n est pas un projet purement informatique et ne doit pas être initié par la direction informatique mais doit être porté par la direction générale. Le PCA se décompose en deux grandes Phases qui sont : Le Plan de Continuité Opérationnel (PCO). Qui définit les exigences métier Le Plan de Continuité Informatique qui découle des exigences définies lors du PCO et permet de déterminer les moyens informatiques, logistiques et humains à mettre en oeuvre. Des contraintes opérationnelles découlent deux objectifs principaux RPO (Recovery Point Objective) et le RTO (Recovery Time Objective). Le RPO représente la perte acceptable pour un service, c'est-à-dire le point de reprise dans le temps. Cela peut être une journée si on utilise par exemple les sauvegardes de la veille. Le RTO représente le temps maximum d indisponibilité tolérable, c est le temps maximum qu il faudra après un sinistre pour rétablir l activité dans le périmètre fixé. Un projet de PRA peut se découper en quatre phases : -La définition des objectifs métier dont la chronologie de reprise des métiers -La définition des moyens métier et informatique -L implémentation du PCA, cela comprend également la formation de acteurs -Le maintien en Condition Opérationnel MCO, évolution des procédures, tests à périmètre réduit ou complet Les risques des projets PCA Maintenance des PCA Bénéfices indirects Le PRA peut être souvent comme un investissement à perte puisqu il n apporte que l assurance de la continuité de service en cas de sinistre. La mise en place d un PRA apporte pourtant : - Une réflexion sur l importance et la priorisation des applications. Par exemple lors de la mise en place d un PRA, on peut s apercevoir que la messagerie qui était jugée comme service de confort est nécessaire pour la poursuite des activités de l entreprise.
- L architecture mise en place pour satisfaire le PRA peut permettre d augment la disponibilité des applicatifs lors des taches de maintenance planifiées. Par exemple on peut effectuer une bascule sur le site de secoure pour effectuer des mises à jour system sur le site de production sans arrêt des applications. - permet de garder un fond de documentation à jour et maitrisé PRA et Architecture technique PRA à base de sauvegarde/restauration -Pas de modification profonde de l existant -RTO et RPO élevé en jours Ce type de PRA se base sur l architecture existante et demande peu de modifications techniques, c est le moins contraignant à réaliser. Ce type impose l externalisation des sauvegardes, c est dire le stockage physique des bandes de sauvegarde hors du site, car il fautêtre certain de toujours disposer des sauvegardes en cas de sinistre. Le site de repli peut-être loué et le matériel mis à disposition peut être partagé par plusieurs entreprises ce qui revient moins chère. D un point de vu réseau des liens de communication supplémentaires seront certainement nécessaires. Par exemple dans une architecture en étoile (siège sociale + agence) il faut prévoir un lien de secour entre les agences et le site de repli. Architecture à base de cluster La grande difficulté lors d une bascule vers un site de secoure vient du stockage de données. En effet un serveur de traitement ne posera pas de difficulté car il ne stocke aucune données et sont permutables entre eux. Typiquement c est serveurs sont de bons candidat pour la répartission de charge car le requêtes de client client peuvent-être traitées indiferament par l un ou par n importe qu elle serveur. (il faudra toutefois prévoir l alignement des versions entre le site principale et le site de repli).
Définition Les technologies de mise en cluster permettent à plusieurs serveurs de travailler à l'unisson et d'offrir l'apparence d'un environnement informatique unique. D'un point de vue technique, chaque serveur exécute son propre système d'exploitation, mais ils opèrent ensemble comme s'ils ne formaient qu'un. Model complètement partagé Serveur 1 Serveur 2 SAN Dans ce model, les disques sont partagés entre tous les serveurs de cluster. Ce model est difficile à mettre en œuvre car il faut gérer la concurrence lors de l accès aux disques partagés. Oracle propose l option RAC qui utilise ce principe pour la mise en cluster de sa base de données. Dans ce cas la base de données est ouverte en Lecture/Ecriture par plusieurs serveurs simultanément. La mise en place de ce type de cluster nécessite une baie de disque permettant de partager un même disque entre plusieurs serveurs.
Model Miroir Serveur 1 Actif Serveur 1 Passif SAN Dans ce model un seul serveur est actif en même temps. Si la machine active tombe dans ce cas les ressources sont basculé sur l autre server est le service est maintenu. La mise en place nécessite l utilisation d un baie SAN mais les disques ne sont jamais accessibles simultanément. Sur ce type de configuration la bascule d un serveur à l autre n est pas transparente elle s accompagne d un arrêt de service de quelques secondes. C est la technologie adopté par Microsoft car elle permet de sécurisé de nombreuse applications comme les bases de données, les serveurs de messagerie ). Ce type de cluster ce nomme MSCS chez Microsoft (MicroSoft Cluster Service). Remarque ces deux type de cluster permettent la Haute disponibilité mais ne sont pas utilisables tel qu elle pour un PCA. En effet dans sont fonctionnement ont a toujours une seul base de données (fichiers) partagée entre les nœuds du cluster, la perte d un site risque donc d entrainer la perte des données. Pour que se principe soit utilisable il faut donc utiliser une architecture de disque SAN répliqué entre le site de production et le site de secoure. Les baies de disques SAN (Storage Area Network) Il s agit de system matériel destiné à recevoir de nombreux disques physiques qui sont regroupés en grappes RAID et mis à disposition sur un réseau dédié. Comme nous le verrons plus loin cette technologie est indispensable pour la mise en œuvre de cluster de serveurs car elle permet de partager un volume disque entre plusieurs serveurs. Les baies de stockage SAN supportant le protocole Fiber Channel permettent des typologies hautement disponibles basées sur des liens redondants ainsi que la réplication de volume entre plusieurs baies de stockage parfois physiquement distantes. On parle de Fiber Channel en topologie FABRIC Ci-dessous exemple de topologie FABRIC
Remarque : la réplication entres baies de stockage nécessite des lient rapide (le plus souvent en fibre optique : FiberChanel) qui ne permettent pas un éloignement important des sites de production et de repli. Cas particulier des bases de données De nombreux SGBD intègrent des mécanismes de réplication qui permettent de dupliquer la base de données au travers d un lien réseau. Par exemple Microsoft propose le Log Shipping. Cela consiste à envoyer à intervalle régulier un backup du fichier de transaction vers un ou plusieurs serveurs de Standby ou il est restauré. Les serveurs «Standby» n est accessible qu en lecture. Le log shipping introduit un délai de diffusion des données plus au moins important en fonction du volume des modifications et du débit réseau entre les serveurs mais il garanti l intégrité de la base de données cible puisqu il utilise des mécanismes du SGBD. La bascule nécessite des actions manuelles contrairement aux architectures cluster basée sur des baies de stockage. (Ex : MSCS «Microsoft Cluster Service»). Ce mécanisme de réplication est propre au SGBD Les clients du SGBD nécessitent une redirection vers le serveur de secoure. Technique simple à mettre en place