Plan de Reprise d Activité retour d expérience 16/04/2014
www.ellisphere.fr Ellipro Informations de pilotage financier Ellibox Pilotage du risque client et fournisseur Ellicible Informations de pilotage Marketing www.ellipro.fr www.ellibox.fr www.ellicible.fr 2
Les enjeux pour la DSI Les services délivrés sont partie prenante dans les processus de décision de nos clients Leur disponibilité en toutes circonstances est un vrai gage de sécurité Un système d information robuste et des garanties de disponibilité des services pour nos clients Un Datacenter principal sécurisé et disponible 24h/24, 365 jours par an Une organisation et des moyens permettant d assurer la disponibilité des services Un plan de continuité d activité assuré par un deuxième Datacenter alimenté en continu 3
Topologie réseau 4
Réplications des données périmètre technologie Mécanisme RPO Bases de données Moteurs de recherche NAS Traitements ordonnancés Oracle Dataguard Maximum Performance (async.) SQL Server Log shipping 15 minutes MySQL ParStream Exalead EMC² Fichiers intermédiaires de traitements Réplication asynchrone à chaque «event» Recopie de l index à chaque indexation full Recopie de l index à chaque indexation Réplication entre baies par «check points» Rsync scripté, 3 fois par jour ~0 pour les transactions terminées ~0 pour les transactions terminées Le RPO dépend des DB sources indexées Avantage : index disponible plus rapidement 10 minutes Entre 6h et 11h 5
Réplications des logiciels et applications périmètre technologie Mécanisme RPO Unix / Linux Windows Ordonnanceur Coffre fort des mots de passe Outil ITSM Logiciels Applications Logiciels Applications Synchrony Automator «rsync» scripté + scripts post réplication Modification effectuée lors de la mise en production «rsync» scripté, copie des schémas d ordonnancement 24h ~0 24h CyberArk Module Vault DR 10 minutes Développement interne en Oracle APEX Oracle Dataguard ~0 6
Réplications des sauvegardes Réplication d images de sauvegardes entre Datacenters Solution autonome sur chaque Datacenter Visibilité, par l autre appliance, des sauvegardes réalisées et répliquées Pas besoin d import de catalogue : disponibilité immédiate en cas de PRA 7
Procédures et documentation Contenu documentaire BIA des métiers BIA de la DSI PCSI Plan de test de PRA Fil conducteur de mise en œuvre des procédures Procédures opérationnelles Chaque procédure est organisée en 3 documents 1. Simulation de sinistre 2. Activation du site de backup documents utilisés en cas de réel sinistre 3. Restauration suite à simulation de sinistre Plans de tests des applications Moyens Word et Excel 1 Serveur dédié en dehors du site de production contient la documentation nécessaire pour la mise en œuvre du PRA Accessible à tout moment par la cellule de crise Coffre fort des mots de passe répliqué sur le site de backup Aligner le PCSI aux vraies exigences métier Disposer des procédures à jouer en cas de vrai sinistre Je pense que la procédure pour l ouvrir est à l intérieur. 8
Tests de PRA Organisation du test 2 tests annuels Simulation de sinistre durant une plage de maintenance (dimanche) Pas de production sur le Datacenter de backup (accès clients coupés) Exécution des procédures par des profils non experts (expert en support) Implication des métiers sur les tests Réunions préparatoires et de débriefing 1 pilote : le RPCSI Simulation de sinistre Activation du site de backup Tests applicatifs et infra Fin de simulation de sinistre Remise du site de backup en mode stand-by Isolation réseau du Datacenter de Production Test des fonctions majeures Reconnexion réseau du Datacenter de production 9
Organisation Equipe continuité Dimension : 2 personnes Vérification des procédures Pilotage des tests Suivi des actions correctives Reporting sur les résultats des tests S assure de la réalisation des BIA Traduction des BIA dans le PCSI Suivi des actions correctives Audit réguliers sur les procédures Planification du test Réunion préparatoire Communication préalable Support filière Continuité d Activité Natixis Communication des résultats du test Réalisation du test Réunion post test 10
Conclusion Points forts RPO ajusté par service délivré Coûts optimisés 10 ans d expérience Points de vigilance La mise à jour des procédures immédiatement lors de tout changement Suivre au quotidien la bonne exécution des réplications Axes d améliorations Meilleure identification des compétences nécessaires pour chaque procédure Visibilité exhaustive du périmètre des données répliquées Complexe à mettre en œuvre lorsqu on mixe les méthodes de réplication Permettre le PRA d une partie du SI plutôt que tout le Datacenter Contrainte de la granularité BGP mise en œuvre Etudier une solution d adressage dynamique 11
échanges 12