OpenEdge Points sur les solutions PCA PRA pour minimiser les risques en production Ateliers Progress Octobre 2015
Une Véritable Stratégie Je pense que nous devrions mettre à jour notre plan de reprise sur incident. L actuel suggère, dans un cas de sinistre, de courir en cercle en criant «Que devons nous faire?!!! Que devons nous faire?!!!» 3
Plan de Continuité d Activité (PCA) & Plan de Reprise d Activité(PRA) Quelle est la Différence? La Continuite d'activité a plusieurs aspects D un point de vue IT, le PRA est une part plus importante de la pyramide Personnel Analyse Impact Métier Evaluation des risques Haute Disponibilité Continuité d Activité Reprise Réponse d Activité d Urgence Relations Publiques Reprise d Activité Formation/ Prise de Conscience Continuité des Opérations 4
Les exigences en matière de fiabilité Besoin d'identifier, résoudre et prévenir les problèmes avant qu'ils ne surviennent Besoin d'analyses les causes profondes des problèmes de l'application ou processus métier sans se rejeter la responsabilité Haute disponibilité signifie vraiment aucune interruption de service 5
Pourquoi la fiabilité est elle si importante? Visibilité sur l'expérience utilisateur Assurer qu aucune étape d un processus étapes ne manque Détection précoce de problèmes de performance et de disponibilité Guarantie des SLAs Réduction du temps et des ressources pour résoudre les problèmes 6
Quelles sont les causes les plus fréquentes de "temps d'arrêt non planifiés»? *Adapted from Blueprints for High Availability by Evan Marcus and Hal Stern (ISBN: 0-471-43026-9) 7
Temps de Reprise (RTO) Secondes Jours Les Métriques de l Industrie pour un PRA RTO = la durée maximale d'interruption admissible RPO = la durée maximum d'enregistrement des données qu'il est acceptable de perdre Recovery Time Objective (RTO) la durée maximale d'interruption admissible Recovery Point Objective (RPO) la durée maximum d'enregistrement des données qu'il est acceptable de perdre ou le volume maximum de données qu il est acceptable de perdre 0 K0 s Plusieurs MO s Volume de Perte de Données(RPO) 8
Temps de Reprise (RTO) Secondes Jours Pourquoi est-ce important pour vous? Où êtes vous aujourd hui? Où devriez vous être? Volume de Perte de Données(RPO) 0 K0 s Plusieurs MO s 9
Clusters Uniquement Enterprise Database OE RDBMS n est pas Cluster Aware Peut être configurée pour s exécuter sur une configuration de disques partagés Pas d intégration native entre Progress et les Cluster Manager Le Cluster Manager est responsable des tâches d administration pour garantir le failover Ensemble limité de Cluster Managers supportés (à vérifier dans le Product Availability Guide) Microsoft Cluster Services V5.2 IBM HA Clusters 5.1, 5.3. 5.4.1, 6.1 Sun Solaris Sun Cluster 2,2. 3.0, 3.1 and 3.2 HP-UX Service Guard 11.0 and 11i 12
Concepts Cluster 13 Concept Cluster Failover Shared Devices Cluster Resources Description Se compose de deux ou plusieurs machines, appelées nœuds, qui sont étroitement intégrés par matériel et logiciel pour travailler ensemble comme une seule machine virtuelle. Il gère le basculement en cas de panne d'un nœud. Le basculement automatique d'une ressource de cluster d'un nœud à l'autre, offrant ainsi un accès permanent à ces ressources en cas de panne planifiée ou non. Un arrêt planifié est une mise à niveau de matériel ou de logiciel; une interruption non planifiée est un incident de base de données ou du système. Un disque qui est disponible à partir de n'importe quel nœud du cluster. Si un nœud du cluster subit une panne, le périphérique partagé est toujours reconnu et disponible pour les autres nœuds du cluster, offrant ainsi un accès ininterrompu à la base de données. Une base de données en cluster et toutes ses dépendances telles que les fichiers physiques, les disques physiques, et le réseau.
Architecture Globale MYCLUST Node A Cluster Manager Heartbeat Shared Storage Node B Cluster Manager Local Disk Local Disk 14 Failover Clusters
Gérer les Clusters Activer une base de données pour l'environnement en cluster Démarrer une base de données en cluster Arrêter une base de données en cluster Désactiver une base de données en cluster 15
Activer une base de données pour l'environnement en cluster procluster db-name enable [-pf parameter-file] [AI][BI][APW=n][WDOG] Shared Storage Failover Clusters Cluster-enabled database 16
Démarrer une base de données en cluster procluster db-name start Shared Storage Failover Clusters Cluster-enabled database procluster db-name isalive 17
Arrêter une base de données en cluster procluster db-name stop Shared Storage Failover Clusters Cluster-enabled database procluster db-name isalive 18
Désactiver une base de données en cluster procluster db-name disable Shared Storage Failover Clusters Database 19
Solutions OpenEdge pour PCA et PRA 20
PCA et PRA avec OpenEdge Replication / PLUS OE Replication Plus 21
Reprise OpenEdge Database (DB) Notions de base Process Backup DB régulièrement Stockage off-site Application Database Reprise sur incident InstallationSoftware Restauration DB vers la cible Reconnexion des clients Backup Files Restored Database Risques Temps de récupération = ELEVE (sur la base de la dernière sauvegarde «réussie", taille de la DB, etc.) Perte de données = ELEVE 22
Temps de Reprise (RTO) Secondes Jours Backup Database Backup 0 K0 s Plusieurs MO s Volume de Perte de Données(RPO) 23
Reprise OpenEdge DB Notion de bases + After Imaging (AI) Application Database After-Image AI 12:30 AI 1:00 AI 1:30 AI 2:00 Process Backup DB régulièrement Backup fichiers AI régulièrement Stockage off-site Reprise sur incident Installation software Restauration fichiers DB & AI vers la cible Application (roll forward) fichiers AI Reconnexion clients Backup Files Target Database After-Image AI 12:30 AI 1:00 AI 1:30 AI 2:00 24 Risques Temps de récupération = Plus Rapide (sur la base de la dernière sauvegarde «réussie", taille de la DB, et nombre de fichiers AI à appliquer, etc.) Perte de Données= MOYEN (basé sur le dernier fichier AI correct)
Temps de Reprise (RTO) Secondes Jours Backup Database versus After Imaging After Imaging Manuel Backup 0 K0 s Plusieurs MO s Volume de Perte de Données(RPO) 25
Reprise OpenEdge OpenEdge Replication / Plus Process Installation / Configuration replication Application Database Maintien des backups DB & AI Reprise sur incident Fail over (manuel ou automatique) Reconnexion clients Replication Server Target Database Read Only Risques Automated and Near Real Time Temps de récupération = LE PLUS FAIBLE (Meilleur!) Pertes de Données= LE PLUS FAIBLE (Meilleur!) Replication Agent 26
Time to Recover (RTO) Secondes Jours Backup Database versus AI versus OE Replication After Imaging Manuel Backup OE Replication 0 K0 s Plusieurs MO s Volume de Perte de Données(RPO) 27
OpenEdge Replication Configuration Complète AI Mgmt Utility Primaire Secondaire Source DB AI Extents Database Broker Processes Database Broker Processes Repl Queue Replication Server Replication Agent Target DB 28
OpenEdge Replication Fonctionnalités AI Mgmt Utility Primary Primaire Source DB AI Extents Réplication de données Automatique Database Broker Processes Repl Queue Replication Server Pas de changement dans les applications AI Management Utility gère les backup AI. 29
OpenEdge Replication Fonctionnalités Supports de 2 serveurs Secondaires Types de Failover Manuel Automatique Secondaire Database Broker Processes Accès Read-only avec Replication Plus Replication Agent Target DB Target Database 30
OpenEdge Replication contraintes Produits OpenEdge 10 Enterprise & Workgroup RDBMS OpenEdge 11 Enterprise & Workgroup RDBMS Plateformes supportées, OS + Hardware Même OS sur serveur Primaire et Secondaire 31
Demo 2. OpenEdge Replication Setup Source Database Setup Target Database Enable Replication Replicate entre Source et Target Mises à jour d enregistrements dans la Database Source Les mises à jour sont appliquées automatiquement dans la Database Target Accès pour rapports ou autres (Read Only) à partir de la Database Target 32
Operation Normal User met à jours source database Source DB Replication Server Replication Agent Roll Forward permanent Target DB AI BLOCK 33
Demo 3. Transition vers la Database Target Transition Database Target pour devenir Database Source Recovery Failover Reconnexion utilisateurs 34
Demo 4. Transition de Target vers Source Backup de Database Source en cours Restauration de la Source courante vers la Source initiale Redémarrage du serveur Source Failback Transition Reconnexion utilisateurs 35
Demo 5. Crash du serveur de Production Crash de la Database Source Transition la Target en tant que Source Shutdown de la Database Target Déconnexion des utilisateurs Démarrage de la database Target en mode transaction Reconnexion utilisateurs 36
Operation Normal User met à jours source database Source DB Replication Server Replication Agent Roll Forward permanent Target DB AI BLOCK 37
Crash Production User met à jours source database X Source DB Replication Server Replication Agent Roll Forward permanent Target DB AI BLOCK 39
Scenario de Reprise Target devient une database Normal X Source DB User met à jours la nouvelle source database Replication Server X X Replication Agent New Source DB 40
Demo 6. Alerting from OpenEdge Management All the activity for Replication was recorded Emails to indicate Backup Restore Crash Transition 41
OpenEdge Replication Points à Retenir 1 Disponibilité Continue 2 Protection Complète des Données Critiques 3 Intégrité Garantie des Données 4 Performance optimisée avec Replication Plus 5 Facile à implémenter pour ROI rapide 42