PLAN DE CONTINUITE D ACTIVITE Tendances et Perspectives
Sommaire I. Le groupe Devoteam II. PCA : Concept et Vocabulaire III. Solutions de secours IV. PCA : Maturité et enjeux à venir 2
Carte d identité du groupe Devoteam est un groupe international spécialisé dans les nouvelles technologies Conseil en EMEA Groupe créé en 1995 +4500 collaborateurs Présent dans 23 pays Croissance soutenue et régulière (>30%) Coté à la bourse Euronext 3
Notre portefeuille d activités Devoteam accompagne ses clients dans le Conseil IT Nus sommes des trusted advisors Nous sommes un vecteur d innovation Nous sommes des experts en technologies Nous sommes des project managers ² Nous sommes des acteurs du changement Conseil en Stratégie, Marketing et organisation Nous planifions, concevons et déployons les TIC Conseil technologique 4
Offre de Conseil en Continuité d activité Expérience éprouvée Séniorité Implication managériale Réserve et garantie de compétences à travers le Groupe Plus de 300 références PCA Quelques exemples Expertise reconnue Centre de compétence PCA et Gestion de crise unique et dédié Maîtrise de projets d envergure long terme et multi clients Spécialisation sectorielle Reconnaissance institutionnelle Connaissance des opérateurs vitaux, des prestataires et des fournisseurs de secours 5
Sommaire I. Le groupe Devoteam II. PCA : Concept et Vocabulaire III. Solutions de secours IV. PCA : Maturité et enjeux 6
La continuité d activité en France Une genèse en 40 ans 2010 2004 2001 CRBF 2004-02 Attentats du 11 septembre Approche globale Gestion de la Continuité d Activité (GCA) Maturité méthodologique Renforcement du cadre réglementaire Prise de conscience de la culture sinistres extrêmes 2000 1996 Passage à l an 2000 Incendie du Crédit Lyonnais à Paris Installation de la culture de crise Intégration de la dimension secours des utilisateurs Généralisation des systèmes de secours informatique 1990 1970 L informatisation Mise en place des systèmes de secours informatiques Développement des mesures de sauvegardes Prise en compte du sinistre informatique, suite aux événements mai 68 7
SEKR Les types de sinistres pouvant bloquer le fonctionnement de l entreprise Blocage des accès Dégât des eaux Erreurs Humaines Sabotages physique Serveurs et baies Réseaux Ressources humaines RESSOURCES Locaux & Infrastructures 123 = 456 789 R 0# * Téléphonie Incendie Perte d intégrité des données Bugs Rupture électrique ou du froid Risques naturels (pollution,inondation) Coupure de lignes télécoms Panne matérielle 8
SEKR La continuité d activité et la gestion des risques En attente Prévention Serveurs et baies Réseaux Ressources humaines RH RESSOURCES Locaux & Infrastructures 123 = 456 789 R 0# * Téléphonie Avérés Réaction Sécurité Continuité de Service Continuité d Activité 9
Typologie des risques les plus fréquents Accidents Incendie, explosion, implosion, dégâts des eaux Pannes matérielles Événements naturels / pollutions (inondation, tempête, foudre, ) Pertes de services externes essentiels (électricité, eau ) Pollutions (chimiques, thermiques, électromagnétiques,...) Erreurs Erreur d utilisation, d administration, non-respect des consignes Erreur de conception et de réalisation Malveillances (Internes / venant de la concurrence / externe) Vol, fraude, divulgation Sabotage, vandalisme Piratage Pertes de ressources Départ de personnels clés / disparition d un fournisseur Événements sociaux Grèves, occupation de locaux stratégiques 10
Les multiples conséquences d un sinistre Pertes financières Manque à gagner, perte de trésorerie, pénalités de retard... Impact sur l image de marque Perte de confiance, perte de clientèle... Désorganisation durable Rupture du processus décisionnel, perte de productivité... Conséquences juridiques Non respect des contraintes vis à vis des obligations contractuelles,... 11
Evolutions des causes de déclenchement (SunGard Europe) Virus Mouvements sociaux Autres Vol Défaut d accès au site Incendie Désastre environnemental Inondation Déclenchement programmé Activités terroristes Communications Corruption de données Energie Matériel 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 12
Causes de déclenchement de secours informatique en 2010 (SunGard) 11% : autres 5% : incendie 23% : matériel 7% : environnement 2% : inondation 25% : communications 27% : Alimentation électrique 13
Face à ces risques, une seule réponse : Le Plan de Continuité d Activité Assurer la continuité des activités essentielles en priorité Limiter : Les conséquences d un sinistre auprès des clients L impact financier La perte d image La désorganisation Etre en conformité avec la réglementation Revenir à une situation normale aussi rapidement que possible Disposer d un argument commercial de plus en plus demandé Répondre aux demandes des clients Répondre aux demandes des actionnaires 14
Face à ces risques, une seule réponse : Le Plan de Continuité d Activité Un PCA est donc l ensemble des moyens organisationnels, techniques, humains et contractuels mis en œuvre afin de reprendre rapidement les activités vitales de l entreprise, suite à un sinistre significatif Le PCA doit tout prévoir pour assurer la continuité des processus de l entreprise et le retour à une situation normale suite à un sinistre. Les composantes d un PCA : 15
Quand et comment déclencher le PCA Majeur Impact Pertes usuelles Prévention Contrôle interne Formation Feu Dégât des eaux Fraude massive Grève massive Attentat Inondations Séisme Pandémie Emeutes Significatif Gestion des incidents PCA Gestion de crise Moyen Vol Perte de données Indisponibilité informatique Erreur humaine Procédure inadéquate Absence de procédures Perte de serveur Panne électrique Fraude interne ou externe Mouvement social Pertes extrêmes Faible PCA Assurances Provisions sur fonds propres Fréquence Jour Mois Année Décennie Siècle 16
Les quatre niveaux de déclinaison du PCA PRA : Plan de Reprise d Activité Le PRA définit les procédures et les moyens permettant, en cas de sinistre majeur, de redémarrer les parties vitales du SI PRA x SS SI 17
Les différents plans du PCA SI Plan de Continuité d Entreprise Plan de Gestion de Crise (Global) PCA métiers PCA SI Plan de Gestion de Crise SI Plan de Continuité des Opérations PRAp PRA PSI Métiers Informatique 18
Définition du PSI, du PRA, du PRAp PSI : Plan spécifique pour assurer le secours des fonctions centrales du Système d Information. Outre le périmètre du PRA, le PSI prend en compte les sinistres localisés (crash serveur, rupture de lien Internet, etc..) mais aussi l organisation du secours informatique et des services associés. PRA : Un Plan de Reprise d Activité met en œuvre l ensemble des processus et des moyens humains, matériels et technologiques permettant à l entreprise de faire face à un sinistre informatique majeur. PRAp : Le Plan de Reprise d Activité d une application a un cadre identique au PRA, mais ramené à l environnement applicatif. 19
Les besoins de continuité demandés par les métiers Les métiers doivent exprimer leurs besoins de continuité par processus / activités : Durée Maximale d Interruption Admissible (DMIA) Perte Maximale de Donnée Tolérable (PMDT) Nombre de position de travail sur les sites de repli, les ressources humaines, matérielles sauvegarde PMDT Sinistre DMIA Service restauré Reprise d activité 20
La réponse technique fournie La réponse technique s exprime par: Le délai de mise à disposition : «Recovery Time Objective (RTO)»: Des applications informatiques restaurées Des positions de travail opérationnelles sur le site de repli Des moyens de remplacement des ressources sinistrées La quantité de données perdue à la reprise d activité «Recovery Point Objective (RPO)» : Flux reçus Données enregistrées 21
L adéquation entre les besoins de continuité demandés et les réponses techniques proposées Nécessité d adéquation entre les besoins de continuité demandés par les métiers et les conditions techniques de reprise d activité : Demande des métiers : Durée Maximale d Interruption Admissible (DMIA) Perte Maximale de Donnée Tolérable (PMDT) Réponse technique : Recovery Time Objective (RTO) Recovery Point Objective (RPO) 22
Les différents plans d un PCA (exemple) Sinistre Décision de déclenchement du PCA Reprise d activité des processus métiers essentiels Reprise d activité des autres processus Situation normale Fonctionnement Normal Indisponibilité totale Secours Fonctionnement Normal Maintien en condition opérationnelle RTO Maintien en condition opérationnelle PGC Prévention PGC Plan de Gestion Crise PGC Plan de Gestion Crise PGC Prévention PCOM Prévention PCOM Plan de Communication (externe et interne) PCOM Secours PCOM Retour PCOM Prévention PRA Prévention PRA Plan de Reprise d Activité informatique locale PRA Secours PRA Retour PRA Prévention PHE Prévention PHE Plan d Hébergement Extérieur Ouverture de site de repli PHE Fonctionnement sur site de repli PHE Prévention PCO Prévention DMIA : Délai Maximal d Interruption Admissible PCO Plan de Continuité des Opérations Contournement PCO Secours PCO Retour PCO Prévention 23
Une nécessité de tendre à l égalité entre le DMIA et le RTO Fonctionnement normal Sinistre, l activité s arrête Réduire ce délai à zéro Situation rétablie Prévention Début de travail en mode dégradé Durée maximale d Interruption Admissible (DMIA) Recovery Time objective (RTO) PCM de Contournement PCM de secours AVANT PENDANT APRES 24
Sommaire I. Groupe Devoteam II. PCA : Concept et vocabulaire III. Solutions de secours IV. PCA Maturité et enjeux à venir 25
Les composants d un PCA Une organisation ad hoc de gestion de crise Des personnes entraînées Des mesures préventives Des solutions de secours informatique Des solutions de repli pour les utilisateurs Des plans et des procédures formalisés Des tests et des exercices de validation Une organisation de maintien en condition opérationnelle 26
Grands types de solution de secours informatique 27
Des solutions de secours informatiques plus détaillées Niveau 6 sécurité Niveau 5 Niveau 4 Complexe de Production Répartie Niveau 0 aucune mesure spécifique Niveau 1 Externaliser les sauvegardes Niveau 2 Copie électronique des sauvegardes Niveau 3 Stockage redondant Mirroring «local» Stockage redondant Mirroring «distant» Site Miroir Clusters «campus ou distants» Partage de la production entre 2 sites avec capacité de report mutuelle Complexité 28
Niveau 0: Aucune mesure spécifique Description Un site de production Pas de sauvegardes régulières et structurées Pas de dispositifs de redondance matérielle Sécurité physique et logique non gérée Site P Structure Risques Maximal sur l activité de l entreprise Perte d informations Partielle ou totale, selon l état du site de production après sinistre Objectif de temps de reprise 0 10 Coûts d implémentation 0 10 Site B 29
Niveau 1: Externalisation des sauvegardes Description Un site de production sauvegardes régulières et structurées de manière à pouvoir récupérer l information en cas de sinistre informatique Collecte, transport et stockage des médias dans un site externe sécurisé Pas ou peu de dispositifs de redondance matérielle Sécurité physique et logique non gérée Site P Structure Risques Disponibilité, cohérence et complétude des informations Capacité à reconstruire un centre de traitement Perte d informations Partielle: entre la dernière sauvegarde reçue et le sinistre Objectif de temps de reprise: 24h00 à 3 mois 0 10 Coûts d implémentation OPEX 0 10 Site B 30
Niveau 2: Copie électronique des sauvegardes («electronic vaulting») Description Un site de production sauvegardes régulières et structurées de manière à pouvoir récupérer l information en cas de sinistre informatique Transmission automatique des données vers une robotique cartouche dans un site externe sécurisé Pas ou peu de dispositifs de redondance matérielle Site P Structure Risques Disponibilité, cohérence et complétude des informations Capacité à reconstituer un centre de traitement Perte d informations Partielle: entre la sauvegarde répliquée et le sinistre Objectif de temps de reprise: 24h00 à 3 mois 0 10 Coûts d implémentation CAPEX+ OPEX 0 10 Site B 31
Niveau 3: Stockage redondant - Disques miroirs locaux (RAID) Description Un site de production Technologie matérielle et logicielle des sous systèmes disque permettant une recopie, exhaustive et synchrone, des données sur le même site Pas d autres dispositifs de redondance matérielle Site P Structure Risques Impact sur les performances Capacité à reconstruire un centre de traitement Perte d informations En cas de disques/données endommagés lors du sinistre Objectif de temps de reprise: 3h00 à 3 mois 0 10 Coûts d implémentation CAPEX+OPEX 0 10 Site B 32
Niveau 4: Stockage redondant - Disques miroirs distants (RAID) Description Un site de production Technologie matérielle et logicielle des sous systèmes disque permettant une recopie, exhaustive et synchrone ou asynchrone, des données sur un site distant Interconnexion entre les sites par haut débit Site P Structure Risques Impact sur les performances Perte d informations Limitée aux transactions en cours Possible en cas de données endommagées lors du sinistre Objectif de temps de reprise: 1 jour 0 10 Coûts d implémentation: CAPEX+OPEX 0 10 Site B 33
Niveau 5: Site Miroir Clusters étendus campus ou distants Description Deux sites de production Gestion centralisée de ressources de traitement implantées dans deux sites proches ou distants géographiquement Distances limitées dues aux échanges synchrones à travers de la fibre optique et aux restrictions des fournisseurs Supplément de ressources de traitement On line Site P Structure Risques Complexité Architecture technique conçue pour la perte d un site Perte d informations Limitée aux transactions en cours Objectif de temps de reprise: <4 heures 0 10 Coûts d implémentation: CAPEX+OPEX 0 10 Site B 34
Niveau 6: Complexe de production répartie Description Deux sites de production Gestion centralisée de ressources de traitement implantées dans deux sites proches ou distants géographiquement Distances limitées dues aux échanges synchrones sur fibre optique et aux restrictions des fournisseurs Architecture du SI conçue pour la tolérance aux pannes à tous les niveaux par équilibrage de charge entre les sites Supplément de ressources de traitement (capacité de report d un site sur l autre) Site P1 Structure Risques Complexité, innovation Architecture du SI conçue pour supporter la perte d un site Perte d informations Limitée aux transactions interactives en cours Objectif de temps de reprise: minutes 0 10 Coûts d implémentation: CAPEX+OPEX 0 10 Site P2 35
Exemple : Secours à chaud par réplication asynchrone avec sauvegarde de recours Site production Site Secours Serveurs production Serveurs secours Serveurs de sauvegarde Data production Data secours Serveurs de sauvegarde Réplication a synchrone des données de production Ligne à très haut débit Robots sauvegarde bande Transport quotidien des sauvegardes Robots sauvegarde bande 36
Quelle est la bonne distance entre les deux sites? La distance entre les deux sites (production et secours) n est pas réglementée Un paradoxe, il faut : Être proche pour faciliter le maintien en condition opérationnelle Tenir compte des contraintes technologiques Mais ne pas être soumis aux mêmes risques La distance en France entre les deux sites est en moyenne de 22 km, Variante : Deux sites interconnectés distants d une dizaine de kilomètres et un site de secours "ultime" distant de plusieurs centaines de km pour pallier un sinistre régional 37
Sommaire I. Groupe Devoteam II. PCA : Concept et vocabulaire III. Solutions de secours IV. PCA : Maturité et enjeux 38
Méthode Devoteam Consulting Maturité des PCA 2008 1 : Niveau faible : Périmètre 4 3 La continuité d activité n'est pratiquement pas assurée. Quelques initiatives peu formalisées Gouvernance Entraînement 2 1 0 Organisation Moyens Vous Panel Devoteam 2 : Niveau moyen : La continuité d activité existe. Elle n est pas suffisamment opérationnelle. Une base d information de plus de 100 établissements Une notation selon 6 axes d analyse Une analyse personnalisée par : Procédures Secteur d activité Maturité du projet Taille de l entreprise Type de risques Budget 3 : Niveau professionnel : La continuité d activité est opérationnelle dans la majorité des cas. PCA intégré 4 : Niveau renforcé : La continuité d activité est opérationnelle dans tous les cas normalement rencontrés. État de l art 39
Continuité d activité, où en sont les entreprises? Maturité des PCA 2010 2008 Panel représentatif de 100 établissements Gouvernance Périmètre Périmètre 4 3 2 1 0 Organisation Organisation Evaluation Devoteam 2008 Consulting 2010 Entraînement Moyens Moyens Procédures 40
Continuité informatique, où en sont les entreprises? Maturiré PCA - Energie 1 Maturiré PCA - Energie 2 Gouvernance Périmètre 4 3 2 1 0 Organisation Gouvernance Périmètre 4 3 2 1 0 Organisation Entraînement+A57 Moyens Entraînement Moyens Procédures Procédures Maturiré PCA - Groupe Bancaire Maturiré PCA - Opérateur Télécom Gouvernance Périmètre 4 3 2 1 0 Organisation Gouvernance Périmètre 4 3 2 1 0 Organisation Entraînement Moyens Entraînement Moyens Procédures Procédures 41
Enjeux à venir Gouverner Prouver Impliquer le management Définir une feuille de route Maintenir l existant à jour Optimiser les investissements Améliorer les moyens Constituer une filière PCA S intégrer dans une démarche globale de Risk Management Sensibiliser les collaborateurs Piloter les travaux récurrents Contrôler la conformité Assister les opérationnels Construire un programme d entraînement Répondre aux audits Tester l interopérabilité des plans Réaliser des tests probants Diminution progressive des travaux de préparation Implication des décisionnaires Implication des opérationnels Orientation «produits» Interfaçage avec les partenaires Rapprochement des conditions d un sinistre réel 42
Normalisation de la continuité d activité BS 25999 Business Continuity Management (British Standard) ISO 27005 : Information security risk management ISO 21301 : Societal Security Preparedness et continuity management systems requirements. C'est une norme d'exigences. Elle permet de se certifier (en cours de normalisation officielle) ISO 22313 : Guide associés à l'iso 22301 qui reprendra la BS 25599 (non publié) ISO 27031 : Guidelines for ICT readiness for business continuity. Guide associés à l'iso 22301 (en élaboration). 43
Quelques conseils Ecueils à éviter par la Direction Informatique Ecueils à éviter par les Directions fonctionnelles 44
Ecueils à éviter par la Direction Informatique Mettre en œuvre des solutions techniques «top niveau», pour «se faire plaisir» N associer les Directions Fonctionnelles qu au moment de la recette du Plan de Continuité Avoir une approche uniquement technique du Plan de Reprise d Activité ou du Plan de Secours Informatique 45
Ecueils à éviter par les Directions fonctionnelles «Ce n est pas mon problème» «Mon activité ne peut pas être suspendue, et ne peut tolérer aucune perte de données. Mais je n ai aucun budget!» Ne pas confondre «qualité de service» et «plan de continuité» Ne pas prendre en compte les contraintes techniques liées notamment aux technologies ou à l environnement Considérer le Plan comme un projet «one shot» 46
Un proverbe chinois pour conclure Les tuiles qui nous protègent de la pluie ont toutes été posées par temps sec!!! 47
Contact : Ahmed ZERROUKI Tel : +213 661 792 792 Mail : ahmed.zerrouki@devoteam.com 48