Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
Une fiabilité globale pour les sites qui ne PEUVENT pas tomber Table des matières Introduction....3 Avantages de la haute disponibilité...4 Identifier les risques et les menaces....5 Déterminer les besoins en matière de disponibilité....6 Adopter un modèle de responsabilités partagées...6 Créer une redondance avec des zones de disponibilité AWS...7 Surveiller vos sites et systèmes...9 Tester les procédures de reprise.... 10 Conclusion.... 11 2 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
Introduction Imaginez que vous êtes à la tête d une start-up technologique qui offre un service logiciel intelligent basé sur le Cloud. Vous avez travaillé dur pour le construire et le promouvoir, et un jour, un petit miracle se produit votre logiciel est en vedette sur Mashable. Avant même que vous ne vous en rendiez compte, votre site reçoit des dizaines de milliers de visites et votre serveur développé en interne plante sous la charge du trafic. Vous voilà confronté à une interruption de votre service. Et ce qui aurait dû être votre jour de gloire tourne au cauchemar. Dans un tel scénario, disposer d une solution haute disponibilité vous permettrait d éviter le pire. L IaaS (Infrastructure as a Service) peut constituer une solution tentante, mais incomplète. Si vous développez des services très pointus qui exigent des solutions haute disponibilité, il est préférable d opter pour le modèle PaaS (Platform as a Service). Grâce à un système robuste et un fonctionnement sans faille, le modèle PaaS garantit la satisfaction des clients. L ebook Building Success on Acquia Cloud: Ten Layers of PaaS décrit les dix couches du modèle PaaS d Acquia. Ces couches sont les ressources virtuelles, la haute disponibilité, la montée en charge, la maintenance et l optimisation, le monitoring, la prestation continue, la maintenance des applications, les outils tiers, les services de support d application et d infrastructure, et votre code personnalisé. Dans cet ebook, nous allons explorer quelques-unes des raisons qui doivent conduire à opter pour une solution haute disponibilité, et détailler les meilleures pratiques à respecter pour la conception de votre solution d hébergement. 3 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
Avantages de la haute disponibilité Cela peut sembler évident, mais il est toujours utile de prendre le temps de réfléchir aux raisons qui font que la haute disponibilité est importante. Comprendre les risques et les coûts impliqués permet en effet de prendre une décision éclairée quant à la nécessité de protéger la disponibilité de votre site. Dans le cas des sites de commerce très fréquentés, les interruptions ont une incidence directe sur le chiffre d affaires. Selon Fierce Enterprise Communications, les interruptions font perdre aux entreprises 26 millions de dollars chaque année, rien qu en Amérique du Nord. Elles représentent environ 127 millions d heures de travail annuelles dans le monde entier, avec un coût encore plus important pour les sociétés. Mais les dégâts ne se limitent pas à une perte d argent immédiate : les interruptions peuvent entamer la confiance de vos clients, pousser certains de vos clients à délaisser définitivement votre site, vous faire rater des occasions de conquérir de nouveaux clients. La mauvaise publicité d une panne peut se répandre comme une traînée de poudre sur les réseaux sociaux et écorner définitivement l image de marque de votre entreprise. Le coût réel est donc difficile à mesurer, puisque les répercussions ne se limitent pas aux transactions perdues au moment de l interruption. L interruption des applications web sans vocation commerciale peut également générer des coûts importants. Lorsque les ressources opérationnelles qui sont vitales pour la mission d une entreprise (systèmes de gestion des stocks, files d attente de billetterie, moteurs de réservation, référentiels de dossiers médicaux, services d assistance, ou bases de connaissances) s arrêtent, l interruption peut paralyser toute l entreprise. Le surcoût d une telle perte de productivité peut être colossal. Pour autant, la question de la disponibilité ne se limite pas au risque d une perte de service. Pour les sites à très fort trafic, la disponibilité impacte également la vitesse des transactions. Quelques millisecondes de latence par interaction peuvent avoir un effet significatif sur la satisfaction des clients. Vous devez concevoir votre environnement d hébergement en fonction du plus bas niveau de vitesse et de disponibilité requis 24 heures sur 24 et 7 jours sur 7. 4 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
Identifier les risques et les menaces Afin de concevoir une solution d hébergement efficace et optimale, vous devez tenir compte des facteurs et des événements qui peuvent avoir un impact négatif sur la disponibilité. Il n est malheureusement pas facile d anticiper tous les risques possibles ; prendre le temps d une planification préalable permet toutefois d en atténuer un certain nombre. Les menaces les plus courantes et les plus significatives sont notamment liées aux aspects suivants : Matériel : panne d un disque dur, dysfonctionnement d un commutateur, où même déconnexion accidentelle d un cordon d alimentation dans la salle des serveurs Infrastructure : coupures d alimentation, connectivité réseau et bande passante, climatisation Catastrophes imprévisibles : incendie, inondation, ouragan, tornade, actes de guerre ou terrorisme Couche applicative : bogues, processus hors de contrôle, conflits, mises à jour incompatibles Surcharge de trafic : trafic fortuit (pic de fréquentation dû à une couverture médiatique positive) ou malveillant (attaque DDOS) Faille de sécurité : hacking, sabotage interne, logiciel de sécurité défectueux Modifications de code prévues : déploiement de nouvelles versions, mises à jour régulières Latence : proximité physique, bande passante, performances logicielles et matérielles Cette liste montre clairement la nécessité d un plan soigneusement conçu en fonction des exigences de disponibilité de votre site. Dans les sections suivantes, nous détaillerons certaines meilleures pratiques à respecter pour faciliter la gestion de ce processus. 5 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
Déterminer les besoins en matière de disponibilité La première étape pour cerner vos besoins en matière de disponibilité et de fiabilité et choisir votre solution d hébergement en fonction de ces besoins consiste à déterminer votre tolérance à la perte de service. Votre entreprise peut-elle supporter une journée complète d interruption si votre serveur tombe en panne et que vous devez tout restaurer à partir de sauvegardes? Ou les interruptions doivent-elles durer au maximum une heure, le temps de mettre en ligne une base de données répliquée et de lancer une nouvelle instance de votre site à partir de scripts préparés pour une telle urgence? Votre site est-il un site de commerce très fréquenté, ou permet-il l accès à une application vitale pour votre activité, auquel cas vous devez pouvoir rediriger le trafic vers un site de secours en quelques minutes ou même passer instantanément à un deuxième site actif avec équilibrage de charge sans subir d interruption notable? La haute disponibilité a un coût qui doit être comparé à celui d une panne ou d une interruption de service. Adopter un modèle de responsabilités partagées Impliquer différents acteurs contribue à garantir la haute disponibilité et à maximiser le temps de fonctionnement de votre site. Chez Acquia, nous préconisons un modèle de responsabilités partagées pour plus de sécurité. À l une des extrémités de la chaîne, les utilisateurs ont la responsabilité d utiliser le site de manière appropriée, de protéger leurs mots de passe, etc. À l autre extrémité, le fournisseur d hébergement, comme Amazon, est responsable du matériel, de l infrastructure réseau et de la sécurité physique dans le centre de données. Entre les deux, les ingénieurs logiciels ont la responsabilité d adopter des pratiques de codage sécurisées et stables, et les équipes d assurance qualité vérifient 6 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
le fonctionnement et la sécurité. De cette manière, même si votre rôle consiste à vous assurer que la haute disponibilité est garantie à toutes les étapes, vous n avez pas à faire tout le travail vous-même. Vous pouvez compter sur d autres experts pour mener à bien une partie de la mission, tandis que vous vous occupez d orchestrer l ensemble. L une des principales fonctions d Acquia dans cette matrice des responsabilités, c est de concevoir une configuration d hébergement qui réunit ces composantes au sein d une solution conforme à vos besoins spécifiques. Nous utilisons pour cela les services d hébergement fournis par Amazon, combinés avec nos configurations Drupal optimisées et nos outils logiciels pour la gestion et le monitoring. Avec notre modèle PaaS, notre responsabilité est de veiller à ce que ces éléments fondamentaux soient correctement assemblés, déployés et entretenus. Créer une redondance avec des zones de disponibilité AWS Concevoir un système hautement disponible implique de se préparer aux pannes. Afin de maximiser la disponibilité de votre logiciel, vous devez partir du principe que n importe quelle pièce du puzzle matériel, infrastructure réseau, emplacement physique, base de données, couche applicative peut présenter une défaillance inattendue, et que votre plateforme doit être prête à composer avec cette défaillance. Avec Acquia, vous pouvez compter sur une plateforme stable et hautement disponible à tout moment parce que nous nous appuyons sur un fournisseur de Cloud Computing testé et éprouvé, Amazon Web Services (AWS). La principale arme contre les interruptions, c est la redondance. Le centre de données est responsable d un certain degré de redondance : multiples sources d alimentation sans coupure (UPS) et alimentation de secours, multiples voies de connectivité réseau, matériel serveur tolérant aux pannes, etc. Mais c est au fournisseur de service d hébergement qu il incombe de concevoir un environnement d hébergement propre à compléter les efforts du centre de données et protéger le site en cas de panne ne relevant pas de la responsabilité de ce dernier. Acquia crée cette redondance en s appuyant sur les zones de disponibilité AWS. Bien que la configuration physique puisse varier, les zones de disponibilité AWS correspondent généralement à des centres de données distincts. Chaque zone est isolée des autres d un point de vue opérationnel, de 7 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
sorte que toute défaillance de l une (due à une panne de courant ou à un incendie, par exemple) n entraîne pas la défaillance des autres même si elles sont reliées par une connectivité haut débit. Ces zones de disponibilité sont situées dans des endroits à faible risque d inondation et utilisent des services et des réseaux électriques indépendants pour éviter la convergence des points de défaillance. Elles sont par ailleurs réparties géographiquement dans différentes régions, notamment dans l Est des États-Unis, l Ouest des États-Unis (deux régions), l Union européenne et l Asie-Pacifique (trois régions). Cette répartition géographique offre deux avantages supplémentaires : la protection contre les catastrophes localisées qui pourraient affecter plusieurs zones de disponibilité, et la proximité physique avec les populations d utilisateurs, ce qui permet de réduire la latence. Les zones de disponibilité AWS et des outils de gestion Acquia et Amazon permettent à Acquia de concevoir une large gamme de solutions d hébergement adaptées aux exigences de disponibilité spécifiques. Au minimum, une entreprise peut lancer une instance de son site web et assurer des sauvegardes régulières du code et de la base de données. En cas de panne, le site peut être reconstruit à partir de la dernière sauvegarde. Il ne s agit clairement pas de «haute disponibilité», mais cette approche peut suffire pour les besoins de certaines entreprises. Grâce à Acquia et AWS vous pouvez aussi : Lancer une instance du site dans une zone de disponibilité avec une réplication de la base de données en temps réel vers une base de données esclave située dans une autre zone, et utiliser des processus à base de scripts pour lancer rapidement une nouvelle instance du site en cas de besoin. Si une panne survient, la base de données de la seconde zone peut être promue au statut de master, et les scripts permettent de créer une nouvelle instance qui sera opérationnelle beaucoup plus rapidement. Lancer deux instances du site qui partagent une unique base de données, avec réplication en temps réel de la base de données. Dans ce cas, les deux instances peuvent être dans la même zone ou, pour plus de sécurité, dans des zones ou même des régions distinctes. La gestion du trafic sur les deux instances peut être assurée par des technologies telles que les équilibreurs de charge et/ou les DNS round robin. Lancer jusqu à quatre instances d une application dans différentes régions, pour les situations les plus exigeantes. Avec une réplication des données et une détection automatique des pannes, le basculement entre les applications s effectue dès lors qu une défaillance est détectée. Cette approche minimise la latence en servant les sites à partir d emplacements physiquement plus proches des utilisateurs, et élimine pratiquement les risques d interruption grâce à de multiples voies de redondance. 8 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
Chacune de ces solutions implique bien entendu un certain niveau de complexité. C est la raison pour laquelle les ingénieurs d Acquia ont pour mission de concevoir une solution spécifiquement adaptée à vos besoins métiers. Déterminer ce qui sera répliqué et où, concevoir et configurer des sauvegardes et des processus de restauration, optimiser l équilibrage de charge et automatiser la détection des pannes tous ces aspects impliquent diverses décisions et des efforts considérables pour créer une solution équilibrée répondant précisément à vos exigences en matière de disponibilité. Nos ingénieurs travaillent activement à la conception et la mise en œuvre de ces solutions pour vous. Surveiller vos sites et systèmes Maintenir un environnement d hébergement hautement disponible implique un autre facteur crucial : le monitoring des systèmes. Au minimum, vous devez surveiller le site lui-même pour vous assurer qu il répond aux demandes. Différents outils sont disponibles pour surveiller tous les aspects du site et de la plateforme d hébergement : trafic des demandes, tentatives de piratage, performance de la base de données, vitesse des transactions, latence applicative et réseau, entre autres. Même les services de surveillance doivent être surveillés. Les processus de basculement automatisé et les configurations d hébergement dotées de capacités d auto-rétablissement peuvent en effet subir des pannes ; il est donc essentiel de les surveiller aussi. Le monitoring d application et de plate-forme occupe une place centrale dans la solution d hébergement Cloud d Acquia et nous avons créé une gamme complète de produits et de services pour répondre spécifiquement à ces besoins. Acquia Insight, notre suite emblématique, propose une série d outils de réglage, de configuration, de monitoring et de gestion Drupal avec une interface de type tableau de bord intuitive et visuelle. Le service d assistance Acquia propose un support application et plateforme par abonnement, accessible non seulement pendant la phase de développement, mais aussi pour la résolution des problèmes en continu et les interventions d urgence 24x7x365. L Acquia Network Services Marketplace permet d accéder à des solutions Cloud tierces pour le suivi avancé des performances, l optimisation de la vitesse et d autres services essentiels. 9 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
La MTA (Mass Transit Authority) de la ville de New York a adopté la suite de gestion Drupal d Acquia pour son site de prévisions météo et d alertes MTA.info. Lorsque l ouragan Sandy a frappé la côte Est des États- Unis, la MTA a pu continuer à communiquer efficacement avec ses clients, les médias et le public en donnant des informations actualisées et sans interruption même au plus fort de la tempête. Grâce à une surveillance efficace et au réacheminement des données et des connexions, les équipes de développeurs d Acquia en Australie et en Californie ont pris le relais lorsque le support local a cessé de fonctionner. La MTA n a subi aucune interruption et a assuré des vitesses de téléchargement de deux secondes pour la plupart des visiteurs malgré un fort trafic. Tester les procédures de reprise En premier lieu, concevoir et mettre en œuvre une solution d hébergement qui répond parfaitement à vos besoins de disponibilité. Avoir une base de données, des sauvegardes et des scripts pour lancer une nouvelle instance de votre application à la demande, ou une deuxième instance avec équilibrage de charge prête à prendre le relais en cas de défaillance de la première. Et ensuite? Tester. Tous ces efforts sont en effet vains si, au moment où votre site est en panne, vous découvrez qu il manque une étape essentielle dans le script, que votre base de données de sauvegarde est mal configurée, que la sauvegarde est chiffrée, qu elle est protégée par un mot de passe que vous n avez pas, qu elle n a pas été réalisée du tout, ou que la personne qui s occupe de la restauration est indisponible. La seule façon de vous assurer que votre plan de reprise est efficace, c est de le mettre à l épreuve, idéalement dans un environnement de production, ou tout au moins dans un environnement de test. Acquia vous permet de tester vos sauvegardes et vos procédures sans incidence sur la disponibilité de votre site. 10 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber
Conclusion En fin de compte, créer un environnement d hébergement hautement disponible et tolérant aux pannes, c est accepter l éventualité d une défaillance et prendre des mesures pour l atténuer quand elle survient. Acquia intègre de multiples zones de disponibilité AWS dans ses offres d hébergement Cloud, ainsi que des outils de surveillance et de gestion de classe mondiale, des services de support 24x7 et une expertise inégalée pour vous apporter la solution idéale en fonction de vos besoins en matière de disponibilité. Nous travaillons en étroite collaboration avec nos clients pour garantir la haute disponibilité des systèmes vitaux qui ne doivent subir aucune interruption. N hésitez pas à nous appeler pour en savoir plus. Avec l aide de nos experts vous lancerez votre premier site dès aujourd hui. 01 79 97 25 70 En savoir plus acquia.com PARLONS-EN 11 Une fiabilité globale pour les sites qui ne PEUVENT pas tomber www.acquia.com SKU 0432-140728-FRA-EBOOK