Sécurité de l Infrastructure

Documents pareils

ITIL Gestion de la continuité des services informatiques

Cluster High Availability. Holger Hennig, HA-Cluster Specialist

Cours 13. RAID et SAN. 2004, Marc-André Léger

Livre blanc Haute disponibilité sous Linux

Disponibilité 24-7/365

Haute Disponibilité High-Availability : HA. Les enjeux

Informatique pour scientifiques hiver Plan général Systèmes d exploitation

Sybase High Avalaibility

La Continuité d Activité

TIVOLI STORAGE MANAGER. Denis Vandaele

Consolidation. Grid Infrastructure avec la 11gR2

La continuité de service

Stockage Réseau. Le stockage s'échappe du système pour devenir une fonction réseau

VMware Infrastructure The New Computing Platform. Stéphane CROIX Systems Engineer

Hébergement de base de données MySQL. Description du service (D après OGC - ITIL v3 - Service Design- Appendix F : Sample SLA and OLA)

EX4C Systèmes d exploitation. Séance 14 Structure des stockages de masse

Windows Server Chapitre 1: Découvrir Windows Server 2008

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

1 LE L S S ERV R EURS Si 5

1200 Incendies par an dans des «Data Center»!! Et vous. Moi j ai Data Guard 10g!!!!

Configuration Cluster, DRS, HA, DPM et FT

Pourquoi OneSolutions a choisi SyselCloud

Augmenter la disponibilité des applications JEE grâce au clustering : Le projet open source JShaft

PERFORMANCE ET DISPONIBILITÉ DES SI

Un concept multi-centre de données traditionnel basé sur le DNS

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Configuration du serveur ESX

Oracle Maximum Availability Architecture

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Gestion de mémoire secondaire F. Boyer, Laboratoire Sardes

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Continuité de services et plan de reprise d activité

VMotion ne peut fonctionner qu avec une architecture de stockage centralisé de type SAN FC, iscsi ou NAS.

Haute Disponibilité de l environnement WMQ Outils & Méthodes

SQL Server 2008 solutions de sauvegarde et de continuité

Routeurs de Services Unifiés DSR-1000N DSR-500N DSR-250N

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

«clustering» et «load balancing» avec Zope et ZEO

Agenda de l introduction à la résilience

Virtualisation des Serveurs et du Poste de Travail

en version SAN ou NAS

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Dynamic Computing Services solution de backup. White Paper Stefan Ruckstuhl

Spécifications techniques

VMware vsphere 5 au sein du Datacenter Complément vidéo : La configuration et la sécurisation de l'esx

Systèmes et algorithmes répartis

Le e s tocka k ge g DAS,NAS,SAN

vbladecenter S! tout-en-un en version SAN ou NAS

Projet Sécurité des SI

La surveillance réseau des Clouds privés

Le stockage unifié pour réduire les coûts et augmenter l'agilité

Solutions avancées pour la protection des données et la continuité d activité

Hyper-V et SC Virtual Machine Manager sous Windows Server 2008 R2

Mise en place d un cluster. De basculement. Et DHCP Failover. Installation. Préparation. Vérification

Protection des données avec les solutions de stockage NETGEAR

FAMILLE EMC RECOVERPOINT

Smart Notification Management

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

Backup , l intégration du backup sur disque

Gestion des sauvegardes

Easy as NAS Supplément Entreprises. Guide des solutions

Fonctions. Solution professionnelle pour le stockage de données, la synchronisation multi- plateformes et la collaboration

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles

Master Informatique et Systèmes. Architecture des Systèmes d Information. 03 Architecture Logicielle et Technique

Consolidation de stockage

Technologie de déduplication de Barracuda Backup. Livre blanc

FORMATION PostgreSQL Réplication / Haute Disponibilité

La plate forme VMware vsphere 4 utilise la puissance de la virtualisation pour transformer les infrastructures de Datacenters en Cloud Computing.

Sans trop entrer dans les détails, la démarche IO Model consiste à : Pour cela, Microsoft découpe la maîtrise de l infrastructure en quatre niveaux :

L unique SAN industriel proposant un stockage multiniveau automatisé (Automated Tiered Storage)

VMware vsphere 5. VMware vsphere 5. Au sein du Datacenter. La configuration et la sécurisation de l ESX 2 H de vidéo 49,99. livre.

Plan de cette matinée

Zimbra Collaboration 8.X

[WEB4ALL PRESENTATION ET TARIFS VPS INFOGERES]

100% Swiss Cloud Computing

Système de stockage Cisco NSS baies Gigabit

Le socle de sécurité nouvelle génération Consolider, virtualiser et simplifier les architectures sécurisées

Nouvelles de Swisscom Cloud Perspectives Cloud Computing

Retour d'expérience sur Nagios 3. Christophe Sahut

Vulnérabilités engendrées par la virtualisation. Jean-Marie Petry / jean-marie.petry@rbs.fr Chef de Projet / Ingénieur ISIAL

Système de stockage sur disque IBM Storwize V5000

Section I: Le Contexte du DATA CENTER Pourquoi l AGILITE est Nécessaire dans le DataCenter

Installation d une architecture VMware Infrastructure 3 : Bilan et perspectives

Etude d architecture de consolidation et virtualisation

Continuité de service et maîtrise des coûts de possession en environnement virtualisé

Logiciel HP StorageWorks Enterprise Virtual Array (EVA) Fiche technique

La replication dans PostgreSQL

Réseau - Sécurité - Métrologie - Data Center. Le leader du marché allemand des UTM débarque en France avec des arguments forts!

Sommaire. AIDAUCLIC BACKUP : Solution de sauvegarde en ligne 3. Quelles problématiques résout la solution? 3. Fonctionnement de la solution 4

Haute-disponibilité et bases de données

Proposition d une architecture pour ebay, en mettant l accent sur les notions de scalabilité, de résilience, et de tolérance aux pannes.

L état de l ART. Évolution récente des technologies. Denis Szalkowski Formateur Consultant

FACILITER LES COMMUNICATIONS. Le gestionnaire de réseau VPN global de Saima Sistemas

Windows Server 2012 Administration avancée

Technologie Netapp. Novembre 2010

ICT7 Luxembourg. ICT7 Belgium. ICT7 France. 33 people. 12 people. 2 people

Description de Service

NEC Virtual PC Center

Transcription:

Sécurité de l Infrastructure Jean-Noël Colin jean-noel.colin@fundp.ac.be 1

Agenda Introduction Single System High Availability Connectivité Disaster Recovery Data management Monitoring Contract matters 2

Introduction Qu est-ce que l infrastructure? Matériel Ordinateurs (postes individuels, serveurs) Stockage Backup Imprimantes Réseau Datacenter Loi de Murphy: si quelque chose peut mal tourner, alors cette chose finira infailliblement par mal tourner 3

Introduction Loi de Moore (1965): le nombre de transistors dans une puce double tous les 24 (18) mois. 4

Introduction Les capacités de stockage augmentent plus vite que la loi de Moore Kryder dans Scientific American, 2005: Capacité et performance des différents composants augmentent, mais pas au même rythme Impact sur les systèmes et les applications Croissance annuelle (%) Complexité CPU 50 Capacité mémoire 60 Vitesse accès mémoire 10 Capacité disque 60 Vitesse disque 25 Vitesse réseau 40 5

Introduction Objectifs de sécurité pour l infrastructure Confidentialité Probablement moins important... Plus lié au contrôle d accès Integrité Availabilité Continuité du business IT en support au business Continuité des opérations IT Autres termes: RAS Reliability, Availability, Serviceability 6

Introduction Disponibilité impactée par Organisation du travail: heures de bureau ou 24x7? Intervention planifiée Opération de maintenance Panne: deux mesures: MTBF Mean Time Between Failure MTTR Mean Time To Repair Disponibilité = MTBF/(MTBF + MTTR) MTTR plus facile à améliorer que MTBF Meilleur matériel/vendeur Meilleur contrat de support 7

Introduction Fiabilité Probabilité qu un système ou un composant sera disponible sur une période de temps donnée Maintenabilité Mesure de la facilité avec laquelle un système peut être maintenu ou réparé Aussi simple que possible, aussi complexe que nécessaire 8

Introduction Fiche produit Sun Storage J4400 Array 9

Introduction 1.2M hrs MTBF 136 ans 10

Introduction Menaces Panne Erreur humaine Acte intentionnel Catastrophe naturelle Principes généraux (parfois difficiles à concilier) Robustesse Minimiser la probabilité de panne Viser la simplicité: KISS Redondance Eviter les Single Points of Failure Granularité des observations Différents niveaux: composant - système 11

Introduction Redondance Il ne suffit pas de dupliquer... il faut aussi gérer... Gestion des pannes Basculement (failover) Gérer l état sur les composants dupliqués 12

Système isolé Vue simplifiée de l ordinateur 13

Système isolé Fiabilité du matériel 14

Système isolé Processeur (CPU) Multiples CPU Multiples cartes CPU Activer/déactiver Hot swap Memoire Détection d erreur Correction d erreur Memory scrubbing 15

Système isolé Bus système et backplane Interconnection des composants Reprise sur panne limitée Requiert simplicité et robustesse Interfaces I/O Connexions vers le monde extérieur Duplication possible Failover manuel ou automatique Possibilité de vitesse de transfert accrue Hot swap? Cables et connexions Longueur, étiquettage, placement 16

Système isolé 17

Système isolé Alimentation Configuration n + 1, n + 2 Ventilateur = maillon faible Alimentation redondantes (jusqu aux lignes) UPS Interventions sur le matériel Peuvent causer de nouveaux problèmes Nécessitent soin formation outils ex: tapis anti-statique 18

Système isolé Stockage de données Support magnétique Parties mobiles Risque de panne relativement élevé Données stockées dans des fichiers Fichiers stockés sur disque et organisés en système de fichiers (file system) Disque données vs disque système Que faire en cas de panne disque? Restaure le contenu du backup 19

Système isolé Système de fichiers Définit comme les données sont physiquement organisées sur le disque Fonctionalités Journaling, liens, support de la casse des caractères, chiffrement Meta-données Nom, dates (création, modification), permissions, contrôle d intégrité Allocation de l espace Limites Taille (fichier, filesystem, nom de fichiers ), nombre d entrées FAT, NTFS, VxFS, UFS, EXT3, ReiserFS, ZFS, QFS 20

Système isolé HSM - Hierarchical Storage Management Motivations Patterns d accès aux données Différents ratios Capacité/Coût selon le medium Besoin en croissance constante Idée Choisir le medium en fonction du pattern d accès Exemple: SamFS 21

Système isolé RAID Redundant Array of Inexpensive Disks <> SLED Single Large Expensive Disk Différents niveaux combinables Exploite 3 mécanismes Mirroring Striping Contrôle de parité 22

Système isolé Raid 0 - Striping Pas de redondance Répartit la charge sur plusieurs disques Contrôleur unique? Permet d aller au-delà de la capacité individuelle d un disque Deux paramètres #disks (largeur du stripe) #Bytes per chunk (taille du stripe) Difficile à optimiser: trop petit: utilisation équitable des disques, mais fichiers éclatés entre plusieurs chunks trop grand: overhead minimum lors de l accès aux données, mais utilisation non équitable des disques, Panne d un seul disque implique perte de données 23

Système isolé 24

Système isolé Raid 1 - Mirroring Redondance Disque 1 et Disque 2 sont identiques Ecriture plus lente Lecture plus rapide si concurrence Coût de stockage doublé En cas de panne, remplacement du disque et re-construction du miroir 25

Système isolé 26

Système isolé Raid 5 Striping + contrôle de parité n-way RAID 5: n-1 data chunk + 1 chunk de parité Lecture efficace: distributée entre les disques Ecriture peu efficace Nécessite reads + 2 writes Taille d écriture importante pas besoin de lecture Efficacité de l utilisation de l espace (n-1)/n En cas de panne, remplacement du disque et reconstruction des chunks perdus Opération lente car nécessite de relire l entièreté du stripe 27

Système isolé 28

Système isolé Raid 10 Stripe de miroirs Résumé RAID #disques Efficacité Fiabilité Reconstr uction Seq. Read Rnd Read Seq. Write 0 2,3 n 0 ++ + ++ + 1 2 n/2 ++ + + + 0 0 5 3,4 (n-1)/n + - + + - - 10 Rnd. Write 29

Système isolé Software RAID et Volume Manager Veritas Volume Manager, LVM, DiskSuite Configuration définit le lien entre les volumes logiques et les volumes physique Configuration doit être sauvegardée de manière sûre (plusieurs fois sur des appareils différents) Volume Manager joue le rôle de driver pour les couches supérieures Consomme des ressources Hardware RAID Controller Contrôleur spécialisé/disques connectés directement Plus efficace car toutes les opérations sont réalisées en hardware 30

Système isolé Appareil dédié au stockage Solution complète et intégrée, incl. CPU et mémoire Fonctionnalités avancées Snapshot Split mirror ou Copy on write Remote copy EMC, SUN/StorageTek 31

Système isolé 32

Système isolé 33

Virtualisation Infrastructure virtualisée Partage de ressources entre plusieurs clients Ex: Timesharing, mémoire virtuelle, volumes logiques, réseaux virtuels Motivations Cost-effectiveness: nombreux systèmes sous-utilisés Consolidation Gain d espace Maintenabilité Gain d énergie 34

High-Availability Cluster pour high-availability Redondance au niveau du système Solution aux pannes hardware et OS Solution aux problèmes d environnement en cas de DRP Service dissocié d un hôte physique, mais attaché à un hôte logique Types de clusters Cluster Failover Le service bascule d un noeud à l autre Cluster en distribution de charge Le service est exécuté sur plusieurs hôtes simultanément 35

High-Availability Cluster Failover Service A Host A Host B Storage Storage 36

High-Availability Cluster failover Configuration du cluster Etat partagé Communication Inter-node Heartbeat Quorum device Intégration d un service Comment démarrer/arrêter/vérifier? Ressources nécessaires: volumes logiques, adresses IP... Noeud préféré Basculement Timeout, ping-pong Syndrôme de Split brain Dépendances entre services 37

High-Availability Cluster Load-balancing Principalement pour des services stateless Web servers, directory services (LDAP, AD, DNS ) Fermes de serveurs Répartir la charge des requêtes entrantes entre différents serveurs offrant le même service Algorithme de distribution peut être simple (round-robin, déterministe) ou plus complexe, intégrant par ex. les caractéristiques des noeuds DNS Load balancing, IP load balancing, reverse proxies 38

Connectivité Réseau Menaces Disponibilité Panne de composants Interruption de liaison Confidentialité Ecoute passive (eavesdropping) Contrôle d accès Integrité Modification des communications Brouillage 39

Connectivité Réseau Disponibilité Redondance NIC Segment network Fournisseurs Type de connexion 40

Connectivité Réseau Confidentialité le réseau est la porte d entrée vers le serveur... et vers l organisation... Firewall Filtrage de paquets Inspection stateful Passerelle applicative DMZ VPN Tunnel sécurisé sur un lien non-sécurisé utilisateurs nomades accès à des partenaires 41

Datacenter 42

Datacenter Solution complète Installations Sol surélevé, cablage, contrôle d accès Moyens mis en oeuvre HVAC - Heat, Ventilation, Air Conditioning Densité des systèmes accroit le problème de chaleur Placement des racks Flot d air dans la pièce Température: 18 C Dimensionnement de l AirCo Composant critique Redondance! 43

Datacenter Moyens mis en oeuvre Incendie Détection CO2, Halon, FM-200, Inergen Alimentation UPS Connexions redondantes Générateurs diesel Ne pas mettre tous les systèmes sous tension en même temps! Dépendances entre systèmes Quel(s) système(s) est(sont) impactés si le système X tombe en panne? 44

Datacenter Procédures de gestion ITIL Information Technology Infrastructure Library IT Service Delivery IT Service Support Staff dédié Service desk, Incident Management, Problem Management, Configuration Management, Change Management, Release Management 45

Disaster Recovery Objectifs Répondre à un incident majeur Inondation, typhon, tremblement de terre, attaque terroriste, incendie... Corruption de système(s) ou de données Erreur applicative ou humaine Solution: Site de Disaster Recovery Site Et les procédures Site DR souvent limité mode dégradé Définir les composantes du DR Tous les services n ont pas besoin de DR Que doit-on protéger? Quelle est la priorité des services? Quelles sont les ressources nécessaires? 46

Disaster Recovery Incident et reprise Data recovery point Disaster occurrence Disaster noticed Disaster declaration Disaster Recovery System Active Primary System Functional Don t forget this one! RPO Time RTO 47

Disaster Recovery Quelques statistiques Une perte de données importante implique la fermeture de la société dans 43% des cas Une indisponibilité de 10 jours n est en général pas récupérable La plupart des pertes de données ont une cause humaine (45%), 2% sont causés par des catastrophes naturelles, le reste par des pannes 48

Disaster Recovery Différences avec HA Implication du côté métier Plus seulement un problème IT Indisponibilité plus longue Composants impactés plus nombreux, plus grande taille Risque et coût plus élevés Processus différents Opérations manuelles 49

Disaster Recovery Approche générale Définition des objectifs Identification des systèmes Définition des objectifs de récupération (RTO, RPO), staff et responsabilités Design high-level de la solution Design technique de la solution Implémentation de la solution Définition des procédures et formation Test, Test, Test Evaluation et mise à jour 50

Disaster Recovery Site primaire et de backup (DR) Propriété de la société? Accord mutuel? Externalisé? Où placer les sites? Ni trop près, ni trop loin Eviter les risques identiques (ex: zone d activité sismique) 51

Disaster Recovery Synchronisation des sites Hot stand-by Site DR est une copie exacte du site primaire Cold stand-by Nécessite une restauration de données Possibilité d héberger l infrastructure de backup pour une restauration rapide (et conservation plus sûre) Système partagé 52

Disaster Recovery Synchronisation longue distance Mirroring asynchrone Restauration de backup Log shipping Cluster longue distance Synchronisation de fichiers 53

Sécurité des données Données = ressource critique Objectifs Reprise après panne Récupération d une version antérieure Deux opérations Sauvegarder Restauration 54

Sécurité des données Sauvegarde Copie des données d un medium vers un autre Quand? Fréquence A quel moment? Quoi? Backup système Backup fichiers Backup bases de données Full/Incremental 55

Sécurité des données Sauvegarde Où? On-site: copie locale Off-site: copie distance Conditions de stockage Restauration de données préalablement sauvegardées Test, Test, Test souvent oublié, jusqu à ce que... Mantra: LOCKSS Truc: utiliser un réseau séparé pour le backup 56

Surveillance La sécurité de l infrastructure nécessite surveillance qualité de la surveillance éviter faux négatif/faux positifs seuil d alerte Outils Patrol, OpenView, Nagios Sondes spécifiques alerte Email sms équipe de support procédures de reporting et d escalation 57

Et les contrats... Choix d un produit/vendeur Ligne de produit: flexible, modulaire, à la pointe Roadmap? Visite de site Ouverture/Possibilité d intégration Partenariats existants Equipe/ressources locales Organisation de support 58

Et les contrats... Contrat de support conclu avec vendeurs hardware et software différents niveaux de support (et de prix) SLA Service Level Agreement définit le service définit les exigences en matière de disponibilité y compris les aspects de performance exigences réalistes!! indisponibilité cumulée maximum sur une période fréquence d indisponibilité maximum sur une période indisponibilité maximum par incident 59

Et les contrats... SLA Service Level Agreement différencié selon l importance de la panne (minor/major outage) définit les plages d indisponibilité planifiée définit les responsabilités et les procédures définit les mécanismes de reporting et d escalation définit les pénalités en cas de non-respect entre partenaires internes ou avec un tiers 60