transtec IT Compendium Concepts de Stockage Haute disponibilité, Gestion et Performance



Documents pareils
Consolidation de stockage

Protection des données avec les solutions de stockage NETGEAR

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Cluster High Availability. Holger Hennig, HA-Cluster Specialist

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Le e s tocka k ge g DAS,NAS,SAN

Une présentation de HP et de MicroAge. 21 septembre 2010

Système de stockage EMC CLARiiON AX4

La nouvelle solution de stockage V3700

Système de stockage IBM XIV Storage System Description technique

Système de stockage sur disque IBM Storwize V5000

L unique SAN industriel proposant un stockage multiniveau automatisé (Automated Tiered Storage)

LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES

Concepts et systèmes de stockage

Easy as NAS Supplément Entreprises. Guide des solutions

Fiche produit FUJITSU ETERNUS DX200F Baie de stockage Flash

FAMILLE EMC RECOVERPOINT

Serveur EMC/CX Solution de stockage hautes performances dotée d'une connectivité flexible

EX4C Systèmes d exploitation. Séance 14 Structure des stockages de masse

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

Spécifications détaillées

LENOVO THINKSERVER GUIDE DES PRODUITS. Haute évolutivité et flexibilité conjointes au développement de l entreprise

Cours 13. RAID et SAN. 2004, Marc-André Léger

SERVEUR CALLEO APPLICATION R269M

Technologie SDS (Software-Defined Storage) de DataCore

TEC-SHEET. PROVIGO Dacoria V-STORAGE APPLIANCE. transtec Solution Data Sheet ADMINISTRATION MADE EASY HAUTE DISPONIBILITÉ MADE EASY

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

SYSTÈMES DE STOCKAGE AVEC DÉDUPLICATION EMC DATA DOMAIN

Guide des solutions My First SAN. 2ème édition

Le Serveur de Stockage IBM TotalStorage DS4500

Présentation Infrastructure DATACENTRE

PERFORMANCES EXCEPTIONNELLES ET EFFICACITÉ EMC POUR MICROSOFT SQL SERVER

Points forts. IBM Systems and Technology Fiche produit

Simplifier la gestion des données et réduire les coûts grâce à la virtualisation intelligente des fichiers

en version SAN ou NAS

SERVEUR LYNX CALLEO DATACENTER 2460

Serveur Lynx CALLEO Application 2240 Fiches Technique

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Le data center moderne virtualisé

HP Simply Storage Consolidation

SANsymphony -V Fonctionnalités en bref

EMC DATA DOMAIN OPERATING SYSTEM

L'évolution dans les technologies de stockage

CONSULTATION : (MAPA) MAT_INFO_2013_03 Marché à procédure adaptée (MAPA) MAT_INFO_2013_03

EMC DATA DOMAIN HYPERMAX

vbladecenter S! tout-en-un en version SAN ou NAS

Network storage solutions

Serveur Lynx CALLEO Application 2240S Fiches Technique

Le stockage unifié pour réduire les coûts et augmenter l'agilité

au Centre Inter-établissement pour les Services Réseaux Cédric GALLO

La Continuité d Activité

Marché à procédure adaptée (en application de l article 28 du code des Marchés Publics)

Spécifications détaillées

Consolidation Stockage.

Unitt Zero Data Loss Service (ZDLS) La meilleure arme contre la perte de données

CA XOsoft. Suite logiciels. WANSync Solution de réplication des données en LAN ou WAN.

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

10 choses à savoir sur le 10 Gigabit Ethernet

10 tâches d administration simplifiées grâce à Windows Server 2008 R2. 1. Migration des systèmes virtuels sans interruption de service

e-novatic PRATIQUES, PLANIFICATION SUITE

Stockage Réseau. Le stockage s'échappe du système pour devenir une fonction réseau

Nouvelles stratégies et technologies de sauvegarde

Introduction. René J. Chevance

Système de disques milieu de gamme IBM Storwize V7000

Hyper-V et SC Virtual Machine Manager sous Windows Server 2008 R2

Architectures d implémentation de Click&DECiDE NSI

Gestion des sauvegardes

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Logiciel HP StorageWorks Enterprise Virtual Array (EVA) Fiche technique

FUJITSU WORLD TOUR 2014 Paris

LES 5 PRINCIPALES RAISONS DE DÉPLOYER MICROSOFT SQL SERVER SUR LE SYSTÈME DE STOCKAGE UNIFIÉ EMC VNX

Solutions HP Simply StorageWorks pour HP BladeSystem

Système de Stockage Sécurisé et Distribué

1.1. Stockage HP StoreVirtual 4000

Clients et agents Symantec NetBackup 7

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

Stockage unifié EMC Celerra

ORACLE EXADATA DATABASE MACHINE X2-2

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Livre blanc Haute disponibilité sous Linux

HYPER-V CLOUD GUIDES DE DÉPLOIEMENT MODULE 1: ARCHITECTURE ET DIMENSIONNEMENT

Solutions NAS Hitachi

Serveurs et solutions PowerEdge pour les applications métiers

RESEAUX SAN iscsi VIRTUALISES :

ORACLE EXADATA DATABASE MACHINE X2-8

Migration d un Cluster Fiber Channel+SAN+Lames sous Xen vers Ethernet +iscsi+serveurs sous KVM

EMC AVAMAR. Logiciel et système de sauvegarde avec déduplication

Cours 6. Sécurisation d un SGBD. DBA - M1ASR - Université Evry 1

CLOUD PRIVÉ EMC VSPEX Microsoft Windows Server 2012 R2 avec Hyper-V - Jusqu à machines virtuelles

Gamme NetApp FAS3200

La continuité de service

Transcription:

transtec IT Compendium Concepts de Stockage Haute disponibilité, Gestion et Performance

Introduction Disponibilité, Gestion et Performance sont les maîtres mots pour la conception d infrastructures modernes de stockage. transtec IT Compendium est un guide pratique rempli de conseils qui ont fait leurs preuves pour envisager votre environnement de stockage. Cette brochure est subdivisée en trois chapitres principaux : Disponibilité, Gestion et Performance. Elle est complétée par un aperçu des technologies des disques durs et de la performance des applications. Un projet de client transtec à la clinique St. Marien à Amberg revient en filagramme dans cette brochure. Cette clinique de 554 lits a investi dans une solution PACS en 2005 un grand pas en avant dans la numérisation de la radiologie. Pour mémoriser les données des images, transtec a implémenté une solution de haute disponibilité et de virtualisation du stockage. Cette solution dispose d une capacité de 2x 9 To répliqué et peut être facilement étendue à 2x 45 To. Les exemples de projets présentés dans cette brochure concernent cette solution et définissent les exigences et les composants de la solution dans les domaines Disponibilité, Gestion et Performance. 2

Sommaire Disponibilité Disponibilité du système Haute disponibilité au moyen de solutions de cluster Haute disponibilité des donnés au moyen de miroir/réplication et snapshots Page 4 Gestion Gestion de structures de données Gestion de systèmes de stockage Surveillance de l exploitation et signalisation des événements Virtualisation du stockage Gestion hiérarchique des mémoires Page 6 Performance Facteur de puissance Système de stockage Facteur de puissance Réseau de stockage Evolutivité de la performance Page 8 Technologies des disques durs Page 10 Performance des applications Page 11 Représentation de l infrastructure de mémoire à la clinique d Amberg Page 12 Autres informations Page 13 Contact et édition Page 14

Disponibilité Disponibilité Les processus actuels d une entreprise sont supportés par l informatique. Depuis la Ret D jusqu à la production en passant par la comptabilité ou la paie, la dépendance aux données et aux systèmes de stockage augmente fortement et impose que ces systèmes soient hautement disponibles. Pour permettre de prendre des mesures en vue d accroître la disponibilité, nous étudierons les systèmes de stockages, les applications et les données séparément. Disponibilité des serveurs Chaque composant d un système susceptible de l immobiliser en cas de défaillance est désigné par Point de défaillance ou «single point of failure». Ces composants sont le processeur, la mémoire, le bloc secteur, le ventilateur, le disque dur, la carte réseau, la carte mère et le contrôleur de disque dur. La redondance de composants qui reprennent automatiquement les fonctions des composants défaillants en cas d anomalie permet de garantir la disponibilité; la disponibilité du système dans son ensemble s en trouve accrue. L échange des composants défaillants devrait être possible sans arrêt de l exploitation (fonctionnalité de remplacement à chaud), sinon le temps de défaillance serait seulement repoussé, mais non éliminé. Pour garantir la disponibilité des données sur les disques durs, ceux-ci peuvent être configurés au moyen de contrôleurs RAID avec différents niveaux RAID. Selon le niveau RAID choisi, les disques durs sont mirrorés ou configurés de façon à ce que la défaillance d un de ces disques dans la combinaison n entraîne pas une perte des données. Les différentes technologies des disques durs et leur influence sur la disponibilité de systèmes de mémoire sont examinées spécialement page 10. Haute disponibilité au moyen de solutions de cluster La mise en place de clusters permet de sécuriser des serveurs complets et leurs applications contre toute défaillance. Un cluster haute disponibilité permet de protéger le système contre une panne de la carte mère, ce qui est impossible à garantir à l intérieur d un système individuel. Le cluster haute disponibilité assure la redondance des serveurs individuels ainsi que des applications et automatise la reprise de la fonctionnalité du système primaire par le système secondaire en cas d anomalie. Les clusters haute disponibilité sont employés en principe dans les serveurs dans lesquels le stock de données varie fréquemment. Les systèmes combinés accèdent à un stock de données externe commun, car les données doivent être disponibles pour les deux systèmes. Ces données se trouvent généralement sur un système externe de disques RAID. Le cluster est régulièrement testé, de sorte qu en cas de défaillance d un serveur, un autre peut reprendre sa fonction. Cluster actif-passif ou actif-actif Un cluster actif-passif est configuré de telle manière que l un des deux serveur est productif en permanence, mais l autre ne reprend les fonctions du serveur défaillant, qu en cas d arrêt du système. Avec le cluster actif-actif, les deux serveurs se chargent simultanément de différents domaines. En cas d anomalie, les services du serveurs défaillant sont également assurés par le deuxième système. Mais cela suppose que suffisamment de ressources soient disponibles. Ces systèmes de clusters peuvent être configurés par exemple au moyen du Microsoft Cluster Service (MSCS) du Windows Server 2003. Différentes solutions de cluster sont également disponibles aussi sous Linux. Disponibilité des données au moyen de miroir/réplication et des snapshots En plus de la haute disponibilité des serveurs et des éléments du systèmes de stockage, il s agit de garantir la disponibilité des données par la redondance. Autrement dit, les données doivent être conservées de façon redondante par miroir/réplications de façon synchrone ou asynchrone sur un deuxième système de stockage qui se trouve généralement en un autre endroit. Le miroir et la réplication fonctionnent bien l une et l autre au niveau blocs, mais avec le miroir, des lecteurs logiques sont sécurisés, tandis qu avec la réplication, certains répertoires ou fichiers sont déterminés en tant que source. Par la suite on utilisera le terme «réplication» également pour désdigner le «mirroir». Dans la réplication synchrone de données, les deux systèmes disposent à tout moment du même stock de données. Mais, avec ce procédé, le réseau doit être conçu en conséquence. La réplication synchro- 4

Disponibilité ne présente tout d abord l avantage qu une copie identique de toutes les données est disponible à tout moment. Cependant, si des données sont modifiées ou effacées par erreur, ou détruites par un virus, ces changements sont pris en compte simultanément sur le système redondant. Dans le cas de la réplication asynchrone des données, les données sont répliquées à un moment défini, l administrateur a donc la possibilité d introduire des mesures adéquates entre les opérations de synchronisation. Une réplication asynchrone peut être réalisée p. ex. par le module asynchrone Asynchrones IP Mirroring (AIM) de la société DataCore TM. Les deux procédures supposent que la capacité de mémoire du système redondant correspond au moins à la quantité de données du système primaire. Miroirs/ réplications synchrones Miroirs/ réplications asynchrones Snapshots Domaines applicatifs Avantages Limitations Applications pour lesquelles la vitesse n est pas critique, mais pour lesquelles il est important que les données soient complètes à 100 % Distances < 100 km Miroir/réplication sur de plus grandes distances entre centres informatiques Connexion d emplacements extérieurs pour le miroir/réplication des données dans le centre informatique pour la sauvegarde Distances < 100 km Sauvegarde horaire Utilisation pour environnements d essai et de développement, par exemple pour tester de nouvelles versions d une banque de données Une autre possibilité de sécuriser un stock de données à un moment déterminé est possible avec la fonction snapshot. Une reproduction (un instantané) des blocs de données est archivée à certains moments. Lorsque une demande de modification du contenu d un bloc de données arrive par un accès pour écriture, avant que ce bloc soit recouvert, l état actuel du bloc est écrit sur un système secondaire et, en cas de besoin, peut être lu à nouveau sur le système primaire. Les snapshots permettent donc de rectifier les erreurs logiques causées par l utilisateur. L utilisation de cette fonction est très utile par exemple pour les environnements d essai et de production. De plus, par rapport aux réplications fichiers, il ne nécessitent en moyenne que 20-30 % environ de la capacité de mémoire. A tout moment, copie exacte du système local de disques par la miroir/réplication synchrone Permet d utiliser des systèmes de stockage de performances différentes Transmission de l accusé de réception avant la miroir/réplication au serveur d applications (Variante synchrone : transmission après l écriture sur le système secondaire) Rétablissement des états des données à différents moments Rétablissement rapide possible Reprise automatique de l état sur le système symétrique en cas d inconsistance de la banque de données en raison d une erreur logique Risque de pertes (minimes) pendant la reconstitution de données par le/la miroir/réplication différée La quantité d espace disque peut devenir importante si les données changent complètement Exemple de projet Clinique d Amberg Exigences de disponibilité de l environnement de stockage : Assurance de pouvoir accéder constamment aux fichiers radiologiques et aux données des patients grâce à un stockage multiple des données, à des systèmes de stockage hautement disponibles et à un réseau redondant. Composants de la solution : 2 serveurs de domaines de stockage (SDS) pour administrer le stockage dans le fonctionnement en cluster au moyen du logiciel Data Core SANmelody. Equipement des serveurs SDS avec des adaptateurs de bus hôte Fibre Channel, des disques système mirorés et des blocs secteur redondants. 2 systèmes RAID avec connexion aux serveurs SDS pour miroir des données. Conception redondante des blocs secteur et des contrôleurs RAID, utilisation de niveaux RAID pour la sécurisation contre une défaillance des disques durs. Conception redondante des Fabrics Connexion redondante des serveurs d applications Le schéma de la structure de cette solution est représenté page 12.

Gestion Gestion Les administrateurs informatiques doivent exécuter une multitude de tâches différentes dans le domaine de la gestion du stockage. La complexité croissante de ces tâches entraîne aussi une augmentation du temps et des formations nécessaires. Les efforts doivent donc consister à concevoir l environnement de stockage de telle manière que, même si la quantité de données augmente, la complexité de l administration doit être réduite. En outre, l infrastructure du stockage devrait être extensible, performante et hautement disponible en fonction du domaine d utilisation. Si une restructuration est envisagée, le potentiel correspondant de consolidation de l environnement existant devrait être analysé et il faudrait examiner si des systèmes de stockage existants peuvent être intégrés dans le nouvel environnement si on le souhaite. Gestion de structures de données Le fait que la capacité nécessaire de stockage augmente constamment exige une analyse continuelle de l environnement de stockage existant. Les questions prioritaires sont les suivantes : Comment seront utilisées les capacités existantes? Existe-t-il dans le SAN des goulots d étranglement? Quel est l historique des besoins de stockage? Ces aspects ainsi que d autres sont déterminés grâce à l utilisation du logiciel de gestion du stockage. transtec propose, en combinaison avec SANmaestro de la société DataCoreTM, une solution de virtualisation qui fournit les outils d analyse et de contrôle dans ce but. Gestion de systèmes de stockage L administration de systèmes RAID peut s effectuer par différents canaux. Les systèmes de stockage transtec PROVIGO 600 permettent d accéder en série via RS-232C ou par Ethernet via Telnet à un outil de gestion intégré dans un firmware. Le mode ASCII convient pour l administration et la configuration du système RAID si un hôte Unix/Linux est employé pour l administration. Le support graphique de l administration est assuré par l outil JAVA RAIDConn qui fournit des informations élargies sur l état du système et permet l enregistrement de la NVRAM dans un fichier. Une gestion centrale de plusieurs systèmes de stockage PROVIGO 600 est également possible au moyen du logiciel RAIDConn. A cet effet, différents profils configurés dans le logiciel permettent de changer entre les différents systèmes RAID. Surveillance de l exploitation et signalisation des événements L époque à laquelle un agent logiciel était nécessaire sur le système hôte pour la surveillance du RAID est révolue. Les systèmes RAID modernes disposent d un système d alarme autonome, très élaboré. Les services intégrés de surveillance comprennent notamment les SCSI Enclosure Services (SES), qui signalent les paramètres tels que la température, la vitesse du ventilateur ou les défaillances des lecteurs, par le canal FC ou SCSI, au système d exploitation RAID. Les événements sont divisés en trois classes : information, avertissement et anomalie. Le système d exploitation peut pour sa part, par différents mécanismes, signaler à l administrateur un événement survenu. Les systèmes transtec supportent les options d information suivantes : E-mail SNMP Diffusion sur LAN Pageur Virtualisation du stockage Le problème du besoin continuellement croissant de stockage, le défi de la centralisation de la gestion des systèmes de stockage et la répartition flexible des ressources sur différents canaux E/S peut être Logiciel de gestion RAID transtec RAIDConn 6

Gestion résolu par une solution de virtualisation. transtec propose, avec le logiciel DataCore TM SANmelody et SANsymphony, deux solutions de virtualisation qui répondent à l exigence de la gestion de stockage d une entreprise. Cette solution donne notamment la possibilité d allouer plus d espace de stockage que le système n en possède réellement, de générer des volumes répliqués et des snapshots, de réaliser des miroirs IP asynchrones et de pouvoir continuer à utiliser les systèmes RAID existants. Elle peut donc être introduite dans l environnement Unix, Linux et Microsoft et convient aussi pour des infrastructures hétérogènes. Dans cette solution de virtualisation, les systèmes RAID ne sont pas connectés directement aux systèmes hôtes comme habituellement, car un serveur de domaine de stockage (SDS) est intercalé comme couche d abstraction. La connexion des systèmes RAID existants et nouveaux s effectue par SCSI ou FC au SDS. Les capacités disponibles sont réunies par le SDS en pools de stockage, à partir desquels sont finalement générés des volumes qui sont signalés, par iscsi ou FC, aux systèmes hôtes. Cette solution est représentée schématiquement page 12. Comme le serveur SDS administre la sortie de la capacité de stockage, des fonctions élargies peuvent être utilisées. Capacité virtuelle / allocation automatique de ressources : On parle de surréservation lorsque la capacité de mémoire qui est signalée au total à l hôte dépasse la mémoire réellement existante physiquement. Si le serveur SDS possède par exemple dans ses pools de stockage 5 To, il peut au moyen de la fonction d allocation automatique de ressources signaler respectivement 2 To simultanément à cinq hôtes. Ainsi, il est possible de tenir compte de structures croissantes et de mettre directement 2 To à disposition, même si seulement 500 Go sont utilisés actuellement. Mais le serveur SDS réserve dans les pools de stockage seulement le besoin de mémoire réellement utilisée et se signale dès qu une marque limite est dépassée. Traitement des E/S : Le serveur SDS recueille les exigences E/S arrivant et les écrits en mode d équilibrage de charge sur les systèmes RAID. On peut ainsi obtenir un bien meilleur débit, ce qui entraîne une occupation optimale des systèmes RAID. Gestion hiérarchique des mémoires La gestion hiérarchique du stockage appelée aussi HSM, Tiered Storage ou ILM permet d affecter des disques à des classes de données définies. Ce qui permet une meilleure gestion au point de vue du coût, de la performance et de la disponibilité. Les applications et les services des serveurs imposent diverses exigences aux ressources de stockage, pour ce qui est du temps d accès et de la disponibilité. Les répertoires individuels des opérateurs peuvent être par exemple enregistrés sur des systèmes RAID avec des supports de données SATA économiques. Au contraire, les services critiques pour l entreprise, comme les serveurs SQL, stockent les données sur des systèmes très performants et hautement disponibles. Le type d application donne lieu au développement de différentes classes de stockage qui doivent être planifiées séparément les unes des autres. Des recommandations indiquant quelle technologie de disque dur convient pour les divers domaines d applications sont données page 10. Les disques durs SATA et SAS sont conçus en principe pour différents domaines d utilisation. Cependant, la possibilité d utilisation en parallèle à l intérieur d un même système est intéressante. Tous les contrôleurs des disques durs SAS reconnaissent automatiquement les types de disque dur installés et supportent les deux technologies. Il en résulte un grand avantage pour la réalisation d architectures échelonnées de stockage, car une séparation modulaire entre stockage primaire et stockage secondaire à l intérieur d un système est possible et permet de réduire le coût de la solution globale. Exemple de projet Clinique d Amberg Exigences pour la gestion de l environnement de mémoires : Facilité d administration, évolutivité de l environnement de stockage et entretien à distance par le Centre de Compétence transtec. Composants de la solution : Volumes virtuels de 2 To de capacité pour approvisionnement des serveurs Fourniture des volumes au moyen d une solution redondante de virtualisation du stockage Signalisations directes d anomalies des systèmes RAID, serveurs SDS et commutateurs FC par e-mail au service Support transtec Fonctionnalité de gestion basée sur Internet des systèmes FC-RAID et commutateurs FC pour une administration et une surveillance simples Tunnel de réseau privé virtuel pour le service Support transtec pour la diagnostic et la surveillance du système Accès aux serveurs de stockage par protocole RDP Service 24x7x4

Performance Performance La consolidation du stockage et la numérisation des processus de travail augmentent les exigences de puissance pour la solution centrale de stockage. Mais quels facteurs influencent la performance du système et des applications, et à quoi faut-il veiller? Le critère capital est le support de stockage : le disque dur. Pour obtenir une certaine largeur de bande ou une vitesse des transactions des systèmes de transaction en ligne avec un temps d attente acceptable, il est indispensable de prévoir un nombre minimum de disques durs qui peut être évalué. Ces aspects et d autres concernant les disques durs sont examinés séparément pages 10 et 11 aux chapitres Technologies des disques durs et Performance des applications. Facteur de puissance du système de stockage Tandis que dans l environnement des serveurs la performance du processeur central et l architecture interne des bus PCI constituent des critères de décision largement considérés, c est plus rarement le cas, à tort, dans l environnement de stockage. Dans ce cas, des différences de puissance allant jusqu à 50 % sont constatées. Dans les systèmes de stockage évolutifs en particulier, le contrôleur est souvent un goulot d étranglement. Les systèmes de stockage inférieure à 25.000 utilisent les familles de processeurs intégrés Intel XScale /IOP et IBM PowerPC. Les unités RISC possèdent, sont plus puissante mais plus cher que les processeurs x86. La puissance des E/S dépend du type de processeur, de sa vitesse d horloge, de la taille et du type de cache L2 et surtout le type et le nombre de bus PCI La puissance maximum que l on peut atteindre sera 50 % de la bande passante du bus PCI. Pour les calculs de parité RAID-6, la présence d ASIC spéciaux serait nécessaire pour dégager le processeur principal. Par contre, l importance de la taille du cache dans les systèmes de stockage est plutôt surestimée (voir figure 1). A l exception des banques de données qui permettent de laisser les tables et les logs dans le cache rapide. Mais pour cela, il faut pouvoir écrire sur la mémoire cache du Fig. 1 : Mesure de la performance avec compteur E/S (lecture/écriture aléatoire 50 %) système comme sur un disque virtuel, fonction que seul propose les systèmes de stockage haut de gamme, tels que HDS TagmaStore USP ou EMC Symmetrix. Une variante consiste à utiliser des disques à semi-conducteurs (SSD) pour supprimer les points chauds, solution qui restent très chers. L utilisation de contrôleur de cache intelligent est plus importante que la taille brute du cache. Ainsi la différence de performance entre les contrôleurs peut atteindre 20 %. On examinera la capacité du cache à être partitionné et alloué à la demande, les politiques de cache différenciés par volume, l adaptation dynamique aux modèles E/S ou les préréglages pour les systèmes de transaction en ligne ou le streaming audio/vidéo. Facteur de puissance Réseau de stockage La connexion directe classique jusqu à quatre serveurs reste la solution la plus intéressante pour de nombreuses PME. Au lieu du SCSI, il faudrait choisir dès sa disponibilité, le SAS en raison de son coût comparable au SCSI pour une largeur de bande nettement plus grande allant jusqu à 1200 Mo/s par quadruple câble de raccordement. SAS permet aussi de réaliser un mini SAN limité en distance à une armoire de 19. Fibre Channel reste le premier choix pour les réseaux de stockage avec une largeur de bande de 400 Mo/s par canal et une surcharge de protocole inférieure à 6 %, la FC est bien suppérier au SCSI, SAS ou ethernet. Mais avec l inconvénients du coût élevé de l infrastructure et la portée limitée du réseau. Ce qui limite la localisation d un site redondant à quelques dizaines de kilomètre. C est là que résident les points forts du iscsi de 1 Gbit. En pratique et de façon surprenante, avec sa largeur de bande limitée, le iscsi n a pas de problèmes de latence (cf. figure 2). Avec un réseau gigabit, des switchs permettant l agrégation de liens et l utilisation d adaptateurs de bus hôtes iscsi ou de cartes TOE, il est parfaitement possible de réaliser des SAN IP très performant. L occupation CPU d une unité centrale Intel Xeon 3,60 GHz pour deux ports GbE sans carte HBA est d environ 8

Performance Fig. 2 : Comparaison du temps d attente dans le réseau local restreint pour serveur MS Exchange 2003 25 % et même 10 % pour les serveurs Dual-Core avec support Intel E/SAT, si bien que pour des serveurs moins occupés, on peut utiliser aussi un initiateur iscsi logiciel. Les systèmes NAS avec protocole NFS sont il une alternative? L iscsi est préférable pour les opérations nécessitant beaucoup d écriture (ex sauvegarde sur disque), car le NFS ne supporte que de façon limitée les opérations d écriture asynchrone, ainsi l iscsi est 2 fois plus performant que NFS pour les applications utilisant beaucoup de métadonnées, la raison en est en premier lieu une mise en cache agressive des métadonnées et l agrégation asynchrone de mises à jour des métadonnées sous iscsi. Mais par contre, avec des systèmes de banques de données comme Oracle, les différences entre NFS et iscsi se réduisent en cas d utilisation de toutes les possibilités de réglage à moins de 10 % (voir figure 3). Evolutivité de la performance Pour les exigences de performance extrêmes de plus de 10.000 E/S et/ou avec des largeurs de bande en Go, des contrôleurs multiples de stockage sont impérativement nécessaires. Les systèmes de Monolithic Enterprise qui dispose de plus de 64 processeurs avec chacun leur cache et leur bus E/S sont excellents mais exigent des investissements de l ordre du million d euros. Une possibilité plus économique consiste à employer plusieurs systèmes de stockage peu coûteux. Mais cette solution plus complexe peut être simplifié par une couche de virtualisation qui présente des avantages considérables pour la répartition de charge, l allocation et l administration du stockage. La variante la plus intéressante et la plus récente est celle des clusters de stockage. Comme avec les clusters HPC (informatique à haute performance), de nombreux petits noeuds de stockage sont regroupés en un système de stockage parallèle. Avec le nombre élevé de contrôleurs disques, de caches et de lignes hôtes, la puissance globale fait concurrence aux Enterprise Disk Arrays, mais est beaucoup plus économique à l achat et à l entretien. Fig. 3 : Oracle 10g Comparaison de performance avec transtec Unified Storage Exemple de projet Clinique d Amberg Exigences de performance de l environnement de stockage : Enregistrement et restitution rapides des données des images radiologiques du système PACS 1 ainsi que migration rapide des dossiers électroniques des patients ce qui implique un système de stockage haute performance pour les E/S. Composants de la solution : Serveurs SDS avec puissance théorique de 220.000 E/S par seconde Systèmes RAID Dual Controller, qui permettent une répartition de la charge des ensembles RAID Connexion FC 2 Gbit redondante (400 Mo/s FD) des serveurs Structuration des stocks de données dans différents pools de stockage Mise en cache sur deux niveaux des requêtes E/S par les serveurs SDS et les systèmes RAID sous-jacents Optimisation des systèmes RAID pour E/S aléatoires Equilibrage de charge des trajets E/S du serveur SDS au système RAID 1 Système d archivage et de communication d images

Technologies des disques durs Technologies des disques durs Les disques durs constituent le critère capital lorsqu on examine la disponibilité et la performance de systèmes de stockage. Les exigences des applications et le budget disponible conduisent à choisir des disques durs SATA, SCSI, SAS ou FC. Performance Les disques durs SATA représentent le choix optimal pour le transfert de gros fichiers (> 100 KB). Mais les banques de données, comme Exchange, Oracle ou SQL, fonctionnent en général avec des paquets de données de 512 octets à 8 Ko. Dans ce cas, SATA est soumis à des limitations considérables de puissance. Nous préconisons d exploiter des systèmes de transactions en ligne avec env. 100 utilisateurs maximum sur un RAID SATA. Sinon, SCSI, SAS ou Fibre Channel représentent le meilleur choix. La raison est que d une part le nombre plus élevé de rotations permet des accès plus rapides, d autre part, les instructions peuvent être mieux prétriées, de façon à pouvoir traiter plus vite de nombreux petits accès. SATA-2 a une profondeur de tri NCQ max. de 32, tandis que SCSI, SAS et FC sont à 256. D une manière générale, transtec conseille les architectures sérielles comme SATA, SAS et FC plutôt que SCSI, car il ne se produit pas de limitation de la performance comme sur une largeur de bande de canal répartie sur plusieurs disques durs. Fiabilité Tous les disques durs utilisés par transtec sont spécifiés pour service en continu 24 heures sur 24 et 7 jours sur 7. Mais les disques durs SATA ont des limitations quand aux facteurs d utilisation, température et tolérance aux vibrations par rapport aux disques durs Enterprise. Les disques durs SATA ne sont conçus en principe que pour des accès actifs pendant 10-20 % du temps d exploitation. Si des accès E/S ont lieu constamment, le taux de défaillances augmente de façon significative. La température de service ne devrait pas dépasser 30 C. Le TMED indiqué représente une valeur statistique qui varie en fonction de la variation des paramètres tels que facteur d utilisation ou température. PATA SATA SCSI SAS FC Type Parallèle Sériel Parallèle Sériel Sériel Largeur de bande par canal Nbre disques durs par canal Performance par disque dur Organisation des accès écriture/ lecture Limite de puissance par canal Domaines applicatifs 133 Mo/s 300 Mo/s 320 Mo/s 300 Mo/s 200 / 400 Mo/s max. 2 1 max. 14 1 (max. 128 par Expander) < 60 Mo/s < 65 Mo/s < 90-105 Mo/s Vitesse de rotation 5.400-7.200 T/min 7.200 T/min 10.000-15.000 T/min - Mise file d attente instructions natives (NCQ) À partir de 2 disques Optimal pour transfert gros fichiers (> 100 Ko) BD jusqu à env. 100 utilisateurs Serving et Streaming A/V Serveur de fichiers Systèmes de sauvegarde et d archive - À partir de 4 disques < 105 Mo/s < 95-110 Mo/s 15.000 T/min 10.000-15.000 T/min Mise file d attente instructions référencées (TCQ) - - Applications à nombreuses transactions avec petits Blocs de données Systèmes BD OLTP Systèmes de courrier SATA SCSI/SAS/FC Nearline SATA (Edition WD RAID) TMED 1 1 million d heures 1.4 million d heures 1.2 million d heures Heures sous tension (PoH) 2 24 x 7 (8736 h) 24 x 7 (8736 h) 24 x 7 (8736 h) Facteur 10-20 % 80-100 % 80-100 % d utilisation 3 Température 25 C 60 C 60 C Taux de défaillances Domaines applicatifs 0,9 % (24x7) > 3 % (sous charge max.) Mémoire secondaire économique 0,6 % 1,3 % (sous charge max.) Mémoire primaire avec service permanent Systèmes de clusters & RAID 1 Temps moyen de fonctionnement entre défaillances (MTBF) : indication statistique qui concerne un nombre élevé de disques. Avec par exemple 1000 disques durs SATA en service permanent, 9 défaillances sont à prévoir en moyenne en l espace d un an (8736 heures). 2 Heures sous tension (PoH) : heures de service pendant lesquelles le disque est sous tension électrique. 3 Facteur d utilisation : pourcentage de la durée de service (heures sous tension), pendant lequel les accès actifs E/S ont lieu sur le disque dur. 1 10

Performance des applications Performance des applications Des applications, telles que les systèmes de transaction en ligne, le stockage de données ou les données séquentielles de fichiers exigent des méthodes d optimisation de la performance distinctes. Dans les systèmes de transaction en ligne, le matériel est souvent moins décisif que la bonne conception de la banque de données et l optimisation des requêtes. Cependant, on s attachera à optimiser le cache mémoire disponible sur les serveurs ou sur les contrôleurs et de répartir de façon optimale les données sur les disques durs. Dans les systèmes de transaction en ligne, l important est la puissance E/S. Les banques de données devraient se trouver dans le cache même ou au moins sur des disques durs à rotation rapide. En outre, le cache de mémoire devrait être optimisé pour les opérations d écriture et chaque type d activité E/S (banque de données, fichiers d enregistrement de transactions) devrait fonctionner sur des disques durs séparés, des ensembles RAID et idéalement sur des contrôleurs séparés. Les applications exigeant de nombreuses opérations de lecture et d écriture (p. ex. traitement analytique en ligne/systèmes de transactions en ligne) ou les applications avec accès surtout séquentiels ou aléatoires ne devraient pas se trouver sur le même système de stockage ou du moins se situer sur des contrôleurs et des partitions de caches séparés. Le niveau de RAID choisi a également de fortes répercussions sur la puissance. Les niveaux complexes de parité exigent des contrôleurs suffisamment puissants ainsi qu un plus grand nombre de disques durs pour compenser la plus grande complexité E/S pour les opérations d écriture (voir tableau). Un grand utilisateur de la boîte à lettres Microsoft Exchange ayant plus de 200 emails reçus et envoyés par jour génère jusqu à deux accès E/S par seconde, tandis que l utilisateur moyen est à 100 emails avec environ 0,75 E/S par seconde. Pour mille boîtes à lettres avec 900 utilisateurs normaux et 100 grands utilisateurs, il faudrait donc, pour une configuration avec niveau RAID 6, un système de stockage supportant 2.450 E/S et 25 disques durs (10.000 tours/min). Pour les systèmes de transaction en ligne à charge élevée, les disques durs à rotation rapide représentent le meilleur choix. Ils offrent une puissance E/S d environ 30 % plus élevée pour un prix de 45-70 % supérieur. En général, les systèmes de transactions en ligne profitent plus de l investissement dans des disques durs supplémentaires que de l achat de contrôleurs supplémentaires. Pour les applications traitement analytique en ligne, streaming et sauvegarde sur disque, la largeur de bande du contrôleur est souvent le facteur limitatif. Le meilleur investissement consiste en plusieurs petits systèmes de stockage et en contrôleurs de mémoire plus puissants. Finalement, les disques à semi-conducteurs peuvent constituer une solution ultime pour les systèmes de transactions en ligne avec points chauds et avec temps d attente E/S durablement élevé. Les utilisateurs font part d augmentations importantes de puissance avec ce type de disque mais les coûts sont également considérables. Configuration E/S par accès lecture E/S par accès écriture E/S pour 100 accès systèmes de transactions en ligne* Efficacité E/S * RAID-0 1 1 100 100 % RAID-1 1 2 130 77 % RAID-0+1 1 2 130 77 % RAID-5 1 4 190 52 % RAID-6 1 7 280 35 % * sur la base d un mélange typique de systèmes de transactions en ligne comprenant 30 % d opérations d écriture et 70 % de lecture

Une solution hautement disponible de virtualisation du stockage d après l exemple de la clinique d Amberg Utilisateur LAN Applications PACS/MIS/B2D (Connexion possible d autres serveurs de banques de données/fichiers, etc.) PACS Serveur de gestion dans B2D le réseau de gestion MIS Espace ordinateur 1 Espace ordinateur 2 Connexion à la solution domaine de stockage Fibre Channel (Connexion iscsi également possible) FC-SW 1a FC-SW 2a FC-SW 1b FC-SW 2b Fabric 1 Fabric 2 Administration du stockage DataCore TM SANmelody Serveur de domaine de stockage 1 Serveur de domaine de stockage 2 Matériel de stockage Systèmes transtec PROVIGO RAID Systèmes transtec PROVIGO RAID PACS = Système d archivage et de communication d images MIS = Système d information de gestion B2D = Sauvegarde sur disque LAN = Réseau local FC-SW = Commutateur Fibre Channel Systèmes transtec PROVIGO RAID = Réseau de gestion = Chemin primaire de données = Chemin secondaire de données = Connexion Fabric = Réseau local 12 Virtualisation du stockage

Autres informations Autres informations Informations transtec sur les produits, solutions et technologies transtec AG Informations et offres pour matériel transtec http://www.transtec.fr http://www.transtec.ch http://www.ttec.be Centre de Compétence transtec Informations et offres pour solutions transtec dans l environnement mémoire et serveur http://www.transtec-cluster.com Manuel transtec IT Manuel détaillé de technologie informatique http://www.transtec.fr/go/compendium http://www.transtec.ch/go/f_compendium http://www.ttec.be/go/f_compendium DataCore TM Producteur d applications de logiciel dans l environnement SAN http://www.datacore.com Autres informations 13 Organisations et associations dans le domaine du réseau de stockage SNIA Storage Networking Industry Association Serial ATA International Organization STA SCSI Trade Association FCIA - Fibre Channel Industry Association IEEE - Institute of Electrical and Electronics Engineers ASNP - Association of Storage Networking Professionals Association pour le support de l industrie pour la formation et la standardisation dans le domaine des mémoire Association pour le support de l industrie pour l implémentation et la spécification de SATA Association pour la promotion de la technologie SCSI Association pour la promotion de la technologie Fibre Channel Association pour la promotion des thèmes technologiques Forum ouvert pour spécialistes dans l environnement des réseaux de mémoires http://www.snia.org http://www.serialata.org http://www.scsita.org http://www.fibrechannel.org http://www.ieee.org http://www.asnp.org

transtec S.A.R.L Immeuble Les Scientifiques Rue Sébastien Brant F-67400 Strasbourg-Illkirch Téléphone : +33 (0) 3.88.55.16.00 Fax : +33 (0) 3.88.55.16.09 transtec.fr@transtec.fr www.transtec.fr Direction du projet et rédaction Textes et conception Conception graphique transtec Computer AG Riedmattstrasse 9 CH-8153 Rümlang Tel.: +41 (0) 44/818 47 00 Fax: +41 (0) 44/818 47 20 transtec.ch@transtec.ch www.transtec.ch Markus Lohmüller, Marketing Manager Markus.Lohmueller@transtec.de Holger Hennig, Head of Competence Center Holger.Hennig@transtec.de Andrea Rudorf, Senior Storage Consultant Andrea.Rudorf@transtec.de Marco Poggioli, Product Manager Storage Marco.Poggioli@transtec.de Sandra Kammerer, Conception Photos et Communication sk@kammererkommunikation.de Vous trouverez plus d informations sur les solutions transtec à l adresse www.transtec-cluster.com ttec Computers B.V.B.A. The Corporate Village, Avenue Da Vincilaan 9 Box E.6, Elsinor Building B-1935 Zaventem Belgium Téléphone : +32 (0) 800/93 920 Fax : +32 (0) 800/93 921 ttec.be@ttec.be www.ttec.be transtec = ttec en Belgique transtec IT Compendium transtec AG, Novembre 2006 Toutes les illustrations sont propriétés de transtec AG et ne peuvent être utilisées, reproduites et publiées qu avec l autorisation de transtec AG. Nous déclinons toute responsabilité en cas d erreur ou d oubli dans les indications.