Une solution stockage sécurisée et distribuée au Synchrotron Soleil

Documents pareils
Problématiques de stockage d un Data Center

Système de Stockage Sécurisé et Distribué

Solution de stockage et archivage de grands volumes de données fichiers.

Nouvelles stratégies et technologies de sauvegarde

La présentation qui suit respecte la charte graphique de l entreprise GMF

EMC DATA DOMAIN HYPERMAX

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Conservation des documents numériques

Présentation de la gamme des PGI/ERP modulaires Wavesoft

Concepts et systèmes de stockage

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

Entrez dans l ère du Numérique Très Haut Débit

Marché à procédure adaptée (en application de l article 28 du code des Marchés Publics)

NOTIONS DE RESEAUX INFORMATIQUES

EMC DATA DOMAIN OPERATING SYSTEM

L unique SAN industriel proposant un stockage multiniveau automatisé (Automated Tiered Storage)

FAMILLE EMC RECOVERPOINT

Serveur EMC/CX Solution de stockage hautes performances dotée d'une connectivité flexible

Conservation des données à long terme

J'ai un patrimoine électronique à protéger

DEMANDE D INFORMATION RFI (Request for information)

Système de Sauvegarde et d Archivage Backup Smart Way TM

La virtualisation de serveurs avec VMWare Infrastructure - Retour d expérience. Rodérick Petetin CRI INSA Rennes

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

UltraBackup NetStation 4. Guide de démarrage rapide

Kick Off SCC 2015 Stockage Objet. Vers de nouveaux horizons

Network storage solutions

APX Solution de Consolidation de Sauvegarde, restauration et Archivage

Seagate Technology LLC S. De Anza Boulevard Cupertino, CA 95014, États-Unis

Mise en œuvre de la virtualisation à l IGBMC. Guillaume Seith Remy Fritz

SYSTÈMES DE STOCKAGE AVEC DÉDUPLICATION EMC DATA DOMAIN

Guide des solutions My First SAN. 2ème édition

Restauration d AdmiCash sur un nouveau PC ou système d exploitation

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Technologie de déduplication de Barracuda Backup. Livre blanc

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

Distinguer entre «Enregistrer» et «Sauvegarder»

Une unité organisationnelle (Staff) comporte une centaine d'utilisateur dans Active Directory.

L'évolution dans les technologies de stockage

Pérennisation des Informations Numériques

ACQUISITION DE MATERIEL INFORMATIQUE

Sauvegarde des données au LAAS

L A T O U R D E P E I L Z Municipalité

Entreprises Solutions

Moteur de réplication de fichiers BackupAssist

D1- L'environnement de travail

Sécurisation et résilience des services DNS/DHCP Gestion de l adressage IP automatisée

Protection des données avec les solutions de stockage NETGEAR

PostgreSQL, le cœur d un système critique

La Virtualisation Windows chez CASINO. Philippe CROUZY Responsable Infrastructure Equipes Systèmes -Stockage

Analyse Concurrentielle Retrospect et ses concurrents

Spécialiste Systèmes et Réseaux

Spectrophotomètre double faisceau modèle 6800

Solution de sauvegarde pour flotte nomade

Sujet Solution de sauvegarde de serveurs et postes de travail avec BackupPC et Bacula. par ALIXEN

Sauvegarde EMC pour solutions SAP HANA prêtes pour le datacenter. EMC Data Domain avec DD Boost

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Sauvegarde : Supports de données et Infrastructures

Gestion électronique de documents

Informatique pour scientifiques hiver Plan général Systèmes d exploitation

Solutions informatiques (SI) Semestre 1

Clusters de PCs Linux

VERITAS NetBackup 5.0

Système de stockage EMC CLARiiON AX4

Prestations de conseil en SRM (Storage Ressource Management)

Analyse de la bande passante

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

Cours 13. RAID et SAN. 2004, Marc-André Léger

Le Raid c est quoi? Comment ca marche? Les différents modes RAID :

Le partenaire tic de référence. Gestion des ressources humaines INOVA RH

Présentation du module Base de données spatio-temporelles

Fiche Technique Windows Azure

GOUTEYRON ALEXIS. SIO2 N candidat: UEpreuve E4. USituation professionnelle 2. serveurs de fichiers. Uen haute disponibilité

NVR Fusion IV. Pour quels marchés? Caractéristiques Matériel. Logiciel

La continuité de service

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Sauvegarde collaborative en pair-à-pair

Découverte et investigation des menaces avancées PRÉSENTATION

LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES

Module 0 : Présentation de Windows 2000

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

AdBackup Laptop. Solution de sauvegarde pour flotte nomade. Société Oodrive

Analyse Concurrentielle Retrospect et ses concurrents

Présentation Infrastructure DATACENTRE

L ARCHIVAGE LEGAL : CE QU IL FAUT SAVOIR

PRINCIPE MICROSCOPIE CONFOCALE

- Le LPC2E et les Bases de Données Spatiales - Valorisation des bases de données ondes

//////////////////////////////////////////////////////////////////// Administration systèmes et réseaux

JRES 2007 Solution de stockage répartie sur les centres de recherche INRIA, à base de serveurs de fichiers de type «NAS»

LE STOCKAGE UNIFIÉ ASSOCIÉ À LA VIRTUALISATION D'ENTREPRISE

Security Center Plate-forme de sécurité unifiée

Tarifs 15 juin 2015 REF MATRIX APPLIANCES. DESIGNATION RAID CAPACITE EN RAID Prix Public Unitaire HT.

Acronis Backup & Recovery 10 Advanced Server Virtual Edition. Guide de démarrage rapide

Les enjeux du stockage de masse sur bande vidéo

OFFRES DE SERVICES SDS CONSULTING

Plan de Continuité d'activité Concepts et démarche pour passer du besoin à la mise en oeuvre du PCA

Transcription:

Une solution stockage sécurisée et distribuée au Synchrotron Soleil Informatique Scientifique Groupe Systèmes et Réseaux Division Informatique philippe.martinez@synchrotron-soleil.fr

Historique du Synchrotron Soleil Début des années 1990 : initiation du projet (suite du LURE) 1996-1999 : mise en place d'une équipe CEA/CNRS pour l'étude de l'apd (AvantProjet Détaillé) 11 septembre 2000 : Annonce de la construction de Soleil sur le plateau de Saclay par le ministre de la recherche 16 octobre 2001 : Création de la société civile Janvier 2002 : début de la construction Juin 2006 : 1ère accumulation d'électrons Septembre 2006 : 1er faisceau et 1er octet stocké Janvier 2008 : 1ers utilisateurs 400000 350000 Int ensité (u.a.) 300000 250000 200000 Colonne B Colonne H 150000 100000 50000 0 8,9 9 9,1 9,2 9,3 Energie (kev) 9,4 9,5 9,6 9,7

La société Synchrotron Soleil Société civile de droit français (CEA : 28 %, CNRS : 72 %) Partenaires : Le Conseil Général de l'essonne et le Conseil Régional d'ile de France Un grand projet national et européen : - Effectuer la recherche fondamentale dans tous les domaines qui requièrent l utilisation du rayonnement synchrotron - Doter la France d un outil de haute technologie au service de la Recherche, mais aussi des grands enjeux nationaux et de l industrie (défense, environnement, santé ) - S'ouvrir aux utilisateurs français mais aussi aux utilisateurs européens et du monde entier

Les principaux domaines d application Détection de substances polluantes Connaissance de la structure des matériaux Exploration de la matière et connaissance de ses propriétés Conservation des aliments Elaboration de nouveaux matériaux Recherche de nouveaux médicaments, imagerie des tissus osseux, étude de l ADN,... Dans tous les domaines, un accueil est prévu pour les industriels

Qu'est-ce qu'un synchrotron?

Le rayonnement synchrotron? C est un rayonnement très intense produit lorsque des électrons de très haute énergie sont soumis à l action d un champ magnétique et perdent leur énergie. Ces conditions sont réunies dans les accélérateurs circulaires où des électrons sont accélérés jusqu à la vitesse de la lumière et forcés de suivre une trajectoire circulaire (aimants et éléments d insertion). 16/05/2008

Le principe de fonctionnement Le rayonnement synchrotron sortant de l anneau est concentré et dirigé par des systèmes optiques vers les installations expérimentales (les lignes de lumière). Grâce à des réseaux ou des cristaux, on sélectionne la longueur d onde adaptée à l expérience (plus elle est courte et plus on pourra étudier des objets de petite dimension). Anneau de stockage Cabine optique Cabine d expérience Le rayonnement illumine l échantillon. Réfléchi, transmis ou absorbé, il est analysé par des détecteurs et, après traitement des informations, il permet d appréhender les propriétés de l échantillon étudié.

Périmètre de l informatique Arrivée des données à stocker Contrôle et acquisition

Les grandes étapes du projet stockage 1er semestre 2004 : recensement des besoins utilisateurs compréhension du mode de fonctionnement de chaque ligne de lumière identification et caractérisation des données analyse du cycle de vie des données Janvier 2005 : lancement de l appel d offre Septembre 2005 : maquettage Fin 2005/début 2006 : choix de la solution Mai 2006 : début du déploiement Second semestre 2006 : premières mises en production Janvier 2008 : premiers utilisateurs extérieurs

Synthèse des besoins Volumétries très différentes suivant les lignes de lumière (quelques Mo à quelques centaines de Go par jour) Durées de vie variables (de 2 semaines à à vie!) Politiques de conservation différentes suivant le type d'utilisateurs (visiteurs ou scientifiques Soleil) Disponibilité permanente de l'accès aux données Accessibilité multi-réseaux Exportation des données pour les visiteurs : média ou réseau Archivage des données très peu accédées Salle 1 Bâtiment administratif Hierarchisation (données critiques, primaires, secondaires, archives) Salle 2 Contrainte géographique (distances salles et lignesde lumière) Bâtiment Synchrotron 16/05/2008

Objectifs Extensibilité Transparence Sûreté Rapatriement Disponibilité Coût Pérennité Longévité Exploitabilité Incorruptibilité Performance

Architecture matérielle Postes utilisateurs Serveurs d'acquisation MARS AILES Internet PLEIADES Ligne de lumière SMIS Bâtiment Central EMC CX700 NFS/CIFS dorsata 80 à 160 To carnica 24 To florea 150 To CASSIOPEE DISCO GRAU ITL-XL (SAIT1) ODE DESIRS SUN X4500 SUN X4500 MICROFOC EMC CX700 GRAU ITL-XL (SAIT1) trigona 24 To METROLOGIE mellifera 50 à 130 To cerana 150 To Clusters de Calcul CRISTAL SIXS 250 Go Bâtiment Synchrotron DEIMOS DIFFABS Réseau de site TEMPO SAMBA SWING 440 Go PROXIMA1 1800 Go 05/05/2006

Architecture matérielle Point d'accès des lignes de lumière sur serveurs autonomes (DELL), 300 Go à 1,8 To de disques SCSI Points d accès salles informatique (DELL) Stockage des données primaires assuré par des baies de disques EMC (40 To puis 150 To) Stockage des données secondaires assuré par des librairies de bandes GRAU de 1344 slots : bandes LTO3 (400 Go à 800 Go) et SAIT1 (500 Go à 1300 Go) Réseau de stockage Gigabit IP dédié (fibre optique)

La politique de stockage Les données sont déposées sur les points d accès des lignes de lumière ou depuis le cluster de calcul 3. Elles sont copiées très vite sur les 2 baies de disques EMC et les 2 libraires de bandes GRAU 4. La donnée reste dans le cache local 4 jours minimum 5. Au bout de 100 jours, les 2 copies EMC expirent ; restent alors les 2 copies bandes 6. Les 2 copies bandes expirent au bout de 1 à 5 ans suivant les systèmes de fichiers 7. L utilisateur demande alors au préalable un archivage de ses données s il le souhaite 8. A chaque rupture de technologie, on reverra avec la ligne de lumière concernée si on pérennise ou pas les données.

Solution retenue Coeur de la solution = système de stockage cellulaire distribué ACTIVE CIRCLE Un seul noyau - identique sur toutes les machines - qui intègre : sauvegarde en continu réplication stockage hiérarchique stockage multi-sites haute disponibilité

Raisons du choix Solution technique ayant le plus de perspectives intéressantes Evolutivité : architecture très extensible dans un environnement ouvert Robustesse : forte redondance offrant un niveau de réplication important, une sécurisation et une haute disponibilité des données Fonctionnalités : solution répondant à tous les objectifs, dont l archivage intégré au format tar À l époque, capacité de DEVOTEAM à assurer la maîtrise d'oeuvre et à féderer les différents acteurs Meilleur prix au Téraoctet Capacité : des volumétries potentielles permettant largement d anticiper les besoins

Mise en place Plateforme de référence utilisée depuis février 2006 Début du déploiement en mai 2006 Tests avec les premières lignes depuis septembre 2006 Acceptance le 18 octobre 2006 VSR signifiée le 18 décembre 2006 : validation de la disponibilité des données et de la fiabilité du matériel Début de la production des 7 premières lignes en janvier 2007 Installation de 5 autres lignes début 2007 Installation de 5 autres lignes 2nd semestre 2007 jusqu à 24 à 26 lignes fin 2009 16/05/2008

Bilan Engagements pris par ACTIVE CIRCLE respectés, même si parfois différés Très bonne réactivité grâce à des outils de debugging très complets qui permettent une compréhension rapide des problèmes --> corrections vite disponibles Bonne méthologie de travail : peu de régressions malgré le grand nombre de mises à jour et correctifs depuis 2 ans Dans la phase initiale, de nombreux bugs trouvés à la fois sur la plateforme de référence et celle de production, corrigés assez vite. La compétence, le sérieux et l honneteté des intervenants a conforté notre confiance ; l arrivée de Philippe Motet comme directeur technique en juillet 2006 a été très importante, à la fois dans les orientations techniques et dans l organisation et la rigueur du support. Robustesse améliorée de jour en jour au cours des 2 premières années.

Situation chiffrée actuelle Version 3.1.2p29 28 cellules installées : 3 dans chaque salle informatique, 20 lignes de lumière, 2 contrôle machine ~ 5 millions de fichiers Plus de 16 Teraoctets, copiés 4 fois (sans historisation) et archivés 2 fois Près de 60 partages différents Plusieurs centaines de Go écrits/lus par jour quand le faisceau est disponible Pour chaque baie EMC : 150 To Pour chaque librairie GRAU : LTO3 530 To à 1 Po SAIT1 672 To à 1,7 Po

A venir... Système de cache circulaire complet Encore de gros besoins d'outils d'exploitation plus ergonomiques : tableau de bord opérateur, statistiques, rechargement de configuration, centralisation de paramètres Meilleur ordonnancement des lecteurs de bandes Couche système de fichiers vfs Nécéssité d'avoir des outils d'analyse plus simples Optimisation du démarrage en parallélisant certaines taches

Conclusion Une solution novatrice : un choix réfléchi et mesuré entouré d un nombre important d engagements et garanties La mieux adaptée à notre architecture géographique et nos besoins : le «circle» colle bien à «l'anneau»! Un cercle humain actif au service du rayonnement de notre projet

Informatique Scientifique Division Informatique - Groupe Systèmes et Réseaux philippe.martinez@synchrotron-soleil.fr http://www.synchrotron-soleil.fr