DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION
|
|
- Irène St-Gelais
- il y a 8 ans
- Total affichages :
Transcription
1 DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION PRINCIPES DE BASE SUR LES DONNEES ET LE CALCUL HAUTE PERFORMANCE Lois de Gray sur l ingénierie des données 1 : Les calculs scientifiques traitent des volumes considérables de données, sans limites réelles. La solution est l architecture «scale-out» avec accès aux données distribuées. Il faut déplacer les organes de calcul vers les données et non l inverse. Loi d Amdahl sur le calcul haute performance (HPC) 2 : Ajouter des cœurs de microprocesseur à un processus ne permet pas de l accélérer de manière linéaire. Accélération = 1/((1 - P) + P/N) N = nombre de composants parallèles P = partie de programme parallèle (pourcentage) (1-P) = partie séquentielle P/N = partie simultanée/parallèle Les processeurs multicœurs n atténuent pas le problème car le séquençage nouvelle génération est hautement parallélisé. Les systèmes de calcul haute performance (HPC) actuels sont riches en termes de traitement CPU et pauvres en termes d entrées/sorties. Figure 1 : Loi d Amdahl L objectif du séquençage nouvelle génération (SNG) est de créer de grandes régions contiguës de séquences ADN (les blocs de construction du génome) significatives d un point de vue biologique, à partir de milliards d éléments de données issus de fragments courts. Le séquençage du génome entier (méthode globale ou Shotgun) est la meilleure approche en termes de coût par opération de séquençage, de ressources de calcul et de portée clinique. La méthode de séquençage Shotgun consiste à réaliser un échantillonnage aléatoire de séquences de lectures effectuées par les instruments de séquençage nouvelle génération, avec une couverture optimale. La couverture de séquençage nouvelle génération se définit comme suit : nombre de lectures x (longueur de lecture/longueur du génome). Le nombre de lectures est généralement de l ordre de plusieurs millions, la longueur de lecture et la longueur du génome étant exprimées en paires de bases. La longueur du génome humain est d environ 3 milliards de paires de bases. Les étapes du séquençage Shotgun sont les suivantes : 1. Extraction et fragmentation de l ADN. 2. Clonage de l ADN et séquençage des deux extrémités du clone. 3. Recueil des données brutes du séquenceur et de la fonction d appel de bases. 4. Assemblage de la séquence par création d un graphe de De Bruijn 3 (qui peut comporter plus de 100 millions de nœuds et dont les segments sont appelés k-mers) et de ses sous-graphes ; détection des chevauchements et assemblage ; réduction du graphe et création d échafaudages. 5. Finalisation de la séquence en comblant les trous : une couverture plus importante aboutit à des trous plus petits et moins nombreux. 6. Recherche de la signification phénotypique et clinique via les polymorphismes nucléotidiques (SNP), insertions/suppressions (InDel), variants, variations du nombre d exemplaires (CNV) et mutations. Les principaux composants d une architecture de séquençage nouvelle génération sont : le ou les instruments, le calcul haute performance (HPC), le stockage et le réseau. Dans le séquençage nouvelle génération, le calcul haute performance a pour but de réduire la latence et d optimiser le volume de données de séquences ADN traitées par unité de temps. Les composants les plus lents d un environnement HPC sont le réseau et les disques. Il existe plusieurs raisons pour lesquelles on ne peut parvenir à une parallélisation totale 4, notamment : Limitations des algorithmes : Elles sont dues à des dépendances mutuelles ou à des parties du processus qui ne peuvent être exécutées que séquentiellement. Goulots d étranglement : L accès aux données constitue le goulot d étranglement majeur dans les workflows HPC. Dans la mesure où les algorithmes en boucle font entrer et sortir du CPU de grandes quantités de données, les ressources intégrées ont tendance à être sous-utilisées et les performances sont limitées par les chemins de données les plus lents vers la mémoire et son stockage. L accès à une ressource partagée (chemins d exécution dans le cœur, chemins mémoire partagés dans les processeurs multi-cœurs et périphériques d entrées/sorties) sérialise l exécution. Cela influe également sur la simultanéité. Temps système au démarrage : Le processus d appel de bases et les autres opérations faisant intervenir de nombreuses écritures de petits fichiers sont également responsables de ce temps système avant la mise en cache. Communication : La parfaite simultanéité entre les différentes parties d un système parallèle relève davantage de la théorie que de la pratique. La communication étant la pierre angulaire des algorithmes parallèles, il existe toujours un certain pourcentage de sérialisation. Les problèmes d instabilité, dus aux pilotes et aux versions, dans le système d exploitation et le réseau peuvent également être à l origine de goulots d étranglement. PRÉSENTATION DE SOLUTION
2 Exemples d utilisation du séquençage nouvelle génération Au cours des cinq dernières années, les progrès de la science génomique, plus rapides que ne le prévoyait la loi de Moore, ont permis d accélérer l avènement du diagnostic moléculaire (MDx), que le Dr Leroy Hood décrit sous le nom de «médecine P4» 5 : personnalisée, prédictive, préventive et participative. Les exemples d utilisation pour une génomique clinique utilisant le séquençage nouvelle génération sont présentés dans le tableau 1. Tableau 1 : Exemples d utilisation du séquençage nouvelle génération et stratégie d analyse NOM POPULATION D ACIDES NUCLÉIQUES STRATÉGIE D ANALYSE SÉQUENÇAGE ARN (RNA-SEQ) ARN (poly-a, ARNm ou ARN total) Alignement des lectures sur les «gènes» ; variations pour la détection des jonctions d épissage et la quantification de l abondance SÉQUENÇAGE DES PETITS ARN Petits ARN (ou microarn) Alignement des lectures sur les références des petits ARN (par exemple mirbase), puis sur le génome ; quantification de l abondance MÉTHODE CHIP-SEQ ADN lié aux protéines, capturé par l intermédiaire de l anticorps (ChIP = Chromatin ImmunoPrecipitation) Alignement des lectures sur le génome de référence, identifications des pics et des motifs ANALYSE DES VARIATIONS STRUCTURELLES ADN génomique, avec deux lectures «mate-pair» par modèle d ADN Alignement des mate-pairs sur la séquence de référence et interprétation des variants structurels SÉQUENÇAGE DE NOVO ADN génomique, avec éventuellement données externes (par ex. ADNc, génomes d espèces étroitement apparentées, etc.) Regroupement des lectures pour assemblage des contigs, échafaudages et (dans l idéal) séquence de génome entier MÉTAGÉNOMIQUE Intégralité de l ARN ou de l ADN d une communauté (généralement microbienne) Analyse phylogénétique des séquences
3 La stratégie d analyse est gérée principalement par un logiciel Open Source, comme indiqué ci-dessous dans le tableau 2. Toutefois, avec l arrivée à maturité du domaine de la génomique clinique, les plates-formes telles qu Avadis et CLCbio gagnent du terrain pour des raisons de documentation, d audit et d exigences réglementaires. Les techniques de séquençage smallrna, ChIPseq et RNAseq, comme la méthode de séquençage de novo, se révèlent prometteuses d un point de vue clinique. Tableau 2 : Outils d analyses couramment utilisés dans le séquençage nouvelle génération ÉTAPES DES PROCESSUS BIOINFORMATIQUES OUTILS INTÉGRÉS ALIGNEMENT/ ASSEMBLAGE AU GENOME DE REFERENCE ALIGNEMENT ET ASSEMBLAGE DE NOVO DÉCOUVERTE DES SNP/INDEL ANNOTATION, NAVIGATEUR CASAVA BoWTie ABySS SOAPsnp Avadis CLCbio BWA SOAPdenovo EagleView Genomics Workbench Galaxy GATK ELAND Maq SAMtools BFAST Harvard Genotator NCBI MapView SAMtools UCSC Genome Browser Débit de données avec Illumina HiSeq 2000 Débit d environ 30 à 50 Gbp par jour Longueur de lecture d environ 100 bp couverture d environ 50 x à 75 x ~ 8 To de données brutes par run (opération de séquençage) - fichiers d appel de bases compris, images et fichiers log non compris ~ 100 Go de données de résultats par run 2 runs par semaine et par instrument ~ 8 To par semaine et par instrument 4 séquences de génome entier (WGS) ou 16 exomes par semaine et par instrument Débit réaliste de 160 génomes entiers ou 480 exomes par an et par instrument. Cela représente environ 350 To par an. ILLUMINA HISEQ L architecture de séquençage de nouvelle génération présentée à la Figure 2 correspond à un seul exemple de séquenceur de production, l Illumina HiSeq. Avec le succès croissant du «séquençage en tant que service», les chercheurs se concentrent sur le fichier BAM (Binary Alignment Map) pour commencer l analyse des séquences d un point de vue fonctionnel : SNP, insertions/suppressions (InDel), variants, CNV et mutations. Figure 2. Architecture de référence
4 Figure 3 : Les types de stockage EMC Isilon et leurs fonctions La solution : EMC Isilon EMC ISILON ONEFS Le système d exploitation EMC Isilon OneFS combine les trois couches des architectures de stockage traditionnelles (système de fichiers, gestionnaire de volume et RAID) au sein d une couche logicielle unifiée, constituant ainsi un système de fichiers distribué, intelligent et unique qui s exécute sur un cluster de stockage Isilon. Les avantages que présente OneFS pour le séquençage nouvelle génération sont nombreux : Évolutivité : Évolution en fonction des besoins. Évolution linéaire avec une capacité croissante : de 18 To à 20 Po dans un même système de fichiers et un même espace de nommage global. Prévisibilité : L équilibrage dynamique des contenus s effectue au fur et à mesure que des nœuds sont ajoutés, mis à niveau ou que la capacité est modifiée. Ce processus étant très simple, il ne nécessite pas de temps de gestion supplémentaire. Disponibilité : OneFS est capable d auto-réparation Il protège vos données en cas de coupure d alimentation, de panne de nœud ou de disque, de défaut de quorum et de reconstruction du stockage en distribuant les données, métadonnées et données de parité sur l ensemble des nœuds. Efficacité : Comparé aux 50 % d efficacité moyenne des systèmes RAID, OneFS vous garantit une efficacité de 80 %, indépendamment du cache ou de la charge de calcul du CPU. Cette efficacité est due à la hiérarchisation du processus en trois types, comme le montre la Figure 3, et aux pools existant dans ces types de nœuds. Prêt à l emploi pour l entreprise : Administration des clusters de stockage par l intermédiaire d une interface utilisateur Web intuitive. Connectivité à vos processus via les protocoles standard : CIFS, SMB, NFS, FTP/HTTP, Objet et HDFS. Authentification et contrôle d accès normalisés disponibles : AD, LDAP et NIS. Notez que pour mettre en place un système équilibré, vous devez vous procurer en même temps un modèle X ou S et un modèle NL. Postulats : a. Les fichiers bruts sont traités séparément b. Le processus débute au niveau des fichiers d appel de bases c. Couche d archivage commune Fichiers de sortie : Fichiers BAM : 30 octets par lecture + 2 octets par paire de bases ; environ 100 Go à 250 Go pour le séquençage du génome humain entier Fichiers SRA : 10 octets par paire de bases (~ 30 Go pour le séquençage du génome humain entier) Temps d analyse et d interprétation non compris (variable d une semaine à plusieurs mois). Tableau 3 : Deux architectures de référence de stockage ARCHITECTURE DE TYPE «UN VERS UN» Un séquenceur pour un cluster de stockage 3 séquenceurs EXEMPLE AVEC UN SEUL SÉQUENCEUR EMC Isilon X 18 To de capacité brute (3 x 6 To) avec un minimum de 400 Go sur disque SSD, 48 Go de RAM Déplacement vers la couche d archivage après chaque exécution avec SmartPools ou SnapshotIQ TM Zone de travail temporaire (dossiers tmp) sur cluster de stockage Back-end IB et Ethernet front-end 1 Gbit/s minimum (LACP 2 x 1 Gbit/s ou 10 Gbit/s pour améliorer les performances) ÉVOLUTIVITÉ AVEC L AJOUT DE SÉQUENCEURS Couche d archivage : Gamme NL 108 To de capacité brute (3 x 36 To) : Conception offrant 324 To de données brutes (3 x 108 To) pour planification de stockage sur un an ARCHITECTURE DE TYPE «PLUSIEURS VERS UN» Plusieurs séquenceurs pour un cluster de stockage 3 séquenceurs EXEMPLE AVEC 3 SÉQUENCEURS Gamme EMC Isilon S 36 To de capacité brute (3 x 12 To) avec un minimum de 800 Go sur disque SSD, 144 Go de RAM Zone de stockage temporaire (dossiers tmp) sur cluster HPC si le logiciel d analyse de séquençage nouvelle génération permet cette configuration ; dans le cas contraire, zone de stockage temporaire sur le cluster de la gamme S Back-end IB et Ethernet front-end 10 Gbit/s ÉVOLUTIVITÉ AVEC L AJOUT DE SÉQUENCEURS Couche d archivage : Déplacement par lots via les règles SmartPools ou SnapshotIQ : Gamme NL 324 To de capacité brute (3 x 108 To) : Conception offrant 2 clusters NL pour planification de stockage sur un an
5 Flux de données et performances FLUX DE DONNÉES ET DIMENSIONNEMENT POUR LE SÉQUENÇAGE NOUVELLE GÉNÉRATION Malgré la similarité des composants SNG, notamment en matière de séquenceurs, de calcul haute performance et de stockage, les workflows peuvent présenter de grandes différences, comme le montre le tableau 1. Il est donc impératif que les équipes de recherche et d informatique comprennent et planifient en conséquence l architecture du calcul haute performance et du stockage. La figure 4 fournit l illustration d un workflow de ce type, avec chemins de données, tailles de fichiers et volumes de données. Cet exemple est représentatif de la plupart des workflows du séquençage de génomes entiers. Il est également essentiel de bien appréhender le débit de l instrument. Figure 4 : Flux de données et dimensionnement METRICS DE PERFORMANCES Tout comme la bonne compréhension du workflow, le degré de parallélisation des algorithmes dans le processus est fondamental en termes de performances. Il existe également d autres facteurs importants, notamment la RAM (3 Go/cœur), le réglage du système de fichiers NFS et les trames jumbo (TCP MTU 9000). Le réglage des threads pour SGE et NFS peut également contribuer à l amélioration des performances. Configuration de test : plate-forme HPC 72 cœurs (2,6 GHz) avec 144 Go de RAM sur CentOS 6.2 Son-of Grid Engine et PDSH, programmation parallèle avec le compilateur GCC Nœud EMC Isilon S avec capacité brute de 12 To, disque SSD de 540 Go et 144 Go de RAM avec back-end IB sur OneFS Ethernet front-end 1 Gbit/s, NFSv4 Plate-forme d analyse Illumina CASAVA Séquençage du génome humain entier par Illumina
6 Références : 1. Jim Gray, «Scalable Computing» (présentation chez Nortel : Microsoft Research, avril 1999). Figure 5 : Performance du séquençage nouvelle génération avec Illumina CASAVA 2. Amdahl, «Validity of the Single Processor Approach to Achieving Large-Scale Computing Capabilities». AFIPS Conference Proceedings (30) : , Compeau, Pevzner et Tesler, «How to apply de Bruijn graphs to genome assembly», Nature Biotechnology. Volume 29, numéro 11, novembre Hagar et Wellein, «Introduction to High Performance Computing for Scientists and Engineers», CRC Press, Hood et Friend, «Predictive, personalized, preventive, participatory (P4) cancer medicine», Nature Reviews Clinical Oncology 8, , mars Guide d utilisation de CASAVA 1.8, Illumina Réf Rév. B, mai CONCLUSION Le séquençage nouvelle génération est une entreprise complexe faisant intervenir de multiples variables. En effet, les instruments eux-mêmes évoluent plus rapidement que les couches de stockage ou de calcul haute performance à mesure que le processus prend la direction de la génomique clinique. Avec EMC Isilon, la conception du stockage des données de séquençage nouvelle génération, sa mise en œuvre et le processus de mise à niveau sont à la fois simples et sans problèmes. NOUS CONTACTER Pour savoir comment les produits, services et solutions EMC peuvent vous aider à relever vos défis métiers et informatiques, contactez un responsable de compte ou un revendeur agréé, ou visitez notre site Web à l adresse france.emc.com/isilon. EMC 2, EMC, le logo EMC, Isilon, OneFS, SmartPools et SnapshotIQ sont des marques déposées ou des marques commerciales d EMC Corporation aux États-Unis et dans d autres pays. Toutes les autres marques citées dans le présent document sont la propriété de leurs détenteurs respectifs. Copyright 2013 EMC Corporation. Tous droits réservés. 06/13 Présentation de solution H france.emc.com EMC estime que les informations figurant dans ce document sont exactes à la date de publication. Ces informations sont modifiables sans préavis.
EMC DATA DOMAIN HYPERMAX
EMC DATA DOMAIN HYPERMAX Optimisation du stockage de protection EMC AVANTAGES CLÉS Déduplication évolutive et ultrarapide Jusqu à 58,7 To/h de débit Réduit de 10 à 30 fois le stockage de sauvegarde, et
Plus en détailEMC DATA DOMAIN OPERATING SYSTEM
EMC DATA DOMAIN OPERATING SYSTEM Au service du stockage de protection EMC AVANTAGES CLÉS Déduplication évolutive ultrarapide Jusqu à 31 To/h de débit Réduction des besoins en stockage de sauvegarde de
Plus en détailLivre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012
Livre blanc Solution Hadoop d entreprise d EMC Stockage NAS scale-out Isilon et Greenplum HD Par Julie Lockner et Terri McClure, Analystes seniors Février 2012 Ce livre blanc d ESG, qui a été commandé
Plus en détailSYSTÈMES DE STOCKAGE SCALE-OUT D'EMC ISILON
SYSTÈMES DE STOCKAGE SCALE-OUT D'EMC ISILON Le stockage en toute simplicité AVANTAGES CLÉS Gestion du stockage simple, facile à utiliser Évolutivité à grande échelle et flexibilité d évolution à mesure
Plus en détailSYSTÈMES DE STOCKAGE SCALE- OUT D EMC ISILON
SYSTÈMES DE STOCKAGE SCALE- OUT D Stockage simplifié pour les données non structurées AVANTAGES CLES Gestion du stockage simple et conviviale Évolutivité massive de la capacité et des performances Efficacité
Plus en détailACCOMPAGNER L EXPLOSION DES VOLUMES DE DONNEES : LES NOUVEAUX ENJEUX DU STOCKAGE
Livre Blanc ACCOMPAGNER L EXPLOSION DES VOLUMES DE DONNEES : LES NOUVEAUX ENJEUX DU STOCKAGE Abstract En 2012, l explosion des volumes de données n est plus une hypothèse lointaine mais bien une réalité.
Plus en détailFAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES
FAMILLE EMC VPLEX Disponibilité continue et mobilité des données dans et entre les datacenters DISPONIBLITÉ CONTINUE ET MOBILITÉ DES DONNÉES DES APPLICATIONS CRITIQUES L infrastructure de stockage évolue
Plus en détailFAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters
FAMILLE EMC VPLEX Disponibilité continue et mobilité des données dans et entre les datacenters DISPONIBILITE CONTINUE ET MOBILITE DES DONNEES DES APPLICATIONS CRITIQUES L infrastructure de stockage évolue
Plus en détailProtection des données avec les solutions de stockage NETGEAR
Protection des données avec les solutions de stockage NETGEAR Solutions intelligentes pour les sauvegardes de NAS à NAS, la reprise après sinistre pour les PME-PMI et les environnements multi-sites La
Plus en détailLE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data
LE BIG DATA Solution EMC Big Data TRANSITION VERS LE BIG DATA En tirant profit du Big Data pour améliorer leur stratégie et son exécution, les entreprises se démarquent de la concurrence. La solution EMC
Plus en détailSystème de stockage IBM XIV Storage System Description technique
Système de stockage IBM XIV Storage System Description technique Système de stockage IBM XIV Storage System Le stockage réinventé Performance Le système IBM XIV Storage System constitue une solution de
Plus en détailSOLUTIONS EMC ISILON DE STOCKAGE DES RÉPERTOIRES PERSONNELS POUR LES ENVIRONNEMENTS NFS ET SMB
Livre blanc SOLUTIONS EMC ISILON DE STOCKAGE DES RÉPERTOIRES PERSONNELS POUR LES ENVIRONNEMENTS NFS ET SMB Bonnes pratiques recommandées en matière de capacité et de performances Résumé Ce livre blanc
Plus en détailPERFORMANCES EXCEPTIONNELLES ET EFFICACITÉ EMC POUR MICROSOFT SQL SERVER
Livre blanc PERFORMANCES EXCEPTIONNELLES ET EFFICACITÉ EMC POUR MICROSOFT SQL SERVER Optimisation du très haut débit pour les charges applicatives OLTP SQL Server Virtualisation et consolidation des instances
Plus en détailBig data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme
Plus en détailLES 5 PRINCIPALES RAISONS DE DÉPLOYER MICROSOFT SQL SERVER SUR LE SYSTÈME DE STOCKAGE UNIFIÉ EMC VNX
LES 5 PRINCIPALES RAISONS DE DÉPLOYER MICROSOFT SQL SERVER SUR LE SYSTÈME DE STOCKAGE UNIFIÉ EMC VNX Et si vous pouviez éviter aux administrateurs de base de données d avoir à se préoccuper au jour le
Plus en détailTRANSFORM IT + BUSINESS + YOURSELF
TRANSFORM IT + BUSINESS + YOURSELF Copyright 2012 EMC Corporation. All rights reserved. 2 Vos environnements SAP sont complexes et couteux : pensez «replatforming» TRANSFORM IT+ BUSINESS + YOURSELF Alexandre
Plus en détailSYSTÈMES DE STOCKAGE AVEC DÉDUPLICATION EMC DATA DOMAIN
SYSTÈMES DE STOCKAGE AVEC DÉDUPLICATION EMC DATA DOMAIN Grâce à leur technologie de déduplication à la volée ultrarapide, les systèmes de stockage avec déduplication EMC Data Domain continuent de révolutionner
Plus en détailPROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN
PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN 1. DÉVELOPPEMENT D'APPLICATION (CONCEPTEUR ANALYSTE) 1.1 ARCHITECTURE MATÉRIELLE DU SYSTÈME INFORMATIQUE 1.1.1 Architecture d'un ordinateur Processeur,
Plus en détailDécouverte et investigation des menaces avancées PRÉSENTATION
Découverte et investigation des menaces avancées PRÉSENTATION AVANTAGES CLÉS RSA Security Analytics offre les avantages suivants : Surveillance de la sécurité Investigation des incidents Reporting sur
Plus en détailTRANSFORMEZ VOTRE INFRASTRUCTURE DE BASE DE DONNEES
TRANSFORMEZ VOTRE INFRASTRUCTURE DE BASE DE DONNEES Les bases de données telles qu'oracle et SQL Server exigent un niveau de latence faible et prévisible ainsi que des performances d'e/s exceptionnelles
Plus en détail4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Plus en détailEMC VSPEX END-USER COMPUTING
Guide d infrastructure VSPEX EMC Proven EMC VSPEX END-USER COMPUTING Citrix XenDesktop 7 avec Microsoft Hyper-V Server 2012 - Jusqu à 2 000 bureaux virtuels Technologie EMC VNX nouvelle génération et sauvegarde
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailEMC XTREMIO : SOLUTION DE CONSOLIDATION HAUTES PERFORMANCES POUR ORACLE
Livre blanc EMC XTREMIO : SOLUTION DE CONSOLIDATION HAUTES PERFORMANCES POUR ORACLE EMC XtremIO, VMware vsphere, base de données Oracle, Oracle RAC Optimiser les temps de service du stockage pour les charges
Plus en détailEMC Data Domain Boost for Oracle Recovery Manager (RMAN)
Livre blanc EMC Data Domain Boost for Oracle Recovery Manager (RMAN) Résumé EMC fournit aux administrateurs de base de données un contrôle total sur la sauvegarde, la restauration et la reprise après sinistre
Plus en détailInfrastructures Parallèles de Calcul
Infrastructures Parallèles de Calcul Clusters Grids Clouds Stéphane Genaud 11/02/2011 Stéphane Genaud () 11/02/2011 1 / 8 Clusters - Grids - Clouds Clusters : assemblage de PCs + interconnexion rapide
Plus en détailSYSTEME DE STOCKAGE UNIFIE EMC VNXe3200
SYSTEME DE STOCKAGE UNIFIE EMC Le est un système de stockage Flash hybride unifié et Flash unifié très économique qui met la puissance des plates-formes EMC VNX à la portée des informaticiens généralistes.
Plus en détailCLOUD PRIVÉ EMC VSPEX VMware vsphere 5.5 - Jusqu à 1 000 machines virtuelles
Guide d infrastructure EMC Proven CLOUD PRIVÉ EMC VSPEX VMware vsphere 5.5 - Jusqu à 1 000 machines virtuelles Technologies Microsoft Windows Server 2012 R2, EMC VNX ET EMC Powered Backup EMC VSPEX Résumé
Plus en détailMise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC
Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr CATI BBRIC 35 bioinformaticiens
Plus en détailFiche produit FUJITSU ETERNUS DX200F Baie de stockage Flash
Fiche produit FUJITSU ETERNUS DX200F Baie de stockage Flash Fiche produit FUJITSU ETERNUS DX200F Baie de stockage Flash Des performances haut de gamme à un prix avantageux ETERNUS DX : le stockage centré
Plus en détailMaîtriser les technologies Big Data pour obtenir des résultats en quasi-temps réel
LIVRE BLANC Processeurs Intel Xeon Unités de stockage SSD Intel Cartes réseau convergé Ethernet Intel Distribution Intel pour logiciel * Maîtriser les technologies Big Data pour obtenir des résultats en
Plus en détailMABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Plus en détailUne solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs
Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs La structure d un FlexPod Cisco UnifiedComputing& NetAppUnifiedArchitecture Cisco Unified Computing System Architecture
Plus en détailLe data center moderne virtualisé
WHITEPAPER Le data center moderne virtualisé Les ressources du data center ont toujours été sous-utilisées alors qu elles absorbent des quantités énormes d énergie et occupent une surface au sol précieuse.
Plus en détailProposition d une architecture pour ebay, en mettant l accent sur les notions de scalabilité, de résilience, et de tolérance aux pannes.
PROJET «EBAY» V1 MANUEL ROLLAND, SCIA 2009, REMIS LE 7 MARS 2008 1. Rappels sur le projet : Proposition d une architecture pour ebay, en mettant l accent sur les notions de scalabilité, de résilience,
Plus en détailInitiation au HPC - Généralités
Initiation au HPC - Généralités Éric Ramat et Julien Dehos Université du Littoral Côte d Opale M2 Informatique 2 septembre 2015 Éric Ramat et Julien Dehos Initiation au HPC - Généralités 1/49 Plan du cours
Plus en détailGalaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs :
-- 1 -- Galaxy Training days Durée / Programme : 3 journées. Galaxy : First step. Galaxy : Reads alignment and SNP calling. Galaxy : RNAseq alignment and transcripts assemblies. Public : Personnes souhaitant
Plus en détailCLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS?
CLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS? Les offres de Cloud public se sont multipliées et le Cloud privé se généralise. Désormais, toute la question est de savoir
Plus en détailCLOUD PRIVÉ EMC VSPEX Microsoft Windows Server 2012 R2 avec Hyper-V - Jusqu à 1 000 machines virtuelles
CLOUD PRIVÉ EMC VSPEX Microsoft Windows Server 2012 R2 avec Hyper-V - Jusqu à 1 000 machines virtuelles Technologie EMC VNX et EMC Powered Backup EMC VSPEX Résumé Le présent document décrit la solution
Plus en détailCLOUD PRIVÉ EMC VSPEX
Guide d infrastructure EMC Proven CLOUD PRIVÉ EMC VSPEX EMC VSPEX Résumé Le présent document décrit la solution d infrastructure VSPEX EMC Proven destinée aux déploiements de Cloud privé avec VMware vsphere
Plus en détailLe stockage unifié pour réduire les coûts et augmenter l'agilité
Le stockage unifié pour réduire les coûts et augmenter l'agilité Philippe Rolland vspecialist EMEA Herve Oliny vspecialist EMEA Mikael Tissandier vspecialist EMEA Des défis informatiques plus complexes
Plus en détailTechnologie SDS (Software-Defined Storage) de DataCore
Technologie SDS (Software-Defined Storage) de DataCore SANsymphony -V est notre solution phare de virtualisation du stockage, dans sa 10e génération. Déployée sur plus de 10000 sites clients, elle optimise
Plus en détailRetour d expérience RATP. Intégrer le test de performance au cœur du processus de développement agile. Challenges, techniques, résultats.
Retour d expérience RATP Intégrer le test de performance au cœur du processus de développement agile. Challenges, techniques, résultats. Les intervenants Alexis Bourgeois Chef de projet MOE (front web)
Plus en détailEMC VSPEX END-USER COMPUTING
GUIDE DE CONCEPTION EMC VSPEX END-USER COMPUTING VMware Horizon View 6.0 et VMware vsphere Jusqu à 500 bureaux virtuels Technologies EMC VNXe3200 et EMC Data Protection EMC VSPEX Présentation Ce décrit
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailEMC VSPEX FOR VIRTUALIZED MICROSOFT EXCHANGE 2013
GUIDE DE CONCEPTION EMC VSPEX FOR VIRTUALIZED MICROSOFT EXCHANGE 2013 EMC VSPEX Présentation Ce explique comment concevoir une solution Microsoft Exchange Server 2013 dans l infrastructure VSPEX EMC Proven
Plus en détailUTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY
UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier
Plus en détailDES SAUVEGARDES ET DES RESTAURATIONS DE DONNEES SANS CONTRAINTES DE LIEU NI DE TEMPS
POURQUOI CHOISIR ACRONIS BACKUP TO CLOUD? Les volumes de données que votre entreprise doit gérer et les coûts correspondants de sauvegarde et de maintenance augmentent de manière exponentielle. La virtualisation,
Plus en détailINTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE
I N T E RS Y S T E M S INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE David Kaaret InterSystems Corporation INTERSySTEMS CAChé CoMME ALTERNATIvE AUx BASES de données RéSIdENTES
Plus en détailEMC VSPEX FOR VIRTUALIZED ORACLE DATABASE 11g OLTP
GUIDE DE CONCEPTION EMC VSPEX FOR VIRTUALIZED ORACLE DATABASE 11g OLTP EMC VSPEX Résumé Ce explique comment concevoir les ressources des environnements Oracle Database virtualisés sur l infrastructure
Plus en détailComment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet
Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,
Plus en détailGOUVERNANCE DES IDENTITES ET DES ACCES ORIENTEE METIER : IMPORTANCE DE CETTE NOUVELLE APPROCHE
GOUVERNANCE DES IDENTITES ET DES ACCES ORIENTEE METIER : IMPORTANCE DE CETTE NOUVELLE APPROCHE RÉSUMÉ Depuis des années, les responsables de la sécurité de l information et les responsables opérationnels
Plus en détailServeurs et solutions PowerEdge pour les applications métiers
s et solutions PowerEdge pour les applications métiers s et solutions PowerEdge pour les applications métiers Chez Dell, nous sommes tous les jours à votre écoute. Vous nous avez dit que vos infrastructures
Plus en détailOutil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche
Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche Serveurs DELL PowerEdge Tour Rack standard R310 T110II Rack de calcul Lames R815 M610 R410 R910 M620 R415 R510 T620 R620 R720/R720xd
Plus en détailEMC VSPEX FOR VIRTUALIZED MICROSOFT SHAREPOINT 2013
GUIDE DE CONCEPTION EMC VSPEX FOR VIRTUALIZED MICROSOFT SHAREPOINT 2013 EMC VSPEX Résumé Ce explique comment concevoir des ressources Microsoft SharePoint 2013 virtualisées sur l infrastructure VSPEX EMC
Plus en détailFAMILLE EMC VNX. Un stockage unifié nouvelle génération, optimisé pour les applications virtualisées AVANTAGES CLÉS. Gamme VNX
FAMILLE EMC VNX Un stockage unifié nouvelle génération, optimisé pour les applications virtualisées AVANTAGES CLÉS Solution de stockage unifié pour les modes fichier, bloc et objet Puissance de la technologie
Plus en détailFAMILLE EMC RECOVERPOINT
FAMILLE EMC RECOVERPOINT Solution économique de protection des données et de reprise après sinistre en local et à distance Avantages clés Optimiser la protection des données et la reprise après sinistre
Plus en détail<Insert Picture Here> Solaris pour la base de donnés Oracle
Solaris pour la base de donnés Oracle Alain Chéreau Oracle Solution Center Agenda Compilateurs Mémoire pour la SGA Parallélisme RAC Flash Cache Compilateurs
Plus en détailGAMME EMC VMAX3. Plate-forme de services de données d'entreprise pour l'hyperconsolidation et le Cloud hybride critiques AVANTAGES CLÉS PUISSANCE
GAMME EMC VMAX3 Plate-forme de services de données d'entreprise pour l'hyperconsolidation et le Cloud hybride critiques AVANTAGES CLÉS Profitez de performances prévisibles à très grande échelle pour vos
Plus en détailTechnologie de déduplication de Barracuda Backup. Livre blanc
Technologie de déduplication de Barracuda Backup Livre blanc Résumé Les technologies de protection des données jouent un rôle essentiel au sein des entreprises et ce, quelle que soit leur taille. Toutefois,
Plus en détailEMC VNX VG2 GATEWAY. Caractéristiques techniques ARCHITECTURE
EMC VNX VG2 GATEWAY La plate-forme EMC VNX VG2 accroît la valeur des technologies de baie de stockage EMC existantes. Elle fournit une solution complète et consolidée, qui ajoute le stockage NAS à un système
Plus en détailLes plates-formes informatiques intégrées, des builds d infrastructure pour les datacenters de demain
Livre blanc Les plates-formes informatiques intégrées, des builds d infrastructure pour les datacenters de demain Par Mark Bowker, analyste senior, et Perry Laberis, associé de recherche senior Mars 2013
Plus en détailStockage unifié EMC Celerra
FICHE PRODUIT Stockage unifié EMC Celerra Des solutions complètes de stockage unifié avec des fonctions haut de gamme dans toute la famille de produits : NX4, NS-120, NS-480, NS-960 Présentation Grâce
Plus en détailPrésentation de la gamme des PGI/ERP modulaires Wavesoft
Solutions ouvertes pour esprits ouverts Présentation de la gamme des PGI/ERP modulaires Wavesoft Sommaire WaveSoft en quelques chiffres Positionnement des Éditions (Gammes) Standard Professionnelle Entreprise
Plus en détailAtteindre la flexibilité métier grâce au data center agile
Atteindre la flexibilité métier grâce au data center agile Aperçu : Permettre l agilité du data-center La flexibilité métier est votre objectif primordial Dans le monde d aujourd hui, les clients attendent
Plus en détailVérifier la qualité de vos applications logicielle de manière continue
IBM Software Group Vérifier la qualité de vos applications logicielle de manière continue Arnaud Bouzy Kamel Moulaoui 2004 IBM Corporation Agenda Analyse de code Test Fonctionnel Test de Performance Questions
Plus en détailSystème de stockage EMC CLARiiON AX4
FICHE PRODUIT Système de stockage EMC CLARiiON AX4 Simplifier la transition vers le stockage réseau Pour les entreprises qui cherchent une alternative au stockage sur serveur, le système EMC CLARiiON AX4
Plus en détail7 avantages à la virtualisation des applications stratégiques de votre entreprise
7 avantages à la virtualisation des applications stratégiques de votre entreprise Contenu de cet ebook Mise en contexte Avantage 1 : Accélération des mises à niveau grâce au clonage Avantage 2 : Réservation
Plus en détailSauvegarde et restauration EMC Avamar en environnement VMware
Sauvegarde et restauration EMC Avamar en environnement VMware Technologie appliquée Résumé Ce livre blanc décrit les composants des solutions VMware vsphere et VMware View, ainsi que les options disponibles
Plus en détailLa gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailEMC AVAMAR. Logiciel et système de sauvegarde avec déduplication
EMC AVAMAR Logiciel et système de sauvegarde avec déduplication Avantages clés Les données sont dédupliquées à la source (client), avant leur transfert sur le réseau Idéal pour la protection des environnements
Plus en détailProjet d'infrastructure de stockage mutualisée
Projet d'infrastructure de stockage mutualisée (pour la communauté scientifique régionale) - CRRI antoine.mahul@clermont-universite.fr Journée de rencontre du réseau AuDACES - 17 juin 2014 1. Contexte
Plus en détailLe e s tocka k ge g DAS,NAS,SAN
Le stockage DAS,NAS,SAN Sommaire Introduction SAN NAS Conclusion Bibliographie Questions Introduction Besoin de partage de données à travers un réseau Explosion des volumes de données Comment assurer les
Plus en détailIBM Tivoli Monitoring, version 6.1
Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments
Plus en détailBASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM. Livre blanc publié par Oracle Novembre 2007
BASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM Livre blanc publié par Oracle Novembre 2007 BASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM RESUME Oracle 11g Real
Plus en détailImpartition réussie du soutien d entrepôts de données
La force de l engagement MD POINT DE VUE Impartition réussie du soutien d entrepôts de données Adopter une approche globale pour la gestion des TI, accroître la valeur commerciale et réduire le coût des
Plus en détailMise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique
Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes
Plus en détailDescription du produit
Fiche technique Solution de gestion de réseaux locaux sans fil WLM1200 Présentation des produits Au vu de l intérêt croissant pour la mobilité, la gestion des réseaux locaux sans fil (WLAN) revêt une importance
Plus en détailWD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD
WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD Xe, RAFF et StableTrac sont des marques de Western Digital
Plus en détailGènes Diffusion - EPIC 2010
Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses
Plus en détailConcepts et systèmes de stockage
Concepts et systèmes de stockage Francesco Termine, professeur HES, francesco.termine@he-arc.ch 1 Plan Gestion de volumes de stockage Systèmes RAID DAS SAS Concepts Technologies actuelles NAS Concepts
Plus en détailen version SAN ou NAS
tout-en-un en version SAN ou NAS Quand avez-vous besoin de virtualisation? Les opportunités de mettre en place des solutions de virtualisation sont nombreuses, quelque soit la taille de l'entreprise. Parmi
Plus en détailDESKTOP Internal Drive. Guide d installation
DESKTOP Internal Drive Guide d installation Guide d installation du disque dur Seagate Desktop 2013 Seagate Technology LLC. Tous droits réservés. Seagate, Seagate Technology, le logo Wave et FreeAgent
Plus en détailwww.konicaminolta.fr PageScope Suite L accélérateur de workflow * L essentiel de l image
www.konicaminolta.fr PageScope Suite L accélérateur de workflow * L essentiel de l image * PageScope Suite: PageScope Net Care............................................. 4 PageScope Data Administrator.....................................
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailCHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Plus en détailSamsung SmarThru Workflow 3 Un workflow documentaire numérique efficace, pratique et sûr
Samsung SmarThru Workflow 3 Un workflow documentaire numérique efficace, pratique et sûr Un workflow documentaire puissant et automatisé Routage des documents en fonction d un code-barres ou du texte SmarThru
Plus en détailRapports d évaluation professionnels
Rapports d évaluation professionnels Extrayez des informations significatives de vos données immotiques archivées et prenez des décisions opérationnelles les plus appropriées en toute connaissance de cause
Plus en détailDéploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr
Déploiement d une architecture Hadoop pour analyse de flux françois-xavier.andreu@renater.fr 1 plan Introduction Hadoop Présentation Architecture d un cluster HDFS & MapReduce L architecture déployée Les
Plus en détailL unique SAN industriel proposant un stockage multiniveau automatisé (Automated Tiered Storage)
Storage Center Baie de stockage STORAGE CENTER Transcende les limites des systèmes de stockage classiques Les fournisseurs de stockage actuels promettent de réduire le temps et les sommes d argent que
Plus en détailSysFera. Benjamin Depardon
SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation
Plus en détailEMC Forum 2014. EMC ViPR et ECS : présentation des services software-defined
EMC Forum 2014 EMC ViPR et ECS : présentation des services software-defined 1 2 3 4 5 Software is Eating the World Marc Andreessen co-fondateur de Netscape Les entreprises qui utilisent efficacement le
Plus en détailGénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010
GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection
Plus en détailCH.3 SYSTÈMES D'EXPLOITATION
CH.3 SYSTÈMES D'EXPLOITATION 3.1 Un historique 3.2 Une vue générale 3.3 Les principaux aspects Info S4 ch3 1 3.1 Un historique Quatre générations. Préhistoire 1944 1950 ENIAC (1944) militaire : 20000 tubes,
Plus en détailArchitectures d implémentation de Click&DECiDE NSI
Architectures d implémentation de Click&DECiDE NSI de 1 à 300 millions de ligne de log par jour Dans ce document, nous allons étudier les différentes architectures à mettre en place pour Click&DECiDE NSI.
Plus en détailPerformances. Gestion des serveurs (2/2) Clustering. Grid Computing
Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des
Plus en détailÉTAT DES LIEUX DE LA GESTION DE LA SÉCURITÉ ET DU BIG DATA
ÉTAT DES LIEUX DE LA GESTION DE LA SÉCURITÉ ET DU BIG DATA Plan d évolution du Big Data en matière d analyse prédictive de la sécurité AVANTAGES CLÉS Ce livre blanc aborde les points suivants : La complexité
Plus en détailLa nouvelle solution de stockage V3700
IBM Suisse Express Angebote Hiver 2013 La nouvelle solution de stockage V3700 SPECIAL SERVER TRADE-IN Up to CHF 600.- FOR A LIMITED TIME ONLY Offres IBM Express Hiver 2013 2 NOTRE offre d échange de serveurs
Plus en détail