L Institut Français de Bioinformatique : une infrastructure nationale de service en bioinformatique

Documents pareils
Infrastructure de calcul du CRRI

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Big data et sciences du Vivant L'exemple du séquençage haut débit

e-infrastructures pour la Génomique et la Biologie à Grande Echelle

Cloud Computing : quels intérêts et quelles solutions pour les développeurs?

Tutoriel Cloud IFB - Initiation -

Réunion des DU de Biogenouest 19 mars 2014

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Les mésocentres HPC àportée de clic des utilisateurs industriels

Les Clouds de production : Panorama pour les sciences de la vie. Jérôme PANSANEL <jerome.pansanel@iphc.cnrs.fr> Directeur technique France Grilles

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Eco-système calcul et données

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud

: l IDRIS a vingt ans!

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Service Cloud Recherche

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN

La fédération des infrastructures cloud

Contrat d accompagnement de projet

HÉBERGEMENT CLOUD & SERVICES MANAGÉS

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

Hébergement MMI SEMESTRE 4

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Emergence du Big Data Exemple : Linked Open Data

Priorités d investissement IT pour [Source: Gartner, 2013]

Projet d'infrastructure de stockage mutualisée

OBJECTIFS. Une démarche E-science

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

Présentation de l Université Numérique de Paris Île-de-France

PLATE- FORME MUTUALISEE DE SERVICES DIFFERENCIES POUR USAGES D ETABLISSEMENTS D ENSEIGNEMENT SUPERIEUR ET DE RECHERCHE ET APPLICATIONS METIER

Mise en œuvre de la virtualisation à l IGBMC. Guillaume Seith Remy Fritz

Chapitre 4: Introduction au Cloud computing

BUREAU VIRTUEL. Utilisation de l application sur ipad. Guide utilisateur. Sciences Po Utilisation du bureau virtuel sur ipad 1 / 6

Système de Stockage Sécurisé et Distribué

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

Ecole Mohammadia d Ingénieurs Systèmes Répartis Pr. Slimane Bah, ing. PhD G. Informatique Semaine 24

Communauté d Universités et Établissements. Stratégie Territoriale et Initiative d Excellence. Université Côte d Azur (UCA) - page 1

23/01/2015. Les nouvelles structures (IHU et autres) Les petites dernières : les CRC. STRUCTURES de RECHERCHE CLINIQUE RECONNUES

Service de Messagerie Enseignement et Recherche

EXALOGIC ELASTIC CLOUD MANAGEMENT

Emergence du Big Data Exemple : Linked Open Data

Stratégie Microsoft pour les opérateurs de services. Marc Gardette Directeur Stratégie Cloud Microsoft France

Soutien pour la formation à la recherche translationnelle en cancérologie

Des systèmes d information partagés pour des parcours de santé performants en Ile-de-France.

Master 2. Mention : «Ecosciences, Microbiologie» Domaine : Sciences Technologies Santé Responsable : F. Menu

ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE

Du Datacenter au Cloud Quels challenges? Quelles solutions? Christophe Dubos Architecte Microsoft

Accompagnement sur mesure ou solution vpack pré-packagée

Portage d applications sur le Cloud IaaS Portage d application

SysFera. Benjamin Depardon

Test de performance en intégration continue dans un cloud de type PaaS

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

+ = OpenStack Presentation. Raphaël Ferreira - enovance. Credits : Thanks to the OpenStack Guys 1

Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau

VMware Infrastructure The New Computing Platform. Stéphane CROIX Systems Engineer

Evolution des SI à l heure du Cloud

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

Cycle Innovation & Connaissance 12 petit déjeuner Mardi 15 mai Cloud Computing & Green IT : nuages ou éclaircies?

Calcul intensif pour la biologie

L accès aux Clouds (Académiques)

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Guillaume PHILIPPON. Mise en place d un cloud privé et publique

StratusLab : Le projet et sa distribution cloud

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

LES APPROCHES CONCRÈTES POUR LE DÉPLOIEMENT D INFRASTRUCTURES CLOUD AVEC HDS & VMWARE

Solution de Mobilité SAP SUP & AFARIA. Meltz Jérôme

Transformation vers le Cloud. Premier partenaire Cloud Builder certifié IBM, HP et VMware

Les environnements de calcul distribué

Tests de SlipStream sur les plateformes et : vers la. Vers la fédération du Cloud computing

Le groupe et l actionnariat 10 M 30 M 2. Editique, GED, Archivage. Intégration, Infogérance, Développement

Matrice snapshot Jacquelin Charbonnel ANF RNBM - Marseille, 23 mai 2013

Mise en œuvre d une infrastructure de virtualisation au CNRGV

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)

Automatiser le Software-Defined Data Center avec vcloud Automation Center

IN2P3 et PLUME Valorisation de la production de logiciels

Valorisez vos actifs logiciels avec Rational Asset Manager. Jean-Michel Athané, Certified IT Specialist IBM Rational Software

ez Publish Cloud Edition Présentation

COMMENT BOOSTER LA PERFORMANCE DE VOTRE ENTREPRISE? QUELLES SOLUTIONS ERP A L ERE DU NUMERIQUE? JEN 9 & 10 AVRIL 2015

Entrez dans l ère du Numérique Très Haut Débit

Marie Curie Actions Marie Curie Career Integration Grant (CIG) Call: FP7-People-2012-CIG

Exposé de Pérennisation Comission de la Recherche 26 juin 2014

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

ANNE DAMAIS MAGUIRE. du magistère à la création d entreprise

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

Galaxy4Bioinformatics Développement et intégration d application sous Galaxy

SQL Server 2012 et SQL Server 2014

Moderniser vos postes de travail grâce à VMware

Fonctions. Solution professionnelle pour le stockage de données, la synchronisation multi- plateformes et la collaboration

Faisons de la recherche notre force

BOUYGUES TELECOM ENTREPRISES - CLOUD

Présentation DAN DSI le 12 mai 2015 DNE A1 Département du développement et de la diffusion des

Transcription:

L Institut Français de Bioinformatique : une infrastructure nationale de service en bioinformatique J-F Gibrat UMS IFB-core, CNRS Gif-sur-Yvette 1 re réunion PF AuBi, Clermont-Ferrand, 17 juin 2016

Structure de l IFB Objectif : structurer l ensemble de la communauté française des PF de service en bioinformatique et y associer la communauté recherche en bioinformatique Liens avec la SF et le GdR Bioinformatique Moléculaire Organisation : 36 nœuds/plates-formes organisées en 6 pôles régionaux Un nœud national, IFB-core, chargé d impulser et de coordonner la mise en place de l infrastructure. 420 ingénieurs et chercheurs (290 ETP) 261 permanents (162 ETP) 122 CDD (114 ETP)

Plates-formes de l IFB

Mission de l IFB Mission générale : fournir des ressources de base en bioinformatique à la communauté des sciences de la vie Infrastructure nationale de service en bioinformatique Données : Fournir un accès à des collections de données spécialisées à haute valeur ajoutée issues de l expertise du laboratoire d accueil Outils : Développer et mettre à disposition des outils et services en lignes pour analyser les données correspondant à l expertise scientifique du laboratoire d accueil Appui aux projets scientifiques et hébergement sur une infrastructure informatique Formations Infrastructure : Mettre à disposition une infrastructure informatique dédiée à l analyse des données des sciences du vivant (matériel, données, outils) cf. http://france-bioinformatique.fr

Activités régionales de l IFB Offrent un appui bioinformatique aux projets de leur communauté scientifique locale 148 projets en 2015, dont 83 financés par l ANR, 39 par les programmes européens H2020 et 26 avec des entreprises Offrent des formations 3000 personnes formées en 2015 101 formation professionnelles, 30 formations académiques Mettent à disposition leur infrastructure informatique 15,000 cœurs et 8 Po de stockage sur une douzaine de sites. ~6000 utilisateurs Développent des services (données, outils) pour les sciences de la vie 71 collections de données, 1,460,000 visites uniques 166 outils, 320,000 visites uniques, 15,000 téléchargements Publications : 619 121 PF, 117 avec le lab. hôte, 381 avec des partenaires extérieurs Brevets & dépôt APP : 7

Activités nationales de l IFB Mettre en place une infrastructure distribuée dédiée à la gestion et l analyse des données des sciences du vivant Promouvoir le développement de nouveaux services : développements technologiques (WP bioinformatiques) Assurer l animation scientifique et technologique : Organise les groupes de travail et les groupes de réflexion Apporter un soutien aux workshops, conférences, hackathons, etc. Assurer la dissémination de l expertise et la formation Mettre en œuvre des collaborations avec d autres infrastructures nationales en biologie et santé et internationales (ELIXIR)

Activités nationales de l IFB Mettre en place une infrastructure distribuée dédiée à la gestion et l analyse des données des sciences du vivant Promouvoir le développement de nouveaux services : développements technologiques (WP bioinformatiques) Assurer l animation scientifique et technologique : Organise les groupes de travail et les groupes de réflexion Apporter un soutien aux workshops, conférences, hackathons, etc. Assurer la dissémination de l expertise et la formation Mettre en œuvre des collaborations avec d autres infrastructures nationales en biologie et santé et internationales (ELIXIR)

Infrastructure TCI dédiée Services et outils SaaS PaaS Interfaces utilisateur Outils d analyse : pipelines, workfows Services : API, conteneurs, indexage, Données Données des utilisateurs Collections publiques de données IaaS Infrastructure matérielle : Cloud

Data Fédération nationale de Clouds PRO IMG NGS Life science high-throughput research infrastructures users Bioinformatics platforms NGS PRO IMG NGS Cloud PRO NGS NGS IMG RENATER AAI Cyclone H2020 project

Fédération de Clouds de l IFB Déploiement d une infrastructure TCI distribuée Infrastructures régionales (~15) : 15 000 cœurs et 6 Po de stockage; ~6000 utilisateurs Infrastructure nationale hébergée à l IDRIS : Pilote : 300 cœurs, 100 To de stockage Automne 2016 : 5 000 cœurs, 1Po de stockage Printemps 2017 : 10 000 cœurs, 2 Po de stockage Mutualisation du stockage sur bande avec IDRIS (2 Po) Propriétés du Cloud Accès standard par le réseau Accès en self-service (à la demande) «Élasticité» : les ressources informatiques (stockage, calcul, mémoire, bande passante réseau) sont évolutives Modèle économique basé sur une mesure fine de l utilisation des ressources Mutualisation des ressources

Virtualisation Machines virtuelles 11

Les «images» bioinformatiques Un Cloud fournit des machines virtuelles configurables, par ex. le Cloud commercial d Amazon Images / MV < > Classe / objet Valeur ajoutée de l IFB : fournir des «solutions» bioinformatiques clés en main. Création d «images» dédiées : à un domaine particulier (protéomique, métabolomique, etc.) à un type d analyse particulier (analyse de variants, expression différentielle de gènes, ChIP-seq, etc.) Création d un catalogue d images national (market place)

Images : création de MV dédiées

Data Fédération nationale de Clouds PRO IMG NGS Life science high-throughput research infrastructures users Bioinformatics platforms NGS PRO IMG VM NGS IFB life sciences market place and images repository Cloud PRO NGS NGS IMG RENATER AAI Cyclone H2020 project

Utilisation du Cloud

Une infrastructure TCI pour les sciences de la vie Mise en place d un réseau d infrastructures TCI organisé autour d un gros noeud national. Ce réseau a pour objectif de faciliter le flux de données et d images Intégration de ces infrastructures TCI sous forme d une fédération de Clouds Développement d un portefeuille d images bioinformatiques pouvant être exécutées sur cette fédération de Clouds Développement d une infrastructure informatique HTC complémentaire des infrastructures HPC du GENCI. L accent est mis sur le partage des données, leur intégration et réutilisation. La technologie Cloud est bien adaptée aux infrastructures HTC 16

Activités nationales de l IFB Mettre en place une infrastructure distribuée dédiée à la gestion et l analyse des données des sciences du vivant Promouvoir le développement de nouveaux services : développements technologiques (WP bioinformatiques) Assurer l animation scientifique et technologique : Organise les groupes de travail et les groupes de réflexion Apporter un soutien aux workshops, conférences, hackathons, etc. Assurer la dissémination de l expertise et la formation Mettre en œuvre des collaborations avec d autres infrastructures nationales en biologie et santé et internationales (ELIXIR)

Formation et dissémination de l expertise Formations des PF régionales : 30 formations académiques (1675 étudiants) 101 formations professionnelles (1331 personnes formées) Niveau national : compiler, organiser, traduire, démultiplier l effort des PF en utilisant des technologies «e-learning» Cloud sessions de formation pour utilisateurs (de base, avancée). sessions de formation pour développeurs: Gif, Rennes, Montpellier Ecole chercheur CumuloNumbio 1 semaine (Aussois, June 2015) Augmentation de l utilisation des MV dans les cours de Master (1 en 2014, 4 en 2015) 4 e école de bioinformatique IFB-AVIESAN (2015): BYOD GT Galaxy Réunion annuelle Galaxy day (utilisateurs & développeurs) Ecole pour les développeurs : Galaxy4Bioinformatics (1 semaine) Roscoff 11/2014, Nantes 03/2015, Toulouse 11/2015 En 2016, organisation de la formation Galaxy4Bioinformatics ELIXIR En 2017, organisation de la Galaxy Community Conference à Montpellier Hackathons RAD-seq et métagenomique

Feuille de route 2016 Cellule E-infrastructure Déployer la 1 re tranche de l infrastructure nationale informatique (5000 cœurs, 1Po de stockage) Initier la fédération de Clouds Cellule CFV Compiler et structurer les formations des PF régionales. Explorer l utilisation des technologies de e-learning. IFB-core Augmenter le portefeuille «d images» bioinformatiques Renforcer la coordination en matière de développements technologiques Mutualiser les développements (toolshed Galaxy, dépôt BioShaDock, réutiliser les images) Organiser des hackathons et des formations pour les développeurs

Merci pour votre attention Questions?

Nœud national : IFB-core UMS: CNRS, INRA, INSERM, INRIA, CEA Cellule Communication, Formation et Valorisation Cellule E-infrastructure 3.5 postes permanents (mobilité)

CoPil IFB Définit et supervise la politique scientifique et technologique de l IFB Se réunit tous les 15 jours (51 visioconférences). Composition du CoPil: Directeur de l IFB : J-F Gibrat, INRA / C. Blanchet, CNRS Directeur de l IDRIS : D. Girou, CNRS / R. Medeiros, CNRS Directeur de France Génomique : P. Le Ber, CEA Représentants des 6 centres régionaux : IFB-NE: M. Pupin, Lille 1 U. / J. Thompson, CNRS IFB-SO: M. Nikolski, CNRS / C. Gaspin, INRA IFB-GO: O. Collin, CNRS / A. Bihoué, Nantes U. IFB-GS: V. Lefort, CNRS / J-F Dufayard, CIRAD PRA: G. Perrière, CNRS / P. Veber, CNRS APLIO: P. Tuffery, INSERM + I Moszer, IHU-ICM / D. Gautheret, Paris-sud U.

Comité scientifique international (SAB) Membres : Pr Christine Orengo (University College London) Pr Amos Bairoch (SIB & University of Geneva) Pr Soren Brunak (Technical University of Denmark) Pr Anton Nekrutenko (Penn State University) Pr Lodewyk Wessels (Netherland Cancer Institute) Première réunion 10 février 2016