L Institut Français de Bioinformatique : une infrastructure nationale de service en bioinformatique J-F Gibrat UMS IFB-core, CNRS Gif-sur-Yvette 1 re réunion PF AuBi, Clermont-Ferrand, 17 juin 2016
Structure de l IFB Objectif : structurer l ensemble de la communauté française des PF de service en bioinformatique et y associer la communauté recherche en bioinformatique Liens avec la SF et le GdR Bioinformatique Moléculaire Organisation : 36 nœuds/plates-formes organisées en 6 pôles régionaux Un nœud national, IFB-core, chargé d impulser et de coordonner la mise en place de l infrastructure. 420 ingénieurs et chercheurs (290 ETP) 261 permanents (162 ETP) 122 CDD (114 ETP)
Plates-formes de l IFB
Mission de l IFB Mission générale : fournir des ressources de base en bioinformatique à la communauté des sciences de la vie Infrastructure nationale de service en bioinformatique Données : Fournir un accès à des collections de données spécialisées à haute valeur ajoutée issues de l expertise du laboratoire d accueil Outils : Développer et mettre à disposition des outils et services en lignes pour analyser les données correspondant à l expertise scientifique du laboratoire d accueil Appui aux projets scientifiques et hébergement sur une infrastructure informatique Formations Infrastructure : Mettre à disposition une infrastructure informatique dédiée à l analyse des données des sciences du vivant (matériel, données, outils) cf. http://france-bioinformatique.fr
Activités régionales de l IFB Offrent un appui bioinformatique aux projets de leur communauté scientifique locale 148 projets en 2015, dont 83 financés par l ANR, 39 par les programmes européens H2020 et 26 avec des entreprises Offrent des formations 3000 personnes formées en 2015 101 formation professionnelles, 30 formations académiques Mettent à disposition leur infrastructure informatique 15,000 cœurs et 8 Po de stockage sur une douzaine de sites. ~6000 utilisateurs Développent des services (données, outils) pour les sciences de la vie 71 collections de données, 1,460,000 visites uniques 166 outils, 320,000 visites uniques, 15,000 téléchargements Publications : 619 121 PF, 117 avec le lab. hôte, 381 avec des partenaires extérieurs Brevets & dépôt APP : 7
Activités nationales de l IFB Mettre en place une infrastructure distribuée dédiée à la gestion et l analyse des données des sciences du vivant Promouvoir le développement de nouveaux services : développements technologiques (WP bioinformatiques) Assurer l animation scientifique et technologique : Organise les groupes de travail et les groupes de réflexion Apporter un soutien aux workshops, conférences, hackathons, etc. Assurer la dissémination de l expertise et la formation Mettre en œuvre des collaborations avec d autres infrastructures nationales en biologie et santé et internationales (ELIXIR)
Activités nationales de l IFB Mettre en place une infrastructure distribuée dédiée à la gestion et l analyse des données des sciences du vivant Promouvoir le développement de nouveaux services : développements technologiques (WP bioinformatiques) Assurer l animation scientifique et technologique : Organise les groupes de travail et les groupes de réflexion Apporter un soutien aux workshops, conférences, hackathons, etc. Assurer la dissémination de l expertise et la formation Mettre en œuvre des collaborations avec d autres infrastructures nationales en biologie et santé et internationales (ELIXIR)
Infrastructure TCI dédiée Services et outils SaaS PaaS Interfaces utilisateur Outils d analyse : pipelines, workfows Services : API, conteneurs, indexage, Données Données des utilisateurs Collections publiques de données IaaS Infrastructure matérielle : Cloud
Data Fédération nationale de Clouds PRO IMG NGS Life science high-throughput research infrastructures users Bioinformatics platforms NGS PRO IMG NGS Cloud PRO NGS NGS IMG RENATER AAI Cyclone H2020 project
Fédération de Clouds de l IFB Déploiement d une infrastructure TCI distribuée Infrastructures régionales (~15) : 15 000 cœurs et 6 Po de stockage; ~6000 utilisateurs Infrastructure nationale hébergée à l IDRIS : Pilote : 300 cœurs, 100 To de stockage Automne 2016 : 5 000 cœurs, 1Po de stockage Printemps 2017 : 10 000 cœurs, 2 Po de stockage Mutualisation du stockage sur bande avec IDRIS (2 Po) Propriétés du Cloud Accès standard par le réseau Accès en self-service (à la demande) «Élasticité» : les ressources informatiques (stockage, calcul, mémoire, bande passante réseau) sont évolutives Modèle économique basé sur une mesure fine de l utilisation des ressources Mutualisation des ressources
Virtualisation Machines virtuelles 11
Les «images» bioinformatiques Un Cloud fournit des machines virtuelles configurables, par ex. le Cloud commercial d Amazon Images / MV < > Classe / objet Valeur ajoutée de l IFB : fournir des «solutions» bioinformatiques clés en main. Création d «images» dédiées : à un domaine particulier (protéomique, métabolomique, etc.) à un type d analyse particulier (analyse de variants, expression différentielle de gènes, ChIP-seq, etc.) Création d un catalogue d images national (market place)
Images : création de MV dédiées
Data Fédération nationale de Clouds PRO IMG NGS Life science high-throughput research infrastructures users Bioinformatics platforms NGS PRO IMG VM NGS IFB life sciences market place and images repository Cloud PRO NGS NGS IMG RENATER AAI Cyclone H2020 project
Utilisation du Cloud
Une infrastructure TCI pour les sciences de la vie Mise en place d un réseau d infrastructures TCI organisé autour d un gros noeud national. Ce réseau a pour objectif de faciliter le flux de données et d images Intégration de ces infrastructures TCI sous forme d une fédération de Clouds Développement d un portefeuille d images bioinformatiques pouvant être exécutées sur cette fédération de Clouds Développement d une infrastructure informatique HTC complémentaire des infrastructures HPC du GENCI. L accent est mis sur le partage des données, leur intégration et réutilisation. La technologie Cloud est bien adaptée aux infrastructures HTC 16
Activités nationales de l IFB Mettre en place une infrastructure distribuée dédiée à la gestion et l analyse des données des sciences du vivant Promouvoir le développement de nouveaux services : développements technologiques (WP bioinformatiques) Assurer l animation scientifique et technologique : Organise les groupes de travail et les groupes de réflexion Apporter un soutien aux workshops, conférences, hackathons, etc. Assurer la dissémination de l expertise et la formation Mettre en œuvre des collaborations avec d autres infrastructures nationales en biologie et santé et internationales (ELIXIR)
Formation et dissémination de l expertise Formations des PF régionales : 30 formations académiques (1675 étudiants) 101 formations professionnelles (1331 personnes formées) Niveau national : compiler, organiser, traduire, démultiplier l effort des PF en utilisant des technologies «e-learning» Cloud sessions de formation pour utilisateurs (de base, avancée). sessions de formation pour développeurs: Gif, Rennes, Montpellier Ecole chercheur CumuloNumbio 1 semaine (Aussois, June 2015) Augmentation de l utilisation des MV dans les cours de Master (1 en 2014, 4 en 2015) 4 e école de bioinformatique IFB-AVIESAN (2015): BYOD GT Galaxy Réunion annuelle Galaxy day (utilisateurs & développeurs) Ecole pour les développeurs : Galaxy4Bioinformatics (1 semaine) Roscoff 11/2014, Nantes 03/2015, Toulouse 11/2015 En 2016, organisation de la formation Galaxy4Bioinformatics ELIXIR En 2017, organisation de la Galaxy Community Conference à Montpellier Hackathons RAD-seq et métagenomique
Feuille de route 2016 Cellule E-infrastructure Déployer la 1 re tranche de l infrastructure nationale informatique (5000 cœurs, 1Po de stockage) Initier la fédération de Clouds Cellule CFV Compiler et structurer les formations des PF régionales. Explorer l utilisation des technologies de e-learning. IFB-core Augmenter le portefeuille «d images» bioinformatiques Renforcer la coordination en matière de développements technologiques Mutualiser les développements (toolshed Galaxy, dépôt BioShaDock, réutiliser les images) Organiser des hackathons et des formations pour les développeurs
Merci pour votre attention Questions?
Nœud national : IFB-core UMS: CNRS, INRA, INSERM, INRIA, CEA Cellule Communication, Formation et Valorisation Cellule E-infrastructure 3.5 postes permanents (mobilité)
CoPil IFB Définit et supervise la politique scientifique et technologique de l IFB Se réunit tous les 15 jours (51 visioconférences). Composition du CoPil: Directeur de l IFB : J-F Gibrat, INRA / C. Blanchet, CNRS Directeur de l IDRIS : D. Girou, CNRS / R. Medeiros, CNRS Directeur de France Génomique : P. Le Ber, CEA Représentants des 6 centres régionaux : IFB-NE: M. Pupin, Lille 1 U. / J. Thompson, CNRS IFB-SO: M. Nikolski, CNRS / C. Gaspin, INRA IFB-GO: O. Collin, CNRS / A. Bihoué, Nantes U. IFB-GS: V. Lefort, CNRS / J-F Dufayard, CIRAD PRA: G. Perrière, CNRS / P. Veber, CNRS APLIO: P. Tuffery, INSERM + I Moszer, IHU-ICM / D. Gautheret, Paris-sud U.
Comité scientifique international (SAB) Membres : Pr Christine Orengo (University College London) Pr Amos Bairoch (SIB & University of Geneva) Pr Soren Brunak (Technical University of Denmark) Pr Anton Nekrutenko (Penn State University) Pr Lodewyk Wessels (Netherland Cancer Institute) Première réunion 10 février 2016