Titre court (maximum 20 caractères) : Galaxy4Bioinformatics Pièce 1 TITRE COMPLET DE L'ECOLE (en majuscule) : «Développement et intégration d applications sous Galaxy» Adresse du site web de l école thématique : http:// Responsable Scientifique principal : Nom Prénom Qualité Caron Christophe IR Code et intitulé du Adresse Laboratoire FR2424 Place Georges Plateforme Teissier ABiMS 29680 Station Biologique Roscoff de Roscoff Téléphone Fax Adresse électronique 0607835477 chistophe.caron@sb -roscoff.fr Délégation organisatrice : DR17 Conseiller formation en charge de l école : Gwenaël BERTHE Lieu : Roscoff Date de début :19/05/2014(à confirmer) Date de fin: 22/05/2014 Durée : 4 jours S agit-il d une école récurrente? oui non Si oui, Code de l école de la session précédente : Titre de la session précédente : Date de la session précédente : Nombre total de participants prévus : 18 Nombre de participants CNRS prévus : 9 Nombre de participants non CNRS (travaillant dans unité CNRS) : 3 Budget global prévu : 20, 150 Budget demandé au CNRS (hors avance sur recettes) : 14, 650 Avances sur recettes demandées : 1,800 Institut(s) Scientifique(s) concerné(s) : INEE, INSB, INSMI Proposition des sections du Comité National les plus pertinentes pour examen du projet :
NB : Le Comité de sélection des Ecoles thématiques choisira les sections qui évalueront le projet. Attention les sections du Comité National ont été modifiées en janvier 2012. SITUATION SCIENTIFIQUE : L'apparition des «big-data» génère des conséquences non-négligeables sur les métiers de la bioinformatique moderne. Traiter des données haut-débit mobilise de nouvelles infrastructures et de nouveau paradigmes. Les compétences des bio- informaticiens développeurs doivent suivre mais aussi anticiper ces changements. Au sein de la communauté bio-informatique cette révolution est clairement illustrée par un déluge des données (-omiques, imagerie, etc.). La communauté des bio-informaticiens doit être en mesure d'appréhender ces nouvelles technologies. Elle se doit de proposer de nouvelles façons de mener les analyses (e.g. NGS) en développant une expertise autour du domaine (intégration de nouveaux outils, etc.) et en mobilisant de nouvelles compétences. Ceci est d autant plus vrai dans le cadre de la conception de workflows, où s enchaînent de nombreuses étapes et traitements, dans un contexte d infrastructure distribuée. L environnement Galaxy, notamment dédié aux activités de bio-analyse, connaît un succès croissant au sein des communautés bio-informatiques et biologistes. Ce succès se justifie, notamment, par les solutions que cet environnement propose aux problèmes de traitement sur les données NGS. Le groupe de travail «Galaxy IFB», soutenu par l Institut Français de Bio-informatique propose de partager ce savoir-faire (schémas organisationnels, méthodes d intégration, bonnes pratiques de développement, etc.) au travers de ce projet d école. Ce groupe est composé de représentants des plateformes de bio-informatique et anime des actions de réflexion autour de la plateforme Galaxy. Cette opération de formation s inscrit en complément des actions de formations pour les biologistes/bio-analystes menées par l AVISEAN, et s intègre dans la continuité de l action d animation Galaxy menée par l Institut Français de Bio-informatique. CONSÉQUENCES ATTENDUES : Le premier objectif est de former des ingénieurs en charge d intégrer des outils ou des développements internes sous Galaxy. Le second objectif est clairement de renforcer la structuration d une communauté émergente autour de cet environnement dédié aux workflows pour l analyse de données à haut-débit. Les résultats attendus concernent ces deux principaux objectifs. Concernant le premier axe, les résultats attendus sont de disposer d un premier cercle de bioinformaticiens capables d intégrer des développements internes aux unités/plateformes tels que des méthodes bio-informatique novatrices ou des prototypes sous Galaxy. Ces intégrations pourraient favoriser la valorisation de ces développements en facilitant leur dissémination. En parallèle, il est attendu de pouvoir multiplier l offre de service grâce à la montée en compétences dans le domaine de la conception de workflows. Dans un cadre plus stratégique, et fédératif, une des conséquences attendue sera également de fédérer une communauté en pleine émergence. Cette structuration devrait favoriser la mise en place de nouvelles actions, notamment dans le cadre des Infrastructures de Recherche (IFB, METABOHUB, EMBRC-France, France Génomique) et des projets soutenus par l AVIESAN.
GRANDS AXES DU PROGRAMME : L école s articulera autour de 4 axes principaux : - Présentation des initiatives actuelles au niveau national et international ; - Présentation des concepts des workflows et de l architecture Galaxy ; - Ateliers sur les bonnes pratiques de développements et d intégration ; - Atelier Toolshed ; - Ateliers implémentations de plus haut-niveau (interopérabilité, API, web services, etc.). MODALITES PEDAGOGIQUES : Des sessions magistrales (architecture générale de Galaxy, présentation du modèle d'intégration d'outils, etc.) alterneront avec des ateliers (utilisation de l API, etc.). La dernière demi-journée sera réservée à un travail plus personnel des stagiaires sur un sujet de leur choix, soumis au préalable au comité scientifique. L école s attachera à proposer un cursus graduel qui abordera à la fois les concepts mais aussi leur mise en œuvre. Un temps sera réservé aux échanges entre les différents intervenants. L école sera animée à la fois par des membres du groupe de travail Galaxy de l IFB, et des intervenants externes. Les différentes présentations pédagogiques alimenteront un site de E-Learning, afin notamment, de pouvoir être rejouées par les participants. En fonction des retours sur cette première édition, l école pourrait à nouveau être proposée en tant qu école thématique, et en lien étroit avec d autres structures comme l IFB. MOTS CLES : ( jusqu à dix en majuscules ) (Permet la recherche sur internet par un seul mot) Workflow, bio-informatique, Galaxy, e-science, intégration d outils, NGS, bonnes pratiques Avis de la Délégation sur l organisation :
DESCRIPTION DU PROJET (en français) Titre Court (max 20 caractères) Galaxy4Bioinformatics Pièce 2 Titre complet de l école (en majuscules) : «Développement et intégration d applications sous Galaxy» THEME : Comité Scientifique : chargé d'élaborer ce projet (thèmes, objectifs, conséquences attendues public ciblé, sélection des candidatures) CARON Christophe (CNRS / ABiMS) DUFAYARD Jean François (CIRAD / SouthGreen) GIACOMONI Franck (INRA / METABOHUB) GRANGE Thierry (CNRS / ITMO GGB) INIZAN Olivier (INRA / URGI) LERMINE Alban (INSERM / Institut Curie) MAMAN Sarah (INRA / SIGENAE) MICHEL Gurvan (CNRS / UMR 7139) SAMSON Franck (INRA / MIG) Comité d'organisation : chargé d'assurer la mise en oeuvre du projet (programme, choix des conférenciers, intervenants et animateurs, organisation pédagogique, choix des modalités pratiques) ANDRES Gwendoline (CNRS / ABiMS) CARON Christophe (CNRS / ABiMS) CARRE Wilfrid (CNRS / ABiMS) CORMIER Alexandre (UPMC / UMR 7139) CORRE Erwan (CNRS / ABiMS) DANTEC Christelle (CNRS / Centre de Recherche en Biochimie Macromoléculaire) DRU Philippe (CNRS / EMBRC-France) DEROZIER Sandra (INRA / MIG) DUFAYARD Jean François (CIRAD / SouthGreen) GIACOMONI Franck (INRA / METABOHUB) INIZAN Olivier (INRA / URGI) LE CORGUILLE Gildas (UPMC / ABiMS)
LERMINE Alban (INSERM / Institut Curie) MAMAN Sarah (INRA Toulouse / SIGENAE) PERICARD Pierre (CNRS / ABiMS) SAMSON Franck Samson (INRA / MIG) Pièce 1 SITUATION SCIENTIFIQUE ET OBJECTIFS : Les enjeux : Justification de l'intérêt du thème et des objectifs de l'ecole sur le plan de la recherche : L'apparition des «big-data» a des conséquences non-négligeables sur les métiers de la bioinformatique moderne. Traiter des données haut-débit mobilise de nouvelles infrastructures et de nouveaux paradigmes. Les compétences des bio-informaticiens développeurs doivent suivre mais aussi anticiper ces changements. Au sein de la communauté bio-informatique, cette révolution est clairement illustrée par un déluge des données (-omiques, imagerie, etc.). La communauté des bio-informaticiens doit être en mesure d'appréhender ces nouvelles technologies. Elle se doit de proposer de nouvelles façons de conduire les analyses (e.g. NGS) en développant une expertise autour du domaine (intégration de nouveaux outils, etc.) et en mobilisant de nouvelles compétences. Ceci est d autant plus vrai dans le cadre de la conception de workflows, où s enchaînent de nombreuses étapes et traitements, dans un contexte d infrastructures distribuées. L environnement Galaxy, notamment dédié aux activités de bio-analyses, connaît un succès croissant au sein des communautés bio-informatiques et biologistes. Ce succès se justifie, notamment, par les solutions proposées par cet environnement aux problèmes de traitement des données «NGS». Le groupe de travail «Galaxy IFB», soutenu par l Institut Français de Bio-informatique propose de partager ce savoir-faire (schémas organisationnels, méthodes d intégration, bonnes pratiques de développement, etc ) au travers de ce projet d école. Ce groupe est composé de représentants des plateformes de bio-informatique et anime des actions de réflexion autour de la plateforme Galaxy. Cette opération de formation s inscrit en complément des actions de formations pour les biologistes/bio-analystes menées par l AVISEAN, et s intègre dans la continuité de l action d animation Galaxy menée par l Institut Français de Bio-informatique. Objectifs de formation : Ce projet a pour premier objectif de former des ingénieurs bio-informaticiens à ce nouvel environnement qu est Galaxy. Il a pour deuxième objectif de favoriser la fédération des communautés, et d apporter une pierre à la structuration de la bio-informatique au niveau national. - Justification du choix du "dispositif école" Ce type de dispositif permet des interactions étroites entre les intervenants et les participants, mais aussi entre les différents participants en dehors des sessions. L aspect communautaire des «développements Galaxy» ne fait que renforcer l intérêt de partage au travers d une école in situ.
Public concerné : Pièce 1 Le public concerné correspond aux corps des ingénieurs (développeurs d applications, bioinformaticiens) des plateformes et des laboratoires, qui pourront également à leur tour contribuer à la dynamique de la communauté Galaxy. Ces ingénieurs sont aujourd hui les principaux acteurs dans le processus de mise à disposition de la plateforme Galaxy dans les laboratoires, ou dans le cadre de projets d infrastructures nationaux (IFB, EMBRC-France, METABOHUB). La motivation et l intérêt de ce type de public ont été éprouvés durant l école AVIESAN (Analyse NGS à haut-débit) de janvier 2013. Cette école avait pour public les biologistes et les bio-analystes tout en utilisant Galaxy comme support pédagogique. Plusieurs ingénieurs bio-informaticiens de laboratoires dont provenaient les participants (biologistes/bio-analystes) ont ensuite pris des contacts afin de disposer de conseils sur le déploiement et l intégration de l environnement Galaxy dans leurs laboratoires. Par le dépôt de ce dossier pour 2014, nous avons la volonté de répondre de manière plus structuré à ce type de demandes. Pré-requis : Il est demandé aux participants de disposer des prérequis suivants - Maîtrise de l environnement Linux ; - Connaissance d un langage de script : Python, PERL, etc. - Bonnes notions autour des syntaxes des langages XML, HTML, etc. - Compréhension de concepts autour des technologies WEB ; - Notions dans les processus d installation d outils pour la bio-informatique. Un rappel des principes d architecture de la Plateforme Galaxy sera effectuée au début du cours, et ne constitue pas un prérequis. CONSEQUENCES ATTENDUES : Le premier objectif est de former des ingénieurs en charge d intégrer des outils ou des développements internes sous Galaxy. Le second objectif est clairement de renforcer la structuration d une communauté émergente autour de cet environnement dédié aux workflows pour l analyse de données à haut-débit. Concernant le premier axe, les résultats attendus sont de disposer d un premier cercle de bioinformaticiens capables d intégrer des développements internes aux unités/plateformes tels que des méthodes bio-informatiques novatrices ou des prototypes sous Galaxy. Ces intégrations pourraient favoriser la valorisation de ces développements en facilitant leur dissémination. En parallèle, il est attendu de pouvoir multiplier l offre de service grâce à la montée en compétences dans le domaine de la conception de workflows. Dans un cadre plus stratégique, et fédérateur, une des conséquences attendue sera également de structurer une communauté en pleine émergence. Cette organisation devrait favoriser la mise en place de nouvelles actions, notamment dans le cadre des Infrastructures de Recherche (IFB, METABOHUB, EMBRC-France, France Génomique) et des projets soutenus par l AVIESAN. GRANDS AXES DU PROGRAMME :
L école s articulera autour de 4 axes principaux : - Présentation des initiatives actuelles au niveau national et international ; - Présentation des concepts de workflows et de l architecture Galaxy ; - Ateliers sur les bonnes pratiques de développements et d intégration d outils ; - Atelier «Toolshed» ou entrepôt d outils Galaxy ; - Ateliers pour développeurs experts (interopérabilité, API, web services, etc.). MODALITES PEDAGOGIQUES et ASPECTS INNOVANTS : Des sessions magistrales (architecture générale de Galaxy, présentation du modèle d'intégration d'outils, etc.) alterneront avec des ateliers pratiques (utilisation de l API, etc.). La dernière demijournée sera réservée à un travail plus personnel des stagiaires sur un sujet de leur choix, soumis au préalable au comité scientifique. L école s attachera à proposer un cursus graduel qui abordera à la fois les concepts mais aussi leurs mises en œuvre. Plusieurs créneaux seront réservés aux échanges libres entre les différents intervenants. L école sera animée à la fois par des membres du groupe de travail Galaxy de l IFB, et des intervenants externes. Les différentes présentations pédagogiques alimenteront un site de E-Learning, afin notamment, de pouvoir être rejouées par les participants. En fonction des retours sur cette première édition, l école pourrait à nouveau être proposée en tant qu école thématique, et en lien étroit avec d autres structures comme l IFB. Dans le cas où le projet est suffisamment avancé : module Intervenants (nom et qualité) Forme (conférence, cours, atelier, TD,TP...) PROCEDURE D'EVALUATION : Un questionnaire d évaluation sera proposé à l ensemble des participants, et analysé par le comité scientifique à la suite de l école. Les résultats permettront d identifier, entre autres, l intérêt de reconduire ce type d école. PARTICIPANTS :
- Participants rémunérés par le CNRS (y compris BDI) : 10 - Participants non rémunérés par le CNRS travaillant dans une unité CNRS : 5 - Participants extérieurs (précisez l organisme d appartenance): 3 - Nombre total de participants prévus: 18 MODALITES PRATIQUES : - justification du choix du lieu: La Station Biologique de Roscoff dispose de toute l infrastructure nécessaire à l accueil de groupe : salles de conférence, salle de TP informatique et structure pour l hébergement. Par ailleurs, la plateforme ABiMS a déjà participé à des actions de ce type sur le site de Roscoff (ITMO/AVIESAN janvier/novembre 2013, GRISBI 2010). - calendrier des réunions préparatoires - Des points mensuels sont organisés en visioconférence - Une réunion du groupe Galaxy est organisée en présentiel le 17 juin pour notamment évoquer le projet, mais aussi d autres actions d animations (Conférence Galaxy Oslo 2013, JOBIM Toulouse 2013, etc.) - Une réunion de finalisation du programme est prévue fin novembre si la soumission devait être acceptée - communication (annonces, plaquettes, affiches,...) - Conception d une plaquette - Mise en place d un site WEB - Communication via les listes de diffusion : bioinfo@sfbi.fr, etc.