Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC



Documents pareils
UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

MABioVis. Bio-informatique et la

La gestion des identités au CNRS Le projet Janus

Eco-système calcul et données

JOSY. Paris - 4 février 2010

Qu'est-ce que c'est??

Linux Expo Gestion des Identités et des Accès. Le 16 mars Arismore

Gènes Diffusion - EPIC 2010

Introduction. aux architectures web. de Single Sign-On

CAHIER DES CHARGES D IMPLANTATION

Lancez le setup, après une phase de décompression, la fenêtre d installation des prérequis apparaît, il faut les installer :

Groupe Eyrolles, 2004 ISBN :

SÉCURITÉ POUR LES ENTREPRISES UN MONDE NUAGEUX ET MOBILE. Sophia-Antipolis 01/07/2013 Cyril Grosjean

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

Description de la maquette fonctionnelle. Nombre de pages :

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Mineure Architectures Orientées Services SOA Business Process Modeling (BPM) Mineure SOA. Business Process Modeling (BPM)

W4 - Workflow La base des applications agiles

Joomla! Création et administration d'un site web - Version numérique

Programme de formation

AVANT PROPOS. Merci d avoir choisi WATCHDOC!

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

4. SERVICES WEB REST 46

JOURNÉE TECHNIQUE BNPE 27 JANVIER 2015 LES COULISSES DE LA BNPE

Cédric Ouvry Bibliothèque nationale de France Liberty Alliance Deployment Workshop Paris December 7, 2005

Hébergement de site web Damien Nouvel

REAUMUR-ACO-PRES. Wifi : Point et perspectives

GUIDE D'INSTALLATION DU SYSTEME DE GESTION DE BASES DE DONNEES MYSQL POUR LE PGI EBP

Tour d horizon des différents SSO disponibles

LemonLDAP::NG / SAML2. Xavier GUIMARD (Gendarmerie Nationale) Clément OUDOT (Groupe LINAGORA)

Formats 3D Critères d utilisation dans les échanges Frédéric CHAMBOLLE PSA Peugeot Citroën Direction des Systèmes d Information

Single Sign-On open source avec CAS (Central Authentication Service)

Architecture Orientée Service, JSON et API REST

Business Process Modeling (BPM)

Installation de SQL Server Reporting Services avec l intégration dans un site Windows SharePoint Services V3

Compte-rendu de fin de projet

Gestion d identités PSL Exploitation IdP Authentic

Plan. Présentation du logiciel Sympa Architecture La gestion des hôtes virtuels Listes avec inclusion des abonnés Les modules d authentification

ENVOLE 1.5. Calendrier Envole

Single Sign On. Nicolas Dewaele. Single Sign On. Page 1. et Web SSO

Module d anonymisation

Prise en compte des ressources dans les composants logiciels parallèles

Installation de la plate-forme Liberacces 2.0 «Intégrale» avec LiberInstall

Guide Share France. Web Single Sign On. Panorama des solutions SSO

Conception d'un système d'information WEB avec UML Par Ass SERGE KIKOBYA

Machine virtuelle W4M- Galaxy : Guide d'installation

Outils Logiciels Libres

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Plan de formation : Certification OCA Oracle 11g. Les administrateurs de base de données (DBA) Oracle gèrent les systèmes informatiques

TrustedBird, un client de messagerie de confiance

POVERELLO KASONGO Lucien SIO 2, SISR SITUATION PROFESSIONNELLE OCS INVENTORY NG ET GLPI

Licence professionnelle Réseaux et Sécurité Projets tutorés

Possibilités offertes après la L2?

Chapitre 01 Généralités

EJBCA PKI. Yannick Quenec'hdu Reponsable BU sécurité

SOLUTIONS DE SECURITE DU DOCUMENT DES SOLUTIONS EPROUVEES POUR UNE SECURITE SANS FAILLE DE VOTRE SYSTEME MULTIFONCTIONS SHARP DOCUMENT SOLUTIONS

Fiche Technique Windows Azure

A. Architecture du serveur Tomcat 6

Single Sign-On open source avec CAS (Central Authentication Service) Vincent Mathieu Pascal Aubry Julien Marchal

Définition. Caractéristiques. - Du partage des ressources : espace de stockage, imprimantes, lignes de communication.

Modèle de cahier des charges pour un appel d offres relatif à une solution de gestion des processus métier (BPM)

Utiliser Améliorer Prêcher. Introduction à LDAP

WebSSO, synchronisation et contrôle des accès via LDAP

Vérifier la qualité de vos applications logicielle de manière continue

Java et les bases de données: JDBC: Java DataBase Connectivity SQLJ: Embedded SQL in Java. Michel Bonjour

Vulnérabilités et sécurisation des applications Web

Installation de SCCM 2012 (v2)

Un exemple d'authentification sécurisée utilisant les outils du Web : CAS. P-F. Bonnefoi

Tuto 2 : Configuration Virtual box, Configuration et installation du serveur XiBO

<Insert Picture Here>ApExposé. Cédric MYLLE 05 Février Exposé Système et Réseaux : ApEx, Application Express d Oracle

C est quoi le SWAT? Les équipes décrites par James Martin s appellent SWAT : Skilled With Advanced Tools.

Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui

Guide utilisateur pour le déblocage de cartes et/ou la modification d un code PIN

Explications sur l évolution de la maquette. Version : 1.0 Nombre de pages : 9. Projet cplm-admin

Architectures n-tiers Intergiciels à objets et services web

Un serveur d'archivage

Gestion d'un parc informatique avec OCS INVENTORY et GLPI

Introduction au Génie Logiciel

Connexions à un projet CVS via Eclipse en accès local et distant. 15 Mai 2007

Ce tutoriel ne fera pas de vous un expert sur le déploiement via WDS, mais il vous permettra de comprendre un peu les rouages de ce système.

Quel ENT pour Paris 5?

Vulgarisation Java EE Java EE, c est quoi?

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Présentation, mise en place, et administration d'ocs Inventory et de GLPI

EMME : un environnement de gestion des métadonnées expérimentales

Gestion des Identités : 5 règles d'or. Patrice Kiotsekian Directeur Evidian France

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

OpenVPN Manager. Projet M2-ESECURE - Robin BUREL. Date 10 Janvier 2013 Tuteur : M. Richard

SysFera. Benjamin Depardon

Remplacement du système de contrôle d accès de l Enssat

Nouvelles Plateformes Technologiques

Bases de données et interfaces Génie logiciel

Introduction à LDAP et à Active Directory Étude de cas... 37

Installation et Administration de SolidWorks Electrical CadWare Systems

Transcription:

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr

CATI BBRIC 35 bioinformaticiens 15 unités 10 sites Domaines d applications Modèles d intérêt Plantes Bactéries Insectes Nématodes Champignons Oomycetes Virus Assemblage (genomes/transcriptomes) Annotation structurale des génomes (gènes codants pour des protéines / ncrna) Annotation fonctionnelle (genomes/transcriptomes) Analyse de l expression (RNAseq, puces) Détection et analyse du polymorphisme Metagenomique Epigénomique Modélisation des réseaux métaboliques et de régulation. Gestion de collections (bactéries, insectes, etc.) Systématique: identification des espèces de groupes d espèces d intérêt Phylogénie, évolution Génomique des populations

Architecture bioinformatique BBRIC 4 composants interopérables données accessibles via internet DONNEES BBRIC Data Archive(s) doi http ldap ou public ANALYSES BBRIC Pipelines/Bioinformatics Toolkit BBRIC reference data repository RESULTATS BBRIC Workspace Mise à jour manuelle par un bioinfo upload en ligne de commande

Architecture bioinformatique BBRIC 4 composants interopérables données accessibles via internet DONNEES BBRIC Data Archive(s) doi http ldap ou public ANALYSES BBRIC Pipelines/Bioinformatics Toolkit BBRIC reference data repository RESULTATS BBRIC Workspace Mise à jour manuelle par un bioinfo upload en ligne de commande

Galaxy @ BBRIC S adapter au réseau Des instances au plus proche des données @Rennes Accès contrôlé annuaire LDAP @Toulouse Accès contrôlé Fédération Education Recherche (Shibboleth) @Ailleurs? Un toolshed pour partager les outils Un système pour maintenir les données de référence

Galaxy @ BBRIC Pré-requis avant un passage en production Utilisation de fichiers compressés fastq.gz Interopérabilité avec les instances d Archive Les utilisateurs doivent pouvoir analyser leurs données Interopérabilité avec les instances Workspace Les utilisateurs doivent pouvoir être autonomes dans le postprocessing des résultats intermédiaires

Utilisation de fichiers compressés De nombreux outils le permettent, pourquoi s en priver? Pourquoi Galaxy décompresse automatiquement? Extension des datatypes datatypes_conf.xml lib/galaxy/datatypes/data.py Modification du code de l upload tools/data_source/upload.py Modification des fiches des outils pour ajout du nouveau type accepté

Interopérabilité avec Archive Qu est-ce que l Archive? Un système de conservation des données brutes générique sans limite de taille de fichier Un système ouvert accès programmatique (API, client) conversion vers les formats standards (SRA, GEO pour les séquences) publication des données/métadonnées (DOI, lien permanent) Un accès sécurisé et authentifié droits d accès par fichier authentification par la fédération Education Recherche Un outil accessible aux producteurs de données (les biologistes) interface web (consultation, gestion) moteur de recherche

Interopérabilité avec Archive

Interopérabilité avec Archive

Interopérabilité avec Archive

Interopérabilité avec Archive

Interopérabilité avec Workspace

Interopérabilité avec Workspace

Interopérabilité avec Workspace

Interopérabilité avec Workspace

Atelier 29-30/10/2013 Quinzaine de bioinformaticiens du CATI BBRIC 1/3 connaissait les aspects techniques de Galaxy Etape 1: déployer un outil simple dans Galaxy from scratch Démystifier Galaxy Etape 2: utiliser Appli.pm Se faciliter la vie Etape 3: Déployer un outil complexe (pipeline) Se rendre utile

Atelier 29-30/10/2013 Etape 1: déployer un outil simple dans Galaxy from scratch Predotar, tmhmm, signalphmm Bilan des difficultés rencontrées Gestion dynamique des formats de sortie Paramètres conditionnels Itérateurs / collection Sélection des datatypes Gestion des paths Débogage Mais tout le monde peut y arriver et tout le monde y est arrivé!

Atelier 29-30/10/2013 Etape 2: Appli.pm Qu est-ce? Un module Perl de la «lipmutils» permettant de décrire un programme. Développé pour déployer des services Mobyle & BioMOBY étendu à Galaxy Pourquoi faire? décrire une et une seule fois son programme générer autant d usage que d outils (CLI, Mobyle, Galaxy, JSON, next?) Sous quelles contraintes? Perl Connaitre les datatypes des interfaces (mobyle biomoby galaxy GetOptLong EDAM)

Atelier 29-30/10/2013 Etape 2: Appli.pm Quel cas d'utilisation? un programme à ajouter dans Galaxy ce programme a une interface en ligne de commande j'écris un wrapper Perl utilisant Appli pour générer son usage Galaxy Résultat Permet d obtenir rapidement un outil fonctionnel Permet de générer facilement une trame du XML Galaxy Gère les collections, mais pas les paramètres conditionnels

Atelier 29-30/10/2013 Etape3: Déployer un outil complexe (pipeline) EuGène-P Pipeline d annotation de génomes procaryotes Intègre des données de similarité (Blastx) Intègre des données de transcriptomique (RNA-seq) Intègre des résultats de prédicteurs ab-initio (Prodigal, trnascan-se, ) Le wrapper devait prendre en entrée X banques de RNA-seq, un génome nu générer l environnement (fichiers de conf, arborescence pour l exécution du pipeline produire un fichier d annotation au format GFF3 OK pour la majorité des binômes, quelque soit le langage et la méthode utilisée

Bilan de l atelier + Montée en compétence commune + Prise en main de l outil - Crash des handlers En cause: l écriture de caractères spéciaux sur stderr! - Difficultés logs Comment trouver les commandes exécutées? ~ Les types de données, les ontologies ~ Nécessité de redémarrer régulièrement Problèmes de cache

Bonnes pratiques Toolshed Partager les outils Appli.pm (ou autre?) Si demain, l outil à la mode n est plus Galaxy Déployer des outils de haut niveau Utilisables Utiles Fichiers compressés Obligatoire dans un environnement de production

Merci