Forma&on à la prise en main du service galaxy.prabi.fr Vincent Navra,l Dominique Guyot Chris,ne Oger Jean- François Taly Clothilde Deschamps Amandine Fournier 10/03/2015
Plan de la forma&on 14h- 14h30: Tour de table 14h30-15h: Présenta,on générale Pause café 15h15-16h45: Tutoriel Analyse Qualité 16h45-17h: Conclusion Ques,ons diverses remise d un ques,onnaire
Présenta&on générale du service galaxy.prabi.fr Vincent Navra,l, Dominique Guyot Prise en main du service galaxy.prabi.fr 10/03/2015
Galaxy 4
hup://galaxyproject.org Galaxy
Choix de l instance Galaxy hup://main.g2.bx.psu.edu/ [Serveur principal] hup://test.g2.bx.psu.edu/ [Serveur test] hup://wiki.g2.bx.psu.edu/public Galaxy Servers [Liste de Serveurs] 6
Un tour d horizon tools form/results/visualis2on history/task menu Trackster visualisa2on workflow
Trackster NGS analyses by visualisa/on with Trackster Goecks et al. Nature Biotechnology 2012 8
IGV - Integrated Genome Viewer hup://www.broadins,tute.org/igv/ hup://www.broadins,tute.org/so^ware/igv/alignmentdata
Galaxy Support hup://wiki.galaxyproject.org/support 10
Galaxy Biostar 11
Galaxy ToolShed hup://wiki.galaxyproject.org/tool%20shed 3063 Ou,ls (Mar. 2015) + 1000 (Oct. 2012) 12
Galaxy DevNews hup://wiki.galaxyproject.org/devnewsbriefs 13
Bilan galaxy@prabi Bilan 2010-2014: Un excellent ou&l pour la forma&on à l analyse de données NGS : RNA- seq + Chip- seq + de 10 forma&ons (intra + inter), 1 interna,onale (EMBNEt) environ 150 biologistes formés! prise de contact avec le réseau na,onal IFB- Galaxy et IFB- core intégré au Galaxy Training Network (contact Dave Clements) hups://wiki.galaxyproject.org/teach/gtn
Développement de wrappers galaxy Valorisa,on, transfert technologique et forma,on Ou,ls bioinforma,ques : développés au PRABI : priam_search (java) (D. Kahn, LBBE) B. Radisson (Stage, DUT Aurillac 2012) hup://priam.prabi.fr kissplice (C++) (V. Lacroix, A. Julien, C. Marchet LBBE) hup://kissplice.prabi.fr parablast (D. Guyot) autres (RNASeqpower) Galaxy4bioinforma&cs training 2014 (D. Guyot, C. Oger)
Materiel DELL PowerEdge R920: 4x Intel Xeon E7-4850 2,3Ghz, 24M Cache, 12 cores, hyperthreading. Bus QPI 7,2GT/s. 512GB RAM (32 x 16GB RDIMM 1600MHz). 15 x 1,2 TB SAS 10K + 2 x 146 GB SAS 15K.
SoJware, system. Environnement Virtuel (kvm)
SoJware, system. Galaxy ne fonc,onne pas en mode mul,thread (~ CPU) U,lisa,on d un load- balancer hup:
Beaucoup de Mémoire? Personal Computer ~ 8GB. galaxy.prabi.fr : 512GB (64 x more). Mais galaxy.prabi.fr possède 96 coeurs de calcul. 512 / 96 ~ 5GB / cores. Limita,on pour certaines applica,ons Assemblage: Abyss, Soap2novo, Velvet, Trinity... Gros Alignements Mul,ples: Clustal, Muscle, Mas... U,lisa,on raisonnée
Espace Disque 1,2TB x 15 = 15TB (redondance). Données galaxy: 100 GBs. Index de génomes, banques blast Données d entrée : Plusieurs GBs/échan,llon. 2-100 replicas. Données intermédiaires (trinity ) risque de dépassement de capacité Le système de fichier a besoin d espace libre Pour des gros projets contactez les admin <galaxy- support> communiquez sur la liste <galaxy- user>
Galaxy hardware monitoring Suivi de l u,lisa,on des ressources (ganglia)
Mode de fonc2onnement (1) Accès à la machine de produc&on U,lisateurs: Non- enregistrés (anonymes) u,lisa,on d ou,ls Quotas: 10 Mo, 4 jobs, 10 Mo job output Enregistrés u,lisa,on d ou,ls Quotas: 5 Go, 4 jobs, 10 Mo job output Enregistrés (FR Bioenvis, LECA) u,lisa,on d ou,ls, tests, pe,te produc,on Quotas: 256Go, 8 jobs, 50 Go job output
Créa2on d un compte u2lisateur User > Register
Valida2on des quotas «adhérents» S enregistrer à la liste sympa galaxy- user Pour: sympa@listes.univ- lyon1.fr Sujet: subscribe galaxy- user@listes.univ- lyon1.fr
Mode de fonc2onnement (2) Bonnes pra&ques Lecture de la Charte U,lisateur Abonnement à la liste de diffusion <galaxy- user> Lecture de la documenta,on Monitoring des ressources (RAM, # CPU, Espace disque) ménage, usage raisonné (nombre d échan,llon, volumétrie), sauveguarde données d entrée/sor,e
Mode de fonc2onnement (3) Purge fréquente du système (1 fois par an) Conseil des U&lisateur (remonté des besoins, référent technique)
Le support technique Un pe,t guide u,lisateur (bonnes pra,ques): hup://www.prabi.fr/redmine/projects/galaxy- user/wiki Liste de diffusion u,lisateurs (u,lisa,on d ou,ls, informa,ons): galaxy- user@listes.univ- lyon1.fr Obligatoire pour obtenir les quotas «adhérent» Charte u,lisateurs «Valida&on tacite» par l u&lisa&on du service Une forma,on «prise en main» annuelle possibilité d un cycle de forma,on (théma,que/ou,ls ) Demande spécifique au support technique: galaxy- support@listes.univ- lyon1.fr Transmis par le référent technique de votre laboratoire Demande de conseil à l «atelier» du jeudi après- midi du PRABI
Groupe de travail galaxy@prabi Un noyau d administrateurs systèmes/bioinforma2ciens: Stéphane DelmoUe, Bruno Spataro, Dominique Guyot, Vincent Navra,l Une extension à des béta- testeurs première réunion du groupe de travail Octobre 2014 Une 20ène (LBBE, LECA, PRABI) Intégra,on d ou,ls locaux (SexDetector (G. Marais), kissplice ( V. Lacroix) Remontée des besoins (ou,ls, génomes de ref. ) Testée avec succès sur la forma,on prabi (10 u,lisateurs) Anima,on d un groupe de travail transversal (2 fois par an) 3 axes: admins, développeurs, u,lisateurs ouvert à tous (contact avec LOL, IRT Bioaster ) retour d expérience anima,on de forma,ons à l u,lisa,on de galaxy - ou,ls théma,ques (FRBioenvis, LECA), pe,ts ateliers pra,ques par&cipa&f et collabora&f
Conclusion Pour les u&lisateurs biologistes Un ou,ls très auendu qui va rendre service (ou,ls standards RNA- seq, Chip- seq) MAIS qui va demander quand même une certaine autonomie u,lisa,on des listes galaxy, des forums spécialisés, de la documenta,on qui va peut être créer un sen,ment d insa,sfac,on car malheureusement galaxy ne résoudra pas tout Pour la plateforme et les bioinforma&ciens un ou,ls d échange, de communica,on, pour la forma,on et l enseignement (?) autour de la bioinforma,que et l analyse de données omiques (NGS) Nous souhaitons pour les biologistes, une transi&on nécessaire: vers les ou,ls en ligne de commande, la programma,on indispensables pour des projets plus conséquents et/ou moins «clique bouton» réflexion autour de la mise en place d un cycle de forma,on ini,a,on (galaxy) / perfec,onnement (ligne de commande)?
Remerciements prabi- amsb/ladoua Stéphane DelmoUe, CNRS Dominique Guyot, UCBL Bruno Spataro, CNRS Guy Perrière, CNRS Chris,ne Oger, UCBL Philippe Veber, CNRS Clothilde Deschamps, UCBL- Ezus Rémi Planel, UCBL Amandine Fournier, CNRS Other PRABI members Groupe NGS members LECA J.P. David, CNRS F. Faucon, Doctorant IFB- core Christophe Blanchet, CNRS