http://galaxy-workbench.toulouse.inra.fr



Documents pareils
Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

ESPACE COLLABORATIF SHAREPOINT

Guide pour le bon fonctionnement des applications académiques avec Internet Explorer 7.x

Les logiciels gratuits en ligne

UltraBackup NetStation 4. Guide de démarrage rapide

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Accès externe aux ressources du serveur pédagogique

GUIDE D INSTALLATION INTERNET haute vitesse

Installation d un manuel numérique 2.0

AOLbox. Partage de disque dur Guide d utilisation. Partage de disque dur Guide d utilisation 1

Lancez le setup, après une phase de décompression, la fenêtre d installation des prérequis apparaît, il faut les installer :

Sommaire 1 CONFIGURER SA MESSAGERIE 2 2 CONSULTER VOS MAILS SUR INTERNET (WEBMAIL) 7 3 PROBLEMES POSSIBLES 8

Guide de l utilisateur Communauté virtuelle de pratique en gestion intégrée des risques

Volet de visualisation

Connecteur Zimbra pour Outlook 2007 et 2010 (ZCO) w

Pour les caméras IP de modèles : QSTC201 QSTC211. Surveillance à distance via Internet Guide de démarrage

PORTAIL INTERNET DECLARATIF. Configuration du client Mail de MICROSOFT VISTA

a) Supprimer les bases de données installées dans la version 6.03

Afin d accéder à votre messagerie personnelle, vous devez vous identifier par votre adresse mail et votre mot de passe :

ESPACE NUMERIQUE DE TRAVAIL DU LYCEE LYAUTEY LCS SE3

ApiCrypt - Réception des résultats de biologie

Guide d utilisation de «Partages Privés»

PLAN MULTIMEDIA DANS LES ECOLES UN ESPACE DE STOCKAGE NUMERIQUE (NAS) DANS VOTRE ECOLE. Sommaire

PARTAGER UN ANNUAIRE COLLECTIF DE SIGNETS AVEC DEL.ICIO.US

Manuel d installation et d utilisation du logiciel GigaRunner

INTERCONNEXION ENT / BCDI / E - SIDOC

Manuel d utilisation du web mail Zimbra 7.1

Rapports d activités et financiers par Internet. Manuel Utilisateur

Atelier Le gestionnaire de fichier

SOMMAIRE ÉTAPES OBLIGATOIRES. Récupérer le connecteur... 3

sommaire ÉTAPES OBLIGATOIRES Récupérer le connecteur... 3

GUIDE MEMBRE ESPACE COLLABORATIF. Février 2012

Installation d'un Active Directory et DNS sous Windows Server 2008

PROCÉDURE D AIDE AU PARAMÉTRAGE

Installation / Sauvegarde Restauration / Mise à jour

Créer et partager des fichiers

Documentation Honolulu 14 (1)

GESTION DE L'ORDINATEUR

MISE A JOUR : 04 FEVRIER 2011 PROCÉDURE D INSTALLATION. Cegid Business COMMENT INSTALLER CEGID BUSINESS V9 SOUS WINDOWS XP, VISTA ET 7

Utilisation d une tablette numérique

Edition de sites Jahia 6.6

Service de Virtualisation de la DSI UJF

TUTORIAL ULTRAVNC (EDITION 2)

Création d un formulaire de contact Procédure

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Guide de configuration. Logiciel de courriel

L adresse électronique professionnelle : Mode d emploi

Procédure pas à pas de découverte de l offre. Service Cloud Cloudwatt

Manuel d utilisation du site web de l ONRN

INTERCONNEXION ENT / BCDI / E - SIDOC

Principales Evolutions Version

POVERELLO KASONGO Lucien SIO 2, SISR SITUATION PROFESSIONNELLE OCS INVENTORY NG ET GLPI

Publication sur serveur distant

Installation et utilisation du client FirstClass 11

SQL Server Installation Center et SQL Server Management Studio

Sécurisation de Windows NT 4.0. et Windows 2000

Manuel d utilisation de Gestion 6

Un serveur FTP personnel, ça ne vous a jamais dit?

PARAMETRER INTERNET EXPLORER 9

Cyberclasse L'interface web pas à pas

IFT287 Exploitation de base de données relationnelles et orientées objet. Laboratoire Mon premier programme Java en Eclipse

Manuel d utilisation Mailchimp

Configuration sous Microsoft Outlook

VTX FTP. Transfert de fichiers business par FTP - Manuel de l'utilisateur. Informations complémentaires : info@vtx.

Préparation à l installation d Active Directory

Placez vous au préalable à l endroit voulu dans l arborescence avant de cliquer sur l icône Nouveau Répertoire

WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/ bits, Windows 2008 R2 et Windows bits

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

Itium XP. Guide Utilisateur

OCLOUD BACKUP GUIDE DE REFERENCE POUR ANDROID

Pré-requis de création de bureaux AppliDis VDI

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

LECON 2 : PROPRIETES DE L'AFFICHAGE Version aout 2011

Archivage de courriels avec Outlook ( )

Guide de l utilisateur du Centre de gestion des licences en volume LICENCES EN VOLUME MICROSOFT

PARAMETRER LA MESSAGERIE SOUS THUNDERBIRD

Guide pour la configuration d adresse

Apps Sage : les 10 étapes pour publier vos données dans le Cloud.

Crédit Agricole en ligne

DIASER Pôle Assistance Rectorat

Créer un site Web : mode d emploi Sous SPIP, avec le squelette «établissement» de l académie de Versailles

Maarch V1.4

Comment utiliser mon compte alumni?

MANUEL D INSTALLATION Sous WINDOWS

Accès distant Freebox v6 Configuration

MESSAGERIE BUREAU AGENDA VIRTUEL. Votre nouvelle messagerie COLLABORATIVE GUIDE PRATIQUE. Membre de

ENVOI EN NOMBRE DE MESSAGES AUDIO

Disque Dur Internet «Découverte» Guide d utilisation du service

SOMMAIRE. Comment se connecter?

Guide Utilisateur MANTIS. Sommaire. Objet du document :

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

SAUVEGARDER SES DONNEES PERSONNELLES

EXTRANET STUDENT. Qu'est ce que Claroline?

E.N.T. Espace Numérique de Travail

Manuel. Administration P.CONSEIL. 12 avril Statut :

SPECIFICATIONS TECHNIQUES : Gestion des Médicaments et des commandes de médicaments

SOMMAIRE. 1. Connexion à la messagerie Zimbra Pré-requis Ecran de connexion à la messagerie 4

Mes documents Sauvegardés

Transcription:

-- 1 --

Vos traitements bioinformatiques avec GALAXY Maria Bernard Laurent Cauquil - Sarah Maman Ibouniyamine Nabihoudine 5 Février 2014 DOKEOS http://galaxy-workbench.toulouse.inra.fr -- 2 --

Galaxy pour vos traitements (bio)informatiques Présentation de la plateforme BioInfo Genotoul Vidéo disponible sur «sig-learning» Présentation de la plateforme Galaxy. Comment récupérer vos données? Notions d outils, d historique et de workflow. Lancement de traitements bioinformatiques. Guide pour les utilisateurs Galaxy. -- 3 --

Galaxy pour vos traitements (bio)informatiques Vidéo disponible sur «sig-learning» -- 4 --

Galaxy Project Equipe Galaxy project : Le Center for Comparative Genomics and rmatics - Penn State, Des départements Biology et Mathematics and Computer Science de l Université d Emory. Anton Nekrutenko Penn State Nate Coraor Penn State James Taylor Emory -- 5 --

Groupe de travail GALAXY IFB http://www.ifb-galaxy.org/ Documentation collaborative (wiki) Formations (mise en commun agenda PF) Architecture Intégration d outils (Tool Shed) -- 6 --

Une «Galaxy» parmi tant d autres Serveur public (https://main.g2.bx.psu.edu/ ): Gratuit et open source. Quota limité : pour se familier à l outil sur des petits jeux de donneés. Données non protégées Une communauté nationnale et internationnale très active : Listes de diffusion (US, FR) Wiki Twitter "Galaxy tour de France" L instance locale Sigenae de Galaxy : Maintenue par Sigenae. Intégration des outils et scripts locaux. Présentation des particuliarités de l instance Sigenae. -- 7 --

Galaxy «la bioinformatique pour tous» Les biologistes peuvent : sont protégées (accès LDAP). Lancer des traitements sans Linux, ni programmation, ni qsub. Dupliquer et partager des analyses complètes. Lancer plusieurs traitements en parallèle. Partir, fermer Internet Puis voir ses résultats le lendemain matin. Et ceci de manière très intuitive! Les bioinformaticiens peuvent : Faire ajouter des outils / WF. Partager des outils (Tool Shed). Partager des traitements. Galaxy devient VOTRE BOITE A OUTILS. -- 8 --

Comment fonctionne Galaxy? Galaxy est installée sur une machine virtuelle qui envoie les calculs à un cluster. Utilisateur de Galaxy Récupération des résultats Envoi de données Serveur Web Galaxy Envoi les jobs Gère la file d'attente Gestionnaire de tâches Cluster de calculs Exécute -- 9 --

Comment ouvrir un compte sur Genotoul? Formulaire de demande de compte: http://bioinfo.genotoul.fr! Utiliser un mail académique -- 10 --

Analyse en quelques clics sans utiliser votre disque dur! -- 11 --

Analyse en quelques clics sans utiliser votre disque dur! -- 12 --

Analyse en quelques clics sans utiliser votre disque dur! -- 13 --

Analyse en quelques clics sans utiliser votre disque dur! -- 14 --

Interface simplifiée Interface divisée en 4 parties : 1 - Liste des outils disponibles. 2 - Visualisation de l outil utilisé, historique, dataset ou workflow. 3 - ou workflow détaillé. 4 - Menu. 4 -- 15 --

Le vocabulaire spécifique à Galaxy TOOL : Outil bioinformatique ou de traitement de fichiers. DATASET : Fichier de données téléchargé dans Galaxy (fichier entrant) ou fichier généré par Galaxy (fichier résultat). HISTORY : Liste des datasets (entrants et résultants) générés par les tools. WORKFLOW : Schématisation des traitements. TOOL DATASET (S) HISTORY WORKFLOW -- 16 --

Principaux onglets ANALYSE DATA : Page d accueil de Galaxy. WORFLOW : Liste des workflows. SHARED DATA : Liste des datasets, historiques et workflows partagés. VISUALIZATION : Outil de visualisation de vos fichiers résultats. USER : Accès à vos historiques et datasets sauvegardés. -- 17 --

2 méthodes de téléchargement de vos données privées Solution 1 (recommandée si vos fichiers sont dans Genotoul) : «Upload local file from filesystem path». Solution 2 : «Upload file from your computer, with a copy on server». L espace disque utilisé n est pas celui de votre PC. Vos traitements ne sont pas limités par la capacité de votre PC. -- 18 --

Téléchargement de données publiques Données ENA,UCSC, Ensembl, NG6, BIOMART : Récupérer les données avec Upload File et pas avec le lien «Galaxy» -- 19 --

Votre auto-formation continue en ligne avec «sig-learning» -- 20 --

Votre accès à sig-learning 1 Taper l adresse de «sig-learning» : http://sig-learning.toulouse.inra.fr/ 2 Authentification Vos formations 3 Accès à la liste des formations auxquelles l utilisateur s est inscrit. -- 21 --

Comment s inscrire à des formations? Il vous est possible de vous inscrire directement en ligne à une formation : «Trainings» «Trainings management» puis «Subscribe to training» : Vos formations L inscription s effectue via une recherche de la formation par mots clés. Voici donc la liste des formations : -- 22 --

Page d accueil de votre formation Outre une introduction et un carrousel permettant d accéder aux principaux chapitres de la formation, la page d accueil de la formation donne accès : Vos formations TRAINING PLAN : Parcours pédagogique avec les supports en ligne. FORUM TESTS LINKS : Support de communication entre stagiaires / formateurs. : Tests et exercices. : Liens utiles. -- 23 --

Exercice 1 : Connexion à Galaxy, exploration de l interface, téléchargement de datasets -- 24 --

Gestion de vos historiques Conserver toutes les étapes de vos analyses. Partager vos analyses. A chaque run d un outil, un nouveau dataset est créé. Les données ne sont pas écrasées. Répéter, autant de fois que nécessaire, une analyse. -- 25 --

s sauvegardés, publiés et partagés L ensemble de vos historiques sont automatiquement sauvegardés. Vos historiques publiés sont accessibles à l ensemble des utilisateurs loggés sur Galaxy (Shared Data / Published Histories). Les historiques partagés sont accessibles uniquement à un utilisateur spécifique (Hitory / Option / Histories Shared With Me). Pour partager ou publier un historique : User / Saved histories / Cliquer sur le nom de l historique / Share ou Publish -- 26 --

Liste des historiques et exécution de mes jobs Analyse OK Analyse en attente Analyse en erreur Analyse en cours -- 27 --

Créer un workflow Depuis une page blanche, vous pouvez concevoir un workflow. Aide : les résultats produits sont typés, il n est donc pas possible de brancher une dataset sur un mauvais tool! -- 28 --

Exporter votre historique en workflow. Depuis votre fenêtre «History», vous pouvez extraire un workflow. -- 29 --

Outils de traitement de fichiers Ces outils sont nombreux et constituent une bonne alternative à la ligne de commande. Les traitements sont automatiquement lancés sur Genotoul (qsub). Voici les principaux outils «non bioinfo» proposés : Join (des fichiers lourds), Substract and Group Text Manipulation Filter and sort Convert Formats -- 30 --

Outils bioinformatiques Mapper un FASTQ sur une référence avec BWA. http://www.genomenewsnetwork.org/ Visualiser la qualité des données avec FASTQC Report. Visualiser un génome avec UCSC. -- 31 --

FAQ et formation en ligne Une FAQ et le lien vers «sig-learning» sont disponibles depuis la page d accueil. Vos supports sont disponibles depuis : http://sig-learning.toulouse.inra.fr How to be a good user? : Maîtrise de son quota Organisation de son espace de travail Contact: sigenae-support@listes.inra.fr -- 32 --

Comment gérer son compte? Suppression des datasets, historiques et workflows inutiles. Suppression temporaire / Suppression permanente -- 33 --

Comment citer Galaxy dans vos publications? Pour vos publications, citer: Les outils utilisés (nom, version). Le workflow généré. Les références «Galaxy project». -- 34 --

En conclusion GALAXY Simplicité d'utilisation (sans Linux) pour lancer des calculs sur le cluster. Gérer les résultats et traitements d une ou plusieurs analyses. Partage de vos datasets, historiques et workflows (intra et inter Galaxy). Présentation schématique de vos traitements grâce aux workflows. Possibilité d ajout de nouveaux outils selon vos besoins. (*Outil Sigenae avec ligne commande) -- 35 --

Exercice 2 : Utilisation d outils de traitements (bio-)informatiques. Création et partage d historiques et de workflows. -- 36 --

Merci pour votre écoute -- 37 --

Trop de datasets dans votre workflow? Si tout est coché, alors tout se passe comme si rien est coché. Si le dataset n'est pas coché, alors qu'au moins un autre est coché, alors le dataset non coché ne sera pas visible dans l'historique. Sauf si l'utilisateur choisi d'afficher les fichiers cachés, alors, dans cette config uniquement, il pourra le voir. Si un 2ieme (ou plus) dataset est coché, alors il sera visible dans l'historique après analyse. -- 38 --