TP Initiation à Galaxy. Fonctionnalités de base de Galaxy

Documents pareils
Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

BIRT (Business Intelligence and Reporting Tools)

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Tutoriel de formation SurveyMonkey

Your Detecting Connection. Manuel de l utilisateur. support@xchange2.net

MODE D EMPLOI DU MODULE D E-COMMERCE

Thunderbird est facilement téléchargeable depuis le site officiel

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Commencer avec Allplan Exchange. Nemetschek Allplan Systems GmbH, Munich. All rights reserved. Enregistrement

1 Démarrage de Marionnet

Utiliser le site SoundCloud.com

Groupe Eyrolles, 2003, ISBN : X

Créer vos données sources avec OpenOffice, adieu Excel

Formation. Module WEB 4.1. Support de cours

IP Remote Controller

Tutoriel : utilisation de l outil de veille TaDaweb

Tutoriel D utilisation. Du PGI Open line d EBP

Installation et utilisation de Cobian Backup 8

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

Cliquez sur le site que vous souhaitez consulter, il s affichera directement dans le navigateur.

Logiciel : GLPI Version : SYNCRHONISATION DE GLPI AVEC ACTIVE DIRECTORY. Auteur : Claude SANTERO Config. : Windows 2003.

Travaux pratiques. DECOUVERTE PDMLink - PTC

NOTICE TELESERVICES : Demander un état hypothécaire

Configuration du serveur web embarqué

Utilisation de XnView

GUIDE D UTILISATION DU BROWSER DE BEYOND 20/20

Alfresco Guide Utilisateur

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

CREATION D UNE EVALUATION AVEC JADE par Patrick RUER (

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

Initiation à LabView : Les exemples d applications :

Utilisation de l outil lié à MBKSTR 9

HYPERDRIVE iusbport Guide d utilisation

«Petit guide d utilisation Prezi» par Marc Nolet

sommaire Archives... Archiver votre messagerie... Les notes... Les règles de messagerie... Les calendriers partagés Les listes de diffusions...

Installation et configuration du serveur syslog sur Synology DSM 4.0

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Access 2010 Entraînement 1 Garage Renault Dossier 24 MCD

Guide de développement de «WorkFLows» avec SharePoint Designer 2013

SAP Lumira Version du document : Guide de l'utilisateur de SAP Lumira

Notice de fonctionnement DVR H Méthode de Visionnage ESEENET

OUTIL DE CRYPTAGE ET DE COMPRESSION

MANUEL UTILISATEUR SOPISAFE V 3.5

Guide d utilisation commandes des pièces de rechange Rev.1.0.3

Guide SQL Server 2008 pour HYSAS

ESPACE COLLABORATIF SHAREPOINT

Les Différents types de Requêtes dans Access

Tutoriel. Votre site web en 30 minutes

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont

HighPush. document /06/2009 Révision pour version /11/2008 Revision pour la /10/2008 Documentation initiale.

Le logiciel de création de site internet IZISPOT est un outil très puissant et qui est assez simple après quelques temps d utilisation.

KBC Securities mtrader. Votre propre salle des marchés. Mode d emploi KBC Securities mtrader pour iphone/ipad

Guide d utilisation et d administration

VAMT 2.0. Activation de Windows 7 en collège

MANUEL D INSTALLATION Sous WINDOWS

Ces Lettres d informations sont envoyées aux extranautes inscrits et abonnés sur le site assistance (voir point N 3).

Archivage de courriels avec Outlook ( )

1 ) INSTALLATION DE LA CONSOLE 2 2 ) PREMIER DÉMARRAGE DE LA CONSOLE 3 3 ) LES JOBS 4 4 ) LES ORDINATEURS 6

Gestion des documents avec ALFRESCO

QUICK START RF Monitor 4.3 CFR21

Service On Line : Gestion des Incidents

SAUVEGARDER SES DONNEES PERSONNELLES

COMPTABILITE SAGE LIGNE 30

Utiliser un tableau de données

E-PROCUREMENT GESTION D UTILISATEURS

Paiement sécurisé sur Internet. Tableau de bord Commerçant

Manuel de formation Spaceman 1 ère journée

RECUPEREZ DES FICHIERS SUPPRIMES AVEC RECUVA

Installation du transfert de fichier sécurisé sur le serveur orphanet

LOGICIEL MARCHES PUBLICS

Numilog - Téléchargement des ebooks Mode d emploi

PLATEFORME SAAS D'ENVOI DE SMS. Guide du débutant UTILISER LA PLATEFORME SMSMODE TUTORIEL

Manuel d utilisation de la plate-forme de gestion de parc UCOPIA. La mobilité à la hauteur des exigences professionnelles

Petit guide d utilisation Prezi

Création d un site Internet

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

Le cas «BOURSE» annexe

GUIDE D UTILISATION LE SETUP GUIDE D EXPLICATION DÉTAILLÉ

Cours iguess. inotes v10.1

Utilisation de la Plateforme Office365 et d Oultlook Web App

Vous venez d acquérir un fichier de données issues de la Base de données SIRENE. Comment utiliser votre fichier?

Prendre en main le logiciel ActivInspire 1.4

SUPPORT DE COURS ACCESS 2010

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

POVERELLO KASONGO Lucien SIO 2, SISR SITUATION PROFESSIONNELLE OCS INVENTORY NG ET GLPI

Business Intelligence simple et efficace

La Clé informatique. Formation Internet Explorer Aide-mémoire

Whitepaper. Méthodologie de création de rapports personnalisés SQL Server Reporting Services

Manuel d utilisation de l outil collaboratif

ContactForm et ContactFormLight - Gestionnaires de formulaire pour Prestashop Edité par ARETMIC S.A.

esms Desktop Guide de l utilisateur

PerSal Manuel d installation

Tango go.box - Aide. Table des matières

< Atelier 1 /> Démarrer une application web

Tutoriel première utilisation ICEM-CFD. Couche limite et modification du maillage en 2D

SRAL Saint Raphaël. Maison des associations 213, rue de la Soleillette Saint Raphaël. : : dromain.jean-pierre@neuf.

Cette fonctionnalité est paramétrable et accessible dans le module administration via le menu "Dossier / Administration".

SurveyMonkey Un outil de sondage électronique. Objectifs

Quelques outils pour le logiciel «Tuxpaint»

Transcription:

TP Initiation à Galaxy Fonctionnalités de base de Galaxy

Introduction 2 Objectifs de ce Tutoriel 2 Se connecter à votre instance Galaxy 2 Transfert des données sur l instance Galaxy 3 Renommage de l historique 4 Manipulation d un fichier texte 4 Conversion des espaces en tabulation 5 Opérations sur un dataset 6 Suppression de colonnes 7 Filtrer les résultats 8 Trier les résultats 8 Réaliser une jointure entre 2 fichiers 11 Récupération et transfert du fichier d annotations 11 Associer les résultats statistiques précédents et les annotations 11 Manipulation des workflows 13 Création d un workflow depuis un historique 13 Visualisation et paramétrage d un workflow 14 Sauvegarde et lancement d un workflow 15 Modification d un workflow 17 Manipulation des historiques 19 Changer d historique 19 Quelques fonctions du menu History options 19 Copy datasets 19 Show structure 20 Visualisation et graphiques 22 Charts 22 Scatterplot 24 Exercice 26 1

Introduction Objectifs de ce Tutoriel - Savoir transférer les données sur Galaxy - Manipuler certains outils de base de Galaxy - Manipuler les historiques de Galaxy - Savoir récupérer les résultats sur son ordinateur - Créer et utiliser des workflows personnalisés Se connecter à votre instance Galaxy - Ouvrir un navigateur internet et taper dans la barre d adresse l IP donnée par les formateurs. - la page d accueil suivante s affiche: - Cliquer sur le logo Galaxy en haut à gauche de la page. L adresse dans la barre d adresse du navigateur devrait prendre la forme suivante : adresse_ip/proxy/gq2fzfp3dkxcscc5uv78afd23ifi/ - Cliquer sur User -> login puis rentrez l identifiant user@galaxy.ifb.fr et le mot de passe ifbuser - La page d accueil s affiche à nouveau et en cliquant sur User logged in as user@galaxy.ifb.fr apparait. 2

Transfert des données sur l instance Galaxy - Récupérer le fichier Tutoriel_listes_genes.csv à l adresse https://drive.google.com/open?id=0b9hfq8t-2mslamxezhpjou93dgm - Dans le panel Tools, cliquer sur Get data -> Upload file - Cliquer sur Choose local file et choisir l emplacement du fichier récemment téléchargé. Laisser les options par défaut pour type et genome. - Cliquer sur Start pour lancer l upload. - Cliquer sur close une fois l upload terminé. - Le fichier transféré doit maintenant apparaître dans le panel History 3

Le fichier contient les résultats statistiques d une analyse différentielle d expression de gènes à partir de données de puce à ADN. En ligne on retrouve différentes sondes de la puce à ADN. En colonnes on a certaines valeurs statistiques associées à ces sondes. Renommage de l historique - En double-cliquant sur Unnamed history, renommer l historique : par exemple TP 1 - fonctionnalités de base. 4

Manipulation d un fichier texte Conversion des espaces en tabulation Objectif : améliorer le formatage des données pour que Galaxy les affiche de façon plus lisible. - Dans le panel Tools, Cliquer sur Text Manipulation -> Convert - Convertir les virgules en tabulations En cliquant sur l icône view data du nouveau dataset convert on data 1, on s aperçoit que le formatage des données a changé. Les données apparaissent maintenant en colonnes 5

Opérations sur un dataset Galaxy donne aux nouveaux datasets un nom automatique (par exemple Convert on data 1 ). Il peut être judicieux de les renommer pour mieux décrire l opération réalisée. - Dans le panel History, cliquer sur le dataset Convert on data 1 cliquez sur l icône Edit attributes. - Modifier le nom dans le champ Name - Ajouter des informations dans les champs Info et Annotation/notes Le nom du dataset a désormais changé dans l historique. De plus en cliquant sur le nom du dataset, On accède à un aperçu de son contenu ainsi qu à certaines informations et opérations : 6

Suppression de colonnes Objectif : Supprimer les colonnes qui sont inutiles pour la suite de l analyse. - Dans le panel Tools, Cliquer sur Text Manipulation -> Cut - Ne conserver que les colonnes 1, 2, 3 et 6 Les colonnes t et B ont désormais disparu. 7

Filtrer les résultats Objectif : ne conserver que les lignes dont la valeur absolue du log fold change (colonne logfc) est supérieure à 2. - Dans le panel Tools, Cliquer sur Filter and sort -> Filter - Entrer la condition dans le champ with following conditions Note : c4>=2 or c4<=-2 est équivalent à abs(c4)>=2. Trier les résultats Objectif : Trier les résultats par valeur absolue du fold change. Cette opération se fait en 2 étapes. Etape 1 : Calcul de la valeur absolue d une colonne - Dans le panel Tools, Cliquer sur Text Manipulation -> Compute 8

Une nouvelle colonne a été créée contenant la valeur absolue du fold change Etape 2 : Tri sur la valeur absolue du fold change - Dans le panel Tools Cliquer sur Filter and sort -> Sort La colonne 5 est maintenant triée et les sondes apparaissent bien par ordre décroissant de valeur absolue de fold change. 9

10

Réaliser une jointure entre 2 fichiers Objectif : Ajouter les annotations aux résultats statistiques. Récupération et transfert du fichier d annotations - Télécharger la liste des annotations à l emplacement suivant : https://drive.google.com/open?id=0b9hfq8t-2mslrmlwd2fprvnzsue - Uploader le fichier ainsi récupéré (Exemples_annotations.csv) à l aide de l outil Upload tool de Galaxy Associer les résultats statistiques précédents et les annotations Il s agit de réaliser une jointure entre le fichier d annotations et le fichier de résultats statistiques. - Dans le panel Tools, Cliquer sur Join, Subtract and Group -> Join two Datasets 11

On notera que l ordre dans lequel les 2 fichiers d entrée sont renseignés est important. En effet, l ordre du résultat correspond à l ordre du premier fichier (champ join ). Si l on veut conserver le tri préalablement effectué sur les logfc, il est donc impératif de faire figurer le fichier comportant les informations statistiques dans le champ join. 12

Manipulation des workflows Galaxy offre la possibilité d automatiser l enchaînement de différents outils grâce aux workflows. Cette fonctionnalité permet donc de reproduire simplement un ensemble de traitements déjà effectué. Création d un workflow depuis un historique Objectif : créer un workflow depuis un historique regroupant un ensemble de traitement déjà effectué. - Cliquer sur l icône History options en haut à droite du panel History. - Cliquer sur Extract Workflow - Cliquer sur Create Workflow 13

Visualisation et paramétrage d un workflow Pour accéder à votre workflow : - Cliquer sur Workflow en haut de la page Galaxy - Cliquer sur le nom de votre workflow puis sur Edit Chaque boîte correspond à un outil. En cliquant sur une boite on peut accéder au paramétrage de l outil associé : 14

Chaque outil peut ainsi être paramétré directement via l interface des workflows. De plus certains paramètres offrent la possibilité d être renseignés au moment du lancement du workflow : De plus on remarque que notre workflow contient 2 fois l outil input dataset. Afin d éviter les confusions lors du lancement du workflow, il est recommandé de les différencier en leur attribuant un nom différent, afin d éviter de les confondre lors du lancement du workflow. - Cliquer sur la boîte input dataset reliée à la boîte convert - Dans la colonne de droite, renseigner le champ Name - Procéder de la même façon pour la deuxième boîte Input dataset (en choisissant le nom fichier annotations par exemple) Sauvegarde et lancement d un workflow Une fois votre workflow paramétré, il faut le sauvegarder : - Cliquer sur l icône en haut droite du panel central. - Cliquer sur Save 15

Lancer le workflow : - Cliquer sur l icône en haut droite du panel central. - Cliquer sur Run Les différentes étapes du workflow apparaissent ainsi que les paramètres devant être renseignés. - Renseigner les 2 champs Input Dataset - Cliquer sur Run workflow - Pour charger le nouvel historique, cliquez sur en haut à droite du panel History, puis sur Saved histories 16

- Cliquer alors sur l historique lié au workflow. Modification d un workflow En plus du paramétrage des outils, il est possible d ajouter ou de supprimer des étapes d un workflow. Par exemple, si l on veut ajouter une étape après le tri, afin de ne retenir que les 50 premiers gènes : - Supprimer le lien entre les boîtes Sort et Join two Datasets" : en passant la souris sur l extrémité du lien du coté de la boîte Join two Datasets une petite croix apparaît. Cliquez sur cette croix pour supprimer le lien - Dans le panel Tools cliquer sur l outil Text manipulation -> Select first - Relier la nouvelle boîte Select First aux boîtes Sort et Join two Datasets 17

- Paramétrer l outil pour ne retenir que les 50 premières lignes - Sauvegarder le nouveau workflow et le lancer, comme décrit précédemment. 18

Manipulation des historiques Galaxy permet de manipuler les historiques et les datasets, afin d organiser au mieux les données et les résultats. Changer d historique - Dans le menu History options (icône en haut à droite du panel History ), cliquer sur Saved Histories - Il est alors possible de changer d historique courant en cliquant sur l historique désiré. Quelques fonctions du menu History options Copy datasets Cette fonctionnalité permet de copier un ou plusieurs dataset vers un ou plusieurs historiques existants, ou vers un nouvel historique. - Dans le menu History options (icône en haut à droite du panel History ), cliquer sur Copy Datasets 19

- On peut alors avoir accès au nouvel historique. Il est aussi possible de manipuler les historiques grâce à l icône. Les différents historiques apparaissent alors côte à côte et il est possible de transférer les datasets vers l historique courant par simple glisser-déposer. Show structure Cette fonctionnalité permet d afficher un résumé de l ensemble des éléments de l historique ainsi que de leurs paramètres 20

- Dans le menu History options (icône en haut à droite du panel History ), cliquer sur Show Structure 21

Visualisation et graphiques Certains dataset proposent des options de visualisation, grâce à l icône Charts L outil Charts permet d accéder à un ensemble représentations graphiques différentes (nuage de points, histogramme, heatmap, boxplot, camembert, etc..) 22

Exemple : histogramme des p-values de nos données originelles. - Prendre comme base le dataset avant filtrage des données - Choisir la 3ème colonne (celle des p-values brutes) - Cliquer sur Draw - Le survol des barres de l histogramme permet d obtenir la fréquence représentée par chacune d elles. 23

Scatterplot L outil scatterplot permet de tracer des nuages de points. Par exemple pour le data Join two datasets on data2 and data8 on peut tracer les p-value ajustées en fonctions des logfc. - Choisir les columns 2 (p-value ajustées), 4 (logfc) et 7 (Gene Symbol) en X, Y et ID, puis cliquer sur draw 24

- Le nuage de points est tracé et en survolant les points, on accède aux informations de chacun d eux. - De plus en cliquant sur Chart controls on peut paramétrer l apparence du graphique. 25

Exercice Le graphique précédent montre que certaines sondes avec abs(logfc) > 2 ont des p-value ajustées supérieures au seuil généralement retenu de 0.05. - Modifier le workflow pour ajouter une étape de filtrage pour ne retenir que les sondes dont les p-values ajustées sont inférieures à 0.05, tout en conservant le seuil abs(logfc) > 2. - Retracer la nuage de points avec les nouveaux résultats. 26