EMME : un environnement de gestion des métadonnées expérimentales



Documents pareils
OBJECTIFS. Une démarche E-science

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Towards a Life Sciences Virtual Research Environment

Introduction aux bases de données: application en biologie

Eco-système calcul et données

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Dafoe Présentation de la plate-forme UIMA

GUGGO 4 ème rencontre

OPEN SCIENCE CATI CODEX MONTPELLIER 14 FÉVRIER 2013

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Qu'est-ce que c'est??

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

Iyad Alshabani SysCom - CReSTIC Université de Reims 17/02/2011 1

Compte Rendu d intégration d application

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

Partage des données de la recherche. Dossier suivi par : I. Blanc (Sup SIS), C. Gaspin (MIA) et O. Hologne (DIST)

Réunion des DU de Biogenouest 19 mars 2014

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. h tt p : / / w w w. s c i e n c e s c o n f. o rg

Gestion des bases de données

Créez votre propre Archive Darwin Core

INGÉNIEUR LOGICIEL JAVAEE / GROOVY 8 ANS D EXPÉRIENCE

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB / 16

Jahia. Guillaume Monnette École Ingénieurs 2000 Marne-La-Vallée IR3

SÉQUENÇAGE DE TYPE RAD-SEQ, PRÉSENTATION ET TRAITEMENT ANALYTIQUE

Big data et sciences du Vivant L'exemple du séquençage haut débit

Gènes Diffusion - EPIC 2010

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

L Orchestration de Services Web avec Orchestra. Goulven Le Jeune Orchestra Project Manager

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

BPEL Orchestration de Web Services

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Projet d'infrastructure Cloud

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES

Atelier Progress Rollbase

Présentation de la gamme de produits et manuels numériques

L exploitation des rapports de vérifications réglementaires : quels enjeux, quelle solution?

Visual Paradigm Contraintes inter-associations

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

DIRAC : cadre et composants pour créer des systèmes de calcul distribués

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. 12 mars 2015

Mercredi 15 Janvier 2014

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Développer une stratégie SIG Entreprise efficace avec ESRI et ArcGIS

Forge. Présentation ( )

<Insert Picture Here>ApExposé. Cédric MYLLE 05 Février Exposé Système et Réseaux : ApEx, Application Express d Oracle

Environmental Research and Innovation ( ERIN )

Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

La démarche MDA. Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)*

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

LES ACCES ODBC AVEC LE SYSTEME SAS

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Les Utilisateurs dans SharePoint

Présentation du module Base de données spatio-temporelles

Urbanisme du Système d Information et EAI

L art d ordonnancer. avec JobScheduler. François BAYART

NOVA BPM. «Première solution BPM intégr. Pierre Vignéras Bull R&D

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

Oracle Database 11g: Administration Workshop I Release 2

Calcul intensif pour la biologie

Open Source & Innovation exo Platform Oualid Chaker,

Présentation: ez Publish 4.4. Sponsor principal:

Un serveur d'archivage

Présentations personnelles. filière IL

Retour d'expérience avec : OCS Inventory & GLP

Solution Intranet collaboratif

Emergence du Big Data Exemple : Linked Open Data

WEB15 IBM Software for Business Process Management. un offre complète et modulaire. Alain DARMON consultant avant-vente BPM

S7 Le top 10 des raisons d utiliser PHP pour moderniser votre existant IBM i

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

Infrastructure / réseau / sécurité /support utilisateur

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

Déterminer les enjeux du Datacenter

Hyper-V Virtualisation de serveurs avec Windows Server 2008 R2 - Préparation à l'examen MCTS

Ce guide décrit la procédure à suivre afin de profiter pleinement du Service de Transfert de Fichiers EGIS. Il décrit

Mise en place d'un gestionnaire de données léger, pluridisciplinaire et national pour les données scientifiques

Architecture client riche Evolution ou révolution? Thomas Coustenoble IBM Lotus Market Manager

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

CATALOGUE FORMATION. Product Lifecycle Management. Juin 2013

Whitepaper. Méthodologie de création de rapports personnalisés SQL Server Reporting Services

Emergence du Big Data Exemple : Linked Open Data

Découvrir le CMS. et l utiliser dans une approche pro!

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Solutions Exploitation de contenus

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

SysFera. Benjamin Depardon

Notre Catalogue des Formations IT / 2015

Service des stages et du placement - secteur placement ANNEE 2013 TITRES DE POSTES OFFERTS AUX DIPLOMES DE GENIE INFORMATIQUE

les techniques d'extraction, les formulaires et intégration dans un site WEB

Transcription:

EMME : un environnement de gestion des métadonnées expérimentales Basé sur l'utilisation d'isa Infrastructure Cyril Monjeaud Ingénieur sur la plate-forme GenOuest, Rennes

PLAN Introduction ISA Infrastructure ISA Software Suite Démonstration Questions 20 min 10 min 10 min

PLAN Introduction ISA Infrastructure ISA Software Suite Démonstration Questions

INTRODUCTION GenOuest, EMME et ISA

La plate-forme GenOuest Introduction ISA Infrastructure ISA Software Suite Démonstrations Plate-forme située à l'inria/irisa de Rennes Associée au groupe de recherche Symbiose (Genscale - Dyliss) GenOuest appartient à ReNaBi-GO (avec BiRD et ABIMS) ReNaBi-GO = plate-forme bio-informatique de Biogenouest GenOuest propose: un large ensemble d outils bio-informatiques des banques de données publiques mises à jour régulièrement la prise en charge de projets de développement en bio-informatique diverses formations en informatique / bio-informatique 1

La plate-forme GenOuest Introduction ISA Infrastructure ISA Software Suite Démonstrations Plate-forme située à l'inria/irisa de Rennes Associée au groupe de recherche Symbiose (Genscale - Dyliss) GenOuest appartient à ReNaBi-GO (avec BiRD et ABIMS) ReNaBi-GO = plate-forme bio-informatique de Biogenouest GenOuest propose: un large ensemble d outils bio-informatiques des banques de données publiques mises à jour régulièrement la prise en charge de projets de développement en bio-informatique diverses formations en informatique / bio-informatique 1

La plate-forme GenOuest Introduction ISA Infrastructure ISA Software Suite Démonstrations Plate-forme située à l'inria/irisa de Rennes Associée au groupe de recherche Symbiose (Genscale - Dyliss) GenOuest appartient à ReNaBi-GO (avec BiRD et ABIMS) ReNaBi-GO = plate-forme bio-informatique de Biogenouest GenOuest propose: un large ensemble d outils bio-informatiques des banques de données publiques mises à jour régulièrement la prise en charge de projets de développement en bio-informatique diverses formations en informatique / bio-informatique 1

Les projets de Genouest GRISBI BioPaaS Grille genocluster Cloud Cluster Biologie intégrative BioMAJ Calcul BioWIC Ontologies Données Métadonnées e-biogenouest Workflows BioSide Galaxy Portail Collaboratif MobyleNet EMME Web services ADT INRIA Elgg OpenLDAP Hubzero Opal Toolkit 2

Les projets de Genouest GRISBI BioPaaS Grille genocluster Cloud Cluster Biologie intégrative BioMAJ Calcul BioWIC Ontologies Données Métadonnées e-biogenouest Workflows BioSide Galaxy Portail Collaboratif MobyleNet EMME Web services ADT INRIA Elgg OpenLDAP Hubzero Opal Toolkit 2

Le deluge de données Introduction ISA Infrastructure ISA Software Suite Démonstrations Contexte Baisse des prix des expériences -> plus d'expériences réalisées Evolution des technologies (NGS) -> plus de données produites Volume et diversité des données explosent sur les plates-formes biologiques Intégration & Interprétation des données sont primordiales Objectif de la plate-forme Intégrer les données pour pouvoir y accéder plus facilement Faciliter l'échange au sein de différents organismes Solution : gestion des métadonnées expérimentales 3

Le deluge de données Introduction ISA Infrastructure ISA Software Suite Démonstrations Contexte Baisse des prix des expériences -> plus d'expériences réalisées Evolution des technologies (NGS) -> plus de données produites Volume et diversité des données explosent sur les plates-formes biologiques Intégration & Interprétation des données sont primordiales Objectif de la plate-forme Intégrer les données pour pouvoir les analyser Faciliter l'échange au sein de différents organismes Solution : gestion des métadonnées expérimentales 3

Les métadonnées expérimentales Introduction ISA Infrastructure ISA Software Suite Démonstrations Qu'est-ce que les métadonnées expérimentales? Métadonnées = Données Description de la données Conditions / détails expérimentaux permettant la création des données Pourquoi s'occuper des métadonnées? Donner du sens à la donnée = interprétable Rendre la donnée accessible à l'utilisateur Identification Découverte Pérennité 4

Les métadonnées expérimentales Introduction ISA Infrastructure ISA Software Suite Démonstrations Qu'est-ce que les métadonnées expérimentales? Métadonnées = Données Description de la données Conditions / détails expérimentaux permettant la création des données Pourquoi s'occuper des métadonnées? Donner du sens à la donnée = interprétable Rendre la donnée accessible à l'utilisateur Identification Découverte Pérennité Métadonnées Données 4

Genouest et les métadonnées GRISBI BioPaaS Grille genocluster Cloud Cluster Biologie intégrative BioMAJ Calcul BioWIC Ontologies Données e-biogenouest Workflows BioSide Galaxy Portail Métadonnées Collaboratif MobyleNet EMME Web services ADT INRIA Elgg OpenLDAP Hubzero Opal Toolkit 5

Genouest et les métadonnées GRISBI BioPaaS Grille genocluster Cloud Cluster Biologie intégrative BioMAJ Calcul BioWIC Ontologies Données e-biogenouest Workflows BioSide Galaxy Portail Métadonnées Collaboratif MobyleNet EMME Web services ADT INRIA Elgg OpenLDAP Hubzero Opal Toolkit 6

Le projet EMME Introduction ISA Infrastructure ISA Software Suite Démonstrations Experimental Metadata Management Environment EnvironneMent de gestion des Métadonnées Expérimentales Objectifs : Service commun aux différentes plate-formes de Biogenouest Stockage et échange de connaissances biologiques Moyens : Essayer de prendre en charge la donnée (selon matériel) Prendre en charge la métadonnée Gestion de l'analyse des données / métadonnées 7

Le projet EMME Introduction ISA Infrastructure ISA Software Suite Démonstrations Experimental Metadata Management Environment EnvironneMent de gestion des Métadonnées Expérimentales Objectifs : Service commun aux différentes plate-formes de Biogenouest Stockage et échange de connaissances biologiques Moyens : Essayer de prendre en charge la donnée (selon matériel) Prendre en charge la métadonnée Gestion de l'analyse des données / métadonnées 7

Le projet EMME Introduction ISA Infrastructure ISA Software Suite Démonstrations Experimental Metadata Management Environment EnvironneMent de gestion des Métadonnées Expérimentales Objectifs : Service commun aux différentes plate-formes de Biogenouest Stockage et échange de connaissances biologiques Moyens : Essayer de prendre en charge la donnée (selon matériel) Prendre en charge la métadonnée Gestion de l'analyse des données / métadonnées 7

Genouest et le projet EMME GRISBI BioPaaS Grille genocluster Cloud Cluster Biologie intégrative BioMAJ Calcul BioWIC Ontologies Données e-biogenouest Workflows BioSide Galaxy Portail Métadonnées Collaboratif MobyleNet EMME Web services ADT INRIA Elgg OpenLDAP Hubzero Opal Toolkit 8

Genouest et le projet EMME GRISBI BioPaaS Grille genocluster Cloud Cluster Biologie intégrative BioMAJ Calcul BioWIC Ontologies Données e-biogenouest Workflows BioSide Galaxy Portail Métadonnées Collaboratif MobyleNet EMME Web services ADT INRIA Elgg OpenLDAP Hubzero Opal Toolkit 8

Genouest et le projet EMME GRISBI BioPaaS Grille genocluster Cloud Cluster Biologie intégrative BioMAJ Calcul BioWIC Ontologies Données e-biogenouest Workflows BioSide Galaxy Portail Métadonnées Collaboratif MobyleNet EMME Web services ADT INRIA Elgg OpenLDAP Hubzero Opal Toolkit 8

Genouest et le projet EMME Ontologies Données Métadonnées e-biogenouest ISAInfrastructure EMME 8

Introduction ISA Infrastructure ISA Software Suite Démonstration

ISA INFRASTRUCTURE (ISATools) Un format, des ontologies et des standards

Le contexte : dépôts et formats Introduction ISA Infrastructure ISA Software Suite Démonstrations Beaucoup de dépôts/formats pour la soumission : Protéomique : Pride Pride XML Génomique : ENA - SRA-XML Transcriptomique : ArrayExpress Mage-Tab Mais aucun pour des expériences multi' omiques Protéomique, génomique, transcriptomique, métabolomique Nutrigénomique, Toxicogénomique, etc Point de départ d'isainfrastructure 9

Le contexte : dépôts et formats Introduction ISA Infrastructure ISA Software Suite Démonstrations Beaucoup de dépôts/formats pour la soumission : Protéomique : Pride Pride XML Génomique : ENA - SRA-XML Transcriptomique : ArrayExpress Mage-Tab Mais aucun pour des expériences multi' omiques Protéomique, génomique, transcriptomique, métabolomique Nutrigénomique, Toxicogénomique, etc Point de départ d'isainfrastructure 9

Le contexte : dépôts et formats Introduction ISA Infrastructure ISA Software Suite Démonstrations Beaucoup de dépôts/formats pour la soumission : Protéomique : Pride Pride XML Génomique : ENA - SRA-XML Transcriptomique : ArrayExpress Mage-Tab Mais aucun pour des expériences multi' omiques Protéomique, génomique, transcriptomique, métabolomique Nutrigénomique, Toxicogénomique, etc Point de départ d' ISAInfrastructure 9

Présentation d'isa Infrastructure ISA Team Susanna Sansone : Team Leader Philippe Rocca-Serra : Technical Co-ordinator Eamonn Maguire : Lead Software Engineer Oxford e-research Center Création d'un format (ISA-Tab) + suite logicielle + dépôt 10

Publications de ISA Team Science, 2009 Omics Data Sharing Field,D. et al. (2009) Science, 9, 234 236. Bioinformatics, 2010 ISA software suite: supporting standards-compliant experimental annotation and enabling curation at the community level Rocca-Serra,P. et al. Bioinformatics, 26, 2354 2356. Nature Genetics, 2011 Toward interoperable bioscience data Susanna-Assunta Sansone et al. (2011) Nature genetics, in press 11

Introduction ISA Infrastructure ISA Software Suite Démonstrations Le format ISA-Tab 2008 : premier workshop ISA-Tab à l'ebi de Cambridge Comment un simple format peut-t-il gérer des études complexes? Format simple Tabulé (texte) Non XML donc plus adapté à la communauté biologique Simple d'utilisation et manipulable avec un tableur Gestion d'études complexes Hébergement des études composées de plusieurs expériences Expériences pouvant être multi' omics 12

Introduction ISA Infrastructure ISA Software Suite Démonstrations Le format ISA-Tab 2008 : premier workshop ISA-Tab à l'ebi de Cambridge Comment un simple format peut-t-il gérer des études complexes? Format simple Tabulé (texte) Non XML donc plus adapté à la communauté biologique Simple d'utilisation et manipulable avec un tableur Gestion d'études complexes Hébergement des études composées de plusieurs expériences Expériences pouvant être multi' omics 12

Introduction ISA Infrastructure ISA Software Suite Démonstrations Le format ISA-Tab 2008 : premier workshop ISA-Tab à l'ebi de Cambridge Comment un simple format peut-t-il gérer des études complexes? Format simple Tabulé (texte) Non XML donc plus adapté à la communauté biologique Simple d'utilisation et manipulable avec un tableur Gestion d'études complexes Hébergement des études composées de plusieurs expériences Expériences pouvant être multi' omiques 12

Les ontologies Introduction ISA Infrastructure ISA Software Suite Démonstrations ISA-Tab permet et encourage l'utilisation d'ontologies Ontologies Un vocabulaire contrôlé : du texte libre (Wild Type, WT, Wt, WildType) Un vocabulaire hiérarchisé : relations entres termes (is_a, has_a, etc.) Annotation des données / métadonnées Vocation Partager et la réutiliser des connaissances grâce à un langage commun Classifier les données et les informations Permettre l'analyse informatique (indexation, recherche avancée, etc.) 13

Les ontologies Introduction ISA Infrastructure ISA Software Suite Démonstrations ISA-Tab permet et encourage l'utilisation d'ontologies Ontologies Un vocabulaire contrôlé : du texte libre (Wild Type, WT, Wt, WildType) Un vocabulaire hiérarchisé : relations entres termes (is_a, has_a, etc.) Annotation des données / métadonnées Vocation Partager et réutiliser des connaissances grâce à un langage commun Classifier les données et les informations Permettre l'analyse informatique (indexation, recherche avancée, etc.) 13

Exemples d'utilisations Introduction ISA Infrastructure ISA Software Suite Démonstrations SNOMED Clinical Terms malignant tumor +Body structure - Clinical finding + Calculus finding + Cyanosis - Disease +... -... - Malignant neoplastic disease Malignant neoplastic disease, SNOMEDCT, 363346000 CHEBI fatty acids - Chemical entity + Atom - Molecular entity - Main group molecular entity -... Fatty acid Fatty acid, CHEBI, 35366 14

Exemples d'utilisations Introduction ISA Infrastructure ISA Software Suite Démonstrations SNOMED Clinical Terms malignant tumor +Body structure - Clinical finding + Calculus finding + Cyanosis - Disease +... -... - Malignant neoplastic disease Malignant neoplastic disease, SNOMEDCT, 363346000 CHEBI fatty acids - Chemical entity + Atom - Molecular entity - Main group molecular entity -... Fatty acid Fatty acid, CHEBI, 35366 14

Exemples d'utilisations Introduction ISA Infrastructure ISA Software Suite Démonstrations SNOMED Clinical Terms malignant tumor Informations libres +Body structure - Clinical finding + Calculus finding + Cyanosis - Disease +... -... - Malignant neoplastic disease Malignant neoplastic disease, SNOMEDCT, 363346000 CHEBI fatty acids - Chemical entity + Atom - Molecular entity - Main group molecular entity -... Fatty acid Fatty acid, CHEBI, 35366 14

Exemples d'utilisations Introduction ISA Infrastructure ISA Software Suite Démonstrations SNOMED Clinical Terms malignant tumor Informations libres +Body structure - Clinical finding + Calculus finding + Cyanosis - Disease +... -... - Malignant neoplastic disease CHEBI fatty acids - Chemical entity + Atom - Molecular entity - Main group molecular entity -... Fatty acid Malignant neoplastic disease, SNOMEDCT, 363346000 Informations reliées à un système de connaissances Fatty acid, CHEBI, 35366 14

L'engagement d'isa Implication sur les questions de standardisation, diffusion, etc. 16

ISA : Investigation Study - Assay Introduction ISA Infrastructure ISA Software Suite Démonstrations Contexte biologique Informations sur l'étude Expérience réalisée sur les échantillons Liens vers les fichiers de données (résultats non inclus directement) 17

ISA : Investigation Study - Assay Introduction ISA Infrastructure ISA Software Suite Démonstrations Contexte biologique Informations sur l'étude Expérience réalisée sur les échantillons Liens vers les fichiers de données (résultats non inclus directement) 17

ISA : Investigation Study - Assay Introduction ISA Infrastructure ISA Software Suite Démonstrations Contexte biologique Informations sur l'étude Expérience réalisée sur les échantillons Liens vers les fichiers de données (résultats non inclus directement) 17

ISA : Investigation Study - Assay Introduction ISA Infrastructure ISA Software Suite Démonstrations Contexte biologique Informations sur l'étude Expérience réalisée sur les échantillons Liens vers les fichiers de données (résultats non inclus directement) 17

Les métadonnées liées à une expérience Sources Échantillons Échantillons Données dat csv Données Données transformées 18

Introduction ISA Infrastructure ISA Software Suite Démonstration

ISA Software Suite

ISA Software Suite

ISACreatorConfigurator Objectif Création de modèles ISA nommés Tables Déclaration de champs Définition du type de données 3 types de modèles : Investigation, Study, Assays Obligatoire? Oui car essentiel lors de l'étape de création des expériences Mais configuration par défaut fournis par ISA 1 modèle pour Investigation et Study 28 modèles pour Assay Analyses : Cell sorting, Metabolite profiling, SNP Analysis, etc. Matériels : DNA µarray, Flow Cytometry, Mass spectro., etc. 19

ISACreatorConfigurator Objectif Création de modèles ISA nommés Tables Déclaration de champs Définition du type de données 3 types de modèles : Investigation, Study, Assays Obligatoire? Oui car essentiel lors de l'étape de création des expériences Mais configuration par défaut fournis par ISA 1 modèle pour Investigation et Study 28 modèles pour Assay Analyses : Cell sorting, Metabolite profiling, SNP Analysis, etc. Matériels : DNA µarray, Flow Cytometry, Mass spectro., etc. 19

ISACreatorConfigurator Utilisateurs Bio-informaticiens Phase de configuration Utilisation Exécutable sur la machine de l'utilisateur (local) Lors de la première utilisation d'isa Lors de l'utilisation d'un nouveau type d'expérience 20

ISACreatorConfigurator Utilisateurs Bio-informaticiens Phase de configuration Utilisation Exécutable sur la machine de l'utilisateur (local) Lors de la première utilisation d'isa Lors de l'utilisation d'un nouveau type d'expérience 20

Exemples de Tables STUDY ASSAY Protein_expression_ms SampleStudy Protein Expression Profiling using Mass Spectrometry Source Name Characteristics[organism] Protocol REF Protocole d'obtention Sample Name SampleStudy.xml - growth protocol Sample Name Protocol REF Protocole d'extraction - protein extraction Extract Name Protocol REF Protocole de marquage - itraq labeling Labeled Name Protocol REF Protocole de spectrométrie - MALDI TOF mass spectrometry Parameter Value[mass spectrometry instrument] Parameter Value[ion optics] MS Assay Name Raw Spectral Data File Protocol REF Protocole de transformation de données Normalization Name Data Transformation Name Derived Spectral Data File Protocol REF Protocole d'identification Protein Assignment File 21

Exemples de Tables STUDY ASSAY Protein_expression_ms SampleStudy Protein Expression Profiling using Mass Spectrometry Source Name Characteristics[organism] Protocol REF Protocole d'obtention Sample Name SampleStudy.xml Protein_expression_ ms.xml - growth protocol Sample Name Protocol REF Protocole d'extraction - protein extraction Extract Name Protocol REF Protocole de marquage - itraq labeling Labeled Name Protocol REF Protocole de spectrométrie - MALDI TOF mass spectrometry Parameter Value[mass spectrometry instrument] Parameter Value[ion optics] MS Assay Name Raw Spectral Data File Protocol REF Protocole de transformation de données Normalization Name Data Transformation Name Derived Spectral Data File Protocol REF Protocole d'identification Protein Assignment File 21

Exemples de Tables STUDY ASSAY Protein_expression_ms SampleStudy Protein Expression Profiling using Mass Spectrometry Source Name Characteristics[organism] Protocol REF Protocole d'obtention Sample Name SampleStudy.xml Protein_expression_ ms.xml MaConfig_ISA - growth protocol Sample Name Protocol REF Protocole d'extraction - protein extraction Extract Name Protocol REF Protocole de marquage - itraq labeling Labeled Name Protocol REF Protocole de spectrométrie - MALDI TOF mass spectrometry Parameter Value[mass spectrometry instrument] Parameter Value[ion optics] MS Assay Name Raw Spectral Data File Protocol REF Protocole de transformation de données Normalization Name Data Transformation Name Derived Spectral Data File Protocol REF Protocole d'identification Protein Assignment File 21

Aperçu : Study 22

Aperçu : Assay 23

ISA Software Suite

ISACreator : Création Partie dédiée aux utilisateurs Rôle : Saisir les métadonnées expérimentales Similaire à un cahier de laboratoire Exécutable sur la machine de l'utilisateur (local) Utilisation Lorsque une investigation est décidée Lorsqu'une étude (study) est ajoutée à une investigation Lorsqu'une expérience (assay) est réalisée dans une étude Dynamique Possible de rajouter des études ou des expériences 24

ISACreator : Création Partie dédiée aux utilisateurs Rôle : Saisir les métadonnées expérimentales Similaire à un cahier de laboratoire Exécutable sur la machine de l'utilisateur (local) Utilisation Lorsque une investigation est décidée Lorsqu'une étude (study) est ajoutée à une investigation Lorsqu'une expérience (assay) est réalisée dans une étude Dynamique Possible de rajouter des études ou des expériences 24

ISACreator : Création Partie dédiée aux utilisateurs Rôle : Saisir les métadonnées expérimentales Similaire à un cahier de laboratoire Exécutable sur la machine de l'utilisateur (local) Utilisation Lorsque une investigation est décidée Lorsqu'une étude (study) est ajoutée à une investigation Lorsqu'une expérience (assay) est réalisée dans une étude Dynamique Possible de rajouter des études ou des expériences 24

ISACreator : Création La saisie des métadonnées Sous la forme de tableaux (Excel-like) Fonctions de manipulations (ajout colonne / lignes, étendre, etc.) Repartis dans plusieurs onglets (respectant le modèle ISA) Lié à ISACreatorConfigurator Chargement d'un dossier de configuration Définition des champs de saisies 25

ISACreator : Création La saisie des métadonnées Sous la forme de tableaux (Excel-like) Fonctions de manipulations (ajout colonne / lignes, étendre, etc.) Repartis dans plusieurs onglets (respectant le modèle ISA) Lié à ISACreatorConfigurator Chargement d'un dossier de configuration Définition des champs de saisies 25

Aperçu : Investigation 26

Aperçu : Study 27

Aperçu : Study 28

Aperçu : Assay 29

ISACreator Finalité Enregistrement sous la forme de fichiers ISA-Tab -> Dépôt Possibilité de recharger des fichiers et modifier Outils intégrés ISAValidator : Validation des fichiers ISA-Tab ISAConverter : Conversion des fichiers ISA-Tab Plugins Recherche d'ontologies Auto-tagging (recherche texte libre -> association avec ontologies) Outils 30

ISACreator Finalité Enregistrement sous la forme de fichiers ISA-Tab -> Dépôt Possibilité de recharger des fichiers et modifier Outils intégrés ISAValidator : Validation des fichiers ISA-Tab ISAConverter : Conversion des fichiers ISA-Tab Plugins Recherche d'ontologies Auto-tagging (recherche texte libre -> association avec ontologies) Outils 30

ISACreator Finalité Enregistrement sous la forme de fichiers ISA-Tab -> Dépôt Possibilité de recharger des fichiers et modifier Outils intégrés ISAValidator : Validation des fichiers ISA-Tab ISAConverter : Conversion des fichiers ISA-Tab Plugins Recherche d'ontologies Auto-tagging (recherche texte libre -> association avec ontologies) Outils 30

ISA Software Suite

BioInvestigation Index BioInvestigation Index = BII Dépôt d'expériences ISA (études multi'omiques) Annuaire expérimentale Stockage des métadonnées dans une base de données PostgreSQL MySQL Oracle Similaire à Pride, ENA ou ArrayExpress 31

BioInvestigation Index BioInvestigation Index = BII Dépôt d'expériences ISA (études multi'omiques) Annuaire expérimentale Stockage des métadonnées dans une base de données PostgreSQL MySQL Oracle Similaire à Pride, ENA ou ArrayExpress 31

BioInvestigation Index BioInvestigation Index = BII Dépôt d'expériences ISA (études multi'omiques) Annuaire expérimentale Stockage des métadonnées dans une base de données PostgreSQL MySQL Oracle Similaire à Pride, ENA ou ArrayExpress 31

BII data manager Utilisé par l'administrateur ISA local (moi) Gestionnaire de dépôt ISA-Tab Chargement Déchargement Exportation d'une expérience Gestion des fichiers de données Dépôt à l'endroit précisé sur le serveur Création des liens associés (accès HTTP / FTP) Gestion de sécurité Étude privée / publique Visible par certains utilisateurs 32

BII data manager Utilisé par l'administrateur ISA local (moi) Gestionnaire de dépôt ISA-Tab Chargement Déchargement Exportation d'une expérience Gestion des fichiers de données Dépôt à l'endroit précisé sur le serveur Création des liens associés (accès HTTP / FTP) Gestion de sécurité Étude privée / publique Visible par certains utilisateurs 32

BII data manager Utilisé par l'administrateur ISA local (moi) Gestionnaire de dépôt ISA-Tab Chargement Déchargement Exportation d'une expérience Gestion des fichiers de données Dépôt à l'endroit précisé sur le serveur Création des liens associés (accès HTTP / FTP) Gestion de sécurité Étude privée / publique Visible par certains utilisateurs 32

BII data manager Utilisé par l'administrateur ISA local (moi) Gestionnaire de dépôt ISA-Tab Chargement Déchargement Exportation d'une expérience Gestion des fichiers de données Dépôt à l'endroit précisé sur le serveur Création des liens associés (accès HTTP / FTP) Gestion de sécurité Étude privée / publique Visible par certains utilisateurs 32

ISA Software Suite

BioInvIndex Web App Application Web Composée de 2 parties Vue globale des expériences Consultation de chaque expérience sous forme de fiche Moteur de recherche indexé par Apache Lucene But final du BII + ISA Accès facile aux expériences et aux données associées Éviter de multiplier les expériences déjà réalisées Se tenir au courant des thématiques / expériences réalisées 33

BioInvIndex Web App Application Web Composée de 2 parties Vue globale des expériences Consultation de chaque expérience sous forme de fiche Moteur de recherche indexé par Apache Lucene But final du BII + ISA Accès facile aux expériences et aux données associées Éviter de multiplier les expériences déjà réalisées Se tenir au courant des thématiques / expériences réalisées 33

Aperçu : BioInvIndex Identification Inscription Recherche Consultation 34

Aperçu : BioInvIndex Recherche libre Recherche par type Nom de l'étude Description Nombre de mesure Assays associés Type de mesure + matériel 35

Aperçu : BioInvIndex Nom de l'étude 36

Aperçu : BioInvIndex Possibilité de faire une recherche sur ce type 37

Aperçu : BioInvIndex Accès aux fichiers ISA-Tab Accès aux fichiers de données 38

Récapitulatif ISA Infrastructure Format ISA-Tab pour l'hébergement des métadonnées expérimentales Suite logicielle ISACreatorConfigurator Création modèle d'expérience ISACreator Création de l'expérience BioInvIndex Dépôt et consultation d'expériences BII Data Manager Gestion du dépôt Projet EMME Environnement de Gestion des métadonnées expérimentale Basé sur l'utilisation d'isa Infrastructure Première version d'un portail : cmonjeau.genouest.org:8180/emme 39

Récapitulatif ISA Infrastructure Format ISA-Tab pour l hébergement des métadonnées expérimentales Suite logicielle ISACreatorConfigurator Création modèle d'expérience ISACreator Création de l'expérience BioInvIndex Dépôt et consultation d'expériences BII Data Manager Gestion du dépôt Projet EMME Environnement de Gestion des métadonnées expérimentale Basé sur l'utilisation d'isa Infrastructure Première version d'un portail : cmonjeau.genouest.org:8180/emme 39

Récapitulatif ISA Infrastructure Format ISA-Tab pour l hébergement des métadonnées expérimentales Suite logicielle ISACreatorConfigurator Création modèle d'expérience ISACreator Création de l'expérience BioInvIndex Dépôt et consultation d'expériences BII Data Manager Gestion du dépôt Projet EMME Environnement de Gestion des métadonnées expérimentale Basé sur l'utilisation d'isa Infrastructure Première version d'un portail : http://cmonjeau.genouest.org:8180/emme 39

Vision générale EMME data ISA-tab PF 1 data ISA-tab PF 2 40

Introduction ISA Infrastructure ISA Software Suite Démonstration

Introduction ISA Infrastructure ISA Software Suite Démonstrations Démonstration Portail, Lancement des outils, Gestionnaire, Galaxy http://cmonjeau.genouest.org:8180/emme

La communauté ISA Bioplatforms Australia framework data initiative, Bioplatforms Australia, Australia Bio-Investigation Index (BII), European Bioinformatics Institute (EBI), UK CSIRO dataset portal, Commonwealth Scientific and industrial Research Organisation (CSIRO), Australia GigaDB, GigaScience journal at BGI, China HMS Library of Integrated Network-based Cellular Signatures (LINCS) project, Harvard Medical School (HMS) LINCS Center, USA HSCI Blood genomics repository, Harvard Stem Cell Institute (HSCI) and Harvard Medical School, USA HSCI Stem cell Discovery engine, Harvard Stem Cell Institute (HSCI) and Harvard Medical School, USA MEtabolomic RepositorY (MeRy-B), UMR1332 INRA and CBiB University of Bordeaux, France Metabolights, European Bioinformatics Institute (EBI), UK NERC envbase, Natural Environmental Research Council s (NERC) Environmental Bioinformatics Centre (NEBC), UK Nutritional Phenotype Database (dbnp), Nutrigenomics, SEEK, Systems Biology of MicroOrganisms (SysMO), pan European consortium Standards-based Infrastructure with Distributed Resources (SIDR), French National Centre for Scientific Research group, France ToxBank Data Warehouse, ToxBank, pan European consortium 41