L étude des gènes et des protéines facilitée par l utilisation du web service ProteINSIDE



Documents pareils
Chapitre II La régulation de la glycémie

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Introduction aux bases de données: application en biologie

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

MABioVis. Bio-informatique et la

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Utilisation des substrats énergétiques

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Génétique et génomique Pierre Martin

Gènes Diffusion - EPIC 2010

Tableau récapitulatif : composition nutritionnelle de la spiruline

Vue d ensemble : Office of Cellular, Tissue and Gene Therapies

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Bases de données des mutations

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

des banques pour la recherche

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Title Text. Outil intégré de collecte, d'analyse et de visualisation de données de mobilité

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Rôle des acides biliaires dans la régulation de l homéostasie du glucose : implication de FXR dans la cellule bêta-pancréatique

Big data : vers une nouvelle science des risques?

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

BREVET D ÉTUDES PROFESSIONNELLES AGRICOLES SUJET

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Médecine Pharmacie Dentaire Sage-femme Kinésithérapie ANNÉE UNIVERSIT AIRE

University of Tokyo Graduate School of Agricultural and Life Sciences et. Kanagawa Academy of Science and Technology

I) - DEFINITIONS I-A) TERMINOLOGIE

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

L AUTOGREFFE QUELQUES EXPLICATIONS

Recherche bibliographique

F.Benabadji Alger

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Médecine Pharmacie Dentaire Sage-femme ANNÉE UNIVERSIT AIRE

Transport des gaz dans le sang

La notion de croissance (végétale) en sixième et en première S.

Transport des gaz dans le sang

Base de données bibliographiques Pubmed-Medline

Créer un référentiel client grâce à Talend MDM

L axe 5 du Cancéropole Nord Ouest

Compléments - Chapitre 5 Spectroscopie

Prenez le PLM express

BIG DATA et EDISCOVERY

Epidémiologie appliquée aux sciences vétérinaires DES DAOA DES - DEA

ATELIER SANTE PREVENTION N 2 : L ALIMENTATION

Activité 38 : Découvrir comment certains déchets issus de fonctionnement des organes sont éliminés de l organisme

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Les modes de recherche sur le Web 2.0

Département de Maine et Loire OASIS. Observatoire d Analyse du Système d Information Stratégique

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Nouveautés de. Dynamics GP 2013 R2. Présenté par Sylvain Lavergne

TP3 Test immunologique et spécificité anticorps - déterminant antigénique

L influence du sport sur le traitement du diabète de type 1

«Peut-on jeûner sans risque pour la santé?»

LES OUTILS DU TRAVAIL COLLABORATIF

Intégration de la dimension sémantique dans les réseaux sociaux

Créer un tableau avec LibreOffice / Calc

Environmental Research and Innovation ( ERIN )

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

Ingénieur R&D en bio-informatique

ACIDES BASES. Chap.5 SPIESS

Hépatite chronique B Moyens thérapeutiques

TheAppTimes. STC europe music Box. Manuel d utilisation. Manuel d utilisation du système Ford music Box MBX 01

Depuis des milliers de générations, le ver à soie est l objet d une sélection

Imagerie des tumeurs endocrines Le point de vue de l imagerie moléculaire

Utiliser Access ou Excel pour gérer vos données

Professeur Diane GODIN-RIBUOT

Big data et sciences du Vivant L'exemple du séquençage haut débit

Création d un formulaire de contact Procédure

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

LA QUESTION DE LA PRISE DE POIDS CHEZ LE FUMEUR EN SEVRAGE TABAGIQUE

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

L INSUFFISANCE CARDIAQUE

Les documents primaires / Les documents secondaires

La lutte contre la tuberculose est régie par l arrêté royal du 17 octobre 2002.

Bovins viande. Effectifs troupeaux et animaux par région en Total élevages. Nbre de veaux pesés en VA0. Nbre de veaux pesés en VA4

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

Manufacturing Intelligence Séminaire Connected Entreprise ( 12 mars 2015)

TerrOïko : JEU en collaboration avec la SEEM

EXERCICES : MECANISMES DE L IMMUNITE : pages

Réception du tissus documentation examens sérologiques inspection préparation façonnage

Bibliographie Introduction à la bioinformatique

OUTILS DE FINANCEMENT DE L INNOVATION TECHNOLOGIQUE ET DE LA VALORISATION DE LA RECHERCHE

Insert System. BRANDplates. Un design intelligent et innovant jusque dans les moindres détails

EXERCICE II. SYNTHÈSE D UN ANESTHÉSIQUE : LA BENZOCAÏNE (9 points)

Guide d utilisation. Version 1.1

AVANT-PROPOS INTRODUCTION INSTALLATION INSTALLER LE PLUGIN ZOTERO INSTALLER LE MODULE DE CITATION...

Composition corporelle

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

La musculation CP5. Orienter et développer les effets de l activité physique en vue de l entretien de soi

L APS ET LE DIABETE. Le diabète se caractérise par un taux de glucose ( sucre ) trop élevé dans le sang : c est l hyperglycémie.

Transcription:

L étude des gènes et des protéines facilitée par l utilisation du web service ProteINSIDE KASPRIC Nicolas Thèse débutée en février 2013 Equipe Amuvi Encadrants : Muriel BONNET Brigitte PICARD Avec l appui de Matthieu REICHSTADT Financement : Région Auvergne Apis-Gene

Contexte Carcasses Age > Race > Elevage Le muscle pour le rendement et la tendreté Le tissu adipeux (TA) pour le goût mais diminue le rendement Variabilité importante du rapport masse TA / masse muscle Des interactions entre TA et muscle suggérées. Chronologie dans la croissance des tissus Variations inverses des masses de tissus: génotypes extrêmes et qui commencent à être expliquées 2

Contexte Interactions TA / Muscle Type et abondance des cellules progénitrices? Spécificités métaboliques des tissus? Relations endocrines entre les tissus? Rapport TA / muscle TA Muscle Nombreuses données issues d études de génomique Outil pour étudier ces données Spécifique aux ruminants Exploiter les connaissances produites pour les espèces modèles et l Homme Connaissances sur les interactions Afin de maîtriser ce rapport, il faut mieux connaître les interactions entre le TA et le muscle 3

Contexte Milliers de protéines / gènes à analyser Manuellement - Recherche d identifiants - Recherche de fonctions - Rassemblement et tri des résultats - Recherche de liens entre les protéines - Comparaison avec les réseaux existants -.. Automatiquement Inexistant 4

ProteINSIDE ProteINSIDE : un outil automatisé pour identifier, annoter et lier des protéines/gènes chez le ruminant. Interpréter Données de génomique Automatiser Outil pour analyser des groupes de protéines/gènes Concevoir Programmation workflow, base de données et interface web Accès aux analyses Informations sur ProteINSIDE Exemple Utilisation gratuite : www.proteinside.org 5

1] Conception de ProteINSIDE

ProteINSIDE Identifier, annoter et lier des groupes de protéines/gènes. Rassemblement d informations Workflow Base de données Web interface Stockage des informations biologique pour le workflow, des analyses et des résultats. Création d analyses et accès aux résultats. Interactions protéine-protéine Alignement de séquences Prédiction de peptides signaux Gene Ontology 7

La base de données de ProteINSIDE Résultats des analyses effectuées avec ProteINSIDE Assemblage de bases de données Liste d attente des analyses Web service Web interface Listes des utilisateurs 8

9

Le web service ProteINSIDE BDD ProteINSIDE ID Résultats Liste de protéines/gènes Visualisation Nouveau JOB JOB terminé Interface web de ProteINSIDE ID Mapping Paramètres Résultats MODULES Alignement Blastp Annotation GO Prédiction de peptide SignalP 4.1 PPi Psicquic Web service 10

L interface web de ProteINSIDE Utilisateurs Visiteurs Compte personnel Manager de travaux Accès à toutes les analyses Accès à tous les outils Pas de compte Résultats disponible 1 mois Accès restreint X Interface Web ProteINSIDE ProteCONVERT Résultats en ligne Résultats téléchargeable Tutoriaux Mise à jours et version du service Statistiques du service Citations 11

L interface web de ProteINSIDE Convertisseur d identifiants IDS de protéines ou de gènes Workflow d analyse des protéines et des gènes 1 2 3 4 Placé en file d attente du workflow 12

L interface web de ProteINSIDE Utilisateurs Terminée File d attente En cours Accès aux résultats Visiteurs 13

2] La biologie avec ProteINSIDE

ProteINSIDE ProteINSIDE Informations Ontologie de gène (GO) Protéines sécrétées Processus Localisations cellulaires Exemple 133 protéines : - Glycolyse - Chaine respiratoire - Hormones ProteINSIDE Fonctions synthétise automatiquement les moléculaires informations disponibles pour un gène/protéine dans les bases de données Interactions protéine-protéine 15

ProteINSIDE Module de récupération d informations biologique : simple appel à la base de données de ProteINSIDE Identifiants Fonction Spécificités ProteINSIDE synthétise automatiquement les informations disponibles pour un gène /une protéine dans les bases de données NCBI et UniProtKB NCBI - Coordinators NR 2013 UniProtKB - Magrane et al. 2011 16

ProteINSIDE ProteINSIDE Exemple des protéines : - Glycolyse - chaine respiratoire - hormone Informations Ontologie de gène (GO) Protéines sécrétées Processus Localisations cellulaires Fonctions moléculaires Interactions protéine-protéine Dictionnaire hiérarchisé de termes GO ProteINSIDE recherche pour des protéines ou des gènes les termes de la «Gene Ontology (GO)» (on parle d annotations). 17

ProteINSIDE Module de Gene Ontology - Appel à la BDD pour annoter les protéines - Calcul de la représentativité des fonctions biologique - Calcul des probabilité qu une protéine agisse bien dans une fonction biologique - Calcul du lien entre les fonctions - Fonctions dans lesquelles les protéines vont entrer en jeu (activation / inactivation de réactions ) QuickGO - Binns et al. 2009 GO.org - Ashburner et al. 2000 18

ProteINSIDE ProteINSIDE Exemple des protéines : - Glycolyse - chaine respiratoire - hormone Informations Ontologie de gène (GO) Protéines sécrétées Processus Localisations cellulaires Fonctions moléculaires Interactions protéine-protéine ProteINSIDE prédit la sécrétion d une protéine en : - Identifiant un peptide signal sur la séquence d acides aminés - Recherchant des termes GO liés à la localisation cellulaire 19

ProteINSIDE Module de Protéines sécrétée - Alignement de séquences - Calcul de la probabilité d apparition d un peptide signal - Vérification du peptide signal - Calcul de la probabilité que la protéine soit bien sécrété par rapport à son background - Comparaison avec les fonction biologique GO Protéines potentiellement sécrété et GO liés à la sécrétion des protéines ProteINSIDE prédit la sécrétion d une protéine en utilisant l algorithme SignalP et les termes GO reliés à la sécrétion SignalP (v 4.1) - Petersen et al. 2011 20

ProteINSIDE ProteINSIDE Exemple des protéines : - Glycolyse - chaine respiratoire - hormone Informations Ontologie de gène (GO) Protéines sécrétées Processus Localisations cellulaires Fonctions moléculaires Interactions protéine-protéine L analyse de réseaux d interactions (interactome) pour identifier la fonction et/ou le rôle central de protéines dans des mécanismes 21

ProteINSIDE Entre protéines du jeu de données (36 interactions ) Entre protéines du jeu de données et extérieures (616 interactions ) ProteINSIDE réalise des réseaux de protéines pour mettre en évidence des mécanismes PsicQuick - Aranda et al. 2011 Cytoscape web - Lopes et al. 2010 22

ProteINSIDE Application Informations Ontologie de gène (GO) 1 3 Protéines sécrétées Interactions protéine-protéine 3 2 2 3 1 2 3 Processus Localisations cellulaires Fonctions moléculaires 1 2 3 Interactions TA / Muscle Type et abondance des cellules progénitrices? Spécificités métaboliques des tissus? Relations endocrines entre les tissus? ProteINSIDE sera utilisé pour identifier des gènes et des protéines spécifiques de cellules musculaires ou adipeuses, de voies métaboliques, des adipokines ou des myokines 23

Application Milliers de protéines / gènes à analyser Manuellement - Recherche d identifiants biologique - Recherche de fonctions biologique - Rassemblement et trie des résultats - Plusieurs mois d étude Automatiquement 2 min d analyse pour 1000 protéines 1 jour d analyse pour génome bovin (33 000 protéines) 24

MERCI DE VOTRE ATTENTION www.proteinside.org