Les bases de données transcriptionnelles en ligne



Documents pareils
Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

OUTILS DE FINANCEMENT DE L INNOVATION TECHNOLOGIQUE ET DE LA VALORISATION DE LA RECHERCHE

Introduction aux bases de données: application en biologie

MODE D'EMPLOI. La gestion des versions permettra de compléter et de faire évoluer les fiches dans le temps. NOM DE LA RESSOURCE CONTACT FOURNISSEUR

Approches bioinformatiques de la cis-régulation

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Ocularis. NOVADIS 14 place Marie Jeanne Bassot Levallois Perret Tel : +(33) Fax : +(33)

FazaANGEL supervision pro-active

Evolutions technologiques et intégration européenne, la nécessaire mutation des échanges banque-entreprise

Artica Proxy Appliance Haute disponibilite

Informations techniques

<Insert Picture Here> La GRC en temps de crise, difficile équilibre entre sentiment de sécurité et réduction des coûts

CATALOGUE DES PRESTATIONS DE LA

TEPZZ 6Z85Z5A T EP A2 (19) (11) EP A2 (12) DEMANDE DE BREVET EUROPEEN

L'ELECTRONIQUE AU. Innov'Day PEP Bellignat 24 Avril 2014

Bases de données des mutations

Mercredi 15 Janvier 2014

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

1 Introduction à l infrastructure Active Directory et réseau

LES ESCALIERS. Du niveau du rez-de-chaussée à celui de l'étage ou à celui du sous-sol.

Les nouvelles architectures des SI : Etat de l Art

Moteurs de recommandations & pertinence de la conversation. Hervé Mignot herve.mignot@equancy.com 24 Mai 2011

10. Base de données et Web. OlivierCuré

Macroscope et l'analyse d'affaires. Dave Couture Architecte principal Solutions Macroscope

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Fusion : l interopérabilité chez Oracle

XBRL, Solvabilité II et l Autorité de Contrôle Prudentiel

energy BOX WEB Automates de GTB

Notions d asservissements et de Régulations

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Les Entrepôts de Données

Réduction de la consommation énergétique des datacenter : optimisation du conditionnement d air, influence de. l architecture

IGEL : Le «cloud sourcing», un nouveau marché pour les clients légers

Système de mesure et d enregistrement ESS III pression et température

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Les Enjeux du Smart Water. Eau. Novembre 2013 Fabrice Renault Directeur commercial France. Schneider Electric Fabrice Renault 1

Rôle des acides biliaires dans la régulation de l homéostasie du glucose : implication de FXR dans la cellule bêta-pancréatique

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Université Toulouse 3 Paul Sabatier (UT3 Paul Sabatier) Mathilde de TAFFIN de TILQUES. 29 Octobre tre :

ALCATEL EYE-BOX LA RÉPONSE AUX BESOINS ESSENTIELS DE COMMUNICATION DES TPE/PME

Les Data Management Platforms (DMP)

1 - Diag Le réseau de partenaires. La formation partenaires. Diag FORMITEL. Stratégie méthode - outils

Cognit Ive Cas d utilisation

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Centre Universitaire LA CITADELLE 220, avenue de l Université B.P DUNKERQUE CEDEX 1 GUIDE DES ETUDES LICENCE PROFESSIONNELLE

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Enterprise Data Quality : fiabilisez vos processus E-Business Suite en améliorant la qualité des données

PLATEFORME DE SUPERVISION

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Définition, typologie et méthodologie d évaluation des avantages immatériels dans le cadre du service universel postal

Introduction au Data-Mining

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

ELOECM Conference2015

Mise en œuvre de l architecture SINP. Forum ATEN des TIC 4 juin Y. Lebeau MEDDE/DGALN/DEB/PEM4

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en Énoncé.


Les réseaux du future

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Connaissance Client et Digital : quels enjeux pour quelles valeurs? Non à la personnalisation bidon! Vente Privée Orange Gan Assurances

FORMATION WS1204 ADMINISTRATION D'UNE INFRASTRUCTURE DE GESTION DES POSTES DE TRAVAIL SOUS WINDOWS SERVER 2012

Le Cloud ou l informatique d entreprise à la carte. Copyright Olivier PAVIE ValorConseil PACA Novembre 2013

FOSS Enterprise Integration Plattaform

Suite bureautique, les enjeux d'une alternative.

UE 8 Systèmes d information de gestion Le programme

N. Paparoditis, Laboratoire MATIS

Oracle Fusion Middleware Concepts Guide 11g Release 1 (11.1.1) Figure 1-1 Architecture Middleware

Les attentes du marché

Le poste de travail Linux virtualisé. GUIDE Share France, le 25 juin La Cantine - Paris

Table des matières Chapitre 1 Virtualisation, enjeux et concepts Chapitre 2 Ligne de produit XEN

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

TSM EVOLUTION > SYSTÈME DE DÉTECTION INCENDIE ADRESSABLE ET CONVENTIONNEL ADR

Mobilitics : Saison 1 : résultats iphone. Conférence de presse du 9 avril 2013

à la fonction remplie par la pièce. AMP 1200 est un système de ventilation décentralisée d'applications. AMP 1200 est une centrale

Lot 4: Validation industrielle. Youness LEMRABET Pascal YIM, 19/11/2010

LIVRE BLANC. La garantie de la meilleure performance réseau pour les applications Cloud

Club AM N 19, janvier 2008 Eric PARISOT, GRITA. DIRECTIVE ABUS de MARCHÉ : En quoi les SGP sont-elles concernées?

Université de Bangui. Modélisons en UML

LA STRATEGIE E-MAROC E UNE AMBITION NATIONALE

Revision of hen1317-5: Technical improvements

Inscription en ligne FQSC. Guide d utilisation

Le solaire: état des lieux de la réglementation internationale & évolution des projets des normes ISO en cours

LOGICIEL INTÉGRÉ POUR LE SECOND ŒUVRE

JOSY. Paris - 4 février 2010

e-leasevision Votre solution de gestion complète de la LLD avec cotation en ligne intégrée

Mise en place du Business Activity Monitoring (BAM) pour piloter les processus logistiques grâce aux Echanges de Données Informatisés (EDI)

Citrix XenApp 7.5 Concepts et mise en oeuvre de la virtualisation d'applications

Le marketing suisse à l'heure du Big Data. 19 Février 2015

Introduction aux Bases de Données Relationnelles Conclusion - 1

CBBC Canadian Business & Biodiversity Council

AdjumedCollect. manuel pour l utilisateur. Version: AdjumedCollect est l instrument servant à la saisie des données.

ENREGISTREUR DE COMMUNICATIONS

Urbanisme du Système d Information et EAI

Petite définition : Présentation :

Cloud Computing. 19 Octobre 2010 JC TAGGER

Programme Agroforesterie 2006/08. Groupe de Travail GT1

Transcription:

Les bases de données transcriptionnelles en ligne

Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription TTGATGTCTCC AGTAATGCGACCATTAC ACCCATTTGGCTTCCCATTTCGA TATCAATTAG ACCCAATTAGTAATAAAT - structure? - classe? - orthologues? matrice - fréq. / poids-position? - type de correction? A 1 1 6 0 7 7 6 5 C 2 5 0 0 0 0 0 0 G 0 1 1 0 0 0 0 1 T 4 0 0 7 0 0 1 1 gène(s) cible(s) module cis-régulateur - taille/position génomique? TF présents? technique expérimentale utilisée? gène cible?

Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription TTGATGTCTCC AGTAATGCGACCATTAC ACCCATTTGGCTTCCCATTTCGA TATCAATTAG ACCCAATTAGTAATAAAT - structure? - classe? - orthologues? matrice - fréq. / poids-position? - type de correction? A 1 1 6 0 7 7 6 5 C 2 5 0 0 0 0 0 0 G 0 1 1 0 0 0 0 1 T 4 0 0 7 0 0 1 1 gène(s) cible(s) module cis-régulateur - taille/position génomique? TF présents? technique expérimentale utilisée? gène cible?

Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription TTGATGTCTCC AGTAATGCGACCATTAC ACCCATTTGGCTTCCCATTTCGA TATCAATTAG ACCCAATTAGTAATAAAT - structure? - classe? - orthologues? matrice - fréq. / poids-position? - type de correction? A 1 1 6 0 7 7 6 5 C 2 5 0 0 0 0 0 0 G 0 1 1 0 0 0 0 1 T 4 0 0 7 0 0 1 1 gène(s) cible(s) module cis-régulateur - taille/position génomique? TF présents? technique expérimentale utilisée? gène cible?

Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription TTGATGTCTCC AGTAATGCGACCATTAC ACCCATTTGGCTTCCCATTTCGA TATCAATTAG ACCCAATTAGTAATAAAT - structure? - classe? - orthologues? matrice - fréq. / poids-position? - type de correction? A 1 1 6 0 7 7 6 5 C 2 5 0 0 0 0 0 0 G 0 1 1 0 0 0 0 1 T 4 0 0 7 0 0 1 1 gène(s) cible(s) module cis-régulateur - taille/position génomique? TF présents? technique expérimentale utilisée? gène cible?

Quelques bases de données

base de donnée commerciale (licence payante publique gratuite 800 1600 ) + version

Qualité des sites Transfac 12000 10000 8000 6000 4000 2000 0 1 2 3 4 5 6 Scores de qualité 1 : Functionally confirmed factor binding site 2: Binding of pure protein (purified or recombinant) 3: Immunologically characterized binding activity of a cellular extract 4: Binding activity characterized via a known binding sequence 5: Binding of uncharacterized extract protein to a bone fide element 6: No quality assigned

Recherche E2F dans Transfac publique classification interacteurs matrices

Recherche E2F dans Transfac publique sites de fixation références

3 Matrices E2F Transfac quelles différences?

[Sandelin A, Alkema W, Engstrom P, Wasserman WW, Lenhard B.] alternative open-source à Transfac taille plus réduite: 459 matrices (oct. 2009) Répartition taxonomique des matrices Origine des données JASPAR 160 200 140 180 160 in vitro 120 140 100 120 80 100 80 60 60 in vivo 40 40 20 20 0 g fun v i eb e rt es ra t in ts sec es nts te s d a a l o t d p r ma ho c ne o ur 0 PB M I q A D ip E X al 1H A se L -se PILE MS ip-ch p E i i E r N S D M Ch cte Ch CO ba essentiellement des données in-vitro, donc pas de gène cible!

Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription TTGATGTCTCC AGTAATGCGACCATTAC ACCCATTTGGCTTCCCATTTCGA TATCAATTAG ACCCAATTAGTAATAAAT - structure? - classe? - orthologues? matrice - fréq. / poids-position? - type de correction? A 1 1 6 0 7 7 6 5 C 2 5 0 0 0 0 0 0 G 0 1 1 0 0 0 0 1 T 4 0 0 7 0 0 1 1 gène(s) cible(s) module cis-régulateur - taille/position génomique? TF présents? technique expérimentale utilisée? gène cible?

E2F dans Jaspar

But: standardiser et centraliser les informations sur la régulation transcriptionnelle inclut certaines bases de données mise en place d'une architecture unifiée: tout le monde peut mettre ses données dans PAZAR et les rendre publiques ou non... open-access et open-source (TRANSFAC n'en fait pas partie) standards GFF (localisation génomique) et XML

aucun gène cible aucun facteur de transcription spécifique d'un gène cible ("gene centric") spécifique d'un FT ("TF centric")

E2F dans PAZAR

Navigateur UCSC target gene

[ Griffith OL et al.] Idée: aller chercher les informations dans la littérature scientifique Comment? en mettant à contribution la communauté scientifique Oreganno met à disposition des curateurs un corpus d'articles scientifiques soumis par des experts identifiés par des approches de text-mining automatiques (recherche de mots typiques comme "transcription factor", "binding site",...)

Oreganno inclut également des données provenant d'autres projets à grande échelle

E2F dans Oreganno site de fixation polymorphisme

Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription TTGATGTCTCC AGTAATGCGACCATTAC ACCCATTTGGCTTCCCATTTCGA TATCAATTAG ACCCAATTAGTAATAAAT - structure? - classe? - orthologues? matrice - fréq. / poids-position? - type de correction? A 1 1 6 0 7 7 6 5 C 2 5 0 0 0 0 0 0 G 0 1 1 0 0 0 0 1 T 4 0 0 7 0 0 1 1 gène(s) cible(s) module cis-régulateur - taille/position génomique? TF présents? technique expérimentale utilisée? gène cible?

[Gallo, S. M., Li, L., Hu, Z. and Halfon, M. S] base de données de modules cis-régulateurs et de TFBS chez la drosophile CRM sans TFBS CRM avec TFBS

Take home messages nombreuses bases de données, contenant différents types d'information information généralement parcellaire: TF mais pas de gène cible, CRM sans TF, etc... les matrices des différentes bases de données sont souvent différentes: impact de cette différence? attention à l'origine des données: in-vivo, in-vitro, in-silico