ANNOTATION DU GENOME DE L L ALGUE VERTE CHLAMYDOMONAS REINHARDTII

Documents pareils
Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Physiopathologie : de la Molécule à l'homme

Test de terrain ou test de laboratoire pour la performance en endurance?

Identification de nouveaux membres dans des familles d'interleukines

Retour d expérience, portage de code Promes dans le cadre de l appel à projets CAPS-GENCI

Marie Curie Actions Marie Curie Career Integration Grant (CIG) Call: FP7-People-2012-CIG

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

DIRECTEUR ADJOINT DES VENTES

Big data et sciences du Vivant L'exemple du séquençage haut débit

Programme consultant expert (PCE)

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Eco-système calcul et données

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

Reproductibilité des expériences de l article "Analyse et réduction du chemin critique dans l exécution d une application"

Protéomique Séance 1 Introduction aux données de protéomique et aux outils de recherche

P R E S E N T A T I O N E T E V A L U A T I O N P R O G R A M M E D E P R E V E N T I O N «P A R L E R»

REMARQUES IMPORTANTES. - L usage d une calculatrice non programmable est autorisé.

Bologne à l EPFL. Réforme de Bologne Implications pour l EPFL. Prof. Dominique Bonvin, Doyen Bachelor-Master

Thierry DELZESCAUX. «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France.

Cursus de Master en Ingénierie de la Production Alimentaire. Une autre façon d accéder au métier d ingénieur

PROGRAMMES DONT LES UNIVERSITES PARTENAIRES SONT DIPLOMANTES. N.B : DIPLOME DE TECHNICIEN SUPERIEUR(DTS) : équivaut au BAC+2

Végétaux Exemples d individus

Etudier à l EPFL Les spécialités. Maya Frühauf Service de promotion des études

Cellules procaryotes Service histologie Pr.k.mebarek

MASTER MANAGEMENT PARCOURS MARKETING ET COMMUNICATION

«39 ans d expérience» ( )

Jean-Claude THOENIG. Adresse personnelle : 11, boulevard du Temple F Paris. jeanclaude.thoenig@free.fr. Juillet 2014

Liste des projets retenus en 2009

Laboratoire de Photophysique et de Photochimie Supra- et Macromoléculaires (UMR 8531)

Enregistrement et transformation du son. S. Natkin Novembre 2001

La publication d un classement

FORMATIONS STAGES INSERTION PROFESSIONNELLE. UFR Sciences Orsay. Isabelle DEMACHY

Large succès de l introduction en bourse de Genomic Vision sur Euronext à Paris qui lève 23,0 M

Budget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud

CULTURE GÉNÉRALE Histoire de l Art (RC) Philosophie (FB)

[Présentation] Juillet 2005

Mesures de PAR. Densité de flux de photons utiles pour la photosynthèse

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

UNIVERSITÉ DE LOMÉ DÉPARTEMENT DE BOTANIQUE

Description des documents du fonds Trié par cote

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

UFR Sciences Fondamentales et Appliquées Université de Poitiers. Se réorienter à l UFR Sciences Fondamentales et Appliquées en janvier 2013

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Métriques, classements et politique scientifique des Etablissements

Les Parcours Scientifiques et les Ecoles Doctorales

COLLOQUE 8 - RELÈVE PME ET SUCCESSION D'ENTREPRISES FAMILIALES. ENJEUX STRATEGIQUES, ORGANISATIONNELS ET HUMAINS

Calcul des indicateurs de sonie : revue des algorithmes et implémentation

Master Informatique Aix-Marseille Université

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

M1 Informatique, Réseaux Cours 9 : Réseaux pour le multimédia

Quels matériaux biosourcés pour l automobile d aujourd hui et celle de demain? Dr Stéphane DELALANDE Direction des Matériaux et Procédés Innovation

Réforme DFGSM 2 et 3

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

Les personnels en charge de la communication au CNRS FLORENCE BOUYER

l excellence PROGRAMME 22 JUIN 2013 PORTES OUVERTES EURALILLE EURASANTÉ EURATECHNOLOGIES HAUTE BORNE PLAINE IMAGES CETI Lille Métropole

Recherche et Formation dans un environnement de pointe. Contact:

Notre métier : Vous accompagner dans votre Projet

Emergence du Big Data Exemple : Linked Open Data

( DOSSIER DE PRESENTATION GENERALE )

évaluation des risques professionnels

Dossier de Presse. Opportunités de Sponsoring

à l intelligence économique

Université Paris Saclay De quoi parle t-on?

Licence Chimie et procédés

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Mise en place d une démarche qualité dans un système d information

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Mise en Forme des Matériaux Polymères Polymer Processing. Philippe Cassagnau

PERSONNEL RETRAITE AYANT UNE ACTIVITE BENEVOLE A L UNIVERSITE PIERRE ET MARIE CURIE

Master en Biochimie et Biologie moléculaire et cellulaire (BBMC)

TP Modulation Démodulation BPSK

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Génétique et génomique Pierre Martin

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Accédez au test ici

CATALOGUE DES PRESTATIONS DE LA

Possibilités offertes après la L2?

Expérience 3 Formats de signalisation binaire

Base de données bibliographiques Pubmed-Medline

Panorama des formations en biotechnologie

Formation L.M.D. en instrumentation biomédicale. Mise en œuvre dans une université scientifique et médicale : Claude Bernard Lyon I

HAL-Pasteur. La plate-forme d archive ouverte de l Institut Pasteur. Formation au dépôt d articles.

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

VIVAGO WELLNESS DOSSIER DE PRESSE

MANUEL UTILISATEUR BALADEUR SANTÉ AUXILIAIRES MÉDICAUX ET SAGES-FEMMES C.D.C 1.40

Formules emprunts obligataires

Résonance Magnétique Nucléaire : RMN

La mondialisation qu on évoque souvent après

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

DOCM Solutions officielles = n 2 10.

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Les plantes et la lumière

Résolvez vos problèmes d énergie dédiée à l informatique

Comptabilité à base d activités (ABC) et activités informatiques : une contribution à l amélioration des processus informatiques d une banque

Sommeil, fatigue au volant et jeunes conducteurs

Chapitre 02. La lumière des étoiles. Exercices :

Transcription:

Un exemple d application d du logiciel pepline: ANNOTATION DU GENOME DE L L ALGUE VERTE CHLAMYDOMONAS REINHARDTII Marianne Tardif #, Annie Adrait #, Norbert Rolland *, Jérôme Garin # # Laboratoire de Chimie des Protéines, ERM Inserm 0201, DRDC/CP - CEA/Grenoble * Laboratoire de Physiologie Cellulaire Végétale, UMR 5019, DRDC/ PCV CEA/Grenoble 17 rue des martyrs F-38054 Grenoble

Chlamydomonas reinhardtii: aspects bio photosynthèse biogénèse (chloroplaste ) mobilité tropisme (phototactisme) autres métabolismes, d intérêt agronomique (synthèse amidon) cycles circadiens réponses au stress Protéines du choloroplaste = 50% des protéines totales

Chlamydomonas reinhardtii: aspects bioinfo http://genome.jgi-psf.org/chlre2/chlre2.home.html Genome : Protéines : ~20 000 sequences 3 211 scaffolds Génome (100 Mb) FGeneSH, GreenGenie, GeneModel Modèles géniques at JGI (Joint Genome Institute) taille : 100 Mb 17 chromosomes version1: 4 000 scaffolds version2: 3 211 scaffolds Biais GC (62%) Annotation au JGI ~3 000 sequences (C. Hauser) ESTs traduits ~700 sequences «Chlamy» (@NCBI) nr

~400 spectres MSMS PepLine versus Mascot mascot ncbi Modèles assignés non assignés (60%) Protéines 154654 16884 20021010.5894.1 gi 131934 X PEU taggor ~4000 PSTs «Clusters» nucléiques pepmap Génome X Combien? Comment les valider? Comment les présenter?

nombre de clusters générés -1 1 bande 331 spectres 2250 tags max. 10 / spectre # hits complets # hits partiels 2 464 + 616 126 = 618590!! d = 1500 nucl. 20 304 clusters!! clusters «géants» ex.30 kb

nombre de clusters générés -2 1 bande 331 spectres 2250 tags # hits complets # hits partiels.. 2 464 1958 clusters 20304 clusters restricted genomic region:

nombre de clusters générés -3 1 bande 331 spectres 2250 tags Mascot # hits complets # hits partiels 2 464 [~2000 protéines ou +! ] 1958 clusters ~20 protéines validées combien sont valides?

1958 clusters validation des clusters -1 1913 «singulet» 7 hits 37 (EAEAISVDVTSK) 8 multiple # peptides différents: >2 2 1 3 hits (multiples) (singulets) Valides??? Bruit? (EAEAISVDVTSK) fonction de score? (AVLIGDESDFER)

validation des clusters -2 Validation indirecte par comparaison avec les résultats r Mascot 1913 (singulets) 8 8 45 (multiples) Existe t-il un modèle déjà décrit à cet endroit? OUI: 26 NON: 11 12 modèles retrouvés (coïncident avec 16 clusters)

Exemple génome:scaffold_165 15117 15251 15544 15565 16036 16111 16455 16639 16911 17119 modèle (prédiction) cluster (Pepline) 15348 15395 16071 16122

Formalisme-1?????????? 15348 15395 16071 16124 seq nc seq aa? modèle (id 157017) >157017 MATDPAGCAAACPAGPLASVLGAAPPGGYDPDQVAAVTFWS FALAPWREVGYNRTMVKATELVALLSNESYLSKPVNASFDY NTTYMREAVRTVYSTAQLPITAAAVPLADGETDIITRLKRN REPIRGNYCPEGSSKPSIVCEGGYYCPNATSQIICPAGYYC KPQSIYPVACPPVVACPEGTESPDGRPLAGLIFAFIVVGMY LLYWVTELGMWVGERIIRHLSLVARIRKNLANLGQIAGITE TQTEEHKEMEKVQEAARARNEVGFQMATMKTSPWWELNENT NIRFRDVRGRMPKGKSGRLENLEYSARLKLPQTVPRVYRHG IIDDTLRMLGMYDKQDRLTGSVENKVISGGERKRVSIGVEI VGKPPILFMDEPTSGLDAARSSELCTLMSNLAAASKTNIIA VIHQPRYSVRC* >157018 MSNALRGLARRVGAQYLRNQRVRGGGGEYPGGSFWSEGTQT GKNGFLFGEVPINGQPRKTLWWEPYWYAGFGGMGVGVYLIY HAKPLEALDIKYWAAPRAAKELETEMRMLDKLNERPDLKER LVAVCKDLNMIEDEAYDLVLMRNEYKVKLGMHTGRVPEDLK AIYEELEA* L Cluster Pepline (id 520) scaffold_165@d1 777 15348 16124 102.. 777 LONGUEUR 15348 nucl DEBUT 16124 nucl FIN 102 COUVERTURE (# nucl) 2 NBRE DE PEPTIDES DIFF SCORES COORD DES HITS etc

Formalisme-2 persistence des résultats r d annotation d? génome:scaffold_165 ESTs 520 comparaison PL Cluster_id: 520 nouvelle piste sur le «browser» 15348 15395 16071 16124

http://www.biology.duke.edu/chlamy_genome/ http://genome.jgi-psf.org/chlre2/chlre2.home.html Chlamy and Co. LA MASSE, LA BIOINFO:. CP /DRDC/ CEA Grenoble Marianne Tardif Annie Adrait Jérôme Garin LES COLLABORATEURS:. UMR 8576 CNRS, Villeneuve d Ascq Steven Ball. UPR-CNRS 1261 /IBPC de Paris/ Francis-André Wollman Olivier Vallon LES ECHANTILLONS, LA BIO:. PCV UMR 5019 /DRDC/ CEA Gre. Norbert Rolland LES CONTACTS AMERICAINS: Stanford Univ & Duke Univ: Arthur R. Grossman Stanford University Charles Hauser Duke University Joint Genome Institute (JGI): Dan Rokhsar Lawrence Berkeley Lab Diego Martinez Los Alamos Nat. Lab Et Les personnes citées pour PepLine!