Un exemple d application d du logiciel pepline: ANNOTATION DU GENOME DE L L ALGUE VERTE CHLAMYDOMONAS REINHARDTII Marianne Tardif #, Annie Adrait #, Norbert Rolland *, Jérôme Garin # # Laboratoire de Chimie des Protéines, ERM Inserm 0201, DRDC/CP - CEA/Grenoble * Laboratoire de Physiologie Cellulaire Végétale, UMR 5019, DRDC/ PCV CEA/Grenoble 17 rue des martyrs F-38054 Grenoble
Chlamydomonas reinhardtii: aspects bio photosynthèse biogénèse (chloroplaste ) mobilité tropisme (phototactisme) autres métabolismes, d intérêt agronomique (synthèse amidon) cycles circadiens réponses au stress Protéines du choloroplaste = 50% des protéines totales
Chlamydomonas reinhardtii: aspects bioinfo http://genome.jgi-psf.org/chlre2/chlre2.home.html Genome : Protéines : ~20 000 sequences 3 211 scaffolds Génome (100 Mb) FGeneSH, GreenGenie, GeneModel Modèles géniques at JGI (Joint Genome Institute) taille : 100 Mb 17 chromosomes version1: 4 000 scaffolds version2: 3 211 scaffolds Biais GC (62%) Annotation au JGI ~3 000 sequences (C. Hauser) ESTs traduits ~700 sequences «Chlamy» (@NCBI) nr
~400 spectres MSMS PepLine versus Mascot mascot ncbi Modèles assignés non assignés (60%) Protéines 154654 16884 20021010.5894.1 gi 131934 X PEU taggor ~4000 PSTs «Clusters» nucléiques pepmap Génome X Combien? Comment les valider? Comment les présenter?
nombre de clusters générés -1 1 bande 331 spectres 2250 tags max. 10 / spectre # hits complets # hits partiels 2 464 + 616 126 = 618590!! d = 1500 nucl. 20 304 clusters!! clusters «géants» ex.30 kb
nombre de clusters générés -2 1 bande 331 spectres 2250 tags # hits complets # hits partiels.. 2 464 1958 clusters 20304 clusters restricted genomic region:
nombre de clusters générés -3 1 bande 331 spectres 2250 tags Mascot # hits complets # hits partiels 2 464 [~2000 protéines ou +! ] 1958 clusters ~20 protéines validées combien sont valides?
1958 clusters validation des clusters -1 1913 «singulet» 7 hits 37 (EAEAISVDVTSK) 8 multiple # peptides différents: >2 2 1 3 hits (multiples) (singulets) Valides??? Bruit? (EAEAISVDVTSK) fonction de score? (AVLIGDESDFER)
validation des clusters -2 Validation indirecte par comparaison avec les résultats r Mascot 1913 (singulets) 8 8 45 (multiples) Existe t-il un modèle déjà décrit à cet endroit? OUI: 26 NON: 11 12 modèles retrouvés (coïncident avec 16 clusters)
Exemple génome:scaffold_165 15117 15251 15544 15565 16036 16111 16455 16639 16911 17119 modèle (prédiction) cluster (Pepline) 15348 15395 16071 16122
Formalisme-1?????????? 15348 15395 16071 16124 seq nc seq aa? modèle (id 157017) >157017 MATDPAGCAAACPAGPLASVLGAAPPGGYDPDQVAAVTFWS FALAPWREVGYNRTMVKATELVALLSNESYLSKPVNASFDY NTTYMREAVRTVYSTAQLPITAAAVPLADGETDIITRLKRN REPIRGNYCPEGSSKPSIVCEGGYYCPNATSQIICPAGYYC KPQSIYPVACPPVVACPEGTESPDGRPLAGLIFAFIVVGMY LLYWVTELGMWVGERIIRHLSLVARIRKNLANLGQIAGITE TQTEEHKEMEKVQEAARARNEVGFQMATMKTSPWWELNENT NIRFRDVRGRMPKGKSGRLENLEYSARLKLPQTVPRVYRHG IIDDTLRMLGMYDKQDRLTGSVENKVISGGERKRVSIGVEI VGKPPILFMDEPTSGLDAARSSELCTLMSNLAAASKTNIIA VIHQPRYSVRC* >157018 MSNALRGLARRVGAQYLRNQRVRGGGGEYPGGSFWSEGTQT GKNGFLFGEVPINGQPRKTLWWEPYWYAGFGGMGVGVYLIY HAKPLEALDIKYWAAPRAAKELETEMRMLDKLNERPDLKER LVAVCKDLNMIEDEAYDLVLMRNEYKVKLGMHTGRVPEDLK AIYEELEA* L Cluster Pepline (id 520) scaffold_165@d1 777 15348 16124 102.. 777 LONGUEUR 15348 nucl DEBUT 16124 nucl FIN 102 COUVERTURE (# nucl) 2 NBRE DE PEPTIDES DIFF SCORES COORD DES HITS etc
Formalisme-2 persistence des résultats r d annotation d? génome:scaffold_165 ESTs 520 comparaison PL Cluster_id: 520 nouvelle piste sur le «browser» 15348 15395 16071 16124
http://www.biology.duke.edu/chlamy_genome/ http://genome.jgi-psf.org/chlre2/chlre2.home.html Chlamy and Co. LA MASSE, LA BIOINFO:. CP /DRDC/ CEA Grenoble Marianne Tardif Annie Adrait Jérôme Garin LES COLLABORATEURS:. UMR 8576 CNRS, Villeneuve d Ascq Steven Ball. UPR-CNRS 1261 /IBPC de Paris/ Francis-André Wollman Olivier Vallon LES ECHANTILLONS, LA BIO:. PCV UMR 5019 /DRDC/ CEA Gre. Norbert Rolland LES CONTACTS AMERICAINS: Stanford Univ & Duke Univ: Arthur R. Grossman Stanford University Charles Hauser Duke University Joint Genome Institute (JGI): Dan Rokhsar Lawrence Berkeley Lab Diego Martinez Los Alamos Nat. Lab Et Les personnes citées pour PepLine!