Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'environnement et Bioinformatique Laboratoire Micro-organismes : Génome et Environnement UMR CNRS 6023 Université Blaise Pascal
Caractérisation des microbiomes Majorité des espèces ( > 99% bactéries ) non cultivées. Grande richesse : 4.10 30 bactéries sur terre, formant plus de 10 9 espèces
Méthodes d'analyse des séquences Recherche de similarité (BLAST, Uclust, ) Classification bayésienne (RDP Classifier, Mothur,...) Approches phylogénétiques (STAP, RAIphy,...)
Approches phylogénétiques Caractérisation taxonomique de l'assemblage microbien Détection de nouveaux clades Analyse de liens évolutifs
Approches phylogénétiques Caractérisation taxonomique de l'assemblage microbien Détection de nouveaux clades Analyse de liens évolutifs Newton et al., 2007
Séquençage d'amplicons Marqueur phylogénétique : petite sous unité de l ARN ribosomique (18S/16S). Universalité Régions conservées / variables
Séquençage aléatoire : métagénomique Séquençage massif aléatoire du pool d'adn prélevé. Approche "naïve" Informations sur différents gènes / fonctions
Outils bioinformatiques PANAM : A Tool for the Phylogenetic Analysis and Taxonomic Affiliation of SSU rrna Amplicons. N. Taïb et al. (BMC Bioinformatics ; en révision) http://code.google.com/p/panam-phylogenetic-annotation METAVIR : a web server dedicated to virome analysis. S. Roux et al. (Bioinformatics ; 2011 Nov 1 ; 27(21) : 3074-5) http://metavir-meb.univ-bpclermont.fr/
Prétraitement Détection des chimères Pangea (Giongo et al ; 2010) Qualité et taille PANAM : Étapes Tri Sample 1 Sample 2 Sample 3 Sample 4 Indices de diversité Clusterisation Uclust (Edgar, 2010) Sample 1 Sample 2 Sample 3 Sample 4 Annotation phylogénétique
PANAM : Étapes d'affiliation Annotation phylogénétique Base de Référence PANAM USEARCH (Edgar, 2010) Sample 1 Sample 2 Sample 3 Sample 4 Séquences requêtes + Taxonomie de la séquence voisine Alignements de référence Séquences requêtes triées selon groupes phylétiques
PANAM : Étapes d'affiliation Annotation phylogénétique Base de Référence PANAM Alignement avec le profil correspondant (HMMER, Eddy, 1998) Alignements de référence Reconstruction Phylogénétique (FastTree, Price et al., 2010) Séquences requêtes triées selon groupes phylétiques Annotation taxonomique Clades environnementaux
PANAM : Restitution taxonomique Restitution taxonomique : capacité du logiciel d'affiliation à déterminer la taxonomie correcte d'une séquence connue. 100% 90% 80% 70% PANAM BLAST STAP RDP 60% 50% Kingdom Phylum Class Order Family Genus Simulations sur séquences complètes (eucaryotes) Restitution : > 90 % au niveau genre Détection de clades environnementaux (Lepère et al., 2008)
PANAM : Restitution taxonomique Simulations sur run de pyroséquençage (400 pb) Eucaryotes 18S Bactéries 16S 100% 100% 90% 90% 80% 70% PANAM STAP RDP 80% 70% PANAM STAP RDP 60% 60% 50% Kingdom Phylum Class Order Family Genus 50% Kingdom phylum Class order Family Genus Restitution : > 75 % au niveau genre pour le 18S > 90 % au niveau genre pour le 16S
PANAM : performances 200 180 160 140 Hours 120 100 80 60 40 20 100 bp 200 bp 400 bp 800 bp 0 5000 50000 100000 250000 500000 750000 1000000 Sequences Simulations sur un CPU 2 GHz Xeon et 24 GB RAM
PANAM : performances 200 180 Dynamique à court terme des petits eucaryotes lacustres 160 Hours 140 120 100 24 prélèvements 348 567 séquences brutes 80 60 248 597 séquences nettoyées 40 20 100 bp 200 bp 400 bp 800 bp 1017 OTUs 0 5000 50000 100000 250000 500000 750000 1000000 Sequences Simulations sur un CPU 2 GHz Xeon et 24 GB RAM Temps de traitement total : 30 minutes Variations à court terme de la diversité du picoplancton eucaryote lacustre : approche par séquençage massif I. Domaizon Poster 12
PANAM : Perspectives Web service intégré, dédié à l'étude de la diversité des microorganismes. Calcul distribué (cluster local / grille de calcul).
PANAM : Perspectives Web service intégré, dédié à l'étude de la diversité des microorganismes. Calcul distribué (cluster local / grille de calcul). Epanam. N. Taib Poster 45
Suivi de communautés microbiennes Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO Évaluation de l impact du tébuconazole (fongicide) sur les communautés bactériennes de lacs et de rivières par une approche de pyroséquençage de l ARNr 16S. N. Pascault Poster 38
Suivi de communautés microbiennes Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO Suivi de communautés spécifiques et comparaison d'échantillons Étude des Archaea en milieu marin ADN & ARN : Diversité / Activité des Archaea 80 échantillons Observation de clades spécifiques Évolution au cours du temps (série temporelle sur 3 ans 1/2) Projet DIVAQUA Diversité spécifique et fonctionnelle des communautés archéennes oxydant l ammonium dans les écosystèmes aquatiques. M. Hugoni Poster 20
Suivi de communautés microbiennes Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO Suivi de communautés spécifiques et comparaison d'échantillons Étude des Archaea en milieu marin ADN & ARN : Diversité / Activité des Archaea 80 échantillons Observation de clades spécifiques Évolution au cours du temps (série temporelle sur 3 ans 1/2) Projet DIVAQUA Suivi globale des communautés microbiennes lacustres Diversité lacustre eucaryote et procaryote : Lac Pavin / Bourget Observatoire de l'environnement Suivi sur une année, en parallèle : 16S Bactéries / 16S Archées / 18S SOERE GLACPE
Outils bioinformatiques PANAM : A Tool for the Phylogenetic Analysis and Taxonomic Affiliation of SSU rrna Amplicons. Najwa Taïb et al. http://code.google.com/p/panam-phylogenetic-annotation METAVIR : a web server dedicated to virome analysis. Simon Roux et al. Bioinformatics (Nov 2011) http://metavir-meb.univ-bpclermont.fr/
Base de données de 80 viromes publiés METAVIR
METAVIR : Arbres phylogénétiques à partir de différents marqueurs
METAVIR : Arbres phylogénétiques à partir de différents marqueurs Cap3 (Huang, 1999) contig_1 read_9 contig_2
METAVIR : Arbres phylogénétiques à partir de différents marqueurs Cap3 (Huang, 1999) contig_1 read_9 contig_2 Hmmer (Eddy,1998) >Chlamydia_phage_1 >Chlamydia_phage_2 >Bdellovibrio_phage >Spiroplasma_virus >contig_1 VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR QST--SVQGNLSAYATST-FDT >contig_2 >read_9 DGST----QGSLGQFSGRVAATYKH TKSFT-EHGVILGLASV
METAVIR : Arbres phylogénétiques à partir de différents marqueurs Cap3 (Huang, 1999) contig_1 read_9 contig_2 Hmmer (Eddy,1998) Gblocks (Talavera & Castresana,2007) PhyML (Guindon & Gascuel, 2003) >Chlamydia_phage_1 >Chlamydia_phage_2 >Bdellovibrio_phage >Spiroplasma_virus >contig_1 >contig_2 >read_9 Chlamydia_phage_1 Chlamydia_phage_2 contig_1 Bdellovibrio_phage Spiroplasma_virus contig_2 Entero_phage_ID22 Entero_phage_NC28 VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR QST--SVQGNLSAYATST-FDT DGST----QGSLGQFSGRVAATYKH TKSFT-EHGVILGLASV Chlamydia_phage_1 Chlamydia_phage_2 read_9 Bdellovibrio_phage Spiroplasma_virus Entero_phage_ID22 Entero_phage_NC28
METAVIR : composition taxonomique GAAS (Angly et al., 2009) Krona (Ondov et al., 2011) Lac du Bourget : Composition taxonomique de la fraction virale
METAVIR : Diversité des Microviridae Lac Bourget / Lac Pavin / Lac Limnopolar
Caractérisation des communautés virales Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir
Caractérisation des communautés virales Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir Diversité des virus d'archaea 6 viromes le long d'un gradient de salinité projet Archevir
Caractérisation des communautés virales Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir Diversité des virus d'archaea 6 viromes le long d'un gradient de salinité projet Archevir Comparaison des communautés virales de milieux extrêmes Virome(s) de la zone anoxique du lac Pavin projet DICENTIM
Gisèle Bronner Jean-Christophe Charvy Didier Debroas Emilie Duffaud François Enault Mylène Hugoni Isabelle Jouan Jean-François Mangot Corinne Petit-Biderre Isabelle Mary Bushra Parveen Vivane Ravet Simon Roux Najwa Taïb Agnès Vellet
Vincent Breton Tung Doan Engelbert Mephu Nguifo Gisèle Bronner Jean-Christophe Charvy Didier Debroas Emilie Duffaud François Enault Mylène Hugoni Isabelle Jouan Jean-François Mangot Corinne Petit-Biderre Isabelle Mary Bushra Parveen Vivane Ravet Simon Roux Najwa Taïb Agnès Vellet Hélène Agogué Agnès Bouchez Isabelle Domaizon Noémie Pascault Jean-François Humbert Julie Leloup Jonathan Colombet Agnès Robin Télèsphore Sime-Ngando Pierre Galand Ian Saulter Joan Artigas Stéphane Pesce Yvan Bettarel