Analyse des données de séquençage massif par des méthodes phylogénétiques



Documents pareils
Big data et sciences du Vivant L'exemple du séquençage haut débit

L Équipe de Microbiologie Aquatique

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Retour d expérience, portage de code Promes dans le cadre de l appel à projets CAPS-GENCI

Nous vous prions d agréer, Madame, Monsieur, l expression de nos sentiments les meilleurs.

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution?

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

RÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition

Vue d ensemble de la vie microbienne

CHAPITRE 3 LA SYNTHESE DES PROTEINES

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

Réunion du réseau de génétique du Département EFPA

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

Gènes Diffusion - EPIC 2010

MABioVis. Bio-informatique et la

5. Matériaux en contact avec l eau

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

L IRSN et la surveillance de l environnement. Etat des lieux et perspectives

Effet des virus et des protistes flagellés sur les ressources nutritives et sur la dynamique et la structure de la communauté bactérienne lacustre

Eco-système calcul et données

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

Liste des matières enseignées

Guide de Tarification. Introduction Licence FD Entreprise Forfaits clé en main SaaS SaaS Dédié SaaS Partagé. Page 2 Page 3 Page 4 Page 5 Page 8

«Poursuivre au-delà de BEEST : une approche fonctionnelle basée sur les traits de vie des espèces en relation avec l habitat».

Brest (29) Lessay (50), Mars 2012

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Tutoriel Cloud IFB - Initiation -

Environmental Research and Innovation ( ERIN )

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

SERVICES DE SEQUENÇAGE

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE)

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Les macroinvertébrés: des bioindicateurs incontournables pour le monitoring des cours d eau en CH

Projet IGGI. Infrastructure pour Grappe, Grille et Intranet. Fabrice Dupros. CASCIMODOT - Novembre Systèmes et Technologies de l Information

Master 2. Mention : «Ecosciences, Microbiologie» Domaine : Sciences Technologies Santé Responsable : F. Menu

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Bases de données des mutations

Jean-François Boulicaut & Mohand-Saïd Hacid

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Domaine : Sciences, Technologies et Santé Mention : Nutrition, Sciences des aliments, Agroalimentaire

Caches sémantiques coopératifs pour la gestion de données sur grilles

C. Magdo, Altis Semiconductor (Corbeil-Essonne) > NOTE D APPLICATION N 2

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

de l air pour nos enfants!

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

L Indice Environnemental

Comportements (The Observer XT) : activité générale du conducteur : (entre autres) mouvements des mains, position, verbalisations.

MASTER 2 CONTAMINANTS EAU SANTE

Structure de base d un ordinateur

CATALOGUE DE PRESTATIONS FORMATION ET CONSEILS

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

Maarch Framework 3 - Maarch. Tests de charge. Professional Services. 11, bd du Sud Est Nanterre

Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

Présentation du programme

Résistance du VIH-1 aux antirétroviraux dans les compartiments anatomiques et cellulaires

IBM Software Group. Migration vers Tivoli Workload Scheduler. Philippe TESSIER 2009 IBM Corporation

Ingénieur R&D en bio-informatique

Capteurs Passifs et Outils de Monitoring des Sédiments

grande simple microscope microscope inventé années biologie = cellule) et (logos de plus en Anglais. Utilise un La microscopie, 1665,

Actualités sur la sélection des pondeuses Prospections futures. Dr. Matthias Schmutz, Lohmann Tierzucht

Conférence technique internationale de la FAO

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Interprétation de l'affleurement 3: a: argilites compactes, b: niveaux oxydés, a: argilites shistées, riches en charbon (bitumineuses)

Luca : à la recherche du plus proche ancêtre commun universel Patrick Forterre, Simonetta Gribaldo, Céline Brochier

Mise en place d un réseau d Arboretums pour une valorisation coordonnée des ressources ligneuses ex situ

SysFera. Benjamin Depardon

Introduction au Data-Mining

LSCE Laboratoire des sciences du climat et de l environnement

1.2. REALISATION DES OPERATIONS DE PRELEVEMENTS ET D ANALYSES

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

Introduction au Data-Mining

Hygiène alimentaire en restauration collective

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales

Spécialisation 3A AgroSup Dijon IAA Microbiologie Industrielle et Biotechnologie (MIB)

Raisonnement probabiliste

Surveillance épidémiologique : application à la détection et la prédiction des épidémies

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Hygiène alimentaire en restauration collective

Compte rendu des utilisations du calculateur TITAN au LACy

Procédure d utilisation du Beckman CEQ 2000 XL pour la réalisation de programmes de séquençage ou de génotypage.

CATALOGUE DES PRESTATIONS DE LA

Rapport annuel de monitoring automatisé de la qualité de l eau

COMMENTAiRES/ DECISIONS

Disponibilité et fiabilité des services et des systèmes

Rôle des nuages dans l'anomalie de température de l'hiver 2007 en Europe

Évaluation de l AERES sur l unité :

Partager et identifier vos besoins

Les débouchés des diplômés de L LMD Sciences de la Nature et de la Vie

Laboratoire de Photophysique et de Photochimie Supra- et Macromoléculaires (UMR 8531)

Les sciences de l ingénieur appliquées à la prise en charge du

INF6304 Interfaces Intelligentes

Identification de nouveaux membres dans des familles d'interleukines

Intérêt des codes FEC pour le stockage distribué Le projet ANR FEC4Cloud et la solution RozoFS

Transcription:

Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'environnement et Bioinformatique Laboratoire Micro-organismes : Génome et Environnement UMR CNRS 6023 Université Blaise Pascal

Caractérisation des microbiomes Majorité des espèces ( > 99% bactéries ) non cultivées. Grande richesse : 4.10 30 bactéries sur terre, formant plus de 10 9 espèces

Méthodes d'analyse des séquences Recherche de similarité (BLAST, Uclust, ) Classification bayésienne (RDP Classifier, Mothur,...) Approches phylogénétiques (STAP, RAIphy,...)

Approches phylogénétiques Caractérisation taxonomique de l'assemblage microbien Détection de nouveaux clades Analyse de liens évolutifs

Approches phylogénétiques Caractérisation taxonomique de l'assemblage microbien Détection de nouveaux clades Analyse de liens évolutifs Newton et al., 2007

Séquençage d'amplicons Marqueur phylogénétique : petite sous unité de l ARN ribosomique (18S/16S). Universalité Régions conservées / variables

Séquençage aléatoire : métagénomique Séquençage massif aléatoire du pool d'adn prélevé. Approche "naïve" Informations sur différents gènes / fonctions

Outils bioinformatiques PANAM : A Tool for the Phylogenetic Analysis and Taxonomic Affiliation of SSU rrna Amplicons. N. Taïb et al. (BMC Bioinformatics ; en révision) http://code.google.com/p/panam-phylogenetic-annotation METAVIR : a web server dedicated to virome analysis. S. Roux et al. (Bioinformatics ; 2011 Nov 1 ; 27(21) : 3074-5) http://metavir-meb.univ-bpclermont.fr/

Prétraitement Détection des chimères Pangea (Giongo et al ; 2010) Qualité et taille PANAM : Étapes Tri Sample 1 Sample 2 Sample 3 Sample 4 Indices de diversité Clusterisation Uclust (Edgar, 2010) Sample 1 Sample 2 Sample 3 Sample 4 Annotation phylogénétique

PANAM : Étapes d'affiliation Annotation phylogénétique Base de Référence PANAM USEARCH (Edgar, 2010) Sample 1 Sample 2 Sample 3 Sample 4 Séquences requêtes + Taxonomie de la séquence voisine Alignements de référence Séquences requêtes triées selon groupes phylétiques

PANAM : Étapes d'affiliation Annotation phylogénétique Base de Référence PANAM Alignement avec le profil correspondant (HMMER, Eddy, 1998) Alignements de référence Reconstruction Phylogénétique (FastTree, Price et al., 2010) Séquences requêtes triées selon groupes phylétiques Annotation taxonomique Clades environnementaux

PANAM : Restitution taxonomique Restitution taxonomique : capacité du logiciel d'affiliation à déterminer la taxonomie correcte d'une séquence connue. 100% 90% 80% 70% PANAM BLAST STAP RDP 60% 50% Kingdom Phylum Class Order Family Genus Simulations sur séquences complètes (eucaryotes) Restitution : > 90 % au niveau genre Détection de clades environnementaux (Lepère et al., 2008)

PANAM : Restitution taxonomique Simulations sur run de pyroséquençage (400 pb) Eucaryotes 18S Bactéries 16S 100% 100% 90% 90% 80% 70% PANAM STAP RDP 80% 70% PANAM STAP RDP 60% 60% 50% Kingdom Phylum Class Order Family Genus 50% Kingdom phylum Class order Family Genus Restitution : > 75 % au niveau genre pour le 18S > 90 % au niveau genre pour le 16S

PANAM : performances 200 180 160 140 Hours 120 100 80 60 40 20 100 bp 200 bp 400 bp 800 bp 0 5000 50000 100000 250000 500000 750000 1000000 Sequences Simulations sur un CPU 2 GHz Xeon et 24 GB RAM

PANAM : performances 200 180 Dynamique à court terme des petits eucaryotes lacustres 160 Hours 140 120 100 24 prélèvements 348 567 séquences brutes 80 60 248 597 séquences nettoyées 40 20 100 bp 200 bp 400 bp 800 bp 1017 OTUs 0 5000 50000 100000 250000 500000 750000 1000000 Sequences Simulations sur un CPU 2 GHz Xeon et 24 GB RAM Temps de traitement total : 30 minutes Variations à court terme de la diversité du picoplancton eucaryote lacustre : approche par séquençage massif I. Domaizon Poster 12

PANAM : Perspectives Web service intégré, dédié à l'étude de la diversité des microorganismes. Calcul distribué (cluster local / grille de calcul).

PANAM : Perspectives Web service intégré, dédié à l'étude de la diversité des microorganismes. Calcul distribué (cluster local / grille de calcul). Epanam. N. Taib Poster 45

Suivi de communautés microbiennes Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO Évaluation de l impact du tébuconazole (fongicide) sur les communautés bactériennes de lacs et de rivières par une approche de pyroséquençage de l ARNr 16S. N. Pascault Poster 38

Suivi de communautés microbiennes Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO Suivi de communautés spécifiques et comparaison d'échantillons Étude des Archaea en milieu marin ADN & ARN : Diversité / Activité des Archaea 80 échantillons Observation de clades spécifiques Évolution au cours du temps (série temporelle sur 3 ans 1/2) Projet DIVAQUA Diversité spécifique et fonctionnelle des communautés archéennes oxydant l ammonium dans les écosystèmes aquatiques. M. Hugoni Poster 20

Suivi de communautés microbiennes Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO Suivi de communautés spécifiques et comparaison d'échantillons Étude des Archaea en milieu marin ADN & ARN : Diversité / Activité des Archaea 80 échantillons Observation de clades spécifiques Évolution au cours du temps (série temporelle sur 3 ans 1/2) Projet DIVAQUA Suivi globale des communautés microbiennes lacustres Diversité lacustre eucaryote et procaryote : Lac Pavin / Bourget Observatoire de l'environnement Suivi sur une année, en parallèle : 16S Bactéries / 16S Archées / 18S SOERE GLACPE

Outils bioinformatiques PANAM : A Tool for the Phylogenetic Analysis and Taxonomic Affiliation of SSU rrna Amplicons. Najwa Taïb et al. http://code.google.com/p/panam-phylogenetic-annotation METAVIR : a web server dedicated to virome analysis. Simon Roux et al. Bioinformatics (Nov 2011) http://metavir-meb.univ-bpclermont.fr/

Base de données de 80 viromes publiés METAVIR

METAVIR : Arbres phylogénétiques à partir de différents marqueurs

METAVIR : Arbres phylogénétiques à partir de différents marqueurs Cap3 (Huang, 1999) contig_1 read_9 contig_2

METAVIR : Arbres phylogénétiques à partir de différents marqueurs Cap3 (Huang, 1999) contig_1 read_9 contig_2 Hmmer (Eddy,1998) >Chlamydia_phage_1 >Chlamydia_phage_2 >Bdellovibrio_phage >Spiroplasma_virus >contig_1 VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR QST--SVQGNLSAYATST-FDT >contig_2 >read_9 DGST----QGSLGQFSGRVAATYKH TKSFT-EHGVILGLASV

METAVIR : Arbres phylogénétiques à partir de différents marqueurs Cap3 (Huang, 1999) contig_1 read_9 contig_2 Hmmer (Eddy,1998) Gblocks (Talavera & Castresana,2007) PhyML (Guindon & Gascuel, 2003) >Chlamydia_phage_1 >Chlamydia_phage_2 >Bdellovibrio_phage >Spiroplasma_virus >contig_1 >contig_2 >read_9 Chlamydia_phage_1 Chlamydia_phage_2 contig_1 Bdellovibrio_phage Spiroplasma_virus contig_2 Entero_phage_ID22 Entero_phage_NC28 VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR QST--SVQGNLSAYATST-FDT DGST----QGSLGQFSGRVAATYKH TKSFT-EHGVILGLASV Chlamydia_phage_1 Chlamydia_phage_2 read_9 Bdellovibrio_phage Spiroplasma_virus Entero_phage_ID22 Entero_phage_NC28

METAVIR : composition taxonomique GAAS (Angly et al., 2009) Krona (Ondov et al., 2011) Lac du Bourget : Composition taxonomique de la fraction virale

METAVIR : Diversité des Microviridae Lac Bourget / Lac Pavin / Lac Limnopolar

Caractérisation des communautés virales Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir

Caractérisation des communautés virales Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir Diversité des virus d'archaea 6 viromes le long d'un gradient de salinité projet Archevir

Caractérisation des communautés virales Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir Diversité des virus d'archaea 6 viromes le long d'un gradient de salinité projet Archevir Comparaison des communautés virales de milieux extrêmes Virome(s) de la zone anoxique du lac Pavin projet DICENTIM

Gisèle Bronner Jean-Christophe Charvy Didier Debroas Emilie Duffaud François Enault Mylène Hugoni Isabelle Jouan Jean-François Mangot Corinne Petit-Biderre Isabelle Mary Bushra Parveen Vivane Ravet Simon Roux Najwa Taïb Agnès Vellet

Vincent Breton Tung Doan Engelbert Mephu Nguifo Gisèle Bronner Jean-Christophe Charvy Didier Debroas Emilie Duffaud François Enault Mylène Hugoni Isabelle Jouan Jean-François Mangot Corinne Petit-Biderre Isabelle Mary Bushra Parveen Vivane Ravet Simon Roux Najwa Taïb Agnès Vellet Hélène Agogué Agnès Bouchez Isabelle Domaizon Noémie Pascault Jean-François Humbert Julie Leloup Jonathan Colombet Agnès Robin Télèsphore Sime-Ngando Pierre Galand Ian Saulter Joan Artigas Stéphane Pesce Yvan Bettarel