Analyse comparative de méthodes de traitement de séquences ITS fongiques issues du pyroséquençage 454

Documents pareils
Analyse des données de séquençage massif par des méthodes phylogénétiques

Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution?

Big data et sciences du Vivant L'exemple du séquençage haut débit

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

SysFera. Benjamin Depardon

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

SERVICES DE SEQUENÇAGE

Calculer les coûts ou bénéfices de pratiques sylvicoles favorables à la biodiversité : comment procéder?

L offre de master orientée «forêt»

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Réunion du réseau de génétique du Département EFPA

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Gènes Diffusion - EPIC 2010

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

Les mesures compensatoires des atteintes à la biodiversité en France

4. Résultats et discussion

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

LE MONITORING DE LA BIODIVERSITE EN SUISSE. Hervé LETHIER, EMC2I

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Conférence technique internationale de la FAO

MABioVis. Bio-informatique et la

Master 2. Mention : «Ecosciences, Microbiologie» Domaine : Sciences Technologies Santé Responsable : F. Menu

La gestion des données en écologie des communautés végétales : l exemple de Phytobase

OBJECTIFS : SAVOIR. - Appréhender les principes de base concernant les autres moyens de paiement. TEMPS PREVU : 2 h 00

Evaluation du LIDAR et de solutions innovantes pour la chaîne d approvisionnement du bois : les résultats du projet européen FlexWood

Les Français et la nature

Génétique et génomique Pierre Martin

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Environmental Research and Innovation ( ERIN )

ApplicaSol, la base de données des applications thématiques

Régionalisation des régimes de perturbations et implications pour l aménagement dans un contexte de changement climatique

BIODIVERSITE - Fiche activité 1. La biodiversité : un monde d interactions

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE)

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

ARRETE Arrêté du 9 juin 2009 portant habilitation à délivrer des masters dans les établissements habilités à délivrer le diplôme d ingénieur

La création d un écosystème d innovation. Funding Partner

Niveau d assurance de stérilité (NAS) Hôpital Neuchâtelois Sylvie Schneider Novembre 2007

Pierre Bonnet, INRA UMR AMAP Raffi Enficiaud, INRIA Équipe IMEDIA

Concertation relative à la mise en place du compte personnel de prévention de la pénibilité Michel de Virville

Procédure d utilisation du Beckman CEQ 2000 XL pour la réalisation de programmes de séquençage ou de génotypage.

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

Patricia Roberts-Pichette

Tarifs des prestations et des moyens de paiement. en vigueur à partir du 1 er mars 2015

Présenté par : Dr Asmae Nouira. Novembre Hanoi Journées Scientifiques Inter-Réseaux AUF

RÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition

DURÉE PUBLIC CONCERNÉ PRÉ-REQUIS. OUTIL PÉDAGOGIQUE FORMATEUR(S) PRIX Consultant CQS

Calcul d une provision technique en assurance vie dans le cadre de Solvabilité 2. Le cas des contrats d épargne : les approches «markedto model»

L'interface utilisateur guide le compilateur à travers les procédures de saisie des données et de calculs impliqués dans le processus d'inventaire

CONFIGURATION DU SERVEUR DE MAILS EXIM. par. G.Haberer, A.Peuch, P.Saade

Focus méthodologique sur la mise en place d'une veille partenariale L expérience du CD P. Bartoli

La directive INSPIRE pour le partage des données géographiques

Prévenir la colonisation par Campylobacter chez les poulets de chair. Dr. Wael Abdelrahman Consultant technique, Probiotiques volailles

Proposition de labellisation d un projet de thèse pour une Allocation de Recherche (5 pages maximum)

REDIGER UNE BIBLIOGRAPHIE

BANC D ETALONNAGE EN TEMPERATURE

Quelle stratégie foncière dans les trames verte et bleue?

URL analysées. Informations générales. Nb. de liens sponsorisés Google

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Franck VAUTIER, Jean-Pierre TOUMAZET, Erwan ROUSSEL, Marlène FAURE, Mohamed ABADI, Marta FLOREZ, Bertrand DOUSTEYSSIER

UNIVERSITÉ DE LOMÉ DÉPARTEMENT DE BOTANIQUE

Typologie à dire d expert des systèmes de production agricole du district de Cho Don, province de Bac Kan

LA CONDUITE D UNE MISSION D AUDIT INTERNE

THÉÂTRE DU BEAUVAISIS

Michel Fortin 1 er Vice-président FTPF 26 janvier 2011

ESSAI DE CONDUITE DE L'AVOCATIER EN HAIE FRUITIÈR E

Pour diffusion immédiate. Nouveau sondage CROP : LES AIRES PROTÉGÉES, UNE PRIORITÉ SELON LES QUÉBÉCOIS

LE SPECTRE D ABSORPTION DES PIGMENTS CHLOROPHYLLIENS

Une application sur tablette tactile pour la saisie de données naturalistes sur le terrain Linhota

Emergence du Big Data Exemple : Linked Open Data

Tarifs des prestations et des moyens de paiement. en vigueur à partir du 1 er juillet 2015

CARTE ACHAT. Yolande Sallent

DOCUMENTATION POINT FACTURE

CREATION DE FORAGE, PUITS, SONDAGE OU OUVRAGE SOUTERRAIN

e-infrastructures pour la Génomique et la Biologie à Grande Echelle

SERVEUR DE SAUVEGARDE POUR BCDI3. par. G.Haberer, A.Peuch, P.Saadé

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

Marie Curie Actions Marie Curie Career Integration Grant (CIG) Call: FP7-People-2012-CIG

Moyens de paiement V i7.00

Accélérer l agilité de votre site de e-commerce. Cas client

Formation aux écrits professionnels

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Eco-système calcul et données

NORME IAS 20 LES SUBVENTIONS PUBLIQUES

Domaine : Sciences, Technologies et Santé Mention : Nutrition, Sciences des aliments, Agroalimentaire

Comparatif fonctionnel des offre Saas d'igsi Easy CRM, Pro CRM, CRM On Demand

FORMATION D EXPERTS REGIONAUX POUR UNE GESTION DURABLE DES FORETS DU BASSIN DU CONGO

Architecture de réseau de senseurs : monitoring environnemental et écosystèmes forestiers

LA RECONFIGURATION DES SERVICES D'EAU ET D'ASSAINISSEMENT A L'ECHELLE DES AGGLOMERATIONS G. CANNEVA R. DE LAAGE

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel

PERSONNEL RETRAITE AYANT UNE ACTIVITE BENEVOLE A L UNIVERSITE PIERRE ET MARIE CURIE

Audit SI du département MIA Réunion de lancement 23 avril MIA - Audit SI Réunion de lancement

MicroSol database, le Premier Système d Information Environnemental sur la Microbiologie des Sols

Transcription:

Analyse comparative de méthodes de traitement de séquences ITS fongiques issues du pyroséquençage 454 M BUEE, C MURAT, E. MORIN, F MARTIN Juliette Lengellé INRA-Nancy, Université de Lorraine,UMR1136 Unité Interactions arbres / microorganismes Equipe Ecogénomique des Interactions 25/04/2012 ETEGE d'aussois

Contexte Champignons présents dans de nombreux écosystèmes Très forte diversité dans les sols forestiers et fonctions diverses Apple => Importance de connaître les communautés fongiques pour comprendre le fonctionnement de l'écosystème forestier et développer une gestion durable des forêts Approches multiples : De l identification des carpophores (fructifications) à la métagénomique monogénique microbienne utilisant l ADN ribosomique fongique (ITS)

Principe de la métagenomique monogénique microbienne Echantillonnage Isolement des racines/sol, lyophilisation, broyage Extraction d ADN génomique Amplification de la région ITS fongique Pyroséquençage 454 (Illumina) Analyses bioinformatiques

Avantages et biais du pyroséquençage 454 Avantages Nombre de séquences important => profondeur importante Traitement de plusieurs échantillons simultanément (multiplexage) Polymorphisme de taille (ITS fongique) => séquences courtes préférentiellement séquencées (modification de l'abondance relative de certains taxa) Erreurs de séquençage non aléatoires (séquences d'homopolymères) Biais Pyroséquençage 454 fructifications Estimation de la richesse en espèces (nombre d'otu) avec le logiciel EstimateS => Inventaire des espèces plus exhaustif avec le pyroséquençage 454 => Surestimation du nombre d'espèce avec le pyroséquençage 454 dû au biais

Effets des erreurs du pyroséquençage 454 Création d'otus artéfactuels : Singletons Nouveaux OTUs Sur-estimation de la diversité Nécessité de corriger les erreurs de séquençage => Necessité sélectionner une série de procédures automatisée permettant de compenser les erreurs du pyroséquençage 454

Méthodologie Combinaison d'outils existants pour compenser les erreurs du pyroséquençage 454 : Bruits => nettoyage des séquences (trimming/denoising) Redondances => plusieurs phases de regroupement (clustering) (Dem) : demultiplexage (T) : Trimming => découpage des séquences de faible qualité (D) : Denoising => retrait du bruit de séquençage [M] : Mothur (logiciel de nettoyage des séquences (reads)) [A] : AmpliconNoise (logiciel de nettoyage des 'reads' gi number : N d'acession du NCBI

Méthodologie Combinaison d'outils existants pour compenser les erreurs du pyroséquençage 454 : Bruits => nettoyage des séquences (trimming/denoising) Redondances => plusieurs phases de regroupement (clustering) (Dem) : demultiplexage (T) : Trimming => découpage des séquences de faible qualité (D) : Denoising => retrait du bruit de séquençage [M] : Mothur (logiciel de nettoyage des séquences (reads)) [A] : AmpliconNoise (logiciel de nettoyage des 'reads' gi number : N d'acession du NCBI

Tests des programmes Test sur 3 jeux de données de ~ 100 000 séquences de 3 écosystèmes différents : Forêt tempérée Forêt tropicale Truffière (inoculée avec Tuber melanosporum) Critères de sélection du pipeline : Nombre de séquences sélectionné aprés nettoyage Nombre d'otu (Operational Taxon Unit) généré : % de singletons Nombre moyen de séquences par OTU Taille moyenne des séquences des OTUs Evaluation de la diversité à l'echelle de l'espèce et de l'ordre(gains/pertes) avec MEGAN Dickie (2010) considère que le Pipeline1 génèrent un trop grand nombre d OTU artéfactuel

Résultats pour les données de la truffière pour les Pipelines 4, 5, 6 Les tendances sont les mêmes pour les deux autres écosystèmes Pipeline 1 (1T) Pipeline 2 (1D + 1 T) Pipeline 3 (1 T) Pipeline 4 (3 D) Pipeline 5 (3 D + 1 T) Pipeline 6 (2D + 1 T) 42,9% 35,2% 21,7% 40,2% 38,7% 7,0% 4954 4005 2352 5434 4770 2268 49,0% 47,4% 46,7% 64.4% 61,8% 51,8% Nb moyen de séquences par OTU 18 18 19 3 3 6 Longueur moyenne des OTUs (pb) 184 187 154 170 179 203 Nombre d'ordres 85 84 73 81 80 61 Nombre d'espèces 1054 958 668 868 834 514 Nb de séquences sélectionnées après nettoyage Nb d'otu généré OTU singleton D = étape de denoising T = étape de trimming Singletons > 50% des OTUs Nombre moyen de séquences par OTU trop faible

Résultats pour les données de la truffière pour les Pipelines 1, 2, 3 Pipeline 1 (1T) Pipeline 2 (1D + 1 T) Pipeline 3 (1 T) Pipeline 4 (3 D) Pipeline 5 (3 D + 1 T) Pipeline 6 (2D + 1 T) 42,9% 35,2% 21,7% 40,2% 38,7% 7,0% 4954 4005 2352 5434 4770 2268 49,0% 47,4% 46,7% 64.4% 61,8% 51,8% Nb moyen de séquences par OTU 18 18 19 3 3 6 Longueur moyenne des OTUs (pb) 184 187 154 170 179 203 Nombre d'ordres 85 84 73 81 80 61 Nombre d'espèces 1054 958 668 868 834 514 Nb de séquences sélectionnées après nettoyage Nb d'otu généré OTU singleton D = étape de denoising T = étape de trimming => Peu de séquences sélectionnées pour le 'clustering' pour le Pipeline 3 => Taille moyenne des OTU faible pour le Pipeline 3

Méthodologie Combinaison d'outils existants pour compenser les erreurs du pyroséquençage 454 : Bruits => nettoyage des séquences (trimming/denoising) Redondances => plusieurs phases de regroupement (clustering) (Dem) : demultiplexage (T) : Trimming => découpage des séquences de faible qualité (D) : Denoising => retrait du bruit de séquençage [M] : Mothur (logiciel de nettoyage des séquences (reads)) [A] : AmpliconNoise (logiciel de nettoyage des 'reads' gi number : N d'acession du NCBI

Intérêt des clusterings successifs Données truffière 4500 4400 Nombre d'otus 4300 4200 4100 4000 3900 3800 3700 3600 1 clustering 2 clusterings 3 clusterings 4 clusterings 5 clusterings => 2 étapes de clustering indispensables au minimum => 3 clusterings => obtention de 100% de séquences uniques 6 clusterings

Améliorations apportées au Pipeline 2 et perspectives Paramétrage du Pipeline pour le traitement d'autres types de séquences : ITS Oomycètes 18S fongiques Ajout de nouvelles fonctionalités: Création d'une matrice d'abondance gi number/échantillon Création de matrices reconnues par R pour générer des AFC Création des fichiers pour générer des courbes de raréfaction Test d'autres combinaisons d'outils de 'trimming'/'denoising' Validation en cours du Pipeline 2 sur un jeu de données issues du séquençage massif d'un assemblage in vitro de différents ADN fongiques connus

Remerciements UMR 1136 Interactixons Arbres-Microorganismes M BUEE F LE TACON F MARTIN A COINCE (thèse 2010-2012) C MURAT E. MORIN Apple