Analyse de l'évolution d'une épidémie bactérienne par comparaison de génomes Marie Petitjean Directeur de thèse : Didier Hocquet Laboratoire d'hygiène Hospitalière - CHRU Besançon Laboratoire Chrono-Environnement Région Franche-Comté 4 Décembre 2015 Petitjean Marie 4 Décembre 2015 1 / 17
Contexte et données Sommaire 1 Contexte et données Épidémie bactérienne Objectifs 2 Analyse des données de séquençage 3 Conclusion Petitjean Marie 4 Décembre 2015 2 / 17
Contexte et données Épidémie bactérienne Pseudomonas aeruginosa Matériel biologique Bactérie à Gram négatif, bacille pyocyanique - coloration verte Présent dans l'environnement - milieux humides Pathogène opportuniste => infections nosocomiales chez les patients fragilisés Bactérie qui s'adapte facilement en modiant son génome 1997-2014 : 17 ans d'épidémie Lieu : CHRU de Besançon Plus de 300 patients infectés ou colonisés Beaucoup de patients touchés au début Diminution du nombre de cas puis disparition en 2014 Petitjean Marie 4 Décembre 2015 3 / 17
Contexte et données Objectifs Analyse de l'évolution bactérienne Objectifs Compréhension de la persistance de la bactérie Analyse des éléments liés à la disparition de la souche épidémique Observation des modications génomiques : mutations, gain ou perte de gènes Données NGS Séquençage de 55 souches bactériennes sélectionnées Deux souches en Illumina Dix-sept en Ion Torrent (100x) Trente-six en Ion Torrent (25x) Séquençage de la première souche en Pacic Biosciences Petitjean Marie 4 Décembre 2015 4 / 17
Sommaire 1 Contexte et données 2 Analyse des données de séquençage Assemblage 3 Conclusion Petitjean Marie 4 Décembre 2015 5 / 17
Assemblage Pacic Biosciences - Single Molecule Real-Time sequencing Données PacBio : Analyse du premier génome prélevé au cours de l'épidémie Technique Séquençage sans amplication préalable Obtention de reads de taille importante : environ 10 kb Résultats de séquençage Assemblage utilisant HGAP - Hierarchical Genome Assembly Process Obtention d'un chromosome circulaire Couverture moyenne de 134x => Obtention d'un génome complet de bonne qualité Petitjean Marie 4 Décembre 2015 6 / 17
Assemblage PGM Ion Torrent & Illumina Genome Analyzer IIx Données Illumina/Ion Torrent : Séquençage des 55 génomes bactériens de l'épidémie Technique Séquençage après digestion et amplication Obtention de reads de petite taille - entre 200 et 400 pb Assemblage Ion Torrent Sous-échantillonnage des reads Utilisation de MIRA - assemblage en fonction de la technologie de séquençage utilisée Assemblage Illumina Utilisation de Ray - nécessite une longueur de k-mers en paramètre Estimation de la longueur des k-mers avec kmergenie Petitjean Marie 4 Décembre 2015 7 / 17
Analyse des données I. Phylogénie 1. Alignement de toutes les souches sur la référence 2. Recherche de la partie commune à tous les génomes = Core genome - 4408996 pb 3. Alignement du Core genome de tous les génomes 4. Extraction des SNPs - Single Nucleotide Polymorphism 5. Utilisation des 3205 SNPs pour générer un arbre phylogénétique avec BEAUTi et BEAST Petitjean Marie 4 Décembre 2015 8 / 17
2014-06_DHS30 2001-08 2002-10 2001-07_DHS13 2001-12 2000-01a 1998-12 1999-08 1997-09_DHS02 1999-11_DHS08 1997-08 1998-02 1999-09 2005-12_DHS25 2006-03_DHS26 2005-09_DHS24 2002-01 2002-09 2001-06 1999-12 1999-04 2003-07 2000-11_DHS11 2003-10_DHS20 2003-06 2002-03 1999-07 1997-11 2001-10_DHS14 1997-05 1997-05_DHS01 2003-05_DHS19 2000-02_DHS09 2001-11 2001-02_DHS12 1998-08 2000-01b 1999-05 1999-01 1999-03_DHS06 1999-06_DHS07 1998-11_DHS05 2003-08b 2001-09 2005-01_DHS22 2002-06_DHS16 2003-02_DHS18 2002-11_DHS17 2008-04_DHS29 2007-12_DHS28 1998-05_DHS04 1998-04 1998-01_DHS03 1997-10 2003-08a 2.0E-6 Figure 1 : Arbre phylogénétique regroupant les 55 souches épidémiques Petitjean Marie 4 Décembre 2015 9 / 17
II. Calcul du MRCA - Most Recent Common Ancestor Utilisation du module BEAUTi pour calculer le MRCA MRCA à 11,8 ans avec un intervalle de conance à 95% allant de 10,1 à 13,5 ans => Lien avec la date d'ouverture du CHRU Petitjean Marie 4 Décembre 2015 10 / 17
III. Analyse des portions de génomes gagnées/perdues 1. Création d'un métagénome = assemblage des reads des 55 génomes 2. Analyse de l'accessory genome = portions propres à chaque souches 3. Quels gènes présents? 4. Récapitulatif d'absence/présence de gènes chez les 55 souches Petitjean Marie 4 Décembre 2015 11 / 17
Figure 2 : Extrait du tableau de présence/absence de gènes Petitjean Marie 4 Décembre 2015 12 / 17
Gènes d'intérêt : résistance et virulence IV. Recherche des mutations ponctuelles liées à une résistance antibiotique 1. Comparaison des séquences des gènes - référence = PAO1 2. Recherche de SNPs 3. Analyse des mutations retrouvées chez chacune des souches 4. Mise en évidence de résistances aux antibiotiques Petitjean Marie 4 Décembre 2015 13 / 17
Figure 3 : Résistance/Sensibilité acquise suite à des mutations Petitjean Marie 4 Décembre 2015 14 / 17
V. Recherche des mutations ponctuelles dans des gènes liés à la virulence 1. Comparaison des séquences des gènes avec BLAST - référence = PAO1 2. Recherche de SNPs 3. Analyse des mutations retrouvées chez chacune des souches 4. Incidence des mutations sur la virulence de la souche Petitjean Marie 4 Décembre 2015 15 / 17
Conclusion Sommaire 1 Contexte et données 2 Analyse des données de séquençage 3 Conclusion Petitjean Marie 4 Décembre 2015 16 / 17
Conclusion Conclusion Données utilisées 1. Séquençage Pacic Biosciences => assemblage d'un génome complet 2. Séquençage en Illumina et Ion Torrent pour comparaison de génomes Évolution de l'épidémie 1. Caractérisation de la première souche attribuée à l'épidémie 2. Modications géniques mises en évidence avec une variation du contenu en gènes 3. Mutations ponctuelles responsables de phénotypes particuliers identiés Petitjean Marie 4 Décembre 2015 17 / 17