Des approches originales basées sur le séquençage nouvelle génération Apport des NGS dans l'amélioration des algues Gregory Carrier
Laboratoire PBA Physiologie et Biotechnologie des Algues Direction: Gaël Bougaran Axes de recherche Relation algue milieu de culture Amélioration des algues Modèles d études Microalgues Etude d un modèle: Tisochrysis lutea Projets de recherches: Facteur 4 Amicale PhycoVert
Tisochrysis lutea, notre modèle Phylum: Haptophyte Endosymbiose: Secondaire Cycle: Supposé Haplodiplo-phasique Adapté de Baldauf Sandra 2008 Intérêts biotechnologiques: Filière existante: - Source d alimentation en aquaculture (bivalve, crevette) o Filières potentielles : - Source d alimentation plus large (poissons, bovins ) - Production de bio-carburant
Vers l amélioration des microalgues L amélioration a débuté il y a 10 000 ans chez les plantes terrestres Sauvage Cultivée Patrice This et al., 2006 Chez les microalgues, l amélioration n apparaît que dans les années 2000! Stratégies d amélioration très empiriques car encore beaucoup de verrous o Connaissances limitées de la biologie de chaque espèce o Données limitées sur la diversité naturelle des espèces
Premiers programmes d amélioration Stratégie empirique: succession de cycles de mutations-sélections Souche initiale Cycle 1 Cycle 2 Souche améliorée Mutagénèse UV Sélection lipide Souche améliorée: - Accumulant deux fois plus de lipides neutres - Caractère conservé (4 ans) Bougaran et al., 2012 Rouxel et al., 2011 Les prochains challenges de l amélioration: sortir de l empirisme Caractérisation de la souche améliorée L impact du programme d amélioration au niveau du génome Optimiser l étape de mutagénèse Carrier et al., 2014 Garnier et al., 2014
Séquençage du génome de trois génotypes Souche initiale Séquençage du génome de Tiso Programme d amélioration Souche améliorée Clones 1-S2M2 Clones 2-S2M2 Objectifs: - Avoir un génome de référence de Tiso - Etudier l impact du programme d amélioration sur le génome de Tiso Deux méthodes de séquençages complémentaires: - Illumina MiSeq Paired-end 250b ( 9 millions de paires) Read 1 Read 2 Séquences de ~500b Ponts entre contigs - Illumina HiSeq V2 Mate-Paire 100b (357 millions de paires) Laetitia Duboscq Read 1 ~2000bases Read 2 Paired-end vs. Mate-Paire Génome Régions complexes
Assemblage du génome de Tiso 9M Wt Cl1 Cl2 111M 97M 149M 1) Sélection des reads de bonne qualité (76%) 2) Assemblage (CLC Assembler) Nombre de contigs 270M Taille des contigs - Avec les données Mate-Paired: 19 020 contigs (61Mb) - Ajout des données MiSeq : 13 114 contigs (58Mb) - Ajout d une étape de Scaffolding (SSPACE): Génome de 7 685 contigs (58Mb)
Annotation du génome de Tiso Annotation du génome de référence In silico (MakerPlant) Approche transcriptomique Approche protéomique Génome de référence: 20 583 gènes identifiés Annotation automatique : 12 630/20 583 avec une fonction putative 561 réactions métaboliques dans la base KEEG Annotation manuelle: Annotation spécifique: facteurs de transcriptions (doctorant Stanislas Thiriet-Rupert) Annotation éléments transposables
Comparaison des génomes Recherche de polymorphismes: double validation: Wt Cl1 Cl2 Wt Cl1 Cl2 FreeBayes DiscoSNP Génomes Données brutes Validation de 71% des SNPs Recherche des différents polymorphismes: - Recherche de SNPs: ATCGCTACTACG ATCGCTGCTACG - Recherche d insertion/délétions : ATCGCT.CTACGACT ATCGCTGATCTACGACT - Recherche de duplications : ATCGCTGAT..CTACGACT ATCGCTGATGATGATCTACGACT
Comparaison des génomes Recherche d insertions d éléments transposables: Classe 1: Copier/Coller Variation de la taille des génomes: activité d éléments transposables? Taille génome % Différence Wt Insertions d origines ET Wt Cl1 Cl2 55 039 123 b 100% / / 57 153 619 b 103% +2,1 Mbases (3%) 1,0 Mbases 56 947 953 b 103% +1,9 Mbases (3%) 0.7 Mbases Bilan: Le génome impacté par le programme d amélioration
Optimisation des méthodes d amélioration Optimisation de l induction de diversité: Programmes ANR Shamash Travaux de Catherine Rouxel et Judith Rumin Souche initiale Cycle 1 Mutagénèse Nombre de mutants générés en fonction de la dose appliquée d un mutagène Mutants viables Dose mutagène
Optimisation des méthodes d amélioration 1) Induction de souches mutantes avec différentes concentrations d EMS Pourcentage de survie Concentration EMS: 30mins
Optimisation des méthodes d amélioration 2) Approche GBS-like (Genotyping By Sequencing) Digestion Génome n ~15% du génome (fragments de 300-500 b) Adaptateurs Rassemble les conditions Sélection des fragments (300-500b) Condition Ref. Condition 1 Condition 2 Condition 3 Séquençage Comparaison des fréquences de mutations 3) Bientôt les résultats!!! Dose optimale du mutagène pour maximiser la diversité induite
Merci à tous!