Tolérance au jeûne chez le loup de mer : Recherche des déterminants génomiques grâce aux NGS E. Desmarais J.C. Avarre, C. Breton, K. Belkhir et B. Guinand Institut des Sciences de l Evolution - Montpellier
Dicentrarchus labrax Distribution Atlantique et Méditerranée Forte différenciation mitochondriale Méditerranée Atlantique ND1 D.labrax 99 Chy5 Chy6 Chy4 MedOr Chy3 Chy2 Chy1 Per20 MedOcc Per22 MedOcc 98 Per23 MedOcc Per24 MedOcc Port3 Atlantique Per18 MedOcc Per19 MedOcc Per21 MedOcc Per17 MedOcc Port10 Atlantique Chy8 MedOr Angl92 Angl97 Manche Angl61 Port9 Atlantique Angl19 Manche Port1 Atlantique Angl17 Manche Port6 Atlantique Port8 Atlantique Angl85 Manche Angl12 Manche 61 Angl13 Manche Port2 Atlantique Port5 Région de Contrôle 100 Chy7 MedOr Pe19 MedOcc Chy2 MedOr Chy4 MedOr Per20 MedOcc Chy6 MedOr Per23 MedOcc 68 D labrax Per24 MedOcc X81472 Chy5 MedOr Per21 MedOcc Port3 Atlantique Per18 38 Per22 Per17 MedOcc Angl12 Angl13 51 Manche Angl97 Angl85 48 Port8 44 Port7 MedOcc Port6 Atlantique Angl19 Manche Port1 Atlantique Angl92 Manche Angl17 Manche Angl61 Manche Port5 Port2 74 Port4 Atlantique 0.002 d = 3,8% d = 9,3% Quid de la différenciation nucléaire? 0,009 < Fst < 0,03 Compartimentation de la divergence? P.A. Gagnaire 0.01
Cycle de vie : Alternance Mer/lagune-estuaire Lagunes = Première année : nourricerie larvaire Années suivantes : terrain de chasse Lagune Nourriture abondante Croissance rapide potentielle Echappe à la prédation Colonisation lagunaire Colonisation littorale Salinité : lagune < Mer Nourriture rare, jeûnes fréquents Croissance lente Prédation prolongée Méditerranée
Populations Sauvages (Allegrucci et al. 1997) Expérimentations (e.g. Allegrucci et al. 1994) Salinité : adaptation différentielle Eau de mer Eau douce 0,7 0,6 Stress osmotique 0,7 0,6 0,5 0,4 0,3 Mortalité sélective 0,5 0,4 0,3 0,2 0,2 0,1 0,1 0 0 A B C A B C Modification des Fréquences alléliques Muravera Bardawil Sabaudia LAGUNES Fiumicino Marsala Messolongi MER
Croissance : très variable chez les juvéniles 1. Disponibilité trophique contrastée : - Entre mer et lagunes - Entre différentes lagunes Larves Fin de première année Lagune Mer 2. Variabilité interindividuelle des taux de croissance Sélection sur individus expérimentaux : - Tolérance au jeûne : perte de poids limitée - Croissance plus lente mais plus continue - Meilleure croissance compensatrice
Evolution des populations? Environnement contrasté à un stade de développement critique : Fortes variations de salinité Autres paramètres : température, oxygène dissous, etc. Mortalité sélective Différentiel important de la disponibilité en nourriture Différence interindividuelle de vitesse de croissance Proie versus prédateur Différence de date de maturité sexuelle Quel impact sur la survie larvaire et le recrutement de la génération suivante? Quel impact sur la structure génétique des populations, voire de l espèce?
RegulBASS Un programme intégré de la tolérance au jeûne chez le bar (Dicentrarchus labrax) B. Guinand 1,6, D. McKenzie 2, E. Desmarais 1, J.-C. Avarre 1,3, K. Belkhir 1, M. Vandeputte 4,5, C. Breton 1, A. Vergnet 5, F. Bonhomme 1,7, B. Chatain 5 En milieu naturel - tolérance au jeûne = survie plus facile en milieu marin Mais croissance plus lente fitness habitat dépendante Structure des populations En milieu piscicole - tolérance au jeûne = meilleure efficacité alimentaire - Caractère héritable Lignées sélectionnables Intérêt commercial RegulBASS Bases physiologiques? et le jeûne Déterminismes? Voies métaboliques? Gènes impliqués? RNA-Seq Assemblage et mapping Transcriptome de référence DGE (24 banques avec replicats biologiques) Différentiels d expression CROISEMENTS CHALLENGES (2 périodes de jeûne de 3 semaines) Comptage d étiquettes et analyse statistique SELECTION D INDIVIDUS INTOLERANTS J+ SELECTION D INDIVIDUS TOLERANTS J- CARACTERISATION PHYSIOLOGIQUE/METABOLIQUE rate of mass loss (g d -1 ) Analyse de la perte de poids en fonction du taux métabolique 1,3 1,1 0,9 0,7 0,5 0,3 0,1 y = 0,1572x - 0,4279 R 2 = 0,5758 y = 0,1558x - 0,2189 R 2 = 0,529 sensitive tolerant 4 6 8 10 Réseaux métaboliques Annotation fonctionnelle Gènes différemment exprimés Capture - Reséquençage Polymorphismes Marqueurs candidats CNV GENOMIQUE et BIOINFORMATIQUE Relation Génotype - Phénotype routine metabolic rate (mmol O 2 h -1 ) A taux métabolique identique, les individus tolérants perdent moins de poids Utilisation différentielle des lipides et protéines Affiliations : 1 UMR CNRS 5554 ISE-M, 2 UMR CNRS 5519 ECOSYM, 3 UMR IRD 226, 4 INRA, 5 UMR INTREPID Ifremer, 6 Université Montpellier 2, 7 Station Biologique de Sète
RegulBass et les NGS RNA-Seq DGE Assemblage et mapping Comptage d étiquettes et analyse statistique Transcriptome de référence Différentiels d expression Réseaux métaboliques Gènes différemment exprimés Annotation fonctionnelle CNV Capture - Reséquençage Polymorphismes Marqueurs candidats RNA-Seq Reconstruction du transcriptome D. labrax par séquençage de l ensemble des ARN messagers DGE Analyse de l expression génique par comptage d étiquettes des ARN messagers Capture-Reséquençage Recherche de SNP dans les CDS et les promoteurs des gènes identifiés pouvant expliquer les différences d expression
DGE Digital Gene Expression : principe Anchoring Enzyme 5 3 5 3 5 3 5 3 Tagging Enzyme cdna cdna cdna cdna AAAAAAA-3 TTTTTTT-5 AAAAAAA-3 TTTTTTT-5 AAAAAAA-3 TTTTTTT-5 Billes Streptavidine AAAAAAA-3 TTTTTTT-5 Séquençage de Millions de TAG de 21 bp Comptage et inférence de différentiel d expression
DGE Digital Gene Expression Analyse quantitative de l expression génique par comptage d étiquettes des ARN messagers Comparaison de l expression génique de 3 groupes d individus J+ et J- en duplicat pour 2 organes Extraction/contrôle des ARNm totaux Société Skuldtech et plateforme séquençage Illumina/Solexa : http://www.skuldtech.com/index.php Reverse-transcription, digestion et construction de 24 bibliothèques de fragments SAGE/DGE Stockage et analyse des données sur un site dédié Analyse supplémentaire : serveur Galaxy et logiciel spécialisé Edge-R.
DGE : mesure des différentiels d expression Beaucoup de TAG recensés 210365 95535 157170 29557 différemment comptés entre J+ et J- pour les deux organes INTESTIN J- J+ J- Cutoff = 50 J + Cutoff = 50 P-1a P+1a P-1a P+1a P-1b P+1b P-1b P+1b FOIE P-2a P-2b P+2a P+2b P-2a P-2b P+2a P+2b P-3a P+3a P-3a P+3a P-3b P+3b P-3b P+3b 2885 tags 3827 tags Communs aux différents réplicats/lots
RNA-Seq : principe 5 3 cdna AAAAAAA-3 TTTTTTT-5 5 3 cdna AAAAAAA-3 TTTTTTT-5 5 3 cdna AAAAAAA-3 TTTTTTT-5 5 3 cdna AAAAAAA-3 TTTTTTT-5 Séquençage de Millions de fragments Assemblage des transcrits Annotation fonctionnelle
RNA-Seq Reconstruction du transcriptome par séquençage de l ensemble des ARN messagers Etablissement d un modèle de gènes : Structure détaillée des gènes i.e Ajout des UTR, Jonctions intron-exon, épissage alternatif, aux CDS déjà prédits Extraction/contrôle des ARNm totaux Plate-forme Biopuces et Séquençage http:/www-microarrays.u-strasbg.fr/ Illumina GAIIX 2X100pb paired-end (4 pistes = 97 millions de lectures) Reverse-transcription, construction de 4 bibliothèques de fragments Assemblage sur la plateforme MBB (CeMEB) et Galaxy (ISEM) : Edition des annotations : Geneious
Illumina Paired-end 2X100pb Assemblage de novo avec 2 kmer pour chaque piste Usearch+CAP3 Abyss+CAP3 Fusion de l ensemble des contigs Piste à piste TopHat Alignement sur génome de référence Cufflinks Assemblage sur génome de référence 89 000 seq LastZ ou Gmap Mapping des contigs Cuffmerge Reconstitution du transcriptome 48 000 seq - Identification des gènes WorkFlow de Galaxy Extraction des séquences des Transcrits piste à piste Blast2GO Analyse fonctionnelle - Recherche d enrichissement en termes GO entre pistes
RNA-Seq : résultats Nb Sequences: 48,396 Total bases: 142,196,225 Mean sequence length: Minimum length: Maximum length: Length range: Mode length: 2938.18 ± 2255.12 bp 63 bp 21,265 bp 21,203 bp 659 bp 13.975 Mbp 13.977 Mbp 13.979 Mbp 13.981 Mbp 13.983 Mbp 13.985 Mbp 13.987 Mbp Chromosome ARFGAP1 CDS prédit ENSGACP00000000543 TCONS_00017414 RNASeq RegulBass TCONS_00017413 TCONS_00017416 Assignation des TAG à des gènes, y compris hors CDS
Identification des gènes 600 gènes pour le foie 421 gènes pour l intestin Recherche des voies métaboliques impliquant les gènes différemment exprimés : Site DAVID http://david.abcc.ncifcrf.gov/summary.jsp Voie métabolique Gène Description J+>>J- J->>J+ (Rouge : J+>>J-) Ubiquitin mediated proteolysis 9 0 Glycolysis / Gluconeogenesis 5 0 Fatty acid metabolism 4 0 Ribosome 3 0 Maturity onset diabetes of the young 3 0 ErbB signaling pathway 3 0 Drug metabolism 3 0 Prion diseases 0 3 Proteasome 11 1 Oxidative phosphorylation 10 2 MAPK signaling pathway 6 6 Complement and coagulation cascades 6 4 Focal adhesion 5 3 Pathways in cancer 3 5 Purine metabolism 4 3 Endocytosis 4 3 Choix de 2X192 gènes pour validation par qpcr Biomark de Fluidigm (Integragen) 126 gènes Foie, 130 gènes Intestin Sélection de 2X48 gènes pour re-séquençage Gènes clés pour les voies métaboliques validées
Design Capture SureSelect 48 poissons 48 gènes Gène 1 1Kb Gène 1 Gène 1 Gène 1 Gène 1 Gène 1 Billes Streptavidine 48 banques Illumina 48 jeux de sondes de capture 48 captures Séquençage de Millions de fragments génomiques contenant les gènes ciblés Recherche de polymorphismes
Re-séquençage après capture Identification de polymorphismes SNP dans les exons+introns et les promoteurs des gènes identifiés Recherche de corrélation entre le génotype et le phénotype de 48 individus J+ et J- Extraction/contrôle des ADN génomiques Société IMAXIO, technique SureSelect Agilent http://www.imaxio.com/ Construction de 48 banques Illumina Fabrication de sondes de capture pour 2X48 gènes (introns+exons+ 1Kb amont) Capture avant pooling et séquençage sur Illumina GAIIX 2X75 pb paired-end (1piste = 40 millions de lectures) Résultats à venir
Recherche pan-génomique des déterminants génétiques impliqués dans le phénotype Individus tolérants au jeûne J- Individus sensibles au jeûne J+ Extraction ARN, Digital Gene Expression Détection de différences d expression TPM Test exact FDR 0,005 12 094 Etiquettes de transcrits Foie 17 463 Etiquettes Intestin BioTag Critères : Gène annoté unique et Tag R1 Identification et sélection des gènes candidats 600 Gènes Foie 421 Gènes intestin DAVID Critères : Appartenance à des voies métaboliques pertinentes sur- (vs.sous-) représentées dans une lignée par rapport à l autre 192 Gènes retenus par organe PCR quantitative pour Validation Logiciel GENEX KEGG sur GenomeNet Critères : Position-clé dans les voies métaboliques pertinentes, littérature Sélection des gènes pour re-séquençage 48 Gènes retenus par organe Capture SureSelect et Séquençage Illumina Geneious Identification des polymorphismes génétiques Analyse de corrélations? Analyse de ségrégation en lignées, populations naturelles
Croisements contrôlés XXXXX descendants Tirage au hasard de 3X 1000 individus Challenges de jeûne Biométrie Génétique quantitative 148 individus pour l analyse génomique Prix au kilo = 6500
Liste de gènes en attente Analyse pan-génomique Beaucoup de candidats Analyse statistique Modèles adéquats? Données biologiques : Génétique quantitative Analyses physiologiques Voies métaboliques Liste de gènes étudiable
Remerciements à : B. Chatain A. Vergnet M. Vandeputte D. Mac Kenzie F. Bonhomme