Génomique discipline scientifique dont l objectif est de cartographier, séquencer et analyser les génomes
Vue d ensemble du génome humain (2004) Taille du génome Taux d erreur dans la séquence 3.08 Gbases 1/100000 bases Nombre de gènes identifiés 19438 Nombre de gènes (prédits et identifiés) 22287 Nombre moyen d exon par gène 10,4 Régions traduites en protéines 34 Mbases (1,1%) Régions transcrites non traduites 21 Mbases (0.7%)
Génomique aujourd hui Définition initiale: Discipline scientifique dont l objectif est de cartographier, séquencer et analyser les génomes Le séquençage à haut-débit des génomes est devenu une activité de routine. Développement de nouvelles disciplines scientifiques (transcriptomique, protéomique, bioinformatique, pharmacogénétique, ) Pour 40-60% des gènes identifiés, la fonction reste inconnue
La post-génomique Génomique Post-génomique Génomique structurale Génomique comparative Génomique fonctionnelle Analyse globale du génome permettant d assigner des fonctions aux gènes Définir l organisation et le contrôle des processus génétiques qui s associent pour faire le fonctionnement physiologique ou pathologique d une cellule, d un organe ou d un organisme
approche gène candidat séquençage du génome humain vision globale du génome Post génomique Tous les gènes sont des candidats potentiels! 5
Génomique structurale Objectif: détermination de la structure tridimensionnelle des protéines à partir des données du génome Etudier la fonction des milliers de gènes «inconnus» à partir de la relation structure fonction des protéines
«Human kinome» = Ensemble des protéines kinase exprimées chez l Homme 1- Définition d une séquence consensus de site catalytique à partir des kinase connues 2- Identification de nouveaux gènes codant potentiellement des protéines kinases à partir de leur séquences
173 inhibiteurs «human kinome» 57 Ser/Thr Kinases Production des protéines à partir des séquences Test d inhibiteurs connus des kinases Identification de cibles moléculaires
Génomique comparative Analyse et comparaison de l ADN de différents organismes Conservation de l ADN entre espèces en particulier au niveau des exons Similarité Homme - singes 95% Similarité Homme - souris 85% ~99% des gènes humains ont un équivalent (orthologue) chez la souris
Génomique comparative Identification des séquences conservées entre différents organismes Séquences codantes Identification de la fonction d un gène à partir de la fonction des orthologues
Génomique Fonctionnelle Génomique = Description physique Sites de fixation Exons Eléments répétés La Génomique Fonctionnelle = fonctionnement des génomes Mutation Transcription ARN Insertion Excision Régulation Traduction Protéine Ex: évaluer le fonctionnement global des gènes dans une maladie
Génomique fonctionnelle et maladies Phénotype malade Variations génétiques facteurs d environnement et facteurs de risque Effet individuel très modeste Accumulation et combinaison d un nombre important de variations Modulation de l effet des variations génétiques Faible contribution de chaque variations génétique au phénotype Intérêt d une analyse plus globale
Etude d expression des gènes Niveau d expression Activité biologique Objectif: Vue d ensemble de l expression du génome (profil d expression génique) Profil d expression génique dynamique Connaissance de la fonctions des gènes
Etude d expression des gènes
Techniques d étude du transcriptome Développement lié au séquençage des génomes: Production de sondes nucléotidiques spécifiques pour chaque gène Etude à grande échelle et simultanée Miniaturisation & Robotisation Traitement d un grand nombre de données bioinformatique Les techniques classiques (Northern blot, PCR quantitative) ne sont pas applicables
Puces à ADN (microarrays) Matrice de sondes cible marquée hybridation Mesure
Principe de base = hybridation 17
Application des puces à ADN Sondes Cible Référence Criblage de banques ADN ADN Gress TM et al. (1992) Mam. Genome 3: 609-619 Transcriptome ADN ARN Schena et al. (1995) Science 270: 467-470 Oligo fingerprinting ADN Oligos Drmanac S. et al. (1996) Genomics 37: 29-40 Reséquençage Oligo ADN Kozal MJ et al. (1996) Nat. Med. 2: 753-759 Phénotypage ADN ADN Gingeras et al. (1998) Genome Res. 8: 435-448 SNP Oligo ADN Winzeler et al. (1998) Science 281: 1194-1197 CGH ADN ADN Pollack JR. (1999) Nature 23: 41-46 DNA-BP ADN Protéines Bulyk et al. (1999) Nature Biotech. 17: 573-577 Suivi de réplication ADN ADN Khodursky et al. (2000) PNAS 97: 9419 9424 Détection de gènes ADN ARN Penn et al. (2000) Nature Genet. 26: 315-318 ChIP-chip ADN ADN Iyer et al. (2001) Nature 409: 533-538 Validation de gènes ADN ARN Shoemaker et al. (2001) Nature 409: 922-927 Taille des ARN ADN ARN Hurowitz et al. (2003) GenBiol 5: R2
Puces à SNP (single nucleotide polymorphism) SNP GCGAATCGAGATA G AATGGACCCGTGCTAA ATCGAGATAAATGGACCCG ATCGAGATATATGGACCCG ATCGAGATACATGGACCCG ATCGAGATAGATGGACCCG Individu Homozygote Individu Hétérozygote Pour un SNP donné, on synthétise 4 oligonucléotides ayant la séquence connue et les 4 bases possibles en position centrale. On hybride la puce constituée de ces oligonucléotides avec l ADN d un individu.
Puces à ADN: transcriptome cibles complexes d ARN Hybridation Réseau de sondes Mesure simultanée du niveau d expression de milliers de gènes
Pathologies cardiaques 30% des causes de décès Forte prévalence Renforcement du poids de ces maladies avec le vieillissement de la population Facteurs de risque environnementaux et génétiques
Profils d expression génique 1. Découvertes physiopathologiques 2. Phénotypage moléculaire
Stewart S et al. Eur J Heart Fail 2001;3:315-22 Insuffisance cardiaque: plus grave que le cancer?
Insuffisance cardiaque: remodelage myocardiaque A B C D Prédisposition à la maladie Anomalie structurale Maladie symptomatique Stade réfractaire REMODELAGE CARDIAQUE REMODELAGE TRANSCRIPTOMAL
Insuffisance cardiaque: processus de remodelage complexe apoptose circuits biomécaniques métabolisme stress oxydant cycle du calcium REMODELAGE CARDIAQUE traitement facteurs génétiques facteurs d environnement cardiopathie initiale
Hypothèse de travail Etude du remodelage transcriptomal associé aux pathologies cardiaques Signatures moléculaires des processus pathologiques Biomarqueurs pertinents pour la prise en charge des malades
Insuffisance cardiaque 44 patients en attente de transplantation CMI CMD autres n= 17 20 7 Age (années) 42-65 24-64 16-48 Sexe (H/F) 16/1 19/1 3/4 FEVG % 22 21 33 40 paramètres cliniques 2 échantillons du VG & 2 échantillons du VD 176 échantillons biologiques
Insuffisance cardiaque VG Cœur explanté VD 44 patients 176 échantillons Myopuce contenant 4217 gènes (quadriplicates) 352 puces 5 937 536 données d expression
Analyse d expériences de puces à ADN x 10 s cibles 10000 s sondes DELUGE DE DONNEES TRAITEMENT EN MASSE DE L INFORMATION Traitement des données Outils d aide à l interprétation
Traitement des données - Acquisition des données & Filtration - Normalisation - Concordance des mesures Consolidation des données Théorie Normalisation Réalité
Interprétation des données Detection de gènes différentiels Méthodes statistiques Detection de groupes de gènes co-regulés Méthodes de «clustering» Annotation fonctionnelle Banques d information (www)
gènes Clustering - Eisen et al. (1998) échantillons Données d expression code couleur clustering hiérarchique
Définitions Cluster Groupe de gènes co-régulés Profil Mesure d expression d un échantillon Signature Niveaux d expression de gènes caractéristiques d un échantillon Fonction Régulation
Signature moléculaire N T1 T2 T3 N T1 T2 T3 N+T1 T2+T3 Notion relative: pour un échantillon donné, il existe plusieurs signatures possibles, selon ce à quoi on compare cet échantillon
Correlation = Fonction Eisen et al. (1998) PNAS 95: 14863-14868 Les gènes d expression corrélée participent à une même fonction biologique
Cluster = Régulation Tavazoie et al. (1998) Nature Genetics Sites de fixation Exons Eléments répétés
mitochondrie mort cellulaire cytosquelette métabolisme synthèse protéique matrice extracellulaire peptides natriurétiques transport ionique adhésion
Stratification moléculaire du risque 44 patients en attente de transplantation Sévérité clinique Stable (n=13) UNOS 2 et stable sur 3 mois Intermediate (n=19) UNOS 1B/2 Deteriorating (n=12) UNOS 1A Analyse statistique Marqueurs de sévérité
Stratification moléculaire du risque VG VD VG VD S D S D S D S D VG VD S D S D Prédicteurs VG Prédicteurs VG Prédicteurs VG/VD
Prédicteur On construit un profil moyen rouge et un profil moyen vert. On mesure la distance de chaque échantillon à ces 2 profils.
Stratification moléculaire du risque ventricule gauche ventricule droit
Prédicteurs moléculaires du pronostic á un stade précoce de la maladie à partir de biopsies cardiaques Heidecker, B. et al. Circulation 2008;118:238-246
Perspectives maladie Prédicteurs moléculaires Médecine génomique problématique clinique Profil d expression génique
Génome Le génome est le patrimoine génétique complet d un organisme Le génome comprend l ensemble des ADN d un organisme Chaque type d organisme vivant (plante ou animal) possède son propre génome
Génome humain > 3 milliards de nucléotides Séquence linéaire d ADN de 2 mètres dans chaque cellule Si chaque paire de bases est représentée par une lettre il faudrait l'équivalent de 800 bibles pour écrire le génome humain.
Acide Désoxyribo Nucléique Double hélice composée exclusivement de 4 nucléotides Appariement des bases deux à deux 2 brins anti-parallèles
Gène Unité d'hérédité contrôlant un caractère particulier. Cet élément génétique correspondant à un segment d'adn ou d'arn (virus), situé à un endroit bien précis (locus) sur un chromosome. Chaque région de l'adn qui produit une molécule d'arn fonctionnelle est un gène.
Gène Exons Eléments répétés Sites de fixation Introns Exons: Eléments du gène qui codent les protéines Introns: Séquences d ADN non codant entre les exons
Expression des gènes Transcription Le gène est transcrit en ARN messager Traduction L ARN messager est traduit en protéine
Expression des gènes 58
Expression des gènes génome humain cellule spécialisée 30.000 gènes 100 to 200.000 transcrits 10.000 20.000 transcrits épissage alternatif 3.000 5.000 transcrits liés à la fonction propre de la cellule 59
human genome project Cartographier le génome humain Séquençage de tout l ADN d un individu