III. GENE, CODE GENETIQUE ET SYNTHESE DES PROTEINES

le caryotype. De nouvelles techniques de marquage des chromosomes directement sur coupes tissulaires (FISH) ou in vitro ( C G H ) (Fig. 14) ont été développées ces dernières années et permettent d étudier des remaniements chromosomiques sur des populations cellulaires hétérogènes comme le sont les tumeurs. Les séquences d ADN constituant le génome humain sont hétérogènes. Cette séquence est structurée à 30% en unités fonctionnelles appelées gènes et à 70% en séquences extragéniques dont la fonction n est pas connue au moins pour une partie d entre elles. Elles ne sont pas vitales car elles ont été éliminées du génome de certaines espèces animales ou végétales (espèces à génome condensé). Cet ADN non fonctionnel extragénique est constitué à environ 20% de séquences répétitives, comme l ADN satellite, riches en paires G-C ou en paires A-T. Cet ADN répétitif contient des séquences variables (polymorphiques) et spécifiques de régions chromosomiques qui peuvent servir de marqueurs pour établir des cartes génétiques (Fig. 15). Le gène peut être défini comme un segment de l ADN correspondant à une unité de l information génétique dont la séquence correspond à une protéine qui en assurera la fonction. Récemment, J. Weissenbach a suggéré que le génome humain contiendrait vraisemblablement e n v i ron 56000 gènes et non 100000 comme les premières estimations le laissaient penser. Au total, l ADN intragénique codant (exonique) pour des protéines ne représenterait que moins de 10% du génome total. L importance de l ADN non codant ne doit cependant pas être sous estimé car il joue probablement un rôle essentiel dans le régulation de l expression de l ADN codant. III. GENE, CODE GENETIQUE ET SYNTHESE DES PROTEINES La spécificité de l information génétique repose sur la particularité structurelle des gènes et se traduit in fine par la synthèse d une protéine dont la fonction est définie par une structure tridimensionnelle précise. C est de la qualité physico-chimique de la séquence linéaire (extrémités NH2 & COOH) d acides aminés que résultent la structure tridimensionnelle et la fonction de la protéine (Fig. 16). Le transfert de l information génétique de l ADN est assuré par une étape intermédiaire: la transcription où l acide ribonucléique dit m e s s a g e r (ARNm) est synthétisé. La molécule d ARNm est formée de ribonucléotides corre spondant à la séquenc e en nucléotides d un des deux brins d ADN. A la différence de l ADN, dans l ARN, l Uracile remplace la Thymidine comme base complémentaire de l Adénine. Sous l action d enzymes, la molécule d ADN s ouvre et par complémentarité des bases (Adénine-Uracile et Guanine-Cytosine), des nucléotides s associent en une séquence identique à celle du brin d ADN informatif. Ainsi une molécule d ARNm simple brin est formée et transmet l information génétique pour la synthèse protéique. L ARNm est fabriqué dans le noyau puis transféré dans le cytoplasme avant l étape de synthèse proprement dite de la protéine ou traduction. La synthèse des protéines repose sur la correspondance, dans un système appelé code génétique, (Fig. 17) entre un ensemble de 3 bases (codon) et un acide aminé : ce code génétique est tout aussi universel que l ADN lui-même. Au cours de la traduction, la séquence de l ARNm est convertie en une séquence d acides aminés pour former une chaîne polypeptidique. Cette étape utilise un code dont l unité est le codon : triplets de bases dont l ordre est traduit en une succession d acides aminés correspondants (polypeptides) au niveau des ribosomes. Les acides aminés sont ordonnés dans la séquence déterminée par la succession de codons de l ARNm. Chaque ARN de transfert (ARNt) transporte un acide aminé différent en fonction du motif de 3 nucléotides (anticodon) qu il présente. Les ARNt s ordonnent par leur anticodon en fonction des codons présentés par l ARNm. Ainsi les protéines sont constituées d une chaîne linéaire d acides aminés: ceux-ci sont, dans tout le règne animal, au nombre d une vingtaine. Certains acides aminés peuvent être codés par plusieurs triplets, c est pourquoi le code génétique est dit dégénéré. En effet, il y a 64 codons différents : 61 pour les 20 acides aminés et 3 (UAA, UAG et UGA) pour des signaux qui contrôlent la traduction et qui sont qualifiés de codons non sens. En fait, ces codons, contrairement à leur qualification de non-sens, ont un sens bien particulier puisqu ils arrêtent la traduction. Le codon ATG, quant à lui, agit comme point de départ. Il code pour la méthionine et correspond au site d initiation de la traduction. Chaque gène est donc caractérisé par des séquences 716

Figure 14 : Techniques de marquage des chromosomes par hybridation génomique comparative (C.G.H.) et hybridation in situ fluorescente (F.I.S.H). 717

Figure 15 : différentes dénominations de l ADN selon ses séquences et fonctions Structure primaire Structure secondaire Structure tertiaire Structure quaternaire (assemblage de sous unités) Figure 16 : Structure des protéines 718

Figure 16 : Suite Structure des protéines 719

ALANINE Ala A GCU GCA GCC GCG ARGININE Arg R CGU CGA AGA CGC GGG AGG ASPARAGINE Asn N AAU AAC ACIDE ASPARTIQUE Asp D GAU GAC CYSTINE Cys C UGU UGC ACIDE GLUTAMIQUE Glu E GAA GAG GLUTAMINE Gln Q CAA CAG GLYCINE Gly G GGU GGA GGC GGG HISTIDINE His H CAU CAC ISOLEUCINE Ile I AUU AUC AUA LEUCINE Leu L UUA CUU CUG UUG CUC AUA CUA LYSINE Lys K AAA AAG METHIONINE Met M AUG (Depart) PHENYLALANINE Phe F UUU CUU CUG UUC CUC CUA PROLINE Pro P CCU CCA CCC CCG SERINE Ser S UCU UCA AGU UCC UCG AGC THREONINE Thr T ACU ACA ACC ACG TRYTOPHANE Trp W UGG TYRONINE Tyr Y UAU UAC VALINE Val V GUU GUA GUC GUG STOP UAA UAG UGA Figure 17 : Code génétique 720

spécifiques de paires de bases, alternant avec des séquences transcrites (exons) et non transcrites (introns) en ARNm. Cela ne veut pas dire qu un exon correspond stricto sensu à une partie codante du gène. En effet, des séquences exoniques non codantes peuvent exister en amont du codon d initiation ATG et en aval du codon d arrêt (Fig. 18). Il est possible d extraire des cellules ou des tissus les ARNm et de synthétiser la séquence d ADN qui leur correspond (ADN cellulaire en ADNc) par la technique de R e v e r s e - Tr a n s c r i p t a s e puis d amplifier par PCR ses séquences spécifiques (RT-PCR) (Fig. 19). Cette méthode, grâce à l étape d amplification, est très sensible et très spécifique pour détecter l expression d un gène particulier grâce à l étape de reverse transcriptase qui définit sa séquence transcrite. Cette technique de RT-PCR est utilisée pour détecter des cellules circulantes tumorales d origine prostatiques en identifiant l ARNm du PSA ou du PSMA ou pour étudier simultanément sur des microplaques (microarrays) l expression de plusieurs centaines de gène pour un échantillon tissulaire dont on a extrait l ARNm (Fig. 20). Cette technique peut également être utilisée sur des coupes tissulaires pour caractériser l expression génique en microscopie. C est l h y- bridation in situ. Les différentes techniques d analyses moléculaires à partir de tissus ou de cellules sont présentées en figure 21. En thérapeutique, des séquences nucléotidiques complémentaires de la séquence de l ARNm (codant pour des protéines clef du métabolisme ou du cycle cellulaire) ont été utilisées pour bloquer la traduction de ces ARNm en protéines fonctionnelles. Cette stratégie, appelée a n t i s e n s, s inscrit dans de nouvelles approches thérapeutiques, où l ADN devient médicam e n t. Si toutes les cellules somatiques diploïdes possèdent les mêmes 46 chromosomes et la même information génétique, la différenciation cellulaire est cependant caractéristique de la spécialisation tissulaire et implique une régulation dans la synthèse des protéines. Le modèle d opéron de Jacob et Monod (1961), établi chez la bactérie Escherichia Coli, sert encore actuellement d idée de base dans l explication des mécanismes de régulation de la synthèse des protéines. Le gène comporte des séquences signal non transcrites mais qui régulent l expression. C est le cas, entre autre, de la région dite du promoteur. Cette séquence régulatrice contient des sites de fixation pour des protéines (facteurs de transcription) qui initient ou répriment l expression du gène (Fig. 22, régulation de l expression). L activation spécifique de certains gènes dans des types cellulaires définis (comme le PSA dans les cellules épithéliales prostatiques différenciées) sous le contrôle de la région du promoteur de ces gènes a été utilisée en thérapie génique. En clonant la région promotrice et en la recombinant en amont d une séquence codante pour une protéine cytotoxique, seules les cellules qui activent la région promotrice sont aptes à exprimer le séquence cytotoxique. C est ainsi que l on utilise le promoteur du gène du PSA dans un virus pour contrôler l expression du gène suicide de la thymidine kinase afin que seules les cellules prostatiques expriment cette enzyme et soient la cible de l effet thérapeutique. L identification des facteurs de transcription spécifiques et des gènes qu ils contrôlent dans certaines pathologies constitue une voie de recherche importante en pharmacologie pour développer des molécules analogues ou antagonistes de ces facteurs. A coté du génome nucléaire, il existe un génome m i t o c h o n d r i a l (16,6kb) qui contient 37 gènes. Certaines protéines mitochondriales sont formées de sous unités synthétisées à partir de gènes nucléaires et transportées secondairement dans les mitochondries pour s associer aux sous unités synthétisées à partir de l ADN mitochondrial (Fig. 23). L ADN mitochondrial, évolue beaucoup plus vite que l ADN nucléaire avec un taux de mutation 10 fois plus élevé. Il en résulte d importants polymorphismes et fait de l ADN mitochondrial un matériel privilégié pour étudier l évolution moléculaire et pour retracer les filiations. IV. DIVISION CELLULAIRE SOMATIQUE ET GAMETIQUE L organisme se forme et renouvelle ses tissus par divisions cellulaires successives. Ces divisions sont équationnelles et qualifiées de mitotiques. Elles constituent la mitose (Fig. 24) et assurent aux deux cellules filles le même ensemble de chromosomes que la cellule mère. La mitose correspond à un cycle de condensation et de décondensation des chromosomes, la condensation maximale étant observée en métaphase. Au cours de la mitose, des structures protéiques particu- 721

Figure 18: Synthèse des protéines 722

Rein Prostate Extraction et purification des ARN messagers Synthèse du premier brin d ADNc 1. Hybridation avec des oligonucléotides spécifiques pour le gène A 2. Amplification par PCR 3. Analyse sur gel d électrophorèse Le gène A est exprimé dans le rein, mais pas dans la prostate Figure 19: RT/PCR 723

Après recopiage de l ARN en ADN complémentaire, la PCR peut parfaitement être appliquée. Population hétérogène d ARNm à queue poly A amorce 1 Transcriptase réverse ARNm Amorce 2 amorce poly T ADNc simple brin Hydrolyse d ARNm et synthèse du 2eme brin extension de l amorce 2 Amorce 1 Amorce 2 ADNc double brin X 2n Figure 19 Bis : RT/PCR : la technique 724

Vert = N > T Jaune = N T Rouge = T > N Figure 20: Microarrays. pour un même organe on isole des cellules normales (N) et tumorales (T). Leurs ARNm sont extraits et amplifiés en RT-PCR pour obtenir de l ADN complémentaire (ADNc) pour plusieurs centaines, voire plusieurs milliers de gènes différents. L ADNc correspondant aux cellules normales est marqué par un fluorochrome vert, celuui correspondant aux cellules tumorales par un fluorochrome rouge. Les ADNc nouvellement marqués sont mélangés dans les micropuits qui correspondent chacun à un gène. Lorsque l ARNm des cellules normales est plus exprimé que celui des cellules tumorales, les puits sont verts. Si c est l inverse (T>N), les puits sont rouges. Si les deux sont exprimés en quantité égale (N=T), les puits sont jaunes. 725

Figure 21 : Technique d analyse des altérations moléculaires à partir de tissus ou de cellules 726

CAAT - BOX : Séquence régulatrice fixznt les facteurs de transcription Figure 22: Régulation de l expression des gènes Figure 23 : ADN Mitochondrial trna = ARN de transfert ex: trna-lys : ARN de transfert de la lysine 727

INTERPHASE Centrioles PROPHASE Fuseau PROMETAPHASE Noyau et chromatine Cellule 2N diploïde Chromosomes et chromatides Cellule 2N diploïde TELOPHASE ANAPHASE METAPHASE Figure 24 : La mitose 728

lières (microtubules) permettent l agencement des chromosomes sur un fuseau et contrôlent leur migration dans chaque cellule fille. Cette étape peut être bloquée par certains médicaments anticancéreux qui agissent sur le système microtubulaire (poisons du fuseau, famille des taxoides, extraits de la colchique, de la pervenche ou de l if) entraînant une polyploïdie létale pour la cellule en division. Les cellules diploïdes (à 2n chromosomes) proviennent du zygote par division mitotique. Elles trouvent leur origine dans la fusion (fécondation) de deux gamètes haploïdes (à n chromosomes : l ovule et le spermatozoïde ne possèdent qu un seul chromosome de chaque paire). La formation de ces cellules haploïdes à partir des cellules sexuelles primaires diploïdes (ovogonie et spermatogonie) se déroule lors de deux divisions particulières appelées méiose (Fig. 25). Le matériel chromosomique se distribue d une façon différente de celle caractérisant la mitose. Deux divisions successives auront lieu : la première est qualifiée de réductionnelle et la seconde d équationnelle. La première division méïotique est caractérisée par un appariement des chromosomes homologues, à savoir des chromosomes d une paire, l un de provenance paternelle et l autre maternelle. Cet appariement engendre deux sortes de recombinaison : - Une recombinaison des chromosomes, résultat de la séparation aléatoire au sein d une paire de chromosomes homologues des chromosomes d origine paternelle ou maternelle. Un exemple particulier de cette séparation aléatoire des chromosomes d une paire est celui des chromosomes sexuels. La femme (46, XX) formera des ovules (23, X) comportant 23 chromosomes dont un seul chromosome X; l homme (46, XY) formera deux sortes de spermatozoïdes : les uns possédant le chromosome X (23, X), les autres le chromosome Y (23, Y) : cette particularité explique à la fois le sexratio théorique de 1/1 et l hérédité des caractères liés au sexe. - Une recombinaison des gènes au sein d un chromosome se déroule également pendant la première division méiotique. Les gènes liés au même chromosome (linkage) peuvent être échangés entre chromosomes homologues (crossing-over ou recombinaison génique). C est en fonction de la fréquence de ces échanges géniques qu une carte génétique du chromosome peut être établie. La distance relative entre deux gènes (locus) est corrélée à la fréquence de recombinaison entre les deux gènes : 1% de recombinaison entre deux locus correspond sur une carte génétique de liaison à une distance de 1 centimorgan : 1cM. Ces fréquences peuvent être considérées comme additives pour des distances peu élevées, elles ne le sont plus totalement pour des distances plus élevées. La fréquence maximale de recombinaison sera de 50 % (Fig. 26). C. LES ALTERATIONS DU GENOME ET LEURS MODES DE TRANSMISSION Les variations inter-individuelles des populations humaines ainsi que les variations entre populations trouvent leurs origines non seulement dans la recombinaison génique et chromosomique mais aussi dans des modifications brusques du matériel génétique, appelées dès 1901 par Hugo de Vries mutations. Les altérations de la structure de l ADN peuvent être consécutives à des erreurs de réplication spontanées ou induites par des radiations ou des composés chimiques, échappant aux mécanismes de réparation de l ADN et de contrôle du cycle cellulaire (apoptose) (Fig. 27) (tableau : gènes réparation & conséquences). I. MUTAGENESE ET ANTI-MUTAGENESE 1. ERREUR DE RÉPLICATION Pendant la réplication, les ADN polymérases catalysent l appariement des nucléotides complémentaires avec une grande fidélité. Cependant, des erreurs surviennent avec une fréquence d environ une pour un million de paires de bases répliquées. Le taux de mutation est toutefois 1000 à 10000 fois plus faible car il existe un mécanisme de contrôle et de réparation des erreurs de réplication. Un des systèmes de réparation connu sous le nom de Methyl-Directed Mismatch Repair System comprend plusieurs protéines et donc plusieurs gènes (caretaker genes). Leur déficience est à l origine de cancers caractérisés par une importante instabilité génétique (phéno- 729