SOMMAIRE DU COURS LES ACIDES RIBONUCLÉIQUES (OU ARN) LES OUTILS ENZYMATIQUES UTILISES EN BIOLOGIE MOLECULAIRE



Documents pareils
Les outils de génétique moléculaire Les techniques liées aux acides nucléiques

TD de Biochimie 4 : Coloration.

CHAPITRE 3 LA SYNTHESE DES PROTEINES

UE : GENE Responsable : Enseignant : ECUE 1. Enseignant : ECUE 2. Dr COULIBALY Foungotin Hamidou

3: Clonage d un gène dans un plasmide

Les OGM. 5 décembre Nicole Mounier

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Rapport Scientifique Seine-Aval 3

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

VI- Expression du génome

Biologie Appliquée. Dosages Immunologiques TD9 Mai Stéphanie Sigaut INSERM U1141

Séquence 2. L expression du patrimoine génétique. Sommaire

AGREGATION DE BIOCHIMIE GENIE BIOLOGIQUE

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Bases moléculaires des mutations Marc Jeanpierre

AGRÉGATION DE SCIENCES DE LA VIE - SCIENCES DE LA TERRE ET DE L UNIVERS

TP n 1: Initiation au laboratoire

Biochimie I. Extraction et quantification de l hexokinase dans Saccharomyces cerevisiae 1. Assistants : Tatjana Schwabe Marcy Taylor Gisèle Dewhurst

Table des matières. Renseignements importants sur la sécurité 2. Nettoyage et élimination 4. Spécifications 4

5.5.5 Exemple d un essai immunologique

TRAVAUX PRATIQUESDE BIOCHIMIE L1

Univers Vivant Révision. Notions STE

TD DOSAGE DE PROTEINES ET ELECTROPHORESE : PARTIE THÉORIQUE BST1 SVT

Partie Observer : Ondes et matière CHAP 04-ACT/DOC Analyse spectrale : Spectroscopies IR et RMN

ANALYSE SPECTRALE. monochromateur

Analyse d échantillons alimentaires pour la présence d organismes génétiquement modifiés

Production d une protéine recombinante

Résonance Magnétique Nucléaire : RMN

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

ANTICORPS POLYCLONAUX ANTI IMMUNOGLOBULINES

Diagnostic biologique de la toxoplasmose

SEQUENÇAGE LI-COR DNA 4200

ACIDES BASES. Chap.5 SPIESS

Séquence 1. Reproduction conforme de la cellule et réplication de l ADN Variabilité génétique et mutation de l ADN

CATALOGUE DES PRESTATIONS DE LA

Transport des gaz dans le sang

Isolement automatisé d ADN génomique à partir de culots de cellules sanguines à l aide de l appareil Tecan Freedom EVO -HSM Workstation

Spectrophotomètre double faisceau modèle 6800

Cellules procaryotes Service histologie Pr.k.mebarek

β-galactosidase A.2.1) à 37 C, en tampon phosphate de sodium 0,1 mol/l ph 7 plus 2-mercaptoéthanol 1 mmol/l et MgCl 2 1 mmol/l (tampon P)

TEST ELISA (ENZYME-LINKED IMMUNOSORBENT ASSEY)

génomique - protéomique acides nucléiques protéines microbiologie instrumentation

ULBI 101 Biologie Cellulaire L1. Le Système Membranaire Interne

EXERCICES : MECANISMES DE L IMMUNITE : pages

Biomarqueurs en Cancérologie

TECHNIQUES: Principes de la chromatographie

Transport des gaz dans le sang

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Module 5 La maturation de l ARN et le contrôle post-transcriptionnel chez les eucaryotes

K W = [H 3 O + ] [OH - ] = = K a K b à 25 C. [H 3 O + ] = [OH - ] = 10-7 M Solution neutre. [H 3 O + ] > [OH - ] Solution acide

Génétique et génomique Pierre Martin

INTRODUCTION À L'ENZYMOLOGIE

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

Hépatite chronique B Moyens thérapeutiques

Comprendre l Univers grâce aux messages de la lumière

L immunoenzymologie. Technique puissante couramment utilisée e en recherche et en diagnostic cificité des anticorps pour leurs nes

EXERCICE II. SYNTHÈSE D UN ANESTHÉSIQUE : LA BENZOCAÏNE (9 points)

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Compléments - Chapitre 5 Spectroscopie

Indicateur d'unité Voyant Marche/Arrêt

LES BIOTECHNOLOGIES DANS LE DIAGNOSTIC DES MALADIES INFECTIEUSES ET LE DÉVELOPPEMENT DES VACCINS

Fiche 19 La couleur des haricots verts et cuisson

Chapitre 7 : Structure de la cellule Le noyau cellulaire

Suivi d une réaction lente par chromatographie

BACCALAURÉAT TECHNOLOGIQUE

1 ère partie : tous CAP sauf hôtellerie et alimentation CHIMIE ETRE CAPABLE DE. PROGRAMME - Atomes : structure, étude de quelques exemples.

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

Respiration Mitochondriale

pka D UN INDICATEUR COLORE

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Maxwell 16 Blood DNA Purification System

Chapitre 2 - Complexité des relations entre génotype et phénotype

Présentations GTF. Point de vue d un utilisateur final. Durée de vie des ouvrages : Approche Prédictive, PerformantielLE et probabiliste

TP N 3 La composition chimique du vivant

Les débuts de la génétique

TP3 Test immunologique et spécificité anticorps - déterminant antigénique

THEME 2. LE SPORT CHAP 1. MESURER LA MATIERE: LA MOLE

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

Structure quantique cohérente et incohérente de l eau liquide

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

1 Culture Cellulaire Microplaques 2 HTS- 3 Immunologie/ HLA 4 Microbiologie/ Bactériologie Containers 5 Tubes/ 6 Pipetage

Sensibilisation à la Sécurité LASER. Aspet, le 26/06/2013

Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations

MISE AU POINT D UNE TECHNIQUE DE QUANTIFICATION DES POPULATIONS BACTERIENNES ET ARCHAEA DE L ECOSYSTEME CAECAL DU LAPIN PAR PCR EN TEMPS REEL

A N A L Y S E U R E N L I G N E D A G V D E S B I C A R B O N A T E S D E L A L C A L I N I T E

ANTIVIRAUX ET INTERFERONS LES ANTIVIRAUX

SESSION 2013 ÉPREUVE À OPTION. (durée : 4 heures coefficient : 6 note éliminatoire 4 sur 20) CHIMIE

Chapitre 11: Réactions nucléaires, radioactivité et fission

TP : Suivi d'une réaction par spectrophotométrie

101 Adoptée : 12 mai 1981

RDP : Voir ou conduire

Analyse d échantillons alimentaires pour la présence d organismes génétiquement modifiés

HRP H 2 O 2. O-nitro aniline (λmax = 490 nm) O-phénylène diamine NO 2 NH 2

SERVICES DE SEQUENÇAGE

Chapitre 02. La lumière des étoiles. Exercices :

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Conférence technique internationale de la FAO

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

4. Conditionnement et conservation de l échantillon

La solution à vos mesures de pression

Transcription:

SOMMAIRE DU COURS LES ACIDES RIBONUCLÉIQUES (OU ARN) I. CARACTERISTIQUES GENERALES II. LES DIFFERENTS TYPES D ARN III. LES ARN RIBOSOMIQUES IV. LES ARN DE TRANSFERT (tarn) V. LES ARN MESSAGERS (marn) VI. LES PETITS ARN NUCLEAIRES LES OUTILS ENZYMATIQUES UTILISES EN BIOLOGIE MOLECULAIRE COUPURE DES ADN PAR LES ENZYMES DE RESTRICTION LES OUTILS ENZYMATIQUES AUTRES QUE LES ENZYMES DE RESTRICTION LES TECHNIQUES DE BASE DE LA BIOLOGIE MOLECULAIRE I. PURIFICATION DES ACIDES NUCLEIQUES II. MIGRATION ELECTROPHORETIQUE DES FRAGMENTS D ADN III. LE TRANSFERT SELON SOUTHERN IV. LA TECHNIQUE D4AMPLIFICATION GENIQUE OU TECHNIQUE PCR V. LA RT-PCR VI. LE SEQUENCAGE DE L ADN VII. L HYBRIDATION MOLECULAIRE LA TRANSCRIPTION I. GENERALITES II. CRACTERISTIQUES GENERALES DE LA TRANSCRIPTION III. LES MODIFICATIONS POST-TRANSCRIPTIONNELLES LA TRANSCRIPTION CHEZ LES EUCARYOTES ET LES MODIFICATIONS POST-TRANSCRIPTIONNELLES CHEZ LES EUCARYOTES I. LA TRANSCRIPTION CHEZ LES EUCARYOTES II. LE CONTROLE DE LA TRANSCRIPTION CHEZ LES EUCARYOTES III. LES REGULATIONS POST-TRANSCRIPTIONNELLES IV. L ETUDE PRATIQUE DE LA TRANSCRIPTION 1

LE CODE GENETIQUE I. DEFINITION II. CARACTERISTIQUES PRINCIPALES III. LES ADAPTATEURS DE LA SYNTHESE PROTEIQUE LA TRADUCTION I. LOCALISATION DE LA TRADUCTION II. LES ELEMENTS NECESSAIRES A LA TRADUCTION III. LES DIFFERENTES ETAPES DE LA TRADUCTION IV. INTERVENTION DES FACTEURS PROTEIQUES AU COURS DE LA SYNTHESE PROTEIQUE V. LES tarn SUPPRESSEURS VI. ETUDE PRATIQUE DE LA TRADUCTION VII. REMARQUE IMPORTANTE SUR LE WESTERN BLOT NOTION DE SEQUENCE SIGNAL ET MODIFICATIONS POST- TRADUCTIONNELLES DES PROTEINES I. GENERALITES II. LA SEQUENCE SIGNAL III. EXEMPLE CLASSIQUE DE PROTEINE AVEC UNE SEQUENCE SIGNAL IV. MODIFICATIONS POST-TRADUCTIONNELLES DES PROTEINES LA REGULATION DE LA SYNTHESE DES PROTEINES I. GENERALITES II. LA REGULATION DE LA SYNTHESE PROTEIQUE CHEZ LES PROCARYOTES LA REPLICATION DE L ADN I. GENERALITES II. LA REPLICATION DE L ADN CHEZ LES PROCARYOTES III. LA REPLICATIO DE L ADN CHEZ LES EUCARYOTES IV. LES TELOMERES 2

LES SYSTEMES DE SAUVEGARDE ET REPARATEURS DE L ADN I. GENERALITES II. ORIGINE DES ALTERATIONS DE L ADN III. LES TYPES DE DOMMAGE DE L ADN IV. LES MECANISMES REPARATEURS DE L ADN V. LES TYPES DE MUTATION DE L ADN LES VECTEURS ET SONDES NUCLEIQUES I. QUELQUES RAPPELS DE DEFINITIONS DE TERMINOLOGIES UTILISEES EN BIOLOGIE MOLECULAIRE II. LES VECTEURS III. LES SONDES NUCLEIQUES 3

LES ACIDES RIBONUCLÉIQUES (OU ARN) I. CARACTÉRISTIQUES GÉNÉRALES Les ARN sont caractérisés par: - L ose, le ribose remplace le 2 -désoxyribose présent dans les ADN. - Les bases pyrimidiques et puriques rencontrées sont: A, C, G et U (cette dernière est remplacée par T dans les ADN). - Une seule chaîne nucléotidique (au lieu de deux dans les ADN). Cette unique chaîne est plus courte que les chaînes d ADN. Les règles d appariement entre les bases complémentaires peuvent s observer dans les ARN. En effet, dans une même chaîne d ARN des portions peuvent être sous forme bicaténaire avec un appariement suivant la règle: A apparié avec U (deux liaisons hydrogène) et C apparié avec G (trois liaisons hydrogène). Dès lors, au niveau des appariements, on aura la constitution de sortes de tiges alors dans les régions non appariées, des boucles apparaîtront. II. LES DIFFÉRENTS TYPES D ARN. Les cellules contiennent essentiellement quatre types d ARN: - Les ARN ribosomiques (ou rarn). - Les ARN de transfert (ou tarn). - Les ARN messagers (ou marn). - Les ARN nucléaires de petite taille (ou snrna)(ou small nuclear RNA)(snRNA) et les ARN cytoplasmiques de petite taille (ou scrna) (ou small cytoplasmic RNA) Dans la cellule, les rarn sont les plus abondants (au moins 80% de l ensemble des ARN de la cellule) et les snrna les moins abondants. III. LES ARN RIBOSOMIQUES. Les ribosomes sont des organites intra-cellulaires situés dans le cytoplasme (mais on en trouve également dans les mitochondries) et qui sont l usine de fabrication des protéines de la cellule. On peut distinguer les rarn des procaryotes (E. coli) et les rarn des eucaryotes. III.1. Les rarn des procaryotes (E. coli). 4

Les ribosomes dits 70 S (S = unité de sédimentation ou Svedberg) sont formés de deux sous-unités, une grande sous-unité (50 S) et une petite sousunité (30 S). Chaque sous-unité comporte des protéines dites protéines ribosomales (ou r-protéines) et des rarn. Ainsi, la sous-unité 50 S contient deux rarn dits 5 S et 23 S et également un nombre considérable de protéines (au moins 34!), alors que la sous-unité 30 S ne contient qu un rarn dit 16 S avec au moins 21 protéines. III.2. Les rarn des eucaryotes. Chez les eucaryotes, les ribosomes sont plus gros (80 S) avec également une structure à deux sous-unités (40 S et 60 S). La sous-unité 60 S contient trois rarn différents (5 S, 5,8 S et 28 S) et la petite sous-unité 40 S ne contient qu un seul rarn 18 S). Le nombre de protéines ribosomales à l intérieur de chaque sous-unité est plus important que chez les procaryotes. III.3. Rôle des rarn. Les rarn jouent un rôle essentiel dans la structure et le maintien de l intégrité des ribosomes en association avec les protéines ribosomales. IV. LES ARN DE TRANSFERT (tarn). Les tarn sont les vecteurs qui vont transférer les acides aminés jusqu à l usine ribosome où s effectue la synthèse protéique. IV.1. Structure des tarn. Les tarn présentent bien entendu la structure générale des ARN. Mais ils possèdent en plus quelques particularités propres. Des bases inhabituelles.tout d abord, ils contiennent des nucléotides inhabituels par les bases qu ils renferment. Ainsi, l hypoxanthine, dont le nucléotide correspondant est l IMP (I = inosine monophosphate), mais aussi la thymine ou des bases méthylées. La structure spatiale des tarn. Les chaînes de tarn sont constituées d une centaine environ de nucléotides. Surtout, il existe des zones d appariement selon la règle de complémentarité et des zones appelées boucles sans appariement où sont présentes les bases inhabituelles. La forme générale est celle d un L. En structure spatiale, on présente souvent les tarn sous forme de trèfle. Les sites importants dans les tarn. Plusieurs sites sont importants dans les tarn. Tout d abord, leur extrémité 3 -OH. Il existe trois nucléotides caractéristiques -C-C-A-3 -OH. C est par cette extrémité que sera fixé l acide aminé qui sera véhiculé par le tarn. 5

Puis, l anticodon qui correspond à un groupe de trois nucléotides (ou triplet) situé sur une boucle du tarn. Ce triplet présente un rôle très important puisqu il doit s apparier avec le codon correspondant présent sur l ARN messager. Cet appariement entre l anti-codon et le codon se fait par des liaisons hydrogène et suivant les règles de complémentarité. Le codon et l anti-codon sont disposés de manière antiparalllèle. Il existe naturellement une vingtaine d acides aminés et on dénombre 61 codons différents! Ceci signifie qu un acide aminé pourra être véhiculé par plusieurs tarn spécifiques (différant par leur anticodon). Enfin, l extrémité 5 des tarn comporte un groupement phosphate. IV.2. Rôle des tarn. Les tarn jouent un rôle capital dans la biosynthèse protéique. La fixation de l acide aminé à transporter sur le tarn spécifique sera décrite en détail lors de l étude de la synthèse protéique. V. LES ARN MESSAGERS (marn). Les ARN messagers (ou marn) constituent le support essentiel de l information génétique entre l ADN et le ribosome où s effectuera la synthèse protéique. Leur durée de vie est très courte à la différence des tarn par exemple. Chez les bactéries, la durée de vie d un marn est de quelques minutes environ. Les marn sont très rapidement synthétisés et dégradés. Ils sont formés d une seule chaîne de nucléotides avec les bases communes aux ARN: A, U, C et G. Cette chaîne comporte une succession de triplets nucléotidiques. Chaque triplet nucléotidique constitue un codon spécifique d un acide aminé donné. Nous étudierons en détail dans la biosynthèse protéique les mécanismes de reconnaissance codon-anti-codon. VI. LES PETITS ARN NUCLEAIRES. Les petits ARN nucléaires (ou snrna) sont présents dans le noyau des cellules et sont impliqués dans certaines étapes de la transcription, c est-àdire la copie de l ADN en ARN messager. Ces snrna sont présents sous forme de particules ribonucléoprotéiques qui sont appelées snrnp : small nuclear ribonucleoparticles ou snurps. Dans le cytoplasme, on peut retrouver des petits ARN (ou scrna, c=cytoplasmic) qui existent également sous forme de particules ribonucléoprotéiques (appelées scrnp : small cytoplasmic ribonucleoprotein particles ou scyrp) VII. LES ARN DOUBLES BRINS. 6

Des ARN peuvent former des appariements comme dans la molécule d'adn et constituer des ARN doubles brins ou bicaténaires. Les appariements se font selon la règle de complémentarité A : U et C : G. LES OUTILS ENZYMATIQUES UTILISÉS EN BIOLOGIE MOLÉCULAIRE COUPURE DES ADN PAR LES ENZYMES DE RESTRICTION I. GÉNÉRALITÉS. Les enzymes de restriction sont des outils utilisés au laboratoire pour cliver l ADN. La coupure de l ADN se fait en un site particulier reconnu par l enzyme. Le nombre d enzymes de restriction est considérable, puisqu il atteint plusieurs centaines actuellement. Chaque enzyme reconnaît une séquence d ADN qui lui est spécifique. Les enzymes de restriction appartiennent à la classe des endonucléases, c est-à-dire des enzymes capables de cliver les liaisons phosphodiester entre deux nucléotides à l intérieur d un acide nucléique. Les endonucléases se différencient des exonucléases qui dégradent la molécule d ADN à partir de l une de ses extrémités (3 ou 5 ). II. SÉQUENCES D ADN RECONNUES PAR LES ENZYMES DE RESTRICTION. 7

Les séquences de nucléotides reconnues par les enzymes de restriction sont habituellement des séquences dites palindromiques. Les séquences palindromiques sont des séquences où la succession des nucléotides lue dans le sens 5 3 (gauche-droite) pour le premier brin est identique à la séquence lue dans le sens droite-gauche pour le second brin (sens 5 3 ). Ces séquences palindromiques sont le plus souvent constituées de 4 ou 6 paires de bases. Il faut remarquer que dans les ADN, on rencontre statistiquement des séquences reconnues par des enzymes de restriction. Ainsi, la séquence GATC reconnue par l enzyme Mbo I est présente avec une fréquence statistique de 1 / 256 paires de bases (1/ 4 4 ). En effet, la fréquence de coupure d un ADN par une enzyme de restriction donnée peut être approchée statistiquement en considérant le nombre de nucléotides de la séquence spécifique reconnue par l enzyme. Ainsi, par exemple, dans la séquence de six nucléotides: GGATCC reconnue par l enzyme Bam HI, on aura donc une fréquence de coupure statistique de 1 / 4 6, soit 1 coupure tous les 4096 nucléotides. III. ORIGINE DES ENZYMES DE RESTRICTION. Les enzymes de restriction sont extraites de micro-organismes, le plus souvent des bactéries. Les bactéries peuvent être parasitées par des virus à ADN. Les bactéries fabriquent des enzymes de restriction qui sont capables de cliver les ADN étrangers. Pour éviter une auto-destruction de leur propre ADN, elles se protègent contre leurs propres enzymes de restriction par une modification des sites de restriction correspondants. IV. NOMENCLATURE DES ENZYMES DE RESTRICTION. Les enzymes de restriction présentent une nomenclature bien précise. Leur nom comporte plusieurs lettres (3 ou 4). La première lettre de dénomination de l enzyme est écrite en majuscule, elle correspond au genre de la bactérie d où a été extraite l enzyme. La seconde lettre et la troisième lettre (en minuscules) correspondent à l espèce de la bactérie d où l enzyme est extraite. On peut avoir une quatrième lettre écrite en majuscule correspondant à la souche bactérienne. Enfin pour terminer, un chiffre romain indique l ordre de caractérisation de ces enzymes. Exemples: Eco RI Extraite de Escherichia coli RYB Sma I Extraite de Serratia marcescens Pst I Extraite de Providencia stuartii site reconnu: G / AATTC site reconnu: CCC / GGG site reconnu: CTGCA / G Des enzymes de restriction différentes peuvent reconnaître des mêmes sites spécifiques, on les appelle isoschizomères. Les isoschizomères fournissent souvent après clivage enzymatique des fragments dont les extrémités sont différentes. 8

V. TYPES DE COUPURES REALISÉES PAR LES ENZYMES DE RESTRICTION. Les enzymes de restriction peuvent donner deux types de coupures: la coupure à bouts francs et la coupure à bouts collants. La coupure à bouts francs aboutit à une coupure au milieu de la séquence palindromique. La coupure à bouts collants (ou à extrémités adhésives) correspond à une coupure qui se fait de part et d autre du centre de symétrie. Les sites de restriction sont repérés dans l ADN par l enzyme de restriction qui coupe l ADN en principe autant que fois qu il y a de sites de restriction. Ceci est valable pour une enzyme de restriction donnée, pour une autre enzyme, la coupure se fera en une position différente sur l ADN. On voit tout de suite les possibilités considérables de ce type d outils enzymatiques. L ADN est découpé en fragments variables et ceci aussi bien l ADN circulaire des bactéries ou des plasmides que l ADN linéaire. VI. LES CLASSES D ENZYMES DE RESTRICTION. La plupart des enzymes de restriction utilisées au laboratoire présentent un site de reconnaissance (souvent palindromique) et un site de coupure identique ou proche du site de reconnaissance, ce sont des enzymes de type II. Certaines bactéries possèdent d autres types d enzymes de restriction. Les enzymes de type I reconnaissent des séquences sur l ADN sans aucune symétrie. Ces enzymes coupent non pas au niveau de la séquence de reconnaissance mais 1000 à 5000 paires de bases plus loin. Les enzymes de type III présentent également un site de reconnaissance mais coupent une vingtaine de nucléotides plus loin. VII. MÉTHYLATION DES SITES DE RESTRICTION ET INACTIVATION DES ENZYMES DE RESTRICTION. L ADN bactérien présente des sites de restriction susceptibles d être repérés par les enzymes de restriction que possèdent la bactérie. Pour éviter une auto-destruction, les enzymes de modification de l ADN bactérien interviennent. Ces enzymes de modification sont des méthylases bactériennes (ou enzymes de méthylation). La méthylation de la cytosine (sur le carbone 5) ou de l adénine (sur l azote 6) appartenant à des sites de restriction aboutit à une inactivation de l enzyme de restriction correspondante. Cette méthylation peut se réaliser sur une base ou sur plusieurs bases appartenant au site de restriction. Les méthylases bactériennes sont très spécifiques. Prenons l exemple de l enzyme de restriction Hind III qui reconnaît la séquence spécifique (et palindromique) suivante: 9

La méthylation de l adénine (représentée sur le schéma associée avec un cercle) aboutit à une absence de reconnaissance de ce site spécifique par l enzyme Hind III et donc à une absence de coupure enzymatique: * 5 -Å-A-G-C-T-T-3 3 -T-T-C-G-A-Å-5 VIII. UTILISATIONS DES ENZYMES DE RESTRICTION. Les utilisations des enzymes de restriction sont très nombreuses en biologie moléculaire. Par exemple, elles permettent de fractionner l ADN en multiples fragments susceptibles d être séparés par les techniques d électrophorèse. Les enzymes de restriction peuvent être utilisées pour préparer un fragment d ADN d un gène donné (insert) à être inséré dans un vecteur comme un plasmide. Les enzymes de restriction sont utilisées couramment pour rechercher des mutations dans le génome. Les enzymes de restriction sont utilisées pour rechercher dans l ADN des cellules eucaryotes les méthylations de bases. Ces méthylations ont une signification complètement différente des méthylations de bases observées chez les procaryotes. Elles sont en relation directe avec des modifications de l expression des gènes des eucaryotes. La méthylation provoque le verrouillage de l expression de tel ou tel gène dans un tissu. Les méthylations dans le génome des eucaryotes concerne les cytosines impliquées dans les doublets dinucléotidiques CG. La recherche de ces doublets et de la présence ou non d une méthylation sur les cytosines est réalisée à l aide de deux enzymes de restriction, une enzyme insensible à la méthylation des cytosines et une autre enzyme sensible à la méthylation des cytosines. Une notion importante pour l utilisation des enzymes de restriction est la notion d enzymes compatibles. Deux enzymes de restriction sont dites compatibles quand elles génèrent après digestion des fractions aux extrémités cohésives complémentaires. Ces fragments peuvent être facilement ligaturés. Exemple: Les enzymes Bam HI (G / GATCC) et Mbo I ( / GATC): Après action de Bam HI: Premier fragment avant clivage par BamHI: Après clivage par Bam HI: 10

5 -G-G-A-T-C-C-3 3 -C-C-T-A-G-G-5 Après action de Mbo I: 5 -G-3 (1) 3 -C-C-T-A-G-5 5 -G-A-T-C-C-3 (2) 3 -G-5 + Second fragment avant clivage par Mbo I: 5 -A-G-A-T-C-A-G-C-3 3 -T-C-T-A-G-T-C-G-5 Après clivage par Mbo I 5 -A-3 (3) 3 -T-C-T-A-G-5 + 5 -G-A-T-C-A-G-C-3 (4) 3 -T-C-G-5 ligatures: 1+4 et 2+3. ISOSCHIZOMÈRES: Soit la séquence suivante: GGTACC, cette séquence est coupée par l enzyme Kpn I et l enzyme Acc65 I: Kpn I: 5 -G-G-T-A-C/C-3 3 -C/ C-A-T-G-G-5 Acc65 I: 5 -G/G-T-A-C-C-3 3 -C-C-A-T-G/G-5 Ces enzymes sont des isoschizomères, elles reconnaissent en effet la même séquence nucléotidique GGTACC. On voit tout de suite que les extrémités des fragments obtenus diffèrent. Autre exemple: les enzymes Msp I et Hpa II: I. Coupure par Msp I: 11

Cette enzyme est insensible à la méthylation, elle permet d étudier les séquences CG dans le génome. II. Coupure par Hpa II: c est un isoschizomère de l enzyme Msp I. Mais elle est sensible à la méthylation des cytosines: 5 -C-C*-G-G-3 Premier brin (sens 5 3 ) 3 -G-G-C-C-5 Second brin (sens 3 5 ) Hémi-méthylation (concerne C* donc pas de coupure par Hpa II) LES OUTILS ENZYMATIQUES AUTRES QUE LES ENZYMES DE RESTRICTION I. LES ENZYMES COUPANT L ADN. I.1. La DNase. La DNase utilisée au laboratoire est extraite du pancréas de bovin. Il s agit d une endonucléase qui coupe l ADN double brin (mais aussi l ADN simple brin). Elle conduit à des coupures ou «nicks» tout à fait au hasard, sans reconnaissance d un site spécifique (ce qui la distingue des enzymes de restriction). On obtient des fragments de tailles variées (ou oligonucléotides) qui possèdent en leur extrémité 5 un groupement phosphate. Cette enzyme est sensible à des ions bivalents (Mg 2+ et Mn 2+ ). Elle est utilisée pour des marquages de sondes avec des radioisotopes (voir plus loin). I.2. LA NUCLÉASE S1. Cette enzyme extraite d un champignon, n attaque que l ADN simple brin. Elle n attaque pas en principe les ADN doubles brins et les hybrides ADN- ARN. 1.3 L'EXONUCLEASE III. Cette enzyme catalyse l'hydrolyse séquentielle des nucléotides d'un ADN 3' -- ->5' à partir d'une extrémité 3'OH libre. Elle possède en plus une activité 3' phosphatase. II. LES ENZYMES ASSURANT LA LIGATURE. II.1. LES LIGASES. 12

Les ligases sont capables de lier par une liaison ester un fragment avec un groupement phosphate en 5 et un groupement OH en 3 et ceci en présence d ATP. Elles peuvent effectuer des ligatures sur des fragments d ADN avec bouts francs ou des bouts collants (ou extrémités cohésives). Elles sont extraites de bactéries. III. LES ENZYMES ENLEVANT OU AJOUTANT DES GROUPES PHOSPHATES. III.1. ENZYMES ENLEVANT DES GROUPES PHOSPHATES. Ces enzymes sont appelées phosphatases. Les phosphatases alcalines sont actives à ph alcalin. Elles permettent d enlever le groupement phosphate situé en 5 d une chaîne d ADN. Elles sont extraites de bactéries ou d origine animale (intestins). Elles sont utilisées pour préparer de l ADN recombinant. III.2. ENZYMES AJOUTANT DES GROUPEMENTS PHOSPHATES. Les kinases permettent de fixer un groupement phosphate en présence d ATP. Dans cette molécule d ATP, le phosphate fixé est celui situé en position gamma (position la plus externe) de la molécule d ATP. Le groupement phosphate est fixé à l extrémité 5 d un ADN préalablement déphosphorylé. Ces kinases sont extraites de bactéries. IV. LES ENZYMES RECOPIANT LES ACIDES NUCLÉIQUES. IV.1. PROPRIÉTES GÉNÉRALES. Les enzymes recopiant aussi bien une chaîne d ADN ou d ARN ont les propriétés générales suivantes: - Elles synthétisent le nouveau brin dans le sens 5 3. - Cette synthèse s effectue de manière complémentaire et antiparallèle. - Elles nécessitent la présence de nucléosides triphosphates (NTPs) ou de désoxynucléosides triphosphates (dntps). IV.2. LES ENZYMES RECOPIANT UN ADN EN ADN. Ces enzymes sont des ADN polymérases ADN dépendantes. Elles ne sont pas capables de synthétiser le brin nouveau d ADN sans la présence d une amorce d acide nucléique. Les ADN polymérases catalysent la réaction générale suivante: (dnmp)n + dntp (dnmp)n+1 + PPi avec N = A, C, T ou G. (PPi = groupe pyrophosphate). 13

Toutes les ADN polymérases possèdent les caractéristiques suivantes: - Elles ont besoin d une amorce avec une extrémité 3 -OH libre. - La chaîne nouvelle d ADN est synthétisée dans le sens 5 3. - La chaîne nouvelle est complémentaire de la chaîne matrice d ADN et antiparallèle. IV.2.1. L ADN POLYMÉRASE I (E. coli) ET LE FRAGMENT DE KLENOW. Comme exemple-type d ADN polymérase, nous citerons l ADN polymérase I qui est extraite d E. coli. Cette enzyme possède des propriétés polymérasiques, mais aussi des propriétés exonucléasiques. Il est important de préciser que les exonucléases peuvent couper les nucléotides un par un à partir d une chaîne polynucléotidique avec une spécificité soit de l extrémité 5 (coupure 5 3 ), soit de l extrémité 3 (coupure 3 5 ). L ADN polymérase I possède les deux activités exonucléasiques: 5 3 et 3 5. Cette enzyme est constituée par une seule chaîne polypeptidique. Au laboratoire, on utilise souvent une enzyme préparée à partir de l ADN polymérase I qui est appelée fragment de KLENOW. Cette enzyme ne possède plus d activité exonucléasique 5 3, il reste les propriétés polymérasiques et les propriétés exonucléasiques 3 5. L activité 3 5 permet à l enzyme au cours d une synthèse d un fragment d ADN de contrôler si l appariement de la base qui vient d être ajoutée est conforme aux règles de complémentarité. Cette remarquable activité exonucléasique 3 5 est encore appelée la fonction d édition de l enzyme. IV.2.2. LA SÉQUENASE. Cette enzyme est d origine bactérienne mais elle ne possède plus d activité 3 5 exonucléasique. Elle est utilisée dans le séquençage de l ADN. IV.2.3. LA Taq POLYMÉRASE. La Taq polymérase est une ADN polymérase extraite de bactéries présentes dans les sources chaudes. Elle permet de travailler à des températures plus élevées que les températures usuelles (ambiante ou 37 C). Elle est très utilisée dans les réactions d amplification génique et également dans les réactions de séquençage de l ADN. En principe, elle est dépourvue de l activité exonucléasique 3 5. IV.3. LES ENZYMES RECOPIANT UN ARN EN UN ADN. IV.3.1. LA RÉTROTRANSCRIPTASE OU TRANSCRIPTASE INVERSE. 14

Cette enzyme est surtout présente dans les rétrovirus (virus à ARN). Elle permet de fabriquer à partir d un ARN messager (marn) un cadn (ou séquence d ADN complémentaire d un marn). Elle possède les propriétés suivantes: - C est une ADN polymérase qui synthétise le nouveau fragment dans le sens 5 3. - Elle est ARN-dépendante. - Elle est dépourvue d activité exonucléasique 3 5, donc de fonction d édition. Elle peut donc insérer des bases par erreur. - Elle a une activité RNAse. La technique classique pour préparer un cadn à partir d un marn consiste tout d abord à fournir une amorce à la rétrotranscriptase. Cette amorce peut être une séquence courte par exemple une séquence oligo(dt) capable de s hybrider avec l extrémité poly(a) du marn. A partir de cette amorce, la rétrotranscriptase poursuit la copie en ADN du marn (élongation). De plus à la fin de la copie, elle est capable de recopier son propre travail, donc elle réalise une boucle à l extrémité 3 de l ADN copié (voir schémas). Un traitement chimique doux permet de détruire le marn simple brin mais pas sa copie d ADN simple brin. On ajoute ensuite de l ADN polymérase pour réaliser une copie de l ADN simple en ADN double brin. La nucléase S1 peut ensuite éliminer l extrémité de l épingle à cheveu. On a ainsi formé un cadn double brin. D autres techniques existent pour préparer du cadn à partir du marn. IV.4. LES ENZYMES RECOPIANT UN ADN EN UN ARN. Les ARN polymérases réalisent des transcriptions de l un des deux brins d ADN en un brin d ARN. Elles sont extraites des bactéries. Ces ARN polymérases possèdent les propriétés suivantes: - Elles synthétisent le brin nouveau dans le sens 5 3. - Elles n ont pas besoin d amorce pour commencer la synthèse (à la différence des ADN polymérases). - Elles nécessitent des ribonucléosides triphosphates (ou NTPs) et également (comme les autres polymérases) des ions Mg 2+. - Elles sont dénuées d activité d édition. 15

16

17

18

- Enfin, dans des conditions normales de transcription, les ARN polymérases ne peuvent démarrer la transcription que si l ADN à transcrire possède le promoteur spécifique correspondant. LES TECHNIQUES DE BASE DE LA BIOLOGIE MOLÉCULAIRE I. PURIFICATION DES ACIDES NUCLÉIQUES. I.1. EXTRACTION A PARTIR DE MATÉRIELS BIOLOGIQUES. L ADN (ou l ARN) doit impérativement être purifié à partir de matériels biologiques dans des conditions optimales de qualité et de quantité. Dans la pratique, les acides nucléiques sont souvent extraits du sang total. Le procédé classique est l extraction par le couple phénol-chloroforme. Le phénol est un excellent agent dénaturant des protéines et il permet de séparer efficacement les protéines et les acides nucléiques. Il est ensuite éliminé par l extraction avec du chloroforme (non miscible avec l eau). La séparation des phases aqueuse et organique peut se faire par centrifugation. La phase aqueuse contient les acides nucléiques. Des traitements par des agents clivant les protéines (protéolyse) peuvent être nécessaires. Les acides nucléiques peuvent être finalement récupérés sous forme solide à la suite de précipitation par l alcool éthylique ou par l alcool isopropylique. De nombreux réactifs sont disponibles, prêts à l emploi, ce qui permet de simplifier les opérations de purification. Il est possible d extraire les acides nucléiques à partir d échantillons biologiques variés: cultures cellulaires, 19

tissus divers etc... Les méthodes d extraction doivent bien entendu être adaptées aux quantités disponibles de matériel biologique. I.2. ESTIMATION DES QUANTITÉS D ADN. Cette estimation est indispensable après extraction d ADN à partir d un matériel biologique. Elle s effectue par spectrophotométrie dans l ultra-violet à 260 nm. Il est indispensable de mesurer également l absorption à 280 nm. Cette dernière longueur d onde permet d estimer la contamination éventuelle de l extrait par des protéines. L absorption se définit par l unité de densité optique mesurée à 260 nm. Une unité de densité optique correspond à l absorption d une solution d ADN double brin à la concentration de 50 µg/ml ou à l absorption d une solution d ADN simple brin (ou d ARN) à la concentration de 25 µg/ml. II. MIGRATION ÉLECTROPHORÉTIQUE DES FRAGMENTS D ADN. Les fragments d ADN après digestion par les enzymes de restriction peuvent être séparés par électrophorèse sur un gel d agarose. Dans ce type de gel, les migrations des fragments d ADN dépendent de la taille du fragment plus que de la charge de celui-ci. Plus le fragment a une taille élevée, moins la migration électrophorétique par rapport au puits d inclusion sera importante. A l opposé les fragments de petite taille auront une distance de migration la plus élevée. La détermination précise des tailles des fragments séparés par électrophorèse est effectuée en faisant migrer des marqueurs de poids moléculaire en parallèle avec les échantillons à analyser. La détection de l ADN sur ce type de gel est réalisée par exposition aux rayons UV après réaction avec un réactif spécifique (bromure d éthidium par exemple, agent s intercalant entre les brins d ADN). L électrophorèse des fragments d ADN en gel d agarose permet des séparations jusqu à 20-25 kb (20000-25000 pb). Le tampon utilisé pour la migration électrophorétique a un ph basique (par exemple: 8,3 dans le cas du tampon appelé TBE = Tris-Borate-EDTA). Des fragments d ADN de taille restreinte (inférieure à 1000 paires de bases) peuvent être séparés par électrophorèse sur gel de polyacrylamide. D autres techniques électrophorétiques existent comme l électrophorèse en champ pulsé qui permet de séparer des grands fragments d ADN (taille supérieure à 50 kb). Le support d électrophorèse est constitué par de l agarose et on applique au gel un champ électrique de nature variable. Ainsi, le champ électrique peut être appliqué dans une direction donnée pendant 1 minute puis dans une direction perpendiculaire au champ précédent pendant une minute et ainsi de suite. Le processus de réorientation des macromolécules dans le champ électrique dépend de leur taille. 20

ÉLECTROPHORÈSE EN GEL D AGAROSE APRÈS MIGRATION ET COLORATION PAR LE BROMURE D ETHIDIUM. FIGURE DE GAUCHE: - PISTE 1: Marqueurs de taille (en paires de bases). - PISTE 2: Echantillon d ADN dont la taille est à déterminer. FIGURE DE DROITE: - Courbe d étalonnage en abscisses, les distances par rapport au puits d inclusion: et en ordonnées les poids moléculaires (échelle logarithmique). III. LE TRANSFERT SELON SOUTHERN. III. 1. PRINCIPE. 21

Cette méthode a été initialement décrite par E.M. SOUTHERN en 1975. Elle consiste à détecter spécifiquement des fragments d ADN transférés sur filtre par leur hybridation à des séquences complémentaires marquées par un radioisotope. III. 2. RÉALISATION PRATIQUE. Les étapes successives de cette technique sont les suivantes: III. 2.1. Extraction de l ADN génomique. Cette extraction s effectue à partir des leucocytes circulants par exemple obtenus à partir de sang total. III. 2. 2. Digestion par des enzymes de restriction différentes du même ADN génomique. L ADN génomique est digéré par des enzymes de restriction différentes: dans le tube 1, on réalisera une digestion par l enzyme 1; dans le tube 2, une digestion par l enzyme 2; etc...). On peut bien entendu réaliser des digestions par deux enzymes dans un même tube. Dans ces conditions, on obtient un très grand nombre de fragments, mais seuls quelques fragments correspondent à une partie ou à la totalité du gène étudié. III. 2. 3. Séparation électrophorétique des fragments d ADN par électrophorèse dans un gel d agarose. Après séparation électrophorétique en gel d agarose des fragments d ADN bicaténaires obtenus par digestion enzymatique, on réalise une dénaturation des fragments par un traitement alcalin du gel d électrophorèse. Ce traitement transforme les fragments d ADN double brin (ou bicaténaires) en fragments d ADN monobrin (ou monocaténaires). III. 2. 4. Transfert des fragments monocaténaires du gel d agarose à un support souple (feuille de nylon par exemple). Le transfert des fragments monocaténataires du gel d agarose à un support type nylon s effectue par simple capillarité. III. 2. 5. Fixation des fragments monocaténaires d ADN sur le support souple et hybridation dans des conditions optimales de stringence avec une sonde complémentaire marquée à un radioisotope. Les fragments monocaténaires d ADN transférés sur un support solide souple (nylon) sont mis en présence d une sonde qui va s hybrider dans des conditions physico-chimiques bien définies. on parle de conditions optimales de stringence. La sonde s apparie avec les fragments d ADN monocaténaire selon les règles de complémentarité. De plus, elle est marquée avec un 22

radioisotope (soit à son extrémité 5, soit à l intérieur de la chaîne polynucléotidique). Nous verrons plus loin la préparation des sondes. III. 2. 6. Lavages et révélation (dans ce cas par autoradiographie). Après de nombreux lavages, le support solide est mis en contact avec un film photographique pendant plusieurs jours. Le film est ensuite révélé. Les bandes d ADN monocaténaires hybridées avec la sonde radioactive sont visibles sous forme de bandes noires sur un fond blanc. La position de ces bandes par rapport à des témoins de poids moléculaire permet de déterminer la taille de ces fragments. III.3. UTILISATIONS DE LA TECHNIQUE DE SOUTHERN. Nous citerons parmi les applications de la technique de SOUTHERN: III.3.1. Carte de restriction de l ADN. Les enzymes de restriction coupent l ADN au niveau de séquences parfaitement définies. Il est donc possible d établir une véritable carte d un gène donné par la technique de SOUTHERN. Cette carte porte le nom de carte de restriction. En pratique, l ADN à étudier est réparti en différentes fractions. Chaque fraction est traitée par une enzyme de restriction ou un couple d enzymes de restriction. Ainsi dans l exemple ci-dessous. Dans le puits 1, on dépose l ADN digéré par Eco RI seule; dans le puits 2, on dépose l ADN digéré par Hind III seule et dans le puits 3, l ADN digéré par Eco RI et Hind III. La détection des différents fragments est réalisée à l aide d une sonde marquée du gène étudié (voir schémas). Cartographie selon SOUTHERN et résultats: 23

Interprétation: (1): Position des coupures par Eco RI. (2): Position des coupures par Hind III. (3): Position des coupures par Hind III + Eco RI. III.3.2. Si on dispose de sondes spécifiques du gène à explorer. 24

Mise en évidence des délétions dans un gène ou une zone juxta-génique. L étendue de la délétion peut être estimée par la détermination de la taille des fragments d ADN. III.3.3. Comparaison de l ADN de différents individus avec mise en évidence des polymorphismes de restriction. En présence de mutation(s) ponctuelle(s) dans des sites de restriction, des variations dans la taille de certains fragments seront observées et ceci par exemple à l intérieur d une même population. Ces petites différences entre des individus dans une même population sont appelées de polymorphisme de taille des fragments de restriction (ou RFLP pour «restriction fragment length polymorphism»). III.3.4. Mise en évidence des recombinaisons entre des gènes. IV. LA TECHNIQUE D AMPLIFICATION GÉNIQUE OU TECHNIQUE PCR («POLYMERASE CHAIN REACTION»). IV. 1. PRINCIPE. Cette technique décrite en 1985 (K. MULLIS et collaborateurs) permet d amplifier des séquences d ADN de manière spécifique et d augmenter de manière considérable la quantité d ADN dont on dispose initialement. Elle nécessite de connaître la séquence des régions qui délimitent l ADN à amplifier. Ces séquences serviront à synthétiser des amorces oligonucléotidiques complémentaires (de longueur de 20 à 30 nucléotides en général). Ces oligonucléotides serviront à délimiter la portion d ADN à amplifier. L ADN polymérase les utilisera comme amorces. IV. 2. RÉALISATION PRATIQUE. La technique comporte des cycles successifs. Chaque cycle comprend une succession de trois phases: - Une phase de dénaturation par la chaleur pour séparer les deux brins d ADN (92-95 C)(30 secondes-1 minute). - Une phase d hybridation avec les deux amorces spécifiques entre 55-60 C. La première amorce se fixe sur un brin d ADN, l autre sur le brin complémentaire (30 secondes-1 minute). - Une phase d extension par l ADN polymérase à partir des amorces à 70-72 C (1-2 minutes). Cette technique a pris un essor considérable avec l introduction d une ADN polymérase résistante à la chaleur. Cette ADN polymérase ou Taq polymérase est extraite d une bactérie thermophile (Thermus aquaticus). Elle permet une automatisation des différents cycles (dans des appareils appelés 25

thermocycleurs). Le nombre de cycles est généralement compris entre 30 et 40. Cette méthode permet d amplifier l ADN compris entre les deux amorces d un facteur de 10 5 à 10 6. Les résultats doivent être optimisés en fonction d un certain nombre de paramètres: concentration en MgCl2, concentration en amorces, spécificité des amorces etc... Le choix des amorces est particulièrement crucial pour obtenir des résultats satisfaisants (spécificité, taille, paramètres physico-chimiques...). L introduction de logiciels spécialisés et des bases de données nucléotidiques a permis de réaliser des choix plus rationnels. La Taq polymérase extraite de Thermus aquaticus présente une activité exonucléasique 5 3, mais elle est dénuée d activité exonucléasique 3 5, c est-à-dire de la fonction d édition. Elle peut insérer des bases qui ne suivent pas la règle classique d appariement et ceci au hasard. On estime qu elle réalise une mauvaise incorporation toutes les 10 4 à 10 5 bases. Cette technique a évolué considérablement. De nouveaux types de PCR ont été introduits. Nous citerons brièvement: - La PCR dite «Multiplex» pour amplifier des gènes avec de nombreux exons (le gène CFTR impliqué dans la mucoviscidose possède 27 exons), il est possible d introduire dans le milieu d amplification des couples d amorces spécifiques différentes. - La PCR dite «Nested PCR». Elle correspond à une seconde PCR réalisée en utilisant des nouuvelles amorces situées à l intérieur du domaine défini par les amorces de la première PCR. - La PCR quantitative. Dans ce type de PCR, on cherche à estimer le nombre de copies présent dans la séquence cible d ADN ou d ARN. La proportionnalité entre le nombre d amplifications et le nombre de copies n est valable que pour un nombre de cycles PCR faible. IV. 3. UTILISATIONS DES PRODUITS PCR. Les utilisations des produits PCR sont très variées, nous citerons quelques exemples (cette liste n est pas exhaustive): IV.3.1. Mise en évidence de mutations ponctuelles par hybridation des produits PCR avec des sondes oligo-nucléotidiques (technique dite du «dotblot»). Les produits PCR peuvent après transformation en monobrins être hybridés avec des sondes oligonucléotidiques fixées sur un support solide. Ces sondes correspondent à des séquences normales et pathologiques (présence de mutations ponctuelles par exemple) pour un gène donné. IV.3.2. Analyse de restriction. 26

Le produit PCR est soumis à une digestion enzymatique par une enzyme de restriction. Si une mutation ponctuelle modifie le site de restriction intialement présent, la taille des fragments d ADN obtenus après digestion sera modifiée et décelable après électrophorèse des fragments d ADN (sur gel d agarose ou gel de polyacrylamide). A titre d exemple, la mutation ponctuelle (GAGGTG) sur le sixième codon du premier exon du gène b de la globine humaine entraîne l apparition d une hémoglobine anormale appelée hémoglobine S (mutation ponctuelle d un acide aminé: GluVal). Cette anomalie est répandue dans le monde entier. Elle est responsable à l état homozygote d une pathologie grave: la drépanocytose homozygote. Cette mutation entraîne une modification du site de restriction de l enzyme Dde I: C / TNAG (N = A, T, C ou G). La séquence suivante représente les 9 premiers codons normaux du premier exon du gène b de la globine humaine: La mutation Hb S conduit à une mutation ponctuelle au niveau du codon 6 avec disparition du site de restriction pour l enzyme Dde I: L électrophorèse des produits PCR après digestion par l enzyme Dde I permet d affirmer ou d infirmer la présence d une mutation GAGGTG sur le codon 6 par la comparaison des tailles des fragments. On peut donc confirmer l état hétérozygote ou l état homozygote pour cette mutation. IV.3.3. Introduction du produit PCR dans un vecteur: clonage du produit PCR (voir cours sur les vecteurs). IV.3.4. Séquençage direct du produit PCR (voir cours sur le séquençage). IV.3.5. Analyse électrophorétique des produits PCR: technique DGGE et technique SSCP). Ces techniques d analyse électrophorétiques des produits PCR sont particulièrement utiles pour mettre en évidence des mutations ponctuelles au niveau d un gène. Des produits PCR (ou amplimères) particuliers sont formés si des mutations sont présentes sur l ADN initial. Les produits PCR seront différents en fonction de la présence d une séquence normale, d une séquence mutée (homozygote, hétérozygote ou composite)(voir schémas). 27

IV. 3.5.1. Technique DGGE (pour «denaturating gel gradient electrophoresis»). La température de fusion d un produit PCR (ADN double brin), c est-à-dire la température moyenne de séparation des deux brins est fonction de sa séquence. Une mutation ponctuelle qui change donc la séquence entraîne une modification de la température de fusion. Cette modification est mise en évidence par électrophorèse sur gel de polyacrylamide en présence d un gradient d agent dénaturant. IV. 3.5.2. Technique SSCP (pour «single strand chain polymorphism». La technique SSCP est basée sur l analyse électrophorétique des produits PCR sous forme de fragments simple brin. On amplifie par PCR une région que l on désire étudier et on compare la mobilité de l ADN dénaturé portant une mutation par rapport à celle d un fragment de référence comportant une séquence normale. Une mutation ponctuelle au sein d une séquence modifie suffisamment la structure secondaire de l ADN monobrin pour qu il en résulte des changements de migration électrophorétique sur gel de polyacrylamide. Les techniques DGGE et SSCP sont concurrencées par des techniques de chromatographie liquide à haute performance avec des températures d élution variables (DHPLC: «denaturing high pressure liquid chromatography»). V. LA RT-PCR. La RT-PCR se déroule en deux phases. Une première phase correspond à la copie d ARN messager en ADN complémentaire (cadn) et une seconde phase correspond à une réaction PCR classique sur le cadn synthétisé. Dans la première phase, l ARN messager à étudier est répéré en utilisant une sonde oligonucléotidique spécifique (amorce 1 qui s hybride à l extrémité 3 du seul marn auquel on s intéresse), puis la transcriptase inverse (ou rétrotranscriptase) permet la synthèse du brin complémentaire (sous une forme de cadn simple brin), une seconde amorce oligonucléotidique spécifique (amorce 2) permettra la synthèse du second brin par extension. L ADN complémentaire synthétisé servira ensuite de matrice pour une réaction PCR classique. La technique RT-PCR a permis de montrer que la transcription de tous les gènes s effectuait dans tous les tissus et ceci même pour les gènes qui présentent une très grande spécificité tissulaire. On parle dans ces conditions de transcription illégitime. Il est évident qu avant les techniques d amplification génique, la sensibilité des méthodes classiques n avait pas permis de mettre en évidence un tel phénomène. 28

VI. LE SÉQUENÇAGE DE L ADN. VI.1. TECHNIQUE DE SANGER. VI.1.1. PRINCIPE. Cette technique enzymatique est basée sur la copie d'un fragment d'adn monocaténaire que l'on désire séquencer par une ADN polymérase. On utilise des didésoxynucléosides triphosphates. Ces dérivés ne possèdent pas d'oh en position 3' du désoxyribose. L'incorporation de ce didésoxyribonucléotide par l'adn polymérase bloque l'allongement de la molécule d'adn en cours de copie. En effet, l'allongement d'une chaîne polynucléotidique par une ADN polymérase nécessite un groupement OH en 3' disponible. Soit l'adn bicaténaire suivant dont la séquence doit être déterminée : 5 G G T C A T C C A T G G A T T C G A 3 3 C C A G T A G G T A C C T A A G C T 5 Les deux brins d'adn sont préalablement séparés par fusion. Considérons le brin orienté 3'-->5' : 3 C C A G T A G G T A C C T A A G C T 5 On réalise une hybridation avec une amorce de séquençage1 : GGTCATCC, orientée 5'-->3' : 5 G G T C A T C C 3 C C A G T A G G T A C C T A A G C T 5 1 L'amorce de séquençage pour simplifier l'exposé a été volontairement réduite en nombre de nucléotides, ceci n'est pas le cas en pratique. L'exemple présenté ci-dessus est bien entendu essentiellement à but didactique. Puis, on réalise une réaction de séquençage avec des dntps (datp, dttp, dctp et dgtp) et de la Taq polymérase. On prépare quatre tubes identifiés : A, T, C et G. Tube A T C G Taq polymérase + + + + dntps + + + + ddntp ddatp ddttp ddctp ddgtp 29

Dans le tube A : on introduit du ddatp. La synthèse d'adn s'arrêtera au niveau de chaque A avec les fragments suivants: 5'-GGTCATCCA-3' (8 nucléotides) 5'-GCTCATCCATGGA-3' (13 nucléotides) 5'-GCTCATCCATGGATTCGA-3' (18 nucléotides) Dans le tube T : on introduit du ddttp. La synthèse s'arrêtera au niveau de chaque T avec les fragments suivants: 5'-GGTCATCCAT-3' (10 nucléotides) 5'-GGTCATCCATGGAT -3' (14 nucléotides) 5'-GGTCATCCATGGATT -3' (15 nucléotides) Dans le tube C : on introduit du ddctp. La copie d'adn s'arrêtera au niveau de chaque C avec le fragment unique suivant : 5'-GGTCATCCATGGATTC -3' (16 nucléotides) Dans le tube G: on introduit du ddgtp. La synthèse s'arrêtera au niveau de chaque G avec les fragments suivants: 5'-GGTCATCCATG-3' (11 nucléotides) 5'-GGTCATCCATGG-3' (12 nucléotides) 5'-GGTCATCCATGGATTC-3' (17 nucléotides) On voit facilement qu'avec cette technique, si l'amorce ajoutée est marquée en 5' par un phosphate radioactif (32P), dans chaque tube, on aura différentes espèces qui présenteront toutes un marquage en 5' au phosphate radioactif. 30

nt = nucléotide (nombre de nucléotides) La lecture de ce gel se fait de bas en haut (des fragments de petite taille aux fragments de grande taille). On aura donc le résultat de séquençage suivant: VI.1.2. Les appareils de séquençage automatique. La technique de Sanger s'est considérablement automatisée avec l'apparition des appareils de séquençage automatique. On utilise des amorces ou des didésoxynucléosides triphosphates marqués à des fluorochromes. La réaction de séquençage s'effectue comme décrite précédemment dans la technique manuelle de Sanger. La lecture du gel se fait par un balayage automatique qui permet de discriminer grâce à des fluorochromes différents les quatres bases A, T, C ou G. L'utilisation de logiciels informatiques permet de fournir un tracé électrophorétique avec des couleurs différentes pour chaque base élémentaire. 31

VI.2. TECHNIQUE CHIMIQUE DE MAXAM ET DE GILBERT. La méthode chimique de MAXAM et de GILBERT est moins utilisée actuellement que la méthode enzymatique de SANGER. L ADN à séquencer est tout d abord marqué en 5 avec phosphore 32 (datp), puis clivé après A, G, C ou T par divers réactifs chimiques. Après clivage par ces réactifs, les fragments produits sont séparés par électrophorèse en gel de polyacrylamide. L examen de l autoradiographie correspondante permet de connaître la séquence du brin analysé. VII L'HYBRIDATION MOLECULAIRE. Nous avons déjà défini la température de fusion d'un ADN bicaténaire ainsi que les facteurs qui influencent celle-ci comme la composition en bases ou la nature du milieu dans lequel l'adn est en solution. D'autres facteurs importants interviennent comme la longueur des fragments d'adn ou la présence éventuelle dans l'adn bicaténaire initiale de mésappariements. A l'inverse après séparation de brins par fusion, si la solution d'adn est refroidie lentement dans des conditions de milieus favorables, une réassociation des brins est progressivement observée. Ce phénomène est appelé hybridation moléculaire. Cette réassociation peut concerner deux séquences d'adn ou une séquence d'arn complémentaire. Elle est donc d'une spécificité très grande. VII.1 LES FACTEURS AFFECTANT L'HYBRIDATION MOLECULAIRE. L'hybridation moléculaire dépend d'un grand nombre de facteurs. - Tout d'abord le temps. Plus le temps de réaction est long, plus la probabilité d'appariements pour des séquences complémentaires augmente. - La concentration en acides nucléiques. Plus la concentration en acides nucléiques est élevée, plus la probabilité de rencontres entre des séquences complémentaires est élevée. En pratique on introduit le produit temps x concentration en acides nucléiques, Ce paramètre est appelé Cot pour les hybridations entre fragments d'adn et Rot pour les hybridations d'arn et d'adn. On utilise souvent les valeurs de Cot 1/2 et de Rot 1/2 qui correspondent respectivement à 50% d'hybridation dans le cas d'hybridation moléculaire d'adn ou d'adn-arn. - D'autres facteurs interviennent : la nature du milieu, la longueur des fragments, la présence d'agents chimiques supplémentaires (phénol...) etc... 32

L'HYBRIDATION SPECIFIQUE AVEC DES SONDES OLIGONUCLEOTIDIQUES Les produits PCR (PCR classique ou multiplex) sont dénaturés en ADN monobrin et peuvent être hybridés avec des oligo-nucléotides normaux ou pathologiques fixés de manière covalente à un support solide. La présence du produit d'hybridation après lavages est décelée par réaction enzymatique 33

grâce à la biotine fixée sur les amorces PCR. Les amorces PCR sont en effet marquées en 5' par de la biotine. La biotine réagit avec la streptavidineperoxydase (ou phosphatase alcaline) pour la révélation enzymatique. SEQUENÇAGE AUTOMATIQUE DOUBLE BRIN SUR SEQUENCEUR LI-COR 4200 Cette technique de séquençage fait appel à un marquage des amorces (" Dye Primer "). Il est possible d'utiliser un marquage des di-désoxynucléotides (ddntps) avec les marquages 700 et 800 nm (" Dye Terminator "). On veut déterminer la séquence de l'adn double brin suivant : 34

Les réactions de séquençage sont préparées dans quatre tubes : A, T, C et G. La synthèse d'adn est réalisée en présence d'une Taq polymérase, de dntps et des ddntps spécifiques. L'appareil peut effectuer après migration électrophorétique une double détection aux deux longueurs d'onde par balayage du gel. Le tube de séquençage indiqué dda contiendra différentes espèces dont l'extrémité 3' est terminée par dda et l'extrémité 5' comporte un marquage soit à 700 nm, soit à 800 nm. Ces espèces sont séparées par électrophorèse en gel de polyacrylamide par une migration verticale. 35

APPAREIL DE SEQUENÇAGE AUTOMATIQUE LI-COR 4200 36

37

38

39

LA TRANSCRIPTION I. GÉNÉRALITÉS. La transcription constitue l ensemble des mécanismes par lequel l ARN messager (marn) est synthétisé. Le marn est une copie d une portion de l ADN. Seules certaines portions de l ADN sont transcrites, ces séquences d ADN sont appelées gènes. Enfin, seul l un des deux brins d ADN est copié en marn. La transcription constitue l étape préliminaire essentielle pour la biosynthèse protéique (ou traduction). La transcription ne produit pas seulement des marn, mais aussi des tarn, des rarn et des snarn. II. CARACTÉRISTIQUES GÉNÉRALES DE LA TRANSCRIPTION. II.1. Les règles de base. La synthèse d un marn à partir d ADN s effectue toujours: - Dans le sens 5 3. - De manière antiparallèle par rapport à la portion d ADN copiée. - De façon complémentaire (appariements G et C et A et U). II.2. Les éléments nécessaires à la transcription. La synthèse d un marn nécessite: - La présence de nucléotides propres au marn, c est-à-dire contenant du ribose, des bases A, U, G et C et sous forme de nucléosides triphosphates: ATP, UTP, CTP et GTP (on écrit souvent pour les dénommer NTP). - La présence d une enzyme: l ARN-polymérase. Les sels de magnésium sont indispensables à cette enzyme. - Bien entendu, la présence d une matrice d ADN servant de modèle. Ce modèle est indispensable à l enzyme, on parle souvent d ARN-polymérase ADN-dépendante. II.3. Les différentes étapes de la transcription. La transcription ne concerne qu une portion de l ADN. Il est bien évident qu il faut définir le début et la fin de la transcription et préciser les mécanismes par lesquels l ARN-polymérase reconnaît la portion d ADN à transcrire. On parle également d unité transcriptionnelle. La synthèse de l ARN messager comprend trois phases successives: l initiation (ou début), l élongation de la chaîne polynucléotidique et enfin, la terminaison. II.3.1. L initiation de la transcription. On donne par convention, le chiffre +1 au premier nucléotide à partir duquel la transcription commence. Le chiffre -1 désigne le nucléotide qui le précède. Le signal pour initier une transcription correcte est appelé promoteur. Cette séquence d ADN est située juste avant le début de la région où commencera la transcription. 40

Les promoteurs les plus simples sont les promoteurs des gènes des procaryotes. Nous étudierons pour commencer essentiellement ceux-ci, les promoteurs des gènes des eucaryotes étant beaucoup plus complexes et seront étudiés plus loin. II.3.2. Les promoteurs des gènes des procaryotes. Les promoteurs sont pour la plupart situés en 5 (ou en amont) du site +1 d initiation de la transcription. Ces promoteurs ne sont donc pas transcrits. La comparaison des séquences des promoteurs de nombreux gènes de procaryotes (E. coli) a montré la présence de séquences nucléotidiques courtes présentant une grande similitude de structure. Deux séquences nucléotidiques sont remarquables. Une séquence située entre -30 et -35 paires de bases environ en amont de l origine de la transcription est appelée séquence -35. Cette séquence -35 présente un motif de six bases bien conservées: TTGACA. Enfin, à environ 10 nucléotides en amont de l origine de la transcription, on retrouve un motif TATAAT. Cette séquence dite séquence -10 est appelée également boîte de PRIBNOW. La distance séparant les sites -35 et -10 est comprise entre 16 et 18 pb dans 90% des promoteurs des procaryotes. Le maintien d'une telle distance est d'importance pour la fixation de l'arn polymérase. II.3.3. L ARN-polymérase des procaryotes. Chez les procaryotes, les ARN présents: ARN messagers, ARN de transfert et ARN ribosomaux sont synthétisés par la même ARN-polymérase. L ARNpolymérase d E. coli est composée de 5 sous-unités qui sont des chaînes polypeptidiques distinctes, 2 chaînes alpha, 1 chaîne béta, 1 chaîne béta et 1 chaîne σ (sigma). L ensemble de ces cinq sous-unités constitue l holoenzyme de l ARN-polymérase. La sous-unité sigma n est pas associée en permanence à ce complexe mais de manière transitoire. Sa présence est nécessaire pour permettre à l ARN-polymérase de reconnaître les sites promoteurs. Après l initiation, cette sous-unité sigma se dissocie. Le noyau de l enzyme («core») est constitué par les sous-unités (alpha)2bétabéta et il contient le site catalytique de l enzyme responsable de l élongation de la chaîne polynucléotidique. Le complexe formé par le noyau de l enzyme et le facteur σ vient se positionner sur le promoteur. Il recouvre une région située entre les positions -60 et +20. Dès lors, placée sur cette région, l ARN polymérase protège l ADN de l action de désoxynucléases. Cet effet de protection a été démontré par des expériences de "foot-printing". Une dénaturation locale de l ADN se fait de la position -10 à la position +1. Dès la formation de la première liaison phosphodiester du marn, le facteur σ est relâché. Des facteurs additionnels protéiques et le degré d enroulement de l ADN influent sur l activité transcriptionnelle. Il est évident que la transcription a un effet très important sur la structure locale de l'adn. Dès lors, l'action des enzymes suivantes : gyrase (qui introduit des super-tours négatifs) et topoisomérase I (qui enlève des super-tours négatifs) est essentielle en avant et en arrière de l'arn polymérase au cours de sa progression le long de l'adn. 41

II.3.4. L initiation de la transcription chez les eucaryotes. L initiation est beaucoup plus complexe que chez les eucaryotes (voir chapitre correspondant). II.3.5. L élongation de la chaîne polynucléotidique au cours de la transcription. La progression de la transcription nécessite de former des liaisons ester entre les nucléotides. Les nucléotides à ajouter sont présents sous forme de nucléosides triphosphates (formes riches en énergie), chaque nucléoside triphosphate forme une liaison ester par son extrémité 5 avec l extrémité 3 (OH) de l ARN en cours d élongation. Il y a donc à chaque addition une élimination de groupement pyrophosphate (symbolisé par P-O-P). Le premier trinucléotide comporte aussi bien chez les procaryotes que chez les eucaryotes une base purique (adénine ou guanine). Ce premier nucléotide va conserver son groupement triphosphate. La progression de la transcription se fait dans le sens 5 3. Au fur et à mesure de la progression de la transcription, les deux brins d ADN se séparent, il y a copie d un seul brin d ADN, l ARN initialement apparié au brin d ADN transcrit se détache. Les liaisons hydrogène se reforment après passage de l ARN polymérase et les deux brins d ADN reprennent leur forme hélicoïdale. Pour bien comprendre l élongation au cours de la transcription, considérons la séquence d ADN double brin suivante: +1 5 -A-G-C-T-T-A-A-C-G-C-G-T-A-3 3 -T-C-G-A-A-T-T-G-C-G-C-A-T-5 Dans la séquence d ADN ci-dessus, le chiffre +1 au-dessus de la base (A) désigne le site d initiation de la transcription (=première base transcrite). Au cours de la transcription, dans le cas d une ARN polymérase progressant dans le sens gauchedroite sur la séquence ci-dessus, l ARN polymérase synthétisera le marn dans le sens 5 3, ce qui signifie que la séquence du marn commencera par: 5 -A-A-C-G-C-G-U-A-3 Par définition, le brin sens est le brin d ADN qui a la même séquence que l ARN messager. Dans ce dernier, les bases T sont évidemment remplacées par les bases U. Le brin anti-sens est le brin opposé. Pour le brin d ADN: 5 -A-G-C-T-T-A-A-C-G-C-G-T-A-3, on parle de brin non transcrit, il ne sert pas de brin-matrice de lecture à l ARN polymérase. Par contre le brin d ADN orienté en sens inverse: 3 -T-C-G-A-A-T-T-G-C-G-C-A-T- 5 est appelé brin transcrit. Il sert de brin-matrice de lecture à l ARN polymérase. Par référence à la synthèse des protéines, on appelle également le brin non transcrit, le brin codant et le brin transcrit, le brin non codant. Considérons maintenant la séquence d ADN double brin suivante: 5 -G-C-A-A-T-C-G-3 3 -C-G-T-T-A-G-C-5 42

Si l ARN polymérase progresse dans le sens gauchedroite, le brin sens est constitué par le brin: 5 -G-C-A-A-T-C-G-3. Par contre, si l ARN polymérase progresse dans le sens droitegauche, le brin sens est constitué par le brin: 3 -C-G-T-T-A-G-C-5. II.3.6. La fin de la transcription. Chez les procaryotes. La fin de transcription chez les procaryotes s effectue par l intervention de signaux de fin de transcription. Ces signaux peuvent être des structures appelés terminateurs simples formant des boucles d appariement dites en épingles à cheveux (régions riches en bases G et C). Les sites de terminaison chez E. coli ont deux caractéristiques structurales: une épingle à cheveux commune à tous les sites de terminaison et une queue d environ 6 résidus U située en 3 à l extrémité de l unité de transcription. Dans ces conditions, la formation de telles boucles dans l ARN messager synthétisé déstabilise l association entre l ARN polymérase et la matrice d ADN servant de modèle. Il existe également des transcriptions de certains gènes chez les procayrotes qui nécessitent l intervention de facteurs protéiques dits de terminaison (facteur rho chez E. coli). Les séquences terminatrices dans ce cas sont appelées rho-dépendantes. Chez les eucaryotes: Des signaux de polyadénylation (séquence-type: 5 -A-A-T-A-A-A-3 sur le brin sens) annoncent la terminaison de la transcription d un gène. L ARN polymérase reconnaît ce signal sur l ADN mais poursuit la transcription. Dans ces conditions, le produit primaire de la transcription ou transcrit primaire sera remodelé (voir plus loin les modifications posttranscriptionnelles chez les eucaryotes). II.4. Les produits de la transcription. Les produits de la transcription peuvent être: - Soit des ARN messagers. Ces marn sont traduits en protéines au niveau des ribosomes. Leur durée de vie est brève. Il faut préciser que les ARN messagers des procaryotes sont souvent polycistroniques, c est-à-dire qu ils codent pour plusieurs chaînes polypeptidiques. Par contre, les ARN messagers des eucaryotes sont en principe monocistroniques. -Soit des ARN de transfert, des ARN ribosomiques ou des petits ARN nucléaires. Les tarn et les rarn sont synthétisés par transcription d un gène. A la différence des marn, ces ARN sont stables et ne sont pas traduits en protéines au niveau des ribosomes. Les gènes produisant des tarn ou des rarn sont des gènes existant sous forme d une succession en tandems de gènes identiques, ce qui les différencient des gènes uniques produisant des marn. III. LES MODIFICATIONS POST-TRANSCRIPTIONNELLES. 43

III.1. Chez les procaryotes. Il n existe pratiquement pas de modifications du marn chez les procaryotes. La transcription et traduction ne sont pas dissociées chez les procaryotes à la différence des eucaryotes. La traduction commence alors que le marn est en cours de synthèse ce qui n est pas le cas chez les eucaryotes. La dégradation des marn bactériens est réalisée par la combinaison d'endonucléases et d'exonucléases. Les clivages par les endonucléases s'effectuent dans le sens 5"-----> 3" et en arrière des ribosomes qui assurent la traduction protéique. Puis, les fragments ainsi libérés sont dégradés par des exonucléases qui travaillent ensuite dans le sens 3"---->5". La transcription d un gène tarn se fait sous forme d un précurseur. Ce précurseur sera transformé par clivages, addition à l extrémité 3" du triplet CCA et modifications des bases en tarn. III.2. Chez les eucaryotes. Les modifications concernant les rarn et les tarn sont comparables à celles rencontrées chez les procaryotes. Les modifications des marn seront abordées dans le chapitre suivant 44

45

46

LA TRANSCRIPTION CHEZ LES EUCARYOTES ET LES MODIFICATIONS POST-TRANSCRIPTIONNELLES CHEZ LES EUCARYOTES I. LA TRANSCRIPTION CHEZ LES EUCARYOTES. I.1. Les ARN polymérases des eucaryotes. Contrairement aux procayrotes qui possèdent qu une seule ARN polymérase, les eucaryotes ont trois ARN polymérases qui assurent la synthèse des différents ARN. La transcription implique donc: - 1. L ARN polymérase I. Elle transcrit les rarn: 5,8 S, 18 S et 28 S, sauf le rarn 5 S. - 2. L ARN polymérase II. Elle transcrit les précurseurs des marn ou transcrits primaires, la plupart des petits ARN nucléaires (snarns). - 3. L ARN polymérase III. Elle transcrit les tarn, les rarn 5 S et une faible fraction des ARN nucléaires. Ces trois ARN polymérases ont été initialement distinguées par leur sensibilité à un poison isolé des champignons (amanites phalloïdes): l aamanitine. Des trois ARN polymérases, l ARN polymérase II est la seule très sensible à ce poison. Ces ARN polymérases sont localisées dans le noyau de la cellule. La transcription par chacune des ces trois ARN-polymérases implique les trois étapes suivantes: 1/. La reconnaissance des séquences du promoteur et l assemblage d un complexe d initiation au point de départ de la transcription. 2/. L élongation, c est-à-dire la synthèse de l ARN. 3/. La terminaison. Toutes les ARN polymérases ont besoin de facteurs multiples pour se positionner au point de départ de la transcription. Il existe des facteurs généraux de la transcription qui contribuent à un niveau bas de transcription. Des facteurs additionnels par exemple activateurs peuvent augmenter la transcription au-delà du niveau basal. Toutes les ARN polymérases des eucaryotes sont des protéines constituées de nombreuses sous-unités (typiquement de 8 à 14). La plus grande sousunité de l'arn polymérase II a un domaine C-terminal ("carboxy-terminal domain": CTD) qui consiste en une répétition d'une séquence consensus de 7 acides aminés. Cette séquence répétitive est propre à l'arn polymérase II. Chez les mammifères, on démombre environ 50 répétitions de cette séquence consensus. La portion CTD peut être hautement phosphorylée sur des 47

résidus sérine ou thréonine. Dans ce chapitre nous nous intéresserons essentiellement à la synthèse des transcrits primaires des gènes des eucaryotes par l'arn polymérase II. I.2. Structure des gènes chez les eucaryotes: les exons et les introns. Chez les eucaryotes, les gènes présentent une structure discontinue, comportant des exons et des introns. Les exons sont par définition des séquences d ADN qui seront traduites en protéines (on dit aussi qu elles seront exprimées). Les introns sont par définition des séquences d ADN intercalées entre les exons. I.3. Les différentes phases de la transcription. I.3.1. Copie d un gène, formation d un transcrit primaire (ou pré-marn) Le transcrit primaire correspond à une copie intégrale des exons et des introns d un gène. Les promoteurs de l ARN polymérase II (comme ceux de l ARN polymérase des bactéries) sont localisés en 5 par rapport au site d initiation de la transcription. Des régions situées en amont du site d initiation sont d importance pour la transcription: - Tout d abord, la boîte TATA. Elle est située à environ -25 paires de bases de l origine de la transcription. C est une séquence de six nucléotides riche en A et T. La séquence dite consensus (statistiquement la plus rencontrée) est TATAAA. Une mutation dans cette boîte altère fortement la transcription. Cette boîte fixe un facteur général de transcription appelé TFIID (TF: facteur de transcription; II pour l ARN polymérase II). Ce facteur est absolument nécessaire pour l initiation de la transcription. Puis en remontant en amont du site d initiation, on trouve successivement: - La boîte GC (située le plus souvent dans la région entre -110 et -40). Elle peut se présenter sous forme d hexanucléotides: 5 -GGGCGG-3. Le motif riche en bases G et C peut être répété plusieurs fois. - La boîte CCAAT (souvent située dans la région entre -120 et -80). Cette boîte peut être située avant ou après une boîte GC ou même entre deux boîtes GC. L unité de transcription comporte une origine le point de départ de la transcription (ou site +1) et un point de fin de la transcription (séquence de terminaison de la transcription). En d autres termes, une unité de transcription va de la première base transcrite à la dernière base transcrite. L ARN qui lui correspond s appelle le transcrit primaire ou pré-marn. Il comprend non seulement les régions codantes ou exons, mais aussi les introns 48

et les portions 5 et 3 non traduites (régions 5 -UTR et 3 -UTR, «UTR= untranslated regions»). I.3.2. Addition de la coiffe (ou «cap») à l extrémité 5. Le premier nucléotide du transcrit primaire commence par un groupement triphosphate. La base correspondante est en principe une base purique (A ou G). L'extrémité 5" initiale du transcrit primaire peut alors être représentée par : 5" pppa/gpnpnpnpn... avec p=groupement phosphate et N=A,T,C ou G. En présence de GTP et d'une guanylyl transférase, on a la réaction suivante : Gppp+pppApNpNp...----->GpppApNpNp...+pp+p Le premier phosphate situé à l extrémité 5 du transcrit primaire va être éliminé au cours d une soudure (par une liaison anhydride d acide) avec du GMP (guanosine monosphosphate) provenant du GTP. Il y a donc constitution d une liaison inhabituelle: 5 5 triphosphate. On parle de coiffe ou «cap». Cette coiffe en 5 du transcrit primaire se met en place dès le début de la transcription. Au niveau de la base de la guanosine terminale s ajoute un groupement méthyle sur l atome d azote en 7. D autres modifications peuvent se produire comme des méthylations en 2 sur les riboses situés sur les deux premiers nucléotides de l extrémité 5 du transcrit primaire. La coiffe est indispensable pour protéger les marn de l attaque par des enzymes de dégradation. I.3.3. Addition de poly(a) à l extrémité 3. 49

Après synthèse, les ARN messagers sont clivés dans leur partie 3 une vingtaine de bases en aval d une séquence spécifique: AAUAAA (correspondant sur le brin d ADN non transcrit à la séquence AATAAA). Cette coupure est réalisée par une endonucléase. Après cette coupure, une enzyme la poly(a) polymérase en présence d ATP additionne un nombre variable d A (au moins 200-250 chez les mammifères supérieurs). La plupart des marn synthétisés par l ARN polymérase II possèdent cette extrémité poly(a), à l exception des ARN messagers d histones. La présence de poly(a) aurait également une fonction de protection des marn sur l extrémité 3 des marn. I.3.4. Maturation du transcrit primaire en marn. Un mécanisme précis appelé excision-épissage permet la maturation du transcrit primaire en marn. Un certain nombre de points sont d importance pour comprendre cette maturation. Ce mécanisme se déroule dans le noyau des eucaryotes. Chez les eucaryotes supérieurs, il a été démontré très tôt que l'arn nucléaire était hétérogène et instable. Cet ARN a été appelé ARN nucléaire hétérogène (hnrna). La forme physique du hnrna est celle d'une particule ribonucléoprotéique dans laquelle le hnrna est lié à des protéines. Le transcrit primaire ou pré-marn est inclus dans l'hnrna, qui contient bien entendu d'autres transcrits. I.3.4.1. Importance de la conservation de séquences situées à la jonction exon-intron. Site 5 Site de Site 3 d épissage branchement d épissage (donneur) (accepteur) Au niveau du transcrit primaire: La séquence des bases d un intron commence par GU et se termine par AG. La séquence consensus à l extrémité 5 des introns des vertébrés est GUAAGU ou GUGAGU. A l extrémité 3, la séquence consensus est un brin de dix pyrimidines (Py = U ou C) suivie par n importe quelle base N (A, U, G ou C) puis par C (ou U) et se termine par la séquence invariante AG. L exon d amont se termine par CAG ou AAG. L exon d aval commence par une base 50

G ou A. Le site de branchement (A) est localisé entre 20 et 50 nucléotides en amont du site 3 d épissage. I.3.4.2. Le mécanisme de l excision-épissage fait intervenir deux réactions de transestérification. Dans la première étape, il y a formation d un premier clivage en 5 de l intron. L OH situé en 2 du ribose appartenant à l A du branchement vient se souder à l extrémité 5 -phosphate de l intron. Il y a formation d une liaison 5-2 phosphodiester. Il y a constitution d une boucle ou lasso («lariat»). L extrémité 3 de l exon situé en amont du clivage (exon 1) présente un OH (3 ) libre: Une seconde étape correspond au deuxième clivage en 3 de l intron. Il y a simultanément: soudure des deux exons avec formation d une liaison phosphodiester entre l OH (3 ) de l exon 1 et le phosphate (5 ) de l exon aval (exon 2) et libération du lasso qui sera ensuite dégradé. I.3.4.3. Rôle des petits ARN nucléaires (snarn). Chez les eucaryotes, il existe des petits ARN nucléaires (snarn). Ce sont des petites molécules (100-300 nucléotides environ), riches en uracile. On les dénomme U1, U2, U4, U5 et U6. Chaque snarn est associé à ses propres facteurs protéiques pour constituer un complexe appelé snrnp 51

(RNP: ribonucléoprotéines et sn: «small nuclear»). Ces complexes (snrnp) se fixent au niveau de l intron à éliminer constituant un complexe appelé «spliceosome». La constitution de ce «spliceosome» est nécessaire pour un déroulement correct de l excision-épissage. La présence de ces «spliceosomes» au niveau des différents introns d un transcrit primaire permet le maintien de celui-ci dans le noyau dans l attente de sa maturation en marn. Parmi les snrnp, on peut distinguer: - U1. Permet la reconnaissance de la partie 5 de l intron à exciser par une complémentarité de séquence avec ce dernier. - U2. S associe au site A de branchement. - U5. Permet la reconnaissance de la partie 3 de l intron à exciser. - U4 et U6 interagissent entre eux. U6 possèderait l activité catalytique. I.3.4.4. Autres types d épissage possibles. D autres mécanismes d épissage sont possibles tels que: - L auto-épissage. Certains ARN sont doués d activité enzymatique permettant les réactions de trans-estérifications. On les appelle des ribozymes. Dans deux groupes d introns appelés groupe I et groupe II, l excision-épissage se fait différemment: - Introns du groupe I. Dans ce groupe, l excision-épissage requiert uniquement le transcrit primaire (qui va se cliver par lui-même) et un facteur externe, une guanosine monophosphate (G-OH). Le 3 OH de la guanosine monophosphate se comporte comme un réactif nucléophile qui attaque l extrémité 5 -phosphate du nucléotide situé en 5 de l intron: 52

L extrémité 3 -OH de l exon situé en 5 de l intron va réagir avec le nucléotide 5 de l exon situé en 3 de l intron, ceci aboutit à la soudure des deux exons. Il s agit de réactions de transestérification. Ce type d intron est rencontré dans des pré-rarn. -Introns du groupe II. Ces introns sont rencontrés dans certains marn mitochondriaux. Ils ressemblent aux introns des pré-marn. En effet, un site de branchement (A) intervient et il est présent dans l intron. C est l OH en 2 situé sur l A du site de branchement qui attaque la jonction entre l exon d amont (exon 1) et l intron. L intron sera finalement éliminé sous forme de lasso. - Le trans-épissage. L épissage ne se produit pas au sein d un même messager, mais entre deux messagers différents. Ce type d épissage a été décrit chez un parasite, le trypanosome. - L épissage utilisant une maturase. Processus très complexe décrit chez la levure (gène du cytochrome b) il y a traduction en protéine (ou maturase) à partir d un premier intron, puis cette protéine sert à épisser les transcrits des introns suivants. I.3.4.5. Rôle des introns Rappelons qu ils ont été découverts chez les eucaryotes supérieurs. Certains procaryotes possèdent des introns dans leurs gènes (archébactéries). Le rôle des introns est encore discuté. Cependant, quelques idées semblent émerger. Les introns pourraient faciliter l élaboration de gènes complexes en délimitant des séquences codantes et permettant ainsi la mobilité des exons dans le génome. Enfin, l absence d introns dans un génome bactérien pourrait signifier que la bactérie est parvenue au stade ultime de son évolution et qu elle aurait perdu toute possibilité d évoluer vers la complexité. II. LE CONTROLE DE LA TRANSCRIPTION CHEZ LES EUCARYOTES. II.1. LE COMPLEXE D INITIATION. 53

A la différence de l ARN polymérase des procaryotes, l ARN polymérase II des eucaryotes ne se fixe pas directement sur le promoteur. Elle se fixe par l intermédiaire de facteurs généraux de la transcription comprenant plusieurs protéines dénommées TF pour «transcription factor» et II pour l ARN polymérase II: TFIIA, TIIB... Ces protéines associées à l ARN polymérase II constituent le complexe d initiation de la transcription et catalysent la formation de la première liaison phosphodiester entre les deux premiers nucléotides du marn. Lorsque le site promoteur est libéré par la progression de l ARN polymérase II sur l ADN constituant la phase d élongation, un autre complexe d initiation peut se mettre en place. II.1.1. LES FACTEURS GENERAUX DE LA TRANSCRIPTION ET LA FORMATION DU COMPLEXE BASAL D INITIATION. Une succession d étapes met en jeu des éléments du promoteur, l ARN polymérase II et des facteurs protéiques généraux de la transcription. 1/. La première étape est constituée par la fixation du facteur de transcription TFIID sur la boîte TATA. Cette fixation est realisée par l intermédiaire d un des composants du facteur TFIIID qui est appelé TBP ( pour «TATA box binding protein»). Un facteur additionnel TFIIA stabilise l association facteur TFIID et boîte TATA. Il n est pas représenté sur les schémas suivants. Le facteur TFIID comporte des facteurs appelés TAFII («transcription activating factors») Ces facteurs TAFII permettent l interaction entre le facteur TFIIID et des éléments activateurs situés en amont de la boîte TATA. 2/. Puis le facteur TFIIB se fixe sur le facteur TFIID fixé sur la boîte TATA. 54

3/. Le facteur de transcription TFIIB recrute l ARN polymérase II et le facteur TFIIF. 4/. Les facteurs TFIIE et TFII H se fixent, suivis par des facteurs supplémentaires complétant le complexe de transcription: 55

Le facteur TFIIH présente une activité protéine kinase. En présence d ATP, une phosphorylation de l ARN polymérase est réalisée sur la plus grosse sous-unité de l enzyme riche en sérine et en thréonine (partie C-terminale). 5/. La phosphorylation sur sites spécifiques déclenche le début de la transcription: De plus, arrivée au bout du promoteur, l ARN polymérase II doit être libérée du complexe des facteurs de transcription généraux pour démarrer la transcription. La phosphorylation d une des sous-unités de l ARN polymérase est indispensable pour déplacer l enzyme du complexe d initiation de la transcription. II.2. DEFINITION DES FACTEURS CIS- ET TRANS-REGULATEURS DE LA TRANSCRIPTION. Il existe toute une série de séquences nucléotidiques comportant chacune un nombre limité de nucléotides (6-8 nucléotides le plus souvent) et dispersées généralement en 5 du gène, ces séquences sont appelées éléments cisrégulateurs. Ces séquences sont remarquablement conservées dans les gènes de nombreuses espèces. Elles vont fixer des facteurs dits trans-régulateurs. II.2.1. Facteurs cis-régulateurs de la transcription. Quand un facteur trans-régulateur se fixe sur une séquence cis-régulatrice de l ADN, la quantité de marn synthétisé est brusquement modifiée, soit augmentée, soit diminuée. Les séquences activatrices (séquences «enhancer») peuvent être situées à des distances très importantes du promoteur du gène (jusqu à quelques dizaines de kilobases) et ceci en amont ou en aval du gène. Des séquences extinctrices (séquences «silencer») ont un effet opposé aux séquences activatrices. Elles peuvent être également situées très à distance du promoteur du gène. C est bien entendu la structure tridimensionnelle de l ADN qui permet de rapprocher ces éléments régulateurs du gène à transcrire. Ainsi, pour nous limiter à quelques exemples, le facteur général de transcription TFIIID peut être considéré comme un facteur trans-régulateur. Il se fixe sur un élément cis-régulateur qui est la boîte TATA. 56