CHM3102-A2005 Révision: séquençage des protéines et d ADN 14/12/2005

CHM3102-A2005 Révision: séquençage des protéines et d ADN 14/12/2005 1

Ch 7: Stratégie de séquençage d une protéine Étapes impliquées (il faut des aliquots pour chaque étape) : 1. Détermination du nombre de chaînes polypeptidiques (sous-unités) dans la protéine a) Par analyses des résidus N-terminal (ex., chlorure de dansyl) et C-terminal (ex., carboxypeptidase) 2. Coupure des liens disulfures (inter- ou intramoléculaires) a) Dénaturation de la protéine (ex., avec hydrochlorure de guanidine ou des surfactants comme SDS) b) Réduction avec du DTT (ex., dithiothréitol) suivi par alkylation avec iodoacétate 3. Détermination de la composition des acides aminés a) Hydrolyse acide (HCl, 6M, 24h, 100ºC) ou basique b) Dérivation avec un fluorophore (marquage): ex, OPA c) Séparation des OPA-aa par chromatographie (HPLC) 4. Coupeur des chaînes polypeptiques trop longues en des plus petits fragments peptidiques par des réactions spécifiques a) Digestion enzymatique (ex., trypsine et chymotrypsine) b) Clivage chimique avec du CNBr 5. Séquençage des fragments peptidiques par la dégradation d Edman a) Réaction avec du PITC suivi par séparation des PTH-aa par HPLC 6. Élucidation de la séquence par recouvrement des séquences des différents fragments 7. Détermination des positions les liens disulfures entre les sous-unités 2

1. Détermination du nombre de chaînes polypeptidiques (sousunités) dans la protéine: analyses des résidus terminaux H R O NH 3 + N H R H O H N H R O R H N COO - H résidu N-terminal résidu C-terminal Puisque chaque chaîne polypeptidique possède un résidu N-terminal et C- terminal, le nombre de sous-unités distinctes dans une protéine peut être déterminé en identifiant le nombre de chacun des résidus terminaux. 3

2. Coupure des liens disulfures COO - COO - COO - COO - + H3 N CH + + H3 N CH + H3 N CH + H3 N CH CH 2 SH HS CH 2 CH 2 S S CH 2 Cystéine Cystéine Cystine Insuline Les liens disulfures doivent être coupés avant le séquençage pour séparer et déplier les sous-unités. 4

2. b) Réduction avec du dithiothréitol (DTT) ou du 2-mercaptoéthanol: Cystine H N N H H C CH 2 S S CH 2 C H C O O C + 2 HSCH 2 CH 2 OH ou CH 2 SH CH 2 OH CHOH CH 2 SH DTT Cystéines H N N H H C CH 2 SH HS CH 2 C H C O O C SCH 2 CH 2 OH + ou SCH 2 CH 2 OH HO HO S S Alkylation H N H C CH 2 SH + H N ICH 2 COO - alkylation H C CH 2 SCH 2 COO - + HI C O Iodoacétate C O Cystéine Cystéine protégée 5

3. Détermination de la composition d acides aminés d une protéine Le nombre de chaque acide aminé dans une chaîne polypeptidique est un paramètre caractéristique de chaque protéine. Une protéine inconnue peut souvent être identifiée en mesurant le pourcentage relatif des différents acides aminés et en comparant avec des bases de données. Premièrement, les liens peptidiques dans une protéine sont hydrolysés par traitement acide, basique ou enzymatique. Les acides aminés libérés sont ensuite séparés et quantifiés. a) Ex., Traitement acide: polypeptides + 6 M HCl, reflux à 100-120 C pour 24 hrs sous vide. Des temps de réaction plus long sont nécessaires pour une hydrolyse complète des résidus Leu, Val et Ile. Trp est considérablement dégradée. La vitesse de dégradation de certains résidus, tels que Thr, Tyr et Ser peut être mesurée et un facteur de correction peut être inclut pour tenir compte de la perte de ces acides aminés en fonction du temps d hydrolyse. l hydrolyse acide convertit Asn à Asp et Gln à Glu, respectivement (du NH 4+ est éliminé). Les méthodes enzymatiques sont surtout utilisées pour la détermination de l Asn, de la Gln et du Trp 6

b) Dérivation Dérivation pré-colonne des amines (acides aminés) Fluorescamine OPA : o-phtaldialdéhyde NDA : naphtalène-2,3- dicarboxaldéhyde CBQCA : 3-(4- carboxybenzoyl)-quinoline- 2-carboxaldéhyde 7

c) Séparation après dérivation pré-colonne des acides aminés avec l OPA 8

4. Coupure spécifique des liens peptidiques a) Fragmentation enzymatique Endopeptidases: Coupure spécifique de liens peptidiques à l intérieure d une chaîne Exopeptidases: Coupure d un acide aminé N- ou C-terminal d une chaîne peptidique 9

a) Fragmentation enzymatique par la trypsine trypsine b) Fragmentation chimique: Le CNBr coupe les liens peptidiques du côté C-terminal d un résidu Met. Br - H 2 O 10

5. Dégradation d Edman (analyse séquentielle): = N- -C phényl isothiocyanate (PITC) (séquençage de peptides constitués de 40 à 60 résidus) 11

Séparation des acides aminés de phénylthiohydantoin (étalons) par chromatographie liquide à haute performance 12

6. Détermination de l ordre des fragments peptidiques La séquence des fragments peptidiques individuels est déterminé en établissant l ordre dans lequel ils étaient connectés. La séquence des acides aminés dans un 1 er set de fragments est comparé avec celui d un 2 è set de fragments pour lequel les points de coupure sont différents. Un recouvrement de quelques résidus est généralement suffisant pour identifier un point de connexion. 13

7. Détermination des positions des liens disulfures Le mélange des fragments peptidique est analysé par électrophorèse sur gel en 2D en utilisant les mêmes conditions de séparation dans les deux directions. Après séparation dans la 1 ère direction, la matrice est exposée à l acide performique pour couper tout les liens disulfures existants. Ensuite la séparation est effectuée dans la 2 è direction. Les fragments qui ne contiennent pas de liens disulfures sont positionnés sur la diagonale puisque leur vitesse de migration dans le deux directions est identique. Les fragments contenant des liens disulfures montrera 2 points pour les fragments produits par oxydation qui sont positionnés on dehors de la diagonale. Les fragments liés par des ponts disulfures peuvent être isolés du gel et identifiés par séquençage. 14

Ch 8: Amplification et séquençage des acides nucléiques ADN chromosomique, plasmides (ADN bactérien), ARN messager Rupture cellulaire Isolation et purification des acides nucléiques Concentration et amplification et séquençage de l ADN ou de l ARN isolé 15

L amplification des acides nucléiques par réaction de polymérisation en chaîne La quantité d ADN dans un échantillon est souvent insuffisante pour le séquençage et l analyse. L amplification en chaîne par polymérase (ACP) est un procédé d'amplification enzymatique in vitro d'une séquence définie d'adn (Kary Mullis, Prix Nobel 1993). Une seule molécule d ADN suffit pour l ACP. Avec l ACP, plusieurs tâches qui avant étaient impossible sont maintenant devenues de routine (ex. identification d un coupable avec un seul cheveu ou spermatozoïde et l identification rapide de maladies infectieuses). Principes de l ACP ACP en temps réel (mesure semi-quantitative des produits de l ACP durant la réaction) Transcription inverse de l ARN en ADN complémentaire 16

La réaction d amplification ACP est constituée de 3 étapes principales: La réaction d amplification est effectuée dans un seule éprouvette qui est placée dans un thermocycleur Étape 1- dénaturation de l'adn (séparation des deux brins de la double hélice) à température élevée (95 C). Étape 2- positionnement des 2 amorces (présentent en excès) en face de leurs séquences complémentaires, sur les brins d'adn, et fixation sur ces cibles (hybridation) à 50-60 C. 5 Étape 3- phase d'extension à 72 C dans laquelle l'adn polymérase synthétise, à partir des amorces, le brin complémentaire de celui qui sert de matrice et un excès des 4 acides désoxyribonucléiques (datp, dctp, dgtp et dttp). 17

La réaction d amplification atteint éventuellement un plateau, le nombre de copies n augmente plus. Ceci est dû à l épuisement de réactifs (amorces et nucléotides), à l inhibition enzymatique par des phosphates libérés durant la réaction, à la détérioration thermique de l ADN polymérase et à l hybridation des brins plus long d ADN à des températures élevées au dépit de l hybridation de l ADN à simple brin avec des amorces. (D après A. Manz, N. Pamme & D. Iossifidis, Bioanalytical Chemistry, 2004) 19

Transcription inverse de l ARN 5' 3' ARNm 72 C 5' 3' amorce 42 C 5' 3' 3' 5' transcriptase inverse 5' 3' 5' 5' 3' 3' 5' ARNm ADN 94 C ACP de l'adn 20

Séquençage des acides nucléiques Puisque la séquence des nucléotides dans une molécule d ADN ou d ARNm détermine sa fonction, le séquençage des acides nucléiques est une tâche bioanalytique importante. Le développement de méthodes rapides et automatisées pour le séquençage des acides nucléiques a attiré beaucoup d intérêt dans les dix dernières années, surtout dans le contexte du projet du génome humain. Méthodes de séquençage: microréseaux d ADN (pour des oligonucléotides courts) - méthode de Maxam-Gilbert méthode de Sanger 21

Enzymes de restriction L ADN doit avant être coupé («digéré») en plus petits fragments de jusqu à 800 paires de bases. Après digestion et séparation par électrophorèse sur gel, les fragments d ADN à simple brin peuvent être séquencés. 22

Méthode de Sanger (méthode didéoxy ou méthode de terminaison de chaîne) La méthode de Sanger est basée sur la synthèse d un brin complémentaire de l ADN en utilisant les oligonucléotides à séquencer comme matrices (tel que pour l ACP). Contrairement à l ACP, la synthèse du brin complémentaire est effectuée en présence d un nucléotide de terminaison de chaîne. L échantillon d ADN à simple brin est divisé en 4 portions. Chaque portion est incubée avec de l ADN polymérase, les quatre désoxyribonucléotides triphosphates (datp, dgtp, dctp, dttp) et une amorce appropriée. ou du fluorophore Le brin complémentaire synthétisé est marqué en incorporant du 32 P, soit dans l amorce ou dans un des désoxyribonucléotides triphosphates, ou marqué avec les fluorophores pour détection par la fluorescence. Dans chacun des 4 mélanges réactionnels, est ajouté un 2,3 -didéoxynucléotide triphosphate (ddntp) en petite quantité. O O O - O P O P O P O O O - O - O- H H 3' H Base H H H ddntp 23

Dès que un ddntp est incorporé dans la chaîne croissante, la réaction se termine puisqu il n y aura pas de 3 -OH libre pour l incorporation d un autre nucléotide. L incorporation d un ddntp résulte dans une série de chaînes tronquées, chacune terminée par un analogue didéoxy dans la position de la base correspondante. Les produits de chacune des 4 réactions sont séparés selon leur taille par électrophorèse sur gel dans des voies parallèles. La séquence du brin complémentaire d ADN est déterminée par autoradiographie. Cette séquence est ensuite utilisée pour identifier la séquence de l ADN original. 24

Exemple de séquençage d un fragment d ADN par la méthode de Sanger Électrophorèse sur gel 25

Exemple de séquençage d ADN par la méthode de Sanger marqueurs fluorescents (D après http://employees.csbsju.edu/hjakubowski/classes/ch331/bcintro/list_of_figures.htm) 26

Marquage avec 32 P versus marquage avec 4 fluorophores Question: Quelle est la séquence des acides nucléiques dans cet échantillon analysé par le marquage avec 32 P et par le marquage fluorescent où les amorces «primers» ont été marqués comme: pour réaction avec ddatp, - pour réaction avec ddttp, pour réaction avec ddcpt et pour réaction 27 avec ddgtp?

Question: Quelle est la séquence de l échantillon d ADN si les 4 amorces «primers» ont été marqués pour les réaction avec les ddntp comme: vert: A, rouge: T, bleu: C et noir: G? (D après http://www.sars.no/facilities/sequencing.php) 29