Marc de Tapia INSERM U-692 Laboratoire Signalisations Moléculaires et Neurodégénérescence Biochimie 1 Protéines I) Les Acides aminés II) Les peptides et protéines a) Définitions b) Les Structures c) Structures et fonctions d) Méthodes d analyses 2009/10
Importance des protéines Présence universelle dans le monde vivant Un individu est majoritairement constitué de protéines (Premier constituant après l eau) Les protéines assurent la quasi totalité des fonctions vitales d une cellule et d un organisme vivant (structurales et dynamiques) Capacité codante du génome humain : De 60.000 à 100.000 peptides & protéines
Protéines = Macromolécules ou polymères linéaires constitués de l assemblage de monomères Monomères = Acides aminés Polymères = Peptides & Protéines
Un peu d Histoire 1806 Vauquelin & Robinet Découverte du1 er acide aminé : l asparagine (le dernier : la thréonine en 1935) 1832 Jöns Berzelius 1 ère apparition du nom «Protos-Protéios» (prééminence, au premier rang) La substance organique qui est présente dans toutes les parties du corps animal et du royaume végétal pourrait être appelée protéine. Gerardus Johannes MulderJournal für praktische Chemie 16, 129 (1839) 1902 Fischer & Hofmeister La liaison peptidique 1926 James Summer 1 ère cristallisation d une protéine : l uréase 1958 Frédérick Sanger 1 ère séquence de protéine 1950-60 La génomique Relation entre séquence nucléotidique et peptidique 1990-2000 La protéomique Analyse systématique des protéines
Maladie génétique = Défaut dans un gène Défaut de fonction de la protéine codée par le gène muté Protéines = Cibles thérapeutiques des médicaments
Les protéines interviennent dans tous les processus biologiques *** Exemples *** Enzymatique : Transport : Stockage : * Métabolisme, division cellulaire * Hémoglobine * Lipoprotéines * Ferritine * Ovalbumine Mouvements : * Actine, Myosine / contraction Structure : Défense : Régulation : * Protéines du cytosquelette * Collagène * Kératine * Anticorps * Thrombine (coagulation) * Venins, toxines * Physiologique: Hormones * Génique: Facteurs de transcription
Biochimie 1 Protéines I) Les Acides aminés II) Les peptides et protéines III) Les Structures IV) Structures et fonctions V) Méthodes d analyses
Un acide aminé Formule générale Molécule bifonctionnelle portant sur un carbone alpha 1. un groupe amine primaire NH 2 2. Un hydrogène H 3. un groupe carboxyle COOH 4. un résidu variable R R NH 2 - C - COOH Carbone α H
Résidu variable R caractérise l acide aminé 1. dimension 2. forme 3. charge 4. capacité de former des interactions Hydrogènes Hydrophobes, Hydrophyles Ioniques Covalentes 5. réactivité chimique R NH 2 - C - COOH Carbone α H
20 Acides Aminés composent les protéines Molécules indispensables devant être apportées par la ration alimentaire Les 20 acides aminés sont discriminés par le résidu R constituant la chaîne latérale R chaîne latérale NH 2 - C - COOH Carbone α H chaîne principale La nature chimique du résidu R détermine les propriétés spécifiques de chaque acide aminé
R et les propriétés des acides aminés - Chaîne latérale aliphatique (Hydrogène et carbone) - Chaîne latérale aromatique (Cycle aromatique) - Chaîne latérale carboxylique ou amide (COOH ou CONH 2 ) - Chaîne latérale basique (NH 3 + ou NH 2+ ) - Chaîne latérale alcool (OH) - Chaîne latérale avec un soufre (sulfydrile: SH ou thioether: S-CH 3 ) - Chaîne latérale iminoacide (N secondaire ou imino)
R est une chaîne latérale carbonée aliphatique linéaire ou ramifiée (Hydrogènes + carbones) => Acides aminés aliphatiques (1) ] R Groupement Méthyle
=> Acides aminés aliphatiques (2) ] R Groupement Isopropyle Groupement Isobutyle Groupement Butyle secondaire
R est une chaîne latérale contenant un groupe aromatique, structure cyclique à 6 électrons délocalisés => Acides aminés aromatiques ] R Groupement Phényle Groupement Phénol Groupement Indole
R est une chaîne latérale contenant un groupement carboxyle libre ou sous forme d amide (NH 2 ) => Acides aminés dicarboxyliques et leurs amides ]R β-carboxyle γ-carboxyle Groupement amide
R est une chaîne latérale contenant une fonction amine (NH 2 ) qui porte sous sa forme acide conjuguée une charge positive => Acides aminés dibasiques ]R Groupement ε-amino Groupement δ-guanidyle Groupement imidazole
R est une chaîne latérale contenant une fonction alcool. Les groupes OH ne sont pas ionisables. => Acides aminés alcools ]R Groupement Alcool I aire Groupement Alcool II aire
R est une chaîne latérale contenant un atome de soufre. => Acides aminés soufrés ]R Groupement thiol (SH) ou sulfidryle est un donneur de proton Groupement thioéther CH3-S-CH2- ]R
R est une chaîne latérale contenant une amine secondaire (NH) => Acide aminé iminoacide Cycle pyrrolidone Groupement α-aminocarboxylique Le groupe α-amino est engagé dans une structure cyclique L amine secondaire (azote présentant un doublet libre) est accepteur de proton.
Récapitulatif: Les 20 acides aminés NOM Glycine Alanine Valine Leucine Isoleucine Radical H CH3 CH CH 3 CH 3 CH 2 CH CH 3 CH 3 H C CH 3 CH 2 NOM Histidine Aspartate Glutamate Asparagine Radical CH 2 Cycle Imidazole CH 2 COOH (CH 2 ) 2 COOH CH 2 CH 3 CONH 2 Phénylalanine Tyrosine CH 2 Cycle Phényl CH 2 Cycle Phénol OH Glutamine Cystéine Méthionine (CH 2 ) 2 CONH 2 CH 2 SH (CH 2 ) 2 S Tryptophane Lysine CH 2 Cycle Indole (CH 2 ) 4 NH3+ Proline Sérine CH3 Fonction amine secondaire CH 2 OH Arginine (CH 2 ) 3 NH CNH 2 + NH 2 Thréonine H-C-OH CH 3
Nomenclature NOM Code à 3 lettres Code à 1 lettre Alanine Ala A Arginine Arg R Asparagine Asn N Acide aspartique Asp D Cystéine Cys C Glutamine Gln Q Acide glutamique Glu E Glycine Gly G Histidine His H Isoleucine Ile I Leucine Leu L Lysine Lys K Méthionine Met M Phenylalanine Phe F Proline Pro P Sérine Ser S Thréonine Thr T Tryptophane Trp W Tyrosine Tyr Y Valine Val V Acide Aspartique ou asparagine Acide glutamique ou glutamine Asx Glx B Z
Propriétés physicochimiques des Acides Aminés : Déterminées par : Nature chimique commune à tous les Aas Nature chimique spécifique de chaque résidu R de la chaîne latérale. 1/ Chiralité 2/ Absorption et Fluorescence 3/ Solubilité 4/ Propriétés ioniques 5/ Réactivité chimique Les propriétés spécifiques de chaque acide aminé sont utilisées à des fin d analyses, de mesures, etc
Définition : Un carbone portant quatre constituants différents est un centre chiral définissant des stéréoisomères ou isomères optiques à pouvoir rotatoire opposé lévogyre (L) ou dextrogyre (D). Un acide aminé est constitué - 1 fonction AMINE - 1 groupe CARBOXYLE - 1 atome d H - 1 résidu R (chaîne latérale) le tout relié à un carbone (Cα)
La disposition des différents groupes autour du Ca confère une activité optique aux AA Isomère L Isomère D Seuls les isomères L sont des constituants des protéines.
Certains acides aminés ont un deuxième centre chiral car ils présentent un deuxième carbone portant 4 constituants différents.
Absorption des acides aminés Principe : L absorption d une solution dépend de la capacité du soluté à capter toute ou partie de faisceaux de la lumière blanche (différentes longueur d ondes). Lumière blanche La solution absorbe le rouge Rouge Jaune Bleu Jaune + = Vert Bleu La solution est verte
Un acide aminé peut absorber par l intermédiaire de R 1/ les acides aminés n absorbent pas la lumière visible Solution incolore 2/ les bandes d absorption dans l infrarouge sont caractéristiques de leurs chaînes latérales 3/ les chaînes latérales aromatiques ont des spectres d absorption caractéristiques dans l ultraviolet Absorption Densité Optique (DO) Trp Spectres d absorption des acides aminés aromatiques dans l ultra-violet (UV) Tyr Phe 240 260 280 300 Longueur d onde (nm)
Application de la Spectroscopie d absorption (UV/Vis) La loi de Beer-Lambert Io I l (trajet optique) Mesure de densité optique (DO) & Concentration (c) d une solution protéique DO = log (Io/I) = ε. l. C ε = Coefficient d extinction molaire (Valeur de DO d une solution molaire)
Fluorescence des acides aminés : Principe : Certaines molécules excitées par une lumière incidente, à une longueur d onde où elles absorbent, émettent une lumière de longueur d onde plus grande appelée fluorescence. Rq : Cette émission, dépendante de l environnement, permet des études de conformation et de structure. Absorption Densité Optique (DO) excitation de la Tyr à 274nm excitation du Trp à 280nm 280 320 360 Emission de fluorescence Longueur d onde (nm)
La GFP (Green fluorescent protein) 1962 Osamu Shimomura isole une Protéine fluorescente des méduses 1992 Martin Chalfie clone le gène de la GFP dans E. coli 1994 Roger Tsien produit de nouvelles variantes par mutagénèse dirigée des 3 AAs responsables de la florescence 2008 Prix Nobel de chimie
1994 : visualisation des récepteurs neuronaux du toucher de C. elegans 2007 l expérience du «brainbow» permet de suivre les projections des neurones dans un cerveau de souris Protéine GFP = Outil indispensable de la biologie moléculaire Cartographie cellulaire Transfert de gènes Visualisation de cellules en mouvement Etc
Principe : La solubilité d une molécule dépend de sa capacité à former des interactions avec le solvant. La solubilité des acides aminés dans l eau dépend essentiellement de deux facteurs : Les deux groupements fonctionnels communs à tous les Acides aminés (COOH et NH 2 ) peuvent s ioniser et donc favoriser la dissolution la présence d une chaîne latérale peut donner à l Aa un caractère plus ou moins polaire La solubilité d un AA dans l eau peut aller de 1 à 100 g/l La solubilité dans des solvants organiques est faible (quelques mg/l)
Propriétés ioniques des Acides Aminés : R NH 2 - C - COOH H R + NH3 - C - COO - H Molécules amphotères Acide aminé = association de deux charges à propriétés acides-bases Ion dipolaire ou Zwitterion
ph isoélectriques = Valeur du ph de la solution dans laquelle la charge totale nette moyenne de la molécule est nulle Ion dipolaire (Zwitterion) - C COOH - C COO - - C COO - NH 3 + NH 3 + NH 2 aa + aa o aa - ph acide ph isoélectrique ph basique * ph < pi => la charge nette moyenne est positive * ph > pi => la charge nette moyenne est négative
Concentration des différentes formes & ph Zwitterion forme protonée forme déprotonée
AA à chaîne latérale ne comportant pas de groupe ionisable - C aa + aa o aa - COOH COO - COO - - C - C NH 3 + NH 3 + NH 2 K 1 pk αcooh K 2 pk αnh3+ * pk des groupes αcooh et αnh2 sont très différents * La forme à charge nulle est l ion mixte (zwitterion) phi = (pk αcooh +pk αnh2 ) 2
AA à chaîne latérale comportant une fonction acide (Asp et Glu) pk αcooh < pk RCOOH < pk αnh2 aa + aa o aa +, 2- aa 2- COOH COOH COOH COO - COO - COO - COO - COO - R C R C R C R C NH 3 + NH 3 + NH 3 + NH 2 K 1 pk αcooh K 2 pk RCOOH K 3 pk αnh3+ * La forme à charge nulle est au centre des deux équilibres entre les deux fonctions carboxyliques Acides aminés phi = (pk RCOOH +pk αcooh ) 2 pk α-cooh pk α -amine pk R-acide pi Glu 2,2 9,7 4,3 3,25 Asp 2,1 9,8 3,9 3,0
AA à chaîne latérale comportant une fonction basique (His, Lys et Arg) pk αcooh < pk αnh2 < pk RNH 2 aa 2+ Aa 2+, - aa o aa - NH 3+ COOH NH 3+ COO - NH 3 + COO - NH 2 COO - R C R C R C R C NH 3 + NH 3 + NH 2 NH 2 K 1 pk αcooh K 2 pk αnh3+ K 3 pk RNH3+ * La forme à charge nulle est au centre des deux équilibres entre les deux fonctions amines phi = (pk RNH2 +pk αnh2 ) 2 Acides aminés pk α-cooh pk α -amine pk R-amine pi His 1,8 9,2 6 7,6 Lys 2,2 8,95 10,5 9,725 Arg 2,2 9,05 12,5 10,775
Cystéine (CH 2 -SH) et Tyrosine (Phénol) groupes acides La cystéine : * La différence des pk est élevée, la forme à charge nulle est entre l équilibre αcooh et R acide Acides aminés phi = (pk αcooh +pk R acide ) 2 pk α-cooh pk α -amine pk R-acide pi Cys 1,7 10,8 8,3 5,0 La tyrosine : * La forme à charge nulle est entre l équilibre αcooh et αnh 2 Acides aminés phi = (pk αcooh +pk α amine ) 2 pk α-cooh pk α -amine pk R-acide pi Tyr 2,2 9,1 10,1 5,65
Propriétés chimiques des acide aminés Activités & Fonctions des protéines R NH 2 - C - COOH H Réactivité chimique des groupements fonctionnels
Groupement carboxyle peu réactif à ph physiologique Décarboxylation R NH 2 - C - COOH H R NH 2 - C - H CO 2 H Ser => Ethanolamine (précuseur de l acétylcholine His => Histamine (vasodilatateur; allergie et inflammation) Glu => 4-aminobutanoique ou GABA (neurotransmetteur)
Groupement amine très réactif Désamination avec oxydation R NH 2 - C - COOH H R NH 3 O C - COOH Obtention d un acide α-cétonique servant d intermédiaire dans le métabolisme des acides aminés Réaction avec la ninhydrine: Révélation et dosage des protéines
Groupement amine très réactif Addition de carbonyle R NH 2 - C - COOH R - C O H Aldéhyde H R R - C H N - C - COOH H Obtention d une base de Schiff Intermédiaire de réaction enzymatique avec des AA comme substrat
Réactivité du groupement aminé & Séquençage des protéines Méthode de Sanger: * Arylation avec le Fluoro 2,4-dinitrobenzène (FDNB) NH 2 + FDNB 2,4-dinitrophényl-AA Couleur jaune * Acylation avec le Chlorure de Dansyle (DNS) NH 2 + DNS Cl Dansyl-AA Fluorescent Dégradation récurrente d Edmann: Carbamylation avec le phénylisothiocyanate (PTC) NH 2 + PTC Réactif d Edmann Phénylthiohydantoine-AA Absorbe dans l UV
Groupement R R NH 2 - C - COOH H La réactivité de R & les modifications post-traductionnelles Carboxyles et Amines des chaînes latérales : Réactivité équivalente qu en α Lys et les liaisons covalentes du collagène Thiol très réactif : Cys et les ponts disulfures Alcools et amides peu réactifs : Ser catalyse de réaction enzymatique Ser, Thr et Tyr : sites potentiels de phosphorylation (ATP) Ser, Thr et Asn : sites potentiels de O et N-glycosylations Tyr et iodation des hormones thyroïdiennes
Autres classifications possibles En fonction de la polarité de la chaîne latérale: Tient compte des interactions possibles de l AA avec son environnement (liaisons faibles de van der Walls, liaisons électrostatiques, hydrogènes ou interactions hydrophobes). R apolaires (hydrophobes): Gly, Ala, Val, Pro, Met, Leu, Ile, Phe, Tyr, Trp R polaires mais non chargés (hydrophile): Ser, Cys, Asn, Thr, Gln R polaires et chargés (+ ou - hydrophile selon le ph): Asp, Glu, Lys, Arg En fonction du phi de l acide aminé : Tient compte du phi des groupement de la chaîne latérale R acide : Asp et Glu R basique : Lys, Arg, His R neutre : Tous les autres
Biochimie 1 Protéines I) Les Acides aminés II) Les peptides et protéines a) Définitions b) Les Structures c) Structures et fonctions d) Méthodes d analyses 2009/10
Définitions : Peptides & Protéines = Polymères d acides aminés Peptide = enchaînement d un nombre d AA inférieur à 50 * si Nbre d AA < 10 => Oligopeptide * si Nbre d AA > 10 => Polypeptide Protéine = enchaînement d un nombre d AA au delà de 50 Holoprotéines Uniquement constituées d acides aminés Hétéroprotéines Constituées d acides aminés & Groupe prosthétique (minéral, métallique ou organique) Glucides (partie glucidique - liaison covalente) Glycoprotéines Lipides (partie lipidique - liaison covalente) Lipoprotéines
La brique = l acide aminé Le ciment = la liaison peptidique (1902 Fischer et Hofmeister) Le groupe carboxyle d un AA se lie à la fonction amine d un autre AA avec élimination d une molécule d H 2 O Liaison peptidique Liaison peptidique = CONH L association des acides aminés par l intermédiaire des liaisons peptidiques forme la chaîne protéique (polypeptidique)
La chaîne peptidique La chaîne peptidique est vectorisée : => Les Aas sont attachés par liaisons peptidiques dans un ordre spécifique (défini par le gène) CONVENTIONS - une chaîne polypeptidique a un sens avec une extrémité aminée, N-terminal et une extrémité carboxylique, C-terminal - l extrémité N-terminal est prise comme origine de la protéine (démarrage de la synthèse) - la chaîne polypeptidique est formée d une chaîne principale répétitive squelette (N - C α - C) (N - C α - C) et d une chaîne latérale variable (R)
Liaisons peptidiques Résidu N-terminal Résidu C-terminal la synthèse peptidique résulte de la formation de liaisons peptidiques (CONH) entre AAs
Sens d une protéine une extrémité aminée N-terminal & une extrémité carboxylique C-terminal Résidu N-terminal Résidu C-terminal L extrémité N terminal est prise comme origine de la protéine Séquence = Tyr Gly Gly Phe Leu (Y G G F L)
la chaîne polypeptidique est formée d une chaîne principale répétitive (squelette ; N-C α -C) Chaîne principale Résidu N-terminal Résidu C-terminal (N - C α - C) (N - C α - C)
la chaîne polypeptidique est formée d une chaîne latérale variable (R) Chaîne latérale Chaîne latérale Résidu N-terminal Résidu C-terminal
Biochimie 1 Protéines I) Les Acides aminés II) Les peptides et protéines a) Définitions b) Les Structures c) Structures et fonctions d) Méthodes d analyses 2006/07
Configuration et structure dimensionnelle Caractéristiques spatiales d une protéine Structure tridimensionnelle responsable de sa fonction Plusieurs niveaux de définitions 1) Structure primaire: ordre des acides aminés le long de la chaîne polypeptidique. M D GA C W etc 2) Structure secondaire: organisation ou repliement local d acides aminés consécutifs. 3) Structure tertiaire: agencement stable dans l'espace des différents repliements locaux. 4) Structure quaternaire: agencement de sous-unités entre elles, quand la protéine est constituée de plusieurs sous-unités indépendantes (ex: hémoglobine).
Structure primaire Composition et séquence des acides aminés M D GA C W etc La séquence en acide aminé d une protéine détermine sa structure tridimensionnelle responsable de sa fonction
Détermination directe par séquençage des protéines * Méthode de Sanger ou récurrente d Edmann * Spectrométrie de Masse Détermination indirecte par les outils de bioinformatique * Bases de données informatiques disponibles Génomique : projet séquençage des Génomes LOCUS: NP_035300 (254 aa) linear ROD 09-APR-2006 DEFINITION prion protein [Mus musculus]. ACCESSION NP_035300 VERSION NP_035300.1 GI:13173473 DBSOURCE REFSEQ: accession NM_011170.1 KEYWORDS SOURCE Mus musculus (house mouse) ORGANISM Mus musculus Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Euarchontoglires;Glires;Rodentia;Sciurognathi; Muroidea; Muridae; Murinae; Mus. REFERENCE 1 (residues 1 to 254) AUTHORS Asano,M., Mohri,S., Ironside,J.W., Ito,M., Tamaoki,N. and Kitamoto,T. TITLE vcjd prion acquires altered virulence through trans-species infection JOURNAL Biochem. Biophys. Res. Commun. 342 (1), 293-299 (2006) PUBMED 16480953 1 manlgywlla lfvtmwtdvg lckkrpkpgg wntggsrypg qgspggnryp pqggtwgqph 61 gggwgqphgg swgqphggsw gqphgggwgq gggthnqwnk pskpktnlkh vagaaaagav 121 vgglggymlg samsrpmihf gndwedryyr enmyrypnqv yyrpvdqysn qnnfvhdcvn 181 itikqhtvtt ttkgenftet dvkmmervve qmcvtqyqke sqayydgrrs sstvlfsspp 241 villisflif livg
ETUDE des séquences primaires Regroupement de protéines en famille moléculaires Information sur des fonctions potentielles Evolution moléculaire Informations sur l origine et l évolution Détermination de signature spécifiques de protéines ayant une même fonction Informations sur les éléments moléculaires responsables des activités biologiques
Structure secondaire organisation ou repliement local d acides aminés consécutifs La structure secondaire est la résultante des contraintes stériques dues à la structure propre des acides aminés. géométrie de la liaison peptidique liaisons hydrogènes potentielles entre résidus Impact sur la structure locale
géométrie de la liaison peptidique liaisons hydrogènes potentielles entre résidus Les contraintes de la liaison peptidique L atome d oxygène à charge partielle négative forme un dipôle électrique avec l amide à charge partielle positive => Configuration trans
Modélisation de la liaison peptidique - N, H, O et C de la liaison peptidique sont coplanaires * Encombrement stérique minimisé Rigidité de la liaison peptidique conduit à un squelette défini et stable Les libertés de rotation des atomes aux extrémités de la liaison permettent l adoption de différentes conformations dans l espace
géométrie de la liaison peptidique liaisons hydrogènes potentielles entre résidus Les différentes Structures secondaires Hélices α Feuillets β Coudes β Pelote statistique
Hélices α Interactions faibles entre les NH et CO sur un segment continu (résidus R n et R n-(3,4) ) Liaisons Hydrogènes N + 3,6 N Caractéristiques d une Hélice - 3,6 résidus / tours - pas d hélice : 0,54 nm / tour - la liaison H est // à l axe - longueur de la liaison H : 0,286 nm Structure en forme de bâtonnet
Hélice α droite Les R sont à l extérieur de l hélice => Structure en hélice α favorisée par des chaînes latérales ne portant pas de charge et dont l encombrement stérique est faible La configuration L des acides aminés privilégie un enroulement à droite de l hélice
Feuillets β Interactions faibles entre les NH et CO de segments différents pouvant appartenir à la même chaîne ou à des chaînes différentes => Structure en forme de feuillet plissé
1 liaison peptidique sur 2 ne participe pas à une liaison H Association de plusieurs brins Sens peptidique des brins adjacents peut être identique ou contraire feuillet β parallèle feuillet β anti-parallèle (+ stable car faible distorsion des liaisons H) N C N C parallèle anti-parallèle C N
Différentes représentation des feuillets β
Coudes ou tours β (Conformations non répétitives à résidus polaires) => Changement de direction de la chaîne peptidique Ιndispensable pour la formation de feuillets de chaînes anti-parallèles (β) Court segment peptidique de 2 à 4 résidus avec possibilités de liaisons hydrogènes entre le premier et le dernier résidu du coude O R 4 R 3 N α 3 C N H α 4 C O C O H R 2 α 2 N C α 1 R 1 N R 2 et R 3 : chaînes latérales chargées => interactions avec H 2 O R 1 et R 4 : chaînes latérales de faible encombrement stérique => favorable aux contraintes
La configuration de la proline provoque le changement de direction de la chaîne peptidique R α O H C N H α C O R α O H C N O C α H Conformation trans Conformation cis Stabilité identique des conformations trans et cis 6% d isomères cis dans les protéines globulaires La Proline est un point de rupture d une Hélice α : - Absence de NH pour la liaison Hydrogène - Cycle pyrrolidone rigide bloque la rotation et détruit la continuité de l hélice
Pelote statistique Conformations non structurées dans des conformations périodiques Forme irrégulière obéissant aux contraintes locales de voisinage Résultante des réarrangements tertiaires et/ ou quaternaire
Acides aminés & Prédiction de structure secondaire? Hélices α : Ala, Leu, Met, Glu Gly déstabilise une hélice (R trop petit) Pro interrompt une hélice : pas de liberté de rotation Feuillets β : Val, Ile, Tyr, Cys, Trp, Phe Pro déstabilise le feuillet Coudes et boucles: Gly, Asp, Ser, Asn et Pro souvent dans sites de liaison et/ou sites actifs des protéines
Structure tertiaire Organisation spatiale des différentes structures locales La structure tertiaire est la résultante des arrangements des structures secondaires entre elles aboutissant à la forme globale spécifique de la protéine. Liaisons covalentes Liaisons non covalentes Forme globale spécifique
Liaisons covalentes => Ponts disulfures Les cystéines peuvent créer des liaisons covalentes par l intermédiaire de leurs atomes de soufre N N H C CH 2 SH HS CH 2 C H C O C O N N H C CH 2 S S CH 2 C H C O C O * Formation des ponts disulfures par oxydation * Rupture des ponts disulfures par des agents réducteurs (β-mercaptoéthanol)
La Kératine = principal constituant des cheveux Principe d une permanente
Liaisons non covalentes : => ponts salin: Liaisons ioniques entre groupements chargés de signe opposé => liaisons hydrogènes : Interactions électrostatiques entre dipôles => Forces de van Der Walls : Attractions hydrophobes entre groupements apolaires => Interactions des chaînes latérales avec l eau - chaînes polaires exposées - chaînes apolaires enfouies
Ponts salins = Liaisons ioniques entre groupements chargés de signe opposé H N O - C CH 2 C O C O + H3 N CH 2 N C C H O Les interactions ioniques sont sensibles au ph
Liaisons hydrogènes = Interactions électrostatiques entre dipôles H N C CH 2 C C O O - O HO R N C C H O
Forces de van Der Walls = Attractions hydrophobes entre groupements apolaires Poche hydrophobe Ileu Val Leu Met Ala Phe Interactions des chaînes latérales avec l eau chaînes polaires exposées chaînes apolaires enfouies
Les interactions modulent la structure globale de la protéine La Structure de la protéine subi l influence du milieu sur les interactions dont elle dépend. Nature du solvant Température ph du milieu Force ionique Présence d agents oxydant, réducteurs, détergents
Conformation native d une protéine = Structure tertiaire de la protéine qui exprime sa fonction biologique dans des conditions physiologiques Purification d une protéine native = Obtention d une protéine active et fonctionnelle (Possibilité d études de fonction)
Dénaturation d une protéine Action de toutes substances annulant les interactions Variation de ph, sels & agents chaotropes : Détergents (SDS) Agents réducteurs: (β-mercaptoéthanol) Purification d une protéine dénaturée = Obtention d une protéine inactive et non fonctionnelle (Possibilité d études de paramètres physicochimiques)
Deux grandes catégories de Protéines Protéines fibreuses Agrégation d une conformation unique : Kératine = torsade de dimères d hélices α Fibroïne = empilement de feuillets β Protéines globulaires Structures variées très dépendants des interactions et du milieu Peuvent comprendre des motifs de structures en hélices α ou en feuillets β plissés Protéines à domaine α dominant Protéines à domaine α dominant Protéines α/β (les plus nombreuses)
Structure tertiaire de la GFP (Green fluorescent protein) = Enchaînement de feuillets β, de coudes et d hélices α coudes feuillets β hélices α
Structure Quaternaire Assemblage de protéines oligomériques La structure quaternaire est la résultante de l association de différentes protéines (sous-unités) aboutissant à un complexe protéique fonctionnel Liaisons covalentes Liaisons non covalentes Association de sous-unités protéiques Mêmes liaisons qui interviennent dans les structures tertiaires et quaternaires Ponts disulfures Liaisons hydrogènes Liaisons hydrophobes
Organisation de protomères ou sous-unités Association ou dissociation des sous-unités & Régulation fonctionnelle Une seule Unité protéique α, α2 Association de plusieurs sous-unités protéiques différentes α2β2 (Hémoglobine) Liaisons entre sous-unités non covalentes : types hydrophobes, ioniques, hydrogènes covalentes : ponts disulfures
Biochimie 1 Protéines I) Les Acides aminés II) Les peptides et protéines III) Les Structures IV) Structures et fonctions V) Méthodes d analyses
Relations Structure et Fonction Structure Primaire & Secondaire Séquences consensus & Sites de reconnaissances Associées à des fonctions précises Structure Tertiaire : Organisation spatiale des structures locales Permettant le regroupement de plusieurs structures secondaires pour l obtention d une fonction Structure Quaternaire : Permet la régulation par l interaction de protéines identiques ou différentes
Le doigt de zinc Séquence consensus contenant 4 cystéines (ou 2 Cystéines + 2 histidines) espacées de manières identiques. C (aa) 3 C (aa) 6-12 C H (aa) 3 C H Boucle Séquence variable ] Spécificité Interaction AN Interaction Avec le Zinc ] Structure
Structure tertiaire & pathologie La protéine PRION & les Maladies à Prion (Vache folle, ESB, tremblante du mouton, Creutzfeld-Jacob) D. Carleton Gajdusek Prix Nobel 1976 Stanley Prusiner Prix Nobel 1997 Découverte des Prions: Nouveau mode d infection par des protéines
Mutation de la protéine prion Prp-p: Changement de conformation de la protéine qui favorise l apparition d agrégations amyloïdes dans les neurones Structure normale saine (PrPc) Forte proportion d hélices α Structure pathologique (PrPsc : scrapie) Forte augmentation des feuillets β
Un exemple de structure dimérique de type α2: Le facteur TBX3 et sa cible ADN Les gènes T-box codent pour une grande famille de facteurs de transcription ayant un rôle critique dans le développement des vertébrés et des invertébrés. La structure dimérique permet la reconnaissance d une séquence spécifique d ADN par des interactions entre les hélices H3 et H4 de chaque sous-unités avec les bases nucléotidiques
Biochimie 1 Protéines I) Les Acides aminés II) Les peptides et protéines III) Les Structures IV) Structures et fonctions V) Méthodes d analyses
Paramètres physicochimiques Carte d identité d une protéine Poids moléculaire phi Structure oligomérique Méthodes d identification des protéines Electrophorétiques Chromatographiques
Principe de l électrophorèse Migration de molécules chargés dans un champs électrique Charge de la molécule Q Champ Electrique X - - + - M - - + - Force d accélération QX - - Force de frottement F Vitesse de migration V QX = FV F : fonction de la molécule (encombrement) et du milieu de migration (viscosité)
Supports Electrophorètiques Les plus courants Agarose : Acides nucléiques Polyacrylamide : Protéines Conditions d électrophorèses * non dissociantes = gels natifs migration selon les charges intrinsèques des protéines (ph des solutions d électrophorèses) ** dissociantes = gels SDS migration de protéines dénaturées en présence de SDS (sodium dodecyl sulfate), détergent ionique (anion)
Ammonium persulfate acrylamide Méthylène bis-acrylamide Dépôt de l échantillon avec une pipette Cathode Cuve d électrophorèse Gel démoulé et coloré Tampon d électrophorèse Gel Anode Tampon d électrophorèse
Migration de protéines dénaturées en présence de SDS: Protéines chargées négativement de façon uniforme Dépôt de l échantillon avec une pipette Cathode Cuve d électrophorèse Tampon d électrophorèse Gel Anode Tampon d électrophorèse Migration en fonction de la taille ou poids moléculaire
1 Cellule humaine Capacité codante du génome 60.000 à 100.000 6.000 protéines synthétisées à un moment donné 80 à 90% des gènes sont des gènes d entretien (Cytosquelette, Métabolisme ) 400 Protéines dont l expression est Cellule et/ou tissu spécifique LA PROTEOMIQUE
Electrophorèse Deux Dimensions (2D) ou méthode d O Farrel pi PM 4.0 ph 8.0 Permet l identification de plusieurs centaines de spots Recherche de spots spécifiques d une condition donnée en fonction de l obtention de l extrait protéique séparé Carte de référence pour une cellule, un tissu ou un complexe protéique donné à un moment donné et/ou dans des conditions physiologiques définies
La protéomique Banques de données informatisées Cartes bi-dimenssionnelles annotées Protéines acides plasmatique
Principe de la chromatographie Séparation de molécules entre une phase mobile (Tampon d élution) et une phase immobile (Support stationnaire) Utilise les propriétés d interactions des acides aminés - liaisons ioniques Chromatographie Echangeuse d ions - liaisons hydrophobes/hydrophyles Chromatographie Phase inverse Utilise les propriétés globales d interactions des protéines - encombrements et tailles Chromatographie Exclusion-diffusion - interactions spécifiques avec un ligand Chromatographie d affinité
Marc de Tapia INSERM U-692 Laboratoire Signalisations Moléculaires et Neurodégénérescence Biochimie 1 Les grands Mécanismes I) La réplication II) La transcription III) La traduction 2009/10
Les Dogmes de la BIOLOGIE Réplication ADN Transcription ARN Traduction PROTEINE
Acides nucléiques Protéines Réplication Gène Transcription transcrit Traduction Protéine
La réplication Synthèse d acides désoxyribonucléique qui reproduit exactement le génome d une cellule au cours du cycle cellulaire afin de préparer la division de cette cellule.
Génomes PB totales Nbre chromosomes Bactérie (E. coli) 4.639.221 1 Levure (Saccharomyces cerevisiae) 12.068.000 16 Nématode (C. elegans) 97.000.000 12 Plante (Arabidospsis) 125.000.000 10 Insecte (Drosophile) 180.000.000 18 Plante (Oryza sativa) 480.000.000 24 Souris (Mus musculus) 2.500.000.000 40 Homme (Homo sapiens) 3.200.000.000 46
Stockage de l information génétique Les chromosomes Réplication = Duplication des chromosomes lors de la Mitose
Structures des Chromosomes linéaires Séquences répétées assurant la protection des chromosomes Sépare le chromosome en deux bras Séquences uniques (gènes), répétées et origines multiples de réplication
Evolution des chromosomes au cours de la mitose G1 Décompactage de la chromatine (1 chromatide par chromosome) S Ouverture des bulles de réplication et début de la réplication G2 Obtention de deux chromatides liées par leurs centromères M Séparation des chromatides & centromères liés au fuseau achromatique Retour à G1 après mitose (séparation) les gènes peuvent s exprimer dans les deux cellules filles
La réplication est semi-conservative brins parents brins filles Les deux brins de l ADN parental servent de modèle pour la synthèse des nouveaux brins filles Séparation des brins de l ADN parental à chaque cycle de réplication
Réplication différente des petits ADN circulaires et des très longs ADN linéaires chromosomes procaryote eucaryote
Origine unique de la réplication Ouverture locale de la double hélice d ADN Formation de deux fourches de réplication La réplication est bidirectionnelle ADN filles
Origines multiples de réplication Ouverture locale de la double hélice d ADN Formation des fourches de réplication La réplication est bidirectionnelle ADN filles
La boucle de réplication Synthèse bidirectionnelle Fourches de réplication La liaison de protéines spécifiques ouvre la double hélice L ADN simple brin est stabilisé par des protéines SSB (Single Strand bound) La synthèse d ADN ne peut démarrer que sur des amorces ARN/ ADN Il existe une dizaine d isoenzymes d ADN polymérases chez les eucaryotes: Polymérase α = synthèse des amorces Polymérase γ = principale enzyme de la réplication Autres polymérases spécifiques de la synthèse de l ADN mitochondrial ou des processus de réparation de l ADN génomique.
La fourche de réplication Brin direct Sens de progression de la fourche de réplication Brin retardé La réplication nécessite la séparation des deux brins d ADN parentaux (Hélicase) La synthèse d ADN démarre toujours par leur extrémité 3 - OH terminale (Polymérase) => Le brin nouveau est synthétisé dans le sens 5 vers 3 La synthèse du brin retardé nécessite la synthèse de brins amorces spécifiques appelés fragments d Okasaki (Primase)
Les enzymes de la réplication Topoisomérase, Hélicase ADN polymérase ADN dépendantes Primase ADN ligase Télomérase
Topoisomérase, Hélicase Ouverture de la double hélice Primase Synthèse des amorces ARNs ADN polymérase ADN dépendante Synthèse des brins filles ADN ligase Jonction des différents fragments filles Télomérase Synthèse des extrémités; télomères
Topoisomérases & Structure de l ADN Les topoisomérases modifient l enroulement de l ADN en hydrolysant un brin d ADN et en le reconstituant après avoir fait le tour de l autre brin Topoisomérase 1 (Hélicase) : déroulement de l ADN en avant de la synthèse Topoisomérase 2 (Gyrase) : enroulement de l ADN néosynthétisé
Structure super-enroulée de l ADN Structure relaxé de l ADN Structure ouverte de l ADN
Polymérases & Synthèse de l ADN La primase = une ARN polymérase ADN dépendante ARN polymérase indépendante de la transcription Synthétise les amorces d ARN complémentaires au brin ADN (10 nucléotides) L amorce constitué d un brin mixte ARN/ADN sert de point d initiation des ADN-polymérases-ADN dépendantes CTCGACATGCCGATCGTATAGTACCGGCTTAAT GCGCUGTUCG Amorce ARN CTCGACATGCCGATCGTATAGTACCGGCTTAAT GCGCUGTUCGGCUAGCUAUACUT début de synthèse ADN
Les ADN polymérases ADN dépendante Enzymes présentes dans le noyau cellulaire qui agissent pendant la phase S du cycle cellulaire Elles assurent l élongation en utilisant comme substrat des désoxyribocléosides triphosphates (dntp) et les amorces ARN/ADN synthétisées par la primase Elles prennent modèle sur le brin matrice P 2 O 7 4- datp dctp dgtp dttp + ADN Matrice Simple brin ADN Double Brin
Activité des polymérases Elles ne démarrent la condensation de nouveaux nucléotides que sur une fonction alcool en 3 du ribose du dernier nucléotide d une amorce (doit être hybridé avec un nucléotide complémentaire de la matrice) Elles forment une liaison phosphodiester entre l extrémité 3 OH et le 5 monophosphate (α) du ribose qui résulte de l hydrolyse des phosphates (β et γ). Cette hydrolyse fournit l énergie nécessaire à la liaison phosphosdiester Nucléotide copié Amorce ARN/ADN ADN Matrice
Les ADN polymérases assurent la fidélité de la copie grâce à leur activité exonucléasique
Ribonucléase & ADN ligase = Jonction des fragments d Okasaki Sur le brin retardé de la fourche de réplication les amorces ARN sont hydrolysées par une ribonucléase L ADN ligase assure la reconstitution de la liaison phosphodiester entre le 3 OH et le 5 OH des riboses de deux nucléotides voisins
5 3 Télomérases = Terminaison de la Réplication Télomère Brin modèle 3 TTAGGGTTAGGGTTAGGGTTA AATCCC 5 télomérase Matrice ARN CAAUCCCAAUC 3 5 5 3 3 TTAGGGTTAGGGTTAGGGTTA AATCCC CAAUCCCAAUC 5 450 nt 5 3 3 TTAGGGTTAGGGTTAGGGTTA AATCCC CAAUCCCAAUC 5 5 Polymérase γ 3 3 5 Faute de place à l extrémité 3 de l ADN pour une amorce complémentaire, la réplication s accompagnerai d un raccourcissement des chromosomes La télomérase peut continuer la synthèse d un ADN simple brin en prenant comme amorce un ARN constituée de la répétition d une séquence CAAUCCCUAAC
La Transcription Lecture d un gène par une ARN- Polymérase ADN dépendante qui synthétise un acide ribonucléique dont la structure primaire reproduit celle du brin sens de ce gène.
Initiation Facteurs de transcription reconnaissants des séquences promotrices Elongation ARN polymérases Terminaison Facteurs de terminaison reconnaissants des séquences spécifiques TRANSCRIT PRIMAIRE ARN
L initiation de la transcription Région promotrice Facteur(s) de transcription ARN polymérase ARN polymérase ARN
Les séquences promotrices Procaryotiques Séquences -35 Pribnow box Démarrage transcription +1 19 bases 10 bases Séquences reconnues par l ARN polymérase La sous unité β de l ARN polymérase est la cible des antibiotiques rifamycine et rifampicine qui bloquent la formation du premier lien phosphodiester
Les séquences promotrices eucaryotiques CATT box TATA box Démarrage transcription +1 40 à 50 bases 20 à 30 bases Séquence reconnues par TFIID Séquence reconnue par les facteurs de transcription (CTF ou autres) L ARN pol II est la cible de la toxine de l amanite phalloide (α-amanitin)
Elongation Brins sens et antisens GGCCAATCT CCGGTTAGA Brin «sens» TATATA ATATAT Démarrage transcription AGGC. +1 AGGC TCCG Brin «antisens» les gènes sont présents sur les deux brins d ADN Lors de la formation du complexe de transcription, le facteur TFIID reconnaît la TATA box de façon symétrique, le brin sens est celui où la CAAT box est en amont de la TATA box Le brin «sens» correspond au brin copié (séquence de l ARN, le brin «antisens» servant de modèle pour la transcription
Les ARN polymérases ADN dépendantes Enzymes présentes dans le noyau cellulaire qui agissent pendant la phase G1 du cycle cellulaire Elles assurent l élongation en utilisant comme substrat des ribocléosides triphosphates (NTP) et l ADN double brin Il existe plusieurs enzymes ARN polymérases ADN dépendantes Enzyme procaryotique Une seule ARN polymérase α2ββ (cœur) σ Enzymes eucaryotiques ARN polymérase I: grands ARN ribosomiques ARN polymésase II : ARN messagers (protéines) ARN polymérase III : petits ARN (ARNt, ARNr 5s) P 2 O 7 4- GTP ATP UTP CTP + ADN Matrice double brin ARN Simple Brin
Elongation de la transcription ARN P P P P P P G 3 HO 5 3 HO A C U G U ADN 3 5 T G A C A C T T A C T G T G A A 5 3 Brin matrice antisens Brin codant sens L ARN pol II est accompagnée de facteurs d élongation permettant l ouverture de la chromatine pour permettre l avancée de l enzyme
Fin de la transcription ARN polymérase Région terminatrice Il existe des signaux reconnus par les polymérases et par des facteurs de terminaison qui permettent la libération de l ADN et de l ARN primaire (avant modifications post-transcriptionnelles) terminaison procaryotique reconnaissance d une structure en épingle à cheveu (hairpin) dépendante du facteur Rho terminaison eucaryotique reconnaissance de séquence AAUAAA (brin sens) souvent suivie d une séquence AUACAAAC qui permettent la libération la polymérase et l ajout par la polya polymérase de queues polya
Modification des transcrits primaires ARN eucaryotes La coiffe : Structure Me-G-ppp-5 Queue poly A (3 ) * Séquence 3 -AAAAAAAAAAAAAA Edition : CAA vers UAA * Modification de bases spécifiques par désamination Excision - Epissage * Elimination des parties non codantes (introns) Exon1 - Intron - Exon2 - Intron - Exon 3 (ARN primaire) Exon1 - Exon2 - Exon3 (ARN codant)
La coiffe = 7-Methyl-Guanosine (Me-G-ppp-5) (capping) Me 7 Lien 5-5 P P P Guanine 5 CH 2 5 CH 2 Base HO HO OH OH Ribose 3 OH O Ribose P La coiffe est ajoutée à l extrémité 5 OH terminale de l ARN en deux étapes ajout d une guanosine triphosphate par une guanylil transférase méthylation de l azote 7 de la guanine terminale par une guanine-7-methyl-transférase (SAM : source de méthyl) Les ARNm, détruits normalement par les ribonucléases du cytoplasme, sont protégés par cette structure particulière qui dissimule l extrémité 5 OH du transcrit
La queue polya GCUACAAUAAAUGCUGAAUGAAUCCAAGCUCUGAGCCUGGUAUGUUUG Endonucléase spécifique GCUACAAUAAAUGCUGAAUGAAUCC ARN pol II libère le transcrit primaire PolyA polymérase ATP P 2 O 7 4- GCUACAAUAAAUGCUGAAUGAAUCCAAAAAAAAAAAAAAAAAA(A) n La queue polya (+ de 1000 nt) La queue polya protège l ARN de la dégradation par les exonucléases La queue polya est indispensable à la maturation et le transport des transcrits vers le cytoplasme Lorsqu elle est réduite à quelques centaines de nt, le messager (1/2 vie) sera détruit
Excision - Epissage Etape de la maturation des acides ribonucléiques messagers, où les introns sont éliminés de la structure primaire et les exons liés les uns aux autres Les gènes eucaryotiques sont discontinus L épissage est réalisé dans des complexes multiprotéiques ; les splicosomes, contenant des petits acides nucléiques (snrna; small nucleolar RNA) Il existe en 5 de l intron un site GU donneur d épissage suivi d une séquence riche en purines et en 3 de l intron un site AG accepteur d épissage suivi d une séquence riche en pyrimidines L épissage peut être alternatif conduisant à plusieurs structure d ARN messagers à partir d un même gène
ARN messager Intron1 Intron2 exon1 GU AG exon2 GUAG exon3 (A)n Splicosome : snrnp & snarn exon1 exon2 exon3 (A)n Excision des introns ex1 ex2 ex3 (A)n 5 UTR Séquence non traduite Séquence codante Protéine 3 UTR Séquence non traduite GU Site donneur d épissage en 5 AG Site accepteur d épissage en 3
L épissage alternatif conduit à la synthèse de plusieurs ARN messagers et protéines à partir d un même gène 1 Gène ADN Génomique (76.000 pb) 1 4 5 6 7 8 9 2 3.1 Transcrits Alternatifs 3.2 Domaine conservé Protéines multiples (de 25 à 112 kdaltons) ayant toutes un domaine commun conservé et des domaines spécifiques de chaque isoforme
Stabilité des ARN messagers Coiffe Me7-G Ribosomes Queue polya AAAAAAAAAA Absence de Coiffe Peu de Ribosomes Queue polya raccourcie 5 exonucléase endonucléase 3 exonucléase La coiffe protège de la dégradation immédiate lors de la transcription par les 5 exonucléases La Queue poly A protège les ARN des 3 exonucléases La traduction par les ribosomes protège de la dégradation par les endonucléases
Régulation de la transcription Promoteur de base Trans = Protéines Insuline Tissu cardiaque AMPc PKA ARN pol II GATA4 Oct1 CREB IRF TFIID CCCAGGC ATGCAAAT TGACGTTCA GATTTTTAT TATATA GGGTCCG TACGTTTA ACTGCAAGT CTAAAAATA ATATAT GATA Octamère CRE IRS TATA box Cis = Séquences ADN Les éléments de séquences nucléotidiques Cis du promoteur sont reconnus de manière spécifique en Trans par des facteurs de transciption (structures protéiques définies) Les élements Cis peuvent activer (enhancer) ou inhiber (silencer) la transcription
Cis HRE : Eléments de réponse aux hormones & Régulation transcriptionnelle par les hormones stéroïdiennes Récepteurs Androgène Glucocorticoïde Acide rétinoïque Vitamine D Hormone tyroïdienne Dimère Acide rétinoïque & Vit D Séquences consensus HRE GG(A/T)ACAN 2 TGTTCT GGTACAN 3 TGTTCT AGGTAN 5 AGGGTCA AGGTAN 3 AGGGTCA AGGTAN 5 AGGGTCA AGGTANAGGTCANAGGTCANAGGTCA
Trans HRE : Eléments de réponse aux hormones & Régulation transcriptionnelle par les hormones stéroïdiennes Structures protéiques de la reconnaissance de l ADN Doigt de Zinc (Zinc finger) Domaines basiques (K & R) avec fermeture à Leu (Leu Zipper) Hélice-Boucle-Hélice
Complexe de transcription = Association de nombreux facteurs Régulation fine de la transcription
Etudes des séquences régulatrices grâce aux outils de la biologie moléculaire * Région promotrice GFP GFP GFP GFP GFP
Les Homeo box & les Homéodomaines Séquences promotrices & Protéines régulatrices Régulateurs du développement embryonnaire de la drosophile Christiane Nüslein-Vollhard, Edward Lewis, Eric Wieschaus Prix Nobel de Médecine 1995