Bibliographie. Introduction à la bioinformatique. Objectifs. Préambule: Les cellules. Alberts et al, The molecular biology of the cell

Documents pareils
CHAPITRE 3 LA SYNTHESE DES PROTEINES

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Séquence 2. L expression du patrimoine génétique. Sommaire

Contrôle de l'expression génétique :

VI- Expression du génome

Biomarqueurs en Cancérologie

Univers Vivant Révision. Notions STE

ULBI 101 Biologie Cellulaire L1. Le Système Membranaire Interne

1 Culture Cellulaire Microplaques 2 HTS- 3 Immunologie/ HLA 4 Microbiologie/ Bactériologie Containers 5 Tubes/ 6 Pipetage

MABioVis. Bio-informatique et la

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

TD de Biochimie 4 : Coloration.

Bibliographie Introduction à la bioinformatique

Module 5 La maturation de l ARN et le contrôle post-transcriptionnel chez les eucaryotes

Université d Evry-Val d Essonne Ecole Doctorale des Génomes Aux Organismes. Thèse

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

Bases moléculaires des mutations Marc Jeanpierre

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr

Structure quantique cohérente et incohérente de l eau liquide

Hépatite chronique B Moyens thérapeutiques

Introduction à la Génomique Fonctionnelle

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

2 C est quoi la chimie?

Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

CHAPITRE 3 LES TASQ COMME PLATEFORME POUR LA CATALYSE PSEUDO-ENZYMATIQUE

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Bases de données et outils bioinformatiques utiles en génétique

Ecran : Processeur : OS : Caméra : Communication : Mémoire : Connectique : Audio : Batterie : Autonomie : Dimensions : Poids : DAS :

Chapitre III Le phénotype immunitaire au cours de la vie

Traitement numérique de l'image. Raphaël Isdant

Jean Dubuffet AUTOPORTRAIT II

IlliS. Le ribosome bactérien : structure et fonctions SYNTHÈSE

TP N 3 La composition chimique du vivant

Les tests génétiques à des fins médicales

1 les caractères des êtres humains.

Comment faire passer un message

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Production d une protéine recombinante

Le test de dépistage qui a été pratiqué à la

Compléments - Chapitre 5 Spectroscopie

Big data et sciences du Vivant L'exemple du séquençage haut débit

- pellicule de fruits qui a un rôle de prévention contre l'évaporation, le développement de moisissures et l'infection par des parasites

Tableau 1. Liste (non exhaustive) des protéines se localisant dans les P-Bodies

Luca : à la recherche du plus proche ancêtre commun universel Patrick Forterre, Simonetta Gribaldo, Céline Brochier

Biochimie I. Extraction et quantification de l hexokinase dans Saccharomyces cerevisiae 1. Assistants : Tatjana Schwabe Marcy Taylor Gisèle Dewhurst

Perl Orienté Objet BioPerl There is more than one way to do it

Le code à barres EAN 13 mes premiers pas...

voies de signalisation

Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux

Catalogue Informatique - Clés USB Stylos

INTRODUCTION À L'ENZYMOLOGIE

TD DOSAGE DE PROTEINES ET ELECTROPHORESE : PARTIE THÉORIQUE BST1 SVT

ZOTERO Un outil gratuit de gestion de bibliographies

Justine Ludi. HEAD Genève

Centrale d Alarme Visiotech

BROSSES ANTISTATIQUES GUIDE TECHNIQUE

I. La levure Saccharomyces cerevisiae: mode de vie

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Transport des gaz dans le sang

Transport des gaz dans le sang

β-galactosidase A.2.1) à 37 C, en tampon phosphate de sodium 0,1 mol/l ph 7 plus 2-mercaptoéthanol 1 mmol/l et MgCl 2 1 mmol/l (tampon P)

PROFIS Installation. Module 4: Module 3D Design

Glossaire des nombres

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

Identification des protéines PPR impliquées dans l épissage des ARN messagers dans les chloroplastes et les mitochondries chez Arabidopsis Thaliana.

Pop-Art façon Roy Liechtenstein

SESSION 2013 ÉPREUVE À OPTION. (durée : 4 heures coefficient : 6 note éliminatoire 4 sur 20) CHIMIE

Y a-t-il une place pour un vaccin thérapeutique contre l hépatite B? H. Fontaine, Unité d Hépatologie Médicale, Hôpital Cochin

Resolution limit in community detection

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007

Partie 1. Addition nucléophile suivie d élimination (A N + E) 1.1. Réactivité électrophile des acides carboxyliques et groupes dérivés

Partie I : Un siècle de transformations scientifiques, technologiques et sociales

Jouve, 18, rue Saint-Denis, PARIS

Les probabilités. Chapitre 18. Tester ses connaissances

1. Utilisation conforme à l usage prévu. 2. Propriétés. 3. Montage. Capteur de CO 2 AMUN

ACIDES BASES. Chap.5 SPIESS

TP3 Test immunologique et spécificité anticorps - déterminant antigénique

Les débuts de la génétique

QUESTIONNAIRE CAHIER DES CHARGES POUR FACILITER LA CREATION DE VOTRE SITE WEB

Gestion d un VIDÉOPROJECTEUR. ou d un ÉCRAN SECONDAIRE

Les OGM. 5 décembre Nicole Mounier

T.P. 7 : Définir et contrôler un système d allumage statique

Indicateur d'unité Voyant Marche/Arrêt

Base de données bibliographiques Pubmed-Medline

Utiliser le site learningapps.org pour créer des activités interactives

Ni tout noir, ni tout blanc Consignes Thème I - Observer

MYRIAD. l ADN isolé n est à présent plus brevetable!

Annales de Biologie Cellulaire QCM (niveau SVT 1 er année)

Si la source se rapproche alors v<0 Donc λ- λo <0. La longueur d onde perçue est donc plus petite que si la source était immobile

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

Transcription:

Introduction à la bioinformatique 2. Fondations moléculaire en 66 slides et 2 video Bibliographie Alberts et al, The molecular biology of the cell Zvelebil et Baum, Understanding bioinformatics 1 2 Objectifs Préambule: Les cellules Expliquez la structure de l ADN et ARN Expliquez le dogme de la biologie moléculaire Expliquez le rôle de ARNm Expliquez comment le ARNm est traduit en protéine Expliquez comment l expression des gènes est contrôlée Montrez comment les introns sont enlevés de l ARNm Récapitulez comment l évolution se produit L unité fondamentale de la vie Toutes les cellules partagent les mêmes mécanismes Les cellules produisent d autres cellules en passant l information nécessaire pour reconstruire toutes les fonctions (hérédité) Les cellules traitent l information comme des ordinateurs nourriture, survie,.. 3 4

Préambule: Les cellules 2 Deux grandes classes de cellules La structure interne des cellules eukaryotes est plus complexe Préambule: Les cellules 3 Toute l information est encodée par une structure spécifique : l ADN Acide deoxyribonucleique L information d un type de cellule peut être traiter par des autres types de cellules. Un ADN fait partie d un chromosome L ADN contient l information pour produire des milliers de protéines les prokaryotes n ont pas de noyau. un gène est une partie de l ADN qui correspond à une seule protéine. le génome est l ensemble des molécules d ADN. 5 6 Préambule: Les cellules 4 Préambule: Les cellules 5 Organisme Année Taille (Mb) Mycoplasma genitalium 1995 0,6 L homme a 46 molécules d ADN dans chaque cellule organisées dans les chromosomes Haemophilus influenzae 1995 1,8 Escherichia coli 1997 4,6 Saccharomyces cerevisiae 1996 12 Schizosaccharomyces pombe 2002 14 Caenorhabditis elegans 1998 97 Arabidopsis thaliana 2001 120 Dans les bactéries, il y a souvent un seul chromosome circulaire Oryza sativa 2002 5 000 Drosophila melanogaster 2000 180 Galus Galus 2004 1 200 Rattus Norvegicus 2004 2 900 Mus musculus 2002 3 400 Homo sapiens 2001 3 400 1Mb = 1000000 bases La taille des génomes 7 8

La structure de... Carte 1: le monde de l ADN ADN (acide deoxyribonucléique) ARN (acide ribonucléique) 4 sujets: (jaune) régulation des gènes, (bleu) la traduction des gènes, (noir) l évolution et (rouge) la structure de l ADN et de l ARN Watson et Crick (1953) 9... l ADN et l ARN 10... l ADN et l ARN l ADN et l ARN sont des structures linéaires de 4 types de nucléotides l ADN et l ARN sont des structures linéaires de 4 types de nucléotide Un nucléotide est composé de 3 parties (Fig. A) : une base, un sucre et un groupe de phosphate Une nucléotide est composé de 3 parties (Fig. A) : une base, un sucre et un groupe de phosphate La seule différence entre les 4 types est la base : A,T,G et C La seule différence entre les 4 types est la base : A,T,G ou C Les molécules ADN sont des séquences 5 de millions de bases 3 le début de l ADN est annoté par 5 et le fin par 3. 3 - GTAACGGTCA - 5 11 un brin = une séquence de bases 12

... l ADN et l ARN 2... l ADN et l ARN 2 L ADN est constitué de deux brins complémentaires 5 - CATTGCCAGT - 3 3 - GTAACGGTCA - 5 complémentarité renversée L ADN est constitué par deux brins complémentaires Les deux brins sont enroulés et liés par de liaisons hydrogènes (liens faibles) au sein de la structure Les pairs de bases sont toujours entre un pyrimidine et un purine : A-T et C-G L ordre des deux brins est inversé Brin codant/sens Brin non codant/ antisens extérieur: la chaîne principale 13 14... l ADN et l ARN 3 Les question du bio-informaticien L ADN est constitué par deux brins complémentaires Les deux brins sont enroulés et liés par des liaisons hydrogènes (liens faibles) au sein de la structure l ARN est constitué par un seul brin cette molécule peut également se plier dans une structure 3D. les pairs sont maintenant : A-U et C-G Uracil (U) remplace Thymine (T) en ARN!! L ordre des nucléotides dans les séquences est-il aléatoire? S il n est pas aléatoire, est-ce qu on peut prédire la fonction et la structure en utilisant la séquence? Est-ce qu on peut trouver des autres séquences qui ressemblent des séquences/ structures connues? 15 16

le dogme central de la biologie moléculaire... l ADN et l ARN 4 La réplication de l ADN Pendant la division de la cellule, les deux brin de l ADN sont séparés Les gènes sont traduit en protéines en deux étapes Chaque brin sert comme un plan pour la production d un brin complémentaire étape 1 : transcription Des parties de l ADN sont copiées dans des séquences plus courts = ARN messager (ARNm) taux d erreurs = 1 sur 109 bases étape 2 : traduction l information génétique est préservé Le ARNm est traduit par le ARN-polymérase dans une séquence d acides aminées = protéines 17 18 La transcription L ARNm est un brin complémentaire d un des brins de l ADN Video sur la transcription et la traduction on prend le brin non codant (antisens) de l ADN Le nombre d ARNm dans la cellule = le niveau d expression d un gène RNA 5 - CAUUGCCAGU - 3 (ARN messager) DNA 3 - GTAACGGTCA - 5 (brin non codant) 19 20

La traduction La traduction 2 Traduction de l ARNm dans protéines en utilisant les ARN de transfert (ARNt) ARNm est lu trois nucléotides à la fois (codon) Le ribosome commence au 5 et bouge dans la direction du 3 Il attrape des molécules ARNt qui peuvent s associer aux codons de l ARNm. 4 3 possibilités = 64 codons seulement 20 acides aminés La traduction est faite par le ribosome Le code génétique est dégénéré Les acides aminés liés au ARNt, se lieront à la séquence existante Les codons ne se superposent pas 21 22 Le code génétique Le code génétique 2 RNA 5 - CAU UGC CAG U - 3 (ARN messager) Protein - His Cys Gln... Comme les codons ne se superposent pas, on a trois possibilités de départ pour la traduction (reading frames) Dans la majorité des cas, la traduction commence au codon AUG = M (ethionine) Un code dégéneré 23 24

Contrôle de la production des protéines Les questions du bio-informaticien Un gène est la partie de l ADN qui code pour une protéine. En pratique, on définit parfois le gène comme la combinaison entre la partie codante et la région de contrôle région de contrôle gène Pour lancer la transcription l ARNpolymérase se lie aux régions de contrôle Est-ce qu on peut détecter les régions de contrôle dans l ADN? Est-ce qu il existe une préférence pour certaines combinaisons de nucléotides dans les régions de contrôle? Quelles sont les motifs qui indiquent le début et la fin de la région codante? 25 26 Contrôle de la production des protéines 2 Prokaryotes Signal de départ : séquences de consensus à la position -10 : TATAAT à la position -35 : TTGACA Plus la liaison est forte entre l ARN-polymérase, plus la transcription du gène est fréquente Contrôle de la production des protéines 3 Signal de départ : séquences de consensus à la position -25 : TATA reconnu par la TATA binding protein (TBP) 3 types de RNA-polymerase. Le type II est responsable pour la transcription de ARNm. Eukaryotes plusieurs sites de liaison pour autres protéines qui peuvent lancer ou réprimer la transcription Signal d'arrêt : deux petites séquences complémentaires qui peuvent interagir comme les deux brins de l ADN (contient plusieurs CG pairs) la variation des régions de promoteurs est plus grande Signales d'arrêt : la séquence AAUAAAA produits une séparation 10-30 bases après le signal 27 28

Contrôle de la production des protéines 4 Dans les eukaryotes les ARN produits par la transcription sont modifiés avant qu ils sont traduits. Les exons (introns) sont des parties de l ADN qui (ne) sont (pas) traduits en acides aminés. Les questions du bio-informaticien Est-ce qu on peut trouver automatiquement les introns et exons? dans le plupart des cas, les introns commencent avec GU et se terminent avec AG Épissage (Splicing) est le mécanisme qui enlève les introns de l ARNm. 29 30 Contrôle de la production des protéines 5 Évolution En prokaryotes il y a aussi une séquence courte pour positionner le ribosome = séquence de Shine-Dalgarno = AGGAGGU En prokaryotes plusieurs gènes pourraient être contrôlés par un seul promoteur = operon Les prokaryotes divergent dans deux groupes distincts Les espèces multicellulaires Toutes les cellules sont dérivées d une cellule commune L analyse des génomes donne de l information sur les relations évolutives entre les espèces 31 32

Évolution 2 Évolution 3 Hérédité = transfert de l information génétique à partir du parent vers la progéniture Quand une cellule se divise, l ADN est copié et partagé entre les deux nouvelles cellules. Parfois, des erreurs (mutations) produites pourraient: Améliorer la fonctionnalité de la cellule = avantage sélective Endommager la fonctionnalité de la cellule = désavantage sélective, peut tuer la cellule Rien change pour la fonctionnalité de la cellule = sélectivement neutre L essai et erreur continu permet à des cellules et à des organismes d évoluer Certaines parties de l ADN évoluent plus facilement que d autres 33 Évolution 4 Les régions non-codantes/non-contrôlées de l ADN Les régions qui sont importantes pour la fonction d une protéine doivent être conservées 34 les questions du bio-informaticien Des nouveaux gènes sont produits à partir des anciens gènes La duplication et le divergence sont deux mécanismes importants pour l évolution des gènes Etant donné un ensemble de séquences, peut-on déterminer leurs relations évolutives? gènes paralog = deux gènes de la même espèce qui ont été produits par la duplication mais qui ont divergé dans leur fonction Si on a deux organismes qui one une ancêtre commune, on peut déterminer les fonction de leurs gènes en utilisant des homologues connues. gènes ortholog = deux gènes de deux espèces différentes qui viennent du même gène héréditaire du dernier ancêtre commun 35 36

Carte II : la structure et la fonction des protéines Objectifs 2 sujets: (jaune) la fonction etc, (bleu) la structure des protéines 37 Discuter l importance des protéines pour la fonction de la cellule Expliquer les différents niveaux dans la structure des protéines Montrer comment les séquences d acides aminés se forment Décrire pourquoi les acides aminés sont les modules essentielles des protéines Expliquer les types de structure secondaire Expliquer le pliage d une protéine Montrer pourquoi la structure est importante pour la fonction d une protéine protéines catalyser de réactions (enzymes), la régulation d expression des gènes (facteurs de transcription), la structure des cellules (cytoskeleton), voies de signalisation,... La majorité des objets dans les cellules sont des protéines Les protéines sont... les modules qui forment la structure de la cellule les robots qui remplissent presque chaque fonction dans la cellule: 38 La structure... La structure d une protéine peut être décrite sur des niveaux différents Le génome humaine contient entre 30000 et 35000 protéines 39 40

... primaire Comme l ADN et l ARN, les protéines sont des séquences de molécules simples = acides aminés hydrophobe Les acides aminés Tous les acides aminés (AA) sont composés de trois parties : le Cα central, groupe d azote, groupe carbone et le groupe de chaîne latérale La différence entre les acides aminés est dans le groupe de chaîne latérale hydrophile 41 42 Les acides aminés 3 Le pliage Les AA sont enchaînés par des liens de peptides Les conformations de la chaîne principale sont limitées pour cette raison on appelle les protéines aussi des polypeptides Angles de torsion La figure de Ramachandran donne les angles qui sont observés en vraies protéines La structure d une protéine est définie par la séquence d acides aminés Les liens de peptide sont planaires. Rotation est permise autour des liens N-C (ϕ) et Cα-C (φ) Seulement les angles ϕ et φ qui ne donnent pas des désaccords sont acceptables 43 44

le pliage 2 le pliage 3 Les hydrophobes sont à l'intérieur et les hydrophiles à l'extérieur Le pliage des protéines est dirigé par 3 types d interactions entre les acides aminés la stabilité de la protéine est déterminée par la force combinée (leur coopération) de toutes les interactions Une séquence d acides aminés se plie dans une conformation avec l énergie le plus bas La structure pliée d une protéine n est pas statique! Elle change tout le temps et la configuration préférée peut changer quand elle est liée à une autre protéine La force de ces interactions est 30-300 fois moins forte que les liens de peptides 45 46 Les questions du bioinformaticien... tertiaire Est-ce qu on peut qualifier de façon précise, la stabilité d une protéine? Est-ce qu on peut prédire la structure des protéines étant donnée la séquence? Est-ce qu on peut grouper les structures des protéines dans des classes différentes? La structure 3D de la protéine pliée est nommé la structure tertiaire On discute ici seulement les protéines globulaires l autre type sont les protéines fibreuses 47 48

Un exemple Évolution La séquence et la structure de Fyn SH2 130 140 150 160 170 180 EARSLTTGET GYIPSNYVAP VDSIQAEEWY FGKLGRKDAE RQLLSFGNPR GTFLIRESQT 190 200 210 220 230 240 TKGAYSLSIR DWDDMKGDHV KHYKIRKLDN GGYYITTRAQ FETLQQLVQH YSERAAGLCC 250 260 270 280 290 300 RLVVPCHKGM PRLTDLSVKT KDVWEIPRES LQLIKRLGNG QFGEVWLGTW NGNTKVAIKT 49 Le nombre de séquences de taille n est immense Seulement une partie de toutes ces protéines a une forme pliée stable Mais (presque) toutes les protéines dans les cellules ont une forme stable? Réponse : La sélection naturelle L évolution par sélection naturelle a éliminé ces types de protéines une protéine avec une structure ou une activité biochimique variable n est pas pertinente pour la survie de la cellule A partir du moment où les protéines sont devenues stables et si elles ont des caractéristiques intéressantes, la structure pourrait évoluer La duplication et la divergence des gènes peuvent créer des protéines avec la même structure mais avec une fonction différente, c.a.d. une préférence d interaction avec d autre protéines (spécificité) Pour ces raisons, les protéines qu on connaît maintenant ont une conformation stable et une fonction bien précise 50 Les familles de protéines 2 La structure des membres d une famille est beaucoup mieux préserver que la séquence d acides aminés famille du Homeodomain Des familles de protéines sont définies par des similarités de séquence et de structure ces deux protéines ont une structure et une séquence similaire mais il ont des activités différentes. estimation de +/- 1 protéine par 1 billion Les familles de protéines 20x20x...x20 = 20n n=300 donne 10390 chaînes Seulement 17 du 60 AA sont les mêmes serine proteases 51 52

les domaines Les protéines peuvent également se composer de multiples pièces globulaire = les domaines les domaines 2 Remuer les domaines est un autre mécanisme d évolution Les domaines peuvent se plier indépendamment Les domaines introduisent de la modularité dans la structure Changer l ordre ou le nombre des domaines dans la structure augmente le nombre et les types d interactions Chaque domaine a sa propre fonctionnalité La taille d un domaine Grandes protéines sont souvent composées de plusieurs domaines L évolution a selectioné des combinaisons de domains pas des domains individuels! 53 54 Les questions du bioinformaticien... secondaire les hélices α les brins β Est-ce qu il y a des régularités structurales dans les structures de protéines? Est-ce qu on peut trouver une relation entre les structures et les acides aminés qui font parties de ces structures? Quand on analyse beaucoup de structures tertiaires, on peut trouver des régularités géométriques. les hélices et brins sont produits par des liaisons hydrogènes entre les groupes NH et CO de la chaîne principale Entre 50-80% des résidus dans une protéine peuvent être classifié en tant qu une de ces structures régulières 55 56

les hélices α et brins β les hélices α et brins β 2 Les liaisons hydrogènes sont entre deux parties différentes de la protéine en rouge, l interaction entre NH en CO Normalement, les interactions sont entre deux résidus séparés par deux autres résidus Certaines acides aminés sont préférés dans les hélices: Ala (A) Glu (E), Leu (L) et Met (M) Les brins β peuvent être organisés parallèlement ou antiparallèlement Pro (P), Gly (G), Tyr (T) er Ser (S) forment peu d hélices La combinaison de quelques brins β = feuille β 57 58 la visualisation de la structure tertiaire les hélices α et brins β 3 les brins β les boucles représentation Cα wire-frame les hélices α Les boucles jouent souvent un rôle important dans la fonction d une protéine représentation ruban 59 space-filling 60

La fonction des protéines... quaternaire La fonction d une protéine est définie par sa structure Les mêmes forces faibles entre les AA pour stabiliser la structure, permettent à une protéine de se lier aux autres structures dans la cellule La majorité des protéines sont composées de deux ou plusieurs unités indépendantes un dimère hemoglobin 2 α et 2 β sousunités Quand une protéine est liée à une autre protéine, il peut exécuter sa fonction biochimique le ligand = petite molécule, macromolécule,... 61 Cette liaison pourrait être faible ou forte, mais la liaison est toujours spécifique La fonction des protéines 2 62 La fonction des protéines 2 Les sites de liaison sont préservés dans des familles de protéines Aux moins 3 formes de liaison SH2 domain Traçage évolutif : Tracer les AA conservés sur la structure du domaine Souvent ces AA qui se regroupent ensemble sur la surface sont reliés au site de liaison Liaison entre la surface et une boucle 63 Création d un coiledcoil entre deux hélices de deux protéines Liaison précise entre deux surfaces (extrêmement spécifique et forte) 64

La fonction des protéines 3 Les molécules se rencontrent aléatoirement Quand il se touche et que les surfaces ne sont pas bien adaptées, l association ne reste pas longtemps le taux d association et de disassociation Les questions du bioinformaticien Beaucoup de méthodes d'apprentissage automatique pourraient être utilisées pour résoudre des questions biomoléculaires Techniques de classification et régression Méthodes de clustering Hidden Markov models Neural networks... 65 66