Bibliographie. Introduction à la bioinformatique. Objectifs. Préambule: Les cellules. Alberts et al, The molecular biology of the cell

Documents pareils
CHAPITRE 3 LA SYNTHESE DES PROTEINES

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

MABioVis. Bio-informatique et la

Séquence 2. L expression du patrimoine génétique. Sommaire

VI- Expression du génome

Univers Vivant Révision. Notions STE

TD de Biochimie 4 : Coloration.

Contrôle de l'expression génétique :

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

1 Culture Cellulaire Microplaques 2 HTS- 3 Immunologie/ HLA 4 Microbiologie/ Bactériologie Containers 5 Tubes/ 6 Pipetage

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

Biomarqueurs en Cancérologie

Structure quantique cohérente et incohérente de l eau liquide

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

ULBI 101 Biologie Cellulaire L1. Le Système Membranaire Interne

Bibliographie Introduction à la bioinformatique

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

Bases moléculaires des mutations Marc Jeanpierre

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr

Hépatite chronique B Moyens thérapeutiques

Module 5 La maturation de l ARN et le contrôle post-transcriptionnel chez les eucaryotes

Conférence technique internationale de la FAO

2 C est quoi la chimie?

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

MYRIAD. l ADN isolé n est à présent plus brevetable!

1 les caractères des êtres humains.

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

L universalité et la variabilité de l ADN

Identification de nouveaux membres dans des familles d'interleukines

Les débuts de la génétique

Université d Evry-Val d Essonne Ecole Doctorale des Génomes Aux Organismes. Thèse

Génétique et génomique Pierre Martin

TP N 3 La composition chimique du vivant

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Production d une protéine recombinante

ACIDES BASES. Chap.5 SPIESS

1.2 Coordinence. Notion de liaison de coordinence : Cas de NH 3. et NH 4+ , 3 liaisons covalentes + 1 liaison de coordinence.

Bases de données et outils bioinformatiques utiles en génétique

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

Big data et sciences du Vivant L'exemple du séquençage haut débit

INTRODUCTION À L'ENZYMOLOGIE

Les OGM. 5 décembre Nicole Mounier

UE6 - Cycle de vie du médicament : Conception rationnelle

Transport des gaz dans le sang

Transport des gaz dans le sang

Resolution limit in community detection

Système immunitaire artificiel

Introduction à la Génomique Fonctionnelle

Compléments - Chapitre 5 Spectroscopie

CHAPITRE 3 LES TASQ COMME PLATEFORME POUR LA CATALYSE PSEUDO-ENZYMATIQUE

Insulinothérapie et diabète de type 1

Conception de Médicament

5.5.5 Exemple d un essai immunologique

Cellules procaryotes Service histologie Pr.k.mebarek

CHAPITRE VI : HYBRIDATION GEOMETRIE DES MOLECULES

Biochimie I. Extraction et quantification de l hexokinase dans Saccharomyces cerevisiae 1. Assistants : Tatjana Schwabe Marcy Taylor Gisèle Dewhurst

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

TP3 Test immunologique et spécificité anticorps - déterminant antigénique

Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux

Annales de Biologie Cellulaire QCM (niveau SVT 1 er année)

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

COURS COLLÉGIAUX PRÉALABLES À L ADMISSION

Partie Observer : Ondes et matière CHAP 04-ACT/DOC Analyse spectrale : Spectroscopies IR et RMN

Gènes Diffusion - EPIC 2010

Séquence 1. Reproduction conforme de la cellule et réplication de l ADN Variabilité génétique et mutation de l ADN

I. La levure Saccharomyces cerevisiae: mode de vie

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

Logiciel Libre Cours 3 Fondements: Génie Logiciel

Base de données bibliographiques Pubmed-Medline

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :

Extraction d information des bases de séquences biologiques avec R

Partie 1. Addition nucléophile suivie d élimination (A N + E) 1.1. Réactivité électrophile des acides carboxyliques et groupes dérivés

Les tests génétiques à des fins médicales

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

Luca : à la recherche du plus proche ancêtre commun universel Patrick Forterre, Simonetta Gribaldo, Céline Brochier

Infolettre #18 : Les graphiques avec Excel 2010

Dr Pascale Vergne-Salle Service de Rhumatologie, CHU de Limoges. Membre enseignant chercheur EA 4021

Depuis des milliers de générations, le ver à soie est l objet d une sélection

Séquence 4. La nature du vivant. Sommaire. 1. L unité structurale et chimique du vivant. 2. L ADN, support de l information génétique

- pellicule de fruits qui a un rôle de prévention contre l'évaporation, le développement de moisissures et l'infection par des parasites

EXERCICE II. SYNTHÈSE D UN ANESTHÉSIQUE : LA BENZOCAÏNE (9 points)

Compétence 3-1 S EXPRIMER A L ECRIT Fiche professeur

Justine Ludi. HEAD Genève

Les outils de génétique moléculaire Les techniques liées aux acides nucléiques

THEME 2. LE SPORT CHAP 1. MESURER LA MATIERE: LA MOLE

Glossaire des nombres

Introduction aux bases de données: application en biologie

Chapitre 4 - Spectroscopie rotationnelle


GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Chapitre III Le phénotype immunitaire au cours de la vie

Charger une structure Comment ouvrir un fichier avec VMD? Comment charger un fichier PDB directement depuis la Protein Data Bank? Comment charger un

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

Transcription:

Introduction à la bioinformatique 2. Fondation moléculaire en 66 transparants et 2 vidéos Bibliographie Alberts et al, The molecular biology of the cell Zvelebil et Baum, Understanding bioinformatics (p3. - 44) 1 2 Objectifs Expliquez la structure de l ADN et l ARN Expliquez le dogme de la biologie moléculaire Expliquez le rôle de l ARNm Expliquez comment l ARNm est traduit en protéine Expliquez comment l expression de gènes est contrôlée Montrez comment les introns sont enlevés de l ARNm Récapitulez comment l évolution se produit Préambule: Les cellules L unité fondamentale de la vie Toutes les cellules partagent les mêmes mécanismes Les cellules produisent d autres cellules en passant l information nécessaire pour reconstruire toutes les fonctions (hérédité) Les cellules traitent l information comme des ordinateurs nourriture, survie,.. 3 4

Préambule: Les cellules 2 Deux grandes classes de cellules La structure interne des cellules eukaryotes est plus complexe Préambule: Les cellules 3 Toute l information est encodée par une structure spécifique : l ADN Acide deoxyribonucleique L information d un type de cellule peut être traiter par des autres types de cellules. L ADN fait partie d un chromosome L ADN contient l information pour produire des milliers de protéines (1% du génome) les prokaryotes n ont pas un noyau. un gène est une partie de l ADN qui correspond à une seule protéine. le génome est l ensemble des molécules d ADN. 5 6 Préambule: Les cellules 4 Préambule: Les cellules 5 Organisme Année Taille (Mb) Mycoplasma genitalium 1995 0,6 L homme a 46 molécules d ADN dans chaque cellule organisées dans les chromosomes Dans les bactéries, il y a un seul chromosome circulaire Haemophilus influenzae 1995 1,8 Escherichia coli 1997 4,6 Saccharomyces cerevisiae 1996 12 Schizosaccharomyces pombe 2002 14 Caenorhabditis elegans 1998 97 Arabidopsis thaliana 2001 120 Oryza sativa 2002 5 000 Drosophila melanogaster 2000 180 Galus Galus 2004 1 200 Rattus Norvegicus 2004 2 900 Mus musculus 2002 3 400 Homo sapiens 2001 3 400 1Mb = 1000000 bases La taille des génomes 7 8

La structure de... Carte 1: le monde de l ADN ADN (acide deoxyribonucléique) ARN (acide ribonucléique) 4 sujets: (jaune) régulation des gènes, (bleu) la traduction des gènes, (noir) l évolution et (rouge) la structure de l ADN et de l ARN Watson et Crick (1953) 9 10... l ADN et l ARN... l ADN et l ARN l ADN et l ARN sont des structures linéaires qui sont composées de 4 types de nucléotides l ADN et l ARN sont des structures linéaires qui sont composées de 4 types de nucléotides Un nucléotide est composé de 3 parties (Fig. A) : une base, un sucre et un groupe phosphate La seule différence entre les 4 types est la base : A,T,G et C Une nucléotide est composé de 3 parties (Fig. A) : une base, un sucre et un groupe de phosphate La seule différence entre les 4 types est la base : A,T,G ou C Les molécules ADN sont des séquences 5 de millions de bases 3 le début de l ADN est annoté par 5 et le fin par 3. 3 - GTAACGGTCA - 5 11 un brin = une séquence de bases 12

... l ADN et l ARN 2... l ADN et l ARN 2 L ADN est composé de deux brins complémentaires 5 - CATTGCCAGT - 3 3 - GTAACGGTCA - 5 complémentarité renversée L ADN est composé de deux brins complémentaires Les deux brins sont enroulés et liés par de liaisons hydrogènes (liens faibles) au sein de la structure Les pairs de bases sont toujours entre un pyrimidine et un purine : A-T et C-G L ordre des deux brins est inversé Brin codant/sens Brin non codant/ antisens extérieur: la chaîne principale 13 14... l ADN et l ARN 3 Les question du bio-informaticien L ADN est constitué par deux brins complémentaires Les deux brins sont enroulés et liés par des faibles) au sein de la structure l ARN est constitué par un seul brin cette molécule peut également se plier dans une structure 3D. les pairs sont maintenant : A-U et C-G Uracil (U) remplace Thymine (T) en ARN!! L ordre des nucléotides dans les séquences est-il aléatoire? S il n est pas aléatoire, est-ce qu on peut prédire la fonction et la structure en utilisant la séquence? Est-ce qu on peut trouver des autres séquences qui ressemblent des séquences/ structures connues? 15 16

le dogme central de la biologie moléculaire Les gènes sont traduit en protéines en deux étapes La réplication de l ADN Pendant la division de la cellule, les deux brin de l ADN sont séparés Chaque brin sert comme un plan pour la production d un brin complémentaire étape 1 : transcription... l ADN et l ARN 4 Des parties de l ADN sont copiées dans des séquences plus courts = ARN messager (ARNm) taux d erreurs = 1 sur 109 bases étape 2 : traduction l information génétique est préservé Le ARNm est traduit par le ARN-polymérase dans une séquence d acides aminées = protéines 17 18 La transcription L ARNm est un brin complémentaire d un des brins de l ADN Video sur la transcription et la traduction on prend le brin non codant (antisens) de l ADN Le nombre d ARNm dans la cellule = le niveau d expression d un gène RNA 5 - CAUUGCCAGU - 3 (ARN messager) DNA 3 - GTAACGGTCA - 5 (brin non codant) 19 20

La traduction La traduction 2 Traduction de l ARNm en protéines en utilisant les ARN de transfert (ARNt) ARNm est lu trois nucléotides à la fois (codon) 43 possibilités = 64 codons seulement 20 acides aminés La traduction est faite par le ribosome Le code génétique est dégénéré Le ribosome commence au 5 et bouge dans la direction du 3 Il attrape des molécules ARNt qui peuvent s associer aux codons de l ARNm. Les acides aminés liés au ARNt, se lieront à la séquence existante Les codons ne se superposent pas 21 22 Le code génétique RNA 5 - CAU UGC CAG U - 3 (ARN messager) Protein - His Cys Gln... Le code génétique 2 Comme les codons ne se superposent pas, on a trois possibilités de départ pour la traduction (reading frames) Dans la majorité des cas, la traduction commence au codon AUG = M(ethionine) Un code dégéneré 23 24

Contrôle de la production des protéines Un gène est la partie de l ADN qui code pour une protéine. En pratique, on définit parfois le gène comme la combinaison entre la partie codante et la région de contrôle région de contrôle gène Pour lancer la transcription l ARNpolymérase se lie aux régions de contrôle Les questions du bio-informaticien Est-ce qu on peut détecter les régions de contrôle dans l ADN? Est-ce qu il existe une préférence pour certaines combinaisons de nucléotides dans les régions de contrôle? Quelles sont les motifs qui indiquent le début et la fin de la région codante? 25 Contrôle de la production des protéines 2 Prokaryotes Signal de départ : séquences de consensus à la position -10 : TATAAT à la position -35 : TTGACA Plus la liaison est forte entre l ARN-polymérase, plus la transcription du gène est fréquente 26 Contrôle de la production des protéines 3 Signal de départ : séquences de consensus à la position -25 : TATA reconnu par la TATA binding protein (TBP) 3 types de RNA-polymerase. Le type II est responsable pour la transcription de ARNm. Eukaryotes plusieurs sites de liaison pour autres protéines qui peuvent lancer ou réprimer la transcription Signal d'arrêt : deux petites séquences complémentaires qui peuvent interagir comme les deux brins de l ADN (contient plusieurs CG pairs) la variation des régions de promoteurs est plus grande Signales d'arrêt : la séquence AAUAAAA produits une séparation 10-30 bases après le signal 27 28

Contrôle de la production des protéines 4 Dans les eukaryotes les ARN produits par la transcription sont modifiés avant qu ils sont traduits. Les exons (introns) sont des parties de l ADN qui (ne) sont (pas) traduits en acides aminés. Les questions du bio-informaticien Est-ce qu on peut trouver automatiquement les introns et exons? dans le plupart des cas, les introns commencent avec GU et se terminent avec AG Épissage (Splicing) est le mécanisme qui enlève les introns de l ARNm. 29 Contrôle de la production des protéines 5 En prokaryotes il y a aussi une séquence courte pour positionner le ribosome = séquence de Shine-Dalgarno = AGGAGGU En prokaryotes plusieurs gènes pourraient être contrôlés par un seul promoteur = operon Les prokaryotes se partagent dans deux groupes distincts 30 Évolution Les espèces multicellulaires Toutes les cellules sont dérivées d une cellule commune L analyse des génomes donne l information concernant les relations évolutives entre les espèces 31 32

Évolution 2 Hérédité = transfert de l information génétique à partir du parent vers la progéniture Quand une cellule se divise, l ADN est copié et partagé entre les deux nouvelles cellules. Parfois, des erreurs (mutations) produites pourraient: Améliorer la fonctionnalité de la cellule = avantage sélective Endommager la fonctionnalité de la cellule = désavantage Évolution 3 trial and error permet à des cellules et à des organismes d évoluer Certaines parties de l ADN évoluent plus facilement que d autres Les régions non-codantes/non-contrôlées de l ADN Les régions qui sont importantes pour la fonction d une protéine doivent être conservées sélective, peut tuer la cellule Changer rien dans la fonctionnalité de la cellule = sélectivement neutre 33 34 Évolution 4 les questions du bio-informaticien Des nouveaux gènes sont produits à partir des anciens gènes La duplication et le divergence sont deux mécanismes importants pour l évolution des gènes gènes paralog = deux gènes de la même espèce qui ont été produits par la duplication mais qui ont divergé dans leur fonction Etant donné un ensemble de séquences, peut-on déterminer leurs relations évolutives? Si deux organismes ont une ancêtre gènes ortholog = deux gènes de deux espèces différentes qui viennent du même gène héréditaire du dernier ancêtre commun 35 commune, on peut déterminer les fonction de leurs gènes en utilisant les homologues connues. 36

Carte 1: le monde de l ADN 4 sujets: (jaune) régulation des gènes, (bleu) la traduction des gènes, (noir) l évolution et (rouge) la structure de l ADN et de l ARN Carte II : la structure et la fonction des protéines 2 sujets: (jaune) la fonction etc, (bleu) la structure des protéines 37 38 Objectifs protéines Discuter l importance des protéines pour la fonction de la La majorité des objets dans les Décrire pourquoi les acides aminés sont les modules Les protéines sont... les modules qui forment la cellule cellules sont des protéines Expliquer les différents niveaux dans la structure des protéines essentielles des protéines Montrer comment les séquences d acides aminés se forment Expliquer les types de structure secondaire Expliquer le pliage d une protéine Montrer pourquoi la structure est importante pour la fonction d une protéine 39 structure de la cellule catalyser de réactions (enzymes), la régulation d expression des gènes (facteurs de transcription), la structure des cellules (cytoskeleton), voies de signalisation,... les robots qui remplissent presque chaque fonction dans la cellule: Le génome humaine contient entre 25000 et 35000 protéines différentes 40

La structure...... primaire La structure d une protéine peut être décrite sur des niveaux différents Comme l ADN et l ARN, les protéines sont des séquences de molécules simples = acides aminés hydrophobe hydrophile 41 42 Les acides aminés Tous les acides aminés (AA) sont composés de trois parties : le Cα central, groupe d azote, groupe carbone et la chaîne latérale La différence entre les acides aminés est dans la chaîne latérale Les acides aminés 3 Les AA sont enchaînés par des liens peptidiques pour cette raison on appelle les protéines aussi des polypeptides La structure d une protéine est définie par la séquence d acides aminés 43 44

Le pliage Les conformations de la chaîne principale sont limitées Angles de torsion La figure de Ramachandran donne les angles qui sont observés en vraies protéines le pliage 2 Les hydrophobes sont à l'intérieur et les hydrophiles à l'extérieur Les liens peptidiques sont planaires. Rotation est permise autour les liens N-C (ϕ) et Cα-C (φ) Seulement les angles ϕ et φ qui ne donnent pas des désaccords sont acceptables Une séquence d acides aminés se plie dans une conformation avec l énergie le plus bas La structure pliée d une protéine n est pas fixed! Elle change tout le temps et la configuration préférée peut changer quand elle est liée à une autre protéine 45 46 le pliage 3 Le pliage des protéines est dirigé par 3 types d interactions entre les acides aminés La force de ces interactions est 30-300 fois moins forte que les liens peptidiques la stabilité de la protéine est déterminée par la force combinée (leur coopération) de toutes les interactions Les questions du bioinformaticien Est-ce qu on peut quantifier correctement la stabilité d une protéine? Est-ce qu on peut prédire la structure des protéines étant donnée la séquence? Est-ce qu on peut grouper les structures des protéines dans des classes différentes? 47 48

... tertiaire Un exemple La séquence et la structure de Fyn SH2 On discute ici seulement les protéines globulaires 130 140 150 160 170 180 EARSLTTGET GYIPSNYVAP VDSIQAEEWY FGKLGRKDAE RQLLSFGNPR GTFLIRESQT l autre type sont les protéines fibreuses 190 200 210 220 230 240 TKGAYSLSIR DWDDMKGDHV KHYKIRKLDN GGYYITTRAQ FETLQQLVQH YSERAAGLCC La structure 3D de la protéine pliée est nommé la structure tertiaire 49 50 Évolution Les familles de protéines 20x20x...x20 = 20n n=300 donne 10390 chaînes Le nombre de séquences de taille n est immense Seulement une partie de toutes ces protéines a une forme pliée stable 250 260 270 280 290 300 RLVVPCHKGM PRLTDLSVKT KDVWEIPRES LQLIKRLGNG QFGEVWLGTW NGNTKVAIKT estimation de +/- 1 protéine par 1 billion A partir du moment où les protéines sont devenues stables et si elles ont des caractéristiques intéressantes, la structure pourrait évoluer La duplication et la divergence des gènes peuvent créer des protéines avec la même structure mais avec une fonction différente, c.a.d. une préférence d interaction avec d autre protéines (spécificité) Mais (presque) toutes les protéines dans les cellules ont une forme stable? Réponse : La sélection naturelle L évolution par sélection naturelle a éliminé ces types protéines qu on connaît maintenant ont une de protéines une protéine avec une structure ou une activité biochimique variable n est pas pertinente pour la survie de la cellule Pour ces raisons, les conformation stable et une fonction bien précise 51 Des familles de protéines sont définies par des similarités de séquence et de structure ces deux protéines ont une structure et une séquence similaire mais il ont des activités différentes. serine proteases 52

Les familles de protéines 2 La structure des membres d une famille est beaucoup mieux préserver que la séquence d acides aminés famille du Homeodomain les domaines Les protéines peuvent également se composer de multiples pièces globulaire = les domaines Les domaines peuvent se plier indépendamment Les domaines introduisent de la modularité dans la structure Seulement 17 du 60 AA sont les mêmes Chaque domaine a sa propre fonctionnalité La taille d un domaine Grandes protéines sont souvent composées de plusieurs domaines 53 54 les domaines 2 Les questions du bioinformaticien Réutiliser les domaines est un autre mécanisme d évolution Changer l ordre ou le nombre des domaines dans la structure augmente le nombre et les types d interactions L évolution a selectioné des combinaisons de domains pas des domains individuels! Est-ce qu il y a des régularités structurales dans les structures de protéines? Est-ce qu on peut trouver une relation entre les structures et les acides aminés qui font parties de ces structures? 55 56

... secondaire les hélices α et brins β les hélices α les brins β Quand on analyse beaucoup de structures tertiaires, on peut trouver des régularités géométriques. en rouge, l interaction entre NH en CO les hélices et brins sont produits par des liaisons hydrogènes entre les groupes NH et CO de la chaîne principale Entre 50-80% des résidus dans une protéine peuvent être classifié en tant qu une de ces structures régulières Normalement, les interactions sont entre deux résidus séparés par deux autres résidus Certaines acides aminés sont préférés dans les hélices: Ala (A) Glu (E), Leu (L) et Met (M) Pro (P), Gly (G), Tyr (T) er Ser (S) forment peu d hélices 57 58 les hélices α et brins β 2 Les liaisons hydrogènes sont entre deux parties différentes de la protéine La combinaison de quelques brins β = feuille β les hélices α et brins β 3 les brins β les boucles Les brins β peuvent être organisés parallèlement ou antiparallèlement les hélices α Les boucles jouent souvent un rôle important dans la fonction d une protéine 59 60

la visualisation de la structure tertiaire... quaternaire représentation Cα wire-frame La majorité des protéines sont composées de deux ou plusieurs unités indépendantes un dimère représentation ruban hemoglobin 2 α et 2 β sousunités space-filling 61 62 La fonction des protéines La fonction des protéines 2 La fonction d une protéine est définie par sa structure Les sites de liaison sont préservés dans des familles de protéines Les mêmes forces faibles entre les AA pour stabiliser la structure, permettent à une protéine de se lier aux autres structures dans la cellule le ligand = petite molécule, macromolécule,... Quand une protéine est liée à une autre protéine, il peut exécuter sa fonction biochimique 63 Cette liaison pourrait être faible ou forte, mais la liaison est toujours spécifique SH2 domain Traçage évolutif : Tracer les AA conservés sur la structure du domaine Souvent ces AA qui se regroupent ensemble sur la surface sont reliés au site de liaison 64

Aux moins 3 formes de liaison La fonction des protéines 2 La fonction des protéines 3 Les molécules se rencontrent aléatoirement le taux d association et de disassociation Liaison entre la surface et une boucle Création d un coiledcoil entre deux hélices de deux protéines Liaison précise entre deux surfaces (extrêmement spécifique et forte) Quand il se touche et que les surfaces ne sont pas bien adaptées, l association ne reste pas longtemps 65 66 Les questions du bioinformaticien Beaucoup de méthodes d'apprentissage automatique pourraient être utilisées pour résoudre des questions biomoléculaires Techniques de classification et régression Méthodes de clustering Hidden Markov models Neural networks... 67