Cours en ligne. Paris 5. Pasteur. ABI Marseille.

Dimension: px
Commencer à balayer dès la page:

Download "Cours en ligne. Paris 5. Pasteur. ABI Marseille. http://www.dsi.univ-paris5.fr/bio2/autof2/accueil2.htm"

Transcription

1 Cours en ligne Paris 5 Pasteur ABI Marseille

2 Gestion des informations génétiques Séquençage massif de chromosomes complets: information utilisable??? Annotation des banques Structures en retard par rapport aux séquences Pas de banque totalisant toutes les informations sur une séquence

3 Bases bibliographiques Banques de données Bases de séquences Généralistes Spécialisées Bases de structures & domaines Banque = collecte des donnés exhaustive; hétérogènes Base = données homogènes (technique, espèce); valeur ajoutée

4 Banques de séquences Acides nucléiques : Format commun depuis 1990 EMBL (puis EBI) début 1980 : ADN Genbank, Los Alamos puis NCBI DDBJ (Japon) Protéines : PIR = NBRF (National Biomedical Research Foundation) + MIPS (Martinsried Institute for Protein Sequences) + JIPID (Japan International Protein Infromation Database) SwissProt = séquences annotées PIR-NBRF + séquences codantes traduites d EMBL Uniprot = PIR+SP+TREMBL

5 Qualité données Information présente des lacunes Manque de vérifications systématiques des données soumises ou saisies, surtout pour les séquences anciennes Maintenant nombreuses vérifications systématiquement dès la soumission de la séquence On peut signaler aux responsables les erreurs dans les banques

6 Qualité données Recherche de psuedo dans EMBL avec SRS

7 Banques généralistes Projets internationaux Indispensables à la communauté scientifique : données, résultats essentiels (certains ne sont plus dans la littérature, les noms changent) Principale mission = rendre publiques les séquences Bibliographie et expertise biologique liées aux séquences Organisation en rubriques ou champs; références croisées Pas de vérification pour les séquences anciennes Décalage entre dépôt et mise en ligne d une séquence

8 EMBL Panda Group (Protein And Nucleotide EBI This morning the EMBL Database contained 236,378,259,855 nucleotides in 146,771,148 entries Breakdown by entry type Entry Type Entries Standard Constructed (CON) 2,595,559 Third Party Annotation (TPA) 6,008 Whole Genome Shotgun (WGS) 46,934,174

9 EMBL

10 Croissance des entrées de la banque EMBL

11 EMBL: nombre de nucléotides

12 EMBL

13 EMBL Entrée Polydom souris

14 EMBL

15 SWISS-PROT Amos Bairoch. Department of Medical Biochemistry of the University of Geneva & EMBL Release 56.3 of 14-Oct-08 of UniProtKB/Swiss-Prot contains sequence entries, comprising amino acids abstracted from references

16 SWISS-PROT Distribution des longueurs Répartition des entrées

17 SWISS-PROT

18 SWISS-PROT Nombre d entrées dans SP Nombre d entrées humaines dans SP

19 SWISS-PROT Croissance des banques de séquence beaucoup plus rapide que celle des banques de structures Taux de nouveaux repliements

20 PDB PDB: protéines en 2008

21 SWISS -PROT

22 SWISS -PROT Plusieurs noms possibles

23 SWISS -PROT

24 SWISS -PROT

25 Noms En biologie, les noms des protéines ne sont pas stabilisés: évoluent avec le temps Une protéine peut avoir plusieurs fonctions

26 Synonymes Interleukine 6 D après Robert Nitsch Interferon β2 B cell differentiation factor B cell stimulatory factor 2 Hepatocyte stimulatory factor Hibridoma growth factor Plasmocytoma growth factor Dans la SwissProt IL-1F6 Interleukin-1 epsilon IL-1 epsilon FIL1 epsilon

27 UNIPROT

28 UNIPROT

29 UNIPROT Polydom

30 Motifs Motifs consensus (patterns) : Prosite = dictionnaire qui recense les motifs protéiques ayant une signification biologique Régions provenant d un alignement multiple: Block ou PRINTS PROSITE BLOCKS PRINTS

31 Prosite Banque de motifs Motif = signatures protéiques liées à une fonction bio Correspond à un consensus en certaines positions et/ou à une caractéristique structurale permettant de caractériser une famille protéique Expertise par un réseau de correspondants spécialisés (par fonction) Révision régulière (noms des protéines ont une histoire) Interrogeable par protéine ou par motif : fournit motif ou famille

32 1enh Homeodomain

33 PROSITE

34 PROSITE

35 PROSITE motif en séquence

36 Blocks Détecte et assemble les régions conservées de protéines apparentées Détection par alignement multiples et séparation en blocs de séquences Block = superposition de segments protéiques très similaires sans indel

37 BLOCKS 1enh

38 BLOCKS 1enh

39 PRINTS Fingerprints (Empreintes) groupes de motifs extraits d alignements multiples de séquences Signatures d une famille protéique PRINTS-BLAST : Permet de rechercher un motif de la banque PRINTS avec le logiciel BLAST

40 PRINTS What is a fingerprint? fingerprint motif annotation PRINTS

41 PRINTS TM domain loop region TM domain

42 PRINTS 1enh

43 PRINTS 1enh

44 Séquence et Structure ne sont pas sur un même bateau Biosphère = 10 n séquences, avec n voisin de 12 Nombre de repliements (architectures) différents : 10 3 Deux séquences voisines se replient en deux structures voisines Deux structures voisines peuvent porter des séquences très différentes

45 1D Passage séquence structure Domaine 3D?

46 Banques 3D

47 Banque de structures

48 PDB

49 PDB

50 PDB

51 PDB Taux de nouveaux repliements décrits annuellement

52 Fichier PDB Coordonnées atomiques disponibles dans une banque de structures, la Protein Data Bank HEADER DNA-BINDING PROTEIN 20-MAY-94 1ENH 1ENH 2 COMPND ENGRAILED HOMEODOMAIN 1ENH 3 SOURCE (DROSOPHILA MELANOGASTER) RECOMBINANT FORM EXPRESSED IN 1ENH 4 SOURCE 2 (ESCHERICHIA COLI) 1ENH 5 AUTHOR N.D.CLARKE,C.R.KISSINGER,J.DESJARLAIS,G.L.GILLILAND,C.O.PABO 1ENH 6 REVDAT 1 31-AUG-94 1ENH 0 1ENH 7 SCALE ENH 61 ATOM 1 N ARG ENH 62 ATOM 2 CA ARG ENH 63 ATOM 3 C ARG ENH 64 ATOM 4 O ARG ENH 65 ATOM 5 CB ARG ENH 66 ATOM 6 CG ARG ENH 67 ATOM 7 CD ARG ENH 68 ATOM 8 NE ARG ENH 69 ATOM 9 CZ ARG ENH 70 ATOM 10 NH1 ARG ENH 71 ATOM 11 NH2 ARG ENH 72

53 Fichier PDB Pas d information explicite sur les liaisons entre atomes : c est déterminé par le calcul des distances interatomiques Pas d information sur la charge des atomes: peut être calculé

54

55 Coordonnées internes Indépendantes du référentiel

56 Coordonnées internes

57 Coordonnées internes et absolues Coordonnées internes: au pont, tourner à droite, puis suivre tout droit pendant 500 mètres, tourner à gauche, et continuer pendant 600 mètres Coordonnées absolues : N W

58 Coordonnées internes et absolues

59 Coordonnées internes et absolues

60 Classification structurale CATH Class, Architecture, Topology, Homology SCOP Structural Classification of Proteins DALI Structural Classification of Proteins PDBSUM Attribution des structures secondaires à partir du code PDB

61 Taxinomie structurale CATH CLASSES alpha (principalement hélices); pas tout alpha beta (principalement brins) alpha+beta, dissociation des domaines α et β alpha/beta, alternance, unités βαβ few, séquence courte, stabilisation non effectuée par les SSR mais par les ponts disulfure Consensus de 3 méthodes automatiques de délimitations de domaines, le reste manuellement Homologie définie à partir de l identité de séquences

62 Examples of protein architecture Architecture refers to the arrangement and orientation of SSEs, but not to the connectivity. β-sheet with all pairs of strands parallel β-sheet with all pairs of strands anti-parallel

63 Examples of protein topology Topology refers to the manner in which the SSEs are connected. Two β-sheets (all parallel) with different topologies.

64 CATH

65 Roue CATHerine Rose :Alpha Jaune : Beta Vert : Alpha-beta

66 PDBSUM

67 PDBSUM

68 SCOP Classes : comme CATH Repliements : même repliement si même arrangement des SSR et même connexion topologique (cœur commun + éléments de structures secondaires périphériques + régions de turns qui diffèrent en taille et en conformation) Superfamilles : identités de séquence faibles; détails structuraux et fonction suggèrent ancêtre commun Familles : relations évolutives par similitudes de séquence significatives, ou similitudes structure et fonction Essentiellement manuel

69

70 SCOP 1 - Classe: caractéristiques globales, pas de relation évolutive 2 - Repliement: topologie similaire. Cousins éloignés d un point de vue évolutif? 3 - Superfamille : homologie structurale claire 4 - Famille: homologie de séquence claire 5 - Protéine : identité fonctionnelle 6 - Espèces : séquences uniques

71 SCOP Repliements tout alpha Repliements tout beta Repliements alpha/beta Repliements alpha+beta Multi domaines Protéines membranaires Petites protéines Total de repliements

72 DALI Méthode automatique (réseau de neurones et tri hiérarchique) : identifie dans une première étape les similitudes structurales: carte de l espace des repliements (ressemblance structurale suffisante pour opérer les différences entre repliements) Autre critère pour définir les superfamilles : déduit des propriétés fonctionnelles Dietman (2001) NSB 8:953

73 DALI Cercles épais = repliements ; déduits des similitudes structurales Dietman (2001) NSB 8:953

74 DALI Attribution des superfamilles à partir des fonctions Dietman (2001) NSB 8:953

75 Consensus des classes SCOP considéré comme standard, en absence d homologie avec un autre domaine, classification manuelle CATH = consensus de 3 méthodes automatiques de délimitations de domaines, le reste manuellement. Homologie définie à partir de l identité de séquences. Dali = définition des domaines entièrement automatique (repose sur l algorithme PUU) Statistiques du nombre de chaînes, de domaines tels que définis par SCOP, CATH et Dali Day Prot Sci (2003) 12:2150

76 Domaines

77 Domaines globulaires Une chaîne polypeptidique peut comprendre plusieurs domaines, parfois appelés lobes, comme dans la Béta galactosidase. Un domaine est défini par ses caractéristiques 3D de compacité. Il ne correspond pas nécessairement à une continuité dans la séquence. Il peut y avoir une fonction par domaine.

78 Fibronectine Code PDB : 1fnh Liaison aux surfaces cellulaires et à la fibronectine, l héparine, l actine...

79 80% domaines = segments contigu d une seule chaîne Parfois insertion d un domaine dans un autre (parent) Domaine type thioredoxine inséré (rouge) dans un domaine parent (bleu) : 1qmhA

80 Polydom Pentraxin (PTX) complement control protein (CCP) epidermal growth factor (EGF) von willebrand factor A (VWA) AF206329

81 SUSHI Intégré à la membrane Régulation négative de l activation du complément Protéine de liaison au complément

82 Banques de domaines PRODOM SMART PFAM Interpro

83 Domaines Q9ES77_MOUSE InterPro

84 InterPro 1enh

85 InterPro 1enh

86 PRODOM 1enh représentation graphique

87 PRODOM 1enh alignement De la famille

88 PRODOM 1enh arbre phylogénique

89 SMART 1enh

90

91 SMART 1enh

92 PFAM 1enh

93 PFAM 1enh

94 PFAM 1enh

95 PFAM 1enh

96 PFAM 1enh

97 Génomes complets

98 EnsEMBL

99 EnsEMBL

100 EnsEMBL 1enh

101 EnsEMBL 1enh

102 EnsEMBL 1enh

103 Banques spécialisées CAZy HIV A. Thaliana

104

105 Banque A. thaliana

106 IMGT

107 Recherche d information dans les banques Lexicographique : recherche de fragments de texte strictement présents dans la banque Avec valeur ajoutée : recherche des informations voisines, des synonymes. Criblage de banque pour rechercher toute la famille d une séquence donnée

108 Interrogation littérale Interrogation sur plusieurs bases à la fois; possibilité utiliser les références croisées (rechercher dans EMBL les séquences issues d une interrogation de SW) Opérateurs logiques : ET, OU et NON Logiciel SRS installé sur de nombreux serveurs Web (SW, NCBI, EBI, PFAM ). Interface graphique commune Liste des serveurs disponible à

109 SRS

110 SRS

111 SRS3D

112 SRS3D

113 Comparaison des structures Pour comparer des structures il faut d abord les superposer résidu par résidu selon la correspondance établie lors de l alignement des séquences. Ecart quadratique moyen est le rms

114 Superposer = comparer du 3D Nombreux sites MSD permet de sélectionner une partie de la structure à superposer MATRAS permet la même chose, et fournit une image Yakusa Peu d outils pour superposer un grand nombre de structures (Plus de 10): MUSTANG (pas en ligne)

115

116

117

118 EBI-MSD Schéma d un alignement structural multiple. Les flèches dénotent les SSE alignés par paires. Motifs A & B identiques en géométrie, mais connectiviés différentes. MSD gère connectivité entre les structures secondaires. Krissinel (2004) Acta Cryst D60:2256

119 EBI-MSD Fonction Q de qualité d accord entre deux structures rmsd entre les deux structures, nombre de résidus alignés (Nalign) entre les deux séquences de longueur N1 et N2 R = paramètre empirique choisi à la valeur de 3 Å Q = 1 pour structures identiques (N1=N2=Nalign) ; décroit vers zéro quand divergence augmente Compromis entre rms faible et maximum de résidus alignés Krissinel (2004) Acta Cryst D60:2256

120

121 SISYPHUS

122 SISYPHUS

123

124 Acessibilité au solvant Une sonde roule au contact des rayons de van der Waals des atomes de la protéine: elle décrit ainsi la surface moléculaire Le lieu du centre de la sphère sonde est la surface accessible au solvant

125 Accessibilité au solvant

126 1utg Monomère

127 2utg Dimère

128 Cavités dans les protéines Prot Sci (1994) 3:1224

129 Attribution SS2

130 Attribution structures secondaires A partir du fichier PDB; les seuls angles dièdres insuffisants DSSP calcule les liaisons H possibles. Si liaisons tous les (i+3), (i+4) ou (i+5) alors hélice. Si liaisons entre les atomes NiH-Oj et Oi-Nj+2 alors brins parallèles. Si liaisons entre les atomes Oi-Nj et Ni-Oj, alors brins antiparallèles. DSSP attribue une structure secondaire si 4 résidus successifs ont même attribution. DSSP attribue les tours.

131 DSSP Liaison H dans l eau Energie de la liaison H en fonction de l angle HNO et de la distance NO Distance canonique DA = 2.9 Å (D donneur; A accepteur) Angle DHA canonique 180

132 DSSP

133 STRIDE Voisin de DSSP Utilise les liaisons hydrogènes et les angles dièdres

134 RPBS

135 PSEA Utilise les distances entre carbones alpha : d2(i-1,i+2), d3 (i-1,i+3) et d4 (i,i+4) Utilise les pseudo angles de valence τ entre (i-1,i) et (i,i+1) Utilise les pseudo angles dièdres α (i- 1,i,i+1,i+2) Comparaison à des valeurs canoniques Se contente des carbones alpha

136 P-SEA Paramètres d assignation des structures secondaires Paramètre Hélice α Brin β angle τ ( ) 89± ±14 dièdre α ( ) 50± ±45 distance d3 (Å) 5,3 ±0,5 9,9 ±0,9 distance d4 (Å) 6,4 ±0,6 12,4 ±1,2

137 Fiabilité des attributions Banque de chaînes de séquences identiques (au moins des paires) Attribution des structures secondaires sur ces chaînes Peu de désaccords a/b Mésattributions ac ou bc essentiellement localisées aux extrémités des structures secondaires

138 Mésattributions DSSP Nter N+2 N+4 N+6 N+8 N+10 C-10 C-8 C-6 C-4 C-2 Cter Position of disassignments PSEA 0 Nter N+2 N+4 N+6 N+8 N+10 C-10 C-8 C-6 C-4 C-2 Cter Position of disassignments Localisation des mésattributions dans l ensemble des structures secondaires régulières Localisation majoritaire aux extrémités Deux programmes DSSP et PSEA

139 (4) (1) (3) (2) 1) 6AA alpha 2) 4 AA beta 3) 8 AA alpha 4) brin décalé Chaîne A Chaîne B 4sbv Deux chaînes identiques à 100% Superposition des carbones alpha 0,61 Å rms hélice = 0.26 Å Hélice

VI. Domaines protéiques

VI. Domaines protéiques Chapitre 1 Structure des protéines I. Rappels Définitions II. La Protein Data Bank (PDB) III. Angles dièdres et diagramme de ramachandran IV. Structures secondaires V. Structures supersecondaires VI. Domaines

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Formavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...

Formavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB... Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Le vivant est complexe: - 30 millions de types d organismes - 100 000 protéines différentes chez l homme

Le vivant est complexe: - 30 millions de types d organismes - 100 000 protéines différentes chez l homme Introduction Le vivant est complexe: - 30 millions de types d organismes - 100 000 protéines différentes chez l homme Informatique: - stocker les données - éditer les données - analyser les données (computational

Plus en détail

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire Vous aurez besoin des programmes suivant : d un éditeur de séquence d un visualiseur de structure 3D (PyMOL) Avant-propos

Plus en détail

ALIGNEMENT PLUS RAPIDE

ALIGNEMENT PLUS RAPIDE ALIGNEMENT PLUS RAPIDE 1. méthodes heuristiques : hachage, arbres de suffixe, PD limitée (taille totale de trous bornée) 2. PD éparse (pour sous-séquence commune ou chaînage en alignement global heuristique)

Plus en détail

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité?

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité? TD Bioinformatique : Sequence lignment Pourquoi faire une recherche par similarité? - Savoir si ma séquence ressemble à d'autres déjà connues. - Trouver toutes les séquences d'une même famille. - Rechercher

Plus en détail

GMIN206 TD Banques de données biologiques Interrogation des banques via GQuerry et Formats de fichiers de séquences

GMIN206 TD Banques de données biologiques Interrogation des banques via GQuerry et Formats de fichiers de séquences GMIN206 TD Banques de données biologiques Interrogation des banques via GQuerry et Formats de fichiers de séquences 1. Interrogation des banques via GQuerry 1.1 Rappel De manière concrère, l interrogation

Plus en détail

MÉMOIRE. Bases de données et outils d analyse pour la génomique bactérienne

MÉMOIRE. Bases de données et outils d analyse pour la génomique bactérienne MÉMOIRE présenté devant l Université Claude Bernard LYON 1 pour l obtention de L HABILITATION À DIRIGER DES RECHERCHES par Guy PERRIÈRE soutenance prévue le 27 juin 2000 Bases de données et outils d analyse

Plus en détail

Base de données bibliographiques Pubmed-Medline

Base de données bibliographiques Pubmed-Medline Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction

Plus en détail

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA Amplification spécifique Détection spécifique Clonage dans des vecteurs Amplification in vitro PCR Hybridation moléculaire - hôte cellulaire

Plus en détail

Logiciel MPSA et ressources bioinformatiques clientserveur Web dédiés à l analyse de séquences de protéine.

Logiciel MPSA et ressources bioinformatiques clientserveur Web dédiés à l analyse de séquences de protéine. N d ordre 139-99 Année 1999 THÈSE présentée devant l UNIVERSITÉ CLAUDE BERNARD LYON 1 pour l obtention du DIPLÔME DE DOCTORAT (arrêté du 30 mars 1992) présentée et soutenue publiquement le 31 mai 1999

Plus en détail

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques IMMUNOLOGIE La spécificité des immunoglobulines et des récepteurs T Informations scientifiques L infection par le VIH entraîne des réactions immunitaires de l organisme qui se traduisent par la production

Plus en détail

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

! Séquence et structure des macromolécules.  Séquences protéiques (UniProt)  Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ) Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de

Plus en détail

Conception assistée par ordinateur de molécules thérapeutiques

Conception assistée par ordinateur de molécules thérapeutiques Conception assistée par ordinateur de molécules thérapeutiques D. Gilis Bioinformatique génomique et structurale Faculté des sciences appliquées Université Libre de Bruxelles Objectif: illustrer en quoi

Plus en détail

Annotation in silico de séquences biologiques

Annotation in silico de séquences biologiques Annotation in silico de séquences biologiques Carl Herrmann TAGC Inserm U928 Université de la Méditerranée carl.herrmann@univmed.fr Pourquoi Diana est-elle ce qu'elle est...? génotype = l'information génétique

Plus en détail

Présentation et accès aux bases de données OMIM, GDB, EMBL/GenBank, SWISS PROT, PDB et au système d'information IMGT

Présentation et accès aux bases de données OMIM, GDB, EMBL/GenBank, SWISS PROT, PDB et au système d'information IMGT Présentation et accès aux bases de données OMIM, GDB, EMBL/GenBank, SWISS PROT, PDB et au système d'information IMGT Véronique Giudicelli LIGM, IGH, UPR CNRS 1142 141 rue de la Cardonille 34296 Montpellier

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

Recherche d homologies

Recherche d homologies Recherche d homologies Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Introduction 4 2 Les systèmes de scores

Plus en détail

Bioinformatique. Ressources et banques de données internationales

Bioinformatique. Ressources et banques de données internationales Bioinformatique Ressources et banques de données internationales Frédéric Lecerf frederic.lecerf@agrocampus-ouest.fr UMR PEGASE Equipe Génétique & Génomique Bioinformatique Plan du module 1. Présentation

Plus en détail

Quelques termes-clef de biologie moléculaire et leur définition

Quelques termes-clef de biologie moléculaire et leur définition Acide aminé (AA) Quelques termes-clef de biologie moléculaire et leur définition Isabelle Quinkal INRIA Rhône-Alpes Septembre 2003 Petite molécule dont l enchaînement compose les protéines - on dit qu

Plus en détail

Eléments primordiaux de biologie moléculaire

Eléments primordiaux de biologie moléculaire Eléments primordiaux de biologie moléculaire Pourquoi s intéresser au matériel génétique? Base de l information génétique Tissu Cellule Noyau Organisme entier Lieu où est localisé l ADN Mol d ADN qui est

Plus en détail

Extraction d information des bases de séquences biologiques avec R

Extraction d information des bases de séquences biologiques avec R Extraction d information des bases de séquences biologiques avec R 21 novembre 2006 Résumé Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d intérêt (nucléotidiques et protéiques)

Plus en détail

Formation Python. Sandra Dèrozier & Franck Samson 13 Juin 2014

Formation Python. Sandra Dèrozier & Franck Samson 13 Juin 2014 Formation Python Sandra Dèrozier & Franck Samson 13 Juin 2014 Programme Présentation rapide de Python Présentation d Eclipse Gestion de fichiers Fonctions Utilisation des exceptions Expressions régulières

Plus en détail

Différences entre Homme et singes?

Différences entre Homme et singes? Différences entre Homme et singes? Différences entre Homme et singes? Apparition de l œil? Apparition du vol? Apparition des hémoglobines? Molécule d hémoglobine HEME Chaîne polypeptidique de type 2 Chaîne

Plus en détail

Classification : a) Les acides aminés à chaîne aliphatique : Glycine Alanine Valine Leucine Isoleucine

Classification : a) Les acides aminés à chaîne aliphatique : Glycine Alanine Valine Leucine Isoleucine LES PROTEINES Objectifs : - Indiquer la structure des acides aminés et leurs propriétés. - Indiquer la structure de la liaison peptidique. - Différencier structure 1, 2, 3 et 4 des protéines. - Citer les

Plus en détail

MASTER «IN SILICO DRUG DESIGN» (2015-2016) Semestre 2 - Spécialité MMis - MACROMOLECULES BIOLOGIQUES Université Paris Diderot

MASTER «IN SILICO DRUG DESIGN» (2015-2016) Semestre 2 - Spécialité MMis - MACROMOLECULES BIOLOGIQUES Université Paris Diderot MASTER «IN SILICO DRUG DESIGN» (2015-2016) Semestre 2 - Spécialité MMis - MACROMOLECULES BIOLOGIQUES Université Paris Diderot UE1 PROGRAMMATION EN DRUG DESIGN (7 ECTS) Responsable : O. TABOUREAU EC1 -

Plus en détail

Microbiologie BIOL 3253. L évolution, la taxinomie et la diversité microbienne

Microbiologie BIOL 3253. L évolution, la taxinomie et la diversité microbienne Microbiologie BIOL 3253 L évolution, la taxinomie et la diversité microbienne Introduction générale et vue d ensemble Taxinomie Science de la classification biologique. Constituée de 3 parties séparées

Plus en détail

Data Mining. Rapport de Projet

Data Mining. Rapport de Projet Université Bordeaux I 2011 Nicolas FONTAINE Florence MAURIER Jonathan MERCIER Data Mining Rapport de Projet M2 Bioinformatique Responsable : P. Desbarat Table des matières Introduction 1 1 Choix des données

Plus en détail

Biologie «in silico» Adapté de Pierre Vincens

Biologie «in silico» Adapté de Pierre Vincens Biologie «in silico» Adapté de Pierre Vincens Bioinformatique Association de la biologie et de l'informatique Objectifs : Analyser, modéliser ou prédire les informations issues de données biologiques expérimentales

Plus en détail

TD 1 Biais de codons

TD 1 Biais de codons Module LV348 Version enseignant TD 1 page 1/7 TD 1 Biais de codons Revu dernièrement par Mathilde Carpentier, Cyril Gallut et Joël Pothier Version du 15 janvier 2014 L objectif de ce TP est de prendre

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

Principes généraux de la biochimie

Principes généraux de la biochimie Principes généraux de la biochimie «La biochimie a pour but de décrire, expliquer et exploiter les structures et le comportement des molécules biologiques en se servant de la chimie, de la physique et

Plus en détail

Structure et fonction des protéines

Structure et fonction des protéines Structure et fonction des protéines 2012-2013 Partie 1 : Repliement et structure tertiaire marie-line.garron@afmb.univ-mrs.fr L2 Structures des polypeptides Structure Primaire: séquence linéaire des acides

Plus en détail

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Exercice 1 (4,5 points) 1. Donner la définition de l acronyme BLAST. (0,5 pt) : Basic Local Alignment Search Tool 2. Expliquer les principes

Plus en détail

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Pré-traitements & indexation B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques

Plus en détail

Bioinformatique BTV Alignement de Séquences

Bioinformatique BTV Alignement de Séquences 1 / 60 Bioinformatique BTV Alignement de Séquences Jean-Michel Richer jean-michel.richer@univ-angers.fr http://www.info.univ-angers.fr/pub/richer Juillet 2008 2 / 60 Plan Plan 1 Rappels 2 Alignement multiple

Plus en détail

Cours de Bioinformatique Appliquée (Partie 1)

Cours de Bioinformatique Appliquée (Partie 1) Enseignement de Bioinformatique Appliquée CM 10h TD 16h (4 séances de 4h) Travail Personnel 8h Horaires de CM -08 Sept 14-16h -09 Sept 10-12h -15 Sept 14-16h -22 Sept 14-16h -29 Sept 14-16h Travail Personnel

Plus en détail

Apprentissage d automates sur les protéines

Apprentissage d automates sur les protéines Apprentissage d automates sur les protéines Approche par fusion de fragments significativement similaires (Jobim 04) François Coste, Goulven Kerbellec, Boris Idmont, Daniel Fredouille Christian Delamarche

Plus en détail

Licence-Master Bioinformatique Contrôle continu 06/03/06. Correction

Licence-Master Bioinformatique Contrôle continu 06/03/06. Correction Licence-Master Bioinformatique Contrôle continu 06/03/06 Correction -«Vraies» questions de cours -«fausses» questions de cours: questions pour voir si pouviez imaginer une réponse crédible qui n était

Plus en détail

Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires).

Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires). Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires). Objectifs de la fiche : 1. Ouvrir des séquences (ADN ou protéine). 2. Changer de règle de numérotation & faire apparaître

Plus en détail

Ecole Centrale Paris Année 2009-2010 1 ère année. Cours «Biologie». Vendredi 28 mai 2010

Ecole Centrale Paris Année 2009-2010 1 ère année. Cours «Biologie». Vendredi 28 mai 2010 Ecole Centrale Paris Année 2009-2010 1 ère année. Cours «Biologie». Vendredi 28 mai 2010 Contrôle des Connaissances. 2 ème session) (Durée : 1h30, tous documents autorisés, ordinateur interdit) Important

Plus en détail

La base de données MEDLINE

La base de données MEDLINE La base de données MEDLINE La base de données MEDLINE est produite par la National Library of Medicine (NLM) aux Etats-Unis. Elle couvre tous les domaines biomédicaux : médecine, biologie, toxicologie,

Plus en détail

Études par diffraction de fibres de l ADN double brin

Études par diffraction de fibres de l ADN double brin J. Phys. IV France 130 (2005) 63 74 C EDP Sciences, Les Ulis DOI: 10.1051/jp4:2005130004 Études par diffraction de fibres de l ADN double brin V.T. Forsyth 1,2 et I.M. Parrot 1,2 1 Institut Laue Langevin,

Plus en détail

15 septembre 2010. Démo #2 MySQL Séquençage

15 septembre 2010. Démo #2 MySQL Séquençage 15 septembre 2010 Démo #2 MySQL Séquençage SQL et MySQL SQL: structured query language langage pour manipuler des données dans des bases de données relationnelles MySQL: Implantation de SQL Ajout à SQL

Plus en détail

Outils. A. LineFolio et le portefeuille fictif

Outils. A. LineFolio et le portefeuille fictif Outils A. LineFolio et le portefeuille fictif Cette rubrique regroupe les portefeuilles réels (Aa) et les portefeuilles fictifs (Ab) à des fins de comparaison. Aa Ab A 1 1-Le portefeuille réel Aa-2 Aa-4

Plus en détail

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE Plan de Cours Automne 2015 Professeurs: Sylvie Hamel, Département d Informatique et de Recherche Opérationnelle Guillaume Lettre, Institut de Cardiologie

Plus en détail

L ADN. Schématisez un nucléotide et un nucléoside en précisant sur quel carbone du sucre se font les différents assemblages :

L ADN. Schématisez un nucléotide et un nucléoside en précisant sur quel carbone du sucre se font les différents assemblages : L ADN. I. GENERALITES. A. Les caractéristiques de l ADN. Donnez les 6 caractéristiques de l ADN : B. Les nucléotides/nucléosides : Schématisez un nucléotide et un nucléoside en précisant sur quel carbone

Plus en détail

Automatisation de la plateforme MicroScope avec l API JBPM. Engelen. CEA/DSV/IG/Genoscope Métabolique Laboratoire (Atelier) de Génomique.

Automatisation de la plateforme MicroScope avec l API JBPM. Engelen. CEA/DSV/IG/Genoscope Métabolique Laboratoire (Atelier) de Génomique. Atelier «BioWorkFlow» - 25/09/08 Automatisation de la plateforme MicroScope avec l API JBPM David Vallenet & Stéfan Engelen CEA/DSV/IG/Genoscope CNRS-UMR Génomique Métabolique Laboratoire (Atelier) de

Plus en détail

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX Sommaire Définitions et abréviations Résumé Introduction I. Matériel II. Méthode A) Méthode de contrôle manuel des résultats produits par GLADX B) Comparaison des résultats de l outil GLADX avec les résultats

Plus en détail

DEVOIR DE SCIENCES DE LA VIE et de LA TERRE. Septembre 2014.

DEVOIR DE SCIENCES DE LA VIE et de LA TERRE. Septembre 2014. DEVOIR DE SCIENCES DE LA VIE et de LA TERRE. Septembre 2014. Vous devez choisir pour chaque question proposée, zéro, une ou plusieurs réponses exactes parmi celles proposées ou bien répondez à la question.

Plus en détail

Applications des nombres complexes à la géométrie

Applications des nombres complexes à la géométrie Chapitre 6 Applications des nombres complexes à la géométrie 6.1 Le plan complexe Le corps C des nombres complexes est un espace vectoriel de dimension 2 sur R. Il est donc muni d une structure naturelle

Plus en détail

Chapitre 1 La révolution des sciences de la vie par la génétique

Chapitre 1 La révolution des sciences de la vie par la génétique Chapitre 1 La révolution des sciences de la vie par la génétique Variation génétique de la couleur des grains de maïs. Chaque grain représente un individu de constitution génétique distincte. La sélection

Plus en détail

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Statisticiens: Sophie Lamarre Steve Van Ginkel Sébastien Déjean - Magali San Cristobal Matthieu Vignes Biologistes: Stéphane

Plus en détail

Soutenance de mi-stage

Soutenance de mi-stage Supervisée par : Mireille RÉGNIER & Yann PONTY 30 juin 2015 1/29 1 Structure 3D de l ARN et objectifs Notions sur la structure 3D de l ARN Intérêts de la comparaison de structures 3D Qu est ce que la comparaison

Plus en détail

TP 5 Enquête sur les maladies héréditaires - III

TP 5 Enquête sur les maladies héréditaires - III TP 5 Enquête sur les maladies héréditaires - III Anémie Falciforme [Sickle-Cell Anemia] Partie 1 Qu est-ce que l anémie falciforme? L'anémie falciforme (sickle cell anemia) est une maladie génétique qui

Plus en détail

Les grandes bases de données en biologie et les. Guy Perrière. Pôle Rhône-Alpes de Bioinformatique. Forum «Big Data» 16 mai 2014

Les grandes bases de données en biologie et les. Guy Perrière. Pôle Rhône-Alpes de Bioinformatique. Forum «Big Data» 16 mai 2014 Les grandes bases de données en biologie et les problèmes associés Forum «Big Data» Guy Perrière Pôle Rhône-Alpes de Bioinformatique 16 mai 2014 Guy Perrière (PRABI) Forum «Big Data» 16 mai 2014 1 / 17

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

La synthèse des protéines transcription code génétique traduction

La synthèse des protéines transcription code génétique traduction CEC André-Chavanne BIO 3 OS La synthèse des protéines transcription code génétique traduction I. La «Transcription» : de l ADN à l ARNm. L'adresse suivante permet d accéder à une ANIMATION sur la TRANSCRIPTION.

Plus en détail

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan M Bioinformatique, Connaissances et Données Année 24-25 GMIN206 Info. Biologique et Outils bioinformatiques Banques de données biologiques (3h de Cours +,5h de TD + 4h de TP) Elodie Cassan Anne-Muriel

Plus en détail

Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2

Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2 DEVELOPPEMENT D UNE INTERFACE GRAPHIQUE : LOCAL WEB GUI FOR BLAST (LWBG), POUR LES TRAITEMENTS DE DONNEES BIOLOGIQUES Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2 Plan

Plus en détail

TP11 - Administration/Tuning

TP11 - Administration/Tuning TP11 - Administration/Tuning MIAGE #3-2006/2007 January 9, 2007 1 Architecture physique d une base Oracle 1.1 La structure physique Une base de données Oracle est composé de fichiers (au sens du système

Plus en détail

I. TOUITOU (Mise ligne 15/10/08 LIPCOM-RM) Faculté de Médecine Montpellier-Nîmes

I. TOUITOU (Mise ligne 15/10/08 LIPCOM-RM) Faculté de Médecine Montpellier-Nîmes er cycle PCEM MI5 Génétique moléculaire et clinique Année Universitaire 008-009 Comment apprécier la composante héréditaire des maladies?. Excès de cas familiaux - Les études familiales - - La plupart

Plus en détail

Bioinformatique BTV Stockage des données

Bioinformatique BTV Stockage des données 1 / 64 Bioinformatique BTV Stockage des données Jean-Michel Richer jean-michel.richer@univ-angers.fr http://www.info.univ-angers.fr/pub/richer Juillet 2008 2 / 64 Plan Plan 1 Introduction 2 Format de stockage

Plus en détail

Perl Orienté Objet BioPerl There is more than one way to do it

Perl Orienté Objet BioPerl There is more than one way to do it Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels

Plus en détail

I. Obtenir les exons d'un chromosome humain possédant la plus forte densité en SNP. 1. Récupérer les exons codant du chromosome 22 humain

I. Obtenir les exons d'un chromosome humain possédant la plus forte densité en SNP. 1. Récupérer les exons codant du chromosome 22 humain Exemples d'analyse sous Galaxy : Adaptation des exercices "Using Galaxy" proposés par la team Galaxy Exercices proposés par la plateforme rennaise GenOuest Jennifer Hillman-Jackson, 1 Dave Clements, 2

Plus en détail

COMPUTROL on Line TM

COMPUTROL on Line TM Page 1 de 5 Version 1, 15 novembre 2000 Ordre des procédures 1. Définissez votre laboratoire. 2. Définissez vos instruments et vos analytes pour votre laboratoire. 3. Définissez les règles de contrôle

Plus en détail

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Biodiversité fongique Biodiversité: diversité spécifique d une communauté écologique, correspondant au nombre d espèces et à leur

Plus en détail

LA SYNTHÈSE DES PROTÉINES

LA SYNTHÈSE DES PROTÉINES LA SYNTHÈSE DES PROTÉINES La transcription Information : dans le noyau (sous forme d'adn) Synthèse des protéines : dans le cytoplasme (au niveau des ribosomes du reticulum endoplasmique) L'ADN ne sort

Plus en détail

Bibliographie Introduction à la bioinformatique

Bibliographie Introduction à la bioinformatique Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A

Plus en détail

Méthodologie de mise en oeuvre de workflows scientifiques

Méthodologie de mise en oeuvre de workflows scientifiques Méthodologie de mise en oeuvre de workflows scientifiques Yuan Lin yuan.lin@supagro.inra.fr UMR MISTEA INRA, SupAgro, Montpellier!2 Contexte & Objectif Divers domaines scientifiques Ressources existantes

Plus en détail

Comment la Souris fait de la souris avec des graines?

Comment la Souris fait de la souris avec des graines? Comment la Souris fait de la souris avec des graines? d après «10 clés pour la Biologie» de J. Tavlitzki «[ ] La Souris, l Ecureuil, le Lapin mangent des graines. La Souris fait de la souris, l Ecureuil

Plus en détail

But du cours. Sources & références. Sources & références. Sources & références. Plan. La fouille de données (ou data mining) Principe (postulat...

But du cours. Sources & références. Sources & références. Sources & références. Plan. La fouille de données (ou data mining) Principe (postulat... But du cours Vocabulaire, principes et techniques du Data Mining Méthodes et Algorithmes Interprétation des résultats. Data Mining : Concepts and Techniques J. Han, M. Kamber Morgan Kaufmann Le Data Mining

Plus en détail

Initiation WORD. Module 9 : Les graphismes.

Initiation WORD. Module 9 : Les graphismes. Initiation WORD. Module 9 : Les graphismes. Système d exploitation utilisé : Windows XP Service Pack 2 Créé par Xavier CABANAT Version 1.0 Document créé par Xavier CABANAT Page 1 sur 14 Avant propos. Tout

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 Sélectionner les propositions exactes Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 QCM 1 La plupart des techniques de biologie moléculaire repose sur le principe de complémentarité

Plus en détail

AMADEUS PLATE FORME DE SERVICES EN A N N O T A T I O N E X P E R T E D E S GENES ET GENOMES

AMADEUS PLATE FORME DE SERVICES EN A N N O T A T I O N E X P E R T E D E S GENES ET GENOMES EN A N N O T A T I O N E X P E R T E D E S GENES ET GENOMES L annotation des gènes et génomes : une révolution en mouvement... L annotation est une étape essentielle dans la découverte des connaissances

Plus en détail

Information Génétique et hérédité 1- Réplication, mitose, méiose

Information Génétique et hérédité 1- Réplication, mitose, méiose Information Génétique et hérédité 1- Réplication, mitose, méiose REPLICATION DE L ADN et CYCLE CELLULAIRE quantité d'adn 4C 2C G 1 S G 2 M G 1 5 12 15 16 duplication de l'adn mitose temps heures CYCLE

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

THÈME 3 : DU GÉNOTYPE AU PHÉNOTYPE. CHAPITRE 1 : la relation entre ADN et protéines

THÈME 3 : DU GÉNOTYPE AU PHÉNOTYPE. CHAPITRE 1 : la relation entre ADN et protéines THÈME 3 : DU GÉNOTYPE AU PHÉNOTYPE CHAPITRE 1 : la relation entre ADN et protéines Les caractères d un individu dépendent de plusieurs facteurs : certains dépendent des caractères présents dans la famille

Plus en détail

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS Sauvegarde collaborative entre pairs 1 Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS Sauvegarde collaborative entre pairs 2 Introduction Pourquoi pair à pair? Utilisation de ressources

Plus en détail

ARN et bioinformatique: PDF processed with CutePDF evaluation edition www.cutepdf.com

ARN et bioinformatique: PDF processed with CutePDF evaluation edition www.cutepdf.com ARN et bioinformatique: Partie 1 PDF processed with CutePDF evaluation edition www.cutepdf.com Sommaire Principes biologiques : Transcription/traduction, types d ARN, formes primaires/secondaires. Zuker

Plus en détail

L'ordre et la nature des acides aminés (ou séquence) d un polypeptide dépend de la séquence des nucléotides de l ADN du gène qui le code.

L'ordre et la nature des acides aminés (ou séquence) d un polypeptide dépend de la séquence des nucléotides de l ADN du gène qui le code. L'ordre et la nature des acides aminés (ou séquence) d un polypeptide dépend de la séquence des nucléotides de l ADN du gène qui le code. Une mutation, peut entraîner une modification de la séquence des

Plus en détail

Cours 4 : Python, listes et boucles

Cours 4 : Python, listes et boucles Cours 4 : Python, listes et boucles Listes Les listes contiennent un tableau de données : patients = ["Jean Dupont", "Paul Dubois", "Marianne Y"] Il est possible de mélanger des types différents : chromosomes_recombines

Plus en détail

Analyse de Séquences M1 BIBS. 2 e partie. http://rna.igmors.u-psud.fr/gautheret/cours/ V. 2012.1

Analyse de Séquences M1 BIBS. 2 e partie. http://rna.igmors.u-psud.fr/gautheret/cours/ V. 2012.1 Analyse de Séquences M1 BIBS 2 e partie http://rna.igmors.u-psud.fr/gautheret/cours/ V. 2012.1 1 Les programmes Génome 2 Les programmes Génome Préhistoire Séquençage de Sanger Avant le séquençage d organismes:

Plus en détail

Outils de gestion des ressources biologiques

Outils de gestion des ressources biologiques Le Cahier des Techniques de l INRA 2015 (84) N 1 Outils de gestion des ressources biologiques Frédéric Sanchez 1 *, Tou Cheu Xiong 1 Résumé. Les recherches en biologie génèrent un grand nombre d échantillons

Plus en détail

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine.

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Anne Poupon Biologie et Bioinformatique des Systèmes de Signalisation INRA - Nouzilly France

Plus en détail

A : Vrai : La biotechnologie est l'ensemble des techniques qui utilisent des microorganismes,

A : Vrai : La biotechnologie est l'ensemble des techniques qui utilisent des microorganismes, Ecurie du 1/02/12 1: AE A : Vrai : La biotechnologie est l'ensemble des techniques qui utilisent des microorganismes, des cellules animales, végétales ou leurs constituants à des fins industrielles (agro

Plus en détail

OECD (Q)SAR Application Toolbox: Contexte et évolution. B. Diderich Environment, Health and Safety Division OECD

OECD (Q)SAR Application Toolbox: Contexte et évolution. B. Diderich Environment, Health and Safety Division OECD OECD (Q)SAR Application Toolbox: Contexte et évolution B. Diderich Environment, Health and Safety Division OECD Philosophie Mettre en œuvre dans un programme informatique flexible le document guide de

Plus en détail

L adhérence cellulaire

L adhérence cellulaire UE2 : Biologie cellulaire Migration cellulaire, domiciliation et cancer Chapitre 2 : L adhérence cellulaire Pierre CAVAILLES Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits

Plus en détail

A1-1 TP3 Gmsh et partitionnement de maillage

A1-1 TP3 Gmsh et partitionnement de maillage A1-1 TP3 Gmsh et partitionnement de maillage Nicolas Kielbasiewicz 23 septembre 2013 1 Introduction à Gmsh Sous Windows et Mac OS, Gmsh est une application native. Sous Linux, il se lance en ligne de commande,

Plus en détail

Méthodes d apprentissage :

Méthodes d apprentissage : Méthodes d apprentissage : application au tri de complexes protéines-protéines Jérôme Azé Apprentissage: tâches Apprentissage non supervisé (Eisen, ) Apprentissage supervisé (arbres de décision, k-ppv,

Plus en détail

Software Design Description

Software Design Description Software Design Description ABSTRACT: KEYWORDS: APPROVED: AUTHOR PROJECT MANAGER PRODUCT OWNER General information/recommendations A SDD provides a representation of a software system created to facilitate

Plus en détail

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien.

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. Thomas DERRIEN CNRS-UMR6061 Génétique et Développement Université

Plus en détail

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation 2- Les molécules d ADN constituent le génome 2-1 La séquence d ADN représente l information génétique Lettres: A, T, G, C Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine).

Plus en détail

RNAseq et NGS. Adriana Alberti Karine Labadie

RNAseq et NGS. Adriana Alberti Karine Labadie RNAseq et NGS Séquençage et Diversité LES ORGANISMES EUCARYOTES animaux plantes champignons protistes BACTERIES ARCHEES VIRUS METAGENOMES LES SOURCES ADN GENOMIQUE ARN / cdna AMPLICONS BACs ET FOSMIDES

Plus en détail

Polymorphismes de l ADN

Polymorphismes de l ADN Introduction Polymorphismes de l ADN Présentation et mise en évidence Recherche de gènes responsables de maladies génétiques : Analyse de pedigrees où la maladie est présente Sur quel chromosome? À quel

Plus en détail