TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité?

Dimension: px
Commencer à balayer dès la page:

Download "TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité?"

Transcription

1 TD Bioinformatique : Sequence lignment Pourquoi faire une recherche par similarité? - Savoir si ma séquence ressemble à d'autres déjà connues. - Trouver toutes les séquences d'une même famille. - Rechercher toutes les séquences qui contiennent un motif donné. - Déterminer la fonction: Le but est d'identifier la fonction d'une séquence en la comparant à une ou plusieurs autres séquences. similarités dans la séquence similarités dans la structure similarités dans la function

2 Homologie La similarité forte entre deux séquences est considérée comme représentative de l'homologie entre ces séquences. séquence ancêtre commune mutations accumulées au cours de l'évolution. Lorsque la similitude protéique dépasse 30% sur au moins 100 résidus, alors il est généralement probable que les séquences dérivent d'un ancêtre commun (elles sont homologues). La comparaison de gènes homologues est une approche très efficace pour : - Déterminer la fonction et la structure d'une séquence. - Repérer des régions fonctionnelles au sein des séquences. - Etudier les processus de l'évolution à l'échelle moléculaire. - Etablir la phylogénie des espèces L'homologie entre deux séquences peut laisser supposer que les séquences ont des fonctions identiques (mais ne le prouve pas...).

3 2784 Gan et al. FIGURE 1 (caption on next page) Biophysical Journal 83(5)

4 Dot Plot lignement de séquences (proteines, DN, RN) Méthode de représentation visuelle des positions des similarités entre deux séquences (ou sur une même séquence). Objectif Dans le cas de la comparaison d'une séquence avec elle-même, il s'agit de détecter les répétitions internes. Dans le cas où la comparaison implique deux séquences différentes, il est possible d'identifier des régions de similarité. Principe Le principe est de mettre les séquences le long des axes d une matrice et de mettre un point là où il y a une correspondance. T T C G G C T G G C

5 Exercise 1: Tracez un nouveau dotplot à partir des deux séquences suivantes : THFLTQHYDKPQYRNDR KHFLTQHQHKPFGRNDR Que remarquez vous? T H F L T Q H Y D K P Q Y R N D R K H F L T Q H Q H K P F G R N D R

6 Exercise 2: Tracez un dotplot de la sequence avec elle-meme: BCDFFGKDFGTFGK B C D D F G K D F G B B C D D F G K D F G B ugmentez la stringence, en ne conservant les segments qui contiennent au moins 3 positions identiques sur la diagonale. La diagonale principale représentant l exacte similarité de la prot avec elle-même (normale) Plusieurs lignes diagonales représentant des zones de similarité chevauchantes. Dot plot typique pour une séquence contenant des répétitions.

7 La proteine ribosomale S1 de EColi contient 6 répétitions d environ 13 aa correspondant à 6 domaines S1. Domaine S1 : fonction de liaison à l RN et Beta-Barrel. Si on diminue la taille des fragments devant être similaires en dessous de 13, on voit mieux. Ici taille fragment = 6.

8 Exercise 3: Comparaison de la séquence nucléaire du gène de l'actine de muscle (horizontalement) à la séquence de l'dnc (RN) du même gène 1. Comment apparaissent les exons dans un dotplot? 2. Combien comptez-vous d'exons? 3. Que pouvez-vous dire sur la différence de taille entre les exons et les introns? 1. Les exons apparaissent en plusieurs petites diagonale décalées. Ils sont séparés par les introns du genes que l on ne retrouve pas dans l DNc exons. 3. Les exons sont plus petits que les introns.

9 Recherche par similarité La recherche de similarités (globale ou locale) entre deux séquences consiste à chercher des régions très semblables: un maximum de caractères identiques : appariements et un minimum de changements : substitutions, insertions/délétions Exemples Un alignement parfait: sequence 1: TCCPSIVRSN * * * * * * * * * * * sequence 2: TCCPSIVRSN Un alignement avec ressemblances fortes: sequence 1: TCCPSIVRSN. * * * * *. * * * * sequence 2: SCCPSISRSN Un alignement avec indels et mismatch: sequence 1: CCCPSIVRSN. * * *. * *.. sequence 2: SC - PSR-RNT

10 Matrices de similarité Quantification de la similitude : Le score Un score global permet de quantifier la similitude. Il résulte de la somme des scores élémentaires calculés sur chacune des positions en vis à vis des deux séquences dans leur appariement optimal. C'est le nombre total de "bons appariements" pénalisé par le nombre de "mésappariements". Un mésappariement peut être : la substitution d'un caractère par un autre (mutation) l'introduction d'un "gap" Le gap permet d'optimiser l'alignement entre les deux séquences donc de faire coïncider le maximum de caractères communs. Example: ppariement: 5 Mésappariement: -6 Ouverture insertion/délétion : -4 T G G T T T G G T SCORE: = 1

11 Matrices de substitution Les matrices PM (Percentage of cceptable point Mutations) PM matrices are based on global alignments of closely related proteins. Specific for a particular evolutionary distance. ex : la PM 250 est appropriée pour comparer des sequences ayant subis 250 mutations per 100 amino acids. Because of back mutations and silent mutations this corresponds to sequences that are about 20 percent identical. Les matrices BLOSUM (BLOcks SUbstitution Matrix) Based on local multiple alignments sans gap de regions très conservées of more distantly related sequences. ex:blosum 62 (default matrix in BLST), is calculated from comparisons of sequences with no less than 62% identity. Est utilisée comme matrice par défaut car elle offre un bon compromis quand les distances évolutives entre les séquences ne sont pas connues. lignement 1: G - P F D Y S T V H R C P R F E T H - V Score PM250 = = 2 Score BLOSUM45 = = 6 lignement 2: G P F D Y S T - V H R C P R F E - - T H V Score PM250 = = 3 Score BLOSUM45 = = 4

12 Exercise 4: Calculer le score pour l allignemnet proteique suivante. Vous utiliserez la matrice de substitution BLOSUM50 et une pénalité d ouverture et d extension de gap de 2 E V R E P K T E M P K V

13 E-value Nombre d'alignements attendus par hasard ayant un score supérieur ou égale au score (S) obtenu dans la banque considérée (mn). Plus la valeur est faible, plus l'alignement est fiable (indique que le résultat n est pas du au hasard) Dépend du nombre total de résidus contenus dans la banque (Ces valeurs ne sont pas comparables entre deux banques) E-value = Kmn e -λs m* n : correspond à l espace de recherche. m est le nombre de lettres de la séquence requête et n est le nombre de lettre dans la base de données. Relation linéaire avec la taille de l espace de recherche: si la taille de la banque double, la e-value double aussi. Relation exponentielle avec le score: de légers changements de score peuvent entraîner d important changement de la e-value.

14 Exercise 5: Caluler le E-value pour les alignements precedents. Consider: m=10, n=10, K=1, λ=2 lignement 1 PM 250 : S = 2 E-value = Kmn e -λs = 1 * 10 * 10 * exp(-2*2) = Blosum 45 : S = 6 E-value = Kmn e -λs = 1 * 10 * 10 * exp(-2*6) = lignement 2 PM 250 : S = 3 E-value = Kmn e -λs = 1 * 10 * 10 * exp(-2*3) = Blosum 45 : S = 4 E-value = Kmn e -λs = 1 * 10 * 10 * exp(-2*4) =

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire Plan 1 Banques de données 2 Comparaison de 2 séquences Dotplot, alignement optimal Recherche de similarité 3 Alignement multiple l 4 Phylogénie moléculaire Recherche de similarité 1 séquence (Query) comparée

Plus en détail

Comparaison et alignement de séquences 2

Comparaison et alignement de séquences 2 Comparaison et alignement de séquences 2 LV348 -BI Sophie Pasek sophie.pasek@upmc.fr Comment comparer une séquence contre une banque? Comparaison séquence/banque Pourquoi? : Réunir un échantillon taxonomique

Plus en détail

Comparaison et alignement. de séquences 2 LV348 -BI. sophie.pasek@upmc.fr. Sophie Pasek

Comparaison et alignement. de séquences 2 LV348 -BI. sophie.pasek@upmc.fr. Sophie Pasek Comparaison et alignement de séquences 2 LV348 -BI Sophie Pasek sophie.pasek@upmc.fr Comment comparer une séquence contre une banque? Comparaison séquence/banque Pourquoi? : Réunir un échantillon taxonomique

Plus en détail

Alignement de séquences (2/2)

Alignement de séquences (2/2) Alignement de séquences (2/2) Observation à l aide de l outil graphique : le dotplot. Simple, visuel, Très informatif : Permet de repérer une similarité globale Permet de repérer des similarités locales

Plus en détail

Recherche d homologies

Recherche d homologies Recherche d homologies Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Introduction 4 2 Les systèmes de scores

Plus en détail

BIO6: Bioinformatique appliquée Correction du TD3

BIO6: Bioinformatique appliquée Correction du TD3 BIO6: Bioinformatique appliquée Correction du TD3 Exercice 1 : programmation dynamique voir le site web indiqué dans le TD pour corriger l'exercice Exercice 2 : similarité de séquence et distance évolutive

Plus en détail

Lancer FASTA et BLAST en ligne de commande

Lancer FASTA et BLAST en ligne de commande Lancer FASTA et BLAST en ligne de commande V.2006.1 http://www.esil.univ-mrs.fr/~dgaut/cours Daniel Gautheret ESIL, Université de la Méditerranée Fasta Article original: Lipman and Pearson (1985) Science

Plus en détail

Bioinformatique BTV Alignement de Séquences

Bioinformatique BTV Alignement de Séquences 1 / 60 Bioinformatique BTV Alignement de Séquences Jean-Michel Richer jean-michel.richer@univ-angers.fr http://www.info.univ-angers.fr/pub/richer Juillet 2008 2 / 60 Plan Plan 1 Rappels 2 Alignement multiple

Plus en détail

Outils de la Bioinformatique M1 GENIOMHE/ M1 BS Comparaison de séquences 2 à 2

Outils de la Bioinformatique M1 GENIOMHE/ M1 BS Comparaison de séquences 2 à 2 Outils de la Bioinformatique M1 ENIOMHE/ M1 BS omparaison de séquences 2 à 2 Exercice 1 : omparaison visuelle de séquences avec ot Plot Les séquences suivantes sont à comparer : Séquence_1 Séquence_2 1.1)

Plus en détail

Alignement Multiple de séquences

Alignement Multiple de séquences Alignement Multiple de séquences Introduction Alignement multiple = Alignement simultané de plusieurs séquences (Nt ou Prot) Outil essentiel pour : Signatures protéiques Homologie avec une famille de protéines

Plus en détail

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques IMMUNOLOGIE La spécificité des immunoglobulines et des récepteurs T Informations scientifiques L infection par le VIH entraîne des réactions immunitaires de l organisme qui se traduisent par la production

Plus en détail

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool)

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) A A C T G G T A A C C G A G C T A C G G T C C G Algorithme de Blast (version 1) (Altschul et

Plus en détail

Alignement de séquences Principes et méthodes. Karim Mezhoud Ir. agronome PhD. Toxicologie, Protéomique, Bioinformatique

Alignement de séquences Principes et méthodes. Karim Mezhoud Ir. agronome PhD. Toxicologie, Protéomique, Bioinformatique lignement de séquences Principes et méthodes Karim Mezhoud Ir. agronome PhD. oxicologie, Protéomique, Bioinformatique entre national des Sciences et echnologies Nucléaires Sidi habet unis Pourquoi analyser

Plus en détail

Recherche de parenté entre les vertébrés

Recherche de parenté entre les vertébrés 1 CHAPITRE A Recherche de parenté entre les vertébrés 2 Chapitre A : Recherche de parentés entre les êtres vivants Tous les êtres vivants présentent des structures cellulaires et un fonctionnement commun

Plus en détail

Corrigé du TD1. Exercice 1:

Corrigé du TD1. Exercice 1: Corrigé du TD1 Exercice 1: le but était d'aligner des séquences à la main et de compter les substitutions entre acides aminés observées. Le résultat se trouve à cette adresse: http://tagc.univ-mrs.fr/herrmann/bio6/displaymatrix.php

Plus en détail

Bioinformatique appliquée. Cours 4 BLAST. idée. lire un résultat de Blast. la famille Blast

Bioinformatique appliquée. Cours 4 BLAST. idée. lire un résultat de Blast. la famille Blast Bioinformatique appliquée Cours 4 BLAST idée lire un résultat de Blast la famille Blast -1- "quelle est la similarité entre ces 2 séquences? et donc: est-ce que ces deux séquences sont homologues?" "existe-t-il

Plus en détail

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Exercice 1 (4,5 points) 1. Donner la définition de l acronyme BLAST. (0,5 pt) : Basic Local Alignment Search Tool 2. Expliquer les principes

Plus en détail

Alignement de séquences

Alignement de séquences Bioinformatique appliquée ours lignement de séquences principes un algorithme d'alignement: programmation dynamique alignement global, alignement local -- Les comparaisons de séquences DOPLO j'ai séquences,

Plus en détail

Fiche technique : étudier les protéines avec UniProt

Fiche technique : étudier les protéines avec UniProt Fiche technique : étudier les protéines avec UniProt http://www.uniprot.org/ Objectifs : ce site en ligne «UniProt», pour Universal Protein Resource, permet d étudier les protéines dans un cadre évolutionniste.

Plus en détail

Data Mining : la classification non supervisée

Data Mining : la classification non supervisée Data Mining : la classification non supervisée Clustering : une affaire de distance. Etude préliminaire. Valeurs discrètes. Soient les deux individus suivants correspondant à des séquences ADN : X = AGGGTGGC

Plus en détail

AVL Liban La Bioinformatique. Bioinformatique

AVL Liban La Bioinformatique. Bioinformatique AVL Liban 2011 La Sami Khuri Department of Computer Science San José State University San José, California, USA sami.khuri@sjsu.edu www.cs.sjsu.edu/faculty/khuri Sami Khuri sami.khuri@sjsu.edu Qu est-ce

Plus en détail

Bibliographie Introduction à la bioinformatique

Bibliographie Introduction à la bioinformatique om enaerts, Bibliographie ntroduction à la bioinformatique. l analyse des séquences par paires et la programmation dynamique onday ebruary om enaerts, Zvelebil et Baum, Understanding bioinformatics ormen

Plus en détail

Alignements multiples

Alignements multiples Alignements multiples Informatique Génomique - Master 1 Guillaume Blin IGM-LabInfo UMR 8049, Bureau 4B066 Université de Marne La Vallée gblin@univ-mlv.fr http://igm.univ-mlv.fr/ gblin 2007-08 Plan C est

Plus en détail

Méthodes et algorithmes pour le séquençage

Méthodes et algorithmes pour le séquençage Méthodes et algorithmes pour le séquençage Jérémie MARY http://www.lri.fr/~mary La comparaison de séquences Distance d'édition Selon ce concept, le bon alignement est celui qui minimise les opérations

Plus en détail

Initiation à la Bioinformatique

Initiation à la Bioinformatique Université d Alexandrie Initiation à la Bioinformatique Basic Local Alignment Search Tool BLAST Université d Alexandrie AUF Auteur(s): Mohamed GAD 2009/2010 Auteur(s) : Mohamed GAD Professeur à l institut

Plus en détail

Plateforme de Recherche de Mutations

Plateforme de Recherche de Mutations Plateforme de Recherche de Mutations Jean-Marc Aury contact: pfm@genoscope.cns.fr 29 janvier 2009 Introduction Présentation des données produites par le GSFLX : type, qualité, Méthodes de détection de

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée V.2004.4 http://www.esil.univ-mrs.fr/~dgaut/cours Bioinformatique Deux définitions possibles Applications de l informatique

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

Analyse in silico de génomes, protéomes et transcriptomes. «Génomique comparative» V.2012.1. Protocole TD

Analyse in silico de génomes, protéomes et transcriptomes. «Génomique comparative» V.2012.1. Protocole TD Magistère Biotechnologies Analyse in silico de génomes, protéomes et transcriptomes «Génomique comparative» V.2012.1 Protocole TD Notes : Scripts et données sur : http://rna.igmors.u-psud.fr/gautheret/cours/analinsilico

Plus en détail

Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin

Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin Plan de la session Bioinformatique & séquençage haut débit Date Intervenant (s) Libellé 05/03 G. Salin Introduction

Plus en détail

TD 3 Recherche de similarités dans une banque de séquences

TD 3 Recherche de similarités dans une banque de séquences Module LV348 Version enseignant TD 3 page 1/7 TD 3 Recherche de similarités dans une banque de séquences Revu dernièrement par Mathilde Carpentier, Cyril Gallut et Joël Pothier Version du 30 mars 2012

Plus en détail

Modélisation de la structure 3D des protéines

Modélisation de la structure 3D des protéines Modélisation de la structure 3D des protéines We are drowning in data and starving for knowledge -R.D. Roger Unité Mathématique Informatique et Génome Séminaire AGENAE, Seignosse-le-Pénon, 20-21 mai 2003

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

LES FAMILLES MULTIGÉNIQUES : L'EXEMPLE DES CHAÎNES DE L'HÉMOGLOBINE

LES FAMILLES MULTIGÉNIQUES : L'EXEMPLE DES CHAÎNES DE L'HÉMOGLOBINE Fiche sujet-élève Les similitudes entre gènes sont interprétées comme le résultat d une ou plusieurs duplications d un gène ancestral. Des molécules homologues appartiennent à la même famille multigénique

Plus en détail

Différences entre Homme et singes?

Différences entre Homme et singes? Différences entre Homme et singes? Différences entre Homme et singes? Apparition de l œil? Apparition du vol? Apparition des hémoglobines? Molécule d hémoglobine HEME Chaîne polypeptidique de type 2 Chaîne

Plus en détail

Série : STL Spécialité biotechnologies SESSION 2014 BACCALAURÉAT TECHNOLOGIQUE

Série : STL Spécialité biotechnologies SESSION 2014 BACCALAURÉAT TECHNOLOGIQUE BACCALAURÉAT TECHNLGIQUE Série : STL Spécialité biotechnologies SESSIN 2014 CBSV : sous épreuve coefficient 4 Biotechnologies : sous épreuve coefficient 4 Durée totale de l épreuve: 4 heures Les sujets

Plus en détail

Comparaison et alignement. de séquences LV348 -BI. Sophie Pasek

Comparaison et alignement. de séquences LV348 -BI. Sophie Pasek Comparaison et alignement de séquences LV348 -BI Sophie Pasek sophie.pasek@upmc.fr Comment comparer deux séquences? Le Dot-Plot Tableau indexé par les caractères des deux séquences Identité : Non Identité:

Plus en détail

Objectif : identifier la mutation responsable de la maladie parmi les millions de polymorphisme.

Objectif : identifier la mutation responsable de la maladie parmi les millions de polymorphisme. Identification de gènes morbides Analyses mutationnelles Maladies monogéniques Objectif : identifier la mutation responsable de la maladie parmi les millions de polymorphisme. Plan : Variations du nombre

Plus en détail

Introduction à la bioinformatique

Introduction à la bioinformatique Faculté des Sciences - Rabat Laboratoire de Microbiologie et Biologie Moléculaire -------------------------------------- Université Mohamed V - Agdal Faculté des Sciences B.P. 1014 - Rabat - MAROC TD Biologie

Plus en détail

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire Vous aurez besoin des programmes suivant : d un éditeur de séquence d un visualiseur de structure 3D (PyMOL) Avant-propos

Plus en détail

Recherche et analyse de polymorphismes SNP

Recherche et analyse de polymorphismes SNP Recherche et analyse de polymorphismes SNP 1- Tablet : Détection visuelle de SNP avec Tablet Tablet est un outil graphique de visualisation d assemblage et d alignement de séquences issues de NGS (Next

Plus en détail

Eléments de stratégie d échantillonnage à l adresse des diagnostiqueurs amiante.

Eléments de stratégie d échantillonnage à l adresse des diagnostiqueurs amiante. Eléments de stratégie d échantillonnage à l adresse des diagnostiqueurs amiante. Essai de détermination du nombre de prélèvements à effectuer lors d un diagnostic amiante afin d assurer une représentativité

Plus en détail

BIOINFORMATIQUE APPLIQUEE (BI4U2) EXAMEN DE SECONDE SESSION JUIN 2013

BIOINFORMATIQUE APPLIQUEE (BI4U2) EXAMEN DE SECONDE SESSION JUIN 2013 Année universitaire 2012/2013 Site : X Luminy X St-Charles o St-Jérôme o Cht-Gombert o Aix-Montperrin o Aubagne-SATIS Sujet session de : o 1 er semestre - o 2 ème semestre - X Session 2 Examen de : X L1/L2/oL3

Plus en détail

Master 1 IUP Génomique et Protéomique Examen de GP4 - Bioinformatique

Master 1 IUP Génomique et Protéomique Examen de GP4 - Bioinformatique Master 1 IUP Génomique et Protéomique Examen de GP4 - Bioinformatique Exercice 1 : banques de données. Durée de l épreuve : 2h Documents autorisés Q1) Le schéma ci-dessous représente le nombre d articles

Plus en détail

ÉCOLE CENTRALE DE PÉKIN SCIENCES INDUSTRIELLES POUR L INGÉNIEUR

ÉCOLE CENTRALE DE PÉKIN SCIENCES INDUSTRIELLES POUR L INGÉNIEUR DM4 Page 北 航 中 法 工 程 师 学 院 ÉCOLE CENTRALE DE PÉKIN SCIENCES INDUSTRIELLES POUR L INGÉNIEUR Année académique 24-25 Devoir à la maison n 4 À rendre le vendredi 2 juin 25 Numéro d étudiant à 8 chiffres :

Plus en détail

Introduction à la Bio-Informatique IFT3295/IFT6291/BIN6000. Nadia El-Mabrouk DIRO, Université de Montréal

Introduction à la Bio-Informatique IFT3295/IFT6291/BIN6000. Nadia El-Mabrouk DIRO, Université de Montréal Introduction à la Bio-Informatique IFT3295/IFT6291/BIN6000 Nadia El-Mabrouk DIRO, Université de Montréal Qu est-ce que la Bioinformatique? Qu est-ce que la Bio-informatique? Champs multi-disciplinaire

Plus en détail

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Biodiversité fongique Biodiversité: diversité spécifique d une communauté écologique, correspondant au nombre d espèces et à leur

Plus en détail

VI. Domaines protéiques

VI. Domaines protéiques Chapitre 1 Structure des protéines I. Rappels Définitions II. La Protein Data Bank (PDB) III. Angles dièdres et diagramme de ramachandran IV. Structures secondaires V. Structures supersecondaires VI. Domaines

Plus en détail

TP 5 Enquête sur les maladies héréditaires - III

TP 5 Enquête sur les maladies héréditaires - III TP 5 Enquête sur les maladies héréditaires - III Anémie Falciforme [Sickle-Cell Anemia] Partie 1 Qu est-ce que l anémie falciforme? L'anémie falciforme (sickle cell anemia) est une maladie génétique qui

Plus en détail

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE Plan de Cours Automne 2015 Professeurs: Sylvie Hamel, Département d Informatique et de Recherche Opérationnelle Guillaume Lettre, Institut de Cardiologie

Plus en détail

Bioinformatique Appliquée Recherche de similitudes

Bioinformatique Appliquée Recherche de similitudes Besoin d'accélérer la recherche de similitude dans une banque Bioinformatique Appliquée Recherche de similitudes La recherche de similitude permet de comparer une séquence appelée requête (query) à une

Plus en détail

1. L ADN et l information génétique. l ADN l information génétique est contenue dans l ADN. traduction. comment fait-on une protéine?

1. L ADN et l information génétique. l ADN l information génétique est contenue dans l ADN. traduction. comment fait-on une protéine? 1. L ADN et l information génétique l ADN l information génétique est contenue dans l ADN (ADN) (ARN) 1 2 A G T C U comment fait-on une protéine? traduction l information génétique est organisée par triplets

Plus en détail

Apprentissage d automates sur les protéines

Apprentissage d automates sur les protéines Apprentissage d automates sur les protéines Approche par fusion de fragments significativement similaires (Jobim 04) François Coste, Goulven Kerbellec, Boris Idmont, Daniel Fredouille Christian Delamarche

Plus en détail

L'apport de l'étude des génomes : les innovations génétiques.

L'apport de l'étude des génomes : les innovations génétiques. Introduction : L'apport de l'étude des génomes : les innovations génétiques. Au sein du vivant, les espèces se différencient les unes des autres par l existence de gènes différents. Au sein d une espèce,

Plus en détail

Annotation de protéines

Annotation de protéines JS Varré Université Lille 1 jean-stephane.varre@lifl.fr http://www.lifl.fr/~varre jean-stephane.varre@lifl.fr 1 / Pourquoi faire de l annotation automatique de protéines? Il est difficile de trouver expérimentalement

Plus en détail

Analyse informatique des données moléculaires

Analyse informatique des données moléculaires 6 - Bioinformatique F. CORPET, C. CHEVALET INRA, Laboratoire de Génétique Cellulaire, BP 27, 31326 Castanet-Tolosan cedex e-mail : chevalet@toulouse.inra.fr Analyse informatique des données moléculaires

Plus en détail

Annotation in silico de séquences biologiques

Annotation in silico de séquences biologiques Annotation in silico de séquences biologiques Carl Herrmann TAGC Inserm U928 Université de la Méditerranée carl.herrmann@univmed.fr Pourquoi Diana est-elle ce qu'elle est...? génotype = l'information génétique

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Algorithmes pour la comparaison de séquences II

Algorithmes pour la comparaison de séquences II Algorithmes pour la comparaison de séquences II Hélène TOUZET touzet@lifl.fr Equipe Bioinfo Master recherche informatique www.lifl.fr/~touzet/masterrecherche.html Pourquoi comparer des séquences? Puisque

Plus en détail

Module ITC34 - Algorithmique et Programmation

Module ITC34 - Algorithmique et Programmation Module ITC34 - Algorithmique et Programmation TDs Algorithmique (trois séances) Benoît Darties - benoit.darties@u-bourgogne.fr Univ. Bourgogne Franche-Comté Année universitaire 2015-2016 Avant-propos :

Plus en détail

INTRODUCTION À LA BIO-INFORMATIQUE

INTRODUCTION À LA BIO-INFORMATIQUE Biologie moléculaire-2016 1 INTRODUCTION À LA BIO-INFORMATIQUE Dans cette section, on désire vous donner une introduction sur l utilisation du site web du National Center for Biotechnology Information

Plus en détail

Eléments de correction du Bac Blanc n 2 de Mathématiquesdu Lundi 8 Avril2013. Calculatrice autorisée - Aucun document n'est autorisé.

Eléments de correction du Bac Blanc n 2 de Mathématiquesdu Lundi 8 Avril2013. Calculatrice autorisée - Aucun document n'est autorisé. TES Spé Maths Eléments de correction du Bac Blanc n 2 de Mathématiquesdu Lundi 8 Avril2013 Calculatrice autorisée - Aucun document n'est autorisé. Vous apporterez un grand soin à la présentation et à la

Plus en détail

Le problème des multiplications matricielles enchaînées peut être énoncé comme suit : étant

Le problème des multiplications matricielles enchaînées peut être énoncé comme suit : étant Licence informatique - L Année 0/0 Conception d algorithmes et applications (LI) COURS Résumé. Dans cette cinquième séance, nous continuons l exploration des algorithmes de type Programmation Dynamique.

Plus en détail

Sommaire des mises à jour au document : Indicateurs de rendement des mathématiques M à 9 de l Alberta

Sommaire des mises à jour au document : Indicateurs de rendement des mathématiques M à 9 de l Alberta Sommaire des mises à jour au document : Indicateurs de rendement des mathématiques M à 9 de l Alberta Ce document présente les mises à jour qui ont été faites au document d appui Indicateurs de rendement

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Autres termes clés (Other key terms)

Autres termes clés (Other key terms) Carve-out method Autres termes clés (Other key terms) Norme Rapports d assurance sur les contrôles d une société de services extérieurs (, Assurance Reports on Controls at a Third Party Service Organization)

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance

Plus en détail

TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases

TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases Master 1 :: module BBSG1.2.1 "Bioinformatique" :: année 2006/2007 TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases Encadrants: Emmanuel Talla (talla@ibsm.cnrs-mrs.fr) & Céline Brochier-Armanet

Plus en détail

Algorithmique pour la bioinformatique

Algorithmique pour la bioinformatique lgorithmique pour la bioinformatique Présentation, dotplot, et JV (Vincent Ranwez UM2/ISEM) 1 1. Présentation du module Intervenants V. Ranwez (cours / P) lban Mancheron (P projet) ontenus des P Manipulation

Plus en détail

LES MARQUEURS MOLECULAIRES

LES MARQUEURS MOLECULAIRES LES MARQUEURS MOLECULAIRES Il y a différents types de marqueurs : o Les caractères phénotypiques : limités, observations sur l arbre entier et sur différentes années o Les marqueurs biochimiques o Les

Plus en détail

Microbiologie BIOL 3253. L évolution, la taxinomie et la diversité microbienne

Microbiologie BIOL 3253. L évolution, la taxinomie et la diversité microbienne Microbiologie BIOL 3253 L évolution, la taxinomie et la diversité microbienne Introduction générale et vue d ensemble Taxinomie Science de la classification biologique. Constituée de 3 parties séparées

Plus en détail

Feuille TD 1 : Probabilités discrètes, dénombrement

Feuille TD 1 : Probabilités discrètes, dénombrement Université de Nice-Sophia Antipolis -L2 MASS - Probabilités Feuille TD 1 : Probabilités discrètes, dénombrement Exercice 1 : 1. On doit choisir 2 représentants dans une classe de 40 élèves. Quel est le

Plus en détail

Les fonctions de hachage, un domaine à la mode

Les fonctions de hachage, un domaine à la mode Les fonctions de hachage, un domaine à la mode JSSI 2009 Thomas Peyrin (Ingenico) 17 mars 2009 - Paris Outline Qu est-ce qu une fonction de hachage Comment construire une fonction de hachage? Les attaques

Plus en détail

Alignements de séquences

Alignements de séquences de séquences Problématique Matrices de points Distance d édition + calcul d un alignement optimal Qu est-ce qu une distance Méthode naïve: énumération de tous les alignements possibles Programmation dynamique

Plus en détail

Plus courts chemins, programmation dynamique

Plus courts chemins, programmation dynamique 1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique

Plus en détail

Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires).

Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires). Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires). Objectifs de la fiche : 1. Ouvrir des séquences (ADN ou protéine). 2. Changer de règle de numérotation & faire apparaître

Plus en détail

À PROPOS D IMAGES : Fiche professeur

À PROPOS D IMAGES : Fiche professeur À PROPOS D IMAGES : Fiche professeur Damier Assiette Danseuse Eventail Danseuse 1 FICHE ÉLÈVE (1) Que devient une image lorsqu on la grossit? Ouvrir (par exemple avec l application «Aperçu»), les deux

Plus en détail

Plan. Entreprise Guide ou comment rendre presque séduisantes les procédures statistiques de SAS. Tirer un échantillon d'une table existante (1)

Plan. Entreprise Guide ou comment rendre presque séduisantes les procédures statistiques de SAS. Tirer un échantillon d'une table existante (1) Entreprise Guide ou comment rendre presque séduisantes les procédures statistiques de SAS Présentation au Club des Utilisateurs SAS de Québec 30 octobre 2006 Jean Hardy Services Conseils Hardy Plan Tirer

Plus en détail

Intégrité académique. Guide des solutions logicielles pour la détection du plagiat

Intégrité académique. Guide des solutions logicielles pour la détection du plagiat Intégrité académique Guide des solutions logicielles pour la détection du plagiat Version du 25 avril 2014 Table des matières I. Comparaison à partir d Internet... 3 II. Comparaison à l aide de logiciels

Plus en détail

Introduction à l Analyse des séquences biologiques.

Introduction à l Analyse des séquences biologiques. Introduction à l Analyse des séquences biologiques Christian.Fondrat@dsi.univ-paris5.fr Les outils d analyse de séquences C est QUOI? DES BASES DE DONNEES DES PROGRAMMES Utilitaires (consultation, acquisition

Plus en détail

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce Année 2007-2008 Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce B. Monsuez Projet informatique «Voyageur de commerce» Résolution

Plus en détail

Chapitre 5. Réplication, Réparation et Recombinaison de l ADN

Chapitre 5. Réplication, Réparation et Recombinaison de l ADN Chapitre 5 Réplication, Réparation et Recombinaison de l ADN Réplication de l ADN 1. La complémentarité des bases permet la réplication de l ADN 2. La synthèse de l ADN commence aux origines de réplication

Plus en détail

Université du Québec à Montréal

Université du Québec à Montréal RECUEIL D EXERCICES DE BICHIMIE 6. Les acides nucléiques 6.2. Réplication, transcription et traduction P P P CH 2 H N H N N NH NH 2 Université du Québec à Montréal 6.2. Réplication, transcription et traduction

Plus en détail

5. Validité de la méta-analyse

5. Validité de la méta-analyse 5. Validité de la méta-analyse 5.1. Poids de la preuve d une méta-analyse Le poids de la preuve d un résultat scientifique quantifie le degré avec lequel ce résultat s approche de la réalité. Il ne s agit

Plus en détail

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban EXERCICE 1 : 4 Points Cet exercice est un questionnaire à choix multiples. Aucune justification n est demandée. Pour chacune des questions, une

Plus en détail

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation 2- Les molécules d ADN constituent le génome 2-1 La séquence d ADN représente l information génétique Lettres: A, T, G, C Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine).

Plus en détail

Modèle relationnel Création et modification des relations en SQL

Modèle relationnel Création et modification des relations en SQL Modèle relationnel Création et modification des relations en SQL ENT - Clé sql2009 BD - Mírian Halfeld-Ferrari p. 1 Insertion dans une relation Pour insérer un tuple dans une relation: insert into Sailors

Plus en détail

RdF Reconnaissance des Formes Semaine 11 : RDF sur les chaînes

RdF Reconnaissance des Formes Semaine 11 : RDF sur les chaînes RdF Reconnaissance des Formes Semaine 11 : RDF sur les chaînes Master ASE : http://master-ase.univ-lille1.fr/ Master Informatique : http://www.fil.univ-lille1.fr/ Spécialité IVI : http://master-ivi.univ-lille1.fr/

Plus en détail

Chapitre 1 La recherche de parentés chez les Vertébrés. L établissement de phylogénies. I Critères de comparaison. A Données embryologiques

Chapitre 1 La recherche de parentés chez les Vertébrés. L établissement de phylogénies. I Critères de comparaison. A Données embryologiques Chapitre 1 La recherche de parentés chez les Vertébrés. L établissement de phylogénies. Les êtres vivants, très diversifiés, partagent pourtant des propriétés communes : - une structure cellulaire - un

Plus en détail

ARN non codant et bioinformatique

ARN non codant et bioinformatique ARN non codant et bioinformatique Gènes? Deux types de gènes: gènes codant pour des protèines gènes à ARN Les familles d ARNs ARN ARNs codant ARNs non codants ARNm Ribozymes ARNs traduction Petits ARNs

Plus en détail

Critères pour les méthodes de quantification des résidus potentiellement allergéniques de protéines de collage dans le vin (OIV-Oeno 427-2010)

Critères pour les méthodes de quantification des résidus potentiellement allergéniques de protéines de collage dans le vin (OIV-Oeno 427-2010) Méthode OIV- -MA-AS315-23 Type de méthode : critères Critères pour les méthodes de quantification des résidus potentiellement allergéniques de protéines de collage (OIV-Oeno 427-2010) 1 Définitions des

Plus en détail

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

Anagène. Démarrer avec le logiciel. Ressources. Traitements courants. Aller plus loin

Anagène. Démarrer avec le logiciel. Ressources. Traitements courants. Aller plus loin Anagène Anagène est un logiciel conçu par le CNDP et INRP. Il est destiné à l'exploitation pédagogique de données moléculaires : séquences de gènes et de protéines. L'élève peut ainsi travailler sur des

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

Présentation du design des sites CLINT

Présentation du design des sites CLINT Présentation du design des sites CLINT 1 GÉNÉRALITÉS 1.1 DESIGN Visuel «léger», «simple» mettant en valeur l accès à l information et l information ellemême. Style très moderne s adaptant à l ensemble

Plus en détail

Interrogationécrite d 'InformatiqueUV2

Interrogationécrite d 'InformatiqueUV2 1ères années INSA 2005/06 Durée : 1H15 Interrogationécrite d 'InformatiqueUV2 Les documents sont autorisés, aucune feuille adjointe ne sera prise en compte. Toutes vos réponses doivent figurer dans ce

Plus en détail

Alignement de séquences biologiques

Alignement de séquences biologiques lignement de séquences biologiques Nadia El-Mabrouk Inspiré de: n introduction de Bioinformatics lgorithms www.bioalgorithms.info Neil C. Jones and Pavel. Pevzner Motivation Identification des gènes: Est-ce

Plus en détail

TP B43 Bio-Informatique 1. TP 1 : Les commandes LINUX et les instructions exécutables sous OCTAVE

TP B43 Bio-Informatique 1. TP 1 : Les commandes LINUX et les instructions exécutables sous OCTAVE TP B43 Bio-Informatique 1 TP 1 : Les commandes LINUX et les instructions exécutables sous OCTAVE 1) Quelques commandes LINUX - Ouvrir un terminal (menu Applications Accessoires Terminal) - Afficher la

Plus en détail

Bases de données multimédia VIII indexation vidéo & audio

Bases de données multimédia VIII indexation vidéo & audio Bases de données multimédia VIII indexation vidéo & audio ENSIMAG 2014-2015 Matthijs Douze & Karteek Alahari Plan Spécificité du problème Filtrage temporel Détecteur spatio-temporels Aggrégation temporelle

Plus en détail