Différentes applications de l oracle des facteurs

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Différentes applications de l oracle des facteurs"

Transcription

1 Différentes applications de l oracle des facteurs Thierry Lecroq LITIS en collaboration avec : Joël l Alexandre, Hélène H Dauchel,, Arnaud Lefebvre et Élise Prieur. Séminaire MORO 01/02/06

2 Plan rappels de biologie moléculaire (en images) notations oracle des facteurs FORRepeats compression vecteurs des suffixes Séminaire MORO 01/01/06-2

3 Une cellule eucaryote Séminaire MORO 01/01/06-3

4 Un chromosome Séminaire MORO 01/01/06-4

5 L ADN Séminaire MORO 01/01/06-5

6 Les paires de bases Séminaire MORO 01/01/06-6

7 Les nucléotides Séminaire MORO 01/01/06-7

8 De l ADN à la protéine (en passant par l ARN) Séminaire MORO 01/01/06-8

9 La réplication de l ADN Séminaire MORO 01/01/06-9

10 Les gènes Séminaire MORO 01/01/06-10

11 De l ADN à l ARN : la transcription Séminaire MORO 01/01/06-11

12 L ARN Séminaire MORO 01/01/06-12

13 Les codons Séminaire MORO 01/01/06-13

14 Le code génétique Séminaire MORO 01/01/06-14

15 Tailles des génomes (Mb) Escherichia coli (bactérie) 4,6 Saccharomyces cerevisiae (levure) 13 C. elegans (ver) 100 Arabidopsis thaliana (plante) 125 Drosophila melanogaster (mouche) 180 Riz 400 Homo sapiens 3300 Fougère Amoeba dubia (amibe) Séminaire MORO 01/01/06-15

16 Les deux thèmes d ABISS Répétitions Épissage alternatif Séminaire MORO 01/01/06-16

17 Les répétitions On estime que le génome g humain contient plus de 90% de séquences répétées r qui peuvent être de plusieurs types : répétitions en tandem ; répétitions dispersées. es. Séminaire MORO 01/01/06-17

18 L épissage alternatif 1 ARN messager prémature exon 1 exon 2 exon 3 épissage 1 épissage 2 exon 1 exon 2 exon 3 exon 1 exon 3 plusieurs ARN messagers Séminaire MORO 01/01/06-18

19 L épissage alternatif (2) nombre de génes humains escomptés s avant séquençage : ~ nombre de gènes g estimés s après s séquens quençage : ~ une explication possible : l épissage alternatif Séminaire MORO 01/01/06-19

20 Notations Α : alphabet (ensemble de lettres ou bases) : concaténation nation Α* * : ensemble des suites finies de lettres w Α* * : mot ou séquence w : longueur du mot w w = w[0] w[1] w[ [ w -1] -1] = w[0.. [0.. w -1] -1] i (0 i w -1) -1) : position sur le mot w ε : mot vide ( ε = 0) Séminaire MORO 01/01/06-20

21 Notations (2) u est un préfixe v est un suffixe de w si w = uzv z est un facteur Fact(w) ) : ensemble des facteurs de w Alph(w) ) : ensemble des lettres de w Séminaire MORO 01/01/06-21

22 Séquences biologiques ADN : Α = {a,{ c, g, t } (acides nucléiques, paires de base) ARN : Α = {a,{ c, g, u } protéine : card A = 20 (acides aminés) Séminaire MORO 01/01/06-22

23 Répétitions exactes M. Crochemore,, An optimal algorithm for computing the repetitions in a word, Information Processing Letters 12 (5) (1983) R. Kolpakov & G. Kucherov,, On maximal repetitions in words, Journal of Discrete Algorithms 1 (1) (2000) W. F. Smyth,, Repetitive perhaps, but not boring, Theoretical Computer Science 249 (5) (2000) Séminaire MORO 01/01/06-23

24 Structures d'index Arbre des suffixes Arbre compact des suffixes Table des suffixes Automate des suffixes (DAWG) Automate compact des suffixes (CDAWG) Vecteurs de suffixes Séminaire MORO 01/01/06-24

25 Oracle des facteurs Allauzen,, Crochemore, Raffinot, 1999 Pour un mot w de longueur m l'oracle des facteurs de w est un automate (Q,( q 0, F, δ) ) où o : Q = {0, 1,..., m} } est l'ensemble des états q 0 = 0 est l'état initial F = Q est l'ensemble des états terminaux δ est la fonction de transition Séminaire MORO 01/01/06-25

26 Oracle des facteurs Allauzen, Crochemore, Raffinot,, 1999 Pour un mot w de longueur m l'oracle des facteurs de w : reconnaît t au moins tous les facteurs de w possède exactement m + 1 états possède entre m et 2m 2-1 transitions Séminaire MORO 01/01/06-26

27 Exemple d'oracle des facteurs w = aattatt a a t t a t t t t a Fact(w) = { ε, a, b, aa, at, ta, tt, aat, att, tat, tta, aatt, atta, tatt, ttat, aatta, attat, ttatt, aattat, attatt, aattatt } Séminaire MORO 01/01/06-27

28 w = aattatt Langage de l'oracle a a t t a t t t t a ata est reconnu bien qu'il ne soit pas un facteur de aattatt Séminaire MORO 01/01/06-28

29 Construction de l'oracle des facteurs w = aatt a a t t t t Lien suffixe de l'état i : suf(i) = δ(0,x) où x est le plus long suffixe répété de w[0..i-1] Séminaire MORO 01/01/06-29

30 Construction de l'oracle des facteurs w = aatta a a t t a 5 t t a Séminaire MORO 01/01/06-30

31 Construction de l'oracle des facteurs w = aattag a a t t a 5 g 6 t t a g g Séminaire MORO 01/01/06-31

32 Construction de l'oracle des facteurs Théor orème [ACR 99] : L'oracle des facteurs d'un mot de longueur m peut être construit en temps et en espace O(m). Séminaire MORO 01/01/06-32

33 Oracle des facteurs d'un mot w bijection entre : les longueurs des préfixes de w les états de l'oracle des facteurs de w toutes les transitions qui mènent m à l'état i sont étiquetées es par la lettre w[i-1] deux types de transitions : transitions internes : δ(i, w[i]) = i+1 pour 0 1 pour 0 i m- m-1 transitions externes : δ(i, w[j-1]) = j avec j-i > 1 pour 0 i < j m Séminaire MORO 01/01/06-33

34 Représentation de l'oracle des facteurs w = aattatt a a t t a t t t t a aattatt,(0,3),(1,3),(3,5) représentation indépendante de l'alphabet Séminaire MORO 01/01/06-34

35 Taille en pratique de l oracle environ 10,5 fois la longueur de la séquences (sans raffinement) Séminaire MORO 01/01/06-35

36 Recherche exacte de mot L'oracle des facteurs d'un mot w de longueur m ne reconnaît t qu'un seul mot de longueur m Séminaire MORO 01/01/06-36

37 Calcul de répétitions avec l'oracle des facteurs Pour un mot w de longueur m on définit d : LRS[i] ] = max { v v est suffixe de w[0.. [0..i]] et v est facteur de w[0.. [0..i-1] } pour 0 i < m Théor orème [LL2000] : il est possible de calculer en temps et espace O(m) ) pour 0 i < m : 0 lrs[i] LRS[i] En pratique lrs[i] ] est très s proche de LRS[i]. Séminaire MORO 01/01/06-37

38 Que calcule-t-on? w suf(i) i lrs(i) lrs(i) Séminaire MORO 01/01/06-38

39 Calcul de répétitions avec l'oracle des facteurs w = attcatcgatc 0 a 1 t 2 t 3 c 4 a 5 t 6 c g a t c Séminaire MORO 01/01/06-39

40 Séminaire MORO 01/01/06-40

41 Séminaire MORO 01/01/06-41

42 Séminaire MORO 01/01/06-42

43 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-43

44 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-44

45 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-45

46 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-46

47 Séminaire MORO 01/01/06-47

48 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-48

49 Résultats expérimentaux Mb exact H. pylori 1,59 2s B. subtilis 4,02 6s E. coli 4,42 6s S. cerevisiae 11,50 14s A. thaliana II et IV 35,47 57s C. elegans 92,40 122s 500 MHz, 1 Go Séminaire MORO 01/01/06-49

50 Recherche de répétitions approchées Extension à droite et à gauche des répétitionsr exactes en utilisant différentes distances. En étendant les répétitions r de longueur 15 et en fixant un seuil de 85% d identitd identité on double les temps de calcul. Séminaire MORO 01/01/06-50

51 Compression séquentielle sans perte On code les mots soit par une lettre lors de sa première occurrence soit par des couples (position, longueur) lors de répétitions r de facteurs Séminaire MORO 01/01/06-51

52 Compression séquentielle sans perte On suppose que w[0.. [0..i]] a déjà d été codé j = min{ k > i k - lrs[k] ] > i + 1 et pour i < h < k : h - lrs[h] i + 1 } alors on code : (suf(j-1) - j i, j - 1 i) w[i + 1] si w[i + 1] Alph(w[0.. [0..i]) Séminaire MORO 01/01/06-52

53 Exemple de compression séquentielle w = attcatcgatc 0 a 1 t 2 t 3 c 4 a 5 t 6 c g a t c at(1,1) (1,1)c(0,2)(3,1)g(0,2)(3,1) Séminaire MORO 01/01/06-53

54 Compression séquentielle : résultats gzip compror bzip2 Fichier bpc ct dc % ct dt % ct dt ChrIV 2,17 230,00 2,00 2,9 37,00 9,65 2,13 37,00 9,65 ChrII 2,18 261,00 2,00 2,9 42,00 10,90 2,14 40,00 12,00 bib 2,5 0,14 0,01 3,1 0,21 0,06 1,97 0,17 0,04 book1 3,25 1,18 0,08 3,8 2,00 0,50 2,42 1,47 0,47 book2 2,7 0,68 0,06 3,3 1,30 0,35 2,06 1,1 0,33 progc 2,67 0,04 0,01 3,8 0,09 0,02 2,53 0,07 0,02 trans 1,61 0,08 0,01 2,16 0,13 0,04 1,52 0,14 0,03 thesis 1,74 7,47 0,65 0,94 7,65 2,37 1,3 18,6 3,44 article1 1,65 5,14 2,5 1,2 37,5 2,5 1,65 5,14 2,5 article2 2,2 24,6 7,1 1,25 51,5 8,2 2,04 8,8 8,6 alpha 0,03 0,08 0,57 0,002 0,3 0,55 0,003 4,45 0,6 Séminaire MORO 01/01/06-54

55 Arbres des suffixes Arbre des suffixes de aatttatttatta$ Séminaire MORO 01/01/06-55

56 Vecteurs des suffixes Vecteurs des suffixes de aatttatttatta$ Séminaire MORO 01/01/06-56

57 Vecteurs des suffixes Séminaire MORO 01/01/06-57

58 Vecteur compact des suffixes Séminaire MORO 01/01/06-58

59 Références Maxime Crochemore,, Christophe Hancart et Thierry Lecroq Algorithmique du texte Vuibert,, Séminaire MORO 01/01/06-59

60 Références The National Health Museum Graphics Gallery Séminaire MORO 01/01/06-60

61 Références A. Lefebvre, Une nouvelle heuristique pour la détection d de répétitions r sur des génomes g complets, pour la comparaison de génomes g et pour la compression,, thèse de doctorat de l Universitl Université de Rouen, A. Lefebvre et T. Lecroq,, A heuristic for computing repeats with a factor oracle: Application to biological sequences, International Journal of Computer Mathematics 79(12) (2002) A. Lefebvre, T. Lecroq et J. Alexandre,, An improved algorithm for finding longest repeats with a modified factor oracle, Journal of Automata, Languages and Combinatorics 8(4) (2003) A. Lefebvre, T. Lecroq,, H. Dauchel et J. Alexandre, FORRepeats: : detects repeats on entire chromosomes and between genomes, Bioinformatics 19(3) (2003) A. Lefebvre et T. Lecroq, Compror: : on-line lossless compression with a factor oracle, Information Processing Letters 83(1) (2002) 1-6. Séminaire MORO 01/01/06-61

62 Références L. Cleophas,, G. Zwaan et B. Watson,, Constructing Factor Oracles, in Proceedings of the Prague Stringology Conference 2003, R. Kato,, A New Full-Text Search Algorithm Using Factor Oracle as Index, Research Report, Tokyo Institute of Technology,, R. Kato,, A New Text Search Algorithm Using Factor Oracle as Full-Text Index, Research Report, Tokyo Institute of Technology,, A. Mancheron et C. Moan,, Combinatorial Characterization of the Language Recognized by Factor and Suffix Oracles, in Proceedings of the Prague Stringology Conference 2004, R. Kato, Finding Maximal Repeats with Factor Oracles, Research Report, Tokyo Institute of Technology,, R. Kato et O. Watanabe, Substring search and repeat search using factor oracles, Information Processing Letters 93( 6) 2005, H. Iwasaki, Error analysis of factor oracles, Research Report, Tokyo Institute of Technology,, H. Iwasaki,, A detail analysis on factor oracle construction of computing repeated factors, Research Report, Tokyo Institute of Technology,, Séminaire MORO 01/01/06-62

63 Perspectives construire l'oracle des facteurs de w[i+k....j+k] à partir de l'oracle des facteurs de w[i....j]] en temps amorti O(k) ) ; Séminaire MORO 01/01/06-63

64 Perspectives construire l'oracle des facteurs de w[i+k....j+k] à partir de l'oracle des facteurs de w[i....j]] en temps amorti O(k) ) ; construire une base d oracles ; alignement multiple avec F. Guinand (LIH, Le Havre). Séminaire MORO 01/01/06-64

Validation et génération de tableaux de Knuth-Morris-Pratt

Validation et génération de tableaux de Knuth-Morris-Pratt Validation et génération de tableaux de Knuth-Morris-Pratt Jean-Pierre Duval, Thierry Lecroq et Arnaud Lefebvre {Jean-Pierre.Duval,Thierry.Lecroq,Arnaud.Lefebvre}@univ-rouen.fr Laboratoire d Informatique,

Plus en détail

Mes histoires d amour avec les travaux de Maxime Crochemore. Gregory Kucherov LIFL/CNRS/INRIA, Lille, France

Mes histoires d amour avec les travaux de Maxime Crochemore. Gregory Kucherov LIFL/CNRS/INRIA, Lille, France Mes histoires d amour avec les travaux de Maxime Crochemore Gregory Kucherov LIFL/CNRS/INRIA, Lille, France Marne-la-Vallée, 26 octobre 2007 travaux de Maxime (données du 2/11/2006) 59 articles de revue

Plus en détail

Marc Chemillier Master Atiam (Ircam), 2009-2010

Marc Chemillier Master Atiam (Ircam), 2009-2010 MMIM Modèles mathématiques en informatique musicale Marc Chemillier Master Atiam (Ircam), 2009-2010 Notions théoriques sur les langages formels (Partie I) - Définitions générales o Mots, langages o Monoïdes

Plus en détail

Les propriétés physicochimiques de l ADN Structure des génomes La chromatine

Les propriétés physicochimiques de l ADN Structure des génomes La chromatine Cours de Biologie Moléculaire L2S3 Structure de l ADN Organisation des génomes 2ème cours (1h30) Les propriétés physicochimiques de l ADN Structure des génomes La chromatine L ADN est chargé négativement

Plus en détail

Algorithmes rapides de recherche exacte de mot

Algorithmes rapides de recherche exacte de mot Algorithmes rapides de recherche exacte de mot Thierry Lecroq Thierry.Lecroq@univ-rouen.fr Laboratoire d Informatique, du Traitement de l Information et des Systèmes. Une partie de ce travail a été effectuée

Plus en détail

De la biologie molécualire à la génomique

De la biologie molécualire à la génomique De la biologie molécualire à la génomique Pierre Neuvial École Nationale de la Statistique et de l Administration Économique Méthodes statistiques pour la biologie Plan du cours 1 Introduction à la biologie

Plus en détail

L'analyse protéomique et les sciences -omiques: des données massives à interpréter et sauvegarder

L'analyse protéomique et les sciences -omiques: des données massives à interpréter et sauvegarder L'analyse protéomique et les sciences -omiques: des données massives à interpréter et sauvegarder Christine CARAPITO, Alexandre BUREL, Patrick GUTERL, Alexandre WALTER, Jérôme PANSANEL, Fabrice VARRIER,

Plus en détail

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire Plan 1 Banques de données 2 Comparaison de 2 séquences Dotplot, alignement optimal Recherche de similarité 3 Alignement multiple l 4 Phylogénie moléculaire Recherche de similarité 1 séquence (Query) comparée

Plus en détail

Marc Chemillier Master M2 Atiam (Ircam), 2011-2012

Marc Chemillier Master M2 Atiam (Ircam), 2011-2012 MMIM Moèles mathématiques en informatique musicale Marc hemillier Master M2 tiam (Ircam), 2011-2012 Oracle es facteurs (logiciels improvisation OMax, ImproteK) - onstruction e l oracle o Liens suffixiels

Plus en détail

Bioinformatique dans l IUP

Bioinformatique dans l IUP Bioinformatique dans l IUP Intervenants Equipe Bioinfo (Laboratoire d Informatique Fondamentale de Lille) Cours : Jean-Stéphane Varré (jean-stephane.varre@lifl.fr) TD sur machine : Jean-Stéphane Varré,

Plus en détail

Biologie Moléculaire et Organismes Modèles

Biologie Moléculaire et Organismes Modèles Biologie Moléculaire et Organismes Modèles Sami Khuri Department of Computer Science San José State University khuri@cs.sjsu.edu Usine de Protéines Les protéines sont responsables de la plupart des fonctions

Plus en détail

Série : STL Spécialité biotechnologies SESSION 2014 BACCALAURÉAT TECHNOLOGIQUE

Série : STL Spécialité biotechnologies SESSION 2014 BACCALAURÉAT TECHNOLOGIQUE BACCALAURÉAT TECHNLGIQUE Série : STL Spécialité biotechnologies SESSIN 2014 CBSV : sous épreuve coefficient 4 Biotechnologies : sous épreuve coefficient 4 Durée totale de l épreuve: 4 heures Les sujets

Plus en détail

Université du Québec à Montréal

Université du Québec à Montréal RECUEIL D EXERCICES DE BICHIMIE 6. Les acides nucléiques 6.2. Réplication, transcription et traduction P P P CH 2 H N H N N NH NH 2 Université du Québec à Montréal 6.2. Réplication, transcription et traduction

Plus en détail

Chapitre 1 La révolution des sciences de la vie par la génétique

Chapitre 1 La révolution des sciences de la vie par la génétique Chapitre 1 La révolution des sciences de la vie par la génétique Variation génétique de la couleur des grains de maïs. Chaque grain représente un individu de constitution génétique distincte. La sélection

Plus en détail

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE Plan de Cours Automne 2015 Professeurs: Sylvie Hamel, Département d Informatique et de Recherche Opérationnelle Guillaume Lettre, Institut de Cardiologie

Plus en détail

Rapport de Monitorat. Élise Prieur

Rapport de Monitorat. Élise Prieur Rapport de Monitorat Élise Prieur 2003-2006 Table des matières 1 Introduction 2 2 Présentation générale 2 3 Expérience antérieure 2 4 Enseignement de moniteur 3 4.1 Activités d enseignement.....................

Plus en détail

Quelques termes-clef de biologie moléculaire et leur définition

Quelques termes-clef de biologie moléculaire et leur définition Acide aminé (AA) Quelques termes-clef de biologie moléculaire et leur définition Isabelle Quinkal INRIA Rhône-Alpes Septembre 2003 Petite molécule dont l enchaînement compose les protéines - on dit qu

Plus en détail

Dans chaque cellule: -génome nucléaire -génome mitochondrial (-génome chloroplastique)

Dans chaque cellule: -génome nucléaire -génome mitochondrial (-génome chloroplastique) 6- Structure et organisation des génomes 6-1 Génomes eucaryotes Dans chaque cellule: -génome nucléaire -génome mitochondrial (-génome chloroplastique) 6-1-1 Génomes nucléaires 6-1-1-1 Nombre d exemplaires

Plus en détail

1. L ADN et l information génétique. l ADN l information génétique est contenue dans l ADN. traduction. comment fait-on une protéine?

1. L ADN et l information génétique. l ADN l information génétique est contenue dans l ADN. traduction. comment fait-on une protéine? 1. L ADN et l information génétique l ADN l information génétique est contenue dans l ADN (ADN) (ARN) 1 2 A G T C U comment fait-on une protéine? traduction l information génétique est organisée par triplets

Plus en détail

Définitions. Numéro à préciser. (Durée : )

Définitions. Numéro à préciser. (Durée : ) Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.

Plus en détail

Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires).

Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires). Fiche technique : utilisation d Anagène (logiciel d étude des données moléculaires). Objectifs de la fiche : 1. Ouvrir des séquences (ADN ou protéine). 2. Changer de règle de numérotation & faire apparaître

Plus en détail

LA SYNTHÈSE DES PROTÉINES

LA SYNTHÈSE DES PROTÉINES LA SYNTHÈSE DES PROTÉINES La transcription Information : dans le noyau (sous forme d'adn) Synthèse des protéines : dans le cytoplasme (au niveau des ribosomes du reticulum endoplasmique) L'ADN ne sort

Plus en détail

Expression des gènes Comparatif entre procaryotes et eucaryotes

Expression des gènes Comparatif entre procaryotes et eucaryotes Comparaison procaryotes/ 2TSbc Expression des gènes Comparatif entre procaryotes et eucaryotes La majeure partie des connaissances de biologie moléculaire a d'abord débuté par l'étude des phénomènes chez

Plus en détail

Chapitre 1. La cellule : unité morphologique et fonctionnelle

Chapitre 1. La cellule : unité morphologique et fonctionnelle Chapitre 1. La cellule : unité morphologique et fonctionnelle 1. Historique de la biologie : Les premières cellules eucaryotes sont apparues il y a 3 milliards d années. Les premiers Homo Sapiens apparaissent

Plus en détail

Compression méthode de Huffman

Compression méthode de Huffman Compression méthode de Huffman Thierry Lecroq Université de Rouen FRANCE La méthode de Huffman consiste à remplacer les caractères les plus fréquents par des codes courts et les caractères les moins fréquents

Plus en détail

Cahier de texte de la classe 1 ère 4 - SVT

Cahier de texte de la classe 1 ère 4 - SVT Cahier de texte de la classe 1 ère 4 - SVT DATE SEQUENCE lundi 12 : revoir la fiche méthodologique «utiliser le microscope optique» (disponible sur le site du lycée) Lundi 12 1 er contact avec les élèves.

Plus en détail

Algorithmes pour la comparaison de séquences II

Algorithmes pour la comparaison de séquences II Algorithmes pour la comparaison de séquences II Hélène TOUZET touzet@lifl.fr Equipe Bioinfo Master recherche informatique www.lifl.fr/~touzet/masterrecherche.html Pourquoi comparer des séquences? Puisque

Plus en détail

GM- Support de l'information génétique ; structure et fonction du génome. Support de l'information génétique ; structure et fonction du génome

GM- Support de l'information génétique ; structure et fonction du génome. Support de l'information génétique ; structure et fonction du génome Mercredi 9 octobre ABECASSIS Anna L2 GM Pr Beroud 16 pages Support de l'information génétique ; structure et fonction du génome Plan A. Des gènes aux protéines I. Structure de l'adn II. Structure des gènes

Plus en détail

Plus courts chemins, programmation dynamique

Plus courts chemins, programmation dynamique 1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique

Plus en détail

Génie génétique. Définition : Outils nécessaires : Techniques utilisées : Application du génie génétique : - Production de protéines

Génie génétique. Définition : Outils nécessaires : Techniques utilisées : Application du génie génétique : - Production de protéines Génie génétique Définition : Ensemble de méthodes d investigation et d expérimentation sur les gènes. Outils nécessaires : ADN recombinant, enzyme de restriction, vecteur, banque ADNc, sonde nucléique...

Plus en détail

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation 2- Les molécules d ADN constituent le génome 2-1 La séquence d ADN représente l information génétique Lettres: A, T, G, C Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine).

Plus en détail

Notions de bioinformatique

Notions de bioinformatique Notions de bioinformatique Souvent les avancées des biotechnologies ont été possibles du fait d avancées technologiques relevant d autres domaines que la biologie. - En juillet 1995 le séquençage d Haemophilus

Plus en détail

Les microarrays: technologie pour interroger le génome

Les microarrays: technologie pour interroger le génome Les microarrays: technologie pour interroger le génome Patrick DESCOMBES patrick.descombes@frontiers-in-genetics.org Plate forme génomique NCCR Frontiers in Genetics Université de Genève http://genomics.frontiers-in-genetics.org

Plus en détail

Ecole Centrale Paris Année 2009-2010 1 ère année. Cours «Biologie». Vendredi 28 mai 2010

Ecole Centrale Paris Année 2009-2010 1 ère année. Cours «Biologie». Vendredi 28 mai 2010 Ecole Centrale Paris Année 2009-2010 1 ère année. Cours «Biologie». Vendredi 28 mai 2010 Contrôle des Connaissances. 2 ème session) (Durée : 1h30, tous documents autorisés, ordinateur interdit) Important

Plus en détail

Chapitre 2. La synthèse protéique : la relation entre le génotype et le phénotype.

Chapitre 2. La synthèse protéique : la relation entre le génotype et le phénotype. Chapitre 2. La synthèse protéique : la relation entre le génotype et le phénotype. Les maladies génétiques comme la drépanocytose ou l'albinisme sont liées à des modifications du génotype des individus

Plus en détail

I. Histoire de la biologie moléculaire (Q1 à Q5)

I. Histoire de la biologie moléculaire (Q1 à Q5) I. Histoire de la biologie moléculaire (Q1 à Q5) Q1. Concernant les premières lois sur l hérédité : Elles ont été établies grâce à des expériences menées sur la drosophile (Drosophila melanogaster). Elles

Plus en détail

Algorithmique et Analyse d Algorithmes

Algorithmique et Analyse d Algorithmes Algorithmique et Analyse d Algorithmes L3 Info Cours 11 : Arbre couvrant Prétraitement Benjamin Wack 2015-2016 1 / 32 La dernière fois Rappels sur les graphes Problèmes classiques Algorithmes d optimisation

Plus en détail

Quelques caractéristiques des microsatellites : définition, densité et structure. P. Jarne CEFE - Montpellier

Quelques caractéristiques des microsatellites : définition, densité et structure. P. Jarne CEFE - Montpellier Quelques caractéristiques des microsatellites : définition, densité et structure P. Jarne CEFE - Montpellier Buts * Définitions * Méthodes d études de la distribution * Qques résultats : distribution dans

Plus en détail

UEL BIO36. Le Caryotype Humain. Plan «structure des génomes» (dc) Le Génome, C est : Introduction à la biologie moléculaire (pour non SV, non BIM)

UEL BIO36. Le Caryotype Humain. Plan «structure des génomes» (dc) Le Génome, C est : Introduction à la biologie moléculaire (pour non SV, non BIM) Plan «structure des génomes» (dc) UEL BIO36 Introduction à la biologie moléculaire (pour non SV, non BIM) Définition Le support physique Les chromosomes dans le noyau : nombre, morphologie, centromère,

Plus en détail

LE SEQUENCAGE DU GENOME HUMAIN. Historique Séquençage Résultats

LE SEQUENCAGE DU GENOME HUMAIN. Historique Séquençage Résultats LE SEQUENCAGE DU GENOME HUMAIN Historique Séquençage Résultats Séquençage de Macromolécules Enchaînement d unités répétitives Petite molécule Couper de façon précise en sous-ensemble 50 25 25 reconstruire

Plus en détail

Prédiction de gènes. Présentation du problème. Open Reading Frame. HMM (Modèles de Markov cachés) Fonctionnement Exemples Limites

Prédiction de gènes. Présentation du problème. Open Reading Frame. HMM (Modèles de Markov cachés) Fonctionnement Exemples Limites Présentation du problème Open Reading Frame Fonctionnement Exemples Limites Procaryotes versus eucaryotes Validation des résultats: 1) comparaison de séquences 2) utilisation de données statistiques HMM

Plus en détail

La synthèse des protéines transcription code génétique traduction

La synthèse des protéines transcription code génétique traduction CEC André-Chavanne BIO 3 OS La synthèse des protéines transcription code génétique traduction I. La «Transcription» : de l ADN à l ARNm. L'adresse suivante permet d accéder à une ANIMATION sur la TRANSCRIPTION.

Plus en détail

RdF Reconnaissance des Formes Semaine 12 : Chaînes, langages et grammaires

RdF Reconnaissance des Formes Semaine 12 : Chaînes, langages et grammaires RdF Reconnaissance des Formes Semaine 12 : Chaînes, langages et grammaires Master ASE : http://master-ase.univ-lille1.fr/ Master Informatique : http://www.fil.univ-lille1.fr/ Spécialité IVI : http://master-ivi.univ-lille1.fr/

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Eléments primordiaux de biologie moléculaire

Eléments primordiaux de biologie moléculaire Eléments primordiaux de biologie moléculaire Pourquoi s intéresser au matériel génétique? Base de l information génétique Tissu Cellule Noyau Organisme entier Lieu où est localisé l ADN Mol d ADN qui est

Plus en détail

Algorithmique P2. HeapSort et files de priorité Ulg, 2009-2010 Renaud Dumont

Algorithmique P2. HeapSort et files de priorité Ulg, 2009-2010 Renaud Dumont Algorithmique P2 HeapSort et files de priorité Ulg, 2009-2010 Renaud Dumont Structure de tas - arbre Un tas est une structure de données qui Permet un nouveau type de tri (Tri par tas) Permet l'implémentation

Plus en détail

PRINCIPALES TECHNIQUES UTILISEES EN GENOMIQUE

PRINCIPALES TECHNIQUES UTILISEES EN GENOMIQUE PRINCIPALES TECHNIQUES UTILISEES EN GENOMIQUE Définitions généralités Quelques chiffres 46 chromosomes 22 paires d autosomes (n=44) 1 paire de gonosomes (n=2) : XX/F et XY/H 300 bandes cytogénétiques =

Plus en détail

Mathématiques pour l informatique 1 notes de cours sur la première partie

Mathématiques pour l informatique 1 notes de cours sur la première partie 1 Mathématiques pour l informatique 1 notes de cours sur la première partie L1 Université Paris-Est, Marne-la-Vallée Cyril Nicaud Organisation Ce demi-cours est composé de 6 séances de cours et 6 séances

Plus en détail

Théorie des Langages Formels Chapitre 5 : Automates minimaux

Théorie des Langages Formels Chapitre 5 : Automates minimaux Théorie des Langages Formels Chapitre 5 : Automates minimaux Florence Levé Florence.Leve@u-picardie.fr Année 2015-2016 1/29 Introduction Les algorithmes vus précédemment peuvent mener à des automates relativement

Plus en détail

Alignements de séquences

Alignements de séquences de séquences Problématique Matrices de points Distance d édition + calcul d un alignement optimal Qu est-ce qu une distance Méthode naïve: énumération de tous les alignements possibles Programmation dynamique

Plus en détail

Cours de Biologie Cellulaire L1 2006/2007

Cours de Biologie Cellulaire L1 2006/2007 Cours de Biologie Cellulaire L1 2006/2007 Qu est ce que la biologie cellulaire? La biologie cellulaire étudie les cellules et leurs organites, les processus vitaux qui s'y déroulent ainsi que les mécanismes

Plus en détail

Prédiction de gènes. Cours de présentation des outils bio-informatiques pour la localisation puis l'étude des gènes. Equipe Bonsai (2014)

Prédiction de gènes. Cours de présentation des outils bio-informatiques pour la localisation puis l'étude des gènes. Equipe Bonsai (2014) Prédiction de gènes Cours de présentation des outils bio-informatiques pour la localisation puis l'étude des gènes Equipe Bonsai (2014) La localisation des gènes C'est la première étape pour interpréter

Plus en détail

Transformée de Burrows-Wheeler et mapping de données RNA-seq

Transformée de Burrows-Wheeler et mapping de données RNA-seq Transformée de Burrows-Wheeler et mapping de données RNA-seq MAPPI, journée indexation 6 juin 2011 Introduction Indexation But : Recherche rapide d'une information dans de grands volumes de données Indexation

Plus en détail

Tutoriel pour les enseignants de lycée. Rappel du contenu des programmes au lycée en classe de seconde

Tutoriel pour les enseignants de lycée. Rappel du contenu des programmes au lycée en classe de seconde Tutoriel pour les enseignants de lycée Ce document sert à l enseignant pour préparer différentes séquences pédagogiques afin d aborder : les questions de la génétique, des maladies génétiques, et les métiers

Plus en détail

Recherche de Motifs. Samuel Blanquart, d après les supports de Hélène Touzet. AeA M1 informatique

Recherche de Motifs. Samuel Blanquart, d après les supports de Hélène Touzet. AeA M1 informatique Recherche de Motifs Samuel Blanquart, d après les supports de Hélène Touzet AeA M informatique Longtemps, je me suis couché de bonne heure. Parfois, à peine ma bougie éteinte, mes yeux se fermaient si

Plus en détail

Biologie Moléculaire et Organismes Modèles

Biologie Moléculaire et Organismes Modèles Biologie Moléculaire et Organismes Modèles Sami Khuri Department of Computer Science San José State University khuri@cs.sjsu.edu Plan du Cours Biologie Moléculaire et Organismes Modèles Qu est-ce que la

Plus en détail

Anagène. Démarrer avec le logiciel. Ressources. Traitements courants. Aller plus loin

Anagène. Démarrer avec le logiciel. Ressources. Traitements courants. Aller plus loin Anagène Anagène est un logiciel conçu par le CNDP et INRP. Il est destiné à l'exploitation pédagogique de données moléculaires : séquences de gènes et de protéines. L'élève peut ainsi travailler sur des

Plus en détail

A BIOINFORMATIQUE FONCTIONNELLE

A BIOINFORMATIQUE FONCTIONNELLE Biologie moléculaire-2017 1 A BIOINFORMATIQUE FONCTIONNELLE PRÉDIRE LA FONCTION D UNE PROTÉINE INCONNUE Supposons que vous avez trouvé la séquence d'acides aminés d'une protéine inconnue et que vous souhaitez

Plus en détail

TD 1 Biais de codons

TD 1 Biais de codons Module LV348 Version enseignant TD 1 page 1/7 TD 1 Biais de codons Revu dernièrement par Mathilde Carpentier, Cyril Gallut et Joël Pothier Version du 15 janvier 2014 L objectif de ce TP est de prendre

Plus en détail

Modélisation coalescente pour la détection précoce d un cancer

Modélisation coalescente pour la détection précoce d un cancer Modélisation coalescente pour la détection précoce d un cancer Mathieu Emily 27 Novembre 2007 Bioinformatics Research Center - Université d Aarhus Danemark Mathieu Emily Coalescence et cancer 1 Introduction

Plus en détail

TP B43 Bio-Informatique 1. TP 1 : Les commandes LINUX et les instructions exécutables sous OCTAVE

TP B43 Bio-Informatique 1. TP 1 : Les commandes LINUX et les instructions exécutables sous OCTAVE TP B43 Bio-Informatique 1 TP 1 : Les commandes LINUX et les instructions exécutables sous OCTAVE 1) Quelques commandes LINUX - Ouvrir un terminal (menu Applications Accessoires Terminal) - Afficher la

Plus en détail

ALIGNEMENT PLUS RAPIDE

ALIGNEMENT PLUS RAPIDE ALIGNEMENT PLUS RAPIDE 1. méthodes heuristiques : hachage, arbres de suffixe, PD limitée (taille totale de trous bornée) 2. PD éparse (pour sous-séquence commune ou chaînage en alignement global heuristique)

Plus en détail

Technologie de l ADN recombinant. Complément de cours sur: «Les Méthodes d Etude de la Cellule»

Technologie de l ADN recombinant. Complément de cours sur: «Les Méthodes d Etude de la Cellule» Technologie de l ADN recombinant Complément de cours sur: «Les Méthodes d Etude de la Cellule» 1 Les techniques de l ADN Recombinant But: isoler des fragments d ADN de génomes complexes et les recombiner

Plus en détail

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine.

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Anne Poupon Biologie et Bioinformatique des Systèmes de Signalisation INRA - Nouzilly France

Plus en détail

Cahier de texte de la classe 1 ère 3 - SVT

Cahier de texte de la classe 1 ère 3 - SVT Cahier de texte de la classe 1 ère 3 - SVT DATE SEQUENCE jeudi 8 : revoir la fiche méthodologique «utiliser le microscope optique» (disponible sur le site du lycée) Jeudi 8 1 er contact avec les élèves.

Plus en détail

Structures Familles, domaines et sites protéiques Ontologie Cluster de transcrits. O. Lecompte Bioinformatique

Structures Familles, domaines et sites protéiques Ontologie Cluster de transcrits. O. Lecompte Bioinformatique Banques Séquences nucléiques protéiques mixtes Structures Familles, domaines et sites protéiques Ontologie Cluster de transcrits PROSITE banque de motifs et de profils caractéristiques de domaines ou de

Plus en détail

L'ordre et la nature des acides aminés (ou séquence) d un polypeptide dépend de la séquence des nucléotides de l ADN du gène qui le code.

L'ordre et la nature des acides aminés (ou séquence) d un polypeptide dépend de la séquence des nucléotides de l ADN du gène qui le code. L'ordre et la nature des acides aminés (ou séquence) d un polypeptide dépend de la séquence des nucléotides de l ADN du gène qui le code. Une mutation, peut entraîner une modification de la séquence des

Plus en détail

La biologie moléculaire Décrypter le vivant: Comprendre et agir

La biologie moléculaire Décrypter le vivant: Comprendre et agir La biologie moléculaire Décrypter le vivant: Comprendre et agir Bernard KNOOPS Knoops@bani.ucl.ac.be Bernard HALLET Hallet@gene.ucl.ac.be Université Catholique de Louvain Institut des Sciences de la Vie

Plus en détail

Cumulo Numbio 2015. La révolution next-generation sequencing et les enjeux de l'expansion de la bioinformatique pour les biologistes.

Cumulo Numbio 2015. La révolution next-generation sequencing et les enjeux de l'expansion de la bioinformatique pour les biologistes. Cumulo Numbio 2015 La révolution next-generation sequencing et les enjeux de l'expansion de la bioinformatique pour les biologistes. Human genome sequence June 26th 2000: official announcement of the completion

Plus en détail

La métaphore de l ordinateur estelle appropriée pour décrire les organismes vivants?

La métaphore de l ordinateur estelle appropriée pour décrire les organismes vivants? La métaphore de l ordinateur estelle appropriée pour décrire les organismes vivants? (Stabilisation fonctionnelle sélective) Originalité de la vie Physique: matière, énergie, temps Biologie: Physique +

Plus en détail

Prédiction de gènes. La localisation des gènes. Quel est le point de départ? Une idée naïve : les phases ouvertes de lecture

Prédiction de gènes. La localisation des gènes. Quel est le point de départ? Une idée naïve : les phases ouvertes de lecture La localisation des gènes Prédiction de gènes Crs de présentation des tils bio-informatiques pr la localisation puis l'étude des gènes C'est la première étape pr interpréter un génome Distinction entre

Plus en détail

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA Amplification spécifique Détection spécifique Clonage dans des vecteurs Amplification in vitro PCR Hybridation moléculaire - hôte cellulaire

Plus en détail

Chapitre 2 : Organisation de la cellule

Chapitre 2 : Organisation de la cellule Partie 1 : notions de biologie cellulaire DAEU- Cours Sciences de la Nature & de la Vie- Marc Cantaloube Chapitre 2 : Organisation de la cellule La cellule est l unité de base des êtres vivants. Il existe

Plus en détail

Les outils du génie génétique.

Les outils du génie génétique. Les outils du génie génétique. I\ Les enzymes. On va se servir des enzymes pour couper, coller et synthétiser des acides nucléiques. A\ Les polymérases. Toutes les polymérases agissent de 5 vers 3. En

Plus en détail

éléments répétés gènes des ARN stables (ARNr, ARNt) gènes protéiques Nb de gènes, taille du génome et complexité pseudogènes régions régulatrices

éléments répétés gènes des ARN stables (ARNr, ARNt) gènes protéiques Nb de gènes, taille du génome et complexité pseudogènes régions régulatrices Plan 3. Annotation des génomes a) Annotation structurale : localisation des éléments génétiques éléments répétés gènes des ARN stables (ARNr, ARNt) gènes protéiques Nb de gènes, taille du génome et complexité

Plus en détail

Alignements de deux séquences

Alignements de deux séquences Alignements de deux séquences Informatique Génomique - Master 1 Guillaume Blin IGM-LabInfo UMR 8049, Bureau 4B066 Université de Marne La Vallée gblin@univ-mlv.fr http://igm.univ-mlv.fr/ gblin 2007-08 Plan

Plus en détail

THÈME 3 : DU GÉNOTYPE AU PHÉNOTYPE. CHAPITRE 1 : la relation entre ADN et protéines

THÈME 3 : DU GÉNOTYPE AU PHÉNOTYPE. CHAPITRE 1 : la relation entre ADN et protéines THÈME 3 : DU GÉNOTYPE AU PHÉNOTYPE CHAPITRE 1 : la relation entre ADN et protéines Les caractères d un individu dépendent de plusieurs facteurs : certains dépendent des caractères présents dans la famille

Plus en détail

Algorithmes sur les séquences en bioinformatique

Algorithmes sur les séquences en bioinformatique M2 - STL Algorithmes sur les séquences en bioinformatique L ARN est un polymère constitué par 4 unités nucléotidiques A,C, G, U (adénine, cytosine, guanine et uracile) Le U remplace le T dans l ADN. Cours

Plus en détail

Concours 2015 Épreuve d Informatique Filière : MP Durée de l épreuve : 3 heures. L utilisation d une calculatrice est autorisée.

Concours 2015 Épreuve d Informatique Filière : MP Durée de l épreuve : 3 heures. L utilisation d une calculatrice est autorisée. A 2015 INFO. MP École des Ponts ParisTech, SUPAERO (ISAE), ENSTA ParisTech, Télécom ParisTech, Mines ParisTech, Mines de Saint-étienne, Mines Nancy, Télécom Bretagne, ENSAE ParisTech (filière MP), École

Plus en détail

Compression Compression par dictionnaires

Compression Compression par dictionnaires Compression Compression par dictionnaires E. Jeandel Compression par dictionnaire Principe : Avoir une liste des mots fréquents ; Lorsqu on trouve un mot dans la liste, remplacer ce mot par sa position

Plus en détail

Différences entre Homme et singes?

Différences entre Homme et singes? Différences entre Homme et singes? Différences entre Homme et singes? Apparition de l œil? Apparition du vol? Apparition des hémoglobines? Molécule d hémoglobine HEME Chaîne polypeptidique de type 2 Chaîne

Plus en détail

Détection de mutations somatiques par NGS sur GAIIx

Détection de mutations somatiques par NGS sur GAIIx Détection de mutations somatiques par NGS sur GAIIx Aude Lamy Laboratoire de Génétique Somatique des Tumeurs CHU de Rouen Inserm U1079 Faculté de Médecine et Pharmacie de Rouen La médecine personalisée

Plus en détail

Information Génétique et hérédité 1- Réplication, mitose, méiose

Information Génétique et hérédité 1- Réplication, mitose, méiose Information Génétique et hérédité 1- Réplication, mitose, méiose REPLICATION DE L ADN et CYCLE CELLULAIRE quantité d'adn 4C 2C G 1 S G 2 M G 1 5 12 15 16 duplication de l'adn mitose temps heures CYCLE

Plus en détail

Structure des génomes bactériens / systèmes de mutagénèse / génomique comparative

Structure des génomes bactériens / systèmes de mutagénèse / génomique comparative Master 1 Bactério 10/01/09 8h30-10h30 RT : Stéphanie Ripert-Bernusset RL: Benjamin de Sainte Marie Structure des génomes bactériens / systèmes de mutagénèse / génomique comparative PLAN DU COURS : I- GENOME

Plus en détail

BIOINFORMATIQUE APPLIQUÉE - CHMI 3206 F. Professeur : Eric R. Gauthier. Test de mi-session. 31 octobre Votre nom :

BIOINFORMATIQUE APPLIQUÉE - CHMI 3206 F. Professeur : Eric R. Gauthier. Test de mi-session. 31 octobre Votre nom : BIOINFORMATIQUE APPLIQUÉE - CHMI 3206 F Professeur : Eric R. Gauthier Test de mi-session 31 octobre 2006 Votre nom : Consignes : 1) Durée : 85 min 2) 5 questions sur 5 pages, pour 80 points. Compte pour

Plus en détail

Acides Nucléiques. ADN et ARN Unités de base : les nucléotides donc les nucléotides = monomères ADN et ARN = polynucléotides = polymères

Acides Nucléiques. ADN et ARN Unités de base : les nucléotides donc les nucléotides = monomères ADN et ARN = polynucléotides = polymères Acides Nucléiques ADN et ARN Unités de base : les nucléotides donc les nucléotides = monomères ADN et ARN = polynucléotides = polymères Structure d un nucléotide Tous composés d une base azotée, d un sucre

Plus en détail

LA TRANSCRIPTION. Introduction. I. Modalité générale de la transcription. II. Transcription chez les Procaryotes

LA TRANSCRIPTION. Introduction. I. Modalité générale de la transcription. II. Transcription chez les Procaryotes LA TRANSCRIPTION Introduction I. Modalité générale de la transcription II. Transcription chez les Procaryotes 1. L'ARN polymérase 2. Etapes de la transcription a. Initiation b. Elongation c. Terminaison

Plus en détail

Génétique. Compléments au cours de 3 ème.

Génétique. Compléments au cours de 3 ème. Génétique Compléments au cours de 3 ème. Plan: Le codage de l information génétique. L utilisation de la génétique. Les limites actuelles de la génétique. Le codage de l information génétique. La structure

Plus en détail

CHAPITRE 5 : ANALYSE LEXICALE

CHAPITRE 5 : ANALYSE LEXICALE CHAPITRE 5 : ANALYSE LEXICALE L analyse lexicale est un autre domaine fondamental d application des automates finis. Dans la plupart des langages de programmation, les unités lexicales (identificateurs,

Plus en détail

Arbre des suffixes : algorithme d Ukkonen. Thierry Lecroq Université de Rouen

Arbre des suffixes : algorithme d Ukkonen. Thierry Lecroq Université de Rouen Arbre des suffixes : algorithme d Ukkonen Thierry Lecroq Université de Rouen Algorithme d Ukkonen L algorithme de construction de l arbre l des suffixes d un d mot y de longueur n d Ukkonen est un algorithme

Plus en détail

THEME 1 A EXPRESSION, STABILITE ET VARIATION DU PATRIMOINE GENETIQUE

THEME 1 A EXPRESSION, STABILITE ET VARIATION DU PATRIMOINE GENETIQUE THEME 1 A EXPRESSION, STABILITE ET VARIATION DU PATRIMOINE GENETIQUE CHAPITRE 3 L EXPRESSION DU PATRIMOINE GENETIQUE I. LA RELATION GENES-PROTEINES Les protéines interviennent dans le fonctionnement d

Plus en détail

Chapitre 10 L isolement et la manipulation de gènes. Injection d ADN étranger dans une cellule animale

Chapitre 10 L isolement et la manipulation de gènes. Injection d ADN étranger dans une cellule animale Chapitre 10 L isolement et la manipulation de gènes Injection d ADN étranger dans une cellule animale Comment amplifier un gène d intérêt? Amplification in vivo à l aide du clonage d ADN L ensemble formé

Plus en détail

Théorie des Langages

Théorie des Langages Théorie des Langages Automates Claude Moulin Université de Technologie de Compiègne Printemps 2013 Sommaire 1 Automate fini 2 Automate et langages réguliers 3 Automate à pile Automate fini déterministe

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Algorithme de Boyer Moore. Thierry Lecroq Université de Rouen 1

Algorithme de Boyer Moore. Thierry Lecroq Université de Rouen 1 Algorithme de Boyer Moore 1 Phase de recherche Problème : localiser toutes les occurrences d un mot x de longueur m dans un texte y de longueur n Méthode : fenêtre glissante 2 Fenêtre glissante x y fenêtre

Plus en détail

Biosimilaires. Les médicaments à l arc-en-ciel. Opportunités thérapeutiques grâce à une nouvelle génération de médicaments

Biosimilaires. Les médicaments à l arc-en-ciel. Opportunités thérapeutiques grâce à une nouvelle génération de médicaments Une brochure à l intention du public intéressé Biosimilaires Opportunités thérapeutiques grâce à une nouvelle génération de médicaments Les médicaments à l arc-en-ciel 1 Table des matières De la fabrication

Plus en détail

RdF Reconnaissance des Formes Semaine 11 : RDF sur les chaînes

RdF Reconnaissance des Formes Semaine 11 : RDF sur les chaînes RdF Reconnaissance des Formes Semaine 11 : RDF sur les chaînes Master ASE : http://master-ase.univ-lille1.fr/ Master Informatique : http://www.fil.univ-lille1.fr/ Spécialité IVI : http://master-ivi.univ-lille1.fr/

Plus en détail

CHAPITRE III: Le Clonage

CHAPITRE III: Le Clonage BIOLOGIE MOLECULAIRE CHAPITRE III: Le Clonage I) Définition: Cloner un fragment d'adn consiste à: isoler physiquement ce fragment. en augmenter le nombre de copie (cf: amplification) II) Principe: Le clonage

Plus en détail

MODULE FTP VERSION 1.1

MODULE FTP VERSION 1.1 MODULE FTP VERSION 1.1 Document: mobyt_module_ftp.pdf Version: 1.1 Auteur: Ignazio Ruiu Date dernière Rév.: 31/01/2011 Organisation: Mobyt France SARL Diffusion: Reservée Destinataires: programmeurs/developpeurs

Plus en détail

Professeur Joël LUNARDI

Professeur Joël LUNARDI Biochimie - Biologie moléculaire Chapitre 3 : La réplication du matériel génétique Professeur Joël LUNARDI MED@TICE PCEM1 - Année 2006/2007 Faculté de Médecine de Grenoble - Tous droits réservés. Chapitre

Plus en détail