Différentes applications de l oracle des facteurs
|
|
- Claude Gagnon
- il y a 8 ans
- Total affichages :
Transcription
1 Différentes applications de l oracle des facteurs Thierry Lecroq LITIS Thierry.Lecroq@univ-rouen.fr en collaboration avec : Joël l Alexandre, Hélène H Dauchel,, Arnaud Lefebvre et Élise Prieur. Séminaire MORO 01/02/06
2 Plan rappels de biologie moléculaire (en images) notations oracle des facteurs FORRepeats compression vecteurs des suffixes Séminaire MORO 01/01/06-2
3 Une cellule eucaryote Séminaire MORO 01/01/06-3
4 Un chromosome Séminaire MORO 01/01/06-4
5 L ADN Séminaire MORO 01/01/06-5
6 Les paires de bases Séminaire MORO 01/01/06-6
7 Les nucléotides Séminaire MORO 01/01/06-7
8 De l ADN à la protéine (en passant par l ARN) Séminaire MORO 01/01/06-8
9 La réplication de l ADN Séminaire MORO 01/01/06-9
10 Les gènes Séminaire MORO 01/01/06-10
11 De l ADN à l ARN : la transcription Séminaire MORO 01/01/06-11
12 L ARN Séminaire MORO 01/01/06-12
13 Les codons Séminaire MORO 01/01/06-13
14 Le code génétique Séminaire MORO 01/01/06-14
15 Tailles des génomes (Mb) Escherichia coli (bactérie) 4,6 Saccharomyces cerevisiae (levure) 13 C. elegans (ver) 100 Arabidopsis thaliana (plante) 125 Drosophila melanogaster (mouche) 180 Riz 400 Homo sapiens 3300 Fougère Amoeba dubia (amibe) Séminaire MORO 01/01/06-15
16 Les deux thèmes d ABISS Répétitions Épissage alternatif Séminaire MORO 01/01/06-16
17 Les répétitions On estime que le génome g humain contient plus de 90% de séquences répétées r qui peuvent être de plusieurs types : répétitions en tandem ; répétitions dispersées. es. Séminaire MORO 01/01/06-17
18 L épissage alternatif 1 ARN messager prémature exon 1 exon 2 exon 3 épissage 1 épissage 2 exon 1 exon 2 exon 3 exon 1 exon 3 plusieurs ARN messagers Séminaire MORO 01/01/06-18
19 L épissage alternatif (2) nombre de génes humains escomptés s avant séquençage : ~ nombre de gènes g estimés s après s séquens quençage : ~ une explication possible : l épissage alternatif Séminaire MORO 01/01/06-19
20 Notations Α : alphabet (ensemble de lettres ou bases) : concaténation nation Α* * : ensemble des suites finies de lettres w Α* * : mot ou séquence w : longueur du mot w w = w[0] w[1] w[ [ w -1] -1] = w[0.. [0.. w -1] -1] i (0 i w -1) -1) : position sur le mot w ε : mot vide ( ε = 0) Séminaire MORO 01/01/06-20
21 Notations (2) u est un préfixe v est un suffixe de w si w = uzv z est un facteur Fact(w) ) : ensemble des facteurs de w Alph(w) ) : ensemble des lettres de w Séminaire MORO 01/01/06-21
22 Séquences biologiques ADN : Α = {a,{ c, g, t } (acides nucléiques, paires de base) ARN : Α = {a,{ c, g, u } protéine : card A = 20 (acides aminés) Séminaire MORO 01/01/06-22
23 Répétitions exactes M. Crochemore,, An optimal algorithm for computing the repetitions in a word, Information Processing Letters 12 (5) (1983) R. Kolpakov & G. Kucherov,, On maximal repetitions in words, Journal of Discrete Algorithms 1 (1) (2000) W. F. Smyth,, Repetitive perhaps, but not boring, Theoretical Computer Science 249 (5) (2000) Séminaire MORO 01/01/06-23
24 Structures d'index Arbre des suffixes Arbre compact des suffixes Table des suffixes Automate des suffixes (DAWG) Automate compact des suffixes (CDAWG) Vecteurs de suffixes Séminaire MORO 01/01/06-24
25 Oracle des facteurs Allauzen,, Crochemore, Raffinot, 1999 Pour un mot w de longueur m l'oracle des facteurs de w est un automate (Q,( q 0, F, δ) ) où o : Q = {0, 1,..., m} } est l'ensemble des états q 0 = 0 est l'état initial F = Q est l'ensemble des états terminaux δ est la fonction de transition Séminaire MORO 01/01/06-25
26 Oracle des facteurs Allauzen, Crochemore, Raffinot,, 1999 Pour un mot w de longueur m l'oracle des facteurs de w : reconnaît t au moins tous les facteurs de w possède exactement m + 1 états possède entre m et 2m 2-1 transitions Séminaire MORO 01/01/06-26
27 Exemple d'oracle des facteurs w = aattatt a a t t a t t t t a Fact(w) = { ε, a, b, aa, at, ta, tt, aat, att, tat, tta, aatt, atta, tatt, ttat, aatta, attat, ttatt, aattat, attatt, aattatt } Séminaire MORO 01/01/06-27
28 w = aattatt Langage de l'oracle a a t t a t t t t a ata est reconnu bien qu'il ne soit pas un facteur de aattatt Séminaire MORO 01/01/06-28
29 Construction de l'oracle des facteurs w = aatt a a t t t t Lien suffixe de l'état i : suf(i) = δ(0,x) où x est le plus long suffixe répété de w[0..i-1] Séminaire MORO 01/01/06-29
30 Construction de l'oracle des facteurs w = aatta a a t t a 5 t t a Séminaire MORO 01/01/06-30
31 Construction de l'oracle des facteurs w = aattag a a t t a 5 g 6 t t a g g Séminaire MORO 01/01/06-31
32 Construction de l'oracle des facteurs Théor orème [ACR 99] : L'oracle des facteurs d'un mot de longueur m peut être construit en temps et en espace O(m). Séminaire MORO 01/01/06-32
33 Oracle des facteurs d'un mot w bijection entre : les longueurs des préfixes de w les états de l'oracle des facteurs de w toutes les transitions qui mènent m à l'état i sont étiquetées es par la lettre w[i-1] deux types de transitions : transitions internes : δ(i, w[i]) = i+1 pour 0 1 pour 0 i m- m-1 transitions externes : δ(i, w[j-1]) = j avec j-i > 1 pour 0 i < j m Séminaire MORO 01/01/06-33
34 Représentation de l'oracle des facteurs w = aattatt a a t t a t t t t a aattatt,(0,3),(1,3),(3,5) représentation indépendante de l'alphabet Séminaire MORO 01/01/06-34
35 Taille en pratique de l oracle environ 10,5 fois la longueur de la séquences (sans raffinement) Séminaire MORO 01/01/06-35
36 Recherche exacte de mot L'oracle des facteurs d'un mot w de longueur m ne reconnaît t qu'un seul mot de longueur m Séminaire MORO 01/01/06-36
37 Calcul de répétitions avec l'oracle des facteurs Pour un mot w de longueur m on définit d : LRS[i] ] = max { v v est suffixe de w[0.. [0..i]] et v est facteur de w[0.. [0..i-1] } pour 0 i < m Théor orème [LL2000] : il est possible de calculer en temps et espace O(m) ) pour 0 i < m : 0 lrs[i] LRS[i] En pratique lrs[i] ] est très s proche de LRS[i]. Séminaire MORO 01/01/06-37
38 Que calcule-t-on? w suf(i) i lrs(i) lrs(i) Séminaire MORO 01/01/06-38
39 Calcul de répétitions avec l'oracle des facteurs w = attcatcgatc 0 a 1 t 2 t 3 c 4 a 5 t 6 c g a t c Séminaire MORO 01/01/06-39
40 Séminaire MORO 01/01/06-40
41 Séminaire MORO 01/01/06-41
42 Séminaire MORO 01/01/06-42
43 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-43
44 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-44
45 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-45
46 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-46
47 Séminaire MORO 01/01/06-47
48 Double-cliquez pour ajouter un titre Double-cliquez pour ajouter un plan Séminaire MORO 01/01/06-48
49 Résultats expérimentaux Mb exact H. pylori 1,59 2s B. subtilis 4,02 6s E. coli 4,42 6s S. cerevisiae 11,50 14s A. thaliana II et IV 35,47 57s C. elegans 92,40 122s 500 MHz, 1 Go Séminaire MORO 01/01/06-49
50 Recherche de répétitions approchées Extension à droite et à gauche des répétitionsr exactes en utilisant différentes distances. En étendant les répétitions r de longueur 15 et en fixant un seuil de 85% d identitd identité on double les temps de calcul. Séminaire MORO 01/01/06-50
51 Compression séquentielle sans perte On code les mots soit par une lettre lors de sa première occurrence soit par des couples (position, longueur) lors de répétitions r de facteurs Séminaire MORO 01/01/06-51
52 Compression séquentielle sans perte On suppose que w[0.. [0..i]] a déjà d été codé j = min{ k > i k - lrs[k] ] > i + 1 et pour i < h < k : h - lrs[h] i + 1 } alors on code : (suf(j-1) - j i, j - 1 i) w[i + 1] si w[i + 1] Alph(w[0.. [0..i]) Séminaire MORO 01/01/06-52
53 Exemple de compression séquentielle w = attcatcgatc 0 a 1 t 2 t 3 c 4 a 5 t 6 c g a t c at(1,1) (1,1)c(0,2)(3,1)g(0,2)(3,1) Séminaire MORO 01/01/06-53
54 Compression séquentielle : résultats gzip compror bzip2 Fichier bpc ct dc % ct dt % ct dt ChrIV 2,17 230,00 2,00 2,9 37,00 9,65 2,13 37,00 9,65 ChrII 2,18 261,00 2,00 2,9 42,00 10,90 2,14 40,00 12,00 bib 2,5 0,14 0,01 3,1 0,21 0,06 1,97 0,17 0,04 book1 3,25 1,18 0,08 3,8 2,00 0,50 2,42 1,47 0,47 book2 2,7 0,68 0,06 3,3 1,30 0,35 2,06 1,1 0,33 progc 2,67 0,04 0,01 3,8 0,09 0,02 2,53 0,07 0,02 trans 1,61 0,08 0,01 2,16 0,13 0,04 1,52 0,14 0,03 thesis 1,74 7,47 0,65 0,94 7,65 2,37 1,3 18,6 3,44 article1 1,65 5,14 2,5 1,2 37,5 2,5 1,65 5,14 2,5 article2 2,2 24,6 7,1 1,25 51,5 8,2 2,04 8,8 8,6 alpha 0,03 0,08 0,57 0,002 0,3 0,55 0,003 4,45 0,6 Séminaire MORO 01/01/06-54
55 Arbres des suffixes Arbre des suffixes de aatttatttatta$ Séminaire MORO 01/01/06-55
56 Vecteurs des suffixes Vecteurs des suffixes de aatttatttatta$ Séminaire MORO 01/01/06-56
57 Vecteurs des suffixes Séminaire MORO 01/01/06-57
58 Vecteur compact des suffixes Séminaire MORO 01/01/06-58
59 Références Maxime Crochemore,, Christophe Hancart et Thierry Lecroq Algorithmique du texte Vuibert,, Séminaire MORO 01/01/06-59
60 Références The National Health Museum Graphics Gallery Séminaire MORO 01/01/06-60
61 Références A. Lefebvre, Une nouvelle heuristique pour la détection d de répétitions r sur des génomes g complets, pour la comparaison de génomes g et pour la compression,, thèse de doctorat de l Universitl Université de Rouen, A. Lefebvre et T. Lecroq,, A heuristic for computing repeats with a factor oracle: Application to biological sequences, International Journal of Computer Mathematics 79(12) (2002) A. Lefebvre, T. Lecroq et J. Alexandre,, An improved algorithm for finding longest repeats with a modified factor oracle, Journal of Automata, Languages and Combinatorics 8(4) (2003) A. Lefebvre, T. Lecroq,, H. Dauchel et J. Alexandre, FORRepeats: : detects repeats on entire chromosomes and between genomes, Bioinformatics 19(3) (2003) A. Lefebvre et T. Lecroq, Compror: : on-line lossless compression with a factor oracle, Information Processing Letters 83(1) (2002) 1-6. Séminaire MORO 01/01/06-61
62 Références L. Cleophas,, G. Zwaan et B. Watson,, Constructing Factor Oracles, in Proceedings of the Prague Stringology Conference 2003, R. Kato,, A New Full-Text Search Algorithm Using Factor Oracle as Index, Research Report, Tokyo Institute of Technology,, R. Kato,, A New Text Search Algorithm Using Factor Oracle as Full-Text Index, Research Report, Tokyo Institute of Technology,, A. Mancheron et C. Moan,, Combinatorial Characterization of the Language Recognized by Factor and Suffix Oracles, in Proceedings of the Prague Stringology Conference 2004, R. Kato, Finding Maximal Repeats with Factor Oracles, Research Report, Tokyo Institute of Technology,, R. Kato et O. Watanabe, Substring search and repeat search using factor oracles, Information Processing Letters 93( 6) 2005, H. Iwasaki, Error analysis of factor oracles, Research Report, Tokyo Institute of Technology,, H. Iwasaki,, A detail analysis on factor oracle construction of computing repeated factors, Research Report, Tokyo Institute of Technology,, Séminaire MORO 01/01/06-62
63 Perspectives construire l'oracle des facteurs de w[i+k....j+k] à partir de l'oracle des facteurs de w[i....j]] en temps amorti O(k) ) ; Séminaire MORO 01/01/06-63
64 Perspectives construire l'oracle des facteurs de w[i+k....j+k] à partir de l'oracle des facteurs de w[i....j]] en temps amorti O(k) ) ; construire une base d oracles ; alignement multiple avec F. Guinand (LIH, Le Havre). Séminaire MORO 01/01/06-64
CHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Plus en détailDéfinitions. Numéro à préciser. (Durée : )
Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.
Plus en détailLa gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailDr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires
Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique
Plus en détailIntroduction à la Génomique Fonctionnelle
Introduction à la Génomique Fonctionnelle Cours aux étudiants de BSc Biologie 3ème année Philippe Reymond, MER PLAN DU COURS - Séquençage des génomes - Fabrication de DNA microarrays - Autres méthodes
Plus en détailDétection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots
Université Toulouse 3 Paul Sabatier(UT3 Paul Sabatier) Informatique Spécialité Bioinformatique Eric AUDEMARD lundi 28 novembre 2011 Détection des duplications en tandem au niveau nucléique à l'aide de
Plus en détailContrôle de l'expression génétique : Les régulations post-transcriptionnelles
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles http://perso.univ-rennes1.fr/serge.hardy/ utilisateur : biochimie mot de passe : 2007 L'ARNm, simple intermédiaire entre le
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailBig data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme
Plus en détailMABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Plus en détailUniversité d Evry-Val d Essonne Ecole Doctorale des Génomes Aux Organismes. Thèse
Université d Evry-Val d Essonne Ecole Doctorale des Génomes Aux Organismes Thèse Présentée pour obtenir le grade de Docteur en sciences de l université d Evry-Val d Essonne Spécialité Bioinformatique par
Plus en détailIntroduction aux bases de données: application en biologie
Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,
Plus en détailGénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010
GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection
Plus en détailObjets Combinatoires élementaires
Objets Combinatoires élementaires 0-0 Permutations Arrangements Permutations pour un multi-ensemble mots sous-ensemble à k éléments (Problème du choix) Compositions LE2I 04 1 Permutations Supposons que
Plus en détailSéquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.
Sommaire Séquence 6 Nous avons vu dans les séances précédentes qu au cours des temps géologiques des espèces différentes se sont succédé, leur apparition et leur disparition étant le résultat de modifications
Plus en détailLes Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16
Les Biolangages Thierry Lecroq Université de Rouen FRANCE 2008 2009 Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 BioPerl Ensemble de modules Perl Utilise la programmation objet L objectif est de mettre
Plus en détailMaster de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant
Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master
Plus en détailTD de Biochimie 4 : Coloration.
TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi
Plus en détailLes débuts de la génétique
HPITRE 9 DES DÉBTS DE L ÉNÉTIQE X ENJEX TELS DES BIOTEHNOLOIES 1 Les débuts de la génétique est avec les travaux de regor Mendel vers la fin du XIX e siècle que furent posées les bases de la génétique.
Plus en détailThéorie des Langages
Théorie des Langages Analyse syntaxique descendante Claude Moulin Université de Technologie de Compiègne Printemps 2010 Sommaire 1 Principe 2 Premiers 3 Suivants 4 Analyse 5 Grammaire LL(1) Exemple : Grammaire
Plus en détailTravaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation
Université de Savoie Module ETRS711 Travaux pratiques Compression en codage de Huffman 1. Organisation du projet 1.1. Objectifs Le but de ce projet est d'écrire un programme permettant de compresser des
Plus en détailComment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet
Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,
Plus en détailCellules procaryotes Service histologie Pr.k.mebarek
Cellules procaryotes Service histologie Pr.k.mebarek I) Les cellules procaryotes II) Les cellules eucaryotes o 1) Caractéristiques générales des cellules eucaryotes o 2) Organisation des cellules eucaryotes
Plus en détailOptimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation
Plus en détailchapitre 4 Nombres de Catalan
chapitre 4 Nombres de Catalan I Dénitions Dénition 1 La suite de Catalan (C n ) n est la suite dénie par C 0 = 1 et, pour tout n N, C n+1 = C k C n k. Exemple 2 On trouve rapidement C 0 = 1, C 1 = 1, C
Plus en détailBases de données des mutations
Bases de données des mutations CFMDB CFTR2 CFTR-France / Registre Corinne THEZE, Corinne BAREIL Laboratoire de génétique moléculaire Montpellier Atelier Muco, Lille, 25-27 septembre 2014 Accès libre http://www.genet.sickkids.on.ca/app
Plus en détailLa carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.
La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.fr Quelques exemples 1 La campagne de Russie de Napoléon
Plus en détailLe langage SQL Rappels
Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,
Plus en détailConférence technique internationale de la FAO
Décembre 2009 ABDC-10/7.2 F Conférence technique internationale de la FAO Biotechnologies agricoles dans les pays en développement: choix et perspectives pour les cultures, les forêts, l élevage, les pêches
Plus en détailContrôle de l'expression génétique :
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles L'ARNm, simple intermédiaire entre le génome et les protéines? gène protéine L'ARNm, simple intermédiaire entre le génome et
Plus en détailFormavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...
Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au
Plus en détailLes OGM. 5 décembre 2008. Nicole Mounier
Les OGM 5 décembre 2008 Nicole Mounier Université Claude Bernard Lyon 1 CGMC, bâtiment Gregor Mendel 43, boulevard du 11 Novembre 1918 69622 Villeurbanne Cedex OGM Organismes Génétiquement Modifiés Transfert
Plus en détailA GRASPxELS approach for the Job Shop with generic time-lags and new statistical determination of the parameters
A GRASPxELS approach for the Job Shop with generic time-lags and new statistical determination of the parameters Présenté par : Equipe de travail : Laboratoire : Maxime CHASSAING Philippe LACOMME, Nikolay
Plus en détailProjet d informatique M1BI : Compression et décompression de texte. 1 Généralités sur la compression/décompression de texte
Projet d informatique M1BI : Compression et décompression de texte Le but de ce projet est de coder un programme réalisant de la compression et décompression de texte. On se proposera de coder deux algorithmes
Plus en détailVI- Expression du génome
VI- Expression du génome VI-1.- EXPRESSION DU GÉNOME- PRINCIPES GÉNÉRAUX DOGME CENTRAL Les gènes et l information génétique sont conservés sous forme d acides nucléiques La perpétuation à l identique de
Plus en détailDÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION
DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION PRINCIPES DE BASE SUR LES DONNEES ET LE CALCUL HAUTE PERFORMANCE Lois de Gray sur l ingénierie des données 1 : Les calculs scientifiques traitent des volumes considérables
Plus en détailBig Data et la santé
Big Data, c'est quoi? Big Data et la santé Collecte, stockage et exploitation de masses de données Capter de façon automatique et anonyme une très grande quantité d'informations, les traiter avec des algorithmes
Plus en détailCours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions
Cours d introduction à l informatique Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions Qu est-ce qu un Une recette de cuisine algorithme? Protocole expérimental
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailExemples de problèmes et d applications. INF6953 Exemples de problèmes 1
Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation
Plus en détailUnivers Vivant Révision. Notions STE
Univers Vivant Révision Notions STE Chap. 13) L Écologie 1) a) Qu est-ce que l empreinte écologique? L empreinte écologique correspond à la surface terrestre et aquatique totale nécessaire à un individu,
Plus en détailStructure quantique cohérente et incohérente de l eau liquide
Structure quantique cohérente et incohérente de l eau liquide Prof. Marc HENRY Chimie Moléculaire du Solide Institut Le Bel, 4, Rue Blaise Pascal 67070 Strasbourg Cedex, France Tél: 03.68.85.15.00 e-mail:
Plus en détailJean-Philippe Préaux http://www.i2m.univ-amu.fr/~preaux
Colonies de fourmis Comment procèdent les colonies de fourmi pour déterminer un chemin presque géodésique de la fourmilière à un stock de nourriture? Les premières fourmis se déplacent au hasard. Les fourmis
Plus en détailJournée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique
Monitorint spatio-temporel intégré de la mobilité urbaine Monitoring spatio-temporel de l ADN urbain Une réponse aux défis, problèmes, enjeux et risques des milieux urbains Nicolas Lachance-Bernard M.ATDR
Plus en détailSOMMAIRE. Travailler avec les requêtes... 3
Access Les requêtes SOMMAIRE Travailler avec les requêtes... 3 A) Créer une requête sélection en mode QBE... 3 B) Exécuter une requête à partir du mode Modifier (QBE)... 3 C) Passer du mode Feuille de
Plus en détailIntroduc)on à Ensembl/ Biomart : Par)e pra)que
Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que Exercice 1 1.a. Quelle est la version de l assemblage
Plus en détailGénétique et génomique Pierre Martin
Génétique et génomique Pierre Martin Principe de la sélections Repérage des animaux intéressants X Accouplements Programmés Sélection des meilleurs mâles pour la diffusion Index diffusés Indexation simultanée
Plus en détailSéquence 2. L expression du patrimoine génétique. Sommaire
Séquence 2 L expression du patrimoine génétique Sommaire 1. La synthèse des protéines 2. Phénotypes, génotypes et environnement Synthèse de la séquence 2 Exercices de la séquence 2 Glossaire des séquences
Plus en détailL universalité et la variabilité de l ADN
L universalité et la variabilité de l DN Unité 4 3 μm hromosomes observés en microscopie électronique à balayage. Les chromosomes, présents dans le noyau, sont constitués d acide désoxyribonucléique (DN).
Plus en détailCompression Compression par dictionnaires
Compression Compression par dictionnaires E. Jeandel Emmanuel.Jeandel at lif.univ-mrs.fr E. Jeandel, Lif CompressionCompression par dictionnaires 1/25 Compression par dictionnaire Principe : Avoir une
Plus en détailInitiation au binaire
Présenté par TryEngineering Objet de la leçon Cette leçon explique les principes du code binaire et ses applications possibles par les ingénieurs informaticiens. Dans cette leçon, les élèves réaliseront
Plus en détailCurriculum Vitae 1 er février 2008
Curriculum Vitae 1 er février 2008 Informations générales Cédric MEUTER Nationalité belge Né à La Louvière, le 16 novembre 1979 Adresse personnelle : Adresse professionnelle : Ave Général Bernheim, 57
Plus en détailCours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Plus en détailLe Langage SQL version Oracle
Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI anis.bach@isg.rnu.tn
Plus en détailNouveautés dans Excel 2013
1 Nouveautés dans Excel 2013 Nouvelle interface de démarrage La nouvelle page d accueil est la première chose qui interpelle lors de l ouverture d Excel. 1 3 2 5 4 Figure 1.1 Nouvelle page d accueil lors
Plus en détailPerl Orienté Objet BioPerl There is more than one way to do it
Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels
Plus en détailI. La levure Saccharomyces cerevisiae: mode de vie
LES LEVURES UE «levures» -5 avril: généralités (MN Simon) -6 avril: analyse génétique (MN Simon) -6 avril: Cycle cellulaire I: la réplication (E. bailly) -7 avril: Cycle cellulaire II: la mitose (E. Bailly)
Plus en détailPLAN DE COURS. GPA750 Ordonnancement des systèmes de production aéronautique
Département de génie de la production automatisée Programme de baccalauréat Professeur Pontien Mbaraga, Ph.D. Session/année Automne 2004 Groupe(s) 01 PLAN DE COURS GPA750 Ordonnancement des systèmes de
Plus en détailRecherche dans un tableau
Chapitre 3 Recherche dans un tableau 3.1 Introduction 3.1.1 Tranche On appelle tranche de tableau, la donnée d'un tableau t et de deux indices a et b. On note cette tranche t.(a..b). Exemple 3.1 : 3 6
Plus en détailUniversité de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription
Université de Montréal Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription par Eloi Mercier Département de bioinformatique Faculté de médecine
Plus en détailHépatite chronique B Moyens thérapeutiques
Hépatite chronique B Moyens thérapeutiques Dr Olfa BAHRI Laboratoire de Virologie Clinique Institut Pasteur de Tunis INTRODUCTION Plus de 300. 10 6 porteurs chroniques de VHB dans le monde Hépatite chronique
Plus en détailBases moléculaires des mutations Marc Jeanpierre
Bases moléculaires des mutations Marc Jeanpierre Chaque enfant qui naît hérite de 10 à 30 nouvelles mutations ponctuelles. L essentiel des ces mutations sont heureusement des variations neutres de séquence
Plus en détailVers l'ordinateur quantique
Cours A&G Vers l'ordinateur quantique Données innies On a vu dans les chapîtres précédents qu'un automate permet de représenter de manière nie (et même compacte) une innité de données. En eet, un automate
Plus en détailInitiation à la Programmation en Logique avec SISCtus Prolog
Initiation à la Programmation en Logique avec SISCtus Prolog Identificateurs Ils sont représentés par une suite de caractères alphanumériques commençant par une lettre minuscule (les lettres accentuées
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailThierry DELZESCAUX. «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France. Thierry.Delzescaux@cea.
Thierry DELZESCAUX «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France Thierry.Delzescaux@cea.fr Thierry DELZESCAUX Ingénieur chercheur CEA Experience Since 2008:
Plus en détailMYRIAD. l ADN isolé n est à présent plus brevetable!
MYRIAD La Cour Suprême des Etats-Unis revient sur plus de 30 ans de pratique : l ADN isolé n est à présent plus brevetable! Mauvaise passe pour les inventions en biotechnologies sur le territoire américain.
Plus en détailLES TYPES DE DONNÉES DU LANGAGE PASCAL
LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.
Plus en détailComment automatiser la création d index multiples avec Word 2010. Paul-Henri Dumas - URFIST - 2014
Comment automatiser la création d index multiples avec Word 2010 Qu est ce qu un index? Un index fait partie de l apparat savant d un travail scientifique, tout comme la table des matières, le sommaire
Plus en détail1 de 46. Algorithmique. Trouver et Trier. Florent Hivert. Mél : Florent.Hivert@lri.fr Page personnelle : http://www.lri.fr/ hivert
1 de 46 Algorithmique Trouver et Trier Florent Hivert Mél : Florent.Hivert@lri.fr Page personnelle : http://www.lri.fr/ hivert 2 de 46 Algorithmes et structures de données La plupart des bons algorithmes
Plus en détailInitiation à LabView : Les exemples d applications :
Initiation à LabView : Les exemples d applications : c) Type de variables : Créer un programme : Exemple 1 : Calcul de c= 2(a+b)(a-3b) ou a, b et c seront des réels. «Exemple1» nom du programme : «Exemple
Plus en détailRecherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Plus en détailBibliographie Introduction à la bioinformatique
Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A
Plus en détailRecherche bibliographique
Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique
Plus en détailSysFera. Benjamin Depardon
SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation
Plus en détailFIMA, 7 juillet 2005
F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation
Plus en détailQuelques Algorithmes simples
Quelques Algorithmes simples Irène Guessarian ig@liafa.jussieu.fr 10 janvier 2012 Je remercie Patrick Cegielski de son aide efficace pour la programmation Java ; la section sur le codage de Huffman a été
Plus en détailGMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan
M Bioinformatique, Connaissances et Données Année 24-25 GMIN206 Info. Biologique et Outils bioinformatiques Banques de données biologiques (3h de Cours +,5h de TD + 4h de TP) Elodie Cassan Anne-Muriel
Plus en détailUEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.
UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases
Plus en détailChapitre 7. Récurrences
Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,
Plus en détailTP Bases de données réparties
page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure
Plus en détailIngénieur R&D en bio-informatique
Ingénieur R&D en bio-informatique Spécialisé Bases De Données 33 ans, Célibataire. Biologie & Informatique gabriel.chandesris[at]laposte.net {06 56 41 97 37} Use the bipper! http://gabriel.chandesris.free.fr/
Plus en détailMENER UNE RECHERCHE D INFORMATION
MENER UNE RECHERCHE D INFORMATION Pourquoi ne pas chercher seulement ses informations dans Google? Crédits photo : Flickr On N importe qui publie n importe quoi sur le Web! Parce que... Les résultats sont
Plus en détailMise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique
Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes
Plus en détailUTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY
UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier
Plus en détailFormats d images. 1 Introduction
Formats d images 1 Introduction Lorsque nous utilisons un ordinateur ou un smartphone l écran constitue un élément principal de l interaction avec la machine. Les images sont donc au cœur de l utilisation
Plus en détailConsignes générales :
PROCÉDURE POUR DÉPÔT DANS WEBCT Consignes générales : 1) Il est important de toujours conserver une copie de votre Webfolio ou Dossier professionnel sur votre disquette, clé USB ou sur votre disque dur
Plus en détailSOMMAIRE AIDE À LA CRÉATION D UN INDEX SOUS WORD. Service général des publications Université Lumière Lyon 2 Janvier 2007
SOMMAIRE 1) CRÉATION D UN INDEX SIMPLE 3 a) Étape 1 : Marquage des entrées d index (à l aide d un fichier de concordance) 3 Procédure d insertion du tableau 4 Saisie des entrées d index 5 Marquage automatique
Plus en détail1 Introduction au codage
CélestineOscarDésiréAnatoleGastonEugène 1 Introduction au codage 1.1 Les ensembles L ensemble de tout les ensembles est Dieu lui-même. Kantor Ensemble des parties d un ensemble désigne l ensemble des sous-ensembles
Plus en détailTravaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015
Andrew Tolonen atolonen@genoscope.cns.fr Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015 A- Généralités I- La vie sur terre telle que nous la connaissons ne
Plus en détailCURRICULUM VITAE. Informations Personnelles
CURRICULUM VITAE Informations Personnelles NOM: BOURAS PRENOM : Zine-Eddine STRUCTURE DE RATTACHEMENT: Département de Mathématiques et d Informatique Ecole Préparatoire aux Sciences et Techniques Annaba
Plus en détailPHYSIQUE-CHIMIE. Partie I - Spectrophotomètre à réseau
PHYSIQUE-CHIMIE L absorption des radiations lumineuses par la matière dans le domaine s étendant du proche ultraviolet au très proche infrarouge a beaucoup d applications en analyse chimique quantitative
Plus en détailprésentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :
N Ordre de la Thèse 3282 THÈSE présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 Mention : BIOLOGIE PAR Emilie GUÉRIN Équipe d accueil : École Doctorale
Plus en détailChapitre 5 : Flot maximal dans un graphe
Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d
Plus en détailBases de données documentaires et distribuées Cours NFE04
Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département
Plus en détailBiomarqueurs en Cancérologie
Biomarqueurs en Cancérologie Définition, détermination, usage Biomarqueurs et Cancer: définition Anomalie(s) quantitative(s) ou qualitative(s) Indicative(s) ou caractéristique(s) d un cancer ou de certaines
Plus en détailVOYAGE DANS LE NON COMMUTATIF THIERRY PAUL
VOYAGE DANS LE NON COMMUTATIF THIERRY PAUL Résumé. Nous proposons un court voyage au pays de la non commutativité. Nous présentons différents aspects des mathématiques et de la physique où cette notion
Plus en détailINSTALLATION Advantage Database Server
INSTALLATION Advantage Database Server WINGS Software Flexibilité, efficacité et précision Télécharger Advantage Database Server Surfez sur le site suivant: http://devzone.advantagedatabase.com Sélectionnez
Plus en détail