Algorithmes pour la comparaison de séquences II
|
|
- Hugues Forget
- il y a 7 ans
- Total affichages :
Transcription
1 Algorithmes pour la comparaison de séquences II Hélène TOUZET Equipe Bioinfo Master recherche informatique
2 Pourquoi comparer des séquences? Puisque c est la structure qui prime pour la fonction (cf cours de Maude Pupin)
3 Structure des protéines Structure Structure Structure Structure primaire secondaire tertiaire quaternaire Swissprot: séquences TrEMBL: séquences PDB : 243 structures
4 les programmes de séquençage fournissent des séquences qu il faut annoter ADN traduction protéine potentielle (TrEmbl) protéine (Swissprot) les structures 3D sont longues et coûteuses à déterminer cristallographie, résonnance magnétique nucléaire dans PDB, toutes les protéines avec plus de 25 % d identité partagent la même structure PDB: Protein Data Bank - banque de structures de protéines résolues expérimentalement
5 Alignement 2 à 2 : Amélioration du modèle avec le traitement des gaps Gap: succession de délétions ou d insertions Un gap correspond à un seul événement mutationnel. Ouv : pénalité d ouverture de gap Ext : pénalité d extension de gap Anciennes pénalités Nouvelles pénalités T C A G A C G A G T C T C A G A C G A G T C T C G G A _ G C _ T G T C G G A G C T G
6 Pénalités de gaps linéaires toutes les positions sont indépendantes (dépendance d ordre 0) Pénalités de gaps affines le score d une position dépend de la position précédente (dépendance d ordre 1) Ext Insertion Ouv+Ext Ouv+Ext Délétion Ext Ouv+Ext s s Ouv+Ext Substitution s
7 Algorithme Trois tables : a(i, j) score maximal d un alignement entre U(1..i) et V (1..j) qui termine par un match ou un mismatch entre U(i) et V (j) b(i, j) score maximal d un alignement entre U(1..i) et V (1..j) qui termine par l insertion de V (j) c(i, j) score maximal d un alignement entre U(1..i) et V (1..j) qui termine par la délétion de U(i)
8 Formules de récurrence Ouv : pénalité d ouverture de gap Ext : pénalité d extension de gap a(i, j) = Sub(i, j) + max a(i 1, j 1) b(i 1, j 1) c(i 1, j 1) b(i, j) = max Ouv + Ext + a(i, j 1) Ext + b(i, j 1) Ouv + Ext + c(i, j 1) c(i, j) = max Ouv + Ext + a(i 1, j) Ouv + Ext + b(i 1, j) Ext + c(i 1, j)
9 Initialisation a(0, 0) = 0 a(i, 0) = a(0, j) = b(i, 0) = b(0, j) = Ouv + Ext j c(i, 0) = Ouv + Ext i c(0, j) =
10 Exemple : EAGAWGHE et PAWHEAE score des substitutions : A E G H P W A E G H P 10 4 W 15 pénalités d ouverture de gaps : -10 pénalités d extension : -2 alignement global avec gaps affines optimal: E A G A W G H - E P - - A W H E A E
11 a (... substitution) b (... insertion) c (... délétion) E A G A W G H E 0 P A W H E A E E A G A W G H E 0 P A W H E A E E A G A W G H E P A W H E A E
12 BLAST Basic Local Alignment Search Tool Altschul et al
13 Programme pour la recherche de similarités dans de grandes banques de données EMBL, Swissprot,... Utilise un algorithme heuristique linéaire pour l alignement local : Ne s intéresse qu aux séquences avec un fort taux de similarité BLAST ne construit pas un alignement avec toutes les séquences de la banque. Tire parti du caractère biologique des séquences Des séquences similaires ont des segments communs de taille k quasi-identiques. Par défaut : ADN k=11 ou 13, protéines k=3
14 Table de hachage k-mers : mots de longueur k Fonction de hachage (pour l ADN): e : {A, C, G, T } {0, 1, 2, 3} H(i) = k 1 j=0 e(a i+j)4 k j 1 H(i + 1) = 4 H(i) + e(a i+k ) mod 4 k Exemple : 5-mers de AGT ACCGAA A G T A C C G A A
15 Étape 0: Pré-traitement de la banque de données : indexation de tous les k-mers 4 11 = << taille de la banque de données Étape 1: Construction d une table de hachage recensant tous les mots de longueurs k apparaissant dans la séquence requête avec un score > T.
16 Étape 2: Localisation des k-mers dans la banque de données HSP : High Scoring Pairs Étape 3 : Extension de ces points d ancrage de proche en proche, pour avoir un score significatif.
17 Query= Felis catus DRD4 gene fordopamine receptor D4 (276 letters) Database: All GenBank+EMBL+DDBJ+PDB sequences 1,174,453 sequences; 5,001,591,585 total letters Sequences producing significant alignments: Score E (bits) Value gi AB Felis catus DRD4 gene f e-52 gi AB Nyctereutes procyonoide e-36 gi AB Canis lupus DRD4 gene f e-36 gi AB Bos taurus DRD4 gene fo e-31 gi Homo sapiens Dopamine D4 recep e-29
18 ALIGNMENTS >gi dbj AB AB Nyctereutes procyonoides DRD4 gene fordopamine receptor D4. Length = 393 Score = 157 bits (79), Expect = 7e-36 Identities = 94/99 (94%) Strand = Plus / Plus Query 1 ttcttcctaccctgcccgctcatgctgctgctctactgggccacgttcc 48 Sbjct 1 ttcttcctaccctgcccgctcatgctgctgctctactgggccacgttcc 48 Query 49 ggggcctgcggcgctgggaggcggctcgccaggccaagctgcactgccgg 99 Sbjct 49 ggggcctgcggcgctgggaggccgcgcgtcgggccaagctgcacggccgg 99 Score = 107 bits (54), Expect = 5e-21 Identities = 60/62 (96%) Strand = Plus / Plus Query 215 ggaggcgcgccaagatcaccggccgggagcgcaaggccatgagggtcct 252 Sbjct 332 ggagacgcgccaagatcacgggccgggagcgcaaggccatgagggtcct 379 Query 253 tgccggtggtggtc 276 Sbjct 380 tgccggtggtggtc 393
19 >gi AB Hylobates pileatus gene for dopamine receptor D4, partial cds, drd4, 7-repeat allele. Length = 507 Score = 42.1 bits (21), Expect = 0.27 Identities = 45/53 (84%) Strand = Plus / Plus 52 ggcctgcggcgctgggaggcggctcgccaggccaagctgcactgccgggcgcc ggcctgcagcgctgggaggtggcacgtcgcgccaagctgcacggccgcgcgcc 56
20 Alignement Felis Catus/ Nyctereute 1 ttcttcctaccctgcccgctcatgctgctgctctactgggccacgttccggggcctgcgg 60 1 ttcttcctaccctgcccgctcatgctgctgctctactgggccacgttccggggcctgcgg cgctgggaggcggctcgccaggccaagctgcactgccgggcgcctcgtcggcccagcggc cgctgggaggccgcgcgtcgggccaagctgcacggccggacaccgcgcagacccagcggc cccggcccaccgccccccga.ggt...c cccggcccgccaccccccgacggtacccccggccccccgccccccgacggcagccccgac ggcgagc ggc.agcccggacggcacccccggcccgccgccccccgacggcacccccgatgacacccc cccccgacgccgtcgcgccccccgacgccgt cgacgccaccccctgccccccgccccccgcccccgacgccgccgcgccccccgccgccga cccagccgagccgccgcggcaggcacccaggaggaggcgcgccaagatcaccggccggga ccctgcggagcccccgtggcagccacgcaagcggagacgcgccaagatcacgggccggga gcgcaaggccatgagggtcctgccggtggtggtc gcgcaaggccatgagggtcctgccggtggtggtc 393
21 AB (horizontal) vs. AB (vertical)
22 Significativité de l alignement : E-valeur E(S,n,m): Nombre moyen d alignements ayant un score supérieur ou égal à S quand on cherche dans une banque de taille m avec une séquence requête de longueur n. décrit le bruit aléatoire qui existe lorsque on aligne des séquences croit de manière proportionnelle en fonction de n et de m décroit de manière exponentielle en fonction du score S plus la E-valeur est proche de 0, plus la similarité est significative
23 Query= actgagcatagctgga (16 letters) Database: All GenBank+EMBL+DDBJ+PDB sequences 1,174,453 sequences; 5,001,591,585 total letters Sequences producing significant alignments: Score E (bits) Value gi AC Mus musculus chromosome gi AC Homo sapiens BAC clone gi AC Canis familiaris clone gi AF Homo sapiens chromosome ALIGNMENTS >gi AC Mus musculus chromosome 10 clone. Length = Query: 1 actgagcatagctgga 16 Sbjct: actgagcatagctgga >gi gb AC Homo sapiens BAC clone Length = Query: 1 actgagcatagctgg 15 Sbjct: actgagcatagctgg 48164
24 Query= actgagcatagctggac (17 letters) Database: All GenBank+EMBL+DDBJ+PDB sequences 1,174,453 sequences; 5,001,591,585 total letters Sequences producing significant alignments: Score E (bits) Value gi AC Mus musculus chromosome gi AL Human DNA sequence fro gi AC Homo sapiens BAC clone ALIGNMENTS >gi AC Mus musculus chromosome 10 clone Query: 1 actgagcatagctggac 17 Sbjct: actgagcatagctggac >gi Human DNA sequence >gi AC Homo sapiens BAC clone Query: 2 ctgagcatagctggac 17 Query: 1 actgagcatagctgg 15 Sbjct: ctgagcatagctggac Sbjct: ctgagcatagctggac 21079
25 Query= actgagcatagctggat (17 letters) Database: All GenBank+EMBL+DDBJ+PDB sequences 1,174,453 sequences; 5,001,591,585 total letters Sequences producing significant alignments: Score E (bits) Value gi AC Mus musculus chromosome 10 c gi AC Homo sapiens BAC clone gi AF Sulfolobus solfataricus ALIGNMENTS >gi AC Mus musculus chromosome 10 clone Query: 1 actgagcatagctgga 16 Sbjct: actgagcatagctgga >gi AC Homo sapiens BAC clone Query: 1 actgagcatagctgg 15 Sbjct: actgagcatagctgg 48164
26 Query= actgagcatag (11 letters) Database: All GenBank+EMBL+DDBJ+PDB sequences 1,174,453 sequences; 5,001,591,585 total letters No significant similarity found.
27 E-value 1000 Query= actgagcatag (11 letters) Database: All GenBank+EMBL+DDBJ+PDB sequences 1,174,453 sequences; 5,001,591,585 total letters Sequences producing significant alignments: Score E (bits) Value gi AC Homo sapiens chromosome 16 clo gi NM_ Danio rerio endothelin recept gi AC Homo sapiens BAC clone gi AC Mus musculus clone rp23-422n gi AP Pyrococcus horikoshii OT gi Drosophila melanogaster ALIGNMENTS >gi AC Homo sapiens chromosome 16 clone Length = Query: 1 actgagcatag 11 Sbjct: actgagcatag 78811
28 Génome de la drosophile Query= actgagcatag (11 letters) Database: D. melanogaster genomic nucleotide sequences 1170 sequences; 122,655,632 total letters Sequences producing significant alignments: Score E (bits) Value gi AE Drosophila melanogaster g gi AE Drosophila melanogaster g gi AE Drosophila melanogaster g gi AE Drosophila melanogaster g gi AE Drosophila melanogaster g ALIGNMENTS >gi gb AE AE Drosophila melanogaster genomic scaffold Query: 1 actgagcatag 11 Sbjct: actgagcatag 17844
29 Les différentes versions de BLAST BLASTN : séquences nucléiques BLASTP : séquences protéiques BLASTX : une séquence nucléique comparée à une base de données protéique. (Traduction suivant les 6 cadres de lecture.) TBLASTX : une séquence protéique comparée à une base de données nucléique TBLASTN : une séquence nucléique comparée à une base de données nucléiques, chacune suivant tous les cadres de lecture. (Cela revient à faire 36 fois BLASTP.)
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailModule Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique
Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z
Plus en détailBig data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme
Plus en détailPerl Orienté Objet BioPerl There is more than one way to do it
Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailBase de données bibliographiques Pubmed-Medline
Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction
Plus en détailIntroduction aux bases de données: application en biologie
Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailIntroduc)on à Ensembl/ Biomart : Par)e pra)que
Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que Exercice 1 1.a. Quelle est la version de l assemblage
Plus en détailMABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Plus en détailFormavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...
Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au
Plus en détailIdentification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailCHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Plus en détailSéquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.
Sommaire Séquence 6 Nous avons vu dans les séances précédentes qu au cours des temps géologiques des espèces différentes se sont succédé, leur apparition et leur disparition étant le résultat de modifications
Plus en détailGMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan
M Bioinformatique, Connaissances et Données Année 24-25 GMIN206 Info. Biologique et Outils bioinformatiques Banques de données biologiques (3h de Cours +,5h de TD + 4h de TP) Elodie Cassan Anne-Muriel
Plus en détailLa fonction exponentielle
DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailExemples de problèmes et d applications. INF6953 Exemples de problèmes 1
Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation
Plus en détail6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses
6. Hachage Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses PLAN Définition Fonctions de Hachage Méthodes de résolution de collisions Estimation
Plus en détailCorrection : E = Soit E = -1,6. F = 12 Soit F = -6 3 + 45. y = 11. et G = -2z + 4y G = 2 6 = 3 G = G = -2 5 + 4 11
Correction : EXERCICE : Calculer en indiquant les étapes: (-6 +9) ( ) ( ) B = -4 (-) (-8) B = - 8 (+ 6) B = - 8 6 B = - 44 EXERCICE : La visite médicale Calcul de la part des élèves rencontrés lundi et
Plus en détailComment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet
Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,
Plus en détailSemestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»
Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,
Plus en détailDétection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots
Université Toulouse 3 Paul Sabatier(UT3 Paul Sabatier) Informatique Spécialité Bioinformatique Eric AUDEMARD lundi 28 novembre 2011 Détection des duplications en tandem au niveau nucléique à l'aide de
Plus en détailCours Bases de données 2ème année IUT
Cours Bases de données 2ème année IUT Cours 13 : Organisation d une base de données, ou comment soulever (un peu) le voile Anne Vilnat http://www.limsi.fr/individu/anne/cours Plan 1 Les clusters de table
Plus en détailCONJUGUÉ D'UN POINT PAR RAPPORT À UN TRIANGLE
CONJUGUÉ D'UN POINT PAR RAPPORT À UN TRIANGLE Jean Luc Bovet, Auvernier L'article de Monsieur Jean Piquerez (Bulletin de la SSPMP No 86), consacré aux symédianes me paraît appeler une généralisation. En
Plus en détail! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)
Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de
Plus en détailGènes Diffusion - EPIC 2010
Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses
Plus en détailAlgorithmique des Systèmes Répartis Protocoles de Communications
Algorithmique des Systèmes Répartis Protocoles de Communications Master Informatique Dominique Méry Université de Lorraine 1 er avril 2014 1 / 70 Plan Communications entre processus Observation et modélisation
Plus en détailSéquençage et Assemblage. de Génomes. François Denizot Emmanuel Talla LCB-IBSM CNRS denizot@ibsm.cnrs-mrs.fr talla@ibsm.cnrs-mrs.
Séquençage et Assemblage de Génomes François Denizot Emmanuel Talla LCB-IBSM CNRS denizot@ibsm.cnrs-mrs.fr talla@ibsm.cnrs-mrs.fr Projet de séquençage d un génome Séquençage aléatoire Assemblage Annotation
Plus en détailUniversité de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription
Université de Montréal Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription par Eloi Mercier Département de bioinformatique Faculté de médecine
Plus en détailLOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.
Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de
Plus en détailSauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS
Sauvegarde collaborative entre pairs 1 Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS Sauvegarde collaborative entre pairs 2 Introduction Pourquoi pair à pair? Utilisation de ressources
Plus en détailBibliographie Introduction à la bioinformatique
Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A
Plus en détailChapitre 5 : Flot maximal dans un graphe
Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d
Plus en détailLes algorithmes de base du graphisme
Les algorithmes de base du graphisme Table des matières 1 Traçage 2 1.1 Segments de droites......................... 2 1.1.1 Algorithmes simples.................... 3 1.1.2 Algorithmes de Bresenham (1965).............
Plus en détailIntroduction à ElasticSearch
Introduction à ElasticSearch Présentée par : Romain Pignolet Lundi 7 Juillet 2014 Sommaire 1 Présentation de Elasticsearch 2 Installation et exemples simples 3 API Rest 4 Comment fonctionne Elasticsearch?
Plus en détailAC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =
LE NOMBRE D OR Présentation et calcul du nombre d or Euclide avait trouvé un moyen de partager en deu un segment selon en «etrême et moyenne raison» Soit un segment [AB]. Le partage d Euclide consiste
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailBaccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.
Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé. L usage d une calculatrice est autorisé Durée : 3heures Deux annexes sont à rendre avec la copie. Exercice 1 5 points 1_ Soit f la
Plus en détailCATALOGUE DES PRESTATIONS DE LA
1/23 La plate-forme Biopuces et Séquençage de Strasbourg est équipée des technologies Affymetrix et Agilent pour l étude du transcriptome et du génome sur puces à ADN. SOMMAIRE ANALYSE TRANSCRIPTIONNELLE...
Plus en détailFeuille d exercices 2 : Espaces probabilisés
Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un
Plus en détailVision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007
Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................
Plus en détailChristian TREPO, MD, PhD
PEG INTERFERON MONOTHERAPI E Christian TREPO, MD, PhD Unmet medical needs in chronic HBV infection Inhibition of viral replication Normalisation of ALT Improvement in liver necroinflammation Improvement
Plus en détailDurée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point
03 Mai 2013 Collège Oasis Durée de L épreuve : 2 heures. apple Le sujet comporte 4 pages et est présenté en livret ; apple La calculatrice est autorisée ; apple 4 points sont attribués à la qualité de
Plus en détailVMware ESX : Installation. Hervé Chaudret RSI - Délégation Centre Poitou-Charentes
VMware ESX : Installation VMware ESX : Installation Créer la Licence ESX 3.0.1 Installation ESX 3.0.1 Outil de management Virtual Infrastructure client 2.0.1 Installation Fonctionnalités Installation Virtual
Plus en détailDr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires
Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique
Plus en détailDéfinitions. Numéro à préciser. (Durée : )
Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.
Plus en détailExtraction d information des bases de séquences biologiques avec R
Extraction d information des bases de séquences biologiques avec R 21 novembre 2006 Résumé Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d intérêt (nucléotidiques et protéiques)
Plus en détailDÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION
DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION PRINCIPES DE BASE SUR LES DONNEES ET LE CALCUL HAUTE PERFORMANCE Lois de Gray sur l ingénierie des données 1 : Les calculs scientifiques traitent des volumes considérables
Plus en détailTraitement bas-niveau
Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.
Plus en détailLe signal GPS. Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz
Le signal GPS Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz Deux signaux en sont dérivés: L1 (fo x 154) = 1.57542 GHz, longueur d onde = 19.0 cm
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailCorrigé du baccalauréat S Asie 21 juin 2010
Corrigé du baccalauréat S Asie juin 00 EXERCICE Commun à tous les candidats 4 points. Question : Le triangle GBI est : Réponse a : isocèle. Réponse b : équilatéral. Réponse c : rectangle. On a GB = + =
Plus en détailSoit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Plus en détailEXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette
Plus en détailAnalyse dialectométrique des parlers berbères de Kabylie
Saïd GUERRAB Analyse dialectométrique des parlers berbères de Kabylie Résumé de la thèse (pour affichage) Il est difficile de parler du berbère sans parler de la variation. Il y a d abord une variation
Plus en détailprésentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :
N Ordre de la Thèse 3282 THÈSE présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 Mention : BIOLOGIE PAR Emilie GUÉRIN Équipe d accueil : École Doctorale
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailOptimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation
Plus en détailEnoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé.
Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé. I- ACTIVITES NUMERIQUES (12 points) Exercice 1 (3 points) On considère
Plus en détail6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr
6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr Interface d un SGF Implémentation d un SGF Gestion de la correspondance entre la structure logique et la structure
Plus en détailFace Recognition Performance: Man vs. Machine
1 Face Recognition Performance: Man vs. Machine Andy Adler Systems and Computer Engineering Carleton University, Ottawa, Canada Are these the same person? 2 3 Same person? Yes I have just demonstrated
Plus en détailSécuristation du Cloud
Schémas de recherche sur données chiffrées avancés Laboratoire de Cryptologie Thales Communications & Security 9 Avril 215 9/4/215 1 / 75 Contexte Introduction Contexte Objectif Applications Aujourd hui
Plus en détailApproche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
Plus en détailDeux disques dans un carré
Deux disques dans un carré Table des matières 1 Fiche résumé 2 2 Fiche élève Seconde - version 1 3 2.1 Le problème............................................... 3 2.2 Construction de la figure avec geogebra...............................
Plus en détailModules d entrées/sorties pour FX série XM07 et XM14
Fiche produit Modules XM07 et XM14 Date Juillet 2009 Modules d entrées/sorties pour FX série XM07 et XM14 Les modules XM07 et XM14 proposent des points d entrées et de sorties physiques supplémentaires
Plus en détailPréleveur d'échantillons d eau automatique ELECTRO-MAGNUM /AQUAMAX 1 & 2 / SERVOTOP
Préleveur d'échantillons d eau automatique ELECTRO-MAGNUM /AQUAMAX 1 & 2 / SERVOTOP Paramétrage du thermostat digital de réfrigération Modèle avec sonde NTC depuis début 2009 (4 touches en dessous de l'afficheur)
Plus en détailLe contexte. Le questionnement du P.E.R. :
Le contexte Ce travail a débuté en janvier. Le P.E.R. engagé depuis fin septembre a permis de faire émerger ou de réactiver : Des raisons d être de la géométrie : Calculer des grandeurs inaccessibles et
Plus en détailExemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions
Exemple accessible via une interface Web Une base de données consultable en ligne : Bases de données et systèmes de gestion de bases de données The Trans-atlantic slave trade database: http://www.slavevoyages.org/tast/index.faces
Plus en détailCaches sémantiques coopératifs pour la gestion de données sur grilles
Caches sémantiques coopératifs pour la gestion de données sur grilles Laurent d Orazio, Fabrice Jouanot, Cyril Labbé, Claudia Roncancio Laboratoire d Informatique de Grenoble 681, rue de la Passerelle,
Plus en détailRobots CNC. WITTMANN nommé «Meilleur achat» pour les robots. Technology working for you.
Robots CNC WITTMANN nommé «Meilleur achat» pour les robots Technology working for you. Le concept robot novateur Des dizaines d années d expériences, de développements et d innovations ont fait des robots
Plus en détailDE L ALGORITHME AU PROGRAMME INTRO AU LANGAGE C 51
DE L ALGORITHME AU PROGRAMME INTRO AU LANGAGE C 51 PLAN DU COURS Introduction au langage C Notions de compilation Variables, types, constantes, tableaux, opérateurs Entrées sorties de base Structures de
Plus en détailGestion des références bibliographiques. Comment simplifier la gestion des références bibliographiques?
Gestion des références bibliographiques Comment simplifier la gestion des références bibliographiques? Objectifs de la formation Créer votre base de données personnelle de références bibliographiques.
Plus en détailThème 2 : Les techniques et stratégies de prospection
BAC PRO VENTE Pole 1 : Prospection Thème 2 : Les techniques et stratégies de prospection Chapitre 1 : Les prospects et les clients Séquence 3 : Des outils de segmentation des clients-prospects - La loi
Plus en détailSEQUENÇAGE LI-COR DNA 4200
SEQUENÇAGE LI-COR DNA 4200 Le gel de séquence contient 64 puits au maximum soit 16 clones traités en parallèle. Les oligos utilisés (modifiés en 5 ) fluorescent à 700/800 nm. Une amorce permet de séquencer
Plus en détailIMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques
IMMUNOLOGIE La spécificité des immunoglobulines et des récepteurs T Informations scientifiques L infection par le VIH entraîne des réactions immunitaires de l organisme qui se traduisent par la production
Plus en détailPrédiction de la structure d une
Prédiction de la structure d une protéine Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Les structures protéiques
Plus en détailTD de Biochimie 4 : Coloration.
TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi
Plus en détailJournée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique
Monitorint spatio-temporel intégré de la mobilité urbaine Monitoring spatio-temporel de l ADN urbain Une réponse aux défis, problèmes, enjeux et risques des milieux urbains Nicolas Lachance-Bernard M.ATDR
Plus en détailSurveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)
Surveillance et maintenance prédictive : évaluation de la latence de fautes Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG) SURVEILLANCE Analyser une situation et fournir des indicateurs! Détection de symptômes!
Plus en détailUTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY
UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier
Plus en détailLes Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16
Les Biolangages Thierry Lecroq Université de Rouen FRANCE 2008 2009 Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 BioPerl Ensemble de modules Perl Utilise la programmation objet L objectif est de mettre
Plus en détailJean-Philippe Préaux http://www.i2m.univ-amu.fr/~preaux
Colonies de fourmis Comment procèdent les colonies de fourmi pour déterminer un chemin presque géodésique de la fourmilière à un stock de nourriture? Les premières fourmis se déplacent au hasard. Les fourmis
Plus en détailCours d initiation à la programmation en C++ Johann Cuenin
Cours d initiation à la programmation en C++ Johann Cuenin 11 octobre 2014 2 Table des matières 1 Introduction 5 2 Bases de la programmation en C++ 7 3 Les types composés 9 3.1 Les tableaux.............................
Plus en détailProcédure d utilisation du Beckman CEQ 2000 XL pour la réalisation de programmes de séquençage ou de génotypage.
MODE OPERATOIRE Code : SSG / 003 UMR 1229 MGS Microbiologie et Géochimie des Sols 17 rue Sully BP86510 21065 Dijon Cedex Rédigé par : D. Bru / S. Hallet. Procédure d utilisation du Beckman CEQ 2000 XL
Plus en détailAlgorithmique et Programmation, IMA
Algorithmique et Programmation, IMA Cours 2 : C Premier Niveau / Algorithmique Université Lille 1 - Polytech Lille Notations, identificateurs Variables et Types de base Expressions Constantes Instructions
Plus en détailde calibration Master 2: Calibration de modèles: présentation et simulation d
Master 2: Calibration de modèles: présentation et simulation de quelques problèmes de calibration Plan de la présentation 1. Présentation de quelques modèles à calibrer 1a. Reconstruction d une courbe
Plus en détailBest Styles ou comment capturer au mieux les primes de risque sur les marchés d actions
Stratégie Best Styles ou comment capturer au mieux les primes de risque sur les marchés d actions La recherche des primes de risque constitue une stratégie relativement courante sur les marchés obligataires
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détail<Insert Picture Here> Solaris pour la base de donnés Oracle
Solaris pour la base de donnés Oracle Alain Chéreau Oracle Solution Center Agenda Compilateurs Mémoire pour la SGA Parallélisme RAC Flash Cache Compilateurs
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailSkype (v2.5) Protocol Data Structures (French) Author : Ouanilo MEDEGAN http://www.oklabs.net
Skype (v2.5) Protocol Data Structures (French) Author : Ouanilo MEDEGAN http://www.oklabs.net : Champ Encodé SKWRITTEN() : Champ Variable défini Précédemment & définissant l état des champs à suivre ECT
Plus en détailNouvelle version de Zonecheck, la 3.0, avec tests DNSSEC
Nouvelle version de Zonecheck, la 3.0, avec tests DNSSEC Stéphane Bortzmeyer Première rédaction de cet article le 22 juin 2010 Le 22 juin, une nouvelle version de Zonecheck
Plus en détailSPECIFICATION DES ECHANGES DE DONNEES INFORMATISES (E.D.I.)
SPECIFICATION DES ECHANGES DE DONNEES INFORMATISES (E.D.I.) Dernière mise à jour : octobre 2013 Ce document a pour objectif de décrire ce que l OPCA (OPCA 3+) attend du fichier à transmettre par l adhérent.
Plus en détailCONFIGURATION DE L AUTOMATE SIEMENS
CONFIGURATION DE L AUTOMATE SIEMENS Créer un projet Dans le bureau de Windows, double-cliquer sur l icône «SIMATIC Manager» : Cliquer ensuite sur l icône «nouveau» : Choisir un nom de projet et valider
Plus en détail2.4 Représentation graphique, tableau de Karnaugh
2 Fonctions binaires 45 2.4 Représentation graphique, tableau de Karnaugh On peut définir complètement une fonction binaire en dressant son tableau de Karnaugh, table de vérité à 2 n cases pour n variables
Plus en détail