Séquençage et Assemblage. de Génomes. François Denizot Emmanuel Talla LCB-IBSM CNRS

Dimension: px
Commencer à balayer dès la page:

Download "Séquençage et Assemblage. de Génomes. François Denizot Emmanuel Talla LCB-IBSM CNRS denizot@ibsm.cnrs-mrs.fr talla@ibsm.cnrs-mrs."

Transcription

1 Séquençage et Assemblage de Génomes François Denizot Emmanuel Talla LCB-IBSM CNRS

2 Projet de séquençage d un génome Séquençage aléatoire Assemblage Annotation Data Release Library construction Assembler Genome scaffold Gene finding Publication Colony picking Combinatorial PCR Homology searches Template preparation Initial role assignments Sequencing reactions Base calling Ordered contig set Gap closure sequence editing Metabolic pathways Gene families Comparative genomics Sequence files Sample tracking Re-assembly ONE ASSEMBLY! Transcriptional/ translational regularory elements Repetitive sequences 2

3 Technologie de séquençage Malgré de nombreuses tentatives de mise au point de nouvelles méthodologies de séquençage d ADN, c est toujours la technique développée par F. Sanger qui est utilisée: Sanger F, Nicklen S, Coulson AR. (1977) DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74:

4

5 Original Sanger Sequencing A mixture of dntps and a single ddntp is used in the reaction tubes. We can start with 4 different reaction tubes, each with all four dntps (datp, dgtp, dttp, dctp) and ONLY one of either dda, ddc, ddg and ddt (only 1%). The key is MOST of the nucleotides are regular ones, and just a fraction of them are dideoxynucleotides.

6 DNA Sequencing begins with replication (similar to PCR)

7

8

9 Séquençage automatique Générer à partir d une extrémité fixe tous les fragments d ADN se terminant par une base donnée Utilisation d un oligonucléotide qui après hybridation à sa matrice simple brin, sert d amorce à une réaction de polymérisation enzymatique

10

11

12 Séparation et détection des fragments

13

14

15 Applied Biosystems 3730xl DNA Analyzer Séquenceur à capillaires pour plaques 96 puits. 1 run ~ 2 heures 10 runs /jours 960 lectures /jours ~1000 bases /lectures bases / jours

16 Automatisation de toutes les étapes Préparation des matrices Réactions de séquence Séparation et détection des fragments Analyse informatique

17 Préparation des matrices Réactions de séquence Séparation et détection des fragments Intégration des éléments dans une chaîne de production Analyse informatique Eviter les goulots d étranglement dans le processus Multiplier les éléments en parallèle USINE Permettant le séquençage d ADN à haut débit

18 Cependant! Limitation importante de la technique!

19 Les contraintes Nécessité de fragmenter le DNA génomique Clonage des fragments en vue de leur amplification Séquençage (souvent partiel) des fragments ou sous-fragments Reconstitution de la séquence d origine

20 DNA fragmentation (mécanique ou enzymatique) Shotgun Clonage dans un vecteur

21 puc (insert jusqu à 10 Kb) (insert jusqu à 45 Kb) (insert jusqu à 100 Kb) (insert 300 Kb) (insert jusqu à 1 Mb, mais réarrangements fréquents)

22 Séquençage des extrémités de chaque insert TTCGATGCTAAAGCTAATCGAAGGGCTTA AAGCTACGATTT GA Élimination des fragments de séquence du vecteur

23 Stratégies de séquençage des génomes

24 Petits génomes peu complexes Grands génomes Forte complexité Mixage des deux approches

25 Le génome du rat «Brown Norway» 2,75 Gb Taille des fragments clonés: <10, 10, 50 et >150kb Profondeur (couverture) ~7X ixage des deux approches Gibbs RA et al. Nature Apr 1;428(6982):

26 Le génome humain (consortium) 3 Gb Ordonnancement des clones (entre eux et sur le chromosome): Comparaison des profils de restriction Hybridation des clones entre eux

27 Finger Print Migration de chaque digestion de BAC Logiciel FPC Minimal Tiling Path X % de fragment "communs" = BACs probablement chevauchant

28 Ordered cloning People who don't trust software generally put a lot of time into dividing large pieces of DNA into small ordered overlapping fragments This strategy requires much more initial cloning work in the laboratory but it minimizes the number of actual sequencing reads required to complete a project It is easy to assemble the reads since it is known how they should fit together to form the final contig

29 Primer Walking Make a new primer from the end of each new sequence read It requires very fast and accurate analysis of sequence reads since each step uses information from the previous read Skips sub-cloing step entirely since all sequencing reactions can be done on one large clone Expensive to make a lot of PCR primers but the price of primer synthesis keeps dropping & there is an economy of scale Assembly problems are minimized since both the order and the amount of overlap of reads are known

30 Shotgun Sequencing Shotgun sequencing takes maximum advantage of the speed and low cost of automated sequencing relies totally on software to assembly a jumble of essentially random sequence reads into a coherent and accurate contig TIGR demonstrated proof of concept on the genomes of Haemophilus influenzae, Methanococcus jannaschii, and Mycoplasma genitalium Celera Genomics demonstrated the ability to shotgun sequence the entire human genome (?)

31 Problems with shotgun sequencing Some sequences are uncloneable; therefore gaps will remain even with redundant coverage Random picking leaves gaps Sample failure of around 20% in the sequencing process is common Sequencing a 40 kb cosmid may require production of 400 kb of raw sequence, with the need for additional sequencing to close gaps Shotgun sequencing is still the most commonly used strategy for sequencing -- it s less labor-intensive than creating nested libraries of ordered subclones.

32 Projet de séquençage d un génome Séquençage aléatoire Assemblage Annotation Data Release Library construction Assembler Genome scaffold Gene finding Publication Colony picking Combinatorial PCR Homology searches Template preparation Initial role assignments Sequencing reactions Base calling Ordered contig set Gap closure sequence editing Metabolic pathways Gene families Comparative genomics Sequence files Sample tracking Re-assembly ONE ASSEMBLY! Transcriptional/ translational regularory elements Repetitive sequences 32

33 A Genome Assembling Project Assemblage Assembler Genome scaffold - Théorie du contigage - Outils d assemblage Combinatorial PCR Ordered contig set Gap closure sequence editing -Etapes de finition - Difficultés et résolution Re-assembly ONE ASSEMBLY!

34 Théorie du contigage

35 La couverture d un contig: un exemple Couverture Contig Reads Pour prévoir une assez bonne couverture de ces contigs lors de l assemblage, il existe une méthode statistique (Lander- Waterman) permettant de determiner le nombre de clones à séquencer, le nombre de contigs prévisibles.

36 Théorie du contigage (Lander-Waterman statistics) (#ilôts) = Ne -cσ (taille des ilôts) = L(e cσ 1) / c + 1 σ L = longueur de la lecture T = chevauchement minimum G = Taille du génome N = Nombre de lectures c = couverture (NL / G) σ = 1 T/L contig = ilôts d au moins 2 lectures

37 Ilôts vs Contigs c N #ilôts #contigs 1 1, , , , G: 1 Mpb L: 600pb T: 40pb

38 Chromobacterium violaceum genome project

39 Outils et programmes d assemblages

40 Le Defi!!!! Image original Pièces du puzzle Reconstruction de l image La mission s apparente à resoudre un puzzle unidimentionnelle avec des centaines de milliers (voire des millions) de pieces et sans l image d origine, bien sur!!!!!!

41 Comment s y prendre? Chromatogramme Programmes d assemblage Sequence complète

42 Sequençage automatique -La plupart des sequençages automatiques utilisent la méthode enzymatique de terminaison de chaine de Sanger (1977), et des marqueurs fluorescents -Séparation des fragments par électrophorese sur gel -Lecture des fragments marques.

43 Sequençage automatique Analyse informatique des images du gel: - lane tracking identifier chaque ligne - trace processing Estimation de l intensité du signal (et bruit de fond) - lane profiling Creation du profile (trace) de chaque chromatogramme - base-calling Transformation des profiles de bases (sequence) Le programme Phred est devenu quasi-standard pour le base calling

44 Base calling - Phred Taux d erreurs varient de 1-17%

45 Base calling - Phred race idéale consiste en: -pics espacés et non hevauchantes Qualité supérieure Aucune ambiguité races généralement btenues different de idéal à cause des: imperfections des éactions de séquençage, e l électrophorèse, ou du trace processing xtremités de la trace Qualité moyenne quelques ambiguités Qualité faible confiance faible

46 Phred quality values q = - 10 log 10 (p) avec: q - quality value p - estimated probability error for a base call Examples: q = 20 means p = 10-2 (1 error in 100 bases) q = 40 means p = 10-4 (1 error in 10,000 bases)

47 Phred Taches effectués par Phred: a. Lire les traces compatible avec la plupart des formats de sequences: SCF (standard), ABI (373/377/3700), ESD (MegaBACE) and LI-COR. b. Base Calling c. Assigne une valeur qualité à chaque base. d. Créer un fichier de séquence et un fichier qualité e. Modifier les chromatogrammes ( vector trimming )

48 Phred BEGIN_SEQUENCE a112e211b.b BEGIN_COMMENT phd2fasta phred Projet.fasta >a112a1.b... ACTGCTCGATGTGTGTG ACTGCTAGCTAGCTAGTC... >a112a2.b ACTGCATGTTCGATCGTAGC... >a112a1.b >a112a2.b Projet.fasta.qual.phd.1 CHROMAT_FILE: a112e211b.b ABI_THUMBPRINT: 0 PHRED_VERSION: c CALL_METHOD: phred QUALITY_LEVELS: 99 TIME: Mon Jan 15 11:27: TRACE_ARRAY_MIN_INDEX: 0 TRACE_ARRAY_MAX_INDEX: TRIM: CHEM: term DYE: big END_COMMENT BEGIN_DNA n 0 5 t 4 24 t 6 35 g 6 44 a 6 71 g 6 92 t t

49 Phred >a112a1.b... ACTGCTCGATGTGTGTG ACTGCTAGCTAGCTAGTC... >a112a2.b ACTGCATGTTCGATCGTAGC... Projet.fasta Crossmatch Séquences de vecteurs >a112a1.b... XXXXXXXXXXXXGTGTG ACTGCTAGCTAGCTAGTC... >a112a2.b ACTGCATGTTCGATCGTAGC... Projet.fasta.screen Projet.fasta.qual Projet.fasta.screen.qual Assemblage

50 Programmes d Assemblage des Séquences Phrap - sequence assembly program (UNIX) Systeme Phred-Phrap-Consed TIGR Assembler - microbial genomes (UNIX) The Staden Package (UNIX) GeneTool/ChromaTool/Sequencher (PC/Mac) Arachne www-genome.wi.mit.edu/wga/ Celera Assembler Paracel Genome Assembler Stroll Amass (Pattern Matching) bio.informatics.indiana.edu/sunkim/amass/ Phusion (SSAHA) Assembler Genome Research 2003 vol 13 p Euler (Eulerian path) AMI based Assembler (Stochastic process) Bioinformatics 2003 vol 19 p22-29

51 Formats et Codification des séquences Nommage des séquences Format des sequences ABI, SCF Les séquences du même clone ont le même prefix L orientation des séquences est matérialisée par g ou b / f ou r Longueur des clones sequencés doit etre définis Taille du clone KT g.SCF KT b.SCF Si séquences provenant des BACs, on effectue également une codification de ces séquences

52 Le système Phred-Phrap-Consed Lire tous les fichiers de séquences (10-10,000) Reverse complemente toutes les séquences (doubles # des séquences à aligner) Alignement multiple de ces séquences afin d obtenir une séquence unique

53 Phrap 1)Rechercher les pairs de séquences chevauchantes 2)Construire l alignement multiple 3)Améliorer l alignement multiple et déterminer le consensus

54 1) Rechercher les paires de séquences chevauchantes -Compare chaque séquence (et son reverse-complement) avec chacune des autres séquences -Génère une liste des régions ayant certains critères de similarités de séquences. Paramètres importants: minimum overlap length, stringency (% of bases identiques), and minimum repeat length.

55 Chevauchement entre deux séquences overlap (19 bases) overhang (6 bases) AGCCTAGACCTACAGGATGCGCGGACACGTAGCCAGGAC CAGTACTTGGATGCGCTGACACGTAGCTTATCCGGT overhang % identity = 18/19 % = 94.7% overlap - region of similarity between regions overhang - un-aligned ends of the sequences Formation des paires de séquences chevauchantes basée sur: length of overlap % identity in overlap region maximum overhang size.

56 Phrap 1) Rechercher les paires de séquences chevauchantes Une séquence peut avoir plusieurs régions chevauchantes

57 1) Rechercher les paires de séquences chevauchantes

58 2) Construire l alignement multiple Combinaison des paires de séquences chevauchantes pour construire des grands fragments de séquences

59 2) Construire l alignement multiple Combinaison des paires de séquences chevauchantes pour construire des grands fragments de séquences

60 2) Construire l alignement multiple Combinaison des paires de séquences chevauchantes pour construire des grands fragments de séquences

61 2) Construire l alignement multiple Combinaison des paires de séquences chevauchantes pour construire des grands fragments de séquences

62 2) Construire l alignement multiple Combinaison des paires de séquences chevauchantes pour construire des grands fragments de séquences

63 2) Construire l alignement multiple Combinaison des paires de séquences chevauchantes pour construire des grands fragments de séquences

64 3) Améliorer l alignement multiple Introduction de gaps dans les alignements de séquences si cela doit ameliorer les alignements. Paramètres: gap creation penalty (default 2.0) gap extension penalty (default (0.1)

65 Au final

66 enus de navigation Consed Séquence du contig Mismatch en rouge Outils de navigation

67 Consed

68 Création des Scaffolds (SuperContigs)

69 Gaps physical gap scaffold A scaffold B sequencing gaps

70 Scaffolding Ordonner et Orienter les contigs (nonchevauchants) le long du chromosome II I III IV III II IV I

71 Contraintes sur les lectures -Les extrémités des lectures doivent avoir une orientation en miroir l un par rapport à l autre -La distance entre deux lectures est connue (avec une certaine erreur expérimentale) clone length F R sequenced ends

72 Création des scaffolds Assembly caffolding

73 Création des scaffolds Assembly caffolding

74 Linking informations Overlaps Mate-pair links Similarity links Physical markers reference genome physical map Clone/Bac reads Gene synteny

75 PCR combinatoire A B D C F E G H A B C D E F G H A B C D E F G H A B C D E F G H A B C D E F G H A B C D E F G H A B C D E F G H A B C D E F G H A B C D E F G H B--D C--F E--H

76 Reads base-pairs Assembly Contigs bp Scaffolding Scaffolds bp

77 Finition Fermeture des gaps

78 Shotgun Finition Shotgun Finition FINITION : -Correction des zones de basse qualité -Ordonnancement des contigs -Séquençage des parties manquantes -gap de séquence -gap de clonage -Réorganisation des séquences répétées

79 Problèmes associés à l assemblage Banques Biaisées === Assemblage foireux L ensemble des clones des différentes banques utilisées doivent couvrir la presque totalité du génome à séquencer Tailles incorrects des Inserts Faible couverture Orientation inconnue des reads. ACGT or TGCA??? Erreurs de séquençage Séquences repétées

80 Finishing repeats RPT A RPT B clones or PCR walks TEP 1. Isolate repeat copies TEP 2. Assemble in isolation TEP 3. Incorporate assembled repeats into rest of assembly - TIGR Assembler can hold together previously assembled contigs - Other assemblers: use repeat consensus as input to the assembler

81 SASA repeat (4776 AA, 14Kb) rom Streptococcus Pneumoniae - likely involved in cell adhesion MTETVEDKVSHSITGLDILKGIVAAGAVISGTVATQTKVFTNESAVLEKTVEKTDALATNDTVVLGTISTSNSASSTSLSASESASTSASESASTSASTSASTSASESASTSASTSISASSTVVGSQTAAA TEATAKKVEEDRKKPASDYVASVTNVNLQSYAKRRKRSVDSIEQLLASIKNAAVFSGNTIVNGAPAINASLNIAKSETKVYTGEGVDSVYRVPIYYKLKVTNDGSKLTFTYTVTYVNPKTNDLGNISSMRP GYSIYNSGTSTQTMLTLGSDLGKPSGVKNYITDKNGRQVLSYNTSTMTTQGSGYTWGNGAQMNGFFAKKGYGLTSSWTVPITGTDTSFTFTPYAARTDRIGINYFNGGGKVVESSTTSQSLSQSKSLSVSA SQSASASASTSASASASTSASASASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTS ASGSASTSTSASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASA STSASVSASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTS ASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASA SASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTS ASASASTSASESASTSASASASTSASESASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASA SASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTS ASESASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASA SASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASAS TSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASASASTSA SESASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASASTSASASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSASASASTSAS ASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASAST SASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSAS ASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESAST SASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASISASESASTSASASASTSAS ASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASAST SASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSAS ASASTSASESASTSASASASTSASASASTSASASASTSASASASASTSASASASTSASASASTSASASASISASESASTSASASASASTSASASASTSASASASTSASASASISASESASTSASESASTST SASASTSASESASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASASTS ASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASG SASTSTSASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTS ASVSASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASA SASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASAS TSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASA SASTSASESASTSASASASTSASESASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASAS TSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASE SASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASAS TSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSA SASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASES ASTSASASASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSA SASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASAS ASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASASASTSASASASISASESASTSASASASTSASASASTSASASAST SASASASISASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSVS NSANHSNSQVGNTSGSTGKSQKELPNTGTESSIGSVLLGVLAAVTGIGLVAKRRKRDEEE

82 Pipeline de Séquençage Quelques Succès

83 Consed A B I vector_dir chromat_dir preta phd_dir base calling quality trimming vector trimming.seq,.qual phd2fasta.contig ace2contig achne2gbrowse Gbrowse.links.reads.ps prearachne runta phrap.xml ta2ace.asm Arachne.bases/.fasta/.contigs repeatfinder gobambus.mates.ace.repeats.stats.details.dot toarachne

84 Sequencing Successes T7 bacteriophage completed in ,937 bp, 59 coded proteins Escherichia coli completed in ,639,221 bp, 4293 ORFs Sacchoromyces cerevisae completed in ,069,252 bp, 5800 genes

85 Sequencing Successes Caenorhabditis elegans completed in ,078,296 bp, 19,099 genes Drosophila melanogaster completed in ,117,226 bp, 13,601 genes

86 Homo sapiens 1st draft completed in ,160,079,000 bp, 31,780 genes

87 The Genome Sequencing Era 18 microbial genomes 40 microbial genomes mouse First eukaryote genome Yeast First higher plant Arabidopsis First fish Fugu irst microbial genome H. influenzae E. coli First multicellular animal C. elegans Fruit fly First mammal Homo sapiens malaria: mosquito and parasite 197 microbial genomes

88 Conclusions et Perspectives Amélioration des procédures d'assemblage en tenant compte des liens clones, des erreurs de nommages, des longueurs variables d'inserts et de la sur-couverture des contigs obtenus. Nécessité d optimisation mathématique (Graphes, Stochastic), et informatique (tables de bits, multi-threading) Diminution des risques d'erreurs d'assemblage Simplification de la phase de finition Obtention d'un génome => Annotation Comparaison génomiques Transcriptome Métabolome Pouvoir pathogène...

89 References TIGR Assembler Sutton, G.G., et al., TIGR Assembler: A New Tool for Assembling Large Shotgun Sequencing Projects. Genome Science and Technology, :9-19. phrap Green, P., PHRAP documentation: ALGORITHMS phred Ewing B., Hillier L, Wendl M, Green P., Basecalling of automated sequencer traces using phred. Genome Research, 1998, 8: consed Gordon, D., C. Abajian, P. Green. Consed: A graphical tool for sequence finishing. Genome Research, 1998, 8: REPuter S. Kurtz, C. Schleiermacher, Fast Computation of Maximal Repeats in Complete Genomes, Bioinformatics, 1999, 15(5): Multiplex PCR Tettelin, H., et al., Optimized Multiplex PCR: Efficiently Closing a Whole- Genome Shotgun Sequencing Project. Genomics, : Celera Assembler Myers, E.W. et al A whole-genome assembly of Drosophila. Science 287: Arachne Batzoglou, S., et al ARACHNE: a whole-genome shotgun assembler. Genome Res 12: Jaffe, D.B., et al Whole-genome sequence assembly for Mammalian genomes: arachne 2. Genome Res 13:

90 References TIGR Assembler Sutton, G.G., et al., TIGR Assembler: A New Tool for Assembling Large Shotgun Sequencing Projects. Genome Science and Technology, :9-19. phrap Green, P., PHRAP documentation: ALGORITHMS phred Ewing B., Hillier L, Wendl M, Green P., Basecalling of automated sequencer traces using phred. Genome Research, 1998, 8: consed Gordon, D., C. Abajian, P. Green. Consed: A graphical tool for sequence finishing. Genome Research, 1998, 8: REPuter S. Kurtz, C. Schleiermacher, Fast Computation of Maximal Repeats in Complete Genomes, Bioinformatics, 1999, 15(5): Multiplex PCR Tettelin, H., et al., Optimized Multiplex PCR: Efficiently Closing a Whole- Genome Shotgun Sequencing Project. Genomics, : Celera Assembler Myers, E.W. et al A whole-genome assembly of Drosophila. Science 287: Arachne Batzoglou, S., et al ARACHNE: a whole-genome shotgun assembler. Genome Res 12: Jaffe, D.B., et al Whole-genome sequence assembly for Mammalian genomes: arachne 2. Genome Res 13:

91 Quelques illustrations et idées empruntées à différents sites Ce site fait référence à un livre: Human Molecular Genetic 2, Tom stachan and Andrew P. Read, Bios Scientific Publisher, Ltd

Séquençage Assemblage. de Génomes. Génomique 1 M1 (2012-2013): Assemblage des Génomes Emmanuel Talla, Aix-Marseille Université

Séquençage Assemblage. de Génomes. Génomique 1 M1 (2012-2013): Assemblage des Génomes Emmanuel Talla, Aix-Marseille Université Séquençage Assemblage de Génomes Génomique 1 M1 (2012-2013): Assemblage des Génomes Emmanuel Talla, Aix-Marseille Université Projet de séquençage d un génome Séquençage aléatoire Assemblage Annotation

Plus en détail

Séquençage haut débit (Next Generation Sequencing) 12/03/2012 Pascal Le Bourgeois, M1BBT, EM8BTGM 1

Séquençage haut débit (Next Generation Sequencing) 12/03/2012 Pascal Le Bourgeois, M1BBT, EM8BTGM 1 Séquençage haut débit (Next Generation Sequencing) 1 Pyroséquençage (454) Margulies M. et al. (2005). Genome sequencing in microfabricated high-density picolitre reactors. Nature 437:376-80 Pas de banques

Plus en détail

La génomique. Etude des génomes et de l ensemble de leurs gènes. Nécessite des outils bioinformatiques. Plusieurs étapes :

La génomique. Etude des génomes et de l ensemble de leurs gènes. Nécessite des outils bioinformatiques. Plusieurs étapes : La génomique Etude des génomes et de l ensemble de leurs gènes La structure Le fonctionnement L évolution Le polymorphisme, Plusieurs étapes : Nécessite des outils bioinformatiques 1 Chronologie sur le

Plus en détail

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation 2- Les molécules d ADN constituent le génome 2-1 La séquence d ADN représente l information génétique Lettres: A, T, G, C Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine).

Plus en détail

RNAseq et NGS. Adriana Alberti Karine Labadie

RNAseq et NGS. Adriana Alberti Karine Labadie RNAseq et NGS Séquençage et Diversité LES ORGANISMES EUCARYOTES animaux plantes champignons protistes BACTERIES ARCHEES VIRUS METAGENOMES LES SOURCES ADN GENOMIQUE ARN / cdna AMPLICONS BACs ET FOSMIDES

Plus en détail

Les technologies de séquençage à haut débit. Patrick Wincker, Genoscope, Institut de Génomique du CEA

Les technologies de séquençage à haut débit. Patrick Wincker, Genoscope, Institut de Génomique du CEA Les technologies de séquençage à haut débit Patrick Wincker, Genoscope, Institut de Génomique du CEA CNG, 12.05.2009 Séquençage Sanger (méthode des dididéoxy terminateurs) : a permis les progrès de la

Plus en détail

Le contrôle qualité sur les données fastq

Le contrôle qualité sur les données fastq Le contrôle qualité sur les données fastq TP detection exome Plan Théorie 1: le format FastQ et l'encodage des qualités Session pratique 1: conversion des qualités (fichier illumina.fastq) Théorie 2: le

Plus en détail

Plateforme de Recherche de Mutations

Plateforme de Recherche de Mutations Plateforme de Recherche de Mutations Jean-Marc Aury contact: pfm@genoscope.cns.fr 29 janvier 2009 Introduction Présentation des données produites par le GSFLX : type, qualité, Méthodes de détection de

Plus en détail

A la rencontre du séquençage haut-débit nouvelle génération. Infosys Building, Kuwait

A la rencontre du séquençage haut-débit nouvelle génération. Infosys Building, Kuwait A la rencontre du séquençage haut-débit nouvelle génération Infosys Building, Kuwait 2001 : Aboutissement du projet Génome Humain Ancêtres & Renouveau 2010 Hélicos, Ion torrent, Pacbio, Oxford Nanopore

Plus en détail

LE SEQUENCAGE DU GENOME HUMAIN. Historique Séquençage Résultats

LE SEQUENCAGE DU GENOME HUMAIN. Historique Séquençage Résultats LE SEQUENCAGE DU GENOME HUMAIN Historique Séquençage Résultats Séquençage de Macromolécules Enchaînement d unités répétitives Petite molécule Couper de façon précise en sous-ensemble 50 25 25 reconstruire

Plus en détail

Interprétation des résultats et troubleshooting

Interprétation des résultats et troubleshooting Interprétation des résultats et troubleshooting Le Service de séquençage du Centre d innovation Génome Québec et Université McGill utilise des appareils 3730xl DNA Analyzer d Applied Biosystems. Cette

Plus en détail

Licence d Informatique Année 2001-2002 Option: Introduction à la biologie moléculaire. LA P.C.R. Polymerase Chain Reaction

Licence d Informatique Année 2001-2002 Option: Introduction à la biologie moléculaire. LA P.C.R. Polymerase Chain Reaction Licence d Informatique Année 2001-2002 Option: Introduction à la biologie moléculaire LA P.C.R. Polymerase Chain Reaction "chercher une aiguille dans une meule de foin"? Chercher à repérer un gène particulier

Plus en détail

Lancer FASTA et BLAST en ligne de commande

Lancer FASTA et BLAST en ligne de commande Lancer FASTA et BLAST en ligne de commande V.2006.1 http://www.esil.univ-mrs.fr/~dgaut/cours Daniel Gautheret ESIL, Université de la Méditerranée Fasta Article original: Lipman and Pearson (1985) Science

Plus en détail

Etapes générales. Polonator. Protocole. Préparation des échantillons. Dover. Séquençage par hybridation/ligation de nonamères. Mise en service en 2009

Etapes générales. Polonator. Protocole. Préparation des échantillons. Dover. Séquençage par hybridation/ligation de nonamères. Mise en service en 2009 Next Generation DNA Sequencing Pourquoi? Séquençage par la méthode de Sanger est pour l instant le «gold standard» Besoins de séquencer toujours plus, plus vite et moins cher But: Séquencer 1 génome humain

Plus en détail

Le séquençage à haut débit Mars 2011

Le séquençage à haut débit Mars 2011 Atelier Epigénétique Université Pierre et Marie Curie Le séquençage à haut débit Mars 2011 Stéphane Le Crom (lecrom@biologie.ens.fr) Institut de Biologie de l École normale supérieure (IBENS) de la Montagne

Plus en détail

Algorithmes pour la comparaison de séquences II

Algorithmes pour la comparaison de séquences II Algorithmes pour la comparaison de séquences II Hélène TOUZET touzet@lifl.fr Equipe Bioinfo Master recherche informatique www.lifl.fr/~touzet/masterrecherche.html Pourquoi comparer des séquences? Puisque

Plus en détail

INTRODUCTION À LA GÉNOMIQUE

INTRODUCTION À LA GÉNOMIQUE 0 INTRODUCTION À LA GÉNOMIQUE Diversité des génomes à l échelle du vivant. I. Outils de la génomique Cours INSA AMIG - Février 2013 - Yann Lesecque - yann.lesecque@gmail.com 1 Plan Trois types d approches

Plus en détail

Bioinformatique dans l IUP

Bioinformatique dans l IUP Bioinformatique dans l IUP Intervenants Equipe Bioinfo (Laboratoire d Informatique Fondamentale de Lille) Cours : Jean-Stéphane Varré (jean-stephane.varre@lifl.fr) TD sur machine : Jean-Stéphane Varré,

Plus en détail

15 septembre 2010. Démo #2 MySQL Séquençage

15 septembre 2010. Démo #2 MySQL Séquençage 15 septembre 2010 Démo #2 MySQL Séquençage SQL et MySQL SQL: structured query language langage pour manipuler des données dans des bases de données relationnelles MySQL: Implantation de SQL Ajout à SQL

Plus en détail

Single Molecule Real Time (SMRT) Sequencing : PacBio RS II

Single Molecule Real Time (SMRT) Sequencing : PacBio RS II Single Molecule Real Time (SMRT) Sequencing : PacBio RS II Input sample Genome DNA, Amplicons, cdna Input sample amounts according to the protocols (10ng-10µg) High Input sample quality (integrity and

Plus en détail

Les propriétés physicochimiques de l ADN Structure des génomes La chromatine

Les propriétés physicochimiques de l ADN Structure des génomes La chromatine Cours de Biologie Moléculaire L2S3 Structure de l ADN Organisation des génomes 2ème cours (1h30) Les propriétés physicochimiques de l ADN Structure des génomes La chromatine L ADN est chargé négativement

Plus en détail

Introduction : l ère de la génomique

Introduction : l ère de la génomique Introduction : l ère de la génomique En 1995, pour la première fois, la séquence complète du génome d une cellule vivante a été déterminée. Il s agissait d Haemophilus influenzae, une bactérie responsable

Plus en détail

Barcoding environnemental par séquençage haut débit

Barcoding environnemental par séquençage haut débit Barcoding environnemental par séquençage haut débit Potentiel et limites Jean-François Martin Échantillonnage Spécificités du barcoding environnemental Amplification (PCR) de marqueurs choisis Séquençage

Plus en détail

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Séquençage ADN Détermination de l ordre d enchainement des nucléotides d un fragment

Plus en détail

Interprétation des résultats

Interprétation des résultats Plateforme de séquençage Cochin Interprétation des résultats Grace à la base de données vous avez un accès direct à vos séquences. Pour valider la qualité de ces séquences vous devez visualiser leur chromatogramme.

Plus en détail

Objectif : identifier la mutation responsable de la maladie parmi les millions de polymorphisme.

Objectif : identifier la mutation responsable de la maladie parmi les millions de polymorphisme. Identification de gènes morbides Analyses mutationnelles Maladies monogéniques Objectif : identifier la mutation responsable de la maladie parmi les millions de polymorphisme. Plan : Variations du nombre

Plus en détail

Assemblage ciblé de séquences : un problème d optimisation d actualité. Jacques Nicolas. Projet Inria Symbiose Rennes

Assemblage ciblé de séquences : un problème d optimisation d actualité. Jacques Nicolas. Projet Inria Symbiose Rennes Assemblage ciblé de séquences : un problème d optimisation d actualité Jacques Nicolas Projet Inria Symbiose Rennes Schéma de base de l assemblage Recherche de recouvrements Shotgun Fragments obtenus par

Plus en détail

génomes Présentation La biologie à l'heure du séquençage des génomes Séquençage de génomes: Pourquoi? Comment? Annotation des génomes

génomes Présentation La biologie à l'heure du séquençage des génomes Séquençage de génomes: Pourquoi? Comment? Annotation des génomes Présentation Bioinformatique: analyse des génomes Céline Brochier-Armanet (Laurent Duret) Université Claude Bernard, Lyon 1 Laboratoire de Biométrie et Biologie évolutive (UMR 5558) Celine.brochier-armanet@univ-lyon1.fr

Plus en détail

6. Les désastres environnementaux sont plus fréquents. 7. On ne recycle pas ses déchets ménagers. 8. Il faut prendre une douche au lieu d un bain.

6. Les désastres environnementaux sont plus fréquents. 7. On ne recycle pas ses déchets ménagers. 8. Il faut prendre une douche au lieu d un bain. 1. Notre planète est menacée! 2. Il faut faire quelque chose! 3. On devrait faire quelque chose. 4. Il y a trop de circulation en ville. 5. L air est pollué. 6. Les désastres environnementaux sont plus

Plus en détail

Paired-end versus mate-pair

Paired-end versus mate-pair Paired-end versus mate-pair Auteurs : Ségolène CABOCHE 1, Gaël EVEN 2 1 Docteur en informatique, Université de Lille2 2 Ingénieur en bioinformatique, Gènes Diffusion Version : 1.0 Dernière modification

Plus en détail

Les nouvelles technologies de séquençage au Genoscope. Jean-Marc Aury, France Denoeud

Les nouvelles technologies de séquençage au Genoscope. Jean-Marc Aury, France Denoeud Les nouvelles technologies de séquençage au Genoscope Jean-Marc Aury, France Denoeud Introduction Présentation du Genoscope et des activités liées aux NTS Séquençage et assemblage des génomes procaryotes

Plus en détail

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00 Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00 HFFv2 1. OBJET L accroissement de la taille de code sur la version 2.0.00 a nécessité une évolution du mapping de la flash. La conséquence de ce

Plus en détail

Jean-Michel CLAVERIE Information Génomique & Structurale UPR 2589 - CNRS Marseille

Jean-Michel CLAVERIE Information Génomique & Structurale UPR 2589 - CNRS Marseille Jean-Michel CLAVERIE Information Génomique & Structurale UPR 2589 - CNRS Marseille ROBOTS DE NOUVELLE GÉNÉRATION POUR LE SÉQUENÇAGE (NGS): LES IMPLICATIONS Avant (1991-2005): les étapes du séquençage (ADN)

Plus en détail

Modélisation de la structure 3D des protéines

Modélisation de la structure 3D des protéines Modélisation de la structure 3D des protéines We are drowning in data and starving for knowledge -R.D. Roger Unité Mathématique Informatique et Génome Séminaire AGENAE, Seignosse-le-Pénon, 20-21 mai 2003

Plus en détail

Master 1 Biologie Santé UE Expression des génomes et transcriptomique. Sujet de : Hélène Dauchel Durée : 2h

Master 1 Biologie Santé UE Expression des génomes et transcriptomique. Sujet de : Hélène Dauchel Durée : 2h Master 1 Biologie Santé UE Expression des génomes et transcriptomique Sujet de : Hélène Dauchel Durée : 2h ****** Les trois questions sont à traitées, elles sont indépendantes : Question 1 : 4 points,

Plus en détail

DIAGNOSTIC PRÉNATAL NON INVASIF : LE SANG MATERNEL

DIAGNOSTIC PRÉNATAL NON INVASIF : LE SANG MATERNEL 6 LE TEST DIAGNOSTIC PRÉNATAL NON INVASIF : LE SANG MATERNEL Source : les cellules trophoblastiques Fetal cell Cell isolation Détection 5-6SA Disparition rapide après accouchement Pas de persistance après

Plus en détail

8.3.3 Réactifs. La polymérase catalyse la synthèse de brins complémentaires d ADN.

8.3.3 Réactifs. La polymérase catalyse la synthèse de brins complémentaires d ADN. 8.3.3 Réactifs 1. AD polymérase: La polymérase catalyse la synthèse de brins complémentaires d AD. Des polymérases qui sont résistantes à la chaleur sont utilisées, telles que la Taq polymérase (Thermus

Plus en détail

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire Plan 1 Banques de données 2 Comparaison de 2 séquences Dotplot, alignement optimal Recherche de similarité 3 Alignement multiple l 4 Phylogénie moléculaire Recherche de similarité 1 séquence (Query) comparée

Plus en détail

I. TOUITOU (Mise ligne 15/10/08 LIPCOM-RM) Faculté de Médecine Montpellier-Nîmes

I. TOUITOU (Mise ligne 15/10/08 LIPCOM-RM) Faculté de Médecine Montpellier-Nîmes er cycle PCEM MI5 Génétique moléculaire et clinique Année Universitaire 008-009 Comment apprécier la composante héréditaire des maladies?. Excès de cas familiaux - Les études familiales - - La plupart

Plus en détail

L2 microbiologie TD08: méthodes de la microbiologie moléculaire

L2 microbiologie TD08: méthodes de la microbiologie moléculaire # Andrew Tolonen (atolonen@gmail.com) # avril 2013 L2 microbiologie TD08: méthodes de la microbiologie moléculaire Exercise 1: amplification d'un gène d'intéret par PCR Vous êtes un médecin travaillant

Plus en détail

IPv6. Internet Control Message Protocol ICMPv6. Objectif: Comparer ICMPv4 avec ICMPv6

IPv6. Internet Control Message Protocol ICMPv6. Objectif: Comparer ICMPv4 avec ICMPv6 IPv6 Internet Control Message Protocol ICMPv6 Objectif: Comparer ICMPv4 avec ICMPv6 v.1b IPv6 Théorie et Pratique & Microsoft Introduction to IPv6 1 ICMPv6 (RFC 2463) Trois fonctions déjà présentes en

Plus en détail

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Biodiversité fongique Biodiversité: diversité spécifique d une communauté écologique, correspondant au nombre d espèces et à leur

Plus en détail

Le séquençage haut-débit

Le séquençage haut-débit Nouveaux outils en biologie Le séquençage haut-débit DES d hématologie 16 janvier 2015 Paris Alice Marceau-Renaut Laboratoire d hématologie CHRU Lille NGS = Next-Generation Sequencing Whole-genome Whole-exome

Plus en détail

Introduction au GBS. Hueber Yann, Alexis Dereeper, Gautier Sarah, François Sabot, Vincent Ranwez, Jean-François Dufayard 9-13 février 2015

Introduction au GBS. Hueber Yann, Alexis Dereeper, Gautier Sarah, François Sabot, Vincent Ranwez, Jean-François Dufayard 9-13 février 2015 Introduction au GBS Hueber Yann, Alexis Dereeper, Gautier Sarah, François Sabot, Vincent Ranwez, Jean-François Dufayard 9-13 février 2015 Sommaire Définition Les différentes méthodologies Exemple du RADseq

Plus en détail

2: Les enzymes de restriction

2: Les enzymes de restriction 2: Les enzymes de restriction Les enzymes de restriction sont des protéines synthétisées par des bactéries pour se protéger des infections de virus (bactériophages). Ces enzymes coupent l ADN viral à des

Plus en détail

Gel Documentation DRAGONFLY 140. Présentation :

Gel Documentation DRAGONFLY 140. Présentation : Gel Documentation DRAGONFLY 140 Présentation : Notre imageur DRAGONFLY 140 est un système unique et autonome de gel documentation d une extrème convivialité, d un maniement et d un entretien simple. DRAGONFLY

Plus en détail

MAT 2377 Solutions to the Mi-term

MAT 2377 Solutions to the Mi-term MAT 2377 Solutions to the Mi-term Tuesday June 16 15 Time: 70 minutes Student Number: Name: Professor M. Alvo This is an open book exam. Standard calculators are permitted. Answer all questions. Place

Plus en détail

Méthodes de séquençage d ADN

Méthodes de séquençage d ADN Méthodes de séquençage d ADN Rappel : ADN, Clonage, Électrophorèse Méthode chimique de Maxam et Gilbert Méthode enzymatique de Sanger Détails des techniques utilisées au début des années 1990 Séquençage

Plus en détail

Génie génétique. Définition : Outils nécessaires : Techniques utilisées : Application du génie génétique : - Production de protéines

Génie génétique. Définition : Outils nécessaires : Techniques utilisées : Application du génie génétique : - Production de protéines Génie génétique Définition : Ensemble de méthodes d investigation et d expérimentation sur les gènes. Outils nécessaires : ADN recombinant, enzyme de restriction, vecteur, banque ADNc, sonde nucléique...

Plus en détail

Génotypage par Séquençage (GBS) : Création d une carte génétique haute densité de Tournesol Population INEDI (RILs PSC8 x XRQ)

Génotypage par Séquençage (GBS) : Création d une carte génétique haute densité de Tournesol Population INEDI (RILs PSC8 x XRQ) Génotypage par Séquençage (GBS) : Création d une carte génétique haute densité de Tournesol Population INEDI (RILs PSC8 x XRQ) Baptiste Mayjonade (IE-CDD SUNRISE) Génétique et génomique des réponses aux

Plus en détail

De la biologie molécualire à la génomique

De la biologie molécualire à la génomique De la biologie molécualire à la génomique Pierre Neuvial École Nationale de la Statistique et de l Administration Économique Méthodes statistiques pour la biologie Plan du cours 1 Introduction à la biologie

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Le séquençage à haut débit Juin 2012

Le séquençage à haut débit Juin 2012 Atelier Epigénétique Université Pierre et Marie Curie Le séquençage à haut débit Juin 2012 Stéphane Le Crom (stephane.le_crom@upmc.fr) Laboratoire de Biologie du Développement (UPMC) de la Montagne Sainte

Plus en détail

Technical Service Bulletin

Technical Service Bulletin INTRODUCTION: Technical Service Bulletin June 25, 2009 Title: M.I.L. "ON" DTC P0AC0, P0AF, P0A7F, AND/OR P0AFA Models: 04-09 Prius Some vehicles may exhibit a M.I.L. ON condition with one or more of the

Plus en détail

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Statisticiens: Sophie Lamarre Steve Van Ginkel Sébastien Déjean - Magali San Cristobal Matthieu Vignes Biologistes: Stéphane

Plus en détail

Utilisation des marqueurs ISSR pour l'étude du polymorphisme génétique d'artemisia herba-alba

Utilisation des marqueurs ISSR pour l'étude du polymorphisme génétique d'artemisia herba-alba Utilisation des marqueurs ISSR pour l'étude du polymorphisme génétique d'artemisia herba-alba Haouari M., Ferchichi A. in Ferchichi A. (comp.), Ferchichi A. (collab.). Réhabilitation des pâturages et des

Plus en détail

Deux plateformes IBiSA et 3 plateaux techniques regroupés depuis 2010. Responsable scientifique Denis Milan. Coordination des nouveaux investissements

Deux plateformes IBiSA et 3 plateaux techniques regroupés depuis 2010. Responsable scientifique Denis Milan. Coordination des nouveaux investissements RNA-seq Olivier Bouchez Nathalie Marsaud Mercredi 28 mars 2012 Plateforme GeT : Génome et Transcriptome Deux plateformes IBiSA et 3 plateaux techniques regroupés depuis 2010 Responsable scientifique Denis

Plus en détail

Exercices LINUX TP2 INTRODUCTION. Les précédents exercices ont permis :

Exercices LINUX TP2 INTRODUCTION. Les précédents exercices ont permis : Exercices LINUX TP2 INTRODUCTION Les précédents exercices ont permis : - d introduire les commandes de base pour se déplacer dans l arborescence et la modifier - - de manipuler les fichiers de données,

Plus en détail

Les outils du génie génétique.

Les outils du génie génétique. Les outils du génie génétique. I\ Les enzymes. On va se servir des enzymes pour couper, coller et synthétiser des acides nucléiques. A\ Les polymérases. Toutes les polymérases agissent de 5 vers 3. En

Plus en détail

Date: 09/11/15 www.crmconsult.com Version: 2.0

Date: 09/11/15 www.crmconsult.com Version: 2.0 Date: 9/11/2015 contact@crmconsult.fr Page 1 / 10 Table des matières 1 SUGARPSHOP : SCHEMA... 3 2 PRESENTATION... 4 3 SHOPFORCE WITH SCREENSHOTS... 5 3.1 CLIENTS... 5 3.2 ORDERS... 6 4 INSTALLATION...

Plus en détail

Monday, December 2 nd 2013. Formation Galaxy

Monday, December 2 nd 2013. Formation Galaxy Formation Galaxy Lundi, 10 Février 2014 This training has not for objectives to introduce every Galaxy tool individually or to build a workflow to process your own data. Objectives: To provide a first

Plus en détail

Biologie Moléculaire 6 GT SG FWB Leçon n 5

Biologie Moléculaire 6 GT SG FWB Leçon n 5 Biologie Moléculaire 6 GT SG FWB Leçon n 5 Tests de paternité (fin labo électrophorèse) Un test de paternité consiste à analyser l'adn de deux personnes dans le but d'établir un lien de parenté génétique.

Plus en détail

1809-2009 Deux siècles de science Questions d'hier, réponses d'aujourd'hui, horizons de demain

1809-2009 Deux siècles de science Questions d'hier, réponses d'aujourd'hui, horizons de demain 1809-2009 Deux siècles de science Questions d'hier, réponses d'aujourd'hui, horizons de demain Le séquençage du génome humain et après? Comment a-t-il été séquencé? Que nous apprend la séquence? Et après?

Plus en détail

La biologie moléculaire Décrypter le vivant: Comprendre et agir

La biologie moléculaire Décrypter le vivant: Comprendre et agir La biologie moléculaire Décrypter le vivant: Comprendre et agir Bernard KNOOPS Knoops@bani.ucl.ac.be Bernard HALLET Hallet@gene.ucl.ac.be Université Catholique de Louvain Institut des Sciences de la Vie

Plus en détail

3. Biotechnologie de l ADN

3. Biotechnologie de l ADN 3. Biotechnologie de l ADN 3.1. Technologie de l ADN recombinant 3.1.1. Isolation d ADN et d ARN 3.1.2. Fragmentation de l ADN (les Endonucléases) 3.1.3. Analyse d ADN sur d agarose et d acrylamide 3.1.4.

Plus en détail

Polymorphismes de l ADN

Polymorphismes de l ADN Introduction Polymorphismes de l ADN Présentation et mise en évidence Recherche de gènes responsables de maladies génétiques : Analyse de pedigrees où la maladie est présente Sur quel chromosome? À quel

Plus en détail

Le séquençage Roche 454

Le séquençage Roche 454 Le séquençage Roche 454 www.454.com Stéphane Fénart, Arnaud Mouchon Roscoff, Avril 2012 Systèmes Genome Sequencers Une stratégie unique en séquençage nouvelle génération Pionniers en séquençage de nouvelle

Plus en détail

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years.

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years. Linja Game Rules 2 players Ages 8+ Published under license from FoxMind Games NV, by: FoxMind Games BV Stadhouderskade 125hs Amsterdam, The Netherlands Distribution in North America: FoxMind USA 2710 Thomes

Plus en détail

Post-traitement et analyse des données

Post-traitement et analyse des données V. Garcia J. Dupiot Post-traitement et analyse des données PAGE 1 Post-traitement et analyse des données Post-traitement. Production des séquences Evaluation de la qualité de séquençage Analyse / pipeline

Plus en détail

Préparation et réalisation de réactions de séquence (Quick Start Kit, Beckman Coulter)

Préparation et réalisation de réactions de séquence (Quick Start Kit, Beckman Coulter) MODE OPERATOIRE Code : SSG / 001 UMR 1229 MGS Microbiologie et Géochimie des Sols 17 rue Sully BP86510 21065 Dijon Cedex Rédigé par : D. Bru Préparation et réalisation de réactions de séquence (Quick Start

Plus en détail

deux tâches dans le tableau et à cliquer sur l icône représentant une chaîne dans la barre d outils. 14- Délier les tâches : double cliquer sur la

deux tâches dans le tableau et à cliquer sur l icône représentant une chaîne dans la barre d outils. 14- Délier les tâches : double cliquer sur la MS Project 1- Créer un nouveau projet définir la date du déclenchement (début) ou de la fin : File New 2- Définir les détails du projet : File Properties (permet aussi de voir les détails : coûts, suivi,

Plus en détail

PERCIMAP. Oreochromis niloticus. Construction d une carte RH à haute densité du génome de Tilapia CNRS UMR 6061

PERCIMAP. Oreochromis niloticus. Construction d une carte RH à haute densité du génome de Tilapia CNRS UMR 6061 PERCIMAP Construction d une carte RH à haute densité du génome de Tilapia Oreochromis niloticus CIRAD UPR20 Aquaculture et gestion des ressources aquatiques, Montpellier H. D Cotta E. Pepey J.F. Baroiller

Plus en détail

Introduction à la Bio-Informatique IFT3295/IFT6291/BIN6000. Nadia El-Mabrouk DIRO, Université de Montréal

Introduction à la Bio-Informatique IFT3295/IFT6291/BIN6000. Nadia El-Mabrouk DIRO, Université de Montréal Introduction à la Bio-Informatique IFT3295/IFT6291/BIN6000 Nadia El-Mabrouk DIRO, Université de Montréal Qu est-ce que la Bioinformatique? Qu est-ce que la Bio-informatique? Champs multi-disciplinaire

Plus en détail

NOTICE D UTILISATION Option USB 2-Ports USB FRANCAIS

NOTICE D UTILISATION Option USB 2-Ports USB FRANCAIS NOTICE D UTILISATION Option USB 2-Ports USB FRANCAIS Introduction Ce supplément vous informe de l utilisation de la fonction USB qui a été installée sur votre table de mixage. Disponible avec 2 ports USB

Plus en détail

ICC International Court of Arbitration Bulletin. Cour internationale d arbitrage de la CCI

ICC International Court of Arbitration Bulletin. Cour internationale d arbitrage de la CCI ICC International Court of Arbitration Bulletin Cour internationale d arbitrage de la CCI Extract for restricted use Extrait à tirage limité International Court of Arbitration 38, Cours Albert 1er, 75008

Plus en détail

Les principes du sequençage haut-débit

Les principes du sequençage haut-débit Les principes du sequençage haut-débit Mardi 23 avril 2013 Dr H. EL HOUSNI Organisation Génomique Podhala'et'al.'Trends'in'genetics'2012' Costa V et al. J BioMed BioTech 2010 32 ans Costa V et al. J BioMed

Plus en détail

Kit d extraction PicoPure DNA

Kit d extraction PicoPure DNA Directement à la PCR Le kit PicoPure DNA permet une extraction simple et rapide de l ADN génomique prêt à l utilisation en PCR. Extraire et amplifier l ADN dans le même tube, sans phase d extraction organique

Plus en détail

Q PCR sur LC480 Roche

Q PCR sur LC480 Roche Q PCR sur LC480 Roche!! NE JAMAIS LAISSER DE PLAQUE DANS L APPAREIL!! Généralités : lampe xénon à arc : s éteint 30 min après chaque run durée d un run : plq 96p = 1h10 environ plq 384p = 40 50 min environ

Plus en détail

XM-EVT Universal Vinyl Siding Trim

XM-EVT Universal Vinyl Siding Trim XM-EVT Universal Vinyl Siding Trim The Universal Vinyl Siding Trim is designed to provide a finished look on the outside wall of a home. The Vinyl Siding Trim is a universal part that can be used in combination

Plus en détail

3615 SELFIE. http://graffitiresearchlab.fr HOW-TO / GUIDE D'UTILISATION

3615 SELFIE. http://graffitiresearchlab.fr HOW-TO / GUIDE D'UTILISATION 3615 SELFIE http://graffitiresearchlab.fr HOW-TO / GUIDE D'UTILISATION Hardware : Minitel Computer DIN FM545 45 connector (http://www.gotronic.fr/art-fiche-din-fm545-4747.htm) Cable Arduino compatible

Plus en détail

PACKZ System Requirements. Version: 2015-05-27. Version: 2015-05-27 Copyright 2015, PACKZ Software GmbH. 1

PACKZ System Requirements. Version: 2015-05-27. Version: 2015-05-27 Copyright 2015, PACKZ Software GmbH. 1 PACKZ System Requirements Version: 2015-05-27 Copyright 2015, PACKZ Software GmbH. All rights reserved.this manual may not be copied, photocopied, reproduced, translated, or converted to any electronic

Plus en détail

EUDAT and CINES data preservation services. Workshop PREDON Stéphane Coutin 05 nov 2014

EUDAT and CINES data preservation services. Workshop PREDON Stéphane Coutin 05 nov 2014 EUDAT and CINES data preservation services Workshop PREDON Stéphane Coutin 05 nov 2014 Le CINES Basé à Montpellier (Hérault, France) EPA créé en 1999, succédant au CNUSC (Centre National Universitaire

Plus en détail

Editing and managing Systems engineering processes at Snecma

Editing and managing Systems engineering processes at Snecma Editing and managing Systems engineering processes at Snecma Atego workshop 2014-04-03 Ce document et les informations qu il contient sont la propriété de Ils ne doivent pas être copiés ni communiqués

Plus en détail

L intérêt du génome individuel

L intérêt du génome individuel L intérêt du génome individuel 28/11/2012 Nom: Vincent Bours Historique et grands projets 1953: structure de l ADN 1977: Fred Sanger, séquençage de l ADN Fin 1980s: Human Genome Project Projet Génome Humain

Plus en détail

ACTIVITE Extrait du rapport de Stage de Séverine ESCAICH

ACTIVITE Extrait du rapport de Stage de Séverine ESCAICH ACTIVITE Extrait du rapport de Stage de Séverine ESCAICH SOMMAIRE I. RÉACTION DE SÉQUENCE...2 I1. Principe de la méthode de SANGER...2 I2. Adaptation de la technique à la fluorescence...3 I3. Conditions

Plus en détail

Identifier des éléments biologiques dans les reads sans assemblage ni génome de référence. Pierre Peterlongo, Nadia Pisanti and Marie-France Sagot

Identifier des éléments biologiques dans les reads sans assemblage ni génome de référence. Pierre Peterlongo, Nadia Pisanti and Marie-France Sagot Identifier des éléments biologiques dans les reads sans assemblage ni génome de référence Pierre Peterlongo, Nadia Pisanti and Marie-France Sagot Que faire des reads? Premiers reflexes Avec un génome de

Plus en détail

Licence-Master Bioinformatique Contrôle continu 06/03/06. Correction

Licence-Master Bioinformatique Contrôle continu 06/03/06. Correction Licence-Master Bioinformatique Contrôle continu 06/03/06 Correction -«Vraies» questions de cours -«fausses» questions de cours: questions pour voir si pouviez imaginer une réponse crédible qui n était

Plus en détail

Qualité des séquences produites par 454 : exemple de traitement

Qualité des séquences produites par 454 : exemple de traitement Qualité des séquences produites par 454 : exemple de traitement Eric PEYRETAILLADE Equipe d accueil CIDAM Faculté de Pharmacie, Université d Auvergne 1 La Technologie 454 (Roche) Etape 1 : Préparation

Plus en détail

DOCKER & A PRIVATE CLOUD: A HAPPY MARRIAGE

DOCKER & A PRIVATE CLOUD: A HAPPY MARRIAGE DOCKER & A PRIVATE CLOUD: A HAPPY MARRIAGE A working group: GUGGO Several Bioinformatics centre: PCIM Brest ABiMS Roscoff GenOuest Rennes BIPAA Rennes BIRD Nantes IRHS Angers Yvan Le Bras, Cyril Monjeaud,

Plus en détail

LA PCR QUANTITATIVE EN TEMPS REEL OU LA "TAQMAN"

LA PCR QUANTITATIVE EN TEMPS REEL OU LA TAQMAN LA PCR QUANTITATIVE EN TEMPS REEL OU LA "TAQMAN" I- Terminologie Le terme TaqMan est souvent utilisé par abus de langage pour désigner : - la technique de PCR quantitative par détection en temps réel de

Plus en détail

Building Local Climate Zones by using socio-economic and topographic vectorial databases

Building Local Climate Zones by using socio-economic and topographic vectorial databases Recherche portant la référence Building Local Climate Zones by using socio-economic and topographic vectorial databases C. Plumejeaud, C. Poitevin, C. Pignon-Mussaud, N. Long UMR 7266 LIENSs, Littoral

Plus en détail

Imagerie Confocale Chromatique

Imagerie Confocale Chromatique Imagerie Confocale Chromatique L imagerie confocale chromatique (Brevet STIL) ) a été inventée en 1995 et est reconnue mondialement comme une technique précise et fiable pour la mesure d épaisseur et de

Plus en détail

MOFAE Multi-objective Optimization Approach to Framework API Evolution

MOFAE Multi-objective Optimization Approach to Framework API Evolution MOFAE Multi-objective Optimization Approach to Framework API Evolution Wei Wu 1,2, Yann-Gaël Guéhéneuc 1, Giuliano Antoniol 2 Ptidej Team 1, SOCCER Lab 2 DGIGL, École Polytechnique de Montréal, Canada

Plus en détail

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA Amplification spécifique Détection spécifique Clonage dans des vecteurs Amplification in vitro PCR Hybridation moléculaire - hôte cellulaire

Plus en détail

A joint institute between LIRMM and NXP. Un laboratoire commun LIRMM-NXP

A joint institute between LIRMM and NXP. Un laboratoire commun LIRMM-NXP A joint institute between LIRMM and NXP Un laboratoire commun LIRMM-NXP ISyTest, Institute for System Testing In the fast-moving world of integrated systems, test solutions are faced with two major issues:

Plus en détail

Marc DELPECH. CORATA La Rochelle le 21 mai 2008

Marc DELPECH. CORATA La Rochelle le 21 mai 2008 Marc DELPECH CORATA La Rochelle le 21 mai 2008 En 24 ans les progrès ont été considérables Premières utilisation des techniques de génétique moléculaire en diagnostic : 1984 Une palette de techniques très

Plus en détail

PROTOCOLE DE DESSIN DES OLIGONUCLEOTIDES LONGS POUR PUCES A ADN. Sommaire

PROTOCOLE DE DESSIN DES OLIGONUCLEOTIDES LONGS POUR PUCES A ADN. Sommaire Sommaire 1. PRINCIPE DE FONCTIONNEMENT:... 2 2. PRE-REQUIS AVANT LE DESSIN DES OLIGONUCLEOTIDES:... 3 2.1 Installation du logiciel OligoArray sur PC:... 3 2.2 Installation du logiciel OligoArray sur Mac:...

Plus en détail

Résumé. Création d un fichier d aide pour Système de supervision automatisé

Résumé. Création d un fichier d aide pour Système de supervision automatisé Résumé Création d un fichier d aide pour Système de supervision automatisé Tuteur entreprise Rosaire LAVOIE Tuteur École Bertrand BOYER Nicolas FYOT Spécialité Génie électrique Résumé Summary Soprema est

Plus en détail

Un ACTIF InConToURnABLE PoUR DEs PARTEnARIATs significatifs. social. An ASSeT To meaningful PARTneRSHIPS

Un ACTIF InConToURnABLE PoUR DEs PARTEnARIATs significatifs. social. An ASSeT To meaningful PARTneRSHIPS Le capital Un ACTIF InConToURnABLE PoUR DEs PARTEnARIATs significatifs social capital An ASSeT To meaningful PARTneRSHIPS Présentation des participants participants presentation Fondation Dufresne et Gauthier

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail