Analyse in-silico de séquences biologiques
|
|
- Lucien Clément
- il y a 7 ans
- Total affichages :
Transcription
1 Analyse in-silico de séquences biologiques Carl Herrmann IBDML Université de la Méditerranée année
2 Génomique "traditionnelle" organisme à séquencer séquençage "contigs" assemblage du génome 2
3 Une nouvelle science: la métagénomique 2000: expédition Sorcerer II de C. Venter dans la mer des Sargasses But: 3 prélever des échantillons marins séquencer l'adn présent étudier les diversité des organismes marins expérience renouvelée dans des mines de fer et d'autres environnements
4 Procédé: 1. prélèvement 2. filtrage 3. séquençage par "shotgun" 4. assemblage des fragments génomiques pour obtenir... 4
5 ... ça (1 Giganucléotides d'adn...) >gi gb EN marine metagenome JCVI_SCAF_ genomic scaffold, whole genome shotgun sequence GAAGATGAGGCGCACAAAACGGCCTTTGAAGCGCTGGTTAAAGCGGCTAAAATAAACGGAATTAACGGTC ACCGCGATGTTGGTGGTTACCGTGCATCGATGTACAATGCACTAGGCTTAGACAGTGTTCAGGCGTTAGT GGATTGTATGCAAGAATTAGAAAACACACACGCATGAAAGTATTAGCAAACGACGGAATTTCAGCTTCGG GAATCGCAGCGATAGAGGCTTCAGGGCACGAATTAATCACCACTAAAGTCGCTCAAGAGCAACTGGAAAG CTACATCAACGAACACCAGATTGATGTGGTTTTGGTGCGTTCAGCAACTACGGTGCGCAAGGAATTGATT GATGCATGTCCTTCAATAAAAGGCATCGGTCGCGGTGGCGTAGGTATGGATAATATCGATGTGGCGTATG CGCGTGAGAAAGGCCTCAAGGTATTTAATACGCCTGCAGCGTCTTCAGATTCTGTCGCGGAATTAGTGAT GGGACACATGCGAACGTTGGTACGTTTCTTACACGACTCCAATAGAAACATGCCGCTCGACGGTGATTCA AAATTCGCGTCGTTGAAAAAAGCCTATGCCGGCGGGATGGAATTGCGCGGTAGAACTTTAGGTATTGTTG GATTCGGTCGCATCGGTCAAGCTTTGGCGAAATTGGCTATTGGTGCGGGAATGGAAGTCGTTTTCTCCGA TATGCACAATGATCACATGGATGTGGCATTGGAATTCTTTGACGGTCAATCGTTAAGCTTCACATGTAAG AATGTAGGCTTGGAAAGGCGTGTTGGCACAATCGGATTTCATTTCACTACACGTTCCAGCGGCGATTTGA TTGGCGCAGCGGAAATTGCAAAAATGAAGGACGTGTGTTTTCTTATTAAATGCTGCGCGTGGCGGAGTAA TTAATGAAGAGGCATTGCTTGATGCGCTGGAGAGCGGCAAGGTAGCTGGAGCTGGATTAGATGTCTTCAA GAATGAGCCTACGCCCGCTGTGAAAGTCTTAATGAATGGAAAAGTGAGTCTTACTCCGCACATTGGTGCA GCGACGGGAGAGGCACAAGATCGCATTGGAACTGAATTGGCGTCCCATATTGATGCGCTCGCAGCGAGTC TCTAGACTGTACTTATAACTTTTTGATGAGCCCTGCGGATTCCGCGGGGCTTTTCTTTTTTGATTGTGTA ATTTCACTTCAAGAACCACCAACAGAATAGAGCTATGCTCCGACCTTTCAAAGCGGTACGTCCGACGCGT GATAAAGCGTATTTAGTTGCCACCCGTTCCTATATTACTTACGGGGCGGAAGAGCTAGATGATAAGTTAG AAAATAACCCGTATACCTTCTTGCACGTCATCAATCCAAATGCATTGCCGGAAGCAAATTATAAAGACCG GTTCAAGGCCGTACGCAGCCGCTACGATCGGTTCGAAAAGGAAGACATCTTTATTCAAGAAGCCCAGTCG ACGTATTACCTCTATGAGCAAAAAACACCTTCGGCAACCTATACGGGCGTTATTGGTTTACTTGACGCCG AAAGTGTGGTCAACGGGACAACGCTGCCGCACGAGAAAACAATCGCAAAACGCGAGCATATTTTTGCCCG ATATCTCAGTATCACAGGGTTTCAGGCAGAACCTGTGTTGGTTTTTGGAGAAGCCGATGAGCACTACGAT CGCTTGGTGAATCGAATTAAAGAAGACCGGCCCGAATACGAGTTTTCCTCCACTGATAGGTATTGCCACA AATTATGGGTGGTGCCATCAGAATACGTA quelles questions poser? 5
6 Questions possibles codant/non-codant? 2. si codant: fonction de la protéine? domaines protéiques? histoire évolutive de la protéine (séquences orthologues chez d'autres organismes)? nous allons utiliser des outils "in-silico" pour répondre à ces questions... 6
7 QUESTION 1: la séquence d'adn est-elle codante ou non?? (i.e. contient-elle un gène codant pour une protéine?) 7
8 A quoi reconnait-on un gène? codon d'initiation de la traduction codon stop ACGTCGGATCATGCTTAGCTTAGGCTATGCTTAAATT M L S L G Y A * cadre de lecture ouvert = ORF = "open-reading frame" ATTENTION: un gène contient un ORF, mais un ORF ne correspond pas forcément à un gène!! 8
9 un petit calcul fréquence des nucléotides: A,C,G,T = 0.25 fréquence des ATG = 0.25*0.25*0.25 = on trouve un ATG en moyenne tous les 64 nucléotides codons stop: TGA, TAA, TAG 1 codon sur ~ 21 en moyenne est un codon stop beaucoup de ATG...(stop) dans les séquences d'adn 9
10 la preuve: séquence intergénique de Drosophile (garanti 100% sans gène!) >up FBgn loc= strand= sourcefile=../dmel chr4 r4.3.fasta.masked CCATCCTGAATGTGGTATGTAAATCTAACATTTTTATGCTAAGCCTCCACTTACTTGTATATTATATAGG CTACGTTTCGTAACGATCGAGGTGTATACAAAGAAGCCGAAATTCACAGGTATGTAAAGCATTTAATTTA... comment distinguer les "bons" ORF des "mauvais"? longueur(orf)» 21 codons (~ 60 et plus) 10
11 Recherche d'orf sur le brin direct et reverse complémentaire dans les 3 cadres de lecture taille minimale des ORF: > 60 AA E D E A H K T A F E A L V K A A K I N G K M R R T K R P L K R W L K R L K. T E R. G A Q N G L. S A G. S G. N K R N GAAGATGAGGCGCACAAAACGGCCTTTGAAGCGCTGGTTAAAGCGGCTAAAATAAACGGA CTTCTACTCCGCGTGTTTTGCCGGAAACTTCGCGACCAATTTCGCCGATTTTATTTGCCT F I L R V F R G K F R Q N F R S F Y V S L H P A C F P R Q L A P. L P. F L R F S S A C L V A K S A S T L A A L I F P I 11
12 QUESTION 2: cet ORF est-il codant? si oui, quelle fonction? cet ORF ressemble-t-il à une protéine connue? 12
13 au début sont les alignements... alignements = outils de base de l'analyse bioinformatique permettent de comparer des séquences biologiques 13 nucléiques (ADN,ARN) protéiques différents outils en fonction du type d'alignement (local/global) de la longueur des séquences, etc... alignement contre des banques de données de séquences (séquences nucléiques, protéiques, EST, ARNm,...)
14 pourquoi comparer les séquences? 14 une ressemblance entre séquences peut indiquer: une fonction biologique proche une structure 3D semblable une origine et/ou histoire évolutive commune la comparaison de séquence permet aussi d'assembler des fragments de séquences de mettre en évidence les différences de séquençage entre différents laboratoires
15 comparaison de 2 séquences séquence A W L T E K E G S Y P K L séquence B W L S S S M N N Q V F P Q L exemple d'alignement insertion/deletion W L T E K E G S Y P K L W L S S S M N N Q V F P Q L identité substitution non-conservative 15 substitution conservative
16 d'autres alignements sont possibles W L T E K E G S Y P K L W L S S S M N N Q V F P Q L W L T E K E G S Y P K L W L S S S M N N Q V F P Q L comment décider?? 16
17 évolution des séquences protéiques mutations d'acides aminés certaines mutations plus favorables propriétés physico-chimiques semblables structure 3D conservée insertion/délétion de fragments de séquences iso-formes issues de l'epissage alternatif certains scénarios évolutifs sont plus probables que d'autres 17
18 évaluation d'un alignement score qui dépend nombre et nature des identités nombre et nature des substitutions nombre d'insertion/délétion score global = scores des positions meilleur alignement: score maximum W L T E K E G S Y P K L W L S S S M N N Q V F P Q L score = s(w,w) +s(l,l) + s(t,s) + s(e,s) s(gap l=2)
19 les paramètres insertion/délétion: 2 paramètres ouverture de gap extension de gap CGATGCAGCAGCAGCATCG CGATGC------AGCATCG CGATGCAGCAGCAGCATCG CG-TG-AGCA-CA--AT-G ouverture de gap extension de gap (13 x 1) (6 x 1) = (13 x 1) - (5 x 10) - (6 x 1) = -43 le caractère non linéaire est plus conforme à la réalité biologique
20 les paramètres ex.: BLOSUM62 identité/substitution: matrices de substitution score pour chaque conservation/substitution 20 obtenu empiriquement à partir des substitutions observées entre séquences
21 influence des paramètres matrice BLOSUM62 W L T E K E G S Y P K L W L S S S M N N Q V F P Q L matrice PAM250 W L T E K E G S Y P K L W L S S S M N N Q V F P Q L 21
22 Alignement optimal 22 comment trouver l'alignement optimal? énumération de tous les alignements possibles et recherche du score max impossible! (complexité en (2n)!/n²) méthodes "heuristiques" pas de garantie que l'alignement soit optimal (il l'est cependant presque toujours...) énorme gain de rapidité (complexité en O(n²))
23 alignement global/local A B Alignement global Alignement forcé des extrémités A B Alignement local 23 Pénalisation forte des délétions/insertions
24 alignement global A B Alignement global 24 Alignement forcé des extrémités utilisé pour aligner des séquences homologues (gènes, protéines, chromosomes) afin de déterminer les mutations évolutives à la base des alignements multiples (ClustalW,...)
25 alignement local A B Alignement local 25 Pénalisation forte des délétions/insertions utilisé pour identifier des séquences homologues, p.ex. dans les banques de données l'homologie peut être restreinte à une portion de séquence (domaine protéique) algo. le plus répandu: BLAST (blastp, blastn,...)
26 BLAST algorithmes Needelman & Wunsch : trop lents pour aligner une séquence contre des centaines d'autres... BLAST: approche heuristique 26 (Altschul, 1990) avantage : rapide inconvénient: pas forcément la solution optimale... recherche de similarité dans des banques de séquences (GenBank, SwissProt,...)
27 BLAST score 27 (Altschul, 1990) longueur de l'alignement
28 BlastP à la loupe BlastP de la protéine dffa_human de SwissProt contre la banque SwissProt
29 29
30 E-value: combien d'alignement de cette qualité peut-on s'attendre à obtenir de manière aléatoire? 30
31 BLAST (Altschul, 1990) plusieurs versions séquence banque de séquence b la s tn n u c lé iq u e n u c lé iq u e b la s tp p ro té iq u e p ro té iq u e b la s tx n u c lé iq u e p ro té iq u e p ro té iq u e tb la s tn p ro té iq u e n u c lé iq u e p ro té iq u e tb la s tx 31 n u c lé iq u e n u c lé iq u e p ro té iq u e p ro té iq u e permet de détecter des gènes potentiels dans une séquence d'adn
32 Comparer ADN ou peptide?? 73% nucl. id 93% nucl. id A C C G T T A C A T G G T A T A C G G T G A C C T G G T A C A C C G T T A C A T G G T A T A C C G T T A T A T G G T A T T T V V T T 100% AA id 32 W W Y Y T T V V T I W W 80% AA id Conclusion: les mutations dans la séquence d'adn ne sont pas équivalentes: mutations synonymes (ne changent pas l'aa) mutations non-synonymes Y Y
33 Comparer ADN ou peptide?? similarité moyenne entre 2 séquences d'adn de longueur égale: 25% similarité moyenne entre 2 séquences d'aa de longueur égale: 5% Conclusion: il est plus fréquent d'avoir une bonne similarité due au hasard entre 2 séquences d'adn que d'aa Si la séquence d'adn est potentiellement codante (présence d'orf),on compare les séquences d'acides aminés plutôt que les séquences d'adn 33
34 exemple de banques de séquences 34 SwissProt: séquences protéiques (Institut Suisse de Bioinformatique & EBI) 200,000 séquences grande qualité des fiches beaucoup d'informations fonctionnelles nr = non-redundant: compilation de plusieurs banques de données protéiques 3.4 millions de séquences SwissProt Protein Information Ressource (PIR) traduction de séquences nucléiques de GenBank PDB (structurale)
35 QUESTION 3: si la séquence est codante, quelle est la fonction de la protéine? 35
36 BlastP à la loupe... BlastP d'un ORF contre la banque SwissProt les similarités semblent se concentrer dans certaines régions 36
37 Protéines homologues gi sp O70302 CIDA_MOUSE Cell death activator CIDE-A (... gi sp P56198 CIDEC_MOUSE Cell death activator CIDE-3... gi sp O60543 CIDA_HUMAN Cell death activator CIDE-A (... gi sp Q96AQ7 CIDEC_HUMAN Cell death activator CIDE-3... gi sp P10567 MYSP_CAEEL Paramyosin gi sp Q02171 MYSP_ONCVO Paramyosin gi sp Q9NJA9 MYSP_ANISI Paramyosin (Allergen Ani s 2) gi sp Q01202 MYSP_BRUMA Paramyosin gi sp P13392 MYSP_DIRIM Paramyosin e-09 2e-08 3e-08 7e
38 Conclusion 38 Blast semble définir des familles de protéines définies par la possession d'une portion de séquence commune
39 Familles, domaines, motifs etc 39 famille protéique: ensemble de protéines évolutivement reliées; un ou plusieurs domaines protéiques communs domaine protéique: unité structurale (et fonctionnelle) indépendante, évolutivement conservée (doigt de zinc, boucle,...) motifs protéiques: plus courts site de modification post-traductionnelle site de liaison (ADN, métal,...) site actif d'enzyme un domaine contient généralement plusieurs motifs
40 Domaines protéiques 1. Comment caractériser ces régions? 2. Comment rechercher leur présence dans des séquences protéiques? 40
41 Outils d'alignement Blast : homologie «deux à deux» on veut plus!! on veut étudier l'homologie au sein d'une famille au niveau de chaque acide aminé! 41 quels sont les acides aminés conservés? y en a-t-il certains plus conservés que d'autres? quelles sont les substitutions tolérées?
42 Un nouvel outil: ClustalW ClustalW = outil d'alignement multiple alignement global «tous contre tous» alignement global 2 à 2 de toutes les paires de séquences matrices de distance; construction d'un arbre de guidage («guide tree») alignement progressif dans l'ordre phylogénétique (+ proches d'abord)
43 Exemple alignement ClustalW: alignement de séquences homologues 43 E Q = conservatif: AA polaires et chargés F V = semi-conservatif: AA hydrophobes mais V petit
44 protéines liées à l'insuline motif protéique lié à l'insuline IGF1B_HUMAN IGF1_PIG IGF1_CANFA IGF2_HORSE INS_CHIBR INS_ORNAN INS_AOTTR * :. 44 APQTGIVDECCFRSCDLRRLEMYCAPLKPAKSAR APQTGIVDECCFRSCDLRRLEMYCAPLKPAKSAR APQTGIVDECCFRSCDLRRLEMYCAPLKPAKSAR -RSRGIVEECCFRSCDLALLETYCATPAKSERDV -----IVDQCCTSICTLYQLENYCN IVEECCKGVCSMYQLENYCN MQKRGVVDQCCTSICSLYQLQNYCN :*::** * : *: ** conservation parfaite subsitution conservative substitution semi-conservative
45 Le guide du petit protéomiste situation 1 séquence protéique quels sont les motifs contenus dans cette protéine? 45 situation 2 situation 3 séquence protéique motif protéique quelles sont les protéines qui contiennent ce motif? quels sont les motifs contenus dans cette protéine? quelles sont les autres protéines qui contiennent ce(s) motif(s)?
46 InterPro la mère de toutes les banques 46
47 analyse d'une protéine contre InterPro recherche de fiches par mots-clé 47
48 Résultat InterProScan fiche Pfam fiche ProDom 48
49 Fiche InterPro annotation fonctionnelle liée à ce domaine 49
50 Conclusion 1. est ce que la séquence d'adn est potentiellement codante? ORFfinder 2. est ce que cet ORF correspond à une protéine? BLASTP ou BLASTX 3. quelle est la fonction potentielle de la protéine? INTERPROSCAN 50
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailCHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Plus en détailBig data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme
Plus en détailMABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Plus en détailModule Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique
Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z
Plus en détailPerl Orienté Objet BioPerl There is more than one way to do it
Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels
Plus en détailSemestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»
Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,
Plus en détailIdentification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Plus en détailDétection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots
Université Toulouse 3 Paul Sabatier(UT3 Paul Sabatier) Informatique Spécialité Bioinformatique Eric AUDEMARD lundi 28 novembre 2011 Détection des duplications en tandem au niveau nucléique à l'aide de
Plus en détailCours 3 : Python, les conditions
Cours 3 : Python, les conditions Conditions Permet d'exécuter des ordres dans certaines conditions : if condition1: code exécuté si condition1 est vraie code exécuté si condition1 est vraie... elif condition2:
Plus en détailContrôle de l'expression génétique :
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles L'ARNm, simple intermédiaire entre le génome et les protéines? gène protéine L'ARNm, simple intermédiaire entre le génome et
Plus en détailMaster de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant
Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master
Plus en détailTD de Biochimie 4 : Coloration.
TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi
Plus en détailContrôle de l'expression génétique : Les régulations post-transcriptionnelles
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles http://perso.univ-rennes1.fr/serge.hardy/ utilisateur : biochimie mot de passe : 2007 L'ARNm, simple intermédiaire entre le
Plus en détailIntroduction aux bases de données: application en biologie
Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,
Plus en détailComment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet
Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,
Plus en détailMise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique
Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes
Plus en détailBibliographie Introduction à la bioinformatique
Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A
Plus en détailDÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION
DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION PRINCIPES DE BASE SUR LES DONNEES ET LE CALCUL HAUTE PERFORMANCE Lois de Gray sur l ingénierie des données 1 : Les calculs scientifiques traitent des volumes considérables
Plus en détailAnalyse des données de séquençage massif par des méthodes phylogénétiques
Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'environnement
Plus en détailSystèmes de transmission
Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un
Plus en détailGénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010
GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection
Plus en détailDétection et prise en charge de la résistance aux antirétroviraux
Détection et prise en charge de la résistance aux antirétroviraux Jean Ruelle, PhD AIDS Reference Laboratory, UCLouvain, Bruxelles Corata 2011, Namur, 10 juin 2011 Laboratoires de référence SIDA (Belgique)
Plus en détail! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)
Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de
Plus en détailGMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan
M Bioinformatique, Connaissances et Données Année 24-25 GMIN206 Info. Biologique et Outils bioinformatiques Banques de données biologiques (3h de Cours +,5h de TD + 4h de TP) Elodie Cassan Anne-Muriel
Plus en détailL informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich
L informatique comme discipline au gymnase Renato Renner Institut für Theoretische Physik ETH Zürich Comment puis-je transférer des fichiers de musique sur mon nouvel iphone? Comment puis-je archiver mes
Plus en détailExtraction d information des bases de séquences biologiques avec R
Extraction d information des bases de séquences biologiques avec R 21 novembre 2006 Résumé Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d intérêt (nucléotidiques et protéiques)
Plus en détailIntroduc)on à Ensembl/ Biomart : Par)e pra)que
Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que Exercice 1 1.a. Quelle est la version de l assemblage
Plus en détailUniversité de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription
Université de Montréal Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription par Eloi Mercier Département de bioinformatique Faculté de médecine
Plus en détailALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII
ALGORITHMIQUE II NOTION DE COMPLEXITE 1 2 Comment choisir entre différents algorithmes pour résoudre un même problème? Plusieurs critères de choix : Exactitude Simplicité Efficacité (but de ce chapitre)
Plus en détailLes bases de données transcriptionnelles en ligne
Les bases de données transcriptionnelles en ligne Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription
Plus en détailTP Bases de données réparties
page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure
Plus en détailBases moléculaires des mutations Marc Jeanpierre
Bases moléculaires des mutations Marc Jeanpierre Chaque enfant qui naît hérite de 10 à 30 nouvelles mutations ponctuelles. L essentiel des ces mutations sont heureusement des variations neutres de séquence
Plus en détailGènes Diffusion - EPIC 2010
Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses
Plus en détailUnivers Vivant Révision. Notions STE
Univers Vivant Révision Notions STE Chap. 13) L Écologie 1) a) Qu est-ce que l empreinte écologique? L empreinte écologique correspond à la surface terrestre et aquatique totale nécessaire à un individu,
Plus en détailFormavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...
Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au
Plus en détailSéquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.
Sommaire Séquence 6 Nous avons vu dans les séances précédentes qu au cours des temps géologiques des espèces différentes se sont succédé, leur apparition et leur disparition étant le résultat de modifications
Plus en détailANALYSE DE RISQUE AVEC LA MÉTHODE MEHARI Eric Papet e.papet@dev1-0.com Co-Fondateur SSII DEV1.0 Architecte Logiciel & Sécurité Lead Auditor ISO 27001
ANALYSE DE RISQUE AVEC LA MÉTHODE MEHARI Eric Papet e.papet@dev1-0.com Co-Fondateur SSII DEV1.0 Architecte Logiciel & Sécurité Lead Auditor ISO 27001 PLAN Introduction Générale Introduction MEHARI L'analyse
Plus en détailGénétique et génomique Pierre Martin
Génétique et génomique Pierre Martin Principe de la sélections Repérage des animaux intéressants X Accouplements Programmés Sélection des meilleurs mâles pour la diffusion Index diffusés Indexation simultanée
Plus en détailprésentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :
N Ordre de la Thèse 3282 THÈSE présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 Mention : BIOLOGIE PAR Emilie GUÉRIN Équipe d accueil : École Doctorale
Plus en détailAlgorithmique I. Augustin.Lux@imag.fr Roger.Mohr@imag.fr Maud.Marchal@imag.fr. Algorithmique I 20-09-06 p.1/??
Algorithmique I Augustin.Lux@imag.fr Roger.Mohr@imag.fr Maud.Marchal@imag.fr Télécom 2006/07 Algorithmique I 20-09-06 p.1/?? Organisation en Algorithmique 2 séances par semaine pendant 8 semaines. Enseignement
Plus en détailHépatite chronique B Moyens thérapeutiques
Hépatite chronique B Moyens thérapeutiques Dr Olfa BAHRI Laboratoire de Virologie Clinique Institut Pasteur de Tunis INTRODUCTION Plus de 300. 10 6 porteurs chroniques de VHB dans le monde Hépatite chronique
Plus en détailLa reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006
La reconnaissance moléculaire: la base du design rationnel En 1890 Emil Fisher a proposé le modèle "serrure et clé" pour expliquer la façon de fonctionner des systèmes biologiques. Un substrat rentre et
Plus en détailPrincipes de bonne pratique :
Principes de bonne pratique : Recommandations en vue de la création de bases de données génétiques nationales Le présent document a été élaboré par le Groupe d experts d INTERPOL sur le suivi des techniques
Plus en détailEfficacité énergétique des réseaux de cœur et d accès
Efficacité énergétique des réseaux de cœur et d accès David Coudert Joanna Mouliérac, Frédéric Giroire MASCOTTE I3S (CNRS/Université Nice Sophia-Antipolis) INRIA Sophia-Antipolis Méditerranée 1 Contexte
Plus en détailLA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE
Biologie LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE Février 2006 I. L'INTRODUCTION Chaque cellule d'un organisme supérieur provient de la multiplication d'une cellule préexistante (cellule
Plus en détailUTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY
UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier
Plus en détailBig Data et la santé
Big Data, c'est quoi? Big Data et la santé Collecte, stockage et exploitation de masses de données Capter de façon automatique et anonyme une très grande quantité d'informations, les traiter avec des algorithmes
Plus en détailMASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE
MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE RÉSUMÉ DE LA FORMATION Type de diplôme : Master (LMD) Domaine ministériel : Sciences, Technologies, Santé Mention : BIOLOGIE SANTE Spécialité
Plus en détaile-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé
e-biogenouest Coordinateur : Olivier Collin Animateur : Yvan Le Bras CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé
Plus en détailIMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques
IMMUNOLOGIE La spécificité des immunoglobulines et des récepteurs T Informations scientifiques L infection par le VIH entraîne des réactions immunitaires de l organisme qui se traduisent par la production
Plus en détailLes Réseaux sans fils : IEEE 802.11. F. Nolot
Les Réseaux sans fils : IEEE 802.11 F. Nolot 1 Les Réseaux sans fils : IEEE 802.11 Historique F. Nolot 2 Historique 1er norme publiée en 1997 Débit jusque 2 Mb/s En 1998, norme 802.11b, commercialement
Plus en détailLes outils de génétique moléculaire Les techniques liées aux acides nucléiques
Les outils de génétique moléculaire Les techniques liées aux acides nucléiques Sommaire Preparation des acides nucléiques Extraction / purification Les enzymes agissant sur les acides nucléiques Les enzymes
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailSystème d autorisation de mise en circulation de lots du CBER : vue d ensemble du processus actuel
Système d autorisation de mise en circulation de lots du CBER : vue d ensemble du processus actuel DIAPOSITIVE 1 Cette présentation a trait au système d autorisation de mise en circulation de lots du CBER.
Plus en détailPrédiction de la structure d une
Prédiction de la structure d une protéine Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Les structures protéiques
Plus en détailTravaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015
Andrew Tolonen atolonen@genoscope.cns.fr Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015 A- Généralités I- La vie sur terre telle que nous la connaissons ne
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailCours n 12. Technologies WAN 2nd partie
Cours n 12 Technologies WAN 2nd partie 1 Sommaire Aperçu des technologies WAN Technologies WAN Conception d un WAN 2 Lignes Louées Lorsque des connexions dédiées permanentes sont nécessaires, des lignes
Plus en détailItem 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Plus en détailCombinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux
Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux Jean-Baka Domelevo Entfellner To cite this version: Jean-Baka
Plus en détail1 les caractères des êtres humains.
Quelques rappels des classes précédentes ACTIVITÉ livre pages 8 et 9 : apprendre le bilan de la page 9 Les êtres vivants sont répartis en espèces. Chaque être vivant est formé de cellules. schéma d une
Plus en détailGUIDE PRATIQUE DU REFERENCEMENT NATUREL
GUIDE PRATIQUE DU REFERENCEMENT NATUREL Auteur Walid Gabteni, Consultant SEO édition du 20 Juin 2015 Source officielle du guide pratique du référencement naturel : https://upload.wikimedia.org/wikipedia/commons/f/f3/guide_pratique_du_référencem
Plus en détailPrésentation du Master Ingénierie Informatique et du Master Science Informatique 2007-2008, Année 2 Université Paris-Est Marne-la-Vallée
Présentation du Master Ingénierie Informatique et du Master Science Informatique 2007-2008, Année 2 Université Paris-Est Marne-la-Vallée Responsable du Master Informatique : Marc Zipstein Responsable de
Plus en détailLaboratoire d informatique Gaspard-Monge UMR 8049. Journée Labex Bézout- ANSES
Laboratoire d informatique Gaspard-Monge UMR 8049 Journée Labex Bézout- ANSES Présentation du laboratoire 150 membres, 71 chercheurs et enseignants-chercheurs, 60 doctorants 4 tutelles : CNRS, École des
Plus en détailIntroduction à la Génomique Fonctionnelle
Introduction à la Génomique Fonctionnelle Cours aux étudiants de BSc Biologie 3ème année Philippe Reymond, MER PLAN DU COURS - Séquençage des génomes - Fabrication de DNA microarrays - Autres méthodes
Plus en détailEDI et commerce électronique
EDI et commerce électronique Table des matières 1. L Echange des Données Informatisées «EDI»... 2 1.1 La naissance du Besoin à L'EDI... 2 1.2 L objectif de L EDI... 2 1.3 Définition de L EDI... 2 1.4 Mise
Plus en détailBases de données des mutations
Bases de données des mutations CFMDB CFTR2 CFTR-France / Registre Corinne THEZE, Corinne BAREIL Laboratoire de génétique moléculaire Montpellier Atelier Muco, Lille, 25-27 septembre 2014 Accès libre http://www.genet.sickkids.on.ca/app
Plus en détailINTRODUCTION À L'ENZYMOLOGIE
INTRODUCTION À L'ENZYMOLOGIE Les enzymes sont des macromolécules spécialisées qui - catalysent les réactions biologiques - transforment différentes formes d'énergie. Les enzymes diffèrent des catalyseurs
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailDr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires
Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique
Plus en détailSERVICES DE SEQUENÇAGE
MARCH 16, 2014 SERVICES DE SEQUENÇAGE Centre d innovation Génome Québec et Université McGill Services de Validation et détection de SNP Technologie de Séquençage de Nouvelle Génération Guide de l utilisateur
Plus en détailJOURNÉE THÉMATIQUE SUR LES RISQUES
Survol de Risk IT UN NOUVEAU RÉFÉRENTIEL DE GESTION DES RISQUES TI GP - Québec 2010 JOURNÉE THÉMATIQUE SUR LES RISQUES 3 mars 2010 - Version 4.0 Mario Lapointe ing. MBA CISA CGEIT mario.lapointe@metastrategie.com
Plus en détailLaboratoire de Photophysique et de Photochimie Supra- et Macromoléculaires (UMR 8531)
Unité Mixte du CNRS (UMR8531) Institut de Chimie Directeur : Keitaro NAKATANI (PU ENS Cachan) Courrier électronique : nakatani@ppsm.ens-cachan.fr http://www.ppsm.ens-cachan.fr Problématique générale :
Plus en détailChapitre 7. Récurrences
Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,
Plus en détailPartie 7 : Gestion de la mémoire
INF3600+INF2610 Automne 2006 Partie 7 : Gestion de la mémoire Exercice 1 : Considérez un système disposant de 16 MO de mémoire physique réservée aux processus utilisateur. La mémoire est composée de cases
Plus en détailNouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires
Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,
Plus en détailIntroduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.
Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis
Plus en détailExemples de problèmes et d applications. INF6953 Exemples de problèmes 1
Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation
Plus en détailOptimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailCOMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS
1 sur 9 COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS (L'article intégral est paru dans Gestions Hospitalières n 357 de juin-juillet 1996) Pour plus d'informations concernant
Plus en détailMAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères 91030 Evry Cedex. www.mabsolut.com. intervient à chaque étape de
Mabsolut-DEF-HI:Mise en page 1 17/11/11 17:45 Page1 le département prestataire de services de MABLife de la conception à la validation MAB Solut intervient à chaque étape de vos projets Création d anticorps
Plus en détailPotentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés
Potentiels de la technologie FPGA dans la conception des systèmes Avantages des FPGAs pour la conception de systèmes optimisés Gérard FLORENCE Lotfi Guedria Agenda 1. Le CETIC en quelques mots 2. Générateur
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailTP3 Test immunologique et spécificité anticorps - déterminant antigénique
TP3 Test immunologique et spécificité anticorps - déterminant antigénique Partie 1 : Spécificité d'un anticorps pour un déterminant antigénique du VIH La séropositivité pour le VIH correspond à la présence
Plus en détailOrganigramme / Algorigramme Dossier élève 1 SI
Organigramme / Algorigramme Dossier élève 1 SI CI 10, I11 ; CI 11, I10 C24 Algorithmique 8 février 2009 (13:47) 1. Introduction Un organigramme (ou algorigramme, lorsqu il est plus particulièrement appliqué
Plus en détailBases de données et outils bioinformatiques utiles en génétique
Bases de données et outils bioinformatiques utiles en génétique Collège National des Enseignants et Praticiens de Génétique Médicale C. Beroud Date de création du document 2010-2011 Table des matières
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailCompte-rendu de fin de projet
Compte-rendu de fin de projet Projet ANR-07-GPLA-004 GNPAnnot / Community system for structural, functional and comparative annotation dedicated to green genomes Programme GPLA 2008 A IDENTIFICATION...2
Plus en détailBase de données bibliographiques Pubmed-Medline
Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction
Plus en détailApproche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
Plus en détailGénomique Comparative et intégrative
Génomique Comparative et intégrative Introduction : Le big data : on peut traiter des données massives à présent, l'objectif à présent est d'éviter les transferts de données trop longs. On a tout à portée
Plus en détailJournée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique
Monitorint spatio-temporel intégré de la mobilité urbaine Monitoring spatio-temporel de l ADN urbain Une réponse aux défis, problèmes, enjeux et risques des milieux urbains Nicolas Lachance-Bernard M.ATDR
Plus en détailEco-système calcul et données
Eco-système calcul et données M. Daydé Dr du Comité d'orientation pour le Calcul Intensif (COCIN) Délégué Scientifique INS2I en charge HPC / Grille / Cloud Calcul / données : un enjeu stratégique Calcul
Plus en détailSERVICE D ACCOMPAGNEMENT PEDAGOGIQUE DE L UNIVERSITE SORBONNE PARIS CITE
SERVICE D ACCOMPAGNEMENT PEDAGOGIQUE DE L UNIVERSITE SORBONNE PARIS CITE CATALOGUE DE FORMATION POUR LES ENSEIGNANTS DE USPC 2014-2015 Le service SAPIENS créé en janvier 2014 propose durant l année 2014-2015
Plus en détailLarge succès de l introduction en bourse de Genomic Vision sur Euronext à Paris qui lève 23,0 M
Communiqué de presse 1 er avril 2014 GÉNOMIQUE TESTS DE DIAGNOSTIC GÉNÉTIQUE R&D Large succès de l introduction en bourse de Genomic Vision sur Euronext à Paris qui lève 23,0 M Offre sursouscrite 4,7 fois,
Plus en détailRéférencement Vendredi 4 Juillet Ile Degaby
Donnez un second souffle à votre e-commerce Référencement Vendredi 4 Juillet Ile Degaby Nicolas Viron / Laurent Bizot Introduction Attente : Comment référencer son site? Thème : Fonctionnement du référencement
Plus en détail«Quick-Check Asset Management»
1 «Quick-Check Asset Management» Audit sur le positionnement des gestionnaires de réseau de distribution en matière de gestion d actifs Septembre 2012 D un régime actuel «Cost +» La plupart des GRD se
Plus en détail