Introduction à la bioinformatique

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Introduction à la bioinformatique"

Transcription

1 Introduction à la bioinformatique Céline Brochier-Armanet Université Claude Bernard, Lyon 1 Laboratoire de Biométrie et Biologie Evolutive (UMR 5558)

2 Lectures recommandées Bioinformatique Cours et cas pratiques (Deléage & Gouy 2013) - Dunod

3 Qu est-ce que la Bioinformatique? Application des techniques de l information à la gestion et l analyse des données biologiques Discipline de la biologie faisant appel à d autres disciplines scientifiques (statistiques, mathématiques, physique informatique) Analyse des données Bases de données Développement méthodologique Expérimentation biologique Modèles/Méthodes Logiciels Hypothèses Modélisation Simulations Traitements bioinformatiques

4 Les deux grands volets de la bioinformatique Représentation, stockage, distribution des données format de données, schéma des bases de données, outils d interrogation, interfaces Analyse des données collectées: Utilisation de l information biologique à différents niveaux développement de méthodes prédictives permettant de comprendre le fonctionnement d un organisme à partir de l information contenue dans son génome => Recherche de fonction de gènes par comparaison de séquences, décomposition de structures 3D pour comprendre comment les protéines se replient, modélisation des interactions entre molécules

5 Recherche d informations Moteurs de recherches pour le web: Google, AltaVista, Lycos, HotBot, Northern Light, Dogpile Moteurs de recherche pour les bases de données publiques : entrez, SRS Utilisation de requêtes structurées pertinentes (mode booléen) combinaison de plusieurs termes au moyen d opérateurs logiques AND (et), OR (ou), NOT (sauf) Le séparateur espace peut être considéré comme AND ou OR selon les moteurs de recherches Utilisation de ( ) pour des requêtes plus complexes ex. (mot_clé1 AND (mot_clé2 OR mot_clé3)) NOT mot_clé4 Utilisation de ex. «structure protéique»

6 Systèmes d interrogation des bases de données publiques Chaque banque de séquences possède son propre système d interrogation: SRS, ENTREZ, ACNUC, DBGET Chaque système utilise une syntaxe particulière pour les requêtes Étiquettes Connecteurs logiques Caractères de substitution Consultez Les Notices Explicatives

7 NCBI : National Center for Biotechnology Information

8 Organisation du NCBI

9 ENTREZ : Recherche d information au NCBI

10 Permet d interroger les banques du NCBI ( m.nih.gov/) ENTREZ : Recherche générale

11 ENTREZ : Exemple d application Recherchez tous les articles scientifiques traitant de potentiel électrostatique pour des molécules protéiques en ne ciblant que les références de deux auteurs: Barry Honig et Andrew McCammon

12 ENTREZ: Choix de la base de données Permet d interroger les banques du NCBI ( m.nih.gov/)

13 ENTREZ: Saisie des mots clés Recherche des articles scientifiques traitant de potentiel électrostatique pour des molécules protéiques en ne ciblant que les références de deux auteurs: Barry Honig et Andrew McCammon => 0 résultat

14 ENTREZ: Saisie des mots clés Recherche des articles scientifiques traitant de potentiel électrostatique pour des molécules protéiques en ne ciblant que les références de deux auteurs: Barry Honig et Andrew McCammon => 0 résultat

15 ENTREZ: Saisie des mots clés Recherche des articles scientifiques traitant de potentiel électrostatique pour des molécules protéiques en ne ciblant que les références de deux auteurs: Barry Honig et Andrew McCammon => 0 résultat

16 ENTREZ: Saisie des mots clés Recherche des articles scientifiques traitant de potentiel électrostatique pour des molécules protéiques en ne ciblant que les références de deux auteurs: Barry Honig et Andrew McCammon => 0 résultat

17 Interprétation de la recherche

18 Une bonne recherche

19 Limitation de la recherche

20 Historique des recherches

21 European Bioinformatics Institute

22 SRS : Recherche d information

23 SRS : Recherche rapide

24 SRS : Choix des databases

25 SRS : Choix des databases

26 SRS : Saisie de la requête

27 SRS : Saisie de la requête

28 Pôle BioInformatique Lyonnais

29 Pôle BioInformatique Lyonnais

30 Banques/bases de données majeures en biologie Hors série annuel de la revue NAR (Nucleic Acid Research recense l actualité des banques/bases de données (naissance, mise à jours, etc.)

31 Banques/bases de données majeures en biologie Sujet Bibliographie Séquences nucléiques Banques de génomes Séquences protéiques Structures protéiques Modifications post-traductionnelles Information biochimique et biophysique Voies métaboliques Microarray 2D-page Source PubMed Genbank (NCBI), EMBL (EBI), refseq Entrez Génome (NCBI), TIGR Swiss-prot, Genpep, Trembl, PIR, refseq Protein Data Base (PDB) RESID ENZYME, BIND KEGG, PathDB, WIT Gene Expression Links SWISS-2DPAGE

32 Séquences biologiques La séquence est l élément central autour duquel les banques de données sont organisées Elles ont été compilées très tôt dans des banques de données 1965 : Margaret Dayhoff publie l Atlas of Protein Sequences qui contient 50 entrées 1978 : Dernière impression de l Atlas of Protein Sequences Après 1978 : disponibles sous forme électronique

33 Banques de séquences généralistes spécialisées Banques de données généralistes : correspondent à une collecte des données la plus exhaustive possible et offrent un ensemble hétérogène d informations Banque ou base de données spécialistes : correspondent à des données plus homogènes établies autour d une thématique et qui offrent une valeur ajoutée à partir d une technique particulière ou d un intérêt suscité par un groupe d individus

34 Qualité des séquences des banques généralistes Très riches Grand nombre de séquences accessibles Grande diversité des organismes représentés Informations accompagnant les séquences (annotation, expertise, bibliographie, liens) Peu/pas de contrôles sur la qualité des entrées Les auteurs sont responsables des entrées! => Nombreux Problèmes/Erreurs Qualité des informations non homogènes Variabilité des connaissances sur les séquences Erreurs dans les séquences (contaminations, séquençage, méthodologie) Biais d échantillonnage taxonomique, des types de séquences, forte redondance

35 Banques généralistes de séquences nucléotidiques EMBL (European Molecular Biology Laboratory) : banque européenne créée en 1980 et financée par l European Molecular Biology Organisation, diffusée par l EBI Genbank : créée en 1982 par la société IntelliGenetics et diffusée par le National Center for Biotechnology Information (NCBI) DDBJ : créée en 1986 et diffusée par le NIG (National Institute of Genetics) Ces trois banques échangent systématiquement leur contenu depuis 1987 et ont adopté un système de conventions communes «The DDBJ/EMBL/Genbank Feature Table Definition»

36 European Nucleotide Archive / European Molecular Biology Lab

37 Banques généralistes de séquences protéiques PIR-NBRF : créée en 1984 par la NBRF (National Biomedical Research Foundation). Elle est maintenant un ensemble de données issues du MIPS et de la banque japonaise JIPID (Japan International Protein Information Database) Swiss-Prot : créée en 1986 à l université de Genève et maintenue depuis 1987 dans le cadre d une collaboration entre cette université (via ExPASY, Expert Protein Analysis System) et l EBI. Celle-ci regroupe aussi des séquences annotées de la banque PIR-NRBF ainsi que des séquences codantes, traduites de l EMBL TrEMBL/Genpep : Elles contiennent les protéines obtenues in silico (déduites à partir de la séquence nucléique, par simple traduction du ou des exons la codant), isolée à partir de la cellule, ou par génie génétique

38 UniProt : Universal Protein Resource

39 Recherche d une séquence dans Swiss-Prot Recherchez la séquence ayant comme identifiant P04118 dans la banque Swiss-Prot

40 Informations relatives à séquence P04118 Recherchez la séquence ayant comme identifiant P04118 dans la banque Swiss-Prot De quel organisme provient-elle? Quelle est sa taille? Quand a-t-elle été déposée dans la banque de séquences? Quelle est sa fonction? Où est-elle exprimée? Quelle est sa localisation cellulaire? Forme-t-elle un complexe protéique? Quelle est la localisation chromosomique du gène qui la code? Combien y a-t-il de transcrits connus? A-t-elle des homologues connus?

41 Swiss-Prot : Champ General information

42 Swiss-Prot : Commentaires

43 Swiss-Prot : Ontonlogies

44 Swiss-Prot : Annotations

45 Swiss-Prot : Séquence

46 Swiss-Prot : Références bibliographiques

47 Swiss-Prot : Références croisées

48 Swiss-Prot : Références croisées

49 Banques protéiques spécialisées Motifs Alignements Classification structurale Familles de protéines Interaction Enzymes Modifications protéiques post-traductionnelles Pathologies Gels bidimensionnels Bases protéiques sur l interaction et la thermodynamique des protéines

50 Informations relatives à séquence P04118 Recherchez la séquence ayant comme identifiant P04118 dans la banque Swiss-Prot De quel organisme provient-elle? Quelle est sa taille? Quand a-t-elle été déposée dans la banque de séquences? Quelle est sa fonction? Où est-elle exprimée? Quelle est sa localisation cellulaire? Forme-t-elle un complexe protéique? Quelle est la localisation chromosomique du gène qui la code? Combien y a-t-il de transcrits connus? A-t-elle des homologues connus?

51 Informations relatives à séquence P04118 Recherchez la séquence ayant comme identifiant P04118 dans la banque Swiss-Prot De quel organisme provient-elle? Quelle est sa taille? Quand a-t-elle été déposée dans la banque de séquences? Quelle est sa fonction? Où est-elle exprimée? Quelle est sa localisation cellulaire? Forme-t-elle un complexe protéique? Quelle est la localisation chromosomique du gène qui la code? Combien y a-t-il de transcrits connus? Recherche dans une banque de génomes complets

52 Ensembl : Base de données de génomes complets de vertébrés (et autres eucaryotes)

53 Localisation de la protéine P04118

54 Nombre de transcrits et de variants

55 Informations relatives à séquence P04118 Recherchez la séquence ayant comme identifiant P04118 dans la banque Swiss-Prot De quel organisme provient-elle? Quelle est sa taille? Quand a-t-elle été déposée dans la banque de séquences? Quelle est sa fonction? Où est-elle exprimée? Quelle est sa localisation cellulaire? Forme-t-elle un complexe protéique? Quelle est la localisation chromosomique du gène qui la code? Combien y a-t-il de transcrits connus? A-t-elle des homologues connus? Quelle est sa distribution taxonomique?

56 Homologie ou similarité? Deux séquences sont dites homologues si elles possèdent un ancêtre commun L existence d un ancêtre commun est inférée (dans la majorité des cas) à partir de la similarité partagée par les séquences

57 ATTENTION: Homologie Similarité L homologie n est pas quantifiable On est pas à 50% ou à 75% homologue On est homologue ou on ne l est pas Raisonnement binaire La similarité est quantifiable On peut dire de deux séquences qu elles sont similaires à 50% ou 75%

58 Guy Perrière Séquences biologiques : Homologie ou similarité? Deux séquences sont dites homologues si elles possèdent un ancêtre commun L existence d un ancêtre commun est inférée à partir de la similarité Seuil pour les protéines :30 % d identité sur une longueur de 100 AA homologie entre les séquences

59 Guy Perrière Similarité sans homologie (1) La similarité n est pas toujours due à de l homologie Convergence ou simple hasard pour de courtes séquences (quelques résidus) Identities = 14/33 (42%), Positives = 22/33 (66%), Gaps = 3/33 (9%) Proteine ribosomale L37AE Query 30 EISQHAKYTCSFCGKTKMKRRAVGI--WHCGSC 60 [Bos taurus] EI+ H +YTC CGK+ +++R + + CGSC SprT family protein [Listeria monocytogenes] Sbjct 107 EITMH-EYTCKSCGKSFLRQRRFNVNRYRCGSC 138

60 Similarité sans homologie (2) Existence de régions de faible complexité (régions riches en quelques aa., cas de la fibroïne [GSGAGA] n ) : Présentes dans 40 % des protéines. Peuvent représenter jusqu à 15 % du total des résidus (Ala, Gly, Pro, Ser, Glu et Gln). >gi gb AAF AF226688_1 fibroin heavy chain Fib-H [Bombyx mori] MRVKTFVILCCALQYVAYTNANINDFDEDYFGSDVTVQSSNTTDEIIRDASGAVIEEQITTKKMQRKNKNHGILGKNEKMIKTFVITTDSDGNESIV EEDVLMKTLSDGTVAQSYVAADAGAYSQSGPYVSNSGYSTHQGYTSDFSTSAAVGAGAGAGAAAGSGAGAGAGYGAASGAGAGAGAGAGAGYGTGAG AGAGAGYGAGAGAGAGAGYGAGAGAGAGAGYGAGAGAGAGAGYGAGAGAGAGAGYGAGAGAGAGAGYGAASGAGAGAGYGQGVGSGAASGAGAGAGA GSAAGSGAGAGAGTGAGAGYGAGAGAGAGAGYGAASGTGAGYGAGAGAGYGGASGAGAGAGAGAGAGAGAGYGTGAGYGAGAGAGAGAGAGAGYGAG AGAGYGAGYGVGAGAGYGAGYGAGAGSGAASGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGTGAGSGAGAGYGA GAGAGYGAGAGSGAASGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGYGAGAGAGYGAGAGAGYGAGAGVGYGAGAGSGAASGAGAGSGAGAG SGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGVGYGAGVGAGYGAGYGAGAGAGYGAGAGSGAASGAGAGAGAGAGTGSSGFG PYVANGGYSRSDGYEYAWSSDFGTGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGYGAGVGVGYGAGYGAGAGAGYGAGAGSGAASGAGAG SGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGVGSGAGAGSGAGAGVGYGAGAGVGYGAGAGSGAASGAGA 25 LIGNES AGAGSGAGAGSGAGAGSGAGAGSGAGVGYGAGYGAGAGAGYGAGAGSGAASGAGAGAGAGAGTGSSGFGPYVAHGGYSGYEYAWSSESDFGTGSGAG AGSGAGAGSGAGAGSGAGAGSGAGYGAGVGAGYGAGYGAGAGAGYGAGAGSGAGSGAGAGSGAGAGSGAAGAGSGAASGAGAGAGAGAGTGSSGFGP AGYGAGAGVGYGAGAGSGAASGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGSGAGAGSGAGAGYGAGYGAGVGAGYGAGAGY GAGYGVGAGAGYGAGAGSGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGAGSGAGSGAGAGYGAGAGAGYGAGAGAGYGAGAGSGAASGAGAGAGAG SGAGAGSGAGAGSGAGSGAGAGSGAGAGYGAGAGSGAASGAGAGSGAGAGAGAGAGAGSGAGAGSGAGAGYGAGAGSGAASGAGAGAGAGTGSSGFG PYVANGGYSRREGYEYAWSSKSDFETGSGAASGAGAGAGSGAGAGSGAGAGSGAGAGSGAGAGGSVSYGAGRGYGQGAGSAASSVSSASSRSYDYSR RNVRKNCGIPRRQLVVKFRALPCVNC Guy Perrière

61 Guy Perrière Homologie sans similarité (1) Deux séquences peuvent être homologues sans que leur similarité soit forte : ACP_KLEAE ---MEMKIDALAGTLESSDVMVRIGPAAQPGIQLEIDSIVKQEFGAAIQQVVRETLAQLG ACP_ECOLI STIEERVKKIIGEQLGVKQEEVTDN--ASFVEDLGADSLDTVELVMALEEEFDTEIPDEE * : : * : * * :* **: * *::: : ::: ACP_KLEAE VKECDNVQLARVQAAALRWQQ ACP_ECOLI AEKITTVQAAIDYINGHQA-- :: ** * : : La similarité entre ces protéines est faible mais les données fonctionnelles et biochimiques montrent qu elles sont homologues.

62 Homologie sans similarité (2) Globine alpha humaine vs myoglobine humaine Identities = 39/148 (26%), Positives = 59/148 (39%), Gaps = 6/148 (4%) Query 1 MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF------DLSHGSA 54 M LS + V WGKV A +G E L R+F P T F F D S Sbjct 1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASE 60 Query 55 QVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHL 114 +K HG V AL + + L+ HA K S C++ L + Sbjct 61 DLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLQFISECIIQVLQSKH 120 Query 115 PAEFTPAVHASLDKFLASVSTVLTSKYR 142 P +F +++ K L + S Y+ Sbjct 121 PGDFGADAQGAMNKALELFRKDMASNYK 148

63 Homologie: Orthologie Définition «gènes présents dans des organismes différents, ayant évolué à partir d un même gène ancestral suite à des événements de spéciation» => La fonction est souvent conservée au cours de l évolution des orthologues

64 Homologie : Paralogie Définition «gènes issus d événements de duplication au sein d un génome» => La fonction d un ou des paralogues peut changer au cours de l évolution (spécialisation, nouvelle fonction)

65 Définition «gènes ayant été acquis par transfert horizontal» Homologie : Xénologie

66 temps Evolution d un gène au cours de l évolution Ancêtre Evolution spéciation Oiseaux Mammifères Evolution Poulet Gauteret

67 temps Apparition de nouveaux gènes par duplication Duplication Ancêtre Evolution Spéciation Oiseaux Mammifères Evolution Poulet Gauteret

68 Application?????? Poulet Gauteret

69 Guy Perrière BLAST : principe général Mot Séquence banque Séquence requête Longueur du mot = w Score T Séquence banque Séquence requête Extension du segment similaire HSP : High Scoring Pair Score T Score max. Extension du segment x Extension stoppée quand : - la fin d une des deux séquences est atteinte - score 0 - score score_max - x

70 Guy Perrière Exemple S L A A L L N K C K T P Q G Q R L V N Q W T x Liste de mots voisins P Q G 18 P E G 15 P R G 14 P K G 14 P N G 13 P D G 13 P H G 13 P M G 13 P S G 13 P Q A 12 P Q N (P, P) = 7 (Q, R) = 1 (G, G) = 6 Score seuil T = 13 Query : 325 S L A A L L N K C K T P Q G Q R L V N Q W L A + + L + T P G R W Sbjct : 290 T L A S V L D C T V T P M G S R M L K R W 310

71 Guy Perrière Versions de BLAST blastp : protéine vs. protéine. Séquence Banque blastn : utile pour le non-codant. Protéique blastp Protéique blastx : séquences codantes non identifiées. tblastn : homologues dans un génome non complètement annoté. Nucléique T T blastn tblastx T Nucléique

72 Guy Perrière Évaluation statistique Similarités détectées : Relations significatives. Similarités dues au hasard. Fonction de score : Mesure sous la forme : D une espérance mathématique (E-value). Valeur en bits. Basée sur une distribution calculée à partir séquences non homologues. Les scores dépendent de la taille de la banque.

73 Guy Perrière E-value, bits et similarité Soit E, l espérance mathématique d avoir une similarité au score S observé : E = Kmn e S Avec m et n les longueurs des deux séquences considérées, et K et deux paramètres dérivés de la distribution précédente. Le score en bits S' est donné par : S' = [ S log(k)] / log(2) La relation entre E et S' est donc donnée par : E = mn 2 S'

74 Informations relatives à séquence P04118 Recherchez la séquence ayant comme identifiant P04118 dans la banque Swiss-Prot De quel organisme provient-elle? Quelle est sa taille? Quand a-t-elle été déposée dans la banque de séquences? Quelle est sa fonction? Où est-elle exprimée? Quelle est sa localisation cellulaire? Forme-t-elle un complexe protéique? Quelle est la localisation chromosomique du gène qui la code? Combien y a-t-il de transcrits connus? A-t-elle des homologues connus? Recherche par BLAST dans une banque de séquences protéiques (RefSEQ)

75 Recherche par Blast au NCBI

76 Choix des paramètres

77 Choix des paramètres

78 Choix des paramètres avancés

79 Résultats du BLAST : Entête

80 Résultats du BLAST : Reformater les résultats

81 Résultats du BLAST : Domaines conservés

82 Résultats du BLAST : Vue graphique

83 Résultats du BLAST : Descriptions

84 Résultats du BLAST : Alignements locaux

85 Résultats du BLAST : Alignements locaux

86 Taxonomy report

87 Alignement et Phylogénie

88 Interpro: protein sequence analysis & classification

89 Interpro: objectifs

90 Interpro: version 46.0 Familles Domaines Repeats Sites

91 Interpro: consortium

92 Prot BD Interpro: construction Prot BD Prot BD

93 Interpro: contenu

94 Interpro: entrées

95 Interpro: informations annexes

96 Interpro: organisation hiérarchique des familles

97 Interpro: interrogation Protéine déjà incluse dans interpro => réponse rapide Protéine non incluse dans interpro => recherche de signatures avec interproscan

98 Interpro: exemple interrogation

99 Interpro: exemple interrogation

100 Interpro: exemple interrogation

101 Interpro: exemple interrogation

102 Interpro: exemple interrogation

103 Interpro: exemple interrogation

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool)

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) A A C T G G T A A C C G A G C T A C G G T C C G Algorithme de Blast (version 1) (Altschul et

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

ALIGNEMENT PLUS RAPIDE

ALIGNEMENT PLUS RAPIDE ALIGNEMENT PLUS RAPIDE 1. méthodes heuristiques : hachage, arbres de suffixe, PD limitée (taille totale de trous bornée) 2. PD éparse (pour sous-séquence commune ou chaînage en alignement global heuristique)

Plus en détail

Bioinformatique. Ressources et banques de données internationales

Bioinformatique. Ressources et banques de données internationales Bioinformatique Ressources et banques de données internationales Frédéric Lecerf frederic.lecerf@agrocampus-ouest.fr UMR PEGASE Equipe Génétique & Génomique Bioinformatique Plan du module 1. Présentation

Plus en détail

Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2

Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2 DEVELOPPEMENT D UNE INTERFACE GRAPHIQUE : LOCAL WEB GUI FOR BLAST (LWBG), POUR LES TRAITEMENTS DE DONNEES BIOLOGIQUES Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2 Plan

Plus en détail

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX Sommaire Définitions et abréviations Résumé Introduction I. Matériel II. Méthode A) Méthode de contrôle manuel des résultats produits par GLADX B) Comparaison des résultats de l outil GLADX avec les résultats

Plus en détail

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée V.2004.4 http://www.esil.univ-mrs.fr/~dgaut/cours Bioinformatique Deux définitions possibles Applications de l informatique

Plus en détail

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité?

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité? TD Bioinformatique : Sequence lignment Pourquoi faire une recherche par similarité? - Savoir si ma séquence ressemble à d'autres déjà connues. - Trouver toutes les séquences d'une même famille. - Rechercher

Plus en détail

Différences entre Homme et singes?

Différences entre Homme et singes? Différences entre Homme et singes? Différences entre Homme et singes? Apparition de l œil? Apparition du vol? Apparition des hémoglobines? Molécule d hémoglobine HEME Chaîne polypeptidique de type 2 Chaîne

Plus en détail

Base de données bibliographiques Pubmed-Medline

Base de données bibliographiques Pubmed-Medline Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction

Plus en détail

Recherche de parenté entre les vertébrés

Recherche de parenté entre les vertébrés 1 CHAPITRE A Recherche de parenté entre les vertébrés 2 Chapitre A : Recherche de parentés entre les êtres vivants Tous les êtres vivants présentent des structures cellulaires et un fonctionnement commun

Plus en détail

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire Vous aurez besoin des programmes suivant : d un éditeur de séquence d un visualiseur de structure 3D (PyMOL) Avant-propos

Plus en détail

Quelques termes-clef de biologie moléculaire et leur définition

Quelques termes-clef de biologie moléculaire et leur définition Acide aminé (AA) Quelques termes-clef de biologie moléculaire et leur définition Isabelle Quinkal INRIA Rhône-Alpes Septembre 2003 Petite molécule dont l enchaînement compose les protéines - on dit qu

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

! Séquence et structure des macromolécules.  Séquences protéiques (UniProt)  Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ) Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de

Plus en détail

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Introduc)on à Ensembl/ Biomart : Par)e pra)que Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que Exercice 1 1.a. Quelle est la version de l assemblage

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Extraction d information des bases de séquences biologiques avec R

Extraction d information des bases de séquences biologiques avec R Extraction d information des bases de séquences biologiques avec R 21 novembre 2006 Résumé Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d intérêt (nucléotidiques et protéiques)

Plus en détail

Automatisation de la plateforme MicroScope avec l API JBPM. Engelen. CEA/DSV/IG/Genoscope Métabolique Laboratoire (Atelier) de Génomique.

Automatisation de la plateforme MicroScope avec l API JBPM. Engelen. CEA/DSV/IG/Genoscope Métabolique Laboratoire (Atelier) de Génomique. Atelier «BioWorkFlow» - 25/09/08 Automatisation de la plateforme MicroScope avec l API JBPM David Vallenet & Stéfan Engelen CEA/DSV/IG/Genoscope CNRS-UMR Génomique Métabolique Laboratoire (Atelier) de

Plus en détail

Biologie «in silico» Adapté de Pierre Vincens

Biologie «in silico» Adapté de Pierre Vincens Biologie «in silico» Adapté de Pierre Vincens Bioinformatique Association de la biologie et de l'informatique Objectifs : Analyser, modéliser ou prédire les informations issues de données biologiques expérimentales

Plus en détail

Bibliographie Introduction à la bioinformatique

Bibliographie Introduction à la bioinformatique Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A

Plus en détail

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z

Plus en détail

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 Sélectionner les propositions exactes Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 QCM 1 La plupart des techniques de biologie moléculaire repose sur le principe de complémentarité

Plus en détail

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien.

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. Thomas DERRIEN CNRS-UMR6061 Génétique et Développement Université

Plus en détail

Tutoriel pour les enseignants de lycée. Rappel du contenu des programmes au lycée en classe de seconde

Tutoriel pour les enseignants de lycée. Rappel du contenu des programmes au lycée en classe de seconde Tutoriel pour les enseignants de lycée Ce document sert à l enseignant pour préparer différentes séquences pédagogiques afin d aborder : les questions de la génétique, des maladies génétiques, et les métiers

Plus en détail

La base de données MEDLINE

La base de données MEDLINE La base de données MEDLINE La base de données MEDLINE est produite par la National Library of Medicine (NLM) aux Etats-Unis. Elle couvre tous les domaines biomédicaux : médecine, biologie, toxicologie,

Plus en détail

Cours de Bioinformatique Appliquée (Partie 1)

Cours de Bioinformatique Appliquée (Partie 1) Enseignement de Bioinformatique Appliquée CM 10h TD 16h (4 séances de 4h) Travail Personnel 8h Horaires de CM -08 Sept 14-16h -09 Sept 10-12h -15 Sept 14-16h -22 Sept 14-16h -29 Sept 14-16h Travail Personnel

Plus en détail

MÉMOIRE. Bases de données et outils d analyse pour la génomique bactérienne

MÉMOIRE. Bases de données et outils d analyse pour la génomique bactérienne MÉMOIRE présenté devant l Université Claude Bernard LYON 1 pour l obtention de L HABILITATION À DIRIGER DES RECHERCHES par Guy PERRIÈRE soutenance prévue le 27 juin 2000 Bases de données et outils d analyse

Plus en détail

CERTIFICAT DE COMPÉTENCES EN BIO-INFORMATIQUE

CERTIFICAT DE COMPÉTENCES EN BIO-INFORMATIQUE CERTIFICAT DE COMPÉTENCES EN BIO-INFORMATIQUE Organisé par l équipe pédagogique : Statistique bioinformatique du département IMATH Responsable de la formation : Pr. Jean-François Zagury Coordinateur des

Plus en détail

Cartographie génomique comparée chez les mammifères G. Bronner, B. Spataro, C. Gautier

Cartographie génomique comparée chez les mammifères G. Bronner, B. Spataro, C. Gautier Cartographie génomique comparée chez les mammifères G. Bronner, B. Spataro, C. Gautier Introduction La cartographie comparée est une analyse comparative, elle repose donc sur l'exploitation de la biodiversité

Plus en détail

Cours d introduction à la génétique de la souris Notion de Souche

Cours d introduction à la génétique de la souris Notion de Souche Cours d introduction à la génétique de la souris Notion de Souche Introduction: - Réponse d un animal à l expérimentation (diapo 1) Facteurs environnementaux et propres à l animal - Notion d animal standardisé

Plus en détail

Comment la Souris fait de la souris avec des graines?

Comment la Souris fait de la souris avec des graines? Comment la Souris fait de la souris avec des graines? d après «10 clés pour la Biologie» de J. Tavlitzki «[ ] La Souris, l Ecureuil, le Lapin mangent des graines. La Souris fait de la souris, l Ecureuil

Plus en détail

présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :

présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE : N Ordre de la Thèse 3282 THÈSE présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 Mention : BIOLOGIE PAR Emilie GUÉRIN Équipe d accueil : École Doctorale

Plus en détail

Présentation et accès aux bases de données OMIM, GDB, EMBL/GenBank, SWISS PROT, PDB et au système d'information IMGT

Présentation et accès aux bases de données OMIM, GDB, EMBL/GenBank, SWISS PROT, PDB et au système d'information IMGT Présentation et accès aux bases de données OMIM, GDB, EMBL/GenBank, SWISS PROT, PDB et au système d'information IMGT Véronique Giudicelli LIGM, IGH, UPR CNRS 1142 141 rue de la Cardonille 34296 Montpellier

Plus en détail

Homéoallèles. Analyse différentielle. Normalisation. NGS Transcriptomique Python R. Blé RNA-seq

Homéoallèles. Analyse différentielle. Normalisation. NGS Transcriptomique Python R. Blé RNA-seq Présenté par Xi LIU ATCGCGCTAGCTGGTGTATCGCATCGCGCTAGCTGGTGTATCGCGCTAGCTGGTGTATCGCGCTAGCCTGGTGTATCGCCATCGCGCTAGCTGGCGCTAGCTGAATCGCGCATATG 17 Septembre 2013 Homéoallèles Génome Normalisation Analyse différentielle

Plus en détail

Logiciel MPSA et ressources bioinformatiques clientserveur Web dédiés à l analyse de séquences de protéine.

Logiciel MPSA et ressources bioinformatiques clientserveur Web dédiés à l analyse de séquences de protéine. N d ordre 139-99 Année 1999 THÈSE présentée devant l UNIVERSITÉ CLAUDE BERNARD LYON 1 pour l obtention du DIPLÔME DE DOCTORAT (arrêté du 30 mars 1992) présentée et soutenue publiquement le 31 mai 1999

Plus en détail

Recherche et veille documentaire scientifique

Recherche et veille documentaire scientifique Recherche et veille documentaire scientifique Élodie Chattot BU Médecine Pharmacie juin 2006 Introduction Le but de cet atelier est de vous initier à la méthodologie de recherche documentaire scientifique,

Plus en détail

Conception assistée par ordinateur de molécules thérapeutiques

Conception assistée par ordinateur de molécules thérapeutiques Conception assistée par ordinateur de molécules thérapeutiques D. Gilis Bioinformatique génomique et structurale Faculté des sciences appliquées Université Libre de Bruxelles Objectif: illustrer en quoi

Plus en détail

Bioinformatique BTV Alignement de Séquences

Bioinformatique BTV Alignement de Séquences 1 / 60 Bioinformatique BTV Alignement de Séquences Jean-Michel Richer jean-michel.richer@univ-angers.fr http://www.info.univ-angers.fr/pub/richer Juillet 2008 2 / 60 Plan Plan 1 Rappels 2 Alignement multiple

Plus en détail

Eléments primordiaux de biologie moléculaire

Eléments primordiaux de biologie moléculaire Eléments primordiaux de biologie moléculaire Pourquoi s intéresser au matériel génétique? Base de l information génétique Tissu Cellule Noyau Organisme entier Lieu où est localisé l ADN Mol d ADN qui est

Plus en détail

Dans la peau d'un Biologiste Computationnel?

Dans la peau d'un Biologiste Computationnel? Dans la peau d'un Biologiste Computationnel? Plusieurs casquettes : (Nature Biotechnology, Vol. 31, Number 11, Nov. 2013) «- data analyst - data curator - database developer - statistician - mathematical

Plus en détail

Corrigé du TD1. Exercice 1:

Corrigé du TD1. Exercice 1: Corrigé du TD1 Exercice 1: le but était d'aligner des séquences à la main et de compter les substitutions entre acides aminés observées. Le résultat se trouve à cette adresse: http://tagc.univ-mrs.fr/herrmann/bio6/displaymatrix.php

Plus en détail

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine.

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Anne Poupon Biologie et Bioinformatique des Systèmes de Signalisation INRA - Nouzilly France

Plus en détail

École Doctorale «Sciences de la Vie et de la Santé»

École Doctorale «Sciences de la Vie et de la Santé» École Doctorale «Sciences de la Vie et de la Santé» Établissement principal : Université de la Méditerranée (AM II) Établissements cohabilités : Université de Provence (AM I) Université d Aix-Marseille

Plus en détail

Obtention de données génétiques à grande échelle

Obtention de données génétiques à grande échelle Obtention de données génétiques à grande échelle Stéphanie FERREIRA Ph.D. Campus de l Institut Pasteur de Lille 1, rue du Professeur Calmette 59000 LILLE Tel : 03 20 87 71 53 Fax : 03 20 87 72 64 contact@genoscreen.fr

Plus en détail

Présentation ADN Fishbase. Jolien Bamps

Présentation ADN Fishbase. Jolien Bamps Présentation ADN Fishbase Jolien Bamps Les lois de Mendel et la transmission de l hérédité Gregor Mendel Moine et botaniste hongrois (1822-1884), en charge de maintenir le potager de son monastère Considéré

Plus en détail

Statistiques Multivariées pour la Bioinformatique. Susan Holmes, Stanford, susan@stat.stanford.edu

Statistiques Multivariées pour la Bioinformatique. Susan Holmes, Stanford, susan@stat.stanford.edu BMM 1 Presentation Statistiques Multivariées pour la Bioinformatique Susan Holmes, Stanford, susan@stat.stanford.edu Specificités de cette classe Les données genetiques sont discretes: comptage. En general

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

ARN et bioinformatique: PDF processed with CutePDF evaluation edition www.cutepdf.com

ARN et bioinformatique: PDF processed with CutePDF evaluation edition www.cutepdf.com ARN et bioinformatique: Partie 1 PDF processed with CutePDF evaluation edition www.cutepdf.com Sommaire Principes biologiques : Transcription/traduction, types d ARN, formes primaires/secondaires. Zuker

Plus en détail

Sujets de mini-projets

Sujets de mini-projets Sujets de mini-projets Sujet I: Décodage neuronal Assistant responsable: Samuel.Gmehlin@epfl.ch et Lukas.Rytz@epfl.ch Motivation Certains neurones du cerveau sont corrélés avec des stimuli complexes, par

Plus en détail

PROTOCOLE DE DESSIN DES OLIGONUCLEOTIDES LONGS POUR PUCES A ADN. Sommaire

PROTOCOLE DE DESSIN DES OLIGONUCLEOTIDES LONGS POUR PUCES A ADN. Sommaire Sommaire 1. PRINCIPE DE FONCTIONNEMENT:... 2 2. PRE-REQUIS AVANT LE DESSIN DES OLIGONUCLEOTIDES:... 3 2.1 Installation du logiciel OligoArray sur PC:... 3 2.2 Installation du logiciel OligoArray sur Mac:...

Plus en détail

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Séquençage ADN Détermination de l ordre d enchainement des nucléotides d un fragment

Plus en détail

Cahier de texte de la classe 1 ère 4 - SVT

Cahier de texte de la classe 1 ère 4 - SVT Cahier de texte de la classe 1 ère 4 - SVT DATE SEQUENCE lundi 12 : revoir la fiche méthodologique «utiliser le microscope optique» (disponible sur le site du lycée) Lundi 12 1 er contact avec les élèves.

Plus en détail

Introduction à l analyse statistique et bioinformatique des puces à ADN

Introduction à l analyse statistique et bioinformatique des puces à ADN Formation INSERM 10 février 2004 Introduction à l analyse statistique et bioinformatique des puces à ADN Gaëlle Lelandais lelandais@biologie.ens.fr 1 Première Partie Analyse d une puce à ADN : Le recherche

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

CHAPITRE 4 - LA COMPLEXITÉ DES RELATIONS ENRE GÈNES, PHÉNOTYPES ET ENVIRONNEMENT

CHAPITRE 4 - LA COMPLEXITÉ DES RELATIONS ENRE GÈNES, PHÉNOTYPES ET ENVIRONNEMENT CHAPITRE 4 - LA COMPLEXITÉ DES RELATIONS ENRE GÈNES, PHÉNOTYPES ET ENVIRONNEMENT Introduction Tous les individus de la même espèce possèdent le même patrimoine génétique, cependant chaque individu est

Plus en détail

Bioinformatique BTV Stockage des données

Bioinformatique BTV Stockage des données 1 / 64 Bioinformatique BTV Stockage des données Jean-Michel Richer jean-michel.richer@univ-angers.fr http://www.info.univ-angers.fr/pub/richer Juillet 2008 2 / 64 Plan Plan 1 Introduction 2 Format de stockage

Plus en détail

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan M Bioinformatique, Connaissances et Données Année 24-25 GMIN206 Info. Biologique et Outils bioinformatiques Banques de données biologiques (3h de Cours +,5h de TD + 4h de TP) Elodie Cassan Anne-Muriel

Plus en détail

Chapitre 10 L isolement et la manipulation de gènes. Injection d ADN étranger dans une cellule animale

Chapitre 10 L isolement et la manipulation de gènes. Injection d ADN étranger dans une cellule animale Chapitre 10 L isolement et la manipulation de gènes Injection d ADN étranger dans une cellule animale Comment amplifier un gène d intérêt? Amplification in vivo à l aide du clonage d ADN L ensemble formé

Plus en détail

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Statisticiens: Sophie Lamarre Steve Van Ginkel Sébastien Déjean - Magali San Cristobal Matthieu Vignes Biologistes: Stéphane

Plus en détail

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation

Lettres: A, T, G, C. Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation 2- Les molécules d ADN constituent le génome 2-1 La séquence d ADN représente l information génétique Lettres: A, T, G, C Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine).

Plus en détail

Perl Orienté Objet BioPerl There is more than one way to do it

Perl Orienté Objet BioPerl There is more than one way to do it Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels

Plus en détail

La base de données PROTICdb 2 pour la protéomique: nouveautés et perspectives. III ème Rencontre des plate-formes protéomiques de la région PACA

La base de données PROTICdb 2 pour la protéomique: nouveautés et perspectives. III ème Rencontre des plate-formes protéomiques de la région PACA La base de données PROTICdb 2 pour la protéomique: nouveautés et perspectives III ème Rencontre des plate-formes protéomiques de la région PACA La base de données PROTICdb 2 pour la protéomique Gestion

Plus en détail

AMADEUS PLATE FORME DE SERVICES EN A N N O T A T I O N E X P E R T E D E S GENES ET GENOMES

AMADEUS PLATE FORME DE SERVICES EN A N N O T A T I O N E X P E R T E D E S GENES ET GENOMES EN A N N O T A T I O N E X P E R T E D E S GENES ET GENOMES L annotation des gènes et génomes : une révolution en mouvement... L annotation est une étape essentielle dans la découverte des connaissances

Plus en détail

Naissance d une banque de données

Naissance d une banque de données Numéro 18, Août 2006 www.prolune.org Naissance d une banque de données Interview du prof. Amos Bairoch Hadrien Dussoix, "First" (1) - www.hadriendussoix.com La banque de données de protéines Swiss-Prot

Plus en détail

Introduction à la biologie moléculaire et à la bio-informatique

Introduction à la biologie moléculaire et à la bio-informatique Introduction à la biologie moléculaire et à la bio-informatique Cours de Master Recherche M2, 2004/2005 Jean-Philippe Vert Jean-Philippe.Vert@mines.org Master Recherche M2 c 2003-2005 Jean-Philippe Vert,

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

Sommaire. Première partie Les concepts de base

Sommaire. Première partie Les concepts de base Sommaire Préface à la troisième édition... Préface à la deuxième édition... Avant-propos à la troisième édition... Avant-propos à la deuxième édition... Avant-propos à la première édition... XV XVII XIX

Plus en détail

VI. Domaines protéiques

VI. Domaines protéiques Chapitre 1 Structure des protéines I. Rappels Définitions II. La Protein Data Bank (PDB) III. Angles dièdres et diagramme de ramachandran IV. Structures secondaires V. Structures supersecondaires VI. Domaines

Plus en détail

Dans chaque cellule: -génome nucléaire -génome mitochondrial (-génome chloroplastique)

Dans chaque cellule: -génome nucléaire -génome mitochondrial (-génome chloroplastique) 6- Structure et organisation des génomes 6-1 Génomes eucaryotes Dans chaque cellule: -génome nucléaire -génome mitochondrial (-génome chloroplastique) 6-1-1 Génomes nucléaires 6-1-1-1 Nombre d exemplaires

Plus en détail

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE COMME EXIGENCE PARTIELLE À L OBTENTION DE LA MAÎTRISE EN GÉNIE PAR Sébastien SERVOLES

Plus en détail

Chapitre 1 La révolution des sciences de la vie par la génétique

Chapitre 1 La révolution des sciences de la vie par la génétique Chapitre 1 La révolution des sciences de la vie par la génétique Variation génétique de la couleur des grains de maïs. Chaque grain représente un individu de constitution génétique distincte. La sélection

Plus en détail

I. Obtenir les exons d'un chromosome humain possédant la plus forte densité en SNP. 1. Récupérer les exons codant du chromosome 22 humain

I. Obtenir les exons d'un chromosome humain possédant la plus forte densité en SNP. 1. Récupérer les exons codant du chromosome 22 humain Exemples d'analyse sous Galaxy : Adaptation des exercices "Using Galaxy" proposés par la team Galaxy Exercices proposés par la plateforme rennaise GenOuest Jennifer Hillman-Jackson, 1 Dave Clements, 2

Plus en détail

La Génomique Biologie, informatique, évolution. Hugues Roest Crollius hrc@ens.fr Dyogen Group L3 Introduction aux sciences du vivant 03.12.

La Génomique Biologie, informatique, évolution. Hugues Roest Crollius hrc@ens.fr Dyogen Group L3 Introduction aux sciences du vivant 03.12. La Génomique Biologie, informatique, évolution Hugues Roest Crollius hrc@ens.fr Dyogen Group L3 Introduction aux sciences du vivant 03.12.2013 La «génomique fonctionnelle» La «génomique évolutive» human

Plus en détail

MUSEUM NAT. D'HISTOIRE NATURELLE PARIS Référence GALAXIE : 4113

MUSEUM NAT. D'HISTOIRE NATURELLE PARIS Référence GALAXIE : 4113 MUSEUM NAT. D'HISTOIRE NATURELLE PARIS Référence GALAXIE : 4113 Numéro dans le SI local : Référence GESUP : 4113 Corps : Maître de conférences du Muséum national d'histoire naturelle Article : 32ou40 Chaire

Plus en détail

Aujourd hui, il y a plus de consortium, ce qui permet des avancées plus rapides.

Aujourd hui, il y a plus de consortium, ce qui permet des avancées plus rapides. GFMOM 20/01/2012 Cours 2 partie 2 T. Bourgeron II. LA CYTOGENETIQUE Nous allons étudier les anomalies chromosomiques des plus grossières aux plus fines. Ces anomalies peuvent être retrouvées dans la population

Plus en détail

Outils de gestion des ressources biologiques

Outils de gestion des ressources biologiques Le Cahier des Techniques de l INRA 2015 (84) N 1 Outils de gestion des ressources biologiques Frédéric Sanchez 1 *, Tou Cheu Xiong 1 Résumé. Les recherches en biologie génèrent un grand nombre d échantillons

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

PUBMED tutoriel PUBMED 1. Présentation P.3. 1- Les étapes de fabrication P.4. 2- Le MeSH : un thésaurus hiérarchisé P.5

PUBMED tutoriel PUBMED 1. Présentation P.3. 1- Les étapes de fabrication P.4. 2- Le MeSH : un thésaurus hiérarchisé P.5 PUBMED tutoriel PUBMED 1 Présentation P.3 1- Les étapes de fabrication P.4 2- Le MeSH : un thésaurus hiérarchisé P.5 3- La notion de mots clés majeurs et de qualificatifs P.8 4- Les opérateurs booléens

Plus en détail

Le ranking de Augure Influencers La méthodologie AIR en détails

Le ranking de Augure Influencers La méthodologie AIR en détails Le ranking de Augure Influencers La méthodologie AIR en détails V1.0 Octobre 2014 Oualid Abderrazek Product Marketing Sommaire 1. Contexte...3 2. L algorithme...3 a. Exposition...4 b. Echo...4 c. Niveau

Plus en détail

Cahier de texte de la classe 1 ère 3 - SVT

Cahier de texte de la classe 1 ère 3 - SVT Cahier de texte de la classe 1 ère 3 - SVT DATE SEQUENCE jeudi 8 : revoir la fiche méthodologique «utiliser le microscope optique» (disponible sur le site du lycée) Jeudi 8 1 er contact avec les élèves.

Plus en détail

France Grilles 19 septembre 2013 http://www.france-grilles.fr

France Grilles 19 septembre 2013 http://www.france-grilles.fr France Grilles 19 septembre 2013 http://www.france-grilles.fr genevieve.romier@idgrilles.fr Relation communautés d utilisateurs Plan Présentation de France Grilles La stratégie vers les utilisateurs Conclusion

Plus en détail

PUBMED niveau 1. Alexandre Boutet (alexandre.boutet@biusante.parisdescartes.fr) Benjamin Macé (benjamin.mace@biusante.parisdescartes.

PUBMED niveau 1. Alexandre Boutet (alexandre.boutet@biusante.parisdescartes.fr) Benjamin Macé (benjamin.mace@biusante.parisdescartes. PUBMED niveau 1 Présentation... 2 1. Les étapes de fabrication... 3 2. Le MeSH : un thésaurus hiérarchisé... 3 3. La notion de mots clés majeurs et les qualificatifs... 7 4. Les opérateurs booléens : AND,

Plus en détail

Séquençage massif en parallèle Défis technologiques et informatiques

Séquençage massif en parallèle Défis technologiques et informatiques Séquençage massif en parallèle Défis technologiques et informatiques Jean-Baptiste Rivière, PhD jean-baptiste.riviere@u-bourgogne.fr 10/09/2014 Séquençage massif en parallèle Défis technologiques de Sanger

Plus en détail

Les microarrays: technologie pour interroger le génome

Les microarrays: technologie pour interroger le génome Les microarrays: technologie pour interroger le génome Patrick DESCOMBES patrick.descombes@frontiers-in-genetics.org Plate forme génomique NCCR Frontiers in Genetics Université de Genève http://genomics.frontiers-in-genetics.org

Plus en détail

Analyses bioinformatiques pour le PCIM

Analyses bioinformatiques pour le PCIM Analyses bioinformatiques pour le PCIM Journée de rencontre des utilisateurs du Pôle de calcul intensif pour la mer 17 janvier 2014 La bioinfo, késaco? Approche in silico de la biologie L'organisation,

Plus en détail

Introduction. La bioinformatique : Traitement des informations biologiques par des méthodes informatiques et/ou mathématiques.

Introduction. La bioinformatique : Traitement des informations biologiques par des méthodes informatiques et/ou mathématiques. Introduction La bioinformatique : Traitement des informations biologiques par des méthodes informatiques et/ou mathématiques. Interdisciplinaire par nature, la bioinformatique est fondée sur les acquis

Plus en détail

BIO-INFORMATIQUE PROJET ANCESTROME

BIO-INFORMATIQUE PROJET ANCESTROME PROJET ANCESTROME Approche de phylogénie intégrative pour la reconstruction de "-omes" ancestraux FINANCEMENT TOTAL 2 200 000 Université Claude Bernard Lyon 1 SCRIPTION Biologie évolutive, écologie, écotoxicologie,

Plus en détail

PRÉSENTATION DE LA BIOINFORMATIQUE

PRÉSENTATION DE LA BIOINFORMATIQUE PRÉSENTATION DE LA BIOINFORMATIQUE O. Collin CNRS IRISA GenOuest 7 octobre 2013 Warming session Poser le décor pour les 3 jours Mise en évidence et mise en relation des éléments clés Réflexions sur quelques

Plus en détail

Eco-système calcul et données

Eco-système calcul et données Eco-système calcul et données M. Daydé Dr du Comité d'orientation pour le Calcul Intensif (COCIN) Délégué Scientifique INS2I en charge HPC / Grille / Cloud Calcul / données : un enjeu stratégique Calcul

Plus en détail

Apprentissage d automates sur les protéines

Apprentissage d automates sur les protéines Apprentissage d automates sur les protéines Approche par fusion de fragments significativement similaires (Jobim 04) François Coste, Goulven Kerbellec, Boris Idmont, Daniel Fredouille Christian Delamarche

Plus en détail

Chapitre 2. La synthèse protéique : la relation entre le génotype et le phénotype.

Chapitre 2. La synthèse protéique : la relation entre le génotype et le phénotype. Chapitre 2. La synthèse protéique : la relation entre le génotype et le phénotype. Les maladies génétiques comme la drépanocytose ou l'albinisme sont liées à des modifications du génotype des individus

Plus en détail

Institut Français de Bioinformatique (IFB) : mettre en place une infrastructure informatique dédiée aux sciences de la vie

Institut Français de Bioinformatique (IFB) : mettre en place une infrastructure informatique dédiée aux sciences de la vie 1 / 1 Institut Français de Bioinformatique (IFB) : mettre en place une infrastructure informatique dédiée aux sciences de la vie J-F. Gibrat Unité Mathématique, Informatique et Génome, INRA, Jouy-en-Josas

Plus en détail

Capacités et attitudes Activités Compétences Tâche complexe Extraire et organiser des Informations

Capacités et attitudes Activités Compétences Tâche complexe Extraire et organiser des Informations Constat : la méiose produit des gamètes génétiquement différents qui parfois comportent des anomalies qui peuvent empêcher l embryon de se développer ou de se développer normalement et entraîner alors

Plus en détail

Simulation des mouvements de protéines membranaires Application aux Complexes II et III de la chaine respiratoire

Simulation des mouvements de protéines membranaires Application aux Complexes II et III de la chaine respiratoire Simulation des mouvements de protéines membranaires Application aux Complexes II et III de la chaine respiratoire M. Beurton-Aimar 1 N. Parisey 2 F. Vallée 1 1 UMR 5800 - LaBRI - Université de Bordeaux

Plus en détail

Formation Python. Sandra Dèrozier & Franck Samson 13 Juin 2014

Formation Python. Sandra Dèrozier & Franck Samson 13 Juin 2014 Formation Python Sandra Dèrozier & Franck Samson 13 Juin 2014 Programme Présentation rapide de Python Présentation d Eclipse Gestion de fichiers Fonctions Utilisation des exceptions Expressions régulières

Plus en détail

Les besoins de la communauté des sciences de la vie en termes d infrastructure informatique

Les besoins de la communauté des sciences de la vie en termes d infrastructure informatique 1 / 31 Les besoins de la communauté des sciences de la vie en termes d infrastructure informatique J-F. Gibrat Unité Mathématique, Informatique et Génome, INRA, Jouy-en-Josas Séminaire IDRIS, Orsay, 14

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail