Annotation de protéines

Dimension: px
Commencer à balayer dès la page:

Download "Annotation de protéines"

Transcription

1 Annotation de protéines Recherche d informations sur une séquence protéique Equipe Bonsai (2014)

2 Annotation expérimentale de protéines Il est difficile de trouver expérimentalement la fonction d une protéine sans connaissance préalable Besoin de nombreuses expériences dans diverses conditions expérimentales Long et coûteux Besoin d inactiver tous les gènes, voire des combinaisons de gènes (knockout, gene silencing [voir wikipedia]) Pas garantie de résultats Il faut trouver la condition dans laquelle le gène s exprime Il faut réussir à observer le phénotype lié au gène ou à son inactivation Il existe souvent des voies alternatives pour compenser l inactivation d un gène Besoin de points de départs pour orienter les recherches 2

3 Que peut-on prédire de façon automatique? La fonction de la protéine (pas finement) C est un transporteur de sucre, mais du quel? Certains domaines fonctionnels Cette partie de la protéine se lie à l ATP (molécule énergétique) Les modifications post-traductionnelles C est une protéine O-glycosylée sur tel acide aminé Les structures 2D et 3D des protéines La localisation cellulaire de la protéine C est une protéine membranaire 3

4 Limite des connaissances (2008) En général, > 30% des gènes d un génome sont de fonction inconnue Exemple d une bactérie, Bacillus subtilis 16% des gènes similaires à d autres gènes de fonction inconnue 26% des gènes sans similarité Exemple de la levure 6400 gènes dont (39%) de fonction complètement inconnue. Il s'agit de l'un des organismes les plus étudiés du point de vue expérimental (génétique et biologie moléculaire). Son génome complet est disponible depuis Pour le génome humain, 60% des gènes sont complètement inconnus. Beaucoup de fonctions cellulaires sont encore à découvrir! 4

5 PRÉDICTION DE LA FONCTION DES PROTÉINES 5

6 Prédiction de la fonction Comparaison de séquence Pb : si la région trouvée ne couvre pas toute la protéine, est-ce qu il s agit de la région importante pour la fonction? Prédiction de domaines/motifs protéiques Pb : comment définir puis représenter ces domaines/motifs? Pb : comment les identifier sur une protéine inconnue? Motifs protéiques Résidus essentiels à une fonction conservée (site actif) Résidus pas nécessairement consécutifs sur la séquence primaire, mais proches dans la structure 3D Domaines protéiques Fragments de séquence contigus conservés dans une ou plusieurs familles Se replient indépendamment 6

7 Détection de régions conservées Processus pour définir un domaine/motif protéique Choix d une famille de protéines Recherche de toutes les séquences appartenant à cette famille Construction d un alignement multiple à partir de ces séquences Cas 1 : à partir de connaissances expérimentales Identification de la région ou des acides aminés essentiels à la fonction sur une ou plusieurs protéines Localisation de cette région dans l alignement Correction éventuelle de l alignement Cas 2 : par détection automatique Extraction de régions fortement conservées dans l alignement Etape finale Extraction de la région conservée puis modélisation 7

8 Un exemple : l hormone pancréatique (PP) Hormone peptidique produite par le prancréas Régule les fonctions pancréatiques et gastrointestinales Banques de domaines InterPro: IPR001955, Pancreatic hormone PROSITE: PS00265, PS50276, PDOC00238, PANCREATIC_HORMONE PFAM: PF00159, Pancreatic hormone peptide Entrées de structure 3D 1FP8 (voir ci-contre) 8

9 Prosite, une banque de motifs protéiques Créée en 1988 ( Motifs protéiques ayant une signification biologique particulière + documentation complète Deux représentations des motifs Matrice poids-position («profil») Pseudo-expression régulière («pattern») Construite manuellement But : aide à l annotation protéique Recherche la présence de motifs dans une séquence 9

10 Prosite par l exemple: l hormone pancréatique section technique: 2 entrées associées : l une représenté par un profil (PS50276), l autre par une pattern (PS500265), 10

11 Prosite par l exemple (1/2): l entrée PS

12 Matrice poids-position de l entrée PS

13 Alignement des vrai-positifs de PS50276 PROFIL: 13

14 Prosite par l exemple (2/2): l entrée PS

15 Alignement des vrai-positifs de PS00265 PATTERN : [FY]-x(3)-[LIVM]-x(2)-Y-x(3)-[LIVMFY]-x-R-x-R-[YF] 15

16 Qu est-ce qu un bon pattern? Pertinent d un point de vue biologique Représentatif de la fonction décrite : Suffisamment tolérant Pas de sur-adaptation (e.g. spécialisation vers une sous-famille) Limiter le nombre de faux négatifs Détecte toutes (ou presque) les séquences qui ont la fonction Suffisamment discriminant Limiter le nombre de faux positifs Ne détecte pas trop de séquences qui n ont pas la fonction recherchée Construction d un pattern A l aide du logiciel PRATT ( Puis amélioration à la main 16

17 Construction d un pattern selon Prosite 17

18 Modélisation par expression régulière (pattern) NEUY CARAU/29-64 AEE..LAKYYSALRHYINLITRQRY PYY HUMAN/29-64 PEE..LNRYYASLRHYLNLVTRQRY PMY PETMA/1-36 PEE..LSKYMLAVRNYINLITRQRY PPY LOPAM/1-36 PED..WASYQAAVRHYVNLITRQRY PAHO BOVIN/30-65 PEQ..MAQYAAELRRYINMLTRPRY PAHO CHICK/26-61 VED..LIRFYNDLQQYLNVVTRHRY PAHO ANSAN/1-36 VED..LRFYYDNLQQYRLNVFRHRY NPF HELAS/4-39 PNE..LRQYLKELNEYYAIMGRTRF NPF MONEX/1-39 DNKAALRDYLRQINEYFAIIGRPRF [FY]-x(3)-[LIVM]-x(2)-Y-x(3)-[LIVMFY]-x-R-x-R-[YF] 18

19 Vérification de la qualité du pattern PS00265 Recherche du pattern dans les protéines de SwissProt Trouvé dans 84 séquences 81 vrais positifs (hormones pancréatiques possédant le pattern) 3 faux positifs (protéines quelconques possédant le pattern) 7 faux négatifs (hormones sans pattern dont 6 tronquées) Sélectivité : 96,43 % Vrais positifs / (vrais positifs + faux positifs) Aptitude de la méthode à éviter les faux positifs Sensibilité : 92,05 % Vrais positifs / (vrais positifs + faux négatifs) Aptitude de la méthode à trouver les vrais positifs 19

20 Vérification de la qualité du pattern PS

21 Vérification de la qualité du pattern PS

22 Exemple de détection du pattern PS00265 La séquence NPF_ARTTR contre le pattern de l hormone pancréatique >NPF_ARTTR KVVHLRPRSSFSSEDEYQIYLRNVSKYIQLYGRPRF PS00265 YlrnVskYiqlYgRpRF 22

23 Construction d une matrice de poids (profil) Même point de départ : alignement multiple Calcul du poids de chaque acide aminé pour chaque position pertinente Fréquence de chaque acide aminé de la colonne Equivalence entre acides aminés Recherche d un profil dans une séquence : Fréquence de l acide aminé présent dans la séquence étudiée Somme des fréquences trouvées à chaque position Profil (motif) trouvé si la somme est supérieure à un seuil propre au profil 23

24 Point de départ : matrice des positions A D E F H I K L M N P Q R S T V W Y

25 Vers plus de souplesse Autoriser des insertions ou des délétions Ajout de pénalités particulières via une colonne supplémentaire Autoriser des substitutions (entre acides aminés voisins) Profil i,a = b f i,b M(a, b) M(a, b) : score entre les acides aminés a et b (PAM, BLOSUM,... ) f i,b : fréquence du b ième acide aminé dans la colonne i de l alignement multiple. 25

26 Exemple 26

27 Recherche d un profil Score : alignement entre le profil et la séquence Les pénalités de substitutions et de gaps sont données par le profil Seuil d admission : E-value Banque de référence : SwissProt 27

28 Vérification de la qualité du profil PS50276 Trouvé dans 82 séquences (tous vrais positifs) 6 faux négatifs (dont 6 séquences tronquées) Sélectivité (Precision): 100 % Vrais positifs / (vrais positifs + faux positifs) Aptitude de la méthode à éviter les faux positifs (dans ce cas, les 82 séquences trouvées sont toutes positives) Sensibilité (Recall): % Vrais positifs / (vrais positifs + faux négatifs) Aptitude de la méthode ne pas «rater» des bonne séquences. 28

29 Vérification de la qualité du profil PS

30 Vérification de la qualité du profil PS

31 Exemple de détection du profil PS50276 La séquence NPF_ARTTR contre le profil de l hormone pancréatique Score: Consensus 1 PE.EAALAKYYAALRHYINLITRQRY 25 : :: :::::: : :: : : NPF_ARTTR 13 SEDEY.YQIYLRNVSKYIQLYGRPRF 37 31

32 PFAM, une autre banque de motifs et domaines Gérée par le Sanger Intitute ( Construction et annotation automatiques des entrée Motifs et domaines représentés par des chaînes de Markov cachées (HMM) Permettent la modélisation des insertions-délétions Etapes de construction Mise en place à partir de séquences similaires Extension à des séquences de plus en plus éloignées 32

33 PFAM par l exemple: l hormone pancréatique 33

34 PFAM par l exemple: l hormone pancréatique 34

35 PFAM par l exemple: l hormone pancréatique 35

36 PFAM par l exemple: l hormone pancréatique 36

37 PFAM : Modélisation avec des HMM HMM = Hidden Markov Model = Modèle de Markov caché Un ensemble d états Des probabilités de transitions entre les états Un ensemble d observations Une probabilité d émission qui indique pour chaque état la probabilité d y émettre telle information 37

38 Profil HMM - alignement sans indel PPY_LOPAM/1-36 PEDWASYQAAVRHYVNLITRQRY PAHO_BOVIN/30-65 PEQMAQYAAELRRYINMLTRPRY PAHO_CHICK/26-61 VEDLIRFYNDLQQYLNVVTRHRY PAHO_ANSAN/1-36 VEDLRFYYDNLQQYRLNVFRHRY NPF_HELAS/4-39 PNELRQYLKELNEYYAIMGRTRF 1 observation = 1 acide aminé 1 état = 1 colonne de l alignement multiple émissions = fréquences de chaque a.a. 38

39 Profil HMM - alignement avec insertions Une insertion est un fragment de la séquence qui n apparait pas dans le modèle Nouvel état : insertion PPY_LOPAM/1-36 PED..WASYQAAVRHYVNLITRQRY PAHO_BOVIN/30-65 PEQ..MAQYAAELRRYINMLTRPRY PAHO_CHICK/26-61 VED..LIRFYNDLQQYLNVVTRHRY PAHO_ANSAN/1-36 VED..LRFYYDNLQQYRLNVFRHRY NPF_HELAS/4-39 PNE..LRQYLKELNEYYAIMGRTRF NPF_MONEX/1-39 DNKAALRDYLRQINEYFAIIGRPRF 39

40 Profil HMM - alignement avec délétions Une délétion est un fragment du modèle qui ne correspond à aucun acide aminé Ajout d états silencieux, qui n émettent rien PMY_PETMA/1-36 PEE..LSKYMLAVRNYINLITRQRY PPY_LOPAM/1-36 PED..WASYQAAVRHYVNLITRQRY PAHO_BOVIN/30-65 PEQ..MAQYAAELRRYINMLTRPRY PAHO_CHICK/26-61 VED..LIRFYNDLQQYLNVVTRHRY PAHO_ANSAN/1-36 VED..LRFYYDNLQQYRLNVFRHRY NPF_HELAS/4-39 PNE..LRQYLKELNEYYAIMGRTRF NPF_MONEX/1-39 DNKAALRDYLRQINEYFAIIGRPRF Q9PT97/29-62 AEE..LAKYYSALRHYINLITRQ.. 40

41 En résumé Etats matchants : colonnes avec moins de 50% de indel Etats d insertion : majorité de insertion (losange) Etats de délétion : majorité de deletion (rond) Probabilités d émission : nombre d occurrences de chaque acide aminé Probabilités de transition : nombre de séquences empruntant la transition Correction avec les pseudo-comptes : +1 à chaque compte (loi de Laplace) 41

42 Un exemple d occurrence du HMM La séquence NPF_ARTTR contre le HMM de l hormone pancréatique Alignments of top-scoring domains: hormone3: domain 1 of 1, from 3 to 36: score 48.4, E = 1.1e-13 *->ypskdfpenpgddaspeeelaqylralrqyinlitrpry<-* ++++ P++++s+E+e+++Ylr++++Yi+l++RpR+ 3 VHLR-----PRSSFSSEDEYQIYLRNVSKYIQLYGRPRF 36 Le HMM «Hormone_3» ou «Pancreatic hormone peptide» est trouvé dans 119 séquences de UniProt 42

43 Autres banques de domaines Blocks Segments multiples alignés sans insertions-délétions Régions les plus conservées des protéines Calibrage contre la banque SwissProt Description du domaine : alignement Prodom Recherche de blocs par comparaison de toutes les séquences de Uniprot deux à deux Annotation automatique Description du domaine : consensus (acide aminé le plus fréquent) 43

44 InterPro. Gérée par l EBI ( Contenu Superfamilles, familles, domaines, motifs, sites fonctionnels, modifications post-traductionnelles, structures 3D Regroupe plusieurs banques existantes Prosite, PFAM, Blocks, Prodom, Smart, Prints, TIGRFams, Superfamilly, SCOP, CATH, MSD Une entrée Description biologique détaillée Représentation de l objet par les différentes banques 44

45 InterPro : différents modèles et annotations Modèles utilisés Annotations produites 45

46 InterPro : objets biologiques et classification Objets biologiques : Famille, Domaine, Répétitions, Site Deux classifications hiérarchiques : Familles et Domaines (ATTENTION : 2 classifications indépendantes et ) 46

47 InterPro : objets biologiques 47

48 InterPro : les familles Une Famille Ensemble de protéines ayant une ou des fonctions proches, dues à leurs origine commune (inférée par similarité de structure et/ou séquence) Les Familles peuvent être organisées en une Hiérarchie 48

49 InterPro : les familles Exemple : famille GPCR kinases (IPR000239), sans hiérarchie dans 2 slides 49

50 InterPro : les domaines Un Domaine En règle générale : partie d une protéine qui se replie & reste stable (structure tertiaire) indépendamment du reste de la protéine Sauf que un Domaine InterPro peut être structurel mais aussi fonctionnel ou conservé au niveau séquence (fourre tout pratique ) Domaines : Hiérarchie possible (idem Familles). Protéines : domaines souvent organisés en «modules» Exemple : dans la famille GPCR kinases (IPR000239), un «module» de 4 domaines apparaît sur 119 protéines de cette famille sous cette forme : Regulator of G protein signalling (IPR000342) Protein kinase domain (IPR000719) AGC-kinase, Pleckstrin C-terminal homology (IPR000961) domain (IPR001849) 50

51 Organisation des domaines dans les familles 51

52 Organisation des domaines vs autres domaines Pour un domaine donné (ou ses fils dans la hierarchie), quels sont les domaines co-occurents dans les protéines? 52

53 Organisation des domaines vs autres domaines En Orange : protein kinase domain (ou ses fils dans la hiérarchie) 53

54 Organisation des domaines dans les proteines? En Orange : protein kinase domain (ou ses fils dans la hiérarchie) 54

55 InterPro par l exemple: l hormone pancréatique 55

56 InterPro par l exemple: l hormone pancréatique 56

57 InterPro par l exemple: l hormone pancréatique 57

58 InterPro par l exemple: l hormone pancréatique 58

59 InterPro par l exemple: l hormone pancréatique 59

60 InterPro par l exemple: l hormone pancréatique 60

61 InterPro : interface d'interrogation simple 61

62 InterProScan : interface d'interrogation 62

63 InterProScan : résutats [résumé] 63

64 InterProScan : résutats [entrée interpro] 64

65 Prédiction de la localisation cellulaire Prédiction de domaines transmembranaires Programmes basés sur l apprentissage à partir de protéines dont les domaines transmembranaires sont connus Critère principal : hydrophobicité des acides aminés TopPred [sur mobyle], TMHMM [cbs.dtu.dk], voir Prédiction de peptide signal Peptide signal : suite d acides aminés située au début d une protéine et indiquant à la machinerie cellulaire vers quel compartiment adresser la protéine Aussi basé sur l apprentissage (jeux d apprentissage spécifiques à un compartiment cellulaire) SignalP [cbs.dtu.dk], Prédictions de localisation cellulaire TargetP [cbs.dtu.dk], Psort [psort.org], voir (liste impressionnante!) 65

66 Prédiction de domaines transmembranaires (1/2) Exemple de résultat pour TopPred: 66

67 Prédiction de domaines transmembranaires (2/2) Exemple de résultat pour TM-HMM: 67

68 Prédiction de peptite signal (1/2) Exemple de résultat pour signalp-nn (NN = Neural Networks) voir 68

69 Prédiction de peptite signal (2/2) Exemple de résultat pour signalp-hmm: The common structure of signal is commonly described as a positively charged n-region, followed by a hydrophobic h-region and a neutral but polar c-region. voir 69

70 Localisation du peptite signal mtp, a mitochondrial targeting peptide SP, Secretory pathway voir 70

71 Localisation du peptite signal Loc Prediction of localization, based on the scores above; the possible values are: C Chloroplast, i.e. the sequence contains ctp, a chloroplast transit peptide; M Mitochondrion, i.e. the sequence contains mtp, a mitochondrial targeting peptide; S Secretory pathway, i.e. the sequence contains SP, a signal peptide; _ Any other location; * "don't know"; indicates that cutoff restrictions were set (see instructions) and the winning network output score was below the requested cutoff for that category. RC Reliability class, from 1 to 5, where 1 indicates the strongest prediction. RC is a measure of the size of the difference ('diff') between the highest (winning) and the second highest output scores. There are 5 reliability classes, defined as follows: 1 : diff > : > diff > : > diff > : > diff > : > diff 71

72 Etude des structures 2D et 3D

73 Prédiction de la structure des protéines Nbre protéines dans les banques (UniProt : ) >> Nbre structures 3D expérimentales (PDB : ) Besoin de logiciels de prédiction Efforts pour déterminer expérimentalement plus de structures 3D Difficultés de prédiction : Pas de règle simple d interactions entre acides aminés Des homologues distants peuvent avoir des structures proches Grande variété de structures 73

74 Prédiction de structure 2D Localisation des éléments de base de structure 2D Hélices α, feuillets β, boucles Reconnaissance de motifs Basée sur des règles de construction des éléments de base et l enchaînement de ces éléments dans les protéines Méthodes statistiques Apprentissage à partir d alignements multiples de séquences impliquées dans une hélice ou un feuillet (protéines de structure 3D connue) Résultats : en moyenne 70% des aa bien prédits 74

75 Exemple de prédiction 2D (site NPSA) KAERKRMRNRIAASKSRKRKLERIARLEEKVKTL Réel HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH DSC hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh MLRC hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh PHD hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh Consensus hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh KAQNSELASTANMLREQVAQLKQKVMNH HHHHHHHHHHHHHHHHHHHHTT hhcchhhhhhhhhhhhhhhhhhhhhhhh hhchhhhhhhhhhhhhhhhhhhhhhhhh hhcchhhhhhhhhhhhhhhhhhhhhhhh hhcchhhhhhhhhhhhhhhhhhhhhhhh AP1_human ( ) 75

76 Exemple de prédiction 2D (PSIPRED) 76

77 Prédiction de structure 3D Modélisation 3D à partir d un homologue Recherche des séquences proches dans PDB Repliement de la seq inconnue à l aide de la structure connue Enfilage (threading) Banques représentatives des topologies de base Repliement de la seq dans chaque structure et sélection de la structure la plus probable Qualité de la prédiction Très variable selon la séquence étudiée Maximum entre 60 et 70% de bonne prédiction 77

78 Format des fichiers de structure 3D Ce sont des fichiers textes Format PDB (Brookhaven) : En-tête avec des informations générales sur les molécules modélisées (éventuellement leur structure 2D) Coordonnées des atomes qui composent la structure ATOM = atome de la protéine HETATM = HETeroAToM = atome des cofacteurs, substrats, ions,... lié à la protéine mmcif (macromolecular Crystallographic Information Format) HEADER NEUROPEPTIDE 09-JUL-04 1TZ4 TITLE [HPP19-23]-PNPY BOUND TO DPC MICELLES COMPND MOLECULE: PANCREATIC HORMONE; SEQRES 1 A 37 TYR PRO SER LYS PRO ASP ASN... SEQRES 2 A 37 ALA GLU ASP LEU ALA GLN TYR... SEQRES 3 A 37 TYR ILE ASN LEU ILE THR ARG... ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM N C C O C C C C C C C

79 Annotation au niveau de l organisme Le but est de voir plus loin qu un gène ou une protéine isolée

80 Quelles sont toutes les fonctions cellulaires? Difficile de faire la liste de toutes les fonctions cellulaires Elles sont nombreuses Elles varient selon les organismes Pas de relation simple entre protéine (ou autre) et fonction Une protéine plusieurs fonctions (n domaines, selon le contexte) Une fonction plusieurs protéines (complexes, duplications) Relations différentes selon les organismes Existence de nombreux noms pour une même fonction Besoin de créer une ontologie pour avoir une description universelle des fonctions cellulaires

81 Une nomenclature pour les enzymes : EC Créée dans les années 60 et mise à jour régulièrement Décrit toutes les fonctions enzymatiques connues à l aide d un code en quatre parties (EC ) Les 6 classes principales, les sous-classes, les sous-sous-classes, le numéro de série Les 6 classes principales : Classe 1 : Oxydoréductases Classe 2 : Transférases Classe 3 : Hydrolases Classe 4 : Lyases Classe 5 : Isomérases Classe 6 : Ligases

82 Une nomenclature générale : Gene Ontology Créée fin 90 et mise à jour régulièrement But : fournir un vocabulaire contrôlé applicable à tout organisme, même si les connaissances sur les rôles des gènes et des protéines évoluent constamment. 3 dictionnaires structurés Processus cellulaires Ex : Polarité de l axe antéro-postérieur, Glycolyse, Fonctions moléculaires Ex : Facteur de transcription, Enzyme, Composants cellulaires Ex : Noyau, Cytoplasme, Membrane, Complexe moléculaire,

83 Les processus cellulaires 4 grands types de processus cellulaires : Voies métaboliques Réseaux de régulation Transduction de signaux Transports membranaires Les autres processus cellulaires Synthèse des protéines (transcription, traduction, ) Réplication de l ADN Division cellulaire (mitose / méiose) Structure de la cellule (cytosquelette, membrane)

84 Exemples d ontologies Composants cellulaires Fonctions moléculaires Processus cellulaires

85 MetaCyc, une banque de voies métaboliques Banque de données de voies métaboliques non redondantes et découvertes expérimentalement, couvrant plus de 2460 organismes Schémas des voies (une voie par organisme) Informations sur les enzymes, protéines, gènes et composés Informations sur la régulation des gènes La banque la plus complète concerne E. coli

86 Metacyc : la voie de synthèse du tryptophane (E. coli) Produits Produits+Enzymes/Gènes/EC+régulation

87 Metacyc : la voie de synthèse du tryptophane (E. coli) trpe, trpd trpd trpc trpa trpc trpb trpx : gènes Source : Metacyc

88 Metacyc : les gènes liés à cette voie (E. coli) Localisation sur le génome Régulation L opéron trp Source : Metacyc

89 Comparaison des «voies du tryptophane» Escherichia coli trpe, trpd trpd trpc trpc trpa trpb 2 protéines 1 fonction (complexe) 1 protéine 2 fonctions Bacillus subtilis 2 protéines 1 fonction (duplication possible) trpe, paba trpd ynai / trpf trpc trpa trpb 2 protéines 2 fonctions

90 Comparaison de la localisation des gènes trp Escherichia coli Bacillus subtilis

91 Recherche d un gène ayant une fonction donnée Première méthode : Trouver une protéine ayant cette fonction chez un organisme proche de celui étudié, Rechercher cette protéine sur le génome à l aide de BlastX. Inconvénient : il faut bien choisir la protéine qui sert de sonde. Deuxième méthode : Trouver un (ou plusieurs) motif(s)/domaine(s) protéique(s) qui caractérise(nt) la fonction recherchée. Rechercher ce(s) motif(s)/domaine(s) sur la séquence génomique traduite dans les 6 phases de lecture. Inconvénient : très long! Est-ce que ce «travail» n est pas déjà fait?

92 Les banques de connaissances, KEGG KEGG : Kyoto Encyclopedia of Genes and Genomes Les données sont représentées sous la forme : de Graphes Listes de voisinages / Matrices de voisinages / Graphes (nœud = objet, arrête = interaction) d Arbres / DAG Hiérarchies 15 banques de données liées

93 Les banques de KEGG

94 KEGG : Pathways Construction manuelle des schémas métaboliques D après les publications Le schéma pour une voie représente toutes les alternatives possibles Les organismes n utilisent pas tous les même réactions pour aboutir au même composé chimique Les gènes pour un organisme donné sont colorés dans le schéma général Lien entre gène et fonction de la protéine codée par le gène

95 Un exemple de schéma de KEGG Assemblage du flagelle Source : KEGG

96 Un exemple de schéma de KEGG [1] [2] Assemblage du flagelle Source : KEGG

97 Un exemple de hiérarchie fonctionnelle BRITE [1] Assemblage du flagelle Source : KEGG

98 Un exemple de table d orthologues de KEGG [2]

99 SIMULATION DYNAMIQUE DES RÉSEAUX CELLULAIRES

100 Limites des représentations statiques Difficiles à lire Besoin de commentaires pour comprendre le fonctionnement du réseau cellulaire Pas de simulation possible + X + Y -

101 Avantage des représentations dynamiques Le fonctionnement complet du réseau est simulé Besoin de formaliser les connaissances Mise en place d aller-retour entre simulation et expérimentation Découverte d étapes manquantes pour que le réseau fonctionne Recherche des molécules effectuant ces étapes dans la cellule Simulations dans différentes conditions Variation des points d entrée du réseau Simulation de mutations (inactivation, sur-expression, ) Disfonctionnements (maladie, élément perturbateur, )

102 Limites des représentations dynamiques Besoin de nombreuses données expérimentales Seuils de concentration des molécules impliquées : Passage de l état actif à l état inactif Plus le réseaux compte de partenaires, plus il est difficile à simuler Trop de variables à prendre en compte Besoin des connaissances en biologie ET en informatique ou mathématique Nécessite la mise en place de collaborations étroites entre équipes de différentes disciplines (cela prend du temps)

103 Généralités sur les réseaux de régulation Un réseau (ou circuit) est un ensemble d interactions Les composants d un réseau cellulaire peuvent être des molécules biologiques ou d autres stimuli (lumière, chaleur, ) Une interaction = effet d un composant sur un autre composant du réseau Un réseau de régulation concerne les gènes et leurs produits, mais aussi la concentration en une molécule,

104 Les circuits positifs Nombre paire (voire nul) d interactions négatives X + + Y X - - Y [X] et [Y] augmentent [X] ou [Y] augmente X ou Y ont un effet positif sur eux-mêmes Ces circuits sont impliqués dans la différentiation cellulaire ou la mémoire.

105 Les circuits négatifs Nombre impaire d interactions négatives X - X Y - + [X] stable [X] et [Y] stables X et Y ont un effet négatif sur eux-mêmes Ces circuits sont impliqués dans le maintient d un état stable, dans l homéostasie

106 La simulation par réseaux booléens Réseau booléen = Graphe orienté Nœud = molécule biologique (gène, protéine, ) ou stimulus (lumière, ) Arrête = fonction booléenne (2 valeurs : 0/1, transcrit/non transcrit, présent/absent, ) Définition du graphe et des tables de vérités Schéma des interactions entre éléments du réseau Successions des états possibles du système Construction du graphe d états Les chemins possibles dans le graphe descriptif Découverte des états stables : soit un cycle, soit un point fixe

107 La simulation par équations différentielles Les équations différentielles sont des égalités faisant intervenir des fonctions et leurs dérivées Les dérivées représentent la variation de concentration d une molécule (dx) dans un laps de temps dt. L équation représente les différents éléments qui agissent sur la concentration de la molécule Limites : il faut connaître les concentrations pour résoudre les équations. Possibilité : estimation des paramètres.

Formavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...

Formavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB... Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Chapitre 7 : Structure de la cellule Le noyau cellulaire

Chapitre 7 : Structure de la cellule Le noyau cellulaire UE2 : Structure générale de la cellule Chapitre 7 : Structure de la cellule Le noyau cellulaire Professeur Michel SEVE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

! Séquence et structure des macromolécules.  Séquences protéiques (UniProt)  Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ) Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de

Plus en détail

INTRODUCTION À L'ENZYMOLOGIE

INTRODUCTION À L'ENZYMOLOGIE INTRODUCTION À L'ENZYMOLOGIE Les enzymes sont des macromolécules spécialisées qui - catalysent les réactions biologiques - transforment différentes formes d'énergie. Les enzymes diffèrent des catalyseurs

Plus en détail

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique

Plus en détail

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques IMMUNOLOGIE La spécificité des immunoglobulines et des récepteurs T Informations scientifiques L infection par le VIH entraîne des réactions immunitaires de l organisme qui se traduisent par la production

Plus en détail

Bibliographie Introduction à la bioinformatique

Bibliographie Introduction à la bioinformatique Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A

Plus en détail

Prédiction de la structure d une

Prédiction de la structure d une Prédiction de la structure d une protéine Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Les structures protéiques

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

Séquence 2. L expression du patrimoine génétique. Sommaire

Séquence 2. L expression du patrimoine génétique. Sommaire Séquence 2 L expression du patrimoine génétique Sommaire 1. La synthèse des protéines 2. Phénotypes, génotypes et environnement Synthèse de la séquence 2 Exercices de la séquence 2 Glossaire des séquences

Plus en détail

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln. MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr Programmation avec R Polycopié d exercices Leslie REGAD ; Gaëlle LELANDAIS leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr Ce polycopié rassemble différents exercices vous

Plus en détail

ULBI 101 Biologie Cellulaire L1. Le Système Membranaire Interne

ULBI 101 Biologie Cellulaire L1. Le Système Membranaire Interne ULBI 101 Biologie Cellulaire L1 Le Système Membranaire Interne De la nécessité d un SMI Le volume augmente comme le cube de la dimension linéaire, alors que la surface n'est augmentée que du carré Une

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

TD de Biochimie 4 : Coloration.

TD de Biochimie 4 : Coloration. TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Modélisation multi-agents - Agents réactifs

Modélisation multi-agents - Agents réactifs Modélisation multi-agents - Agents réactifs Syma cursus CSI / SCIA Julien Saunier - julien.saunier@ifsttar.fr Sources www-lih.univlehavre.fr/~olivier/enseignement/masterrecherche/cours/ support/algofourmis.pdf

Plus en détail

Des applications locales à l infonuagique: comment faire la transition?

Des applications locales à l infonuagique: comment faire la transition? : comment faire la transition? Congrès des milieux documentaires 30 novembre 2011 / m.sevigny@umontreal.ca Directeur Bureau des systèmes Direction des bibliothèques - UdeM 2 / 15 Plan de la présentation

Plus en détail

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr CATI BBRIC 35 bioinformaticiens

Plus en détail

Cellules procaryotes Service histologie Pr.k.mebarek

Cellules procaryotes Service histologie Pr.k.mebarek Cellules procaryotes Service histologie Pr.k.mebarek I) Les cellules procaryotes II) Les cellules eucaryotes o 1) Caractéristiques générales des cellules eucaryotes o 2) Organisation des cellules eucaryotes

Plus en détail

3: Clonage d un gène dans un plasmide

3: Clonage d un gène dans un plasmide 3: Clonage d un gène dans un plasmide Le clonage moléculaire est une des bases du génie génétique. Il consiste à insérer un fragment d'adn (dénommé insert) dans un vecteur approprié comme un plasmide par

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE Biologie LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE Février 2006 I. L'INTRODUCTION Chaque cellule d'un organisme supérieur provient de la multiplication d'une cellule préexistante (cellule

Plus en détail

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006 La reconnaissance moléculaire: la base du design rationnel En 1890 Emil Fisher a proposé le modèle "serrure et clé" pour expliquer la façon de fonctionner des systèmes biologiques. Un substrat rentre et

Plus en détail

Transport des gaz dans le sang

Transport des gaz dans le sang UE3-2 - Physiologie Physiologie Respiratoire Chapitre 9 : Transport des gaz dans le sang Docteur Sandrine LAUNOIS-ROLLINAT Année universitaire 2011/2012 Université Joseph Fourier de Grenoble - Tous droits

Plus en détail

Les cytokines et leurs récepteurs. Laurence Guglielmi laurence.guglielmi@univ-montp1.frli

Les cytokines et leurs récepteurs. Laurence Guglielmi laurence.guglielmi@univ-montp1.frli Les cytokines et leurs récepteurs Laurence Guglielmi laurence.guglielmi@univ-montp1.frli l i@ i 1 Les cytokines et leurs récepteurs 2 mécanismes principaux d interactions cellulaires : - contact membranaire

Plus en détail

Les OGM. 5 décembre 2008. Nicole Mounier

Les OGM. 5 décembre 2008. Nicole Mounier Les OGM 5 décembre 2008 Nicole Mounier Université Claude Bernard Lyon 1 CGMC, bâtiment Gregor Mendel 43, boulevard du 11 Novembre 1918 69622 Villeurbanne Cedex OGM Organismes Génétiquement Modifiés Transfert

Plus en détail

Les bases de données

Les bases de données Les bases de données Introduction aux fonctions de tableur et logiciels ou langages spécialisés (MS-Access, Base, SQL ) Yves Roggeman Boulevard du Triomphe CP 212 B-1050 Bruxelles (Belgium) Idée intuitive

Plus en détail

Journée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Journée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique Monitorint spatio-temporel intégré de la mobilité urbaine Monitoring spatio-temporel de l ADN urbain Une réponse aux défis, problèmes, enjeux et risques des milieux urbains Nicolas Lachance-Bernard M.ATDR

Plus en détail

Analyse,, Conception des Systèmes Informatiques

Analyse,, Conception des Systèmes Informatiques Analyse,, Conception des Systèmes Informatiques Méthode Analyse Conception Introduction à UML Génie logiciel Définition «Ensemble de méthodes, techniques et outils pour la production et la maintenance

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Perl Orienté Objet BioPerl There is more than one way to do it

Perl Orienté Objet BioPerl There is more than one way to do it Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels

Plus en détail

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

De la physico-chimie à la radiobiologie: nouveaux acquis (I) De la physico-chimie à la radiobiologie: nouveaux acquis (I) Collaboration: - Laboratoire de Radiotoxicologie et Oncologie (L. Sabatier) CEA, DSV - Laboratoire de Génotoxicité et Modulation de l Expression

Plus en détail

Information génétique

Information génétique chapitre 3 Information génétique et division cellulaire L étude de la division cellulaire est abordée pour découvrir comment est transmise et conservée l information génétique portée par les chromosomes.

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

COUSIN Fabien KERGOURLAY Gilles. 19 octobre 2007. de l hôte par les. Master 2 MFA Responsable : UE Incidence des paramètres environnementaux

COUSIN Fabien KERGOURLAY Gilles. 19 octobre 2007. de l hôte par les. Master 2 MFA Responsable : UE Incidence des paramètres environnementaux COUSIN Fabien KERGOURLAY Gilles 19 octobre 2007 Inhibition des défenses de l hôte par les bactéries pathogènes Master 2 MFA Responsable : UE Incidence des paramètres environnementaux Gwennola ERMEL I Détection

Plus en détail

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions Exemple accessible via une interface Web Une base de données consultable en ligne : Bases de données et systèmes de gestion de bases de données The Trans-atlantic slave trade database: http://www.slavevoyages.org/tast/index.faces

Plus en détail

I. La levure Saccharomyces cerevisiae: mode de vie

I. La levure Saccharomyces cerevisiae: mode de vie LES LEVURES UE «levures» -5 avril: généralités (MN Simon) -6 avril: analyse génétique (MN Simon) -6 avril: Cycle cellulaire I: la réplication (E. bailly) -7 avril: Cycle cellulaire II: la mitose (E. Bailly)

Plus en détail

Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège

Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège Immunofluorescence Dépistage Aspect Titre Cellules Hep 2: Connectivites

Plus en détail

TP N 3 La composition chimique du vivant

TP N 3 La composition chimique du vivant Thème 1 : La Terre dans l'univers, la vie et l'évolution du vivant : une planète habitée Chapitre II : La nature du vivant TP N 3 La composition chimique du vivant Les conditions qui règnent sur terre

Plus en détail

LE MODELE CONCEPTUEL DE DONNEES

LE MODELE CONCEPTUEL DE DONNEES LE MODELE CONCEPTUEL DE DONNEES Principe : A partir d'un cahier des charges, concevoir de manière visuelle les différents liens qui existent entre les différentes données. Les différentes étapes de réalisation.

Plus en détail

Conférence technique internationale de la FAO

Conférence technique internationale de la FAO Décembre 2009 ABDC-10/7.2 F Conférence technique internationale de la FAO Biotechnologies agricoles dans les pays en développement: choix et perspectives pour les cultures, les forêts, l élevage, les pêches

Plus en détail

Transport des gaz dans le sang

Transport des gaz dans le sang UE3-2 - Physiologie Physiologie Respiratoire Chapitre 9 : Transport des gaz dans le sang Docteur Sandrine LAUNOIS-ROLLINAT Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

1 les caractères des êtres humains.

1 les caractères des êtres humains. Quelques rappels des classes précédentes ACTIVITÉ livre pages 8 et 9 : apprendre le bilan de la page 9 Les êtres vivants sont répartis en espèces. Chaque être vivant est formé de cellules. schéma d une

Plus en détail

Gestion obligataire passive

Gestion obligataire passive Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage

Plus en détail

Learning Object Metadata

Learning Object Metadata Page 1 of 7 Learning Object Metadata Le LOM (Learning Object Metadata), est un schéma de description de ressources d enseignement et d apprentissage. Le LOM peut être utilisé pour décrire des ressources

Plus en détail

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes Langage SQL (1) Sébastien Limet Denys Duchier IUT Orléans 4 septembre 2007 Notions de base qu est-ce qu une base de données? SGBD différents type de bases de données quelques systèmes existants Définition

Plus en détail

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1 Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1 V. Fiolet Université de Mons-Hainaut 2006-2007 Nous allons aujourd hui nous intéresser à la tâche de classification

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Archived Content. Contenu archivé

Archived Content. Contenu archivé ARCHIVED - Archiving Content ARCHIVÉE - Contenu archivé Archived Content Contenu archivé Information identified as archived is provided for reference, research or recordkeeping purposes. It is not subject

Plus en détail

Le rôle de l endocytose dans les processus pathologiques

Le rôle de l endocytose dans les processus pathologiques UE7 Cours n 9 C. LAMAZE 24.11.11 Elise GODEAU (partie1) Guillaume MERGENTHALER (partie2) Le rôle de l endocytose dans les processus pathologiques SOMMAIRE : I. L endocytose à récepteurs : la voie des clathrines

Plus en détail

Séquence 1. Glycémie et diabète. Sommaire

Séquence 1. Glycémie et diabète. Sommaire Séquence 1 Glycémie et diabète Sommaire 1. Prérequis 2. La régulation de la glycémie 3. Le diabète 4. Synthè se 5. Glossaire 6. Exercices Exercices d apprentissage du chapitre 2 Exercices d apprentissage

Plus en détail

Algorithmique répartie

Algorithmique répartie Université Joseph Fourier 23/04/2014 Outline 1 2 Types de communication message envoyé à un groupe de processus Broadcast (diffusion) message envoyé à tous les processus du systèmes Unicast message envoyé

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Section «Maturité fédérale» EXAMENS D'ADMISSION Session de février 2014 RÉCAPITULATIFS DES MATIÈRES EXAMINÉES. Formation visée

Section «Maturité fédérale» EXAMENS D'ADMISSION Session de février 2014 RÉCAPITULATIFS DES MATIÈRES EXAMINÉES. Formation visée EXAMENS D'ADMISSION Admission RÉCAPITULATIFS DES MATIÈRES EXAMINÉES MATIÈRES Préparation en 3 ou 4 semestres Formation visée Préparation complète en 1 an 2 ème partiel (semestriel) Niveau Durée de l examen

Plus en détail

Logement pris en gestion par une Société de Logement de Service

Logement pris en gestion par une Société de Logement de Service Logements pris en gestion par les Sociétés de Logement de Service Public (SLSP) INFORMATIONS GÉNÉRALES Ce fichier reprend les informations concernant les logements n appartenant pas aux Sociétés de Logement

Plus en détail

Le Langage SQL version Oracle

Le Langage SQL version Oracle Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI anis.bach@isg.rnu.tn

Plus en détail

ORIGINE ET DIFFERENTS TYPES DE RYTHMES BIOLOGIQUES. Carine Bécamel carine.becamel@igf.cnrs.fr 04 67 14 29 83

ORIGINE ET DIFFERENTS TYPES DE RYTHMES BIOLOGIQUES. Carine Bécamel carine.becamel@igf.cnrs.fr 04 67 14 29 83 ORIGINE ET DIFFERENTS TYPES DE RYTHMES BIOLOGIQUES Carine Bécamel carine.becamel@igf.cnrs.fr 04 67 14 29 83 INTRODUCTION Rythmes biologiques: définition Tout être vivant (humain, animal, végétal) est soumis

Plus en détail

CHAPITRE 2 : Structure électronique des molécules

CHAPITRE 2 : Structure électronique des molécules CHAPITRE 2 : Structure électronique des molécules I. La liaison covalente 1) Formation d une liaison covalente Les molécules sont des assemblages d atomes liés par des liaisons chimiques résultant d interactions

Plus en détail

Big data : vers une nouvelle science des risques?

Big data : vers une nouvelle science des risques? Big data : vers une nouvelle science des risques? Serge Abiteboul INRIA et ENS Cachan Conseil national du numérique et Académie des sciences Big data et science des risques 1 Organisation Big data en bref

Plus en détail

Résonance Magnétique Nucléaire : RMN

Résonance Magnétique Nucléaire : RMN 21 Résonance Magnétique Nucléaire : RMN Salle de TP de Génie Analytique Ce document résume les principaux aspects de la RMN nécessaires à la réalisation des TP de Génie Analytique de 2ème année d IUT de

Plus en détail

Mise en place d'une démarche qualité et maintien de la certification ISO 9001:2008 dans un système d'information

Mise en place d'une démarche qualité et maintien de la certification ISO 9001:2008 dans un système d'information Mise en place d'une démarche qualité et maintien de la certification ISO 9001:2008 dans un système d'information IMGT The international ImMunoGeneTics information system Joumana Jabado-Michaloud IE Bioinformatique,

Plus en détail

THEME : CLES DE CONTROLE. Division euclidienne

THEME : CLES DE CONTROLE. Division euclidienne THEME : CLES DE CONTROLE Division euclidienne Soit à diviser 12 par 3. Nous pouvons écrire : 12 12 : 3 = 4 ou 12 3 = 4 ou = 4 3 Si par contre, il est demandé de calculer le quotient de 12 par 7, la division

Plus en détail

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015 Andrew Tolonen atolonen@genoscope.cns.fr Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015 A- Généralités I- La vie sur terre telle que nous la connaissons ne

Plus en détail

TD 1 - Structures de Traits et Unification

TD 1 - Structures de Traits et Unification TD 1 - Structures de Traits et Unification 1 Définitions Un trait (en: feature) est un couple attribut-valeur. Une structure de traits (en: feature structure) est un ensemble de traits. On peut les représenter

Plus en détail

ANTICORPS POLYCLONAUX ANTI IMMUNOGLOBULINES

ANTICORPS POLYCLONAUX ANTI IMMUNOGLOBULINES L OUTIL IDEAL POUR TOUTES LES DETECTIONS IMMUNOCHIMIQUES pour toutes les techniques immunodosages (EIA/ELISA) dot/ westernblot immunohistochimie immunocytochimie cytométrie en flux quel que soit le système

Plus en détail

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

Systèmes et algorithmes répartis

Systèmes et algorithmes répartis Systèmes et algorithmes répartis Tolérance aux fautes Philippe Quéinnec Département Informatique et Mathématiques Appliquées ENSEEIHT 4 novembre 2014 Systèmes et algorithmes répartis V 1 / 45 plan 1 Sûreté

Plus en détail

L UNIVERS INSTANTANÉ:

L UNIVERS INSTANTANÉ: L UNIVERS INSTANTANÉ: Samy Benzekry Speaker Name Title 2011 Hewlett-Packard Development Company, 2010 L.P. Hewlett-Packard Development Company, L.P. The information contained herein is subject to change

Plus en détail

Intégration de la dimension sémantique dans les réseaux sociaux

Intégration de la dimension sémantique dans les réseaux sociaux Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux

Plus en détail

Conception de Médicament

Conception de Médicament Conception de Médicament Approche classique HTS Chimie combinatoire Rational Drug Design Ligand based (QSAR) Structure based (ligand et ou macromolec.) 3DQSAR Docking Virtual screening Needle in a Haystack

Plus en détail

voies de signalisation

voies de signalisation Olivier Lascols Faculté de Médecine ierre et Marie Curie Généralités s sur les voies de signalisation 1 I. Caractérisation risation d une d voie de transduction d un d signal Exemple du Signal Mitogénique

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Respiration Mitochondriale

Respiration Mitochondriale Université Pierre et Marie Curie Respiration Mitochondriale Objectifs au cours de Révisions Biochimie PCEM2 Révisions Biochimie Métabolique 2004-2005 Pr. A. Raisonnier (alain.raisonnier@upmc.fr) Mise à

Plus en détail

Règles d engagement. Présentation Diapositives Bibliographie Questions Les vertus de la marche

Règles d engagement. Présentation Diapositives Bibliographie Questions Les vertus de la marche Règles d engagement Présentation Diapositives Bibliographie Questions Les vertus de la marche Plan Rappels sur l agilité Scrum : une implantation de l agilité Scrum ou XP? Conclusion Historique sélectif

Plus en détail

BTS/CGO P10 SYSTEME INFORMATION Année 2012-2013

BTS/CGO P10 SYSTEME INFORMATION Année 2012-2013 BTS/CGO P10 SYSTEME INFORMATION Année 2012-2013 TS2 CGO 7 mars 2013 2 heures Aucun document autorisé Calculatrice autorisée Nota : Il vous est demandé d apporter un soin particulier à la présentation de

Plus en détail

Plus courts chemins, programmation dynamique

Plus courts chemins, programmation dynamique 1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique

Plus en détail

RÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition

RÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition RELÈVE SCIENTIFIQUE AU SERVICE 2 e édition Juin 2011 Réalisé par : Partenaire financier du CQVB : Objectif : Ce répertoire vise à faciliter le maillage entre les étudiants-chercheurs universitaires et

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

choisir H 1 quand H 0 est vraie - fausse alarme

choisir H 1 quand H 0 est vraie - fausse alarme étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts

Plus en détail

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant Acquisition des données - Big Data Dario VEGA Senior Sales Consultant The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated

Plus en détail

Production d une protéine recombinante

Production d une protéine recombinante 99 Production d une protéine recombinante Lic. B. PIRSON Lic. J-M. SERONT ISICHt - Mons Production de la protéine recombinante GFP (Green Fluorescent Protein d Aequoria victoria) par une bactérie ( E.

Plus en détail

Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux

Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux Jean-Baka Domelevo Entfellner To cite this version: Jean-Baka

Plus en détail

Chaînes de Markov au lycée

Chaînes de Markov au lycée Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat

Plus en détail

JEAN-LUC VIRUÉGA. Traçabilité. Outils, méthodes et pratiques. Éditions d Organisation, 2005 ISBN : 2-7081-3260-1

JEAN-LUC VIRUÉGA. Traçabilité. Outils, méthodes et pratiques. Éditions d Organisation, 2005 ISBN : 2-7081-3260-1 JEAN-LUC VIRUÉGA Traçabilité Outils, méthodes et pratiques, 2005 ISBN : 2-7081-3260-1 2 à l assurance qualité Après la définition de la traçabilité dans la métrologie, on peut remarquer que le domaine

Plus en détail

Gestion des transactions et accès concurrents dans les bases de données relationnelles

Gestion des transactions et accès concurrents dans les bases de données relationnelles Gestion des transactions et accès concurrents dans les bases de données relationnelles Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Fev.

Plus en détail