Annotation de protéines
|
|
- Paul Paquin
- il y a 8 ans
- Total affichages :
Transcription
1 Annotation de protéines Recherche d informations sur une séquence protéique Equipe Bonsai (2014)
2 Annotation expérimentale de protéines Il est difficile de trouver expérimentalement la fonction d une protéine sans connaissance préalable Besoin de nombreuses expériences dans diverses conditions expérimentales Long et coûteux Besoin d inactiver tous les gènes, voire des combinaisons de gènes (knockout, gene silencing [voir wikipedia]) Pas garantie de résultats Il faut trouver la condition dans laquelle le gène s exprime Il faut réussir à observer le phénotype lié au gène ou à son inactivation Il existe souvent des voies alternatives pour compenser l inactivation d un gène Besoin de points de départs pour orienter les recherches 2
3 Que peut-on prédire de façon automatique? La fonction de la protéine (pas finement) C est un transporteur de sucre, mais du quel? Certains domaines fonctionnels Cette partie de la protéine se lie à l ATP (molécule énergétique) Les modifications post-traductionnelles C est une protéine O-glycosylée sur tel acide aminé Les structures 2D et 3D des protéines La localisation cellulaire de la protéine C est une protéine membranaire 3
4 Limite des connaissances (2008) En général, > 30% des gènes d un génome sont de fonction inconnue Exemple d une bactérie, Bacillus subtilis 16% des gènes similaires à d autres gènes de fonction inconnue 26% des gènes sans similarité Exemple de la levure 6400 gènes dont (39%) de fonction complètement inconnue. Il s'agit de l'un des organismes les plus étudiés du point de vue expérimental (génétique et biologie moléculaire). Son génome complet est disponible depuis Pour le génome humain, 60% des gènes sont complètement inconnus. Beaucoup de fonctions cellulaires sont encore à découvrir! 4
5 PRÉDICTION DE LA FONCTION DES PROTÉINES 5
6 Prédiction de la fonction Comparaison de séquence Pb : si la région trouvée ne couvre pas toute la protéine, est-ce qu il s agit de la région importante pour la fonction? Prédiction de domaines/motifs protéiques Pb : comment définir puis représenter ces domaines/motifs? Pb : comment les identifier sur une protéine inconnue? Motifs protéiques Résidus essentiels à une fonction conservée (site actif) Résidus pas nécessairement consécutifs sur la séquence primaire, mais proches dans la structure 3D Domaines protéiques Fragments de séquence contigus conservés dans une ou plusieurs familles Se replient indépendamment 6
7 Détection de régions conservées Processus pour définir un domaine/motif protéique Choix d une famille de protéines Recherche de toutes les séquences appartenant à cette famille Construction d un alignement multiple à partir de ces séquences Cas 1 : à partir de connaissances expérimentales Identification de la région ou des acides aminés essentiels à la fonction sur une ou plusieurs protéines Localisation de cette région dans l alignement Correction éventuelle de l alignement Cas 2 : par détection automatique Extraction de régions fortement conservées dans l alignement Etape finale Extraction de la région conservée puis modélisation 7
8 Un exemple : l hormone pancréatique (PP) Hormone peptidique produite par le prancréas Régule les fonctions pancréatiques et gastrointestinales Banques de domaines InterPro: IPR001955, Pancreatic hormone PROSITE: PS00265, PS50276, PDOC00238, PANCREATIC_HORMONE PFAM: PF00159, Pancreatic hormone peptide Entrées de structure 3D 1FP8 (voir ci-contre) 8
9 Prosite, une banque de motifs protéiques Créée en 1988 ( Motifs protéiques ayant une signification biologique particulière + documentation complète Deux représentations des motifs Matrice poids-position («profil») Pseudo-expression régulière («pattern») Construite manuellement But : aide à l annotation protéique Recherche la présence de motifs dans une séquence 9
10 Prosite par l exemple: l hormone pancréatique section technique: 2 entrées associées : l une représenté par un profil (PS50276), l autre par une pattern (PS500265), 10
11 Prosite par l exemple (1/2): l entrée PS
12 Matrice poids-position de l entrée PS
13 Alignement des vrai-positifs de PS50276 PROFIL: 13
14 Prosite par l exemple (2/2): l entrée PS
15 Alignement des vrai-positifs de PS00265 PATTERN : [FY]-x(3)-[LIVM]-x(2)-Y-x(3)-[LIVMFY]-x-R-x-R-[YF] 15
16 Qu est-ce qu un bon pattern? Pertinent d un point de vue biologique Représentatif de la fonction décrite : Suffisamment tolérant Pas de sur-adaptation (e.g. spécialisation vers une sous-famille) Limiter le nombre de faux négatifs Détecte toutes (ou presque) les séquences qui ont la fonction Suffisamment discriminant Limiter le nombre de faux positifs Ne détecte pas trop de séquences qui n ont pas la fonction recherchée Construction d un pattern A l aide du logiciel PRATT ( Puis amélioration à la main 16
17 Construction d un pattern selon Prosite 17
18 Modélisation par expression régulière (pattern) NEUY CARAU/29-64 AEE..LAKYYSALRHYINLITRQRY PYY HUMAN/29-64 PEE..LNRYYASLRHYLNLVTRQRY PMY PETMA/1-36 PEE..LSKYMLAVRNYINLITRQRY PPY LOPAM/1-36 PED..WASYQAAVRHYVNLITRQRY PAHO BOVIN/30-65 PEQ..MAQYAAELRRYINMLTRPRY PAHO CHICK/26-61 VED..LIRFYNDLQQYLNVVTRHRY PAHO ANSAN/1-36 VED..LRFYYDNLQQYRLNVFRHRY NPF HELAS/4-39 PNE..LRQYLKELNEYYAIMGRTRF NPF MONEX/1-39 DNKAALRDYLRQINEYFAIIGRPRF [FY]-x(3)-[LIVM]-x(2)-Y-x(3)-[LIVMFY]-x-R-x-R-[YF] 18
19 Vérification de la qualité du pattern PS00265 Recherche du pattern dans les protéines de SwissProt Trouvé dans 84 séquences 81 vrais positifs (hormones pancréatiques possédant le pattern) 3 faux positifs (protéines quelconques possédant le pattern) 7 faux négatifs (hormones sans pattern dont 6 tronquées) Sélectivité : 96,43 % Vrais positifs / (vrais positifs + faux positifs) Aptitude de la méthode à éviter les faux positifs Sensibilité : 92,05 % Vrais positifs / (vrais positifs + faux négatifs) Aptitude de la méthode à trouver les vrais positifs 19
20 Vérification de la qualité du pattern PS
21 Vérification de la qualité du pattern PS
22 Exemple de détection du pattern PS00265 La séquence NPF_ARTTR contre le pattern de l hormone pancréatique >NPF_ARTTR KVVHLRPRSSFSSEDEYQIYLRNVSKYIQLYGRPRF PS00265 YlrnVskYiqlYgRpRF 22
23 Construction d une matrice de poids (profil) Même point de départ : alignement multiple Calcul du poids de chaque acide aminé pour chaque position pertinente Fréquence de chaque acide aminé de la colonne Equivalence entre acides aminés Recherche d un profil dans une séquence : Fréquence de l acide aminé présent dans la séquence étudiée Somme des fréquences trouvées à chaque position Profil (motif) trouvé si la somme est supérieure à un seuil propre au profil 23
24 Point de départ : matrice des positions A D E F H I K L M N P Q R S T V W Y
25 Vers plus de souplesse Autoriser des insertions ou des délétions Ajout de pénalités particulières via une colonne supplémentaire Autoriser des substitutions (entre acides aminés voisins) Profil i,a = b f i,b M(a, b) M(a, b) : score entre les acides aminés a et b (PAM, BLOSUM,... ) f i,b : fréquence du b ième acide aminé dans la colonne i de l alignement multiple. 25
26 Exemple 26
27 Recherche d un profil Score : alignement entre le profil et la séquence Les pénalités de substitutions et de gaps sont données par le profil Seuil d admission : E-value Banque de référence : SwissProt 27
28 Vérification de la qualité du profil PS50276 Trouvé dans 82 séquences (tous vrais positifs) 6 faux négatifs (dont 6 séquences tronquées) Sélectivité (Precision): 100 % Vrais positifs / (vrais positifs + faux positifs) Aptitude de la méthode à éviter les faux positifs (dans ce cas, les 82 séquences trouvées sont toutes positives) Sensibilité (Recall): % Vrais positifs / (vrais positifs + faux négatifs) Aptitude de la méthode ne pas «rater» des bonne séquences. 28
29 Vérification de la qualité du profil PS
30 Vérification de la qualité du profil PS
31 Exemple de détection du profil PS50276 La séquence NPF_ARTTR contre le profil de l hormone pancréatique Score: Consensus 1 PE.EAALAKYYAALRHYINLITRQRY 25 : :: :::::: : :: : : NPF_ARTTR 13 SEDEY.YQIYLRNVSKYIQLYGRPRF 37 31
32 PFAM, une autre banque de motifs et domaines Gérée par le Sanger Intitute ( Construction et annotation automatiques des entrée Motifs et domaines représentés par des chaînes de Markov cachées (HMM) Permettent la modélisation des insertions-délétions Etapes de construction Mise en place à partir de séquences similaires Extension à des séquences de plus en plus éloignées 32
33 PFAM par l exemple: l hormone pancréatique 33
34 PFAM par l exemple: l hormone pancréatique 34
35 PFAM par l exemple: l hormone pancréatique 35
36 PFAM par l exemple: l hormone pancréatique 36
37 PFAM : Modélisation avec des HMM HMM = Hidden Markov Model = Modèle de Markov caché Un ensemble d états Des probabilités de transitions entre les états Un ensemble d observations Une probabilité d émission qui indique pour chaque état la probabilité d y émettre telle information 37
38 Profil HMM - alignement sans indel PPY_LOPAM/1-36 PEDWASYQAAVRHYVNLITRQRY PAHO_BOVIN/30-65 PEQMAQYAAELRRYINMLTRPRY PAHO_CHICK/26-61 VEDLIRFYNDLQQYLNVVTRHRY PAHO_ANSAN/1-36 VEDLRFYYDNLQQYRLNVFRHRY NPF_HELAS/4-39 PNELRQYLKELNEYYAIMGRTRF 1 observation = 1 acide aminé 1 état = 1 colonne de l alignement multiple émissions = fréquences de chaque a.a. 38
39 Profil HMM - alignement avec insertions Une insertion est un fragment de la séquence qui n apparait pas dans le modèle Nouvel état : insertion PPY_LOPAM/1-36 PED..WASYQAAVRHYVNLITRQRY PAHO_BOVIN/30-65 PEQ..MAQYAAELRRYINMLTRPRY PAHO_CHICK/26-61 VED..LIRFYNDLQQYLNVVTRHRY PAHO_ANSAN/1-36 VED..LRFYYDNLQQYRLNVFRHRY NPF_HELAS/4-39 PNE..LRQYLKELNEYYAIMGRTRF NPF_MONEX/1-39 DNKAALRDYLRQINEYFAIIGRPRF 39
40 Profil HMM - alignement avec délétions Une délétion est un fragment du modèle qui ne correspond à aucun acide aminé Ajout d états silencieux, qui n émettent rien PMY_PETMA/1-36 PEE..LSKYMLAVRNYINLITRQRY PPY_LOPAM/1-36 PED..WASYQAAVRHYVNLITRQRY PAHO_BOVIN/30-65 PEQ..MAQYAAELRRYINMLTRPRY PAHO_CHICK/26-61 VED..LIRFYNDLQQYLNVVTRHRY PAHO_ANSAN/1-36 VED..LRFYYDNLQQYRLNVFRHRY NPF_HELAS/4-39 PNE..LRQYLKELNEYYAIMGRTRF NPF_MONEX/1-39 DNKAALRDYLRQINEYFAIIGRPRF Q9PT97/29-62 AEE..LAKYYSALRHYINLITRQ.. 40
41 En résumé Etats matchants : colonnes avec moins de 50% de indel Etats d insertion : majorité de insertion (losange) Etats de délétion : majorité de deletion (rond) Probabilités d émission : nombre d occurrences de chaque acide aminé Probabilités de transition : nombre de séquences empruntant la transition Correction avec les pseudo-comptes : +1 à chaque compte (loi de Laplace) 41
42 Un exemple d occurrence du HMM La séquence NPF_ARTTR contre le HMM de l hormone pancréatique Alignments of top-scoring domains: hormone3: domain 1 of 1, from 3 to 36: score 48.4, E = 1.1e-13 *->ypskdfpenpgddaspeeelaqylralrqyinlitrpry<-* ++++ P++++s+E+e+++Ylr++++Yi+l++RpR+ 3 VHLR-----PRSSFSSEDEYQIYLRNVSKYIQLYGRPRF 36 Le HMM «Hormone_3» ou «Pancreatic hormone peptide» est trouvé dans 119 séquences de UniProt 42
43 Autres banques de domaines Blocks Segments multiples alignés sans insertions-délétions Régions les plus conservées des protéines Calibrage contre la banque SwissProt Description du domaine : alignement Prodom Recherche de blocs par comparaison de toutes les séquences de Uniprot deux à deux Annotation automatique Description du domaine : consensus (acide aminé le plus fréquent) 43
44 InterPro. Gérée par l EBI ( Contenu Superfamilles, familles, domaines, motifs, sites fonctionnels, modifications post-traductionnelles, structures 3D Regroupe plusieurs banques existantes Prosite, PFAM, Blocks, Prodom, Smart, Prints, TIGRFams, Superfamilly, SCOP, CATH, MSD Une entrée Description biologique détaillée Représentation de l objet par les différentes banques 44
45 InterPro : différents modèles et annotations Modèles utilisés Annotations produites 45
46 InterPro : objets biologiques et classification Objets biologiques : Famille, Domaine, Répétitions, Site Deux classifications hiérarchiques : Familles et Domaines (ATTENTION : 2 classifications indépendantes et ) 46
47 InterPro : objets biologiques 47
48 InterPro : les familles Une Famille Ensemble de protéines ayant une ou des fonctions proches, dues à leurs origine commune (inférée par similarité de structure et/ou séquence) Les Familles peuvent être organisées en une Hiérarchie 48
49 InterPro : les familles Exemple : famille GPCR kinases (IPR000239), sans hiérarchie dans 2 slides 49
50 InterPro : les domaines Un Domaine En règle générale : partie d une protéine qui se replie & reste stable (structure tertiaire) indépendamment du reste de la protéine Sauf que un Domaine InterPro peut être structurel mais aussi fonctionnel ou conservé au niveau séquence (fourre tout pratique ) Domaines : Hiérarchie possible (idem Familles). Protéines : domaines souvent organisés en «modules» Exemple : dans la famille GPCR kinases (IPR000239), un «module» de 4 domaines apparaît sur 119 protéines de cette famille sous cette forme : Regulator of G protein signalling (IPR000342) Protein kinase domain (IPR000719) AGC-kinase, Pleckstrin C-terminal homology (IPR000961) domain (IPR001849) 50
51 Organisation des domaines dans les familles 51
52 Organisation des domaines vs autres domaines Pour un domaine donné (ou ses fils dans la hierarchie), quels sont les domaines co-occurents dans les protéines? 52
53 Organisation des domaines vs autres domaines En Orange : protein kinase domain (ou ses fils dans la hiérarchie) 53
54 Organisation des domaines dans les proteines? En Orange : protein kinase domain (ou ses fils dans la hiérarchie) 54
55 InterPro par l exemple: l hormone pancréatique 55
56 InterPro par l exemple: l hormone pancréatique 56
57 InterPro par l exemple: l hormone pancréatique 57
58 InterPro par l exemple: l hormone pancréatique 58
59 InterPro par l exemple: l hormone pancréatique 59
60 InterPro par l exemple: l hormone pancréatique 60
61 InterPro : interface d'interrogation simple 61
62 InterProScan : interface d'interrogation 62
63 InterProScan : résutats [résumé] 63
64 InterProScan : résutats [entrée interpro] 64
65 Prédiction de la localisation cellulaire Prédiction de domaines transmembranaires Programmes basés sur l apprentissage à partir de protéines dont les domaines transmembranaires sont connus Critère principal : hydrophobicité des acides aminés TopPred [sur mobyle], TMHMM [cbs.dtu.dk], voir Prédiction de peptide signal Peptide signal : suite d acides aminés située au début d une protéine et indiquant à la machinerie cellulaire vers quel compartiment adresser la protéine Aussi basé sur l apprentissage (jeux d apprentissage spécifiques à un compartiment cellulaire) SignalP [cbs.dtu.dk], Prédictions de localisation cellulaire TargetP [cbs.dtu.dk], Psort [psort.org], voir (liste impressionnante!) 65
66 Prédiction de domaines transmembranaires (1/2) Exemple de résultat pour TopPred: 66
67 Prédiction de domaines transmembranaires (2/2) Exemple de résultat pour TM-HMM: 67
68 Prédiction de peptite signal (1/2) Exemple de résultat pour signalp-nn (NN = Neural Networks) voir 68
69 Prédiction de peptite signal (2/2) Exemple de résultat pour signalp-hmm: The common structure of signal is commonly described as a positively charged n-region, followed by a hydrophobic h-region and a neutral but polar c-region. voir 69
70 Localisation du peptite signal mtp, a mitochondrial targeting peptide SP, Secretory pathway voir 70
71 Localisation du peptite signal Loc Prediction of localization, based on the scores above; the possible values are: C Chloroplast, i.e. the sequence contains ctp, a chloroplast transit peptide; M Mitochondrion, i.e. the sequence contains mtp, a mitochondrial targeting peptide; S Secretory pathway, i.e. the sequence contains SP, a signal peptide; _ Any other location; * "don't know"; indicates that cutoff restrictions were set (see instructions) and the winning network output score was below the requested cutoff for that category. RC Reliability class, from 1 to 5, where 1 indicates the strongest prediction. RC is a measure of the size of the difference ('diff') between the highest (winning) and the second highest output scores. There are 5 reliability classes, defined as follows: 1 : diff > : > diff > : > diff > : > diff > : > diff 71
72 Etude des structures 2D et 3D
73 Prédiction de la structure des protéines Nbre protéines dans les banques (UniProt : ) >> Nbre structures 3D expérimentales (PDB : ) Besoin de logiciels de prédiction Efforts pour déterminer expérimentalement plus de structures 3D Difficultés de prédiction : Pas de règle simple d interactions entre acides aminés Des homologues distants peuvent avoir des structures proches Grande variété de structures 73
74 Prédiction de structure 2D Localisation des éléments de base de structure 2D Hélices α, feuillets β, boucles Reconnaissance de motifs Basée sur des règles de construction des éléments de base et l enchaînement de ces éléments dans les protéines Méthodes statistiques Apprentissage à partir d alignements multiples de séquences impliquées dans une hélice ou un feuillet (protéines de structure 3D connue) Résultats : en moyenne 70% des aa bien prédits 74
75 Exemple de prédiction 2D (site NPSA) KAERKRMRNRIAASKSRKRKLERIARLEEKVKTL Réel HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH DSC hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh MLRC hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh PHD hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh Consensus hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh KAQNSELASTANMLREQVAQLKQKVMNH HHHHHHHHHHHHHHHHHHHHTT hhcchhhhhhhhhhhhhhhhhhhhhhhh hhchhhhhhhhhhhhhhhhhhhhhhhhh hhcchhhhhhhhhhhhhhhhhhhhhhhh hhcchhhhhhhhhhhhhhhhhhhhhhhh AP1_human ( ) 75
76 Exemple de prédiction 2D (PSIPRED) 76
77 Prédiction de structure 3D Modélisation 3D à partir d un homologue Recherche des séquences proches dans PDB Repliement de la seq inconnue à l aide de la structure connue Enfilage (threading) Banques représentatives des topologies de base Repliement de la seq dans chaque structure et sélection de la structure la plus probable Qualité de la prédiction Très variable selon la séquence étudiée Maximum entre 60 et 70% de bonne prédiction 77
78 Format des fichiers de structure 3D Ce sont des fichiers textes Format PDB (Brookhaven) : En-tête avec des informations générales sur les molécules modélisées (éventuellement leur structure 2D) Coordonnées des atomes qui composent la structure ATOM = atome de la protéine HETATM = HETeroAToM = atome des cofacteurs, substrats, ions,... lié à la protéine mmcif (macromolecular Crystallographic Information Format) HEADER NEUROPEPTIDE 09-JUL-04 1TZ4 TITLE [HPP19-23]-PNPY BOUND TO DPC MICELLES COMPND MOLECULE: PANCREATIC HORMONE; SEQRES 1 A 37 TYR PRO SER LYS PRO ASP ASN... SEQRES 2 A 37 ALA GLU ASP LEU ALA GLN TYR... SEQRES 3 A 37 TYR ILE ASN LEU ILE THR ARG... ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM N C C O C C C C C C C
79 Annotation au niveau de l organisme Le but est de voir plus loin qu un gène ou une protéine isolée
80 Quelles sont toutes les fonctions cellulaires? Difficile de faire la liste de toutes les fonctions cellulaires Elles sont nombreuses Elles varient selon les organismes Pas de relation simple entre protéine (ou autre) et fonction Une protéine plusieurs fonctions (n domaines, selon le contexte) Une fonction plusieurs protéines (complexes, duplications) Relations différentes selon les organismes Existence de nombreux noms pour une même fonction Besoin de créer une ontologie pour avoir une description universelle des fonctions cellulaires
81 Une nomenclature pour les enzymes : EC Créée dans les années 60 et mise à jour régulièrement Décrit toutes les fonctions enzymatiques connues à l aide d un code en quatre parties (EC ) Les 6 classes principales, les sous-classes, les sous-sous-classes, le numéro de série Les 6 classes principales : Classe 1 : Oxydoréductases Classe 2 : Transférases Classe 3 : Hydrolases Classe 4 : Lyases Classe 5 : Isomérases Classe 6 : Ligases
82 Une nomenclature générale : Gene Ontology Créée fin 90 et mise à jour régulièrement But : fournir un vocabulaire contrôlé applicable à tout organisme, même si les connaissances sur les rôles des gènes et des protéines évoluent constamment. 3 dictionnaires structurés Processus cellulaires Ex : Polarité de l axe antéro-postérieur, Glycolyse, Fonctions moléculaires Ex : Facteur de transcription, Enzyme, Composants cellulaires Ex : Noyau, Cytoplasme, Membrane, Complexe moléculaire,
83 Les processus cellulaires 4 grands types de processus cellulaires : Voies métaboliques Réseaux de régulation Transduction de signaux Transports membranaires Les autres processus cellulaires Synthèse des protéines (transcription, traduction, ) Réplication de l ADN Division cellulaire (mitose / méiose) Structure de la cellule (cytosquelette, membrane)
84 Exemples d ontologies Composants cellulaires Fonctions moléculaires Processus cellulaires
85 MetaCyc, une banque de voies métaboliques Banque de données de voies métaboliques non redondantes et découvertes expérimentalement, couvrant plus de 2460 organismes Schémas des voies (une voie par organisme) Informations sur les enzymes, protéines, gènes et composés Informations sur la régulation des gènes La banque la plus complète concerne E. coli
86 Metacyc : la voie de synthèse du tryptophane (E. coli) Produits Produits+Enzymes/Gènes/EC+régulation
87 Metacyc : la voie de synthèse du tryptophane (E. coli) trpe, trpd trpd trpc trpa trpc trpb trpx : gènes Source : Metacyc
88 Metacyc : les gènes liés à cette voie (E. coli) Localisation sur le génome Régulation L opéron trp Source : Metacyc
89 Comparaison des «voies du tryptophane» Escherichia coli trpe, trpd trpd trpc trpc trpa trpb 2 protéines 1 fonction (complexe) 1 protéine 2 fonctions Bacillus subtilis 2 protéines 1 fonction (duplication possible) trpe, paba trpd ynai / trpf trpc trpa trpb 2 protéines 2 fonctions
90 Comparaison de la localisation des gènes trp Escherichia coli Bacillus subtilis
91 Recherche d un gène ayant une fonction donnée Première méthode : Trouver une protéine ayant cette fonction chez un organisme proche de celui étudié, Rechercher cette protéine sur le génome à l aide de BlastX. Inconvénient : il faut bien choisir la protéine qui sert de sonde. Deuxième méthode : Trouver un (ou plusieurs) motif(s)/domaine(s) protéique(s) qui caractérise(nt) la fonction recherchée. Rechercher ce(s) motif(s)/domaine(s) sur la séquence génomique traduite dans les 6 phases de lecture. Inconvénient : très long! Est-ce que ce «travail» n est pas déjà fait?
92 Les banques de connaissances, KEGG KEGG : Kyoto Encyclopedia of Genes and Genomes Les données sont représentées sous la forme : de Graphes Listes de voisinages / Matrices de voisinages / Graphes (nœud = objet, arrête = interaction) d Arbres / DAG Hiérarchies 15 banques de données liées
93 Les banques de KEGG
94 KEGG : Pathways Construction manuelle des schémas métaboliques D après les publications Le schéma pour une voie représente toutes les alternatives possibles Les organismes n utilisent pas tous les même réactions pour aboutir au même composé chimique Les gènes pour un organisme donné sont colorés dans le schéma général Lien entre gène et fonction de la protéine codée par le gène
95 Un exemple de schéma de KEGG Assemblage du flagelle Source : KEGG
96 Un exemple de schéma de KEGG [1] [2] Assemblage du flagelle Source : KEGG
97 Un exemple de hiérarchie fonctionnelle BRITE [1] Assemblage du flagelle Source : KEGG
98 Un exemple de table d orthologues de KEGG [2]
99 SIMULATION DYNAMIQUE DES RÉSEAUX CELLULAIRES
100 Limites des représentations statiques Difficiles à lire Besoin de commentaires pour comprendre le fonctionnement du réseau cellulaire Pas de simulation possible + X + Y -
101 Avantage des représentations dynamiques Le fonctionnement complet du réseau est simulé Besoin de formaliser les connaissances Mise en place d aller-retour entre simulation et expérimentation Découverte d étapes manquantes pour que le réseau fonctionne Recherche des molécules effectuant ces étapes dans la cellule Simulations dans différentes conditions Variation des points d entrée du réseau Simulation de mutations (inactivation, sur-expression, ) Disfonctionnements (maladie, élément perturbateur, )
102 Limites des représentations dynamiques Besoin de nombreuses données expérimentales Seuils de concentration des molécules impliquées : Passage de l état actif à l état inactif Plus le réseaux compte de partenaires, plus il est difficile à simuler Trop de variables à prendre en compte Besoin des connaissances en biologie ET en informatique ou mathématique Nécessite la mise en place de collaborations étroites entre équipes de différentes disciplines (cela prend du temps)
103 Généralités sur les réseaux de régulation Un réseau (ou circuit) est un ensemble d interactions Les composants d un réseau cellulaire peuvent être des molécules biologiques ou d autres stimuli (lumière, chaleur, ) Une interaction = effet d un composant sur un autre composant du réseau Un réseau de régulation concerne les gènes et leurs produits, mais aussi la concentration en une molécule,
104 Les circuits positifs Nombre paire (voire nul) d interactions négatives X + + Y X - - Y [X] et [Y] augmentent [X] ou [Y] augmente X ou Y ont un effet positif sur eux-mêmes Ces circuits sont impliqués dans la différentiation cellulaire ou la mémoire.
105 Les circuits négatifs Nombre impaire d interactions négatives X - X Y - + [X] stable [X] et [Y] stables X et Y ont un effet négatif sur eux-mêmes Ces circuits sont impliqués dans le maintient d un état stable, dans l homéostasie
106 La simulation par réseaux booléens Réseau booléen = Graphe orienté Nœud = molécule biologique (gène, protéine, ) ou stimulus (lumière, ) Arrête = fonction booléenne (2 valeurs : 0/1, transcrit/non transcrit, présent/absent, ) Définition du graphe et des tables de vérités Schéma des interactions entre éléments du réseau Successions des états possibles du système Construction du graphe d états Les chemins possibles dans le graphe descriptif Découverte des états stables : soit un cycle, soit un point fixe
107 La simulation par équations différentielles Les équations différentielles sont des égalités faisant intervenir des fonctions et leurs dérivées Les dérivées représentent la variation de concentration d une molécule (dx) dans un laps de temps dt. L équation représente les différents éléments qui agissent sur la concentration de la molécule Limites : il faut connaître les concentrations pour résoudre les équations. Possibilité : estimation des paramètres.
Formavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...
Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au
Plus en détailCHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Plus en détailIntroduction aux bases de données: application en biologie
Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,
Plus en détailChapitre 7 : Structure de la cellule Le noyau cellulaire
UE2 : Structure générale de la cellule Chapitre 7 : Structure de la cellule Le noyau cellulaire Professeur Michel SEVE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits
Plus en détailIdentification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Plus en détail! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)
Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de
Plus en détailINTRODUCTION À L'ENZYMOLOGIE
INTRODUCTION À L'ENZYMOLOGIE Les enzymes sont des macromolécules spécialisées qui - catalysent les réactions biologiques - transforment différentes formes d'énergie. Les enzymes diffèrent des catalyseurs
Plus en détailDr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires
Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique
Plus en détailIMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques
IMMUNOLOGIE La spécificité des immunoglobulines et des récepteurs T Informations scientifiques L infection par le VIH entraîne des réactions immunitaires de l organisme qui se traduisent par la production
Plus en détailBibliographie Introduction à la bioinformatique
Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A
Plus en détailPrédiction de la structure d une
Prédiction de la structure d une protéine Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Les structures protéiques
Plus en détailMABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Plus en détailSéquence 2. L expression du patrimoine génétique. Sommaire
Séquence 2 L expression du patrimoine génétique Sommaire 1. La synthèse des protéines 2. Phénotypes, génotypes et environnement Synthèse de la séquence 2 Exercices de la séquence 2 Glossaire des séquences
Plus en détailMASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailBig data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme
Plus en détailLeslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr
Programmation avec R Polycopié d exercices Leslie REGAD ; Gaëlle LELANDAIS leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr Ce polycopié rassemble différents exercices vous
Plus en détailULBI 101 Biologie Cellulaire L1. Le Système Membranaire Interne
ULBI 101 Biologie Cellulaire L1 Le Système Membranaire Interne De la nécessité d un SMI Le volume augmente comme le cube de la dimension linéaire, alors que la surface n'est augmentée que du carré Une
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailTD de Biochimie 4 : Coloration.
TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailModélisation multi-agents - Agents réactifs
Modélisation multi-agents - Agents réactifs Syma cursus CSI / SCIA Julien Saunier - julien.saunier@ifsttar.fr Sources www-lih.univlehavre.fr/~olivier/enseignement/masterrecherche/cours/ support/algofourmis.pdf
Plus en détailDes applications locales à l infonuagique: comment faire la transition?
: comment faire la transition? Congrès des milieux documentaires 30 novembre 2011 / m.sevigny@umontreal.ca Directeur Bureau des systèmes Direction des bibliothèques - UdeM 2 / 15 Plan de la présentation
Plus en détailMise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC
Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr CATI BBRIC 35 bioinformaticiens
Plus en détailCellules procaryotes Service histologie Pr.k.mebarek
Cellules procaryotes Service histologie Pr.k.mebarek I) Les cellules procaryotes II) Les cellules eucaryotes o 1) Caractéristiques générales des cellules eucaryotes o 2) Organisation des cellules eucaryotes
Plus en détail3: Clonage d un gène dans un plasmide
3: Clonage d un gène dans un plasmide Le clonage moléculaire est une des bases du génie génétique. Il consiste à insérer un fragment d'adn (dénommé insert) dans un vecteur approprié comme un plasmide par
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailLA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE
Biologie LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE Février 2006 I. L'INTRODUCTION Chaque cellule d'un organisme supérieur provient de la multiplication d'une cellule préexistante (cellule
Plus en détailLa reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006
La reconnaissance moléculaire: la base du design rationnel En 1890 Emil Fisher a proposé le modèle "serrure et clé" pour expliquer la façon de fonctionner des systèmes biologiques. Un substrat rentre et
Plus en détailTransport des gaz dans le sang
UE3-2 - Physiologie Physiologie Respiratoire Chapitre 9 : Transport des gaz dans le sang Docteur Sandrine LAUNOIS-ROLLINAT Année universitaire 2011/2012 Université Joseph Fourier de Grenoble - Tous droits
Plus en détailLes cytokines et leurs récepteurs. Laurence Guglielmi laurence.guglielmi@univ-montp1.frli
Les cytokines et leurs récepteurs Laurence Guglielmi laurence.guglielmi@univ-montp1.frli l i@ i 1 Les cytokines et leurs récepteurs 2 mécanismes principaux d interactions cellulaires : - contact membranaire
Plus en détailLes OGM. 5 décembre 2008. Nicole Mounier
Les OGM 5 décembre 2008 Nicole Mounier Université Claude Bernard Lyon 1 CGMC, bâtiment Gregor Mendel 43, boulevard du 11 Novembre 1918 69622 Villeurbanne Cedex OGM Organismes Génétiquement Modifiés Transfert
Plus en détailLes bases de données
Les bases de données Introduction aux fonctions de tableur et logiciels ou langages spécialisés (MS-Access, Base, SQL ) Yves Roggeman Boulevard du Triomphe CP 212 B-1050 Bruxelles (Belgium) Idée intuitive
Plus en détailJournée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique
Monitorint spatio-temporel intégré de la mobilité urbaine Monitoring spatio-temporel de l ADN urbain Une réponse aux défis, problèmes, enjeux et risques des milieux urbains Nicolas Lachance-Bernard M.ATDR
Plus en détailAnalyse,, Conception des Systèmes Informatiques
Analyse,, Conception des Systèmes Informatiques Méthode Analyse Conception Introduction à UML Génie logiciel Définition «Ensemble de méthodes, techniques et outils pour la production et la maintenance
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailLa gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailÉvaluation et implémentation des langages
Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailPerl Orienté Objet BioPerl There is more than one way to do it
Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels
Plus en détailDe la physico-chimie à la radiobiologie: nouveaux acquis (I)
De la physico-chimie à la radiobiologie: nouveaux acquis (I) Collaboration: - Laboratoire de Radiotoxicologie et Oncologie (L. Sabatier) CEA, DSV - Laboratoire de Génotoxicité et Modulation de l Expression
Plus en détailInformation génétique
chapitre 3 Information génétique et division cellulaire L étude de la division cellulaire est abordée pour découvrir comment est transmise et conservée l information génétique portée par les chromosomes.
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailCOUSIN Fabien KERGOURLAY Gilles. 19 octobre 2007. de l hôte par les. Master 2 MFA Responsable : UE Incidence des paramètres environnementaux
COUSIN Fabien KERGOURLAY Gilles 19 octobre 2007 Inhibition des défenses de l hôte par les bactéries pathogènes Master 2 MFA Responsable : UE Incidence des paramètres environnementaux Gwennola ERMEL I Détection
Plus en détailExemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions
Exemple accessible via une interface Web Une base de données consultable en ligne : Bases de données et systèmes de gestion de bases de données The Trans-atlantic slave trade database: http://www.slavevoyages.org/tast/index.faces
Plus en détailI. La levure Saccharomyces cerevisiae: mode de vie
LES LEVURES UE «levures» -5 avril: généralités (MN Simon) -6 avril: analyse génétique (MN Simon) -6 avril: Cycle cellulaire I: la réplication (E. bailly) -7 avril: Cycle cellulaire II: la mitose (E. Bailly)
Plus en détailUn laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège
Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège Immunofluorescence Dépistage Aspect Titre Cellules Hep 2: Connectivites
Plus en détailTP N 3 La composition chimique du vivant
Thème 1 : La Terre dans l'univers, la vie et l'évolution du vivant : une planète habitée Chapitre II : La nature du vivant TP N 3 La composition chimique du vivant Les conditions qui règnent sur terre
Plus en détailLE MODELE CONCEPTUEL DE DONNEES
LE MODELE CONCEPTUEL DE DONNEES Principe : A partir d'un cahier des charges, concevoir de manière visuelle les différents liens qui existent entre les différentes données. Les différentes étapes de réalisation.
Plus en détailConférence technique internationale de la FAO
Décembre 2009 ABDC-10/7.2 F Conférence technique internationale de la FAO Biotechnologies agricoles dans les pays en développement: choix et perspectives pour les cultures, les forêts, l élevage, les pêches
Plus en détailTransport des gaz dans le sang
UE3-2 - Physiologie Physiologie Respiratoire Chapitre 9 : Transport des gaz dans le sang Docteur Sandrine LAUNOIS-ROLLINAT Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détail1 les caractères des êtres humains.
Quelques rappels des classes précédentes ACTIVITÉ livre pages 8 et 9 : apprendre le bilan de la page 9 Les êtres vivants sont répartis en espèces. Chaque être vivant est formé de cellules. schéma d une
Plus en détailGestion obligataire passive
Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage
Plus en détailLearning Object Metadata
Page 1 of 7 Learning Object Metadata Le LOM (Learning Object Metadata), est un schéma de description de ressources d enseignement et d apprentissage. Le LOM peut être utilisé pour décrire des ressources
Plus en détailLangage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes
Langage SQL (1) Sébastien Limet Denys Duchier IUT Orléans 4 septembre 2007 Notions de base qu est-ce qu une base de données? SGBD différents type de bases de données quelques systèmes existants Définition
Plus en détailDeuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1
Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1 V. Fiolet Université de Mons-Hainaut 2006-2007 Nous allons aujourd hui nous intéresser à la tâche de classification
Plus en détailINTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Plus en détailArchived Content. Contenu archivé
ARCHIVED - Archiving Content ARCHIVÉE - Contenu archivé Archived Content Contenu archivé Information identified as archived is provided for reference, research or recordkeeping purposes. It is not subject
Plus en détailLe rôle de l endocytose dans les processus pathologiques
UE7 Cours n 9 C. LAMAZE 24.11.11 Elise GODEAU (partie1) Guillaume MERGENTHALER (partie2) Le rôle de l endocytose dans les processus pathologiques SOMMAIRE : I. L endocytose à récepteurs : la voie des clathrines
Plus en détailSéquence 1. Glycémie et diabète. Sommaire
Séquence 1 Glycémie et diabète Sommaire 1. Prérequis 2. La régulation de la glycémie 3. Le diabète 4. Synthè se 5. Glossaire 6. Exercices Exercices d apprentissage du chapitre 2 Exercices d apprentissage
Plus en détailAlgorithmique répartie
Université Joseph Fourier 23/04/2014 Outline 1 2 Types de communication message envoyé à un groupe de processus Broadcast (diffusion) message envoyé à tous les processus du systèmes Unicast message envoyé
Plus en détailMaster de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant
Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master
Plus en détailSection «Maturité fédérale» EXAMENS D'ADMISSION Session de février 2014 RÉCAPITULATIFS DES MATIÈRES EXAMINÉES. Formation visée
EXAMENS D'ADMISSION Admission RÉCAPITULATIFS DES MATIÈRES EXAMINÉES MATIÈRES Préparation en 3 ou 4 semestres Formation visée Préparation complète en 1 an 2 ème partiel (semestriel) Niveau Durée de l examen
Plus en détailLogement pris en gestion par une Société de Logement de Service
Logements pris en gestion par les Sociétés de Logement de Service Public (SLSP) INFORMATIONS GÉNÉRALES Ce fichier reprend les informations concernant les logements n appartenant pas aux Sociétés de Logement
Plus en détailLe Langage SQL version Oracle
Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI anis.bach@isg.rnu.tn
Plus en détailORIGINE ET DIFFERENTS TYPES DE RYTHMES BIOLOGIQUES. Carine Bécamel carine.becamel@igf.cnrs.fr 04 67 14 29 83
ORIGINE ET DIFFERENTS TYPES DE RYTHMES BIOLOGIQUES Carine Bécamel carine.becamel@igf.cnrs.fr 04 67 14 29 83 INTRODUCTION Rythmes biologiques: définition Tout être vivant (humain, animal, végétal) est soumis
Plus en détailCHAPITRE 2 : Structure électronique des molécules
CHAPITRE 2 : Structure électronique des molécules I. La liaison covalente 1) Formation d une liaison covalente Les molécules sont des assemblages d atomes liés par des liaisons chimiques résultant d interactions
Plus en détailBig data : vers une nouvelle science des risques?
Big data : vers une nouvelle science des risques? Serge Abiteboul INRIA et ENS Cachan Conseil national du numérique et Académie des sciences Big data et science des risques 1 Organisation Big data en bref
Plus en détailRésonance Magnétique Nucléaire : RMN
21 Résonance Magnétique Nucléaire : RMN Salle de TP de Génie Analytique Ce document résume les principaux aspects de la RMN nécessaires à la réalisation des TP de Génie Analytique de 2ème année d IUT de
Plus en détailMise en place d'une démarche qualité et maintien de la certification ISO 9001:2008 dans un système d'information
Mise en place d'une démarche qualité et maintien de la certification ISO 9001:2008 dans un système d'information IMGT The international ImMunoGeneTics information system Joumana Jabado-Michaloud IE Bioinformatique,
Plus en détailTHEME : CLES DE CONTROLE. Division euclidienne
THEME : CLES DE CONTROLE Division euclidienne Soit à diviser 12 par 3. Nous pouvons écrire : 12 12 : 3 = 4 ou 12 3 = 4 ou = 4 3 Si par contre, il est demandé de calculer le quotient de 12 par 7, la division
Plus en détailTravaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015
Andrew Tolonen atolonen@genoscope.cns.fr Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015 A- Généralités I- La vie sur terre telle que nous la connaissons ne
Plus en détailTD 1 - Structures de Traits et Unification
TD 1 - Structures de Traits et Unification 1 Définitions Un trait (en: feature) est un couple attribut-valeur. Une structure de traits (en: feature structure) est un ensemble de traits. On peut les représenter
Plus en détailANTICORPS POLYCLONAUX ANTI IMMUNOGLOBULINES
L OUTIL IDEAL POUR TOUTES LES DETECTIONS IMMUNOCHIMIQUES pour toutes les techniques immunodosages (EIA/ELISA) dot/ westernblot immunohistochimie immunocytochimie cytométrie en flux quel que soit le système
Plus en détailGénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010
GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection
Plus en détailApprentissage statistique dans les graphes et les réseaux sociaux
Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique
Plus en détailSystèmes et algorithmes répartis
Systèmes et algorithmes répartis Tolérance aux fautes Philippe Quéinnec Département Informatique et Mathématiques Appliquées ENSEEIHT 4 novembre 2014 Systèmes et algorithmes répartis V 1 / 45 plan 1 Sûreté
Plus en détailL UNIVERS INSTANTANÉ:
L UNIVERS INSTANTANÉ: Samy Benzekry Speaker Name Title 2011 Hewlett-Packard Development Company, 2010 L.P. Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
Plus en détailIntégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux
Plus en détailConception de Médicament
Conception de Médicament Approche classique HTS Chimie combinatoire Rational Drug Design Ligand based (QSAR) Structure based (ligand et ou macromolec.) 3DQSAR Docking Virtual screening Needle in a Haystack
Plus en détailvoies de signalisation
Olivier Lascols Faculté de Médecine ierre et Marie Curie Généralités s sur les voies de signalisation 1 I. Caractérisation risation d une d voie de transduction d un d signal Exemple du Signal Mitogénique
Plus en détailSemestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»
Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailRespiration Mitochondriale
Université Pierre et Marie Curie Respiration Mitochondriale Objectifs au cours de Révisions Biochimie PCEM2 Révisions Biochimie Métabolique 2004-2005 Pr. A. Raisonnier (alain.raisonnier@upmc.fr) Mise à
Plus en détailRègles d engagement. Présentation Diapositives Bibliographie Questions Les vertus de la marche
Règles d engagement Présentation Diapositives Bibliographie Questions Les vertus de la marche Plan Rappels sur l agilité Scrum : une implantation de l agilité Scrum ou XP? Conclusion Historique sélectif
Plus en détailBTS/CGO P10 SYSTEME INFORMATION Année 2012-2013
BTS/CGO P10 SYSTEME INFORMATION Année 2012-2013 TS2 CGO 7 mars 2013 2 heures Aucun document autorisé Calculatrice autorisée Nota : Il vous est demandé d apporter un soin particulier à la présentation de
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailRÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition
RELÈVE SCIENTIFIQUE AU SERVICE 2 e édition Juin 2011 Réalisé par : Partenaire financier du CQVB : Objectif : Ce répertoire vise à faciliter le maillage entre les étudiants-chercheurs universitaires et
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailCompte-rendu re union Campus AAR 3 mars 2015
Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse
Plus en détailchoisir H 1 quand H 0 est vraie - fausse alarme
étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts
Plus en détailAcquisition des données - Big Data. Dario VEGA Senior Sales Consultant
Acquisition des données - Big Data Dario VEGA Senior Sales Consultant The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated
Plus en détailProduction d une protéine recombinante
99 Production d une protéine recombinante Lic. B. PIRSON Lic. J-M. SERONT ISICHt - Mons Production de la protéine recombinante GFP (Green Fluorescent Protein d Aequoria victoria) par une bactérie ( E.
Plus en détailCombinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux
Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux Jean-Baka Domelevo Entfellner To cite this version: Jean-Baka
Plus en détailChaînes de Markov au lycée
Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat
Plus en détailJEAN-LUC VIRUÉGA. Traçabilité. Outils, méthodes et pratiques. Éditions d Organisation, 2005 ISBN : 2-7081-3260-1
JEAN-LUC VIRUÉGA Traçabilité Outils, méthodes et pratiques, 2005 ISBN : 2-7081-3260-1 2 à l assurance qualité Après la définition de la traçabilité dans la métrologie, on peut remarquer que le domaine
Plus en détailGestion des transactions et accès concurrents dans les bases de données relationnelles
Gestion des transactions et accès concurrents dans les bases de données relationnelles Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Fev.
Plus en détail