ARN et bioinformatique: PDF processed with CutePDF evaluation edition
|
|
- Heloïse Laframboise
- il y a 8 ans
- Total affichages :
Transcription
1 ARN et bioinformatique: Partie 1 PDF processed with CutePDF evaluation edition
2 Sommaire Principes biologiques : Transcription/traduction, types d ARN, formes primaires/secondaires. Zuker - Jacobson
3 Biologie ADN => ARN => Protéine ADN = Information ARN = Forme intermédiaire Protéine = Résultat
4 Biologie Transcription = Processus qui transforme l ADN en ARN Traduction = Processus qui transforme l ARN en protéine. Ce ne sont pas toutes les ARN qui sont traduit en protéine => les ARN ont parfois des fonctions autres qu être un stade intermédiaire.
5
6
7 Traduction en bref La traduction = Interprétation des codons de l ARNm en acides aminés (donc protéine ) ARNm = ARN messager, copie sélective d un fragment d ADN, vecteur de l information génétique. Codon = Séquence de trois nucléotides ( AGC, GGA, etc)
8
9 Exemple ADN: ARNm: ATG TTC CAT GCC TGA AUG UUC CAU GCC UGA Met- Ser- His- Ala- STOP
10 Ribosomes Leurs fonction est de synthétiser les protéines en décodant l'information contenue dans l'arn messager «Lecteur» de l ARNm, deux rôles majeurs Fixe la fenêtre de lecture Crée le lien entre les acide aminés transporté par les ARNt
11 ARNt (transfert) Permet la liaison entre l information de l ARNm et le ribosome. Chaque ARNt a un anti-codon et un acide aminé Anti-codon : trois nucléotides qui se fixe à un codon complémentaire Suite à sa fixation, l ARNt libére sont acide aminé et quitte.
12
13 Les autres rôles Régulations des gènes Rôle dans le cerveau? (Piaget 1967, Traill, R.R 2005 ) Double utilisation ( ARN et protéine ) 97% font quelque chose (Mattick, J.S ) mais quoi?
14 ARNnc L ARN est composé d une séquence de nucléotides qui s associent entre eux de manière à formé des structures spécifiques, appelé «Forme secondaires» Quatre bases nucléotides : {A, C, G, U} Règles d association: G-C, A-U, G-U, autres
15 Formes secondaires La forme secondaire est obtenue par le repliement de la forme primaire en respectant les règles d associations ACGUGCCACGAUUCAACGUGGCACAG
16 Formes secondaires La fonction d un farn et strictement lié à sa forme secondaire et tertiaire. La prédiction de ceux-ci = Important pour déterminer fonction ( 97% inconnus )
17 Formes secondaires Il existe plusieurs configurations non-standards qui stabilisent une structure d ARN Single strand, bulge loop, hairpin loop, interior loop, multi-branched loop, pseudoknot
18 Structure non-standard
19 Pseudoknot
20 En math
21 En bref
22 Homologie L évolution fonctionne par petit pas Évolutionnaire, pas révolutionnaire Donc, deux séquences quasi identiques ont probablement un ancêtre commun => On dit qu elles sont «Homologues» GUGCAC => GUGCGC Mais, L ARN est souvent homologue de sa structure secondaire.
23 Covariance Si un élément d une pair stable mute, l autre éléments va souvent muter. On appelle cela la covariance GUGCAC =>
24 Prédiction de forme secondaires Minimisation de l énergie libre Analyse de covariance Recherche d ARN homologue
25 Au début
26 Nussinov-Jacobson Très mauvais résultat Conclusion? Forme secondaire ne maximise les pairs de bases La forme = fonction, certain structure sont recherché
27 Minimisation de l énergie libre Prédiction de structure secondaire à partir d une séquence. Basé sur le fait que le repliement d un ARN est dicté en grande partie(?) par la biophysique Une pair de base va diminuer l énergie libre, tandis qu une structure non conforme va l augmenter
28 Zuker-Stiegler folding algorithm Programmation dynamique qui calcul l énergie libre minimal en additionnant un facteur multiplicatif pour des pairs de bases multiples Les valeurs des structures non-standards (hairpin loop, etc ) ont été déterminés par des expériences de thermodynamique sur des petites structures ARN Problème : La nature n est pas optimal, souvent la structure réel ne l est pas non plus
29
30
31
32
33
34
35
36
37
38 Suboptimal Zuker algorithm Génère les structures d énergies minimal possible considérant une pair de base i,j aléatoire non-optimal. Utilise une variation d énergie comme mesure de distance/d arrêt Nécessaire
39
40 Fonction de partition et conclusion McCaskill algorithme : Transforme l énergie calculé en probabilité que la pair de base existe L information a une variété d utilisation Toutes les méthodes de prédiction sur une seul séquence sont relativement inefficaces ( 20-60% )
41 Remerciement Eva Freyhult, Upsalla center of bioinformatics
42 ARN et bioinformatique: Partie 2
43 Sommaire Rappel Prédiction par comparaison Recherche d ARN CM Stem Kernel
44 En bref
45 Alignement multiple Normalement utile pour déterminer l homologie de séquences ( en autre ) Mais l ARN peut-être homologue par sa structure primaire ou secondaire!
46 Alignement multiple Alors deux séquences très différentes peuvent êtres homologues ou pas. Rechercher via la primaire fausse les résultats De même pour la secondaire
47 Exemple de covariation AGCCAUGCU => AGACAUUCU
48 Shannon théorie : Comparaison F =1/4 => (R,Y) = 1 bit (N) = 0 bit ( A) = 2 bit (PB) = 2 bit Primaire = 6 bit d information => 2^6 => 1 par 64 nucléotides Primaire & Secondaire = +14 bits => 2^20 => 1 par million
49 Structure secondaire Important de connaître les deux pour avoir un alignement de qualité L importance de la structure secondaire facilite ca prédiction si un alignement multiple est disponible. Pour avoir un alignement multiple valide, il faut connaitre la structure secondaire consensus. Poule et Œuf..
50 Covariation La covariation aide à Déduire la structure secondaire en observant les variations de l alignement primaire Déduire les zones conservés de la primaire en se fiant sur les paires de bases de la secondaire.
51 Représentation Utile de pouvoir représenté la structure primaire et secondaire d un ARN dans un modèle Première découverte: les arbres ordonnés!
52 Analyse manuelle Méthode manuelle Processus itératif Raffinement successif des modèles Meilleurs résultats Problèmes Difficile Nécessite expertise Long
53 Analyse manuelle 1) Alignement de séquences ARN homologues Comparer avec séquence consensus Noter transitions et transversions Déterminer structure secondaire possible 2) Alignement multiple ( chap 5 ) Voir différence et modifier alignement via structure secondaire
54 Analyse manuelle 3) Noter les colonnes différence du consensus Vérifier pour structure secondaire possible 4) Analyse statistique ( Chi-Square ) Nombre de pair de base de (i,j) versus la prévision
55 Analyse manuelle 5) Calcul du score d information mutuel pour chaque pair de colonne
56 Analyse manuelle 6) Mesurer la covariance de chaque pair de positions Compter les combinaisons, diviser par combinaison aléatoire 7) Déterminer les covariations les plus communes Utiliser les nouvelles informations pour raffiner la structure secondaire Recommencer
57 Analyse automatique Méthode manuelle => lourde Une méthode automatique est préférable Il faut un nouveau modèle.
58 Modèle de covariance RNA sequence analysis using covariance models by Sean R. Eddy and Richard Durbin 1994 Un CM est: probabilistic models that flexibly describe the secondary structure and primary sequence consensus of an RNA sequence family Sommairement : Généralisation d un MMC qui permet une description flexible des structures primaires et secondaires d une famille d ARN. Créer pour la recherche de BD, ensuite utilisé pour la prédiction de forme secondaire à partir de séquences non-alignés. Basé sur des GSOC
59 GOC
60 RNA structure secondaire Règle : S asu csg gsc usa Représente une ARN simple. Avec a un nucléotide b sa paire et W un nonterminal generic. P awb L aw R Wb
61 RNA secondary structure Production compléte P awb L aw R Wb B SS S W E fin Pas de pseudoknots!
62 GSOC Les grammaires stochastiques hors contextes sont des extension des GOC avec l ajout d une règle de probabilité à chaque règle de production. Ex: 0.7 VP --> V NP 0.3 VP --> V NP NP GOC peuvent bien représenter la forme secondaire d un ARN.
63 GSOC En ajoutant des probabilité à notre modèle, il est possible de représente un alignement consensus d un ARN (presque) Avec ce modèle, il serait possible de chercher des BD d ARN L absence d ajout ou de suppression versus la séquence consensus => plusieurs séquences homologues seront raté.
64 Modèle de covariance Extension du modèle précédent qui permet l insertion et la suppression relative au consensus. Suppression peut arriver dans plusieurs places
65 Modèle de Covariance États possibles MP : Match state D : Deletion of base pair ML : Single base 3' MR : Single base 5' IL : Single insert 5' IR : Single insert 3'
66 Construction du CM Construction de l arbre guide.
67 Arbre guide = >
68 Construction du CM Explosions de l arbre guide
69 Construction d un CM Finalement, les probabilités d emissions et de transition viennent de l alignement multiple
70 Exemple
71 Résultat Structure secondaire semi-consensus, souple et statistique Utile pour la recherche et la validation d ARN Ne donne pas directement de structure secondaire
72 Algo Inside algorithm: Fills a three-dimensional dynamic programming matrix with the summed probability of all parse subtrees at state v for subsequence xi...xj. Pour une séquence x et un CM a, renvoie la P(x a) de la séquence via tout les structures possibles de x Algorithme dynamique: O(aM^2*bM^3) avec b bifurcation, a autres état, M = (a+b)
73 Faiblesse des CM Lourds Peu intuitif Ne permet pas l ajout de connaissance à priori ( mais on Ne permet pas l ajout de connaissance à priori ( mais on y travaille )
74 Recherche dans une BD Recherche d ARN homologue Le fait que ces séquences peut être homologue par leurs séquences primaires ou secondaires rend la recherche difficile Méthodes : Modèle de covariance SVM avec Stem kernel
75 Recherche avec CM Il serait possible de chercher des Arn homologues avec l algo «inside» Génomes > ( facilement ) Temps de calcul plus que prohibitif Autres méthodes mais garder le CM
76 Recherche avec CM CYK algorithme Limite la sous-séquence à une taille D Transformation de la matrice ( v, j, D) plutôt que ( v, i, j ) (v états, j sous-séq) Divide & Conquer Heuristique de «distance»
77 Résultat de CM Recherche dans 400+ génomes Structure secondaire de 500 nucléotides ARN de longueur similaire La recherche = 80 heures ( environs ) Qualité des résultats?
78 Recherche avec SVM Très récents «Stem Kernels for RNA Sequence analysis» by Yasubumi Sakakibara & Kris Popendorf 2007 Utilise un SVM pour classifier les ARN en «homologues» et «non-homologues»
79 Stem Kernel Utilise un «Stem Kernel» extension du string kernel Mesure la similarité des sous-séquences d un ARN Produit interne = Addition tout les sous-séquences communes non-continue
80 Stem kernel «Need to define a feature mapping the space of RNA sequences to a vector space» Nécessite une mesure de distance Compter tout les paires de bases possibles et faire la différence. AUCGAGUCG => 3 (A-U) 1 (U-A) 4 (C-G) 2 ( G-C) L espace est un vecteur à quatres dimensions (3,1,4,2) ( On ignore la paire G-U?)
81 Stem kernel Autre mesure Même distance, mais «stem length de X» Stem de 2 = espace 16 dimension (A(A-U)U), (A(U-A)U).etc Stem kernel utilise cette mesure
82 Stem Kernel Résultat relativement concluant Fonctionne bien avec peu d ARN pour construire le modèle Relativement rapide Difficulté avec certaines formes secondaires Nouvelle méthode : À surveiller!
83 Conclusion Prédiction Minimisation de l énergie libre Covariation Recherche Modèle de covariance Stem Kernel
84 Question?
CHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Plus en détailLa gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailMABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailBig data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme
Plus en détailContrôle de l'expression génétique :
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles L'ARNm, simple intermédiaire entre le génome et les protéines? gène protéine L'ARNm, simple intermédiaire entre le génome et
Plus en détailIdentification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Plus en détail6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses
6. Hachage Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses PLAN Définition Fonctions de Hachage Méthodes de résolution de collisions Estimation
Plus en détailContrôle de l'expression génétique : Les régulations post-transcriptionnelles
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles http://perso.univ-rennes1.fr/serge.hardy/ utilisateur : biochimie mot de passe : 2007 L'ARNm, simple intermédiaire entre le
Plus en détailAnalyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Plus en détailUniversité de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription
Université de Montréal Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription par Eloi Mercier Département de bioinformatique Faculté de médecine
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailFormavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...
Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au
Plus en détailOptimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation
Plus en détailChaînes de Markov au lycée
Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat
Plus en détailVI- Expression du génome
VI- Expression du génome VI-1.- EXPRESSION DU GÉNOME- PRINCIPES GÉNÉRAUX DOGME CENTRAL Les gènes et l information génétique sont conservés sous forme d acides nucléiques La perpétuation à l identique de
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailProgrammation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Plus en détailDétection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots
Université Toulouse 3 Paul Sabatier(UT3 Paul Sabatier) Informatique Spécialité Bioinformatique Eric AUDEMARD lundi 28 novembre 2011 Détection des duplications en tandem au niveau nucléique à l'aide de
Plus en détailGestion obligataire passive
Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailDr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires
Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique
Plus en détailSemestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»
Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détailJournée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique
Monitorint spatio-temporel intégré de la mobilité urbaine Monitoring spatio-temporel de l ADN urbain Une réponse aux défis, problèmes, enjeux et risques des milieux urbains Nicolas Lachance-Bernard M.ATDR
Plus en détailArithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot
Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,
Plus en détailOptimisations des SGBDR. Étude de cas : MySQL
Optimisations des SGBDR Étude de cas : MySQL Introduction Pourquoi optimiser son application? Introduction Pourquoi optimiser son application? 1. Gestion de gros volumes de données 2. Application critique
Plus en détailIMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques
IMMUNOLOGIE La spécificité des immunoglobulines et des récepteurs T Informations scientifiques L infection par le VIH entraîne des réactions immunitaires de l organisme qui se traduisent par la production
Plus en détailGènes Diffusion - EPIC 2010
Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses
Plus en détailSécurité par compression! ReSIST 2010. Gilles RICHARD IRIT www.irit.fr/bite www.bite.ac.uk
Sécurité par compression! ReSIST 2010 Gilles RICHARD IRIT www.irit.fr/bite www.bite.ac.uk Introduction Sécurité.. intrusion réseau, attaques (DoS,DDoS etc.) virus, etc... spams code injection (SQL,XSS,CSRF,...)
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailMaster de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant
Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailLa reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006
La reconnaissance moléculaire: la base du design rationnel En 1890 Emil Fisher a proposé le modèle "serrure et clé" pour expliquer la façon de fonctionner des systèmes biologiques. Un substrat rentre et
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détail# let rec concat l1 l2 = match l1 with [] -> l2 x::l 1 -> x::(concat l 1 l2);; val concat : a list -> a list -> a list = <fun>
94 Programmation en OCaml 5.4.8. Concaténation de deux listes Définissons maintenant la fonction concat qui met bout à bout deux listes. Ainsi, si l1 et l2 sont deux listes quelconques, concat l1 l2 constitue
Plus en détailL utilisation d un réseau de neurones pour optimiser la gestion d un firewall
L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans
Plus en détailLe théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailComment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet
Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailChapitre V : La gestion de la mémoire. Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping
Chapitre V : La gestion de la mémoire Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping Introduction Plusieurs dizaines de processus doivent se partager
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailHépatite chronique B Moyens thérapeutiques
Hépatite chronique B Moyens thérapeutiques Dr Olfa BAHRI Laboratoire de Virologie Clinique Institut Pasteur de Tunis INTRODUCTION Plus de 300. 10 6 porteurs chroniques de VHB dans le monde Hépatite chronique
Plus en détailBase de données bibliographiques Pubmed-Medline
Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailUTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY
UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier
Plus en détailCommande Prédictive des. Convertisseurs Statiques
Commande Prédictive des Convertisseurs Statiques 1 Classification des méthodes de commande pour les convertisseurs statiques Commande des convertisseurs Hystérésis MLI Cde Linéaire Fuzzy Logic Sliding
Plus en détailINF 232: Langages et Automates. Travaux Dirigés. Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies
INF 232: Langages et Automates Travaux Dirigés Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies Année Académique 2013-2014 Année Académique 2013-2014 UNIVERSITÉ JOSEPH
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailReprésentation d un entier en base b
Représentation d un entier en base b 13 octobre 2012 1 Prérequis Les bases de la programmation en langage sont supposées avoir été travaillées L écriture en base b d un entier est ainsi défini à partir
Plus en détailCours d initiation à la programmation en C++ Johann Cuenin
Cours d initiation à la programmation en C++ Johann Cuenin 11 octobre 2014 2 Table des matières 1 Introduction 5 2 Bases de la programmation en C++ 7 3 Les types composés 9 3.1 Les tableaux.............................
Plus en détailPourquoi l apprentissage?
Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage
Plus en détail(Third-Man Attack) PASCAL BONHEUR PASCAL BONHEUR@YAHOO.FR 4/07/2001. Introduction. 1 Domain Name Server. 2 Commandes DNS. 3 Hacking des serveurs DNS
Détournement de serveur DNS (Third-Man Attack) PASCAL BONHEUR PASCAL BONHEUR@YAHOO.FR 4/07/2001 Introduction Ce document traite de la possibilité d exploiter le serveur DNS pour pirater certains sites
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailJean-Philippe Préaux http://www.i2m.univ-amu.fr/~preaux
Colonies de fourmis Comment procèdent les colonies de fourmi pour déterminer un chemin presque géodésique de la fourmilière à un stock de nourriture? Les premières fourmis se déplacent au hasard. Les fourmis
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailLe passage d un ordre de bourse, sa comptabilisation et la gestion des conflits d intérêts
Le passage d un ordre de bourse, sa comptabilisation et la gestion des conflits d intérêts Animé par : Mme Astou Diop NIANG Séminaire COSUMAF Libreville les 4,5 et 6 Novembre 2006 SOMMAIRE 1. DEFINITIONS
Plus en détailEchantillonnage Non uniforme
Echantillonnage Non uniforme Marie CHABERT IRIT/INP-ENSEEIHT/ ENSEEIHT/TéSASA Patrice MICHEL et Bernard LACAZE TéSA 1 Plan Introduction Echantillonnage uniforme Echantillonnage irrégulier Comparaison Cas
Plus en détailSéquence 2. L expression du patrimoine génétique. Sommaire
Séquence 2 L expression du patrimoine génétique Sommaire 1. La synthèse des protéines 2. Phénotypes, génotypes et environnement Synthèse de la séquence 2 Exercices de la séquence 2 Glossaire des séquences
Plus en détailExemples de problèmes et d applications. INF6953 Exemples de problèmes 1
Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation
Plus en détailLes OGM. 5 décembre 2008. Nicole Mounier
Les OGM 5 décembre 2008 Nicole Mounier Université Claude Bernard Lyon 1 CGMC, bâtiment Gregor Mendel 43, boulevard du 11 Novembre 1918 69622 Villeurbanne Cedex OGM Organismes Génétiquement Modifiés Transfert
Plus en détailL annuaire et le Service DNS
L annuaire et le Service DNS Rappel concernant la solution des noms Un nom d hôte est un alias assigné à un ordinateur. Pour l identifier dans un réseau TCP/IP, ce nom peut être différent du nom NETBIOS.
Plus en détailTD de Biochimie 4 : Coloration.
TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailTable des matières. Avant-propos. Chapitre 2 L actualisation... 21. Chapitre 1 L intérêt... 1. Chapitre 3 Les annuités... 33 III. Entraînement...
III Table des matières Avant-propos Remerciements................................. Les auteurs..................................... Chapitre 1 L intérêt............................. 1 1. Mise en situation...........................
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailAnalyse des données de séquençage massif par des méthodes phylogénétiques
Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'environnement
Plus en détailI. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):
Master Chimie Fondamentale et Appliquée : spécialité «Ingénierie Chimique» Examen «Programmation, Simulation des procédés» avril 2008a Nom : Prénom : groupe TD : I. Programmation I. 1 Ecrire un programme
Plus en détailPartenaires: w w w. c o g m a s t e r. n e t
Partenaires: w w w. c o g m a s t e r. n e t Une approche interdisciplinaire et intégrative neuropsychologie psychologie neuroanatomie linguistique philosophie SCIENCES COGNITIVES logique/probas neurosciences
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailLe management des risques de l entreprise Cadre de Référence. Synthèse
Le management des risques de l entreprise Cadre de Référence Synthèse SYNTHESE L incertitude est une donnée intrinsèque à la vie de toute organisation. Aussi l un des principaux défis pour la direction
Plus en détailUne nouvelle approche de détection de communautés dans les réseaux sociaux
UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise
Plus en détailSTA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes
STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités
Plus en détailModèles à Événements Discrets. Réseaux de Petri Stochastiques
Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détail6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr
6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr Interface d un SGF Implémentation d un SGF Gestion de la correspondance entre la structure logique et la structure
Plus en détailSysFera. Benjamin Depardon
SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation
Plus en détailTESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme
TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources
Plus en détailLogiciel Libre Cours 3 Fondements: Génie Logiciel
Logiciel Libre Cours 3 Fondements: Génie Logiciel Stefano Zacchiroli zack@pps.univ-paris-diderot.fr Laboratoire PPS, Université Paris Diderot 2013 2014 URL http://upsilon.cc/zack/teaching/1314/freesoftware/
Plus en détailBases de données des mutations
Bases de données des mutations CFMDB CFTR2 CFTR-France / Registre Corinne THEZE, Corinne BAREIL Laboratoire de génétique moléculaire Montpellier Atelier Muco, Lille, 25-27 septembre 2014 Accès libre http://www.genet.sickkids.on.ca/app
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailChap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1
Chap 4: Analyse syntaxique 1 III- L'analyse syntaxique: 1- Le rôle d'un analyseur syntaxique 2- Grammaires non contextuelles 3- Ecriture d'une grammaire 4- Les méthodes d'analyse 5- L'analyse LL(1) 6-
Plus en détailIMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES
IMPRTATIN, CRÉATIN, MANIPULATIN, EXPRTATIN DE DNNÉES STATISTIQUES Bernard Dupont Bernard.Dupont@univ-lille1.fr ahm.bahah@yahoo.fr Bien que l'analyse et le traitement des données ne soient pas sa vocation
Plus en détailLeslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr
Programmation avec R Polycopié d exercices Leslie REGAD ; Gaëlle LELANDAIS leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr Ce polycopié rassemble différents exercices vous
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailMise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique
Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes
Plus en détailChapitre 7. Récurrences
Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,
Plus en détailCAC, DAX ou DJ : lequel choisir?
CAC, DAX ou DJ : lequel choisir? 1. Pourquoi cette question Tout trader «travaillant 1» sur les indices s est, à un moment ou un autre, posé cette question : «je sais que la tendance est bien haussière
Plus en détailSéquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.
Sommaire Séquence 6 Nous avons vu dans les séances précédentes qu au cours des temps géologiques des espèces différentes se sont succédé, leur apparition et leur disparition étant le résultat de modifications
Plus en détail