MABioVis. Bio-informatique et la



Documents pareils
Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Big Data et Graphes : Quelques pistes de recherche

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Big Data et Graphes : Quelques pistes de recherche

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

DOSSIER DE CANDIDATURE SCIENCES TECHNOLOGIES SANTÉ Master 2 ème année Mention Biologie, Santé

MASTER (LMD) MODELISATION, OPTIMISATION, COMBINATOIRE ET ALGORITHME

Efficacité énergétique des réseaux de cœur et d accès

Le Master Mathématiques et Applications

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

Identification de nouveaux membres dans des familles d'interleukines

Gènes Diffusion - EPIC 2010

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Introduction aux bases de données: application en biologie

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Big data et sciences du Vivant L'exemple du séquençage haut débit

Organisation du parcours M2 IR Les unités d enseignements (UE) affichées dans la partie tronc commun sont toutes obligatoires, ainsi que le stage et

IMO - Informatique, modélisation et optimisation

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

LICENCE : INFORMATIQUE GENERALE

Introduction au Data-Mining

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Panorama des études à travers les filières. FEEL du 23 octobre 2014

Bases de données des mutations

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Enjeux mathématiques et Statistiques du Big Data

IFT6251 : Sujets spéciaux en génie logiciel

COURS COLLÉGIAUX PRÉALABLES À L ADMISSION

Master Informatique Aix-Marseille Université

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Chapitre 5 : Flot maximal dans un graphe

Plus courts chemins, programmation dynamique

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

Comparer l intérêt simple et l intérêt composé

données en connaissance et en actions?

Génétique et génomique Pierre Martin

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Dell Software International Limited City Gate Park Mahon Cork Ireland

Les apports de l informatique. Aux autres disciplines

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

Base de données bibliographiques Pubmed-Medline

UNIVERSITE DES ANTILLES et DE LA GUYANE Campus de Fouillole BP Pointe-à-Pitre Cedex CONTRAT LE MASTER NOM DU DOMAINE STS

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Dans la fonction de maître de formation pratique. Dans la fonction de maître assistant

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Modernisation et gestion de portefeuilles d applications bancaires

Manuel de recherche en sciences sociales

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Environmental Research and Innovation ( ERIN )

Informatique et mathématiques

Burkina Faso Profil pays EPT 2014

Master of Science en mathématiques

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : MOBILITE ET CLOUD COMPUTING

Pi, poker et informatique ; une «épuisante» alliance pour des projets en mathématiques

Conception de Médicament

DATA ANALYTICS Des données aux connaissances et à la création de valeur

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

UFR d Informatique. FORMATION MASTER Domaine SCIENCES, TECHNOLOGIE, SANTE Mention INFORMATIQUE

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Modélisation multi-agents - Agents réactifs

Création intuitive des éléments d un paysage

CEGEP DU VIEUX-MONTRÉAL

Programmation linéaire

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

La classification automatique de données quantitatives

Intérêt du découpage en sous-bandes pour l analyse spectrale

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

SQL Server 2012 et SQL Server 2014

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Quantification Scalaire et Prédictive

Introduction à la méthodologie de la recherche

Console de supervision en temps réel du réseau de capteurs sans fil Beanair

ANALYSTE PROGRAMMEUR EN INFORMATIQUE Option : Développement Internet

Table des matières. I Mise à niveau 11. Préface

Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution?

Introduction au Data-Mining

Université Libre de Tunis

Programmes des classes préparatoires aux Grandes Ecoles

Maîtrise universitaire ès sciences en mathématiques

Francis BISSON ( ) Kenny CÔTÉ ( ) Pierre-Luc ROGER ( ) IFT702 Planification en intelligence artificielle

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Transcription:

MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011

MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID SHERMAN DR INRIA (EPI MAGNOME) Mercredi 17h Génomique DAVID AUBER (MCF UFR Maths Info / EPI GRAVITE) Jeudi 10h Visual Analytics BRUNO PINAUD (MCF UFR Maths Info / EPI GRAVITE) Jeudi 11h-13h 13h «Réseaux biochimiques i évolutifs et visualisations de graphes» (discussion)

MABioVis La bio-informatique comme domaine d application cible Objectifs complémentaires Travailler au plus près des données biologiques, concevoir et mettre en œuvre des modèles Apporter des objets/modèles combinatoires à des fins algorithmique, d analyse et de modélisation Développer des méthodes offrant ultimement à l expert un laboratoire d exploration et d analyse des données

Production de données Données biologiques Annotation primaire Exploration / Formulation d hypothèses / Analyse Analyse et algorithmes Objets/modèles (combinatoires) Elaboration de modèles Intégration et visualisation

MABioVis nos fondamentaux Apport des fondamentaux informatiques Méthodes formelles Théorie des graphes, mathématiques combinatoires Optimisation combinatoire Abstraire la méthodologie des objets modélisés Structures et algorithmes des mathématiques discrètes Permutations et motifs interdits Arborescences multi-échelle Graphes planaires, petit monde, invariant d échelle

La bio-informatique domaine fédérateur et catalyseur Comparaison de génomes / structure, évolution Deux à deux: combinatoire des structures Multiple: optimisation combinatoire (Re) construction de réseaux biologiques gq Modélisation multi- échelle Représentation des connaissances Intégration de données Approche exploratoire Confirmation d hypothèses

MABioVis méthodologie(s) Calcul de similarités (sur des objets ou sur des groupes d objets) Réduction de dimension, clustering Autosimilarité, compression, échantillonnage, passage à l échelle Analyse des séquences et du texte (structures linéaires), des structures arborescentes Objets/mesures combinatoires Formulation des algorithmes Analyse des algorithmes Complexité, convergence ou passage à l échelle des algorithmes

Bilan Scientifique Quelques résultats

aux modèles Cartes comparatives De la comparaison de génomes Loci et gènes Gènes annotés ADN génomique G 1 G 2 G 3 G 4 G 5 G 6 EMBL Gain et perte de gènes Conservation de réseaux Architectures génomiquesé ancestraux Groupes de homologues Familles de protéines Modèles

De la comparaison de génomes aux modèles Comprendre l évolution et la fonction des Cartes comparatives génomes Loci et Gènes gènes annotés ADN de génomiqueé relations développées EMBL au cours du temps La comparaison des génomes est révélatrice G Besoin 1 de comprendre la dynamique des G 2 gènes et des génomes G 3 Gain et perte de gènes Conservation de réseaux Architectures génomiques ancestraux G Besoin 4 G 5 de prédire le rôle et la fonction des gènes G 6 Etablir le lien entre génotype et phénotype Groupes de homologues Familles de protéines Modèles

Comparaison de génomes Clustering par consensus Eviter les écueils d un choix particulier Rechercher la «robustesse» de la partition Définir une heuristique qui se calcule en temps raisonnable Consensus clustering: étant données des partitions P 1,...,P k, trouver une partition consensus P minimisant Σ d(p, ( P k ) où d est une distance. Nikolski Sherman 2007

Comparaison de génomes Comparaison et réarrangements de plusieurs génomes modélisés é par des permutations ti signées Jean Nikolski Sherman 2009

Comparaison de génomes Comparaison et réarrangements de plusieurs génomes Génome médian : à distance minimal i de tous les génomes considérés () Adjacence préservées / perdues encodées par un graphe (breakpoint graph)

Analyse de structures biologiques combinatoires i 350 300 250 Plantes entières 0 - Peuplement 200 150 100 50 0 1 2 3 4 5 6 7 Graphes Caractérisation statistique DAGs Données génomiques Données fortement structurées Arborescences multi-échelles Arborescences Séquences Étiquetage 2 0 1 3 Données moléculaires Comparaison Évaluation de l autosimilarité Modélisation

Comparaison de Structures Secondaires d ARN Bases de données de structures secondaires d'arn Important besoin de nouveaux outils de traitement automatique d'analyse et de comparaison Comparaison multi-échelles Prise en compte de la séquence de nucléotides, de son repliement en structure arborescente, de la décomposition en éléments structuraux (réseau de boucles multiples) Auber Delest Domenger Dulucq 2006

Visualisation d information La visualisation comme stratégie d exploration et de formulation d hypothèses Graphes petits mondes / invariant d échelle Approches (semi) supervisées Algorithmes de dessin Exploitation des indices structuraux Interactions spécifiques

Visualisation multi-niveaux Approche topologique pour l exploration de grands graphes Algorithmes existants peu efficace sur les très grands graphes Besoin de rechercher h automatiquement des sous-structures structures topologiques dans les données Décomposition Multi-échelles Archambault, Auber (2007, 2008, 2009)

Visualisation multi-niveaux Représentation de réseaux métaboliques Algorithmes existant travaille sur un sous- ensemble du réseau Nouvel algorithme permettant d éviter la duplication de sommets en conservant au mieux la représentation des chemins métaboliques Analyse topologique Dessin planaire Bourqui, Auber (2006, 2007)