Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2

Documents pareils
Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

MABioVis. Bio-informatique et la

Possibilités offertes après la L2?

Introduction aux bases de données: application en biologie

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE)

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

Physiopathologie : de la Molécule à l'homme

Base de données bibliographiques Pubmed-Medline

MASTER (LMD) MODELISATION, OPTIMISATION, COMBINATOIRE ET ALGORITHME

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Perl Orienté Objet BioPerl There is more than one way to do it

Identification de nouveaux membres dans des familles d'interleukines

Stages - le calendrier

Comité de suivi de la licence et de la licence professionnelle Comité de suivi du cursus master

Fès. Licences Fondamentales. Filière SMC : Sciences de la Matière Chimie Coordonnateur : Pr. Mohammed KHALDI

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

DOSSIER DE CANDIDATURE SCIENCES TECHNOLOGIES SANTÉ Master 2 ème année Mention Biologie, Santé

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Bases de données documentaires et distribuées Cours NFE04

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Faculté des Sciences d ORSAY

Gènes Diffusion - EPIC 2010

Les débouchés des diplômés de L LMD Sciences de la Nature et de la Vie

Marie Curie Actions Marie Curie Career Integration Grant (CIG) Call: FP7-People-2012-CIG

ACQUISITION. Traitement de l image. Classement. Préparation. Ouverture. Performance

Diplôme d Université Licence d Université Sciences Physiques pour l Ingénieur (SPI) Liste des modules

Liste des matières enseignées

FACULTÉ DES SCIENCES FACULTY OF SCIENCES OFFRE DE FORMATION CONDITIONS D ADMISSION COURSE OFFERING ADMISSION REQUIREMENTS

Poursuivre ses études à l'université de Rouen Masters professionnels en Informatique et en Mathématiques. UFR Sciences et Techniques /18

Big data et sciences du Vivant L'exemple du séquençage haut débit

Ingénieur R&D en bio-informatique

Environmental Research and Innovation ( ERIN )

MASTER 2 SCIENCES DU MEDICAMENT

Dans la fonction de maître de formation pratique. Dans la fonction de maître assistant

Introduction au Data-Mining

CESI Bases de données

Présentation Générale

Mercredi 15 Janvier 2014

Bases de données Cours 1 : Généralités sur les bases de données

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Big data : vers une nouvelle science des risques?

Une conférence-débat proposée par l Institut National de la Recherche Agronomique

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

ÉCOLE SUPÉRIEURE D INGÉNIEURS DE LUMINY - MARSEILLE

LE CALENDRIER DES STAGES

SCIENCES & TECHNOLOGIES - SANTÉ ET STAPS MASTER INFORMATIQUE. Parcours Ingénierie du Logiciel Libre (I2L)

Bases de Données. Plan

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Spécificités, Applications et Outils

Programmation des Applications Réparties. Parsers XML DOM et SAX

ISTEX, vers des services innovants d accès à la connaissance

Panorama des formations en biotechnologie

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Bases de données pour la recherche : quels enjeux et quel rôle pour les patients?

University of AbouBakr Belkaid Tlemcen Program Title Type Level Program Web site Perturbations moyennisations et application aux biomathématiques

La Clé informatique. Formation Excel XP Aide-mémoire

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Panorama des solutions analytiques existantes

Université Paris Saclay De quoi parle t-on?

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Architectures web/bases de données

Dossier justificatif des travaux de R&D déclarés au titre du CIR

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Tableau: Offres de formations professionnelles et doctorales de l'uac

Cursus de Master en Ingénierie de la Production Alimentaire. Une autre façon d accéder au métier d ingénieur

Extraction d information des bases de séquences biologiques avec R

SysFera. Benjamin Depardon

Possibilités offertes après la L2?

Les Parcours Scientifiques et les Ecoles Doctorales

Théorie des Jeux Et ses Applications

Master UP 6. Mention Santé Publique et Management de la Santé. Spécialité Pharmacologie Clinique. Construire une carrière dans l industrie

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Big Data et Graphes : Quelques pistes de recherche

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich

Big Data et la santé

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Module BD et sites WEB

GL BIOCONTROL Le Mas Bas CIDEX ASPERES GSM : +33 (0) Fax : +33 (0) contact@gl-biocontrol.

Introduction aux Bases de Données Relationnelles Conclusion - 1

Master 2. Mention : «Ecosciences, Microbiologie» Domaine : Sciences Technologies Santé Responsable : F. Menu

SQL Parser XML Xquery : Approche de détection des injections SQL

INTRODUCTION AUX BASES de DONNEES

Introduction aux Bases de Données

Rapport de Synthèse. Création d un Générateur de modèle PADL pour le langage C++ Sébastien Colladon

Présentation du module Base de données spatio-temporelles

Programmation C. Apprendre à développer des programmes simples dans le langage C

ANNEXES. Evaluation de la formation à Polytech Lille Département GIS. Enseignements les plus utiles. Enseignements à renforcer

Transcription:

DEVELOPPEMENT D UNE INTERFACE GRAPHIQUE : LOCAL WEB GUI FOR BLAST (LWBG), POUR LES TRAITEMENTS DE DONNEES BIOLOGIQUES Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2

Plan Introduction Etat de l art Résultats Perspectives

- Enormes volumes de données hétérogènes - Manipulation des données difficiles BIO-INFORMATIQUE

Point Forts Points faibles le plus utilisé prend en charge tout type de format Temps de calcul trop important interrogation des données indexées par NCBI alignements très rapides et bonne sensibilité.

Points faibles Point Forts une multitude de laboratoires de recherches se sont détournés des outils en ligne optant ainsi pour une installation locale Garder la confidentialité des résultats en cours d études utiliser ses propres banques de références Minimiser le temps de calcul. Requêtes ne sont réalisables qu en lignes de commande requêtes sont compilées puis exécutées Pas de documention crédible pour maitriser l outil

Local Web Gui for Blast 1- L interface local est LIBRE d accès (Open Source) et elle sera mise en ligne bientôt. 2- Interface web facile d accession- Même aux novices 3- Permet d interroger des banques génomiques locales 4- Permet la création de banques de données locales (protéiques, Nucléiques) 5- Permet d interroger des BD en Ligne via des sites tels que NCBI 6- Parsing des sorties blast 7- Les Scripts sont exécutables sur n importe quel type de plateforme (linux, MS-DOS, MacOs)

Local Web Gui for Blast Nucleotideblast Makeblastdb Local parser Outil d interrogation de banques de données Outil de création de banques de données Outil de recherche d informations spécifiques

Figure : Interface utilisateur pour l outil Blastn Nucleotideblast : Outil graphique d interrogation de banque de références - Possibilité d effectuer des Blastn, des MegaBlast ou DcBlast. - Les séquences peuvent être saisies ou attachées - Les banques de références sont intégrées dans l outil sous la forme d une liste déroulante. - Présence d un ensemble de paramètres généraux et avancés, pour optimiser le résultat: pourcentage d identité, du score, du e-value

Nucleotideblast : Outil graphique d interrogation de banque de références - Les résultats d une requête sont affichés sous la forme d un alignement. - Un score de qualité, un pourcentage d identité, et des données statistiques sont de même calculés. Figure. Résultats d une requête sur la banque de données nucléotidiques

Makeblastdb: Outil de création de banques de données Locales - Permet de construire une banque de référence à partir d un ensemble de séquences de référence déjà conçu ou a partir de plusieurs fichiers présents en local - L outil supporte des formats de stockage de type gk, fasta, et plusieurs autre. Figure : interface utilisateur pour la mise en place d une banque de données de référence

Local parser : Outil de recherche d informations spécifiques - Possibilité de filtrage permettant de récupérer les séquences de gènes d intérêt. - Le parser prend en charge une sortie blast au format XML ou ASCII (Txt). Figure : Résultat d un parsing sur des alignements produits par blast.

Local Web Gui for Blast Quelques difficultés Mais bientôt résolues - Problème de mises à jour automatiques des banques de données publiques - Problème de stockage des données Quelques exigences et perspectives - Nécessité d installation de logiciels tiers - L ensemble de ces outils sera disponible, facilitant ainsi la tâche des utilisateurs - Un manuel sera de même mis à disposition - L ensemble de notre code source sera bientôt mis en ligne pour la communauté scientifique.

Objectif : Former les étudiants issus des Sciences du vivant (agronomie, biologie moléculaire, cellulaire, physiologie animale et végétale, biochimie), des sciences médicales, de l'informatique ou des mathématiques aux besoins spécifiques de la bioinformatique (modélisation du vivant, systèmes d'information biologiques, algorithmique dédiée, analyse de séquences et de génomes, prédictions structurales, phylogénie, ) tout en renforçant les compétences de leur profil initial. La formation s'organise en deux ans. Contact : Pr. Vincent Berry : vberry@lirmm.fr Dr. Alban Mancheron: alban.mancheron@lirmm.fr http://www2.lirmm.fr/bim

Remerciements L université Montpellier II représenté par Mr. Le directeur Gilles Halbout Mr. Le-Guennec Nos enseignants du Master BIM et les responsables de cette formation Et tous ceux qui ont contribués de près ou de loin à l avancement de ce projet. Contact : Fida Khater : fida.khater@hotmail.com Abdoulaziz Moussa : abdoulaziz.moussa@hotmail.fr