DEVELOPPEMENT D UNE INTERFACE GRAPHIQUE : LOCAL WEB GUI FOR BLAST (LWBG), POUR LES TRAITEMENTS DE DONNEES BIOLOGIQUES Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2
Plan Introduction Etat de l art Résultats Perspectives
- Enormes volumes de données hétérogènes - Manipulation des données difficiles BIO-INFORMATIQUE
Point Forts Points faibles le plus utilisé prend en charge tout type de format Temps de calcul trop important interrogation des données indexées par NCBI alignements très rapides et bonne sensibilité.
Points faibles Point Forts une multitude de laboratoires de recherches se sont détournés des outils en ligne optant ainsi pour une installation locale Garder la confidentialité des résultats en cours d études utiliser ses propres banques de références Minimiser le temps de calcul. Requêtes ne sont réalisables qu en lignes de commande requêtes sont compilées puis exécutées Pas de documention crédible pour maitriser l outil
Local Web Gui for Blast 1- L interface local est LIBRE d accès (Open Source) et elle sera mise en ligne bientôt. 2- Interface web facile d accession- Même aux novices 3- Permet d interroger des banques génomiques locales 4- Permet la création de banques de données locales (protéiques, Nucléiques) 5- Permet d interroger des BD en Ligne via des sites tels que NCBI 6- Parsing des sorties blast 7- Les Scripts sont exécutables sur n importe quel type de plateforme (linux, MS-DOS, MacOs)
Local Web Gui for Blast Nucleotideblast Makeblastdb Local parser Outil d interrogation de banques de données Outil de création de banques de données Outil de recherche d informations spécifiques
Figure : Interface utilisateur pour l outil Blastn Nucleotideblast : Outil graphique d interrogation de banque de références - Possibilité d effectuer des Blastn, des MegaBlast ou DcBlast. - Les séquences peuvent être saisies ou attachées - Les banques de références sont intégrées dans l outil sous la forme d une liste déroulante. - Présence d un ensemble de paramètres généraux et avancés, pour optimiser le résultat: pourcentage d identité, du score, du e-value
Nucleotideblast : Outil graphique d interrogation de banque de références - Les résultats d une requête sont affichés sous la forme d un alignement. - Un score de qualité, un pourcentage d identité, et des données statistiques sont de même calculés. Figure. Résultats d une requête sur la banque de données nucléotidiques
Makeblastdb: Outil de création de banques de données Locales - Permet de construire une banque de référence à partir d un ensemble de séquences de référence déjà conçu ou a partir de plusieurs fichiers présents en local - L outil supporte des formats de stockage de type gk, fasta, et plusieurs autre. Figure : interface utilisateur pour la mise en place d une banque de données de référence
Local parser : Outil de recherche d informations spécifiques - Possibilité de filtrage permettant de récupérer les séquences de gènes d intérêt. - Le parser prend en charge une sortie blast au format XML ou ASCII (Txt). Figure : Résultat d un parsing sur des alignements produits par blast.
Local Web Gui for Blast Quelques difficultés Mais bientôt résolues - Problème de mises à jour automatiques des banques de données publiques - Problème de stockage des données Quelques exigences et perspectives - Nécessité d installation de logiciels tiers - L ensemble de ces outils sera disponible, facilitant ainsi la tâche des utilisateurs - Un manuel sera de même mis à disposition - L ensemble de notre code source sera bientôt mis en ligne pour la communauté scientifique.
Objectif : Former les étudiants issus des Sciences du vivant (agronomie, biologie moléculaire, cellulaire, physiologie animale et végétale, biochimie), des sciences médicales, de l'informatique ou des mathématiques aux besoins spécifiques de la bioinformatique (modélisation du vivant, systèmes d'information biologiques, algorithmique dédiée, analyse de séquences et de génomes, prédictions structurales, phylogénie, ) tout en renforçant les compétences de leur profil initial. La formation s'organise en deux ans. Contact : Pr. Vincent Berry : vberry@lirmm.fr Dr. Alban Mancheron: alban.mancheron@lirmm.fr http://www2.lirmm.fr/bim
Remerciements L université Montpellier II représenté par Mr. Le directeur Gilles Halbout Mr. Le-Guennec Nos enseignants du Master BIM et les responsables de cette formation Et tous ceux qui ont contribués de près ou de loin à l avancement de ce projet. Contact : Fida Khater : fida.khater@hotmail.com Abdoulaziz Moussa : abdoulaziz.moussa@hotmail.fr