Bionformatique. D. Puthier Inserm U1090 Polytech Biotech III, 2014



Documents pareils
Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Big data et sciences du Vivant L'exemple du séquençage haut débit

Gènes Diffusion - EPIC 2010

Biomarqueurs en Cancérologie

Eco-système calcul et données

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

La rencontre du Big Data et du Cloud

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Introduction aux bases de données: application en biologie

Langage SQL (1) 4 septembre IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Once the installation is complete, you can delete the temporary Zip files..

SysFera. Benjamin Depardon

Information utiles. webpage : Google+ : digiusto/

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE

Bigdata et Web sémantique. les données + l intelligence= la solution

Bases de données Outils de gestion

Création de Sous-Formulaires

MABioVis. Bio-informatique et la

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Business Process Management

Comment Accéder à des Bases de Données MySQL avec Windows lorqu'elles sont sur un Serveur Linux

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Instructions Mozilla Thunderbird Page 1

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

Base de données bibliographiques Pubmed-Medline

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

Génomique Comparative et intégrative

1-Introduction 2. 2-Installation de JBPM 3. 2-JBPM en action.7

Programme AcSé. Accès Sécurisé aux Innovations Thérapeutiques Deux études pilotes : AcSé - crizotinib et AcSé - vémurafenib

Stage Ingénieur en développement logiciel/modélisation 3D

Archived Content. Contenu archivé

SQL Parser XML Xquery : Approche de détection des injections SQL

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

Ingénieur R&D en bio-informatique

Philippe Lemerle Big Data Secteur public. Copyright 2015, Oracle and/or its affiliates. All rights reserved.

Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

Pratique et administration des systèmes

Introduction aux Bases de Données

BNP Paribas Personal Finance

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Extraction d information des bases de séquences biologiques avec R

Génétique et génomique Pierre Martin

Perl Orienté Objet BioPerl There is more than one way to do it

Les technologies du Big Data

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

Physiopathologie : de la Molécule à l'homme

Développer l accès précoce pour tous les patients, aux thérapie ciblées en France. Pr. Fabien Calvo Institut National du Cancer

Face Recognition Performance: Man vs. Machine

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB / 16

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

DOCUMENTATION - FRANCAIS... 2

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

L installation a quelque peu changée depuis les derniers tutos, voici une actualisation.

Rôle des acides biliaires dans la régulation de l homéostasie du glucose : implication de FXR dans la cellule bêta-pancréatique

Calcul intensif pour la biologie

CBBC Canadian Business & Biodiversity Council

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Bases de données relationnelles

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

SparkInData. Place de Marché des applications Spatiales

CEST POUR MIEUX PLACER MES PDF

Forthcoming Database

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

1 Introduction et installation

Bases de données des mutations

Identification de nouveaux membres dans des familles d'interleukines

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

Frequently Asked Questions

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Principes. 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA. Programmation en Corba. Stéphane Vialle

UE 8 Systèmes d information de gestion Le programme

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Stéphane Lefebvre. CAE s Chief Financial Officer. CAE announces Government of Canada participation in Project Innovate.

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

Marie Curie Individual Fellowships. Jean Provost Marie Curie Postdoctoral Fellow, Institut Langevin, ESCPI, INSERM, France

Les Entrepôts de Données

Les bases de données

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

Bases de données et outils bioinformatiques utiles en génétique

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Hervé Couturier EVP, SAP Technology Development

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

We Simplify Internet Connaissances Globales, Résultats locaux.

Transcription:

Bionformatique D. Puthier Inserm U1090 Polytech Biotech III, 2014

L informatique est omniprésente dans notre sociéte. La biologie ne fait pas exception

Bioinformatique? Utiliser l information numérisée pour comprendre le fonctionnement du vivant

Quelques applications...

Chuck, s il te plait...

Analyse de séquences

Le séquençage c est plus ce que c était 1977-1990, 500bp, analyses manuelles 1990-2000, 500Bp, analyses assistées ( 1D capillary sequencers ) 2005-2014, 20-1000bp ( 2D sequencers Next Generation Sequencing. )

Coût par mégabase (1 million de bases)

Coût par génome humain Sanger-based sequencing (average read length=500-600 bases): 6-fold coverage 454 sequencing (average read length=300400 bases): 10-fold coverage Illumina and SOLiD sequencing (average read length=50-100 bases): 30-fold coverage

De véritables usines à séquencer Illumina 10 séquenceurs. Chacun produisant 1,8 Terabases / 3 day 18,000 génomes / an Factory-scale sequencing technology Enfin le génome à 1000$...

Ou des séquenceurs sur clefs USB...

Bioinformatique: analyse de séquences Assemblage de génomes Annotation de génomes Recherche contre des bases de données (BLAST, Blat,...) Alignements multiples (Clustal,...) Alignements de génomes Recherche/découverte de motifs fonctionnels

Bioinformatique & génétique humaine

Bioinformatique: génétique humaine Analyse de la diversité des génomes SNPs (Single Nucleotide Polymorphisms) InDel (Insertion/Deletion) CNV (Copy Number Variation) GWAS (Genome wide association studies) Associer SNPs et maladies

Analyse GWAS Bipolar disorder (BD) is a severe mood disorder affecting greater than 1% of the population[1]. Classical BD is characterized by recurrent manic episodes that often alternate with depression. Its onset is in late adolescence or early adulthood and results in chronic illness with moderate to severe impairments (...). Genome-wide significant evidence for association was confirmed for CACNA1C and found for a novel gene ODZ4 (...). Pathway analysis identified a pathway comprised of subunits of calcium channels enriched in the bipolar disorder association intervals.

Variations genetiques chez l humain Projet 1000 génomes 1,092 individuals from 14 populations, constructed using a combination of low-coverage whole-genome and exome Sequencing 38 millions de SNPs, 1.4 millions d indels

Million Human Genomes project

Bioinformatique & cancérologie

Bioinformatique: cancérologie Analyser les génomes de tumeurs Définir les anomalies Mutations Translocations Insertions Déletions Variations de nombre (e.g. amplifications) Applications envisageables en séquençage...

Exome sequencing of renal cell carcinoma Cancer a clonal disease evolving in a linear fashion? What about tumor heterogeneity? Can we re-constitute the evolution of the tumor?

Exome-Seq of Renal cell carcinoma

Séquençage de tumeurs

Calico Larry Page at Google's headquarters

Yet another ongoing project : HLI

Bioinformatique & régulation des gènes

Bioinformatique: transcriptomique Transcriptome: l ensemble des transcrits d une cellule Analyse par microarrays ou séquençage (RNA-Seq)

Bioinformatique: transcriptomique Analyse du transcriptome Analyse systématiques des transcrits cellulaires Classification des patients Comparaison des classes Recherche de gènes spécifiques, biomarqueurs Prédiction de classes Prédire le type de maladie sur la base de l expression des gènes Découverte de classes Décrire de nouvelles classes de patients Recherche fondamentale

Bioinformatique: transcriptomique

Bioinformatique: régulation génique ChIP-Seq (Chromatine Immuno-Precipitation and sequencing) Recherche des régions régulatrices Recherche de sites de liaison de facteurs de transcription Analyse des modifications épigénétiques Influence sur le transcriptome? (e.g. cancer)

ChIP-Seq

Bioinformatique & évolution

Bioinformatique: évolution Phylogénie Vise à proposer des modèles d évolution des organismes vivants Génomique comparative Etude comparative de la structure des génomes de différentes espèces. Effet de la sélection sur l organisation et l évolution des génomes

Million plants and animals genome project

Bioinformatique & visualisation

Bioinformatique et visualisation Nécessité de visualiser les informations Des structures Des graphes d'interactions Des séquences Des alignements Des génomes Des annotations / ontologies

Bioinformatique: mais encore...

Bioinformatique: mais encore Réseau d interaction (e.g. protéine-protéine) Modélisation dynamique Datamining (e.g. analyse de la littérature) Biochimie structurale...

Langages & bioinformatique

Langages et lisibilité Attention au code abscons obfuscating code Nécessité de produire un code lisible Utilisez des commentaires!

Perl Développé au départ pour l'analyse de fichiers au format texte (Larry Wall, linguiste). Bénéficie d'une large bibliothèque de modules (i.e; ensemble de fonctions). e.g. modules BioPerl pour la bioinformatique Analyse de séquences Moteur d'expressions régulières très puissant

R Issu du langage S Particulièrement utile pour l'analyse statistique des données Microarrays, NGS, Cytométrie de flux, protéomique, analyse d'image,... Bioconductor open source and open development. It has two releases each year, more than 380 packages, and an active user community Bénéficie d'outils graphiques assez évolués.

SQL (Structured Query Language) Permet de communiquer avec des bases de données Interrogation des données via un langage permet de mettre en relation des tables (bases de données relationnelles)

Python Une bonne alternative à Perl Syntaxe plus lisible / naturelle Facile à apprendre Nombreux outils pour l'analyse de séquences Nombreux outils pour l analyse de données (statistiques) Interface graphique développée (e.g. matplotlib) Devenu très populaire Permet le développement d applications fenêtrées + web

Bash Bourne-Again shell Permet d interagir avec des serveurs sous Unix/Linux Permet de piloter une machine à l aide d instructions simples Permet de produire des traitements complexes à partir de commandes simples

La liste complète des langages... http://fr.wikipedia. org/wiki/liste_des_langages_de_programmatio n

Merci Concentrons nous maintenant sur Bash.