Dans la peau d'un Biologiste Computationnel?



Documents pareils
CHAPITRE 3 LA SYNTHESE DES PROTEINES

Introduction aux bases de données: application en biologie

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

AVIS adopté par le Conseil économique et social au cours de sa séance du 7 juillet I - 1

Base de données bibliographiques Pubmed-Medline

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Extraction d information des bases de séquences biologiques avec R

Big Data et Graphes : Quelques pistes de recherche

Master Développement et Immunologie

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

Ingénieur R&D en bio-informatique

Les lières. MSc in Electronics and Information Technology Engineering. Ingénieur civil. en informatique. MSc in Architectural Engineering

MABioVis. Bio-informatique et la

Médicaments du futur : Tendances et enjeux. Nicolas PY, Debiopharm International forumofac.14 26/09/2014

Environmental Research and Innovation ( ERIN )

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Ordonnance sur la formation menant au bachelor et au master de l Ecole polytechnique fédérale de Lausanne

Big Data et la santé

Exemple PLS avec SAS

Conférence technique internationale de la FAO

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Large succès de l introduction en bourse de Genomic Vision sur Euronext à Paris qui lève 23,0 M

Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA établissements T. Paquet D. Olivier T. Lecroq A.

Big Data et Graphes : Quelques pistes de recherche

TD de Biochimie 4 : Coloration.

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Les tests génétiques à des fins médicales

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

MISSION PARTENARIALE IMMUNOLOGIE - VACCINATION & INFECTIOLOGIE A l occasion de BIOPHARM AMERICA 2015 BOSTON, ETATS-UNIS 14 au 18 septembre 2015

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Génétique et génomique Pierre Martin

SysFera. Benjamin Depardon

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Métiers - informatique et Internet Jobs - IT and Internet

RTFM! Les «mailing lists» en tant que nouvelles formes de communication entre scientifiques.

Université Paris Saclay De quoi parle t-on?

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB / 16

Stéphane Lefebvre. CAE s Chief Financial Officer. CAE announces Government of Canada participation in Project Innovate.

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Thierry DELZESCAUX. «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France.

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

La Commission des Titres d ingénieur a adopté le présent avis

Bourses d excellence pour les masters orientés vers la recherche

Gènes Diffusion - EPIC 2010

Les OGM. 5 décembre Nicole Mounier

en SCÈNE RATIONAL Rational Démonstration SDP : automatisation de la chaîne de développement Samira BATAOUCHE sbataouche@fr.ibm.com

Big data et sciences du Vivant L'exemple du séquençage haut débit

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Services à la recherche: Data Management et HPC *

Physiopathologie : de la Molécule à l'homme

Spécificités, Applications et Outils

2 C est quoi la chimie?

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

L OBSERVATOIRE DE LA BIOLOGIE DE SYNTHESE SYNTHETIC BIOLOGY OBSERVATORY

Rapport d évaluation du master

Get Instant Access to ebook Cest Maintenant PDF at Our Huge Library CEST MAINTENANT PDF. ==> Download: CEST MAINTENANT PDF

Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Simon Lacoste-Julien Chercheur CR Équipe-Projet SIERRA, INRIA - École Normale Supérieure

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

CHAPITRE 4. La réglementation du médicament

MANUEL MARKETING ET SURVIE PDF

Rapport d évaluation du master

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Les débouchés des diplômés de L LMD Sciences de la Nature et de la Vie

La rencontre du Big Data et du Cloud

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Hépatite chronique B Moyens thérapeutiques

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Aurélie GUYOUX. Directrice scientifique Scientific Business Manager

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Face Recognition Performance: Man vs. Machine

Empowering small farmers and their organizations through economic intelligence

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Macroscope et l'analyse d'affaires. Dave Couture Architecte principal Solutions Macroscope

Bigdata et Web sémantique. les données + l intelligence= la solution

Fiche produit ifinance v4

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Emergence du Big Data Exemple : Linked Open Data

MYRIAD. l ADN isolé n est à présent plus brevetable!

Professeur Diane GODIN-RIBUOT

F-7a-v3 1 / Bourses de mobilité / Mobility Fellowships Formulaire de demande de bourse / Fellowship Application Form

INVESTMENT REGULATIONS R In force October 1, RÈGLEMENT SUR LES INVESTISSEMENTS R En vigueur le 1 er octobre 2001

Quand le bâtiment va, tout va

Data issues in species monitoring: where are the traps?

MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE ABDELHAMID IBN BADIS MOSTAGANEM TUNISIE MAROC ALGERIE

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

Transcription:

Dans la peau d'un Biologiste Computationnel? Plusieurs casquettes : (Nature Biotechnology, Vol. 31, Number 11, Nov. 2013) «- data analyst - data curator - database developer - statistician - mathematical modeler - bioinformatician - software developer - ontologist - and many more» Une certitude : - «computers are now essential components of modern biological research» Une problématique : - dans quelle limite (éthique par exemple : biohacking in Socialter N 9 Février 2015) Un besoin : - un scientifique (vous) est amené à adopter de nouvelles compétences en biologie computationnelle et maîtriser une nouvelle terminologie

De novo transcriptome assembly is the method of creating a transcriptome without the aid of a reference genome. The transcriptome is the set of all RNA molecules, including mrna, rrna, trna, and other non-coding RNA transcribed in one cell or a population of cells. It differs from the exome in that it includes only those RNA molecules found in a specified cell population, and usually includes the amount or concentration of each RNA molecule in addition to the molecular identities. http://en.wikipedia.org/wiki/transcriptome est une unité de mesure en biologie moléculaire représentant une longueur de un million de paires de bases d'adn ou d'arn. La mégabase (Mb) Le génome est l'ensemble du matériel génétique d'un individu ou d'une espèce codée dans son acide désoxyribonucléique (ADN) à l'exception de certains virus dont le génome est porté par des molécules d'acide ribonucléique (ARN). Il contient en particulier toutes les séquences codantes (transcrites en ARN messagers, et traduites en protéines) et ARN non codantes (non transcrites, ou transcrites en ARN, mais non traduites). http://fr.wikipedia.org/wiki/g%c3%a9nome

La connaissance (K) biologique est vitale pour l'interprétation des résultats computationnels https://politicalmethodology.wordpress.com/2013/04/01/p-values-are-possibly-biased-estimates-of-the-null-probability/ https://med.stanford.edu/profiles/john-ioannidis?tab=publications Soyez un détective des données et de leur manipulation http://www.biomedcentral.com/content/pdf/1471-2105-5-80.pdf Utilisez les nombreuses ressources intelligemment et précautionneusement http://www.open-bio.org/wiki/main_page http://www.biostars.org http://seqanswers.com

Comprendre les outils logiciels à disposition : - ces logiciels sont souvent l'implémentation d'un algorithme générique mais adapté aux données à traiter et qu'il faut être capable de comprendre Ex. : Overlap-Layout-Consensus assembler optimisé pour de longues séquences vs. Graphes de Bruijn pour de courtes séquences Mais vous êtes un scientifique pas un programmeur : - ayez une méthode de développent de votre outil (script, pipeline, software) avec des tests sur des cas maîtrisés de données - utilisez vos connaissances biologiques au mieux notamment pour la documentation Plus des réflexes de bons sens et de génie logiciel à avoir : - versionnage (Github, Subversion) - README - publication conjointe de vos scripts, données et méthodes documentés et commentés (open data, open science, open source, reproductibilité) - cahier de laboratoire 2.0 Soyez vigilants sur vos découvertes : - le récent article sur les conclusions faussement statistiquement validées (faux positifs, faux négatifs, valeur P) : prendre en compte le biais, le bruit dans les données introduites au cours des expériences pour les générer ou de leur analyse

Les Biotechs : nouvelle révolution industrielle? Eldorado pour les laboratoires? Démocratisation du séquençage ADN depuis 2012 : - 1er génome humain décodé : 15 ans de recherche, 2.7 milliards de dollars - Gain de 105 pour le séquençage de mégabase et de 104 pour un génome (quelques milliers de dollars et d'heures contre 100 millions en 2001) Post-génomique : -biohacking (DIY bio), virus intelligents (Microbesoft?), biologie de synthèse (OGM 2.0?) (marché de 1 000 milliards de dollars en 2025, Source OCDE) - réflexion éthique : ONG, ETC Group

Start-up : Transgène : virus intelligents contre cancer poumon et foie Cellectis : cellules immunitaires génétiquement modifiées (France avec Pfizer) Amyris : fabrication artificielle de l'artémisinine (anti-paludique) (US avec Sanofi) Global Bioenergies : biocarburant (Evry avec Audi) Abolis Biotechnologies : CAO de microorganismes Hyasynth Bio : optiliser la production de cannabinoïdes à visée médicale (Canada)

Biotechnologies : Utilisation de techniques utilisant des être vivants, en général modifiés génétiquement, pour la fabrication industrielle de médicaments, de matières premières industrielles, ou pour améliorer la production agricole Génie génétique : Techniques reposant sur la génétique pour utiliser, reproduire ou modifier le génome des êtres vivants Transgénèse : Introduction d'un ou plusieurs gènes dans un organisme vivant, afin de le modifier (OGM) Séquençage de l'adn : Détermination de l'ordre d'enchaînement des nucléotides constituant un fragment d'adn Biologie de synthèse : Conception (ingénierie) de composants et de systèmes biologiques qui n'existent pas dans la nature (artificiels), ou modifications d'éléments biologiques existants Biohacking : Pratique visant à combiner biothecnologies (expérimentation génétique de l'adn et du vivant) et «hacking» (bricolage) pour expérimenter les possibilités du génome En contrepoint des ONG : Fondation Sciences Citoyennes, ETC group (http://www.etcgroup.org/fr)

Un spectre de disciplines si large Computational biophysics & Structural Biology Modeling of Regulatory, signaling and metabolic networks Pattern Recognition and Machine Learning Data Mining / Graph Mining / Sequence Mining Functional Genomics Molecular Interaction Networks / Systems Biology + Structural Biology Prediction of Protein-Protein and Protein-DNA interactions Gene Expression Analysis & Prediction of Regulatory Network Structure Study of Complex Inherited Traits Image Analysis & Interpretation Biomedical Ontology Development Knowledge Extraction From Scientific Litterature & Medical Reports Evidence Integration Protein Structure Modeling Phylogenetic Tree Construction Synthetic Biology

Biologie et computer sciences : l'interdisciplinarité à l'état brut Variabilité génétique chez l'homme : 0.1 % (vs. 0.2 % chez le chimpanzé) Longueur moyenne d'une chaîne proétique : 300-500 acides aminés. La plus longue : la protéine titine humaine avec 34 350 acides aminés, impliquée dans l'élasticité de la fibre musculaire tatou? Tatou pangolin félin

Biologie et computer sciences : l'interdisciplinarité à l'état brut Paris japonica Fleur de «parisette» > 150 109 pb

Nicolas Loménie Université Paris Descartes, Systèmes Intelligents de Perception http://w3.mi.parisdescartes.fr/sip-lab/ Nicolas.lomenie@parisdescartes.fr Cédric Gageat Institut de Biologie Physico-Chimique Laboratoire de Biochimie Théorique http://www-lbt.ibpc.fr Urszula Czerwińska Institut Pasteur Systems Biology Lab http://proteomics.fr/sysbio/