Puces à ADN (DNA chips) & Micro-réseaux (Microarrays) 1-TECHNOLOGIE DES PUCES

Documents pareils
TD de Biochimie 4 : Coloration.

CATALOGUE DES PRESTATIONS DE LA

Biomarqueurs en Cancérologie

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Big data et sciences du Vivant L'exemple du séquençage haut débit

Rapport Scientifique Seine-Aval 3

Introduction aux bases de données: application en biologie

Hépatite chronique B Moyens thérapeutiques

Introduction à la Génomique Fonctionnelle

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

MAP 553 Apprentissage statistique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

23. Interprétation clinique des mesures de l effet traitement

Disponibilité et fiabilité des services et des systèmes

MABioVis. Bio-informatique et la

CCP PSI Mathématiques 1 : un corrigé

Laboratoire de Photophysique et de Photochimie Supra- et Macromoléculaires (UMR 8531)

Leica DM4000 B LED. Une imagerie facilitée par un éclairage brillant!

La surveillance biologique des salariés Surveiller pour prévenir

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

Les outils de génétique moléculaire Les techniques liées aux acides nucléiques

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Microscopie de fluorescence Etat de l art

Identification de nouveaux membres dans des familles d'interleukines

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Les OGM. 5 décembre Nicole Mounier

Introduction au Data-Mining

FONCTION DE DEMANDE : REVENU ET PRIX

Les sciences de l ingénieur appliquées à la prise en charge du

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

et des sciences du vivant. Les microtechnologies

Enjeux mathématiques et Statistiques du Big Data

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La PCR quantitative (qpcr) et le guide de bonnes pratiques MIQE : adaptation et pertinence dans le contexte de la biologie clinique

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

UE : GENE Responsable : Enseignant : ECUE 1. Enseignant : ECUE 2. Dr COULIBALY Foungotin Hamidou

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation

Contrôle de l'expression génétique :

Détection et prise en charge de la résistance aux antirétroviraux

LES BIOTECHNOLOGIES DANS LE DIAGNOSTIC DES MALADIES INFECTIEUSES ET LE DÉVELOPPEMENT DES VACCINS

Spectrophotomètre double faisceau modèle 6800

Mesure de la surface spécifique

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Gènes Diffusion - EPIC 2010

Cuves pour Spectrophotomètres

L équipement informatique pour le module EECA. Kit d enregistrement (KE) Description des pré-requis techniques et de configuration minimale

IPANEMA IPANEMA ANCIENT MATERIALS RESEARCH PLATFORM. L. Bertrand, M. Thoury, S. Schöder IPANEMA USR3461 CNRS/MCC

Ventilation : Mesure et réglage des débits

Chapitre 7 : Structure de la cellule Le noyau cellulaire

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

SNMP for cloud Jean Parpaillon. SNMP4cloud - 1

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

AGRÉGATION DE SCIENCES DE LA VIE - SCIENCES DE LA TERRE ET DE L UNIVERS

SEQUENÇAGE LI-COR DNA 4200

Introduction au datamining

ANTICORPS POLYCLONAUX ANTI IMMUNOGLOBULINES

Exemple PLS avec SAS

Le Cloud au LIG? Pierre Neyron PimLIG

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

Gouvernance des mesures de sécurité avec DCM-Manager. Présentation du 22 mai 2014

L offre DualSun pour l eau chaude et le chauffage (SSC)

MESURE DE LA TEMPERATURE

Organigramme / Algorigramme Dossier élève 1 SI

Du Thermostat à l ordinateur climatique. Vincent Aubret Hortimax

ANALYSE DES TRANSCRIPTOMES : APPLICATIONS EN PHYSIOLOGIE ET PHYSIOPATHOLOGIE RÉNALES

Alarme domestique- Présentation

Transmission de données. A) Principaux éléments intervenant dans la transmission

Modélisation et simulation des performances de nœuds de routage optique dans les réseaux dorsaux hybrides

Les rencontres de l Agence de l eau Clermont Ferrand 10 janvier TECHNIQUES D EPURATION Dispositifs agréés Abdel LAKEL, CSTB

1 Culture Cellulaire Microplaques 2 HTS- 3 Immunologie/ HLA 4 Microbiologie/ Bactériologie Containers 5 Tubes/ 6 Pipetage

L équilibre Ressources Emplois de biens et services schématisé par une balance

Procédure d utilisation du Beckman CEQ 2000 XL pour la réalisation de programmes de séquençage ou de génotypage.

Diagnostic et suivi virologique des hépatites virales B et C. Marie-Laure Chaix Virologie Necker

MERLIN GESTION PATRIMONIALE. Groupe GESTION PATRIMONIALE. Définition d un programme de renouvellement

Apprentissage Automatique

Introduction au Data-Mining

Les bases de données

Probabilités sur un univers fini

La Latecion protection anti-intrusion Web Web Le concept «Zero effort Security» La protection des applications Extranet

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations

Environmental Research and Innovation ( ERIN )

Comment évaluer une banque?

Diagnostic des Hépatites virales B et C. P. Trimoulet Laboratoire de Virologie, CHU de Bordeaux

Improving the breakdown of the Central Credit Register data by category of enterprises

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Le MeiLLeuR RappORt qualité-prix

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

Outillage d atelier. Consommables

Commande Prédictive des. Convertisseurs Statiques

La classification automatique de données quantitatives

Nicolas Géraud CXO dasein interactions. Extraits de l intervention de

Transcription:

Puces à ADN (DNA chips) & Micro-réseaux (Microarrays) 1-TECHNOLOGIE DES PUCES Objectifs Principe Platformes technologiques Entités mesurables Applications Limites 3-BIOINFORMATIQUES DU TRANSCRIPTOME Pré-production sélection des sondes Production robotique, analyse d image, flux de données Post-production interprétations des résultats : expression différentielle, clustering, classification, réseaux géniques

Puces à ADN : 1-TECHNOLOGIE DES PUCES 1.1-Objectifs Mesures massivement parallèles & quantitatives de l expression des gènes (transcrits/arnm) : Northerns : niveau d expression d 1 gène / tissu Puces ADN : expressions de 10000 gènes / tissu voire de tous les gènes / organisme post-génome annotation relationnelle Transcriptome Génomique Fonctionnelle Protéome Interactome Métabolome génome inventaire pièces détachées élémt. répétés chromosomes gènes

1.2-Principe Hybridation complémentaire des acides nucléiques: Connues Inconnues : SONDES CIBLES 10 4 fragments ADN choisis ADNc,synthétiques immobilisés matrice ordonnée séquences source phase adressage population totale ARN échantillon cellules en solution marquées gène 1 gène 2 gène 3 gène 4 gène 1 gène 2 gène 4 Quantification : signaux proportionnels gène 1 = 10 gène 2 = 40 gène 3 = 0 gène 4 = 20 Hybridation Expression différentielle : test vs. contrôle canaux marqueurs hybridations mesures mono unique (P 33 ) successives normalisées bi double (Cy5/Cy3) simultanées ratios signal = f(marq,tps hyb,strg lav,tps exp,tps exp,q dépt,[cible]) niveau d expression = k x signal facteur de normalisation

1.3-Plateformes technologiques 1.3.1 cdna I.M.A.G.E. banques cdna: clones dbest séquençage banque d EST : séquences acgatgctagcta gctgatcgatcga tcgtagc clustering UniGene clusters d EST : gènes sélection de clones sélection de gènes 1 clone cdna = 1 gène Variantes : macro- micro-réseaux supports filtres nylon lames verre nylon nylon détection P 32 fluorescence colorimét. P 33 densité élts/cm 2 10-100 10000 5000 1000 spots (lxl mm) 3500 (80x120) 6400 (18x18) 9600 (27x18) 8500 (50x20) publié 1990 1995 1998 1999

Exemple d expérience: cdnas, lame de verre, fluorescence bi canaux gènes 8000 gènes : 4000 connus 2000 présumés 2000 inconnus 8102 clones : 8102 PCR Echantillons cliniques: référence : sein normal biopsie : cancer sein extraction ARNm (polya+) dépôts sur lame de verre (robot) 18x18mm marquage RT +Cy3-dUTP marquage RT +Cy5-dUTP hybridation 2 scans fluorescence (microscope laser confocal) répression: stable: induction: superposition normal canal vert cancer canal rouge

1.3.2 Oligonucléotides de synthèse GenBank dbest banque de séquence: gènes acgatgctagcta gctgatcgatcga tcgtagc sélection de 25mer spécifiques 20 sondes / gène: oligos synthèse puis dépôts synthèse in situ 20 oligos = 1 gène = robots spotteurs = imprimantes jet d encre photolithographie (Affymetrix) imprimantes jet d encre micro-réseaux puces à ADN supports lames verre silicium détection fluo bi canaux fluo mono canal densité élts/cm 2 10 000 200 000 gènes (lxl mm) 6400 (18x18) 15000 (13x13) publié 1995 1996

1.3.3 SAGE (Serial Analysis of Gene Expression) échantillons 3 5 5 3 5 3 extraction: ARNm RT : cdna + biotinylation 3 3 5 BsmFI 3 5 purif. frag. 3 (billes streptavidine) ligation oligo: site BsmFI digestion NlaIII 3 5 élution strept: digestion BsmFI 3 5 nx15bp ligation: concaténation 3 5 1 tag 15 bp / gène insertions plasmides 1.3.4 Futur = Microscopie Force Atomique (AFM) = Micro-balances = Adressage électronique = Microbilles & fibres optiques séquençage 10 5 tags: comptage

UniGene Build #120 Sequences Included in UniGene ============================= Known genes are from GenBank 117 (April 15,2000) ESTs are from dbest through 26-Aug-2000 37458 mrnas + gene CDSs 1044880 EST, 3'reads 471665 EST, 5'reads + 293644 EST, other/unknown ---------- 1847647 total sequences in clusters Final Number of Clusters (sets) =============================== 83566 sets total 13959 sets contain at least one known gene 82395 sets contain at least one EST 12788 sets contain both genes and ESTs Histogram of cluster sizes for UniGene Hs build 120 Cluster Number size of clusters 1 27193 2 14045 3-4 13025 5-8 9222 9-16 5608 17-32 3819 33-64 3786 65-128 3574 129-256 2218 257-512 748 513-1024 222 1025-2048 70 2049-4096 31 4097-8192 4 8193-16384 1 translation elongation factor 1 alpha 1

1.4-Entités mesurées Echelles : = expressions absolues nb copies ARNm / cellule = expressions relatives induction ou répression / état référence (ratio) échelle contrôle échantillon 1 échantillon 2 absolue 18.50 46.25 7.4 intuitive référence induction x 2.5 répression 2.5 relative brute 1.0 2.5 0.4 relative log 2 0 1.32-1.32 Variables mesurables: = abondance des transcrits (statique) : pulse = taux de transcription instantané (dynamique) : pulse/chase = taux de traduction instantané (dyn) : IP / anti-ribosomaux = interactions ADN/protéines : IP (ex : facteurs transcription)

1.5-Applications Recherche fondamentale = caractérisations des gènes de fonction inconnue = étude régulation transcription: promoteurs etc. = annotation relationnelle: réseaux géniques Recherche appliquée = identification de cibles thérapeutiques expression différentielle = diagnostique / pronostique clinique classification des pathologies = microbiologie, écologie impact environnement Classique hypothèse Génomique ignorance expériences cribblage compréhension pêche aux gènes fondamental appliqué

1.6-Limites Légitimité extrapolation niveaux mrna activité fonctionnelle produits protéiques? Régulations transcription / traduction / activité enzymatique Fiabilité : variations expérimentales, estimation des erreurs, significativité, reproductibilité, hybridation non-spécifique (contrôle qualité? taille Northerns) Artefacts liés aux mesures globales : méconnaissance des constantes & variables expérimentales fausses interprétations Homogénéité des échantillons : types cellulaires variés (tissus complexes, cellules normales/pathologiques etc.)

Puces à ADN : 3-BIOINFORMATIQUES DU TRANSCRIPTOME 3.1-Préproduction: SONDES 5 UTR épissage Microréseaux: sélection des clones cdna Génome: prédiction des gènes sélection des sondes EST: regroupement en clusters Puces à ADN: sélection des oligos spécificité Tm épissage

3.2 Production : LIMS Laboratory Information Management System Robotique = repiquage clones = PCR = dépôts microréseaux Analyse d image = quantification scans d hybridation Flux de données = bases de données = XML = annotation 10 exp 50 microréseaux 10000 gènes id/signal/disp/bruit/ double canaux = 40 millions données

3.3 Postproduction: interprétation des résultats 3.3.1 Comparaison 2 échantillons Expr. duplicat Expr. test vs. contrôle échantillon 1 4 2 0 2 4 échantillon 1 1 point=1 gène Expr. échantillon 1 4 2 expression différentielle 0 2 4 échantillon 2 Expr. 3.3.2 Analyse n>2 échantillons matrice n*k mesures d expressions tissu 1 tissu 2 tissu n gène 1 1.02.04 1.14 gène 2.972 1.57.783 gène 3.672 4.31 1.71 gène k 2.03.947.002 vecteurs d expression comparaisons profils (gènes / échantillons) outils analyse vecteurs / espace n dimensions

Outils de classification non-supervisée détecter sous-groupes supervisée discriminer classes faux + faux - n=2 dimensions 3 clusters n=2 dimensions 2 classes: & ordonner par similitude prédire appartenance distance représentation clusters: dendrogramme gène 5 gène 1 gène 3 gène 2 gène 6 gène 4 sensibilité: sb = VP VP + FN spécificité: sp = VP VP + FP fiabilité: distance à ligne démarcation co-régulés similitude fonction?

Clustering (classification non-supervisée) calcul distances entre chaque paire de vecteurs (gènes ou tissus) : =distance euclidienne =degré de corrélation eucl : - corr : + eucl : + corr : - gène k gène 4 gène 3 gène 2 gène 1 gène 1 gène 2 gène 3 gène 4 gène k d1k d2k d3k d4k 1 d14 d24 d34 1 d13 d23 1 d12 1 1 matrice de distances Clustering : = k-means = SOM s = hierarchique recalcul matrice de distances dimension -1 n-1 itérations paire gènes les + proches fondent 1 noeud 2 gènes remplacés par gène virtuel = moyenne des 2 vecteurs gène 4 gène 6

Classification supervisée Classificateurs construits sur : =discrimination linéaire (LDA) =arbres décisionnels =machines à support vectoriel (SVM) =analyse de voisinage (NJ) phase 1 apprentissage (classes connues, 1 er jeu vecteurs) phase 2 calibrage (classes connues, 2 e jeu vecteurs) phase 3 prédictions (classes inconnues, 3 e jeu vecteurs) Appliquée aux : = gènes prédiction fonctionnelle = échantillons diagnostique, cibles thérapeutiques Risque / matrice dissymétrique: nb attributs (gènes) >> nb objets (échantillons) toutes classes existe discriminateurs parfaits contrainte de complexité minimale Réseaux géniques ingéniérie concevoir signaux entrées réseaux déduire ingéniérie inverse signaux sorties

Puces à ADN : synoptique des technologies cdna oligonucleotides synth. SAGE radioactif colorimetrie fluorescent photolithogr. jet d encre dépôts séquençage cdna cloné oui oui oui non non non non gène séquencé non non non oui oui oui oui nouveaux gènes + + + - +++ ++ n/a tous inclus spécificité +++ +++ +++ + court ++ ++ +++ sensibilité +++ + + ++ ++ ++ variable gamme dynam. +++ - + ++ ++ ++ variable discrimin. fine - - - +++ +++ +++ + nb. canaux 1 (3?) 1 2 1 1+ 1+ n/a rapidité + +++ ++ ++ ++ ++ - coûts -/+ --/+ + ++++ ++? +++ ++