Formation INSERM : Les Biopuces

Documents pareils

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Visual Paradigm Contraintes inter-associations

Introduction aux bases de données: application en biologie

TD de Biochimie 4 : Coloration.

Spectrophotomètre double faisceau modèle 6800

Ingénieur R&D en bio-informatique

CATALOGUE DES PRESTATIONS DE LA

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

PostgreSQL. Formations. Catalogue Calendrier... 8

Annexe commune aux séries ES, L et S : boîtes et quantiles

Traitement d un AVI avec Iris

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

--- SIDOMTECH (Auto-Entreprise) ---

Introduction à MATLAB R

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Information utiles. webpage : Google+ : digiusto/

La Stratégie d Intégration Advantage

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

La problématique de la Préservation des Bases de Données. Olivier ROUCHON CINES Groupe PIN Jeudi 7 Octobre

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

Les technologies du Big Data

PostgreSQL. Formations. SQL avancé Calendrier... 18

FileMaker Server 11. Publication Web personnalisée avec XML et XSLT

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Scanner laser HDS7000 Ultra rapide, à portée étendue

Présentation du module Base de données spatio-temporelles

Logiciel XLSTAT version rue Damrémont PARIS

Scanner de film numérique

LIDAR LAUSANNE Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

MyReport, LE REPORTING SOUS EXCEL

Mini_guide_Isis_v6.doc le 10/02/2005 Page 1/15

Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE VINCENNES

ZABBIX est distribué sous licence GNU General Public License Version 2 (GPL v.2).

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

Fête de la science Initiation au traitement des images

ATELIER IMAGEJ. Différentes applications vous sont proposées pour apprendre à utiliser quelques fonctions d ImageJ :

Industrialiser la chaîne complète de fabrication 1ère partie - Les bénéfices de la solution logicielle IBM VisualAge Pacbase / Rational

PostgreSQL. Formations. Calendrier... 14

Documentation Technique du programme HYDRONDE_LN

PHP. Performances. Audit et optimisation LAMP. Julien Pauli. Cyril Pierre de Geyer. Guillaume Plessis. Préface d Armel Fauveau

Big data et sciences du Vivant L'exemple du séquençage haut débit

Programme détaillé. Administrateur de Base de Données Oracle - SQLServer - MySQL. Objectifs de la formation. Les métiers

Gestion des bases de données

Modules Multimédia PAO (Adobe)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Tutoriel QSOS. Version /02/2013

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

Programmation Web. Madalina Croitoru IUT Montpellier

Retour d expérience sur Prelude

Historian Server & Client 2012

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x

CONCEPTION ET IMPLANTATION DES SI PROJET : GESTION DU FOYER DE L ENIT

Note de service À : De :

FileMaker Pro 12. Guide de l utilisateur

Urbanisation des SI-NFE107

Hébergement MMI SEMESTRE 4

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

TP Administration Oracle

A.E.C. GESTION DES APPLICATIONS TECHNOLOGIE DE L'INFORMATION LEA.BW

Gnuplot. Chapitre Lancer Gnuplot. 3.2 Options des graphes

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

FICHE DE POSTE. Gestionnaire des données du Portail des savoirs (H/F)

données en connaissance et en actions?

Faire un semi variograme et une carte krigée avec surfer

Découvrir le CMS. et l utiliser dans une approche pro!

Transmission d informations sur le réseau électrique

1. La plate-forme LAMP

SIO-SISR : Projet GSB. LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc. BTS Services Informatiques aux Organisations 1 ère année

Les solutions centre de données virtuel et Infrastructure-service de Bell

Nouveautés Ignition v7.7

BIRT (Business Intelligence and Reporting Tools)

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR

Business Intelligence simple et efficace avec Excel et PowerPivot

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Une plateforme logicielle pour une gestion colorimétrique globale

La Business Intelligence en toute simplicité :

Station Totale Geomax Série Zoom30

Atelier marin. - Vers un suivi optimal des lagons et récifs -

ACQUISITION. Traitement de l image. Classement. Préparation. Ouverture. Performance

SOLUTION ONLINE DE GESTION

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Le traitement du 5ème concours A.I.P. pour l objet SH2-155 de Franck JOBARD

Extraction d informations stratégiques par Analyse en Composantes Principales

Présentation du PL/SQL

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Comment insérer une image de fond?

MISE EN PLACE D UNE SOLUTION DE SURVEILLANCE PERMETTANT DE SUPERVISER LES BASES DE DONNÉES

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB / 16

Utilisation du logiciel ImageJ gratuit

MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.

Gestion collaborative de documents

Opérations de base sur ImageJ

Vidéo Haute définition pour Station Service

Francis Mignault. ! Coauteur : Expert Oracle Application Express. ! Membre du Oracle APEX Advisory Board apex.oracle.com/vote

Transcription:

Formation INSERM : Les Biopuces Méthodes bioinformatiques d analyse des puces à ADN : analyse de l'image, normalisation et stockage des données ENS - 7 février 2004 Laboratoire de Génétique Moléculaire - CNRS Laboratoire de Biologie Moléculaire du Développement - INSERM Plate-forme transcriptome - ENS Stéphane LE CROM - lecrom@biologie.ens.fr

La bioinformatique dans une expérience biopuces Étapes expérimentales Puces commerciales Puces maison Mise au point expérimentale - dessin des oligos - dessin de l expérience Analyse des données Base de données disponibles Hybridation des puces Fouille de données Analyse de l image Traitement des données brutes - Normalisation - Analyse statistique - Stockage Traitement des données Représentation informative des données - Regroupement

Analyse bioinformatique des puces à ADN Analyse de l image

Les différents types d images rencontrés Echelle de couleur = Echelle Quantitative Puces à ADNc/oligonucleotides - ENS - 2 canaux - Superposition (= Ratio) Puces à Oligonucleotides (GeneChip) - Affymetrix - 1 canal - Intensité (= quantité d ARN)

Lecture du résultat des hybridations Excitation des fluorochromes à la longueur d onde appropriée GenePix 4000 - Axon Instrument (http://www.axon.com/gn_genomics.html) ScanArray - Packard BioChip Technologies (http://www.packardbioscience.com) GeneTAC Microarray Analyzers - Genomic Solutions (http://www.genomicsolutions.com) IRIS - University of Pennsylvania (http://www.nhgri.nih.gov/dir/lcg/15k/html/)

Obtention de l image Longueur d onde du Cy5 Longueur d onde du Cy3 Image finale

Principes généraux de l analyse d image But : Convertir l image en valeurs numériques quantifiant l expression des gènes Il existe des logiciels d analyse d image ScanAlyze (M. Eisen Stanford University) Genepix Pro (Axon software)

Les différentes étapes de l analyse d image 1 Localisation des spots sur la lame Pour chaque spot : 2 Délimitation des pixels correspondant à la zone d hybridation 3 Délimitation des pixels pour l estimation du bruit de fond 4 Calcul de l intensité globale de fluorescence Sur l ensemble de la lame : 5 Identification des spots déformés par des artéfacts

1- Localisation des spots sur la lame Il est important d assigner à chaque spot un identifiant de gène correct!

2 - Délimitation des pixels de la zone d hybridation Différentes méthodes sont possibles (segmentation)!: - Cercles à diamètres fixes - Cercles à diamètres variables - Histogrammes - Formes «!adaptée!» Cercles à diamètre fixe Cercles à diamètre variable Plusieurs logiciels sont disponibles!: - GenePix Pro - ScanAlyze - QuantArray - ImaGene - Dapple D après «!Microarray Bioinformatics!», Dov Stekel Intensité variable Méthode par histogramme

3 Délimitation des pixels du bruit de fond Les signaux observés ont deux composantes : Fluorescence issue d une hybridation spécifique Fluorescence non spécifique : Bruit de fond Analyse des pixels localisés à proximité de la région spottée : Méthode «ScanAlyze» Méthode «ImaGene» Méthode «GenePix» Zone de spotting Bruit de fond

4 Calcul de l intensité globale de fluorescence Intensité net = Intensité brute - Bruit de fond Intensité à l intérieure du spot Mesure du bruit de fond Intensité par pixel Moyenne ou médiane? Intensité globale du spot Critère qualité : taille du spot, déviation standard

Exemples : 5 Annotation des spots non conformes Solutions : fi Toujours regarder les contrôles qualité des lots de lames commandés fi Se référer aux aides en ligne (http://www.corning.com/lifesciences/technical_information/techdocs/ troubleshootingultragaps_prontoreagents.asp) fi Élimer les spots artefactuels à l aide d un filtre manuel ou automatique

La récupération des résultats de l analyse d image Exemple d un fichier de sortie de logiciel d analyse d image : Position Intensités Taille Homogénéité Statistiques Brutes BDF Annotations

Analyse bioinformatique des puces à ADN La normalisation d une lame

Les sources de variations d une puce à ADN Quantité d ADN Efficacité de : - l extraction des ARN - la reverse transcription - l étape du marquage - des fluorochromes Erreur systématique => Effets similaires sur plusieurs mesures => Les corrections peuvent se mesurer à partir des données Rendement de la PCR Qualité des ADN déposés et du spotting Effets de cross-hybridation et hybridation non spécifique Erreur stochastique => Effets qui se produisent de façon trop aléatoire et qui du coup ne peuvent se mesurer comme du bruit Calibration Modèle d erreur

1 ère étape : Le nettoyage des données 1 Élimination des gènes dont l annotation est différente de 0 (Éventuellement retourner voir l image originale) 2 Filtrage sur les intensités : - Saturation du scanner - Écart avec le bruit de fond trop faible 3 Il est nécessaire d appliquer certaines transformations mathématiques au données pour faciliter leur analyse :

2 ème étape : La normalisation Pourquoi faire? Pour corriger les différences systématiques entre les mesures sur la meme lame qui ne représentent pas de véritables variations biologiques. Pourquoi la normalisation est nécessaire? En examinant les réplicats contre le même échantillons, où de vraies différences d expression ne doivent pas apparaître. 500.000 spots Extrémités des pointes de dépôt 300.000 spots fi La normalisation des résultats des puces à ADN permet la comparaison de plusieurs expériences (référence commune) fi Plusieurs méthodes sont disponibles pour effectuer cette normalisation fi La normalisation calibre les erreurs systématiques (et non stochastique) fi Il est indispensable d effectuer deux transformations mathématiques sur les résultats bruts avant de normaliser les données

La transformation logarithmique Les effectifs sont plus important vers les faibles intensités Les intensités sont distribuées de façon uniforme Remarque : On choisira le logarithme en base 2 pour les analyses

Effet sur la distribution des intensités : La transformation logarithmique La plupart des intensités mesurées sont faibles Distribution «en cloche» Recentrage de la distribution : Facilite l utilisation des statistiques D après «Microarray Bioinformatics», Dov Stekel

La rotation des graphiques log 2 R vs log 2 G M=log 2 R/G vs A=log 2 RG

Les graphiques MA (MA plot) Différences des intensités : M = log ratio = log f/g = log f - log g Contre la moyenne géométrique des intensités : A = log moyenne géométrique = log fg = [log f + log g]/2. En règle générale, f = intensité en Cy 5 pour un spot sur une puce sur lame de verre ADNc et g = intensité Cy3 pour le même spot sur la même lame.

2 ème étape : La normalisation Le but est d ajuster ou de corriger les données brutes dans l espoir d enlever les effets systématiques, en gardant à l esprit : que la distinction entre les effets systématiques et les autres est souvent loin d'être claire; qu il est d habitude assez difficile de démontrer que l on améliore et pas que l on diminue le «vrai» signal; que déterminer de façon juste quel est l ajustement idéal est très difficile.

Quels spots utiliser pour normaliser? Utilisation de contrôles positifs - Prise en compte de spots contenant des gènes de ménages ou de l ADN génomique - Les contrôles positifs doivent être détectables, posséder une expression stable et tomber dans la gammes de détection du scanner Avantage : peu de gènes sont nécessaires Inconvénient : ces gènes subissent trop de fluctuations non contrôlées dans les systèmes biologiques Mesure de l intensité globale - Utilisation de l intensité globale sur toute la membrane, mesurée pour tous les spots - La mesure de l intensité globale doit s effectuer sur un nombre suffisant de spots et doit utiliser des valeurs homogènes Avantage : mesure efficace sur un grand nombre de spots Inconvénient : il est nécessaire que la majorité des gènes analysés n ait pas une expression modifiée

Les différentes méthodes de normalisation 1) Normalisation basée sur un ajustement global : log 2 R/G Æ log 2 R/G - c = log 2 R/(kG) Régression linéaire Cy5/Cy3 Le choix pour k ou c = log 2 k sont de plusieurs types : c = médiane ou moyenne des log de ratios pour un gène particulier ou un ensemble de gènes (gènes de ménage) c = normalisation en utilisant les intensités totales où : k = R i / G i. MA plot avec médianes 0

Les différentes méthodes de normalisation 2) Normalisation dépendante des intensités : Dans ce cas on trace une ligne à travers le centre des MA plot, en modifiant la valeur de M dans chacun des points (M,A) en utilisant c=c(a), soit : log 2 R/G Æ log 2 R/G - c (A) = log 2 R/(k(A)G). Une estimation de la valeur de c(a) est faite en utilisant une méthode de régression qui utilise la fonction lowess de Cleveland (1979) : LOcally WEighted Scatterplot Smoothing Normalisation intensités globales Normalisation dépendante des intensités

La normalisation par Lowess Courbe de régression Les paramètres à prendre en compte : - La taille des fenêtres - Le chevauchement des fenêtres Régression linéaire locale Avant Après

Comment s affranchir des effets spatiaux? Effet de bloc ou de pointe de dépot

Les différentes méthodes de normalisation 3) Normalisation en prenant en compte les pointes de spotting En plus des variations dépendantes de l intensité, un biais spatial peut aussi être une source importante d erreur systématique. Peu de méthodes de normalisation corrigent les effets spatiaux qui produisent des artéfacts d hybridation comme les pointes de spotting ou les différentes plaques lors de la production des lames. Il est possible de corriger en même temps les biais dû à l intensité et aux différentes pointes utilisées en effectuant une régression par Lowess sur les données à l intérieur de chaque groupe de pointes soit : log2 R/G Æ log2 R/G - ci(a) = log2 R/(ki(A)G), où ci(a) est le coefficient de régression Lowess sur le MA plot pour la grille i.

Lowess par groupes de pointes Lame de verre Lames de verre avec ADNc 4x4 blocs = 16 groupes de pointes

Les différentes méthodes de normalisation Avantages Inconvénients ----- Régression linéaire (Cy5 vs Cy3) ----- Méthode très simple Bonne vision d ensemble des données Asymétrie entre Cy5 et Cy3 Peu efficace sur les nuages déformés ----- Régression linéaire «MA plot» ----- Méthode très simple Alignement sur une horizontale Peu efficace sur les nuages déformés ----- Lowess ----- Marche bien sur les nuages déformés Correction à la fois des intensités en Cy5 et Cy3 Requiert l utilisation de logiciels statistiques Nécessite de faire attention aux paramètres de la régression

Conclusions sur la normalisation Il y a quelques hypothèses à garder à l esprit : Utiliser la méthode Loess global implique qu à l échelle de l abondance des ARNm : - seule une minorité des gènes est différentiellement exprimée - il y a un nombre égal de gènes différentiellement exprimés induits ou réprimés Pour les méthodes spécifiques par bloc, il est nécessaire que les conditions précédentes soient respectées pour chaque bloc. D un point de vue statistique, le nombre de spots concerné par la méthode ne doit pas être trop petit. Utiliser un sous-ensemble de gènes spécifiques pour la normalisation (control, gènes de ménage) implique des hypothèses similaires. Il y a des améliorations à apporter : Utilisation d une méthode de normalisation adaptée aux données utilisées. Il est important de ne pas écraser les variation et de ne pas créer de faux positifs.

La normalisation : Conclusions sur la normalisation - Réduit les effets systématiques (non aléatoires) - Rend possible la comparaison entre plusieurs puces à ADN On recommande : - D effectuer la transformation en log2 ratios (MA plot) - D utiliser la normalisation Loess pour corriger le biais de fluorochrome. - D utiliser une normalisation par pointe (Loess ou médiane) pour prendre en compte les biais spatiaux. - De garder à l esprit que la normalisation change les données brutes : il est donc nécessaire d adapter la méthode de normalisation aux données. - De garantir les mêmes conditions techniques pour toutes les lames qui seront utilisées dans vos expériences (même manipulateur, même scanner, même lot de lames ) - De ne pas hésiter à passer du temps sur les contrôles qualité En principe : - Les spots mauvais seront éliminés en faisant plusieurs réplicats => La chose la plus difficile c est de corriger les bias techniques sans rien changer au signal étudié

Analyse bioinformatique des puces à ADN La normalisation entre lames

Normalisation La normalisation avec les puces Affymetrix Comparaison entre deux expériences : - Chaque condition est hybridée sur une seule membrane/lame. - L utilisation des intensités globales permet la normalisation de toutes les valeurs et donc la comparaison des deux expériences Standardisation Comparaison entre plusieurs expériences : - Toutes les expériences doivent être comparées à une condition contrôle. - Il est nécessaire d utiliser une intensité cible, fixée arbitrairement ou obtenue de façon absolue (gènes de ménage).

Box plots Chaque distribution des données d une expérience est représentée par une boîte On peut visualiser directement la forme globale de la distribution (moyenne, écart-type) et comparer facilement et rapidement les log 2 (ratios) Outliers Upper quartile Median 1.5 IQR Lower quartile Outliers

La normalisation entre lames Hypothèse : Les variations des distributions observées ne sont pas des changements biologiques réels Box plot des distributions des log2(ratios) pour 3 hybridations identiques (réplicats): Gauche : sans aucune normalisation Centre : après une normalisation Loess par bloc (centrage) Droite : après une normalisation entre lames (réduction)

Quelques références sur la normalisation Quackenbush J. Microarray data normalization and transformation. Nat Genet. 2002 Dec;32 Suppl:496-501. Yang YH, Dudoit S, Luu P, Lin DM, Peng V, Ngai J, Speed TP. Normalization for cdna microarray data: a robust composite method addressing single and multiple slide systematic variation. Nucleic Acids Res. 2002 Feb 15;30(4):e15. Leung YF, Cavalieri D. Fundamentals of cdna microarray data analysis. Trends Genet. 2003 Nov;19(11):649-59.

Analyse bioinformatique des puces à ADN Le stockage des données

Gestion du flux d information obtenu Exemple d une structure de gestion des données Base de données Base de données Web Publiques Internet Intranet Images obtenues avec le scanner Images Analyse d images Données brutes Serveur de Fichier Données brutes Résultats normalisés Normalisation Données publiées Résultats normalisés Interface serveur

L organisation des données de puces à ADN Il y a trois grands niveaux d organisation des résultats : 1. Les entrepôts de données publics Construits de la façon la plus flexible possible pour permettre le stockage de données hétérogènes provenant d organismes différents et traités dans des conditions différentes. 2. Les bases de données institutionnelles Construites dans le but de répondre à une communauté d utilisateur sur un plateau technique particulier. 3. Les bases de données installées localement Construites pour un petit groupe d utilisateur et à même de répondre à des besoins particuliers et spécifiques.

Un élément central : le LIMS Base de données locale pour le suivi des expériences LIMS = Laboratory Information Management System - Toutes les étapes du protocole expérimental sont stockées dans la base de données. - Le LIMS permet le suivi des lames et des contrôles de qualité. - La structure flexible du LIMS permet l analyse de différents types de lames. - Un ensemble de tables de correspondance est disponible pour aider à la détermination du nom des gènes et la liaison avec la fouille de données. - Le stockage des données et des processus permet différents types de visualisation - Les caractéristiques du LIMS sont paramétrables et ajustables aux besoins (tables supplémentaires, modules d interrogation spécifiques). Le LIMS se doit d être modulaire Lames de verre Puces à oligonucléotides

La construction d un LIMS Les étapes clefs de la construction d une base de données : 1. Bien choisir son gestionnaire de base de données - Prendre en compte son prix, sa facilité d utilisation et ses capacités à s agrandir Robustesse Simplicité Prix Oracle *** * MS SQL ** ** PostgreSQL ** * 0 MySQL ** * 0 Access * *** FileMaker * *** 2. Prendre son temps pour réfléchir au modèle à utiliser 3. Penser aux aspects de sécurité des données (perte de données, corruption, ) 4. Toujours conserver les données sous leur forme d origine

La construction d un LIMS Les étapes clefs de la construction d une base de données : 5. Créer des filtres pour l import et l export des données - Certains langages sont plus adaptés à ce type de manipulations (PHP, Perl, Java, ) 6. Construire des liens vers les données externes 7. Utilisez les standards disponibles - HTML, SQL - MIAME, MAGE-OM 8. Conservez des traces des modifications et des étapes de traitement des données 9. Pensez à SAUVEGARDER vos données 10. Essayez de construire une structure évolutive - Il est impossible de résoudre tous les problèmes en une fois

Les bases de données pour les puces à ADN Les projets Open Source : BASE MADAM MaxdSQL Installation locale SMD GeneX Entrepôts publics ArrayExpress GEO GXD RAD ChipDB Interrogation publique

BASE - BioArray Software Environment Une base de données pour la gestion en locale des résultats de puces à ADN : Structure sous forme de plug-in Stockage de toutes les étapes importantes d une expérience de puces à ADN Répond aux standards MIAME et MAGE-ML Projet Open Source (MySQL/Linux) Site web : http://base.thep.lu.se/

But : Les entrepôts de données d expression - Offrir l accès aux données brutes pour valider les données publiées - Permettre la comparaison avec d autres groupes - Permettre la comparaison des design de puces - Favoriser le développement de nouvelles méthodes d analyse Exemples : - ArrayExpress - EBI - Gene Expression Omnibus - NCBI - Stanford Microarray Database - Stanford - ExpressDB - Harvard http://www.ncbi.nlm.nih.gov/geo/

La standardisation des données - MGED Pourquoi définir un standard? - Pour spécifier quelles sont les informations minimales à donner pour caractériser une expérience de puces à ADN - Pour permettre l interprétation des données ainsi que la vérification par d autres - Pour faciliter la mise en place d entrepôts de données ainsi que l échange de résultats entre les laboratoires http://www.mged.org

La définition d un standard - MIAME MIAME - Minimum Information About Microarray Experiment : - Le standard MIAME est défini comme l ensemble des informations minimales qui doivent être fournies avec les données de puces à ADN pour permettre leur utilisation, re-normalisation ou ré-interprétation éventuelle. - Ce standard est constitué de 6 différentes parties : 1. Le modèle expérimental : contient l ensemble des informations d hybridation. 2. Le modèle des puces à ADN : contient les informations sur chaque puce utilisée et sur les éléments (spots) qui y sont présents. 3. Échantillons : contient la description de chaque échantillons employés avec les conditions de préparation et de marquage. 4. Hybridations : contient les protocoles et paramètres. 5. Mesures : contient les données, les images et les méthodes de quantification. 6. Contrôles : contient la description des différents contrôles utilisés.

yeast Microarray Global Viewer (ymgv) Permettre l accès simple aux données d expression publiées : 1 profil par publication 1 histogramme par condition (expérience) Fouille de données : nom de gène gene ontology variations http://transcriptome.ens.fr/ymgv/

yeast Microarray Global Viewer (ymgv) Récapitulatif des expériences : Validation des méthodes d analyses : Comparaison entre organismes : Recherche de gènes co-exprimés :

La bioinformatique et le «transcriptome» à l ENS Stéphane LE CROM - Gaëlle LELANDAIS - Sophie LEMOINE - Laurent JOURDREN http://transcriptome.ens.fr