Imagerie Quantitative en Biologie Plusieurs casquettes pour le biologiste computationnel : (Nature Biotechnology, Vol. 31, Number 11, Nov. 2013) «- data analyst - data curator - database developer - statistician - mathematical modeler - bioinformatician - software developer - ontologist - and many more» Une tendance : - la preuve par l'image est une arme efficace à condition que cela soit statistiquement valide Une problématique : - l'articulation analyse génotype phénotype et l'analyse à toutes les échelles : du cellulaire à l'organisme Un besoin : - Le «High-Throughput Screening», le «High-Content Analysis» et l' «Open&Big Data»
L'extraction de marqueurs biologiques ou bio-marqueurs, c'est aussi de la segmentation quantitative d'images, défi essentiel du traitement et de l'analyse d'image DcellIG, NeuronStudio etc. CellProfiler : (pdf +url) De forts liens avec la reconnaissance de formes (pattern recognition) et l'apprentissage machine (machine learning), et la vision par ordinateur (computer vision) Pattern Analysis and Machine Intelligence, IEEE Et le «big data» : par essence, une image c'est des millions de pixels voire des milliards d'octets (multispectral, 3D plus temps, 5D etc. Le challenge de l'histopathologie numérique par exemple
PLOS Computational Biology A Peer-Reviewed, Open Access Journal Translational Bioinformatics : a collection of Education Articles, 2012 http://www.ploscollections.org/article/browseissue.action?issue=info:doi/10.1371/issue.pcol.v03.i11 Chapitre 17 : Bioimage Informatics for Systems Pharmacology Microscopie de Fluorescence haute résolution automatisé + robotique - ces appareillages couplés à des logiciels permettent l'étude systématique et peu coûteuse de divers changements morphologiques observés sur une large population de cellules sous diverses perturbations (composé médicamenteux, catalyseurs métalliques, interférences RNAi) statistiquement valide :-) «Bioimage informatics» = Analyse d'images + Informatique + Biologie + etc. - automatiser l'extraction d'éléments d'intérêt dans les images numériques (segmentation) - automatiser les mesures sur ces éléments d'intérêts et leur représentation voire leur diffusion (Open Data) - pour une analyse rapide? et objective? Encore beaucoup de challenge : scientifique et technologique - Illustration des challenges en bioimagerie quantitative à travers l'exemple d'études basées sur l'analyse des images pour la découverte de nouvelles molécules et cibles thérapeutiques - Le «High-Throughput Screening» et le «High-Content Screening» : identifier des composants ou des gènes qui provoquent les changements phénotypiques ciblés
"C'est ça, le principal critère. On avait quelque chose que l'on a pu transmettre en série et maintenir. Et nous avons vu qu'il s'agissait d'un rétrovirus non seulement à partir de son aspect visuel mais aussi par voie biochimique, par l'activité de transcriptase inverse qui est vraiment spécifique des rétrovirus.[...] Nous avons un atlas. Quand on est un peu habitué, on sait distinguer ce qui est un rétrovirus de ce qui n'en est pas un. On peut faire la distinction en se fondant sur la morphologie mais il faut une certaine habitude." Interview du Prof. Luc Montagnier dans Luc Montagnier a-t-il découvert le VIH? par Djamel Tahi, Continuum, hiver 1997. http://www.sidasante.com/journal/dtintlm.htm «Il est vrai que l'habitude peut parfois permettre de faire la distinction entre des particules ressemblant à des rétrovirus et des particules ressemblant à des virus en s'appuyant sur les traits morphologiques. Cependant, il existe des particules qui ne sont PAS des virus ni des rétrovirus et qui ont néanmoins des traits morphologiques identiques à ceux des rétrovirus. Par conséquent, on ne peut pas conclure à partir de simples considérations morphologiques que les bourgeonnements ou les particules détachées de la cellule sont des rétrovirus. Les cultures de tissus provenant de patients souffrant du SIDA contiennent une pléthore de particules ressemblant à des virus (particules virus-like) dont le diamètre va de 65 à 250 nm, qui ont des formes coniques ou allongées, avec des noyaux centrosymétriques ou tubulaires, ou même avec des noyaux doubles ou un mélange de noyaux.» Commentaire par Eleni Papadopulos-Eleopulos et al.
Microscopie et biologie - «Une image vaut tout un discours» en tout cas pour véhiculer une information - «Mille images font preuve» La microscopie optique classique a déjà permis de quantifier le nombre, la taille, la forme et le mouvement de cellules. Développement de protéines fluorescentes (par exemple protéines fluorescentes vertes et leurs dérivées : le prix Nobel de chimie décerné à Osamu Shimomura, Martin Chalfie et Roger Tsien le 8 octobre 2008 pour la découverte de la protéine GFP)
https://fr.wikipedia.org/wiki/microscopie_%c3%a0_fluorescence
Microscopie optique en champ clair (brigth field) avec marqueurs immunohistochimique Images 5D de milliers de cellules, 3D acquisition, time-lapse sequence, «multiple fluorescent probes» etc.
Études de Cas : «Découverte de molécules (drugs) et cible thérapeutiques (targets)» 1. Multicolor cell imaging-based studies ex. Phenotypic changes of proteins inside individual Drosophila Kc167 cells treated with RNAi libraries A representative image of Drosophila Kc167 cells treated with RNAi. The red, green, and blue colors are the DNA, F-actin, and α-tubulin channels. doi:10.1371/journal.pcbi.1003043.g002
Études de Cas : «Découverte de molécules (drugs) et cible thérapeutiques (targets)» 2. Live-cell imaging-based studies for cell cycle and migration regulatory discovery - 600 gènes parmi 22 000 gènes humains identifiés comme impliqués dans la mitose en utilisant des acquisitions d'images de cellules vivantes en accéléré et des traitements RNAi (projetwww.mitocheck.org étendu au projet www.mitosys.org) - Imagerie in vivo de cellules Hela utilisées pour découvrir des éléments régulant la mitose cellulaire Examples of HeLa cell nuclei and cell cycle phase images. (A) A frame of HeLa cell nuclei time-lapse image sequence; (B) Example images of four cell cycle phases. doi:10.1371/journal.pcbi.1003043.g003 imagerie intermittente/accélérée? (time-lapse imaging) pour l'étude de la dynamique de cellules souches et prédire le destin cellulaire de cellules neuronales progénitrices.
Études de Cas : «Découverte de molécules (drugs) et cible thérapeutiques (targets)» 3. Neuron Imaging-based Studies for Neurodegenerative Disease Drug and Target Discovery - Structure et Morphologie 3D du synapse neuronal avec microscopie à super résolution STED (prix nobel 2014) - Imager et reconstruire la structure 3D de neurones in vivo - Dégénérescence neuronale simulée en traitant des souris avec différents dosages de Aβ peptide qui peut causer la perte de neurites Alzheimer A representative image of neurites. Red indicates nuclei and green represents neurites. doi:10.1371/journal.pcbi.1003043.g005 A representative 2D neuron images. The bright spots near the backbones of neurons are the dendritic spines. doi:10.1371/journ al.pcbi.1003043.g 004
Études de Cas : «Découverte de molécules (drugs) et cible thérapeutiques (targets)» 4. Caenorhabditis elegans (C. elegans) Imaging-based studies and embryogenesis - Modèle biologique excellent : quelques centaines de cellules seulement pour étudier le développement et l'organisation cellulaire. - Étude du développement embryonnaire enregistré avec time-lapse imaging et linéage embryonnaire de chaque cellule reconstruite par suivi de cellules pour comprendre les fonctions des gènes impliqués dans le processus de développement. - Atlas de C. elegans quantifiant la localisation nucléaire et des statistiques sur les motifs spatiaux de développement construit sur la base de piles d'images confocales à l'aide du logiciel CellExplorer. CellProfiler founit un image analysis pipeline pour segmenter les corps cellulaires et quantifier les profils d'expression de protéines spécifiques comme clec-60 de différents individus C. elegans soumis à différents traitements.
En quoi consiste la Bio-Imagerie Quantitative? - Caractériser la fonction des molécules (drugs) et des cibles thérapeutiques (targets) par l'analyse quantitative des changements phénotypiques visuels à travers des algorithmes de : 1. Détection : «Object Detection» - détecter la localisation de différents objets : pour le comptage par exemple les centres de gravité suffisent, pour des structures simples cela peut inclure les problématiques de segmentation de frontières primaires de formes de type «blobs» : particules, noyaux de cellules ou de type «tubes» : neurones, vaisseaux sanguins. 2. Segmentation : «Object Segmentation» - délimiter les frontières «précises» et donc leur étendue spatiale d'objets d'intérêts individualisés dans les images : challenge encore ouvert dû à la variété des formes et des apparences de ces objets dans les images biologiques le paradoxe détection segmentation 3. Suivi : «Object Tracking» - étudier les comportements dynamiques et des changements phénotypiques d'objets au cours du temps (ex. progression du cycle cellulaire et de la migration cellulaire) time-lapse image sequence 4. Visualisation : «Object Visualisation» - nd image visualisation : Fiji, Icy, BioimageXD, NeuronStudio, Farsight et vaa3d pour les images 5D, ITK/VTK avec ParaView et ITK-SNAP pour 3D visualisation Définition de Objet : l'objet acquis par imagerie, cela peut être une cellule, un noyau etc.
En quoi consiste la Bio-Imagerie Quantitative? Intensité et forme 1. Détection : «Object Detection» : - Transformée en Distance à partir de la forme des blobs pour détecter des cellules qui se touchent : techniques par ligne de partage des eaux (watershed etc.) : la discipline de la morphologie mathématique (érosion, dilatation etc.) : théorie du filtrage non linéaire ou de rang (min, max) ; - Théorie du filtrage linéaire (convolution, filtres DOG, LOG, dérivées de gaussiennes) et algèbre linéaire (Hessian etc.) - Seuillage par filtrage dans l'espace des histogrammes ou de l'image ; - Méthodes par vote : Transformée de Hough, template matching - Apprentissage Automatique : machine learning ( le plugin Ilastik de imagej), - Algorithmes de graphes : Dijkstra's shortest-path pour suivre les structures linéaires An example of blob-structure (HeLa cell nuclei) detection. The red spots indicate the detected centers of objects. doi:10.1371/journal.pcbi.1003043.g00 An example of neurite centerline detection. (A) The centerline confidence image obtained by using the local Gaussian derivative features. Higher intensity indicates higher confidence of pixels on the centerlines. (B) The neurite centerline detection result image. Different colors indicate the disconnected branches. doi:10.1371/journal.pcbi.1003043.g008
En quoi consiste la Bio-Imagerie Quantitative? Intensité et forme 2. Segmentation : «Object Segmentation» : - Seuillage simple, entropique, Otsu, seuillage flou par Fuzzy K-means pour la segmentation fond/objets (background/foreground segmentation) ; - Watershed et dérivés pour les clusters de cellules agrégés qui se touchent (marker-controlled watershed) (lien avec la segmentation de type graphe de Voronoï dans le logiciel CellProfiler) - Méthodes par contours actifs : EDP sur les profils d'intensité, contour actif géométrique etc. - Technique dite de Graph cuts - Machine learning, le plugin Ilastik plugin de ImageJ, méthodologie SLIC An example of HeLa nuclei segmentation using the seeded watershed algorithm. The green contours are the boundaries of nuclei. doi:10.1371/journal.pcbi.1003043.g009 An example of segmentation of Drosophila cell images using the level set approach combiné au watershed/voronoi contrôle doi:10.1371/journal.pcbi.1003043.g010
En quoi consiste la Bio-Imagerie Quantitative? Intensité et forme 3. Suivi : «Object Tracking» : - 3 types de méthodes de modélisation algorithmique : x x x fondé sur un modèle d'évolution ; adaptation des algorithmes de segmentation à un volume spatio-temporel ; reposant sur un bouclage segmentation-suivi ;
En quoi consiste la Bio-Imagerie Quantitative? Intensité et forme Ici on opère un glissement progressif de l'analyse d'image (points 1 à 4) vers la reconnaissance de formes et le machine learning 5. Extraction de caractéristiques : «Numerical Features and Morphological Features» : Caractéristiques numériques : - multi-échelles comme les ondelettes ou wavelets (ondelettes de Gabor, de Daubechies utilisées en compression jpeg, mepg par exemple etc.) ; - géométriques ou morphologiques comme les moments de Zernike, la compacité ; - radiométriques comme l'intensité moyenne ou sa variance ; - de texture comme les coefficients de Haralick ; - voir http://murphylab.web.cmu.edu/services/slf/features.html Caractéristiques biologiquement significatives (phénotypes) Exemple 1 : Identification de phases connues du cycles cellulaires : - à l'aide par exemple de la durée d'une phase de ce cycle : ex. interphase, prophase et métaphase (2 cycles courts) et anaphase + Prometa-, Ana 1-, Ana 2- et Télophase cette identification s'apparente à un problème de classification ou reconnaissance de formes : extraction de caractéristiques numériques comme la durée + SVM, K plus proches voisins (KNN), Classifieur Bayésien Naïf + GMM, HMM)
En quoi consiste la Bio-Imagerie Quantitative? Intensité et forme 5. Extraction de caractéristiques : «Numerical Features and Morphological Features» : Caractéristiques biologiquement significatives (phénotypes) A segment of cell cycle procession sequence. Four cell cycle phases, interphase, prophase, metaphase, and anaphase, appear in order. doi:10.1371/journal.pcbi.1003043.g014 The graphical representation of cell cycle phase identification (HMM) doi:10.1371/journal.pcbi.1003043.g015 Exemple 2 :Un phénotype défini par l'utilisateur, son identification et sa classification : soit par inspection humaine inspection (voir ci-dessous) soit par découverte automatique (GMM, clusteringn, rule and decision tree classifier, A representative image of Drosophila cells with three phenotypes: (A) Normal, (B) Ruffling and (C) Spiky phenotypes. doi:10.1371/journal.pcbi.1003043.g 016
En quoi consiste la Bio-Imagerie Quantitative? Intensité et forme Et là on est au cœur des problématiques de machine learning et de «big data» 6. Classification et Prédiction : «Multidimensional Profiling Analysis» : - Caractériser les fonctions des médicaments et cibles, les regrouper en clusters de changements phénotypiques similaires et identifier les candidats à l'origine de changement phénotypique voulu. CellProfiler Analyst, PhenoRipper, KNIME (pipeline and workflow system) Grâce à des techniques issues de l'apprentissage automatique dite de profilage multidimensionnel parmi lesquelles onpeut trouver : Analyse par Clustering - Clustering Hiérarchique, Clustering par Consensus, Cluster 3.0, Java TreeView Analyse Factorielle Multivariée Subpopulation-based Heterogeinity Profiling Analysis Multivariée à base de SVM