Utilisation de relations ontologiques pour la comparaison d images décrites par des annotations sémantiques

Documents pareils
La classification automatique de données quantitatives

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Laboratoire 4 Développement d un système intelligent

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Extraction de caractéristiques visuelles d'images médicales pour la recherche par similitude et l'aide au diagnostic

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Ressources lexicales au service de recherche et d indexation des images

Intégration de la dimension sémantique dans les réseaux sociaux

Introduction au Data-Mining

RI sociale : intégration de propriétés sociales dans un modèle de recherche

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Mesure agnostique de la qualité des images.

INF6304 Interfaces Intelligentes

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Propriétés du Document EMA. Résumé

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Une méthode d apprentissage pour la composition de services web

Classification Automatique de messages : une approche hybride

Introduction au datamining

Vers une Optimisation de l Algorithme AntTreeStoch

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Apprentissage Automatique

Introduction au Data-Mining

Hervé Couturier EVP, SAP Technology Development

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Détection et suivi d'objets dans une séquence d'images par contours actifs

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Projet de Traitement du Signal Segmentation d images SAR

Étude de données multisources par simulation de capteurs et clustering collaboratif

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

Formula Negator, Outil de négation de formule.

Proposition des cadres d évaluation adaptés à un système de RI personnalisé

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1

L usage des concepts du web sémantique dans le filtrage d information collaboratif

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Big Data et Graphes : Quelques pistes de recherche

Vérification audiovisuelle de l identité

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Une approche pour l extraction automatique de structures sémantiques de documents XML

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Agrégation des portefeuilles de contrats d assurance vie

Modélisation géostatistique des débits le long des cours d eau.

Projet : Recalage par maximisation de l information mutuelle

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Face Recognition Performance: Man vs. Machine

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Once the installation is complete, you can delete the temporary Zip files..

Apports des réseaux sociaux dans les SI

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Classification non supervisée

Ingénierie et gestion des connaissances

Reconnaissance de gestes : approches 2D & 3D

Laboratoire d Automatique et Productique Université de Batna, Algérie

Exercices Corrigés Premières notions sur les espaces vectoriels

Économétrie, causalité et analyse des politiques

Recherche d Information(RI): Fondements et illustration avec Apache Lucene. par Majirus

Big Data et Graphes : Quelques pistes de recherche

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)

Les structures de données. Rajae El Ouazzani

Étude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux?

Modélisation du comportement habituel de la personne en smarthome

Cognit Ive Cas d utilisation

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

Conception d un lecteur de musique intelligent basé sur l apprentissage automatique.

L évaluation d algorithmes d analyse vidéo Quelques pistes

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Apprentissage statistique dans les graphes et les réseaux sociaux

Les ontologies pour modéliser les processus de soins en établissement de santé

Limitations of the Playstation 3 for High Performance Cluster Computing

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Editing and managing Systems engineering processes at Snecma

Semantic Web Inside Guillaume Érétéo Directeur R&D

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Contrôle stochastique d allocation de ressources dans le «cloud computing»

Revision of hen1317-5: Technical improvements

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences

Université de XY University of XY. Faculté XY Faculty of XY

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

SARM: Simulation of Absorption Refrigeration Machine

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Les algorithmes de fouille de données

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Informatique / Computer Science

Arbres binaires de décision

RAPID Prenez le contrôle sur vos données

Title Text. Gestion de données de mobilité Mobility data management

Résolution d équations non linéaires

Transcription:

Utilisation de relations ontologiques pour la comparaison d images décrites par des annotations sémantiques Camille Kurtz, Daniel L. Rubin LIPADE (EA 2517), Université Paris Descartes - camille.kurtz@parisdescartes.fr QIL (School of Medicine), Stanford University - dlrubin@stanford.edu Résumé. Face à la complexité des nouvelles générations d images médicales, les processus de recherche d images basés sur leurs contenus visuels peuvent s avérer insuffisants. Cet article propose une nouvelle approche basée sur l annotation des images via des termes sémantiques pouvant pallier ce problème. Elle repose sur la combinaison d une distance hiérarchique permettant de comparer les images en considérant les corrélations entre les termes utilisés pour les décrire et d une mesure de similarité permettant d évaluer la proximité sémantique entre des termes ontologiques. Cette approche est validée dans le cadre de la recherche d images tomodensitométriques. 1 Introduction Les méthodes automatiques de recherche d images fournissent un moyen d aide à la décision dans de nombreux domaines d application. Dans le domaine médical, elles permettent d assister les radiologues lors de leur travail d interprétation d images en identifiant des images similaires au sein de bases de données. Un cas typique d utilisation est la recherche par l exemple où l on souhaite retrouver des images similaires à un exemple d image donné en requête correspondant à un examen médical. Pour ce faire les images sont généralement décrites par leurs caractéristiques bas-niveaux (e.g., couleur, texture) induites de leurs pixels et une mesure de distance est utilisée pour rechercher des images similaires dans l espace des caractéristiques. Cependant, face à la complexité des nouvelles générations d images médicales, les processus de recherche d images basés sur le contenu peuvent s avérer insuffisants. Une des limites principales est liée au problème du saut sémantique : les caractéristiques bas-niveaux ne sont plus suffisamment discriminantes pour caractériser le contenu visuel haut-niveau des images. Pour proposer une solution à ces problèmes, des travaux récents ont montré l intérêt de caractériser le contenu des images par des termes sémantiques (Kwitt et al., 2012). Ces termes peuvent être utilisés pour décrire un nombre important d informations relatives au contenu visuel des images (Fig. 1(a-b)). Ils peuvent être dérivés des observations des radiologues ou automatiquement prédits à partir de caractéristiques bas-niveaux extraits des pixels. Par conséquent, l intégration de termes sémantiques dans les processus de recherche d images est une solution prometteuse pour faire face aux problèmes liés au saut sémantique. Cependant, les systèmes actuels de recherche d images basés sur les annotations sémantiques ne considèrent pas les relations intrinsèques (e.g., sémantiques, anatomiques) qui existent entre ces termes lors de la comparaison des images. Dans la plupart des cas, chaque image est modélisée par un

Une approche sémantique pour la comparaison d images (a) Image scanner. ovoid heterogeneous perilesional vessels bulges capsule of liver circumscribed margin homogeneous fade solitary lesion (b) Termes sémantiques. echotexture imaging observation hypervascular Term xi enhancement enhancing circumscribed smooth margin sθ(xi, xj) margin angular margin not circumscribed lobulated margin Term xj (c) Extrait de l ontologie RadLex. FIG. 1: Une image scanner du foie annotée avec des termes extraits d une ontologie. vecteur d attributs (binaires) représentant la présence ou l absence des termes et une distance classique (e.g., Manhattan, Euclidienne) est calculée entre ces vecteurs. Cette stratégie ne permet donc pas de considérer la similarité entre les éléments sémantiques des vecteurs décrivant les images : la distance entre une image A représentant une lésion annotée avec le terme ovoid et une image B annotée avec le terme round est égale à la distance entre une image A annotée avec le terme ovoid et une image C annotée avec le terme rectangular. Cependant, l image A est sémantiquement (et intuitivement) plus proche de l image B qu elle ne l est de l image C. Des travaux récents (Tousch et al., 2012) ont montré que l utilisation de vocabulaires contrôlés (comme les ontologies) pour l annotation d images pouvait fournir des solutions efficaces pour faire face à ces limites. Les ontologies peuvent être employées pour modéliser les relations sémantiques entre les termes utilisés pour la description des images. De plus, des travaux en traitement automatique des langues naturelles (Pivovarov et Elhadad, 2012) ont déjà proposés des approches pour mesurer la proximité sémantique entre des termes issus d une ontologie (Fig. 1(c)). Par ailleurs, dans le domaine de la comparaison de vecteurs, des distances ont été proposées pour considérer la proximité relative entre les éléments composant les vecteurs, permettant de prendre en compte leurs corrélations (Turney et Pantel, 2010). En couplant ces trois stratégies, il existe ainsi une opportunité de considérer les relations sémantiques entre les termes lors de la comparaison d images et d améliorer les processus de recherche d images. Cet article propose une nouvelle approche basée sur la proximité sémantique du contenu des images, dédiée à la recherche d images similaires au sein de bases de données (Sec. 2). Elle combine une distance hiérarchique permettant de prendre en compte les relations entre les éléments d un vecteur (Kurtz, 2012) et une mesure de similarité ontologique permettant d évaluer automatiquement la proximité sémantique entre des termes extraits d une ontologie. Cette stratégie offre un moyen de capturer les corrélations sémantiques entre les annotations décrivant les images lors de leur comparaison. Cette approche est générique et peut ainsi être utilisée pour un large champ d applications allant de la recherche d images par l exemple à la classification. Les résultats obtenus dans le domaine de la recherche d images tomodensitométriques du foie se sont montrés encourageants et justifient l intérêt de cette approche (Sec. 3). 2 Approche sémantique proposée L approche proposée est composée de deux étapes (Fig. 2) : (1) annotation d une image requête avec des termes sémantiques extraits d une ontologie et construction d un vecteur de termes modélisant l image, et (2) comparaison de l image à d autres images précédemment annotées via le calcul d une distance entre vecteurs de termes couplée à une mesure ontologique.

echotexture abrupt interface imaging observation lesion boundary echogenic halo circumscribed smooth margin margin angular margin not circumscribed obscured margin C. Kurtz et D. L. Rubin Ontologie Base de données B = b0, b1,..., bv 1 C = c0, c1,..., cv 1 D = d0, d1,..., dv 1 Annotation avec des termes de l ontologie Évaluation de la similarité entre les termes Image requête A = a0, a1,..., av 1 HSBD(A, B) = a0, a1,..., av 1 b0, b1,..., bv 1 D(A, B) = D( ) D(A, C) = D( ) D(A, D) = D( ) Image requête Annotation de l image Distance entre vecteurs Résultats FIG. 2: Schéma de l approche proposée. 2.1 Annotation des images Soit I A une nouvelle image requête. La première étape consiste à décrire le contenu visuel de l image (ou d une région d intérêt spécifique de l image) par le biais d un ensemble de termes sémantiques extraits d une ontologie Θ. Cette étape peut être réalisée de façon automatique (par un algorithme d apprentissage prédisant les termes à partir de caractéristiques extraites de la région d intérêt) ou de façon manuelle. Dans le cadre de ces travaux, chaque image a été annotée par un radiologue via des termes de Θ. Pour rendre les descriptions d images comparables, l approche proposée nécessite la création d un sous-vocabulaire de termes extraits de Θ. Ce sous-vocabulaire, spécifique à l application considérée, est défini en accord avec les radiologues. Il est noté X = {x 0, x 1,..., x k 1 } où les k termes x i Θ sont des termes potentiellement utilisables pour décrire le contenu des images. Une fois l image I A annotée, il devient possible de la caractériser via un vecteur de termes sémantiques A = a 0, a 1,..., a k 1 où chaque élément a i A est une valeur binaire représentant la présence ou l absence du terme x i X. 2.2 Comparaison d images Les vecteurs de termes caractérisant les images peuvent ensuite être comparés via le calcul d une distance hiérarchique nommée HSBD (Hierarchical Semantic-Based Distance) (Kurtz, 2012). Lors de son calcul, HSBD permet de considérer des valeurs de proximité entre les éléments des vecteurs comparés. Ces valeurs de proximité sémantique sont préalablement calculées par l intermédiaire d une mesure de similarité ontologique. 2.2.1 Similarité entre termes sémantiques On trouve dans la littérature différents types de mesures permettant d évaluer la similarité entre des termes appartenant à une ontologie. Parmi ces mesures, les mesures structurelles permettent de quantifier la similarité entre termes en se basant sur la structure de l ontologie. Notre contexte applicatif nécessitant la proposition d outils automatiques, notre étude s est ainsi penchée sur l utilisation de telles mesures. Considérons deux termes sémantiques x i, x j X. Un ensemble de liens connectant x i et x j dans l ontologie est défini par path(x i, x j ) = {l 0,..., l n 1 }. Pour quantifier une va-

Une approche sémantique pour la comparaison d images leur de similarité sémantique entre deux termes x i et x j, une méthode intuitive a été proposée dans (Al-Mubaid et Nguyen, 2006). Elle est basée sur une stratégie par branches qui évalue la longueur du chemin minimum entre les termes et leur profondeur taxonomique au sein des branches considérées : plus le chemin entre les termes est long, plus les termes sont différents sémantiquement. L idée est d évaluer la spécificité commune (SC) des deux termes en soustrayant la profondeur de leur premier ancêtre commun (PAC) à la profondeur D c de la branche principale auquel ces termes appartiennent. La spécificité commune est utilisée pour prendre en compte le fait que les couples de termes se trouvant dans les niveaux les plus bas de la hiérarchie sont plus similaires que les couples situés à un niveau plus élevé. Nous avons modifié la définition originale de cette mesure pour la normaliser et pour attribuer un poids égal à la longueur du chemin entre les termes et à leur spécificité commune : ( min p ) log path p (x i, x j ) SC(x i, x j ) + γ s Θ (x i, x j ) = (1) ω Θ norm où ω Θ norm est un facteur de normalisation évaluant la valeur de similarité maximale entre termes et SC(x i, x j ) = D c depth(p AC(x i, x j )) représente la spécificité commune des termes. Pour modéliser l ensemble des valeurs de similarité sémantique entre les k termes x i appartenant au vocabulaire X, nous définissons une matrice de dissimilarité notée M sem (de taille k k) où la valeur de chaque case M sem i,j est obtenue via la mesure s Θ (x i, x j ), x i, x j X. 2.2.2 Distance entre vecteurs de termes Le calcul de HSBD, entre deux vecteurs A et B, requière une matrice de dissimilarité modélisant les corrélations entre les éléments des vecteurs composant A et B. Pour ce faire, HSBD est initialisée avec la matrice de similarité sémantique M sem définie précédemment. Avant de pouvoir calculer HSBD, la stratégie adoptée (basée sur un modèle fin-à-grossier) nécessite de définir un moyen de fusionner hiérarchiquement les différents termes représentés par les vecteurs en «clusters» de termes (i.e., des termes de niveaux sémantiques plus élevés). Cette étape de pré-traitement repose sur la construction d un dendrogramme D induit par M sem et modélisant la hiérarchie de fusion des termes. La construction de D est réalisée par le biais d un algorithme de clustering hiérarchique ascendant. Il est à noter que cette étape de pré-traitement ne doit être effectuée qu une seule fois pour une matrice M sem donnée. Une fois que le dendrogramme D a été construit, la distance HSBD peut être calculée. Son calcul se décompose en deux étapes principales : Étape 1. Calcul des sous-distances hiérarchiques Durant un processus de fusion itératif scannant chaque étage du dendrogramme (de ses feuilles jusqu à sa racine), les vecteurs liés à A et B, et induits par la fusion des termes composant chaque cluster de l étage courant, sont construits. Après chaque itération, la distance de Manhattan D L1 est calculée entre chaque couple de vecteurs créé. Ces «sous-distances» permettent d évaluer la similarité entre A et B à différents niveaux de sémantiques. Étape 2. Fusion des sous-distances Les sous-distances hiérarchiques calculées pour tous les étages du dendrogramme, et l énergie sémantique nécessaire pour aller d un étage à l autre, sont ensuite fusionnées en une fonction qui est finalement intégrée pour fournir la valeur de la distance HSBD. Pour plus de détails sur le calcul de HSBD, les lecteurs peuvent se référer à (Kurtz et al., 2013).

C. Kurtz et D. L. Rubin 1 requête 0.3 (1.0) 0.3 (1.5) 0.4 (1.5) 0.5 (1.0) 0.5 (1.0) 0.5 (1.0) 0.95 0.5 (1.0) 0.6 (1.0) 0.6 (1.0) 0.6 (1.0) 0.6 (1.0) 0.6 (1.0) 1.0 (3.0) NDCG(K) 0.9 1.0 (3.0) 1.0 (3.0) 1.0 (3.0) 1.0 (1.0) 1.0 (2.5) 1.0 (3.0) 1.0 (3.0) 1.0 (2.5) 1.2 (2.0) 1.6 (3.0) 1.7 (3.0) 1.7 (3.0) 1.7 (3.0) 1.8 (3.0) 0 similaire 3 dissimilaire (a) Images similaires à une requête dans la base de données. Pour chaque image, la valeur calculée par HSBD et la valeur de similarité de référence (entre parenthèses) sont présentées. 0.85 0 5 10 15 20 25 30 K DL2 D EMD HSBD (b) Scores NDCG des 4 distances évaluées. FIG. 3: Évaluation des résultats de recherche d images tomodensitométriques similaires. 3 Validation expérimentale L approche proposée a été validée dans le contexte de la recherche d images similaires au sein d une base de données de N = 77 images tomodensitométriques. Chaque image représente une coupe de foie affectée d une lésion (e.g., tumeur, kyste). Chaque lésion a été annotée (12 termes en moyenne) par un radiologue par l intermédiaire de termes appartenant à un sousvocabulaire de 72 termes extraits de l ontologie médicale RadLex (Langlotz, 2006). Les expériences ont consisté à considérer successivement chaque image de la base comme une requête afin de rechercher des images similaires via la distance HSBD combinée à la mesure ontologique. Pour ce faire, l image requête a été comparée à l ensemble des N 1 images qui ont ensuite été classées par ordre de similarité (Fig. 3(a)). Les valeurs de similarité ainsi calculées ont ensuite été comparées via l indice NDCG (Normalized Discounted Cumulative Gain) à des valeurs de similarité de référence définies par un groupe de radiologues pour 30 30 couples d images. L indice NDCG permet d estimer la pertinence d un résultat d expérience de classement par rapport à un classement de référence. Pour chaque image requête, la moyenne de cet indice a été calculée pour chaque K = 1,..., 30, évaluant ainsi la qualité du classement pour différents nombres d images recherchées. Les résultats obtenus par HSBD ont également été comparés à ceux obtenus par d autres distances de l état de l art : la distance Euclidienne D L2, l intersection de vecteurs D et la distance EMD (Rubner et al., 2000). La figure 3(b) présente les scores NDCG obtenus pour les 4 distances évaluées. À partir de ces résultats, on observe que les scores NDCG sont toujours supérieurs quand la comparaison des images est effectuée avec la distance HSBD que quand elle est effectuée avec les 3 autres distances. En particulier, l approche proposée conduit à de meilleurs résultats que ceux obtenus avec la distance EMD qui permet également de prendre en compte les relations sémantiques entre les termes (via une initialisation avec la mesure ontologique présentée). Par ailleurs, les moins bons scores ont été obtenus avec les distances D L2 et D qui ignorent durant leur calcul les relations sémantiques entre les éléments des vecteurs.

Une approche sémantique pour la comparaison d images 4 Conclusion et perspectives Cet article a présenté une approche basée sur les relations ontologiques dédiée à la recherche d images caractérisées par des annotations sémantiques. La principale originalité de cette approche est de prendre en compte les relations de proximité sémantique entre les termes employés pour décrire les images lors de la comparaison de ces dernières. Pour ce faire, cette approche est basée sur une distance hiérarchique entre vecteurs couplée à une mesure ontologique permettant d estimer automatiquement les relations de proximité sémantique. Par la suite, nous prévoyons d étudier de nouveaux processus pour l annotation automatique d images, ainsi que des mécanismes combinant l utilisation d ontologies multiples. Références Al-Mubaid, H. et H. A. Nguyen (2006). A cluster-based approach for semantic similarity in the biomedical domain. In Proceedings of the IEEE EMBC 2006 conference, pp. 2713 2717. Kurtz, C. (2012). Une distance hiérarchique basée sur la sémantique pour la comparaison d histogrammes nominaux. In Actes de la Conférence EGC 2012, pp. 77 88. Kurtz, C., P. Gançarski, N. Passat, et A. Puissant (2013). A hierarchical semantic-based distance for nominal histogram comparison. Data & Knowledge Engineering 87(1), 206 225. Kwitt, R., N. Vasconcelos, N. Rasiwasia, A. Uhl, B. Davis, M. Häfner, et F. Wrba (2012). Endoscopic image analysis in semantic space. Medical Image Analysis 16(7), 1415 1422. Langlotz, C. P. (2006). RadLex : A new method for indexing online educational materials. RadioGraphics 26(6), 1595 1597. Pivovarov, R. et N. Elhadad (2012). A knowledge-based and data-driven approach to identifying semantically similar concepts. Journal of Biomedical Informatics 45(3), 471 481. Rubner, Y., C. Tomasi, et L. J. Guibas (2000). The Earth Mover s Distance as a metric for image retrieval. International Journal of Computer Vision 40, 99 121. Tousch, A. M., S. Herbin, et J. Y. Audibert (2012). Semantic hierarchies for image annotation : A survey. Pattern Recognition 45(1), 333 345. Turney, P. D. et P. Pantel (2010). From frequency to meaning : Vector space models of semantics. Journal of Artificial Intelligence Research 37(1), 141 188. Summary Automated image retrieval applications could assist radiologists by identifying similar images in large archives. However, the semantic gap between low-level image features and their high level semantics may impair the system performances. Thrticle proposes a new approach relying on image annotation with semantic terms that can be considered to deal with this issue. Thpproach combines a hierarchical distance used to take into account the correlations between the terms and an ontological similarity measure enabling to automatically assess term similarities. We validate thpproach in the context of the retrieval of CT images.