Recherche par similarité dans les bases de données multimédia : application à la recherche par le contenu d images

Transcription

1 UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N orre 460 THÈSE DE DOCTORAT Présentée par DAOUDI Imane Discipline : Sciences e l ingénieur Spécialité : Informatique & Télécommunications Titre : Recherche par similarité ans les bases e onnées multiméia : application à la recherche par le contenu images Soutenue le 17 juillet 009. Devant le jury Présient : D. ABOUTAJDINE Professeur à la Faculté es Sciences e Rabat Examinateurs : A. Baskurt Professeur à l Institut National es Sciences Appliquées e Lyon-LIRIS M. DAOUDI Professeur à Télécom Lille 1-ENIC H. Ibn El Haj Professeur Habilité à l Institut National es postes et télécommunication e Rabat K. Irissi Maître e conférence à l Institut National es Sciences Appliquées e Lyon-LIRIS S. Ouatik Professeur Habilité à la Faculté es Science Dhar El-Mahraz e Fès Faculté es Sciences, 4 Avenue Ibn Battouta B.P RP, Rabat Maroc Tel +1 (0) /35/38, Fax : +1 (0) ,

2

3 Table es matières Avant Propos Le travail présenté ans ce mémoire a été effectué ans le care 'une co-tutelle entre le laboratoire marocain LRIT (laboratoire e Recherche en Informatique et Télécommunications) e la Faculté es Sciences e Rabat sous la irection u Professeur Driss Aboutajine et le laboratoire français LIRIS (Laboratoire 'Informatique en Image et Systèmes information) sous la irection u Professeur Atilla Baskurt. Je remercie M. Driss Aboutajine Professeur enseignement supérieur à la faculté es Sciences e Rabat pour son suivi et ses encouragements tout au long e ce travail e thèse e octorat. Mes remerciements vont aussi à Mr Atilla Baskurt Professeur enseignement supérieur à l INSA e Lyon pour son encarement et son suivi rigoureux et patient urant ces années e thèse. Ensuite, je tiens à remercier Mr Mohame DAOUDI Professeur es universités à Télécom Lille 1 et Mr Ibn Lhaj El Hassan Professeur Habilité pour avoir consacré u temps à lecture e cette thèse ainsi pour avoir soumis leur précieux jugement sur la qualité et le contenu e ce travail. Je vourais exprimer ma profone reconnaissance envers mon co-irecteur Khali Irissi maitre e conférence à l INSA e Lyon pour toute l attention et le soutien qu il m a portés penant ces années e thèse et pour sa très grane isponibilité urant toute cette périoe. Mes remerciements vont aussi à mon co-encarant Mr Sai Ouatik professeur Habilité à la faculté es Sciences e Fès pour son suivi. Merci à mes parents et mes frères et sœurs pour leur soutien urant toutes ces années 'étues: je ne saurais être qu'infiniment reconnaissante quant aux sacrifices qu'ils ont consentis. Merci à tous les collègues u laboratoire LRIT et le laboratoire LIRIS pour leur amitié et bonne humeur qui ont égayé ma vie au laboratoire. Enfin merci à ceux et celles que je n'ai pas pu citer, mes sincères amitiés et remerciements.

4 Table es matières Table es matières Introuction Générale Chapitre 1 : Recherche par le contenu ans les bases images fixes 1 Introuction... 6 Représentation u contenu visuel es images 8.1 Descripteurs couleur Descripteurs texture Descripteurs forme Combinaison es escripteurs Mesure e similarité Similarités attentive et pré-attentive Similarité ans les moteurs recherche Similarité par approche noyau Astuce u noyau «Kernel Trick»...

5 Table es matières 4. Fonctions noyaux classiques Généralisation e la notion e istance à travers l astuce u noyau Synthèse... 5 Chapitre : inexation Multiimensionnelle 1 Introuction... 7 Méthoes inexation conventionnelles 8.1 Méthoes e partitionnement e onnées Méthoes e partitionnement e l espace Maléiction e la imension Problèmes inexation et e recherche ans les espaces e grane imension Techniques e réuction e la imension Méthoes inexation multiimensionnelles basées sur l approche approximation Approximation globale Approximation locale Synthèse... 63

6 Table es matières 5 Synthèse Chapitre 3: Méthoe proposée pour l'inexation et la recherche ans les espaces multiimensionnels : RA+-Blocks 1 Introuction KD-Tree Construction un KD-Tree Stratégies e subivision K-D-B-Tree et ses variantes RA-Blocks Approximation Inexation Recherche Synthèse RA + -Blocks Structuration es onnées Structure inex Interrogation e la base e onnées... 87

7 Table es matières 6 Synthèse Chapitre 4: Nouvelle méthoe multiimensionnelle par approche noyau pour l'inexation et la recherche ans les granes bases 'images basées sur le contenu : KRA+-Blocks 1 Introuction Techniques inexation par approche noyau 90.1 M-Tree à noyau KVA-File KRA + -Blocks : structure inexation multiimensionnelle pour la recherche par le contenu Réuction e la imension Propriétés e l ACPK Inexation Mesure e similarité Recherche Bouclage e pertinence Synthèse

8 Table es matières Chapitre 5 : Expérimentations 1 Evaluation es performances e RA + - Blocks Environnement expérimental Description es onnées Expérimentation 1 : Nombre e régions obtenues Expérimentation : Taux e remplissage Expérimentation 3 : Temps e réponse Evaluation es performances u KRA + - Blocks Environnement expérimental Description es onnées Expérimentation 1 : Estimation es paramètres u noyau Expérimentation : Qualité e la recherche par similarité Expérimentation 3 : Bouclage e pertinence Expérimentation 4 : Intérêt sur la combinaison es escripteurs globaux 15.7 Expérimentation 5 : Temps e la recherche Synthèse Conclusion Générale

9 Table es matières Annexe : Algorithmes 1 Construction e l inex KDB-Tree Construction e l inex KD-Tree Algorithme e recherche VA-NOA centrage es onnées ans l espace à noyau Références e l'auteur Références Bibliographiques

10 Table es figures Tables es figures 1.1 Schéma un système e recherche images par le contenu.. 1. Classification es escripteurs e formes D Parties réelles es fonctions e base ART Effet une transformation linéaire à une classification basée sur une istance Eucliienne les contours e ifférentes istances Structure u R-Tree 4. Structure géométrique u M-Tree. 6.3 Fonctionnement e l algorithme "Slim-own" La structure géométrique e la méthoe u pivot métrique PM le partitionnement e onnées selon (a) M-Tree (b) MH-Tree La corresponance entre les régions (b) et les pyramies (a) en eux imensions selon la technique e la pyramie 3.7 Exemple e requête e forme non-hyper cube Résultat u partitionnement un espace à eux imensions selon la méthoe iminmax où (a) θ = 0 (b) θ = 0. 5 (c) θ = Exemple e partitionnement e l espace e onnées (a) et (b) e construction e la structure space-tree Représentation géométrique e l inexation selon la méthoe ViTri La structure inex u Kpyr[Thi 05] Exemple estimation une istance géoésique entre eux point p 1 et p Principe e fonctionnement e l algorithme LLE Construction u VA-File Distance minimale est maximale par rapport au vecteur requête Coage es vecteurs selon LPC-File Calcul e la istance minimale et e la istance maximale entre un vecteur requête et l ensemble e vecteurs ayant la même approximation Exemple e VBR Structure inex u A-Tree. 5.0 structure inex IQ-Tree Partitionnement e l espace selon GC-Tree... Construction e l inex e l arbre GC. (a)partitionnent e l espace e onnées. 57 (b) la structure inex corresponante [Gua 0b] le principe e l approximation e la méthoe AV 58.4 Exemple e calcul e la istance minimal et maximal u vecteur requête par rapport à l approximation suivant la méthoe AV MBRs e l arbre PCR et u R-Tree La structure u KD-Tree et ses partitions ans le plan La subivision 'un espace e onnées par la méthoe stanar Application e a stratégie e ivision u point méian à l ensemble e points e l exemple précéent Partitionnement une page point. 73

11 Table es figures 3.5. Structure 'un -D-B-Tree écomposition une page région Exemple e coage es régions ans un espace e imension eux Structure inex u RA-Blocks Les istances minimales et maximales une région par rapport à un vecteur requête L algorithme e recherche es ppv k u RA-Blocks L algorithme e écoupage e l espace e onnées u RA+-Blocks Exemple e subivision es régions selon K-D-B-Tree Exemple e subivision es régions selon notre méthoe PCs for ifferent δ values. (a) Original ata. (b) PCA. (c) KPCA, δ = () KPCA, δ = (e) KPCA, = 0. 5 δ. (f) KPCA KRA+-Blocks approximations. (a) onnées originales. (b) les onnées projetées avec ACPK. (c) les bornes minimales et maximales 5.1 Le nombre e régions obtenues en fonction e la imension (a) pour es onnées 98 réelles (b) et uniformes Nombre e régions obtenues en fonction e la taille e la base e onnées La capacité e stockage u RA-Blocks et RA+-Blocks Temps e réponse en fonction e la imension Temps e réponse en fonction e la imension Temps e réponse en fonction e la taille e la base e onnées Temps e réponse en fonction e la taille e la base e onnées Un exemple (a) images e la base COIL-100 (b) classes e la base images (a) γ (, δ ) (b) σ (, δ ) (c) valeurs optimales es paramètres u noyau les courbes e rappel et e précision pour ifférentes valeurs es paramètres u noyau Les Coubes e rappel et e précision en utilisant (a) la base B1 (700) et (b) la base B (40000) Les résultats e la recherche avec la méthoe KRA+-Block ans la base COIL- 100 : la première image e chaque ligne représente l image requête et le 11 images représentent les résultats triés par orre croissant e similarité Les Coubes e rappel et e précision en utilisant (a) la base B1 (700) et (b) la base B 40000) Résultat e la recherche en utilisant a. KRA+-Block avec les paramètres optimaux et b. en utilisant une itération u bouclage e pertinence: la première image e chaque ligne représente l image requête et les autres 11 images sont les résultats retournés le temps e réponse en fonction e la imension pour la base (a) BD3. (b) BD Evolution u temps e réponse en fonction e la imension pour la base (a) BD3. (b) BD4. 18

12 Liste es tableaux Liste es tableaux.1 Récapitulatif es avantages et inconvénients es ifférentes méthoes citées Précéemment 9. Récapitulatif es avantages et inconvénients es ifférentes méthoes citées précéemment 37.3 Récapitulatif es avantages et inconvénients es méthoes inexation basée sur l approche approximation locale citées précéemment 64.4 Récapitulatif es avantages et inconvénients es méthoes inexation basée sur l approche approximation globale citées précéemment Récapitulatif e quelques propriétés générales es méthoes inexation basées sur l approximation locale citées précéemment Récapitulatif e quelques propriétés générales es méthoes inexation basées sur l approximation globale citées précéemment La variance cumulée ans les premières composantes principales en fonction e δ. Les zones en couleur grise corresponent à une variance cumulée supérieure ou égale à 98% Valiation es équations 5.1 et 5. pour les régions e la figure Les quatre méthoes utilisées pour la comparaison e la qualité e la recherche Comparaison e la précision (en %) utilisant la couleur et la couleur + la forme Comparaison e la précision (en %) utilisant la couleur et la couleur avec la forme.. 15

13 Introuction Générale Introuction Générale L une es conséquences irectes e la baisse es coûts es équipements informatiques, u éveloppement es télécommunications et e la isponibilité es techniques e numérisation e haute qualité, est la création et l échange e volumes e plus en plus importants e onnées multiméias numérisées. Ces onnées sont par essence hétérogènes et leur contenu préponérant est visuel. Les éveloppements récents ans les omaines u traitement u signal et es bases e onnées offrent tous les éléments nécessaires pour l extraction, l inexation et la recherche u contenu visuel es onnées multiméias, notamment es images. Dans cette thèse, nous nous intéressons aux techniques l inexation multiimensionnelles et la recherche es images fixes par le contenu. Ces techniques sont complémentaires et fonamentales pour une recherche rapie et efficace ans un système e recherche images par le contenu. Les techniques inexation image ont pour but organiser un ensemble e escripteurs (un escripteur étant un vecteur e réels écrivant le contenu visuel une image et pouvant être e très grane imension) afin que les procéures e recherche soient performantes en temps e réponse. Cette organisation se trauit généralement par une structuration es escripteurs en petits ensembles et par l application e stratégies e recherche capable e filtrer toutes les images non pertinentes qui seront évitées (non parcourues) penant la recherche garantissant ainsi un temps e recherche acceptable par l utilisateur. Les techniques e recherche par le contenu quant à elles, consistent à évelopper et à appliquer es outils qui permettent e sélectionner les images les plus pertinentes par leurs contenus. Lors une interrogation, un (ou plusieurs) escripteur, généralement hétérogène, est tout abor extrait à partir e l image requête. Ce escripteur requête est ensuite utilisé pour retrouver les escripteurs stockés ans la base qui lui sont les plus proches en terme e similarité. Les escripteurs trouvés permettent obtenir les images auxquelles ils sont associés et qui, e fait, sont censés être similaires à l image requête. La mise en œuvre e ces outils inexation et e recherche ans un contexte e très grane collection images fait appel à es techniques éveloppées ans eux omaines ifférents : l analyse images et les bases e onnées. Cette mise en œuvre s effectue ans le care un Système e Recherche Images par le Contenu (SRIC ou CBIR pour Content Base Image Retrieval). Objectif e la thèse Les techniques inexation et e recherche images basée sur le contenu visent à extraire automatiquement es caractéristiques visuelles es images et à les organiser ans es inex multiimensionnels pour ensuite faciliter la recherche ans les granes bases images. Ces techniques ont une complexité particulière liée à la nature es onnées manipulées. La littérature fait état e iverses approches inexation et e recherche e onnées e caractère multiimensionnelles. Parmi ces approches, certaines souffrent e la maléiction e la

14 Introuction Générale imension [Web 98][Ams 01]. D autres, par contre, sont spécifiques à une représentation particulière es onnées (istribution uniforme es onnées, espaces métriques ). Il parait onc nécessaire élaborer es techniques inexation multiimensionnelles qui soit aaptées aux applications réelles pour aier les utilisateurs à faire une recherche rapie et efficace. L inexation et la recherche basées sur le contenu comporte trois principales opérations relativement complexes 1. La escription automatique consistant à extraire es signatures compactes u contenu visuel e l image.. La structuration e l espace e escription (inexation), consistant à mettre en place une structure inex multiimensionnelle permettant une recherche efficace pour es milliers, voire es millions images. 3. La recherche par similarité ans laquelle une istance est associée à chaque type e escripteur, puis une recherche es k plus proches voisins est effectuée. Notre thèse consiste à traiter les ifférentes étapes citées ci-essus en se focalisant essentiellement sur l inexation multiimensionnelle et la recherche par le contenu ans les granes bases images fixes. En fait, il s agit e évelopper une méthoe rapie et efficace inexation et e recherche es k ppv qui soit aaptée aux applications inexation par le contenu et aux propriétés es escripteurs images. Nous nous intéressons ans un premier temps à l inexation multiimensionnelle. En effet, la problématique se complexifie lorsque la taille e la base evient conséquente et que les escripteurs eviennent e grane imension. La recherche est généralement effectuée une manière exhaustive sur la totalité e la base ce qui se trauit par un temps e réponse inacceptable par l utilisateur. Dans la littérature, plusieurs techniques conventionnelles inexation multiimensionnelles ont été proposées pour l optimisation u temps e réponse. Ces techniques permettent e réuire la recherche séquentielle à un sous ensemble e paquets e vecteurs en regroupant ces erniers ans es formes géométriques particulières (rectangle, sphère, etc.) et en utilisant es stratégies e filtrage. Ceci permet par conséquent e réuire le nombre E/S ainsi que le nombre e calculs e istance. Malheureusement, la performance es techniques conventionnelles inexation multiimensionnelle se égrae ramatiquement lorsque la imension es onnées augmente [Web 98], phénomène connu sous le nom e la maléiction e la imension qui ren la recherche séquentielle exhaustive bien meilleure qu une recherche sur les structures inex conventionnelles. Pour cela, es techniques inexation multiimensionnelles basées sur l approche approximation ont été proposées [SYUK 00][Ter 0], elles reposent sur la compression es onnées où un coage particulier es onnées est appliqué permettant améliorer la recherche séquentielle par es stratégies e filtrage. Les méthoes inexation basées sur l approche approximation sont consiérées comme efficaces pour gérer les vecteurs e grane imension [Web 98], mais leur intégration ans un système e recherche et inexation basé sur le contenu (très gran volume e onnées, très grane imension, aucune hypothèse sur la istribution es onnées, etc.) pose e sérieux problèmes. Notre objectif est améliorer l efficacité e ces techniques inexation et apporter es réponses au problème u passage à l échelle et e la maléiction e la imension pour pouvoir ensuite intégrer ces techniques ans un système e recherche par le contenu. Notre secon objectif consiste à appliquer une méthoe inexation multiimensionnelle basée sur l approche approximation, à la recherche images basée sur le contenu. Rappelons qu il s agit e mettre en place es techniques permettant e sélectionner les images les plus pertinentes par leur contenu relativement à une requête onnée selon ifférents types e escripteurs (couleur, texture, forme). L intégration e ces techniques ans un système SRIC est confrontée à e nombreux problèmes. Le premier se pose lors e l étape inexation. En effet,

15 Introuction Générale cette étape consiste à gérer les escripteurs caractéristiques es images auxquelles sont associés plusieurs types e onnées écrivant à la fois la couleur, la texture, la forme, etc. es images. Ces escripteurs possèent généralement un très gran nombre e composantes (>100), onc une grane imension ifficile à gérer par les méthoes inexation existantes en raison u problème e la maléiction e la imension. Le euxième problème se présente lors e la structuration e l espace e escription. Il s agit à ce stae e structurer et organiser en inex es vecteurs multiimensionnels composés es ifférents types attributs qu on ésignera par escripteurs hétérogène. Cette structure inex evrait regrouper les escripteurs ans es formes géométriques particulières e sorte que les escripteurs appartenant à la même forme soient similaires en termes une istance onnée. D où le troisième problème qui consiste à éfinir une istance permettant une part e mieux approximer la proximité entre les vecteurs attributs hétérogène ans l espace multiimensionnel et autre part estimer le plus fièlement possible la similarité visuelle entre les images. Notre objectif est onc élaborer une technique inexation multiimensionnelle qui répone efficacement à ces problématiques et permettant ainsi une recherche efficace et rapie ans un SRIC. Synthèse es contributions Notre travail a abor porté sur l amélioration es méthoes inexation basées sur l approche approximation, pour réponre aux problèmes e la maléiction e la imension et réuire le temps e la recherche ans les espaces e grane imension et au passage à l échelle. D abor, nous avons passé en revue les principales méthoes basées sur l approche approximation et nous avons ensuite comparé leurs principales caractéristiques. Sur la base e cette étue, nous avons choisi améliorer les performances e la méthoe RA-Blocks [Ter 0] en raison es avantages quelle présente. La méthoe proposée (RA + -Block) repose sur un nouvel algorithme e partitionnement qui permet améliorer notablement les performances e la structure inex u RA-Blocks en terme e capacité e stockage et e temps e recherche en générant es régions compactes et isjointes. Les résultats e ces travaux ont été publiés ans [1][8] La euxième contribution est la proposition une mesure e similarité aaptée aux onnées réelles lors e l inexation et e la recherche par le contenu. Nous avons opté pour une représentation e la similarité par fonction noyau. Ainsi, toutes les mesures e similarité et calculs e istance auxquels nous nous sommes intéressés sont entièrement basés sur ce formalisme. Nous avons étuié les ifférents paramètres e la fonction noyau et nous avons proposé une stratégie e sélection es paramètres qui permettent une meilleure estimation e la similarité entre escripteurs hétérogènes ainsi qu une représentation iscriminante es onnées ans l espace e caractéristiques. Les résultats e ces travaux ont été publiés ans [4]. La troisième et principale contribution est la conception une méthoe efficace inexation et e recherche par le contenu particulièrement aaptée aux onnées e nature hétérogènes (KRA + - Blocks). Cette méthoe permet accélérer consiérablement le temps e la recherche et améliorer significativement la qualité es résultats retournés, particulièrement pour les granes bases e escripteurs attributs hétérogènes. La méthoe proposée combine une méthoe non linéaire e la réuction e la imension et une méthoe inexation multiimensionnelle fonée sur l approche approximation pour faire face au problème e la maléiction e la imension et à celui e l inexation es onnées hétérogènes. La réuction non linéaire e la imension permet utiliser et exploiter les propriétés es fonctions noyau pour éfinir une mesure e similarité aaptée à la nature es onnées. Pour améliorer la qualité

16 Introuction Générale e la recherche, nous avons également implémenté un schéma e bouclage e pertinence avec une approche statistique. Nous avons moélisé le problème e la recherche par une classification binaire, ans laquelle nous avons créé un moèle pour iscriminer la classe es images pertinentes e celle es images non pertinentes, ceci à travers le calcul es probabilités es classes e vecteurs. Les résultats e ces travaux ont été publiés ans [5][6]. La quatrième contribution e cette thèse est l intégration e la méthoe inexation multiimensionnelle KRA + -Blocks au moteur e recherche par le contenu es images fixes IMALBUM, éveloppé au sein u LIRIS. Nous avons mené es expérimentations pour évaluer nos eux méthoes (RA + -Blocks et KRA + -Blocks) à très granes échelle (base e éléments) et avec es escripteurs visuelles e grane imension (=5), ce qui est rarement le cas ans la littérature. Cela nous a permis e montrer que l utilisation e l approche approximation e régions et l approche noyau permettent être très robuste à l augmentation e la taille e la base e onnées et e la imension es escripteurs utilisés aussi bien pour la qualité que pour le temps e recherche. Cela a également montré que la combinaison e plusieurs types e escripteurs en une seule structure inex est possible grâce à l approche e similarité que nous avons proposée. Description es chapitres Ce ocument écrit l ensemble es travaux menés ans le care e cette thèse sur la recherche par similarité ans les granes bases e onnées multiméias: application à la recherche par le contenu ans les bases images. Il comporte cinq chapitres écrits comme suit : Le premier chapitre propose un tour horizon es principales approches e la escription e l apparence visuelle. Nous commençons par la présentation es principales méthoes extraction automatiques es caractéristiques visuelles es images (couleur, texture, et forme) en précisant à chaque fois, les techniques mises en œuvre ans cette thèse pour la escription. Nous présentons ensuite les principales mesures e similarité qui existent ans la littérature et nous énumérons celles utilisées par les systèmes e recherche images basée sur le contenu. Enfin, nous introuisons la notion e similarité par l approche noyau, nous présentons quelque aspect e cette théorie ans notre contexte et nous proposons une généralisation e la notion e istance par cette approche. Le euxième chapitre est composé e trois paragraphes. Dans le premier, nous passons en revue les principales techniques conventionnelles inexation multiimensionnelle en étaillant respectivement les approches basées sur le partitionnement e onnées et sur le partitionnement e l espace. Le euxième présente brièvement les problèmes e la maléiction e la imension qui perturbent le fonctionnement es techniques inexation. Nous présentons ans le même paragraphe les principales techniques e la réuction e la imension qui ont été proposées ans la littérature pour contourner ces problèmes. Dans le ernier paragraphe e ce chapitre, sont présentées les nouvelles méthoes pour la recherche et l inexation es onnées multiimensionnelles basées sur l approche approximation ou filtrage Pour épasser les limites e la méthoe inexation basée sur l approche approximation RA- Blocks, particulièrement au niveau u écoupage e l espace e onnées, nous proposons ans le troisième chapitre une autre méthoe que nous avons appelée RA+-Blocks. Nous présentons abor les méthoes e partitionnement e l espace e onnées KD-Tree et KDB-Tree sur lesquelles sont basées respectivement les eux méthoes RA + -Blocks et RA-Blocks. Nous présentons ensuite la méthoe RA-Blocks. Enfin notre méthoe inexation et e recherche basée sur l approche approximation RA+-Blocks est étaillée.

17 Introuction Générale Le quatrième chapitre est consacré à la présentation e notre méthoe KRA + -Blocks. Nous présentons abor les principales méthoes inexation basée sur l approche noyau, puis nous étaillons notre nouvelle méthoe inexation. Dans le cinquième chapitre, estiné à la présentation et à la iscutions es résultats expérimentaux, nous présentons le contexte es évaluations, puis nous effectuons une série expérimentations qui permettent e valier nos eux méthoes inexation et e recherche sur es bases images réelles et synthétiques. La conclusion générale présente une synthèse es travaux effectués ans cette thèse. Elle écrit aussi les perspectives que nous proposons au prolongement e ce travail e recherche

18 Chapitre 1 : Recherche par le contenu ans les bases images fixes Chapitre 1 Recherche par le contenu ans les bases images fixes L objectif e ce chapitre est faire un tour horizon es principaux concepts e base relatifs à la recherche images basée sur le contenu. Nous présentons abor les principales approches pour la escription e l apparence visuelle es images fixes permettant une recherche efficace par le contenu. Ensuite, nous introuisons les ifférentes approches e mesure e similarité proposées ans la littérature, nous intéressant particulièrement à la notion e similarité par l approche noyau. 1 Introuction Comme l inique clairement leur nom, les "systèmes e recherche images par le contenu" (SRIC ou CBIR avec le vocable Anglais) ont pour fonction principale e permettre la recherche images en se basant non pas sur es mots clefs, mais sur le contenu propre es images. Les applications e tels systèmes sont très nombreuses et assez variées. Elles incluent es applications juiciaires : les services e police possèent e granes collections inices visuels (visages, empreintes) exploitables par es systèmes e recherche images. Les applications militaires, bien que peu connues u gran public, sont sans oute les plus éveloppées [Eak 99] : reconnaissance engins ennemis via images raars, systèmes e guiage, ientification e cibles via images satellites en sont quelques exemples. Bien autres applications existent telles que le iagnostic méical, les systèmes information géographiques, la gestion œuvres art, les moteurs e recherche images sur Internet et la gestion e photos personnelles, etc. Le besoin en recherche images par le contenu est réel, et les problématiques sont nombreuses et variées. Dans le omaine militaire par exemple, la recherche engins ennemis ans les bases images raars ne présentera pas les mêmes ifficultés que la recherche e voitures, voire une voiture en particulier, ans une base images généralistes. Toutefois, certaines phases relatives aussi bien à l inexation e la base qu à la recherche ans celle-ci vont être nécessaires ans tous les cas e figure. Les SRIC ont pour vocation e réponre efficacement aux requêtes e l utilisateurs, ils s appuient généralement sur une représentation e bas niveau u contenu e l image. La recherche se fait ainsi par comparaison es caractéristiques. Malheureusement, la conception

19 Chapitre 1 : Recherche par le contenu ans les bases images fixes un système permettant assister es utilisateurs ans leurs tâches e recherche images est confrontée à es problèmes très ivers. Parmi les ifficultés pouvant être rencontrées [Eak 99] : 1. Comprenre les utilisateurs images et leurs comportements : e quoi les utilisateurs ont-ils réellement besoin?. Ientifier une manière "convenable" pour écrire le contenu e l image. C est une tâche renue ifficile par l aspect sémiotique es images. 3. Comparer les requêtes et les images e la base e manière à refléter fièlement les jugements e similarité humains. Cette comparaison s effectue à travers une mesure e similarité, généralement explicité sous forme une istance 4. Fournir es interfaces conviviales : c est la vitrine u système permettant la représentation es résultats et qui peut s avérer fonamentale en présence un mécanisme e bouclage e pertinence. 5. Offrir es temps e réponse acceptables : cette contrainte requière une stratégie inexation et e recherche pour naviguer efficacement ans les granes bases images. Le schéma générique SRIC peut être représenté par le igramme e la figure 1.1. Deux processus principaux oivent exister. Un premier qui calcule les escripteurs es images e la base et un secon qui, à partir es escripteurs et es paramètres e la requête, recherche les images positives et les fournit à l utilisateur. Base images Base inex Inexation Calcul es escripteurs Requête e l utilisateur Descripteur e la requête Utilisateur Réponse Requête Pertinence Moteur e recherche Fig 1.1 Schéma un système e recherche images par le contenu Cette phase e recherche est souvent couplée avec une possibilité interaction u système avec l utilisateur, ce qui permet e raffiner le processus e recherche en iniquant au système les résultats pertinents et ceux qui ne le sont pas. Les informations fournies sont alors exploitées pour améliorer la recherche ans une phase ite e bouclage e pertinence (Relevance feeback). Toutes les images e la base sont écrites à l aie es escripteurs. Ceux-ci oivent contenir es attributs iscriminants permettant une bonne escription u contenu e l image et être associés à une mesure efficace e la similarité.

20 Chapitre 1 : Recherche par le contenu ans les bases images fixes Représentation u contenu visuel es images La performance es systèmes e recherche épen pour une grane partie u choix es escripteurs employés et es techniques associées à leur extraction. De nombreux escripteurs sont utilisés ans les systèmes e recherche pour écrire les images. Ceux-ci peuvent être ifférenciés selon eux niveaux : Les escripteurs e bas niveau : les plus utilisés ans les systèmes actuels sont la couleur, la texture et la forme, leur pouvoir e iscrimination étant limité au contenu visuel e l image. Les escripteurs e haut niveau : tenent à se rapprocher u contenu sémantique e l image, et peuvent être soit extraits automatiquement soit fournis par l utilisateur sous forme e mots-clefs lors e l inexation. Cepenant, l extraction automatique ne semble réaliste actuellement que sur es bases thématiques. La normalisation MPEG7 [Man 0] a justement pour objectif e stanariser la escription es contenus multiméia, en proposant pour chaque type e contenu (image, son, viéo), les attributs à écrire ainsi que les escripteurs associés à chaque attribut. Le but ici n est pas u tout être exhaustif, mais plutôt e présenter brièvement quelques escripteurs proposés pour l image, puis e revenir sur ceux que nous avons utilisés ans le care e ce travail..1 Descripteurs couleur Le fort pouvoir e iscrimination e la couleur en fait un attribut omniprésent ans la grane majorité es systèmes inexation et e recherche par le contenu. De nombreux escripteurs sont proposés ans la littérature et nous pouvons consiérer qu ils forment granes catégories : o Les escripteurs relatifs à l espace couleur, où il s agit e représenter les principales couleurs une image, tout en fournissant es informations sur leur importance, leur istribution colorimétrique, etc. o Les escripteurs incluant es informations spatiales relatives à la istribution ans le plan image e la couleur, à la connexité entre couleurs, etc. Ces classes e escripteurs sont complémentaires et généralement les systèmes font appel à ces eux aspects. MPEG7 propose naturellement es escripteurs pour les familles. Les couleurs ominantes, les quantifications es espaces couleur pour la première, et les escripteurs "Color Layout", "Color Structure" et "Scalable Color" pour la secone. Nous ne étaillerons pas ces escripteurs ici. Toute fois, l approche la plus courante et la plus rencontrée ans la littérature est l histogramme couleur. De très nombreux auteurs ont proposé iverses manières utiliser l histogramme comme escripteur, ainsi que iverses istances associées qui permettent e mesurer la similarité entre eux histogrammes. Dans [Swa 91], Swain et Ballar ont suggéré e écrire la couleur une image à l aie e son histogramme couleur et ont éfini l intersection histogrammes couleur comme mesure e similarité entre une image histogramme I et un moèle histogramme M par : n ( I, ) min (1.1) j= 1 j M j

21 Chapitre 1 : Recherche par le contenu ans les bases images fixes qu il est possible e normaliser par : H sect n ( I, M ) min j j j= 1 ( I, M ) = (1.) n M j= 1 j Cette mesure semble la plus référencée ans la littérature car ayant servi e base à bon nombre e travaux qui ont cherché à l améliorer. Stricker & Orengo [Str 95] montrent que l utilisation e l histogramme cumulé H I) = ( h, h,..., h ) une image I éfini par : ( c1 c cn h = (1.3) c h j c l c l < c j où H ( I) = ( hc1, hc,..., hcn ) représente l histogramme couleur classique, permet e gagner en robustesse aux changements locaux e forme et aux petits écalages ans l image. La mesure e similarité peut être effectuée par la istance L 1, L ou L. Les auteurs consièrent que c i < c j si les valeurs es 3 composantes e la couleur c i sont inférieures respectivement aux 3 composantes couleur e la couleur c j. Syea [Sye 00] propose e écrire la couleur par le vecteur : ( C Nb, { δ C }, { H ( δ )} ), (1.4) i C i C étant un paramètre pour iniquer l espace e travail, Nb le nombre e couleurs quantifiées utilisées, δ Ci la valeur e la i ième couleur et H ( δ C i ) le pourcentage e pixels rattachés à cette couleur. Une istance e mesure e similarité est proposée, à partir e la éfinition une matrice A e similarité entre couleurs, où l élément a ( i, j) représente la similarité entre la couleur i et la couleur j. La istance est onnée par : V T = V. AV. (1.5) V étant un vecteur représentant la ifférence, élément par élément, es histogrammes es images à comparer. Cette istance tient compte aussi bien e la ifférence entre les couleurs, que e la quantité e présence une couleur ans les eux images. Hafner [Haf 95] propose une istance ponérée entre histogrammes afin e tenir compte e la similarité entre couleurs : où hi et ou ist hist ( H H ') = a ( h h ')( h '), ij i j h i j (1.6) ' h j ésignent respectivement bins es histogrammes H et a ij i j ij ( ist ) ij H ', et istij = 1 (1.7) max ( ) ist ij a ij = exp cst (1.8) maxij istij représente la similarité entre les couleurs i et j, ist ij étant la istance eucliienne entre ces couleurs et cst une constante positive. L auteur fait appel à une autre istance ist avr, plus souple et beaucoup plus rapie à calculer, afin e réaliser un premier filtrage sur les images e la base, éliminant ainsi une bonne partie e celles-ci, et n effectuant le calcul e la istance ist que sur les images éjà présélectionnées. hist

22 Chapitre 1 : Recherche par le contenu ans les bases images fixes La istance ist avr choisie représente en fait la istance eucliienne entre les vecteurs e couleur moyens e images. Une autre approche pour caractériser la couleur est l utilisation es moments statistiques, l histogramme étant une ensité e probabilité. Stricker [Str 96] propose e calculer pour chaque canal la moyenne, la variance et le moment orre 3, afin e caractériser la istribution e la couleur. Il éfinit ensuite une istance entre eux images par : I H I H I ( I, H ) = w μ + w σ σ + w s μ s (1.9) i1 i i i i i i3 I I I avec μ i, σ i et s i représentent respectivement la moyenne, la variance et le moment orre 3 u i ième canal e l image I. Les w ij étant es ponérations associées à chaque terme. Au niveau es espaces couleur utilisés, e très nombreux travaux ont également été menés, notamment ceux cherchant à offrir es espaces perceptuellement uniforme, et ans lesquels une istance mesurée entre couleurs reflète bien la ifférence entre celles-ci. L espace e base est l espace RGB, cepenant non seulement il ne présente pas cette propriété, mais en plus les trois composantes Rouge, Vert, Bleu sont très corrélées. Parmi les espaces perceptuellement uniformes les plus utilisés nous avons les espaces Lab et Luv. Ceux-ci sont obtenus à partir e l espace RGB par es transformations non linéaires. Dans ce travail, nous avons opté pour les couleurs ominantes en limitant le nombre maximal e celles-ci à 5, le escripteur utilisé est celui utilisé ans le système IMALBUM [Ir 03], il contient les couleurs ominantes CD i, leur pourcentage pr i, leur variance σ i, la cohérence spatiale SCR (i), et le maximum e l histogramme u graient G [Ir 01]. Notons que CD i, pr i,etσ i sont éterminés lors e la segmentation en consiérant l espace couleur Lab. H s ( c) Rappelons que la cohérence spatiale est onnée par : SCR( i) =, où H représente H ( c) Y 1X 1 l histogramme couleur classique, et H ( c) δ ( I( i, j), c). α( i, j), où I est l image segmentée s = i= 0 j= 0 e taille ( X, Y), c est la couleur u pixel ( i, j), δ ( i, j) est le symbole e Kronecker et α ( i, j) éfini par : ' ' 1 si k, k [ W, W ] I( i + k, j + k ) = I( i, j) α ( i, j) = (1.10) 0 sin on i H i En éfinitif, le escripteur couleur associé à chaque image e la base est e la forme : CD, pr, σ, SCR(1),..., CD, pr, σ, SCR( L), ) ( L L L G où L est le nombre e couleurs ominantes utilisées (ans notre cas L =5) Nous avons également utilisé l histogramme couleur es couleurs ominantes (Lab) en supposant une istribution Gaussienne es couleurs.. Descripteurs texture La texture est une caractéristique fonamentale es images, car elle concerne un élément important e la vision humaine. Il n existe pas e éfinition précise et consensuelle e la texture en vision par orinateur. On parle fréquemment e répétition e motifs similaires, sans pour autant que cette notion soit exhaustive. De manière générale, la texture se trauit par un arrangement spatial es pixels que l intensité ou la couleur seules ne suffisent pas à écrire. Elle peut consister en un placement structuré

23 Chapitre 1 : Recherche par le contenu ans les bases images fixes éléments mais peut aussi n avoir aucun élément répétitif. On peut ainsi grâce à la texture faire la ifférence entre un coucher u soleil et une orange. Elle trauit onc l aspect homogène une zone et peut être écrite selon ses propriétés spatiales et fréquentielles. L approche basée sur la configuration spatiale e l image consiste à représenter la texture sous forme un histogramme en niveau e gris. Des moments statistiques sont alors calculés sur les matrices e cooccurrences pour onner es inications sur le contraste, la irectionalité, la périoicité u motif, etc. [Har 73, Ha 93]. Les matrices e cooccurrence éfinissent la probabilité jointe e l occurrence e eux niveaux e gris quelconques ans une image. Chaque élément i( x, y) e position ( x, y) ans cette matrice, ren compte e la probabilité que eux niveaux e gris x et y apparaissent conjointement ans un certain voisinage. Plusieurs statistiques peuvent alors être calculées sur la matrice e cooccurrence. Citons, par exemple : l énergie, l entropie, le contraste et l homogénéité. Néanmoins, e telles approches sont limitées u fait que la pertinence es résultats épen es zones traitées e l image, ainsi que es valeurs es paramètres liés à la méthoe (orientation et pas). L une es méthoes e escription e la texture les plus utilisées concerne les propriétés fréquentielles et s appuie sur la transformée e Fourier, la représentation e Gabor, les onelettes et la transformée en cosinus iscrète [Man 96a, Nas 98]. Elle repose sur l analyse une fonction e ensité spectrale ans un omaine fréquentiel [Baj 73], les coefficients une transformation biimensionnelle iniquant la corrélation es motifs ans une image. La granularité e la texture étant proportionnelle à la périoe spatiale, les textures e grane granularité ont une énergie spectrale concentrée aux fréquences basses alors que les textures plus fines concentrent leur énergie aux fréquences hautes. Puisque les textures sont la répétition un motif, elles seront caractérisées par es pics ans la représentation fréquentielle e l image (les textures fines ans les fréquences hautes et les textures grossières ans les basses fréquences). L iée consiste onc à écrire une image I( x, y) comme étant un signal à eux variables spatiales x et y. Ce signal est écomposé comme une somme ponérée e fonctions sinusoïales. Le pois e chacune e ces fonctions ans la écomposition est calculé par le coefficient e Fourier F f x, f ) où : F( f, f ) x y = + + I( x, y) e iπ ( f x x+ f y y) ( y xy, (1.11) f x et f y sont les fréquences spatiales e l image I ( x, y). Les escriptions e type Fourier écomposent l image sur es fonctions sinusoïales, qui ont la propriété e s étenre inéfiniment ans l espace. Une telle escription est onc aaptée à es signaux périoiques ou quasi-périoiques, mais trouve sa limitation pour es signaux plus complexes, présentant e fortes iscontinuités. Or, les images présentent justement ce type e caractéristiques. C est pourquoi autres écompositions ont été utilisées, comme celles ite e Gabor. L iée fonatrice e la méthoe e Gabor est e écomposer l image sur es fonctions analysantes obtenues à partir une fonction sinusoïale orientée sur l axe es x et moulée par une enveloppe gaussienne ans les irections x et y. Ces fonctions sont ensuite générées par ilatation et rotation. Les filtres e Gabor sont largement utilisés aujour hui, notamment u fait e leur pertinence en regar u système visuel humain. En effet, Marcelja [Mar 80] a montré que les cellules u cortex humain pouvaient être moélisées par es fonctions e Gabor à une imension. Daugman [Dau 85] a élargi ce moèle à eux imensions.

24 Chapitre 1 : Recherche par le contenu ans les bases images fixes Cepenant, une limitation provient u choix non trivial es paramètres pour éformer la fonction analysante. Une classe plus générale e méthoes e escription espace - fréquence est ainsi couramment utilisée en traitement images : les analyses multi-résolution par onelettes. Etant onnée la nature es bases images utilisées ans le care e notre travail, nous n avons pas fait appel au escripteur e texture..3 Descripteurs forme La forme est l un es attributs bas niveau également le plus utilisé pour écrire le contenu visuel es images. L importance e la forme pour la recherche images peut être constatée par le simple fait que plusieurs systèmes SRIC incorporent une façon ou une autre es escripteurs e formes [Fli 95, Gev 00, Pen 96]. Ces erniers sont utilisés pour écrire la structure géométrique générique u contenu visuel. Zhang et al. [Zha 04] ont proposé e classifier les escripteurs e forme en eux familles : o Descripteurs orientés région : qui écrivent les objets selon la istribution spatiale es pixels qui les constituent. o Descripteurs orientés contour : qui écrivent les objets selon leur contour externe. Pour chacune e ces approches (région ou contour), on peut ensuite istinguer eux sous familles : o Celles qui écrivent globalement les objets. o Celles qui écrivent les objets en les consiérant comme un arrangement e sous parties (structurelles). o La hiérarchie entière e cette classification et les principales méthoes couramment citées ans la littérature sont présentées ans la figure 1.. Descripteur e forme Basé contour Basé région Structurel Global Global Structurel Chaînes Smooth curve ecomposition Les approximations polygonales primitives géométriques simples Distance e Hausorff Shape contexte Elastic matching Analyse multi-echelle Transformé e Fourier Moment e périmètre Shape signature Angular Raial Transform Les moments géométriques Les moments orthogonaux Shape matrix Les moments e Zernike Les moments e Legenre Axe méiane Enveloppe Fig. 1.. Classification es escripteurs e formes D

25 Chapitre 1 : Recherche par le contenu ans les bases images fixes Quelque soit la méthoe utilisée, il emeure important que certaines propriétés invariance soient vérifiées, notamment pour la translation, le changement échelle et la rotation, u fait que l être humain corrige instinctivement les effets e ces transformations lors e la recherche un objet. Dans certaines applications, la robustesse à l occultation peut également être souhaitée. Pour les escripteurs orientés contour, un exemple classique est l histogramme es orientations es contours [Jai 98], qui pren en compte l angle u graient calculé pour es pixels e contours. Cet histogramme onne une escription approximative e la forme ans une image, calculée sur les régions e l image où il y a suffisamment activité e la couleur pour générer es contours. D autres escripteurs sont basés sur les coins et les contours ans les segments e frontières [Pet 00]. En utilisant seulement l information sur la frontière es objets, ces escripteurs ignorent les informations ponctuellement importantes contenues à l intérieure es objets. Dans [Bel 0, Scl 95] les auteurs utilisent es configurations spatiales e points intérêt situés à l intérieur es contours, mais la méthoe est couteuse en temps e calcul, en raison e la nécessité e localier les points. De plus, l absence e points intérêt peut affecter les performances. La théorie es moments géométriques, qui utilisent es éveloppements en série pour représenter la forme es objets, évite ce type e problème [Ter 98]. [Hu 6] propose plusieurs fonctions non linéaires éfinies sur les moments géométriques qui sont invariantes à la translation, à la rotation et aux changements échelle. Ces escripteurs ont été appliqués avec succès à l ientification avions, e navires et e visage [Ter 98]. Dans cette catégorie nous trouverons également les escripteurs e Fourier qui écrivent le contour par ses composantes fréquentielles [Per 77, Zha 01], les moments e Zernike et Zernike moifié [Tea 80], qui ont été aaptés par e nombreux auteurs [Ter 98, Kim 00], les invariants ifférentiels [Gev 04], es escripteurs basés sur la transformée e Hough [Fer 05], et les escripteurs élémentaires, comme le rapport longueur/largeur u rectangle englobant, l isotropie, et enfin le escripteur CSS (Curvature Scale Space) [Mok 9] recommané par MPEG7. Daoui et al [Dao 00] ont proposé utiliser la istance géoésique éfinie ans [Ebe 94]. Ainsi au lieu e calculer cette istance parmi l ensemble e points e CSS ( u, σ ), les auteurs ont proposé l utilisation es maximums es CSS calculés à partir un certain seuil σ pour inexer le contour e la forme Les escripteurs orientés région ont également été beaucoup utilisés. Nous focalisons sur le escripteur ART (Angular Raial Transform) introuit par [Kim 99], et que nous avons exploité ans le care e ce travail. Le principe e ce escripteur est e projeter l objet à étuier sur une série e fonctions e base (Fig1.3) Fig 1.3 Parties réelles es fonctions e base ART Le escripteur est constitué un vecteur e 33 coefficients obtenus par l équation :

26 Chapitre 1 : Recherche par le contenu ans les bases images fixes F π 1 * = I nm( ρ, θ ), f ( ρ, θ) = I nm( ρ, θ ), f ( ρ, θ ρρθ (1.1) nm ) 0 0 ans laquelle I représente l image à écrire et f, l une es 33 fonctions e bases utilisées. Ce escripteur e formes possèe e nombreuses propriétés : petite taille, robuste aux bruits, invariance aux changements échelle et à la rotation, possibilité e écrire es objets complexes..4 Combinaison es escripteurs Les attributs e bas niveau (couleur, texture, forme) écrivent les images par leur contenu visuel. Ces attributs peuvent être combinés pour caractériser e façon encore plus efficace le contenu. Cepenant, ans e très nombreuses situations, un attribut seul ne suffit pas pour écrire le contenu e l image. Il est onc intéressant e combiner ces ifférents attributs pour une recherche plus efficace et plus iscriminante. Les problèmes qui se posent lors e la combinaison e ces ifférents attributs pour la recherche et l inexation sont au moins e trois orres : La mesure e similarité : Celle-ci est une étape primoriale ans tout système e recherche. Dans le cas où les images sont écrites par ifférents attributs, une solution classique pour mesurer la similarité est e calculer séparément les mesures e similarité pour chaque attribut puis en éuire une mesure composée e la similarité globale entre les images. Cela suppose bien éviement que les ifférents attributs sont inexés séparément (avec es structures inex séparées). Or, en base e onnées, Il existe peu e méthoes qui utilisent plusieurs inex pour structurer les onnées. Une autre ifficulté relative à la similarité est e éterminer comment combiner plusieurs mesures éfinies souvent sur es omaines ifférents, avec es ynamiques ifférentes, es egrés importance ifférents, notamment pour l utilisateur, mais également e natures ifférentes. L espace e escription : Le choix e l espace e escription consiste à chercher les attributs (escripteurs) visuels significatifs e la base images, l ensemble e ces attributs étant représenté par un nuage e points ans un espace e imension élevée. Un problème qui se pose, si les vecteurs contiennent plusieurs attributs, est celui e la imension e l espace e escription. Ce problème est connu ans la communauté es bases e onnées par "la maléiction e la imension" ou "imensionality curse avec le vocable anglais" La structuration : la phase e construction une structure inex est une étape utile ans le cas où les onnées sont volumineuses et appartiennent à un espace e escription e grane imension. Cela revient à structurer les nuages e points relatifs aux escripteurs es images et à les stocker efficacement en machine. Cette tâche e structuration peut s avérer ifficile ans le cas où les onnées à structurer sont e nature hétérogène. La ifficulté résie notamment ans le choix e la istance à utiliser pour la structuration (mise en place un inex) et ans la normalisation es ifférents types e onnées. Dans le paragraphe suivant nous aborons les ifférents aspects e la mesure e similarité. Les problèmes liés aux bases e onnées à savoir le problème e la maléiction e la imension et celui e la structuration seront traités ans les chapitres suivants. 3 Mesure e similarité Dans la majorité es SRIC, la recherche images similaires est basée sur la similarité es caractéristiques visuelles telles que la couleur, la texture ou la forme. La fonction istance

27 Chapitre 1 : Recherche par le contenu ans les bases images fixes utilisée pour évaluer la similarité épen es critères e la recherche mais également e la représentation es caractéristiques. L iée principale est généralement associer à chaque image un vecteur multiimensionnel représentant les caractéristiques e l image, et e mesurer la similarité es images en utilisant une fonction e istance entre les vecteurs. Plusieurs mesures e similarité existent ans la littérature, et sont basées soit sur la comparaison entre es escripteurs es images, soit sur la comparaison irecte entres images. Nous nous intéressons ans cette étue au premier type e mesure e similarité. Nous présentons ans ce paragraphe abor le principe e la similarité attentive et pré-attentive avant e faire un rapie tour horizon sur les mesures e similarité basées sur le moèle métrique. Nous ferons le point sur les principales mesures e similarité utilisées ans le omaine es SRIC, et enfin nous introuirons le principe e la mesure e similarité par l approche noyau. 3.1 Similarités attentive et pré-attentive L œil humain possèe la capacité ientifier visuellement les images similaires à partir e leur contenu. Il est prouvé [Lev 76] que la perception visuelle humaine opère selon eux moes : perception attentive et pré-attentive [Bim 99]. La perception attentive a un lien irect avec l interprétation, elle intervient une fois que l attention e l utilisateur a été focalisée. Son utilisation est requise ans es omaines spécifiques tels que la étection e visages, l imagerie méicale ou mécanique. Ces omaines comparent les objets et éfinissent es critères e similarités qui leur sont propres. La perception pré-attentive quant à elle, est basée sur la similarité entre les signaux perçus par l œil, sans aucune forme interprétation, elle fait intervenir es mécanismes globaux sur l image, et correspon à es traitements qui ont lieu avant le cortex ans le cerveau humain. Elle est utile ans es applications plus générales pour lesquelles la couleur, la texture, la forme ou la perception es relations spatiales est plus importante. Plusieurs moèles tentent e reprouire automatiquement la perception humaine e la similarité es signaux sensoriels, Parmi les plus importants, on cite le moèle e Tversky [Tve 77] et le moèle métrique [Tor 65] Moèle e Tversky Dans la théorie e Tversky [Tve 77], la éfinition e la similarité est inspirée e la théorie es ensembles. Dans le cas où l on cherche à comparer une image I une base image avec une image requête R, Tversky propose que la similarité Sim( R, I) entre I et R ait les propriétés suivantes : * Sim ( R, I) est autant plus importante que I et R ont es caractéristiques communes. * Sim ( R, I) est autant moins importante que I possèe es caractéristiques propres que R ne partage pas. * Sim ( R, I) est autant moins importante que R possèe es caractéristiques propres que I ne partage pas. En notant C I et C R les caractéristiques extraites e I et R respectivement. Il vient que CR C I représentent les caractéristiques propres e R, CI CR celles e I, et CR CI celles commune à I et R, Tversky propose alors : Sim( R, I) = f ( CR CI ) α f ( CR CI ) βf ( CI CR ) (3.13) autrement it, la similarité entre eux images est obtenue par une combinaison linaire une fonction e eux types e escripteurs, α et β étant es ponérations.

28 Chapitre 1 : Recherche par le contenu ans les bases images fixes Notons que cette mesure s applique à es caractéristiques e préicats logiques et que son application à es onnées numériques pose e nombreux problèmes. Santini et Jain [San 95] montrent que le moèle e similarité e Tversky peut être utilisé pour moéliser les istances entre les textures, mais cette approche reste inintéressante pour l inexation Similarité par une fonction istance La perception humaine e la similarité peut être moélisée par une mesure e istance appropriée ans un espace métrique multiimensionnel. Mathématiquement, une istance normalisée ist est éfinie comme une fonction à valeur ans [0 ;1] et qui vérifie les trois propriétés suivantes : * ist( V1, V) + ist( V, V3) ist( V1, V3) (3.14) * ist ( V1, V) = ist( V, V1 ) (3.15) * ist ( V1, V) = 0 V1 = V (3.16) La conition (3.14) est connue sous le nom inégalité triangulaire, (3.15) est appelée symétrie. Les istances sont nombreuses ans la littérature, éfinies pour es valeurs scalaires, ensemblistes, vectorielles, etc. (ifférence absolue, cosinus, Harman, Dice, Jacquar, egré inclusion, prouit scalaire, Manhattan, Hamming, Eucliienne, Hausorff ). Nous présentons ans la suite les istances les plus couramment utilisées. Lorsque les onnées sont assimilées à es vecteurs, ce qui est souvent le cas, la istance e Minkowski est fréquemment employée. Elle est onnée par : ist m 1 N m m 1, V) = ( Wi v1, i v, i ) i= 1 ( V (3.17) m représente l orre et W est une matrice e ponération. En faisant varier la valeur e m, on obtient ifférentes fonctions e istance. La istance e Minkowski u premier orre ( m = 1) est une istance e Manhattan et la istance e Minkowski u euxième orre ( m = ) est une istance Eucliienne. Le choix 'une valeur appropriée pour m épen e l importance que nous voulons accorer aux plus granes ifférences. Ainsi les granes valeurs e m onnent progressivement plus 'importance aux ifférences les plus granes et quan m ten à l'infini la istance e Minkowski ten vers la istance e Tchebychev. Distance Eucliienne Lorsque m =, on obtient la istance Eucliienne : ist N ( V1, V) = Wi ( v1, i v, i ) i= 1 (1.18) C est la istance la plus fréquemment utilisée grâce à ses propriétés géométriques intéressantes. Cette istance à tenance à onner plus importance aux plus granes ifférences sur une variable simple. Le contour e la même istance (Eucliienne) à partir un point onnée à une forme sphérique (cercle en eux imensions). Elle est surtout recommanée pour es espaces isotopiques où les onnées ont les mêmes propriétés ans toutes les irections (imensions). Les clusters éfinis par une istance Eucliienne sont invariants à la translation et la rotation, par contre ils ne sont pas invariants aux transformations linéaires et plus généralement à autres transformations qui égraent les rapports entre les istances. La figure 1.3 représente

29 Chapitre 1 : Recherche par le contenu ans les bases images fixes un exemple e l effet une transformation linéaire sur la classification basée sur une istance Eucliienne 1. D après la figure 1.4, on remarque que, lorsque l'axe vertical est multiplié par un facteur e.0 et l'axe horizontal est rétréci par un facteur e 0.5, le groupement e onnées est moifié (comme illustré à roite). Réciproquement, si l'axe vertical est rétréci par un facteur e 0.5 et l'axe horizontal multiplié par un facteur e.0, e nombreux petits faisceaux apparaissent. Dans les eux cas e figure les groupements es onnées iffèrent u groupement original Fig 1.4. Effet une transformation linéaire à une classification basée sur une istance Eucliienne Distance e Manhattan Pour m = 1, on obtient la istance e Manhattan : N 1, V) = ( v1, i v, i ) i= 0 ist( V (1.19) 1 Exemple tiré e Pattern Classification e Richar O. Dua, Peter E. Hart et Davi G. Stork

30 Chapitre 1 : Recherche par le contenu ans les bases images fixes Cette istance est aussi connue sous le nom e city-block. Elle est recommanée par le comité MPEG-7 [Jea 01] pour comparer eux formes écrites avec la méthoe ART e Kim [Kim 99]. Ainsi, pour eux objets O 1 et O ont les formes sont écrites respectivement par vecteurs V 1 et V, constitués une série e N coefficients chacun, [Jea 01] propose évaluer une mesure e issemblance entre les objets par la formule : N ist( O, O = v v (1.0) 1 ) C est cette formulation que nous utiliserons ans cette thèse. i= 0 1, i, i Distance e Chebychev Pour m =, on obtient la istance e Chebychev : ist V, V ) = max( W v v ) (1.1) ( 1 i 1, i, i i Cette istance est aaptée aux onnées e grane imension, elle est souvent employée ans les applications où la vitesse exécution est importante. Cette istance examine la ifférence absolue entre les ifférents pairs es vecteurs, elle est consiérée comme une approximation e la istance Eucliienne mais avec moins e calcul. Dans la formule e la istance, les variables v 1, i et v, i représentent respectivement les valeurs ème u i attribut es eux vecteurs/escripteurs V 1 et V, et W i représente le pois associé à cet attribut. Nous istinguons une autre famille e istances ites istances quaratiques ont l expression t est la suivante : V, V ) = ( v v ) W ( v v ) (1.) ( 1 1, i, j 1, i, j En fonction e la matrice M on obtient ifférentes istances. Avec W = I, telle que I est la matrice unité, on retrouve la istance Eucliienne classique. Une illustration es contours es ifférentes istances présentées auparavant est onnée par la figure 1.5 Eucliienne chebyshev Manhatt Fig.1.5. les contours e ifférentes istances Distance e Mahalanobis 1 Avec W = Cov, on obtient la istance e Mahalanobis. La matrice Cov correspon à la matrice e covariance entre l ensemble es escripteurs images. A la ifférence e la istance Eucliienne où les composantes es vecteurs sont traitées e la même façon, cette istance pren en consiération les épenances (corrélations) entre les onnées.

31 Chapitre 1 : Recherche par le contenu ans les bases images fixes Distance u Chi- 1 Avec W = D telle que D est une matrice iagonale exprimant la fréquence relative apparition es mots/attributs ans les vecteurs e onnées, on obtient la istance u Chi. Cette istance est utilisée en analyse e onnées pour que ces onnées puissent apparaître ans un espace commun. Ce type analyse est souvent utilisé ans l analyse en composantes principales permettant e mettre en évience les combinaisons es attributs principaux. Cette istance est exprimée par la fonction suivante : N N fv f 1, j V, j Chi ( V1, V) = ( ) (1.3) f. j f f j = 1 où N est le nombre total attributs ans la base images, f V ésigne la fréquence e 1, j l attribut j ans le vecteurv 1, fv ésigne le nombre total attributs ans le vecteur V 1 1 et, f. j ésigne la fréquence e l attribut j ans l ensemble e la base es vecteurs. Dans les mesures que nous avons présentées précéemment, pour un attribut onné, la istance est calculée à partir e la ifférence v 1, i v, j entre les vecteurs e onnées. Or, cette manière e procéer risque e fausser le résultat e la mesure e similarité notamment lorsque les attributs écrivant les images ont es omaines e éfinition ifférents. Par exemple, ans le cas e la istance e Manhattan, les attributs ayant une grane ispersion e valeurs sont implicitement favorisés, ce qui conuit à une augmentation consiérable e la istance finale. Il est onc nécessaire e normaliser la valeur e similarité. Cela peut s'effectuer par l interméiaire une opération ite e recoage es onnées en réalisant un centrage pour tous les attributs (on retranche à toutes les valeurs la moyenne es valeurs e l attribut pour tous les exemples) et une réuction (on ivise toutes les valeurs par l écart type e l attribut). Ainsi, tous les attributs sont e moyenne nulle et écart type égal à 1. Toutefois, ce processus ne peut être effectué que si l on connaît tous les vecteurs e onnées, ce qui n est pas toujours le cas notamment ans les traitements incrémentaux. Une solution consiste plutôt à exprimer e manière explicite le omaine e éfinition es attributs et à intégrer cette information ans le calcul e la similarité. Par exemple, si l on introuit une fonction Dom i qui calcule la ifférence entre la borne haute et la borne basse u omaine e éfinition e l attribut, la istance e Manhattan s énonce e la manière suivante : N ( v1, i v, i ) ist( V 1, V) = Wi ( v1, i, v, i ) avec ( v1, i, v, i ) = [01] (1.4) om i= 1 Avec cette fonction e istance, il est possible e traiter es vecteurs composés e onnées hétérogènes à l aie une seule mesure générale que l on utilise lors u calcul e la fonction ( v1, i, v, i ) corresponant au type e la onnée en cours e traitement. Le problème qui se pose avec cette istance résie ans le choix es ponérations. En effet, la manière ont les attributs sont ponérés est tout à fait cruciale pour que la mesure effectuée soit pertinente et puisse refléter l importance que l on souhaite accorer à chaque attribut. Cette ponération n est pas toujours facile à réaliser, notamment si l on n'a pas expert u omaine capable e la fournir. Dans le cas es SRIC, la ponération est liée au besoin e l utilisateur, susceptible e changer à chaque requête. V1 V i 3. Similarité ans les moteurs recherche Les performances es SRIC épenent largement e la mesure e similarité/issimilarité utilisée pour la comparaison es escripteurs es images. L un es attributs les plus utilisés ans les SRIC est la couleur, et le escripteur le plus courant et le plus rencontré ans la

32 Chapitre 1 : Recherche par le contenu ans les bases images fixes littérature est l histogramme couleur. De très nombreux auteurs ont proposé iverses manières utiliser l histogramme comme escripteur, ainsi que iverses istances associées qui permettent e mesurer la similarité entre eux histogrammes. La istance Eucliienne est le plus souvent utilisée pour mesurer la similarité entre les histogrammes, mais malheureusement cette istance n est pas optimale pour la comparaison e ce type e signature. Parmi les nombreuses techniques e calcul e similarités qui ont été proposées, on trouve l intersection es histogrammes [Swa 91]. Cette mesure est équivalente à une istance L 1 si les histogrammes sont normalisés. Une euxième manière e mesurer la similarité entre les histogrammes est e voir l histogramme comme une istribution, et ainsi utiliser l entropie comme similarité [Kul 59]. Une version symétrique e mesure par l entropie est aussi proposée [Puz 97], ainsi qu une mesure probabiliste au sens e Chi [Set 95]. Malheureusement ces techniques comparent inépenamment les valeurs es histogrammes sans prenre en consiération la corrélation entres les composantes. Ceci pose es problèmes en termes e robustesse puisqu elles sont sensibles à certaines transformations, notamment la translation. Des mesures plus robustes sont proposées, comme les istances sur les istributions cumulées [Str 95], l Earth Mover s Distance [Rub 99], ou les istances quaratiques généralisées. Ces méthoes sont efficaces pour la mesure e similarité mais elles ne traitent pas le problème e la non linéarité es onnées, e plus elles sont coûteuses au niveau temps e calcul particulièrement ans le care e l apprentissage. En fait, ans les SRIC, les images ne sont pas représentées par un unique vecteur relatif à un attribut, mais un ensemble e vecteurs se rapportant aux ifférents espaces e caractéristiques (couleur, texture, forme, etc.). Le problème qui se pose alors, est e savoir comment combiner plusieurs mesures éfinies souvent sur es omaines ifférents et éventuellement avec es importances variables ifférentes. Néanmoins, les résultats expérimentaux montrent, e manière éviente, que la prise en compte simultanée e plusieurs attributs onne toujours e meilleurs résultats par apport à l utilisation un seul et unique attribut [Pic 96b]. Généralement, on va être amené à combiner es mesures établies inépenamment les unes es autres. Les ifficultés sont au moins e trois orres : * Les omaines e éfinition es attributs sont ifférents. * Les attributs ne sont pas toujours inépenants les uns es autres. * Leurs importance n est pas la même. La littérature présente plusieurs formes e combinaison entre ifférentes mesures e similarité plus au moins justifiées. Nous citons uniquement les techniques les plus fréquemment utilisées ans les SRIC. Une es techniques courante consiste à concaténer les ifférents types e vecteurs puis uniformiser les échelles avec une istance e Mahalanobis. Les systèmes CANDID [Kel 95], QBIC [Nib 93] et Netra [Man 96b] offrent la possibilité e combiner facilement les escripteurs

33 Chapitre 1 : Recherche par le contenu ans les bases images fixes e texture et e forme en calculant séparément les mesures e similarité pour chaque type e escripteurs puis en érivant une mesure composée e similarité globale. Les escripteurs couleur peuvent également être intégrés ans la combinaison. Ce type e istance emeure confronté aux problèmes u choix es ponérations et e la non linéarité es onnées. Quan les composantes sont inépenantes, es mesures plus simples suffisent. VISUALSEEK [Smi 96] utilise une simple somme entre la istance spatiale (elle-même une simple somme) et la istance e couleurs (une istance quaratique aaptée). Cha et Chung [Cha 98] proposent encore une somme es ifférences absolues entre la moyenne et l écart-type respectivement sur les quatre quarants et trois canaux images RVB. Une somme es ifférences quaratiques, ponérée par l inverse e la variance corresponante, est utilisée pour la texture (granularité, contraste et irection) et la forme ans QBIC [Fal 94]. Il est généralement ifficile e faire un choix parmi toutes les techniques e mesure e similarité. Le choix 'une mesure particulière épen non seulement e l'application, mais également e plusieurs facteurs tels que la istribution es onnées, le temps e calcul, la complexité, etc. Chaque mesure présente es propriétés ifférentes, et l intérêt une mesure e similarité par rapport à une autre, notamment ans un SRIC, résie ans sa capacité à s aapter aussi bien à l application visée, qu à la nature es onnées utilisées pour la escription es images. A la ifférence es mesures e similarité présentée ans les paragraphes précéents, les fonctions noyaux offrent e nombreux avantages pour l analyse et l exploitation es escripteurs images. Comme nous allons le voir, les fonctions noyaux éfinissent, le prouit scalaire ans l espace multiimensionnel à travers une fonction e base φ par : k V, V ) =< Φ( V ), Φ( ) >. L intérêt e l approche noyau vient u fait que seul le noyau k oit ( 1 1 V être éfini alors que la fonction e base φ n est jamais explicitement calculée. Ceci offre un gran choix utilisation es fonctions e bases non linéaires, posséant es capacités pour s aapter à la iversité es caractéristiques es escripteurs. Avec l approche noyau, on peut également obtenir un care mathématique formel à partir uquel une seule mesure e similarité pour ifférents types e onnées peut être établie. Ceci, permet ainsi e faciliter le processus inexation et e contourner les problèmes liés à la combinaison e plusieurs mesures e similarité exposés ans les paragraphes précéents. 4 Similarité par approche noyau Dans le paragraphe suivant, nous nous intéressons à la notion e similarité par approche noyau. Nous présentons abor le principe u "Kernel Trick", qui permet e transformer une méthoe basée sur le prouit scalaire en une méthoe à noyau. Nous aborerons ensuite les exemples e fonctions noyaux les plus utilisées ans la littérature. Enfin, nous étaillerons la généralisation e la notion e istance par es fonctions noyaux. 4 3 ist( V, V ) moyt i ( V ) moyt i ( V ) + ecartt, i ( V1 ) ecartt, i ( ) = 1, 1, V t= 1 i= 1

34 Chapitre 1 : Recherche par le contenu ans les bases images fixes 4.1 Astuce u noyau «Kernel Trick» Avant e présenter l astuce u noyau, il est nécessaire e revenir sur quelques notions e base liées aux espaces à noyau. Commençons abor par éfinir formellement les espaces e Hilbert à noyau reprouisant (RKHS : Reproucing Kernel Hilbert Space). Définition 1 Un espace e Hilbert à noyau reprouisant Η (RKHS) est un espace e Hilbert e fonctions pour lequel il existe une fonction k : χ χ R (appelée noyau auto-reprouisant) vérifiant : * Η contient toutes les fonctions k( V 1,.) pour V 1 χ * la propriété reprouisant est satisfaite : f Η V χ < f, k( V,.) > H = f ( ), 1 1 V1 Définition Une fonction k : χ χ R est un noyau éfini positif si et seulement si : * Elle est symétrique : V V χ k( V, V ) = k( V, ) 1, 1 V1 N N * Et éfinie positive : N 1, ( V,..., V ) χ, ( a,..., a ) R, a a k( V, V ) 0 1 n 1 n N i i, j= 1 Le théorème e Moore-Aronszajn [Aro 50] inique qu à tout noyau éfini positif correspon un unique RKHS. Notons que ce résultat ne suppose aucune conition sur l espace origine χ. Pour la suite, nous notons H k le RKHS associé à la fonction noyau k Pour mieux comprenre la éfinition formelle u RKHS, nous introuisons le théorème e Mercer [Mer 09] uquel vont écouler e nombreuses et remarquables implications pratiques. Théorème 1 : Théorème u Mercer Toute fonction k ( V 1, V) éfinie positive sur un omaine compact χ χ peut s écrire sous la forme une série uniformément convergente, i.e. N k( V1, V) = λ i ψ i ( V1) ψ i ( V), N ( 1.5) i= 1 où les { λ } N i i= 1et les { ψ } N i i= 1 sont es valeurs propres et les fonctions propres orthogonales e l opérateur (linéaire auto-ajoint compact onc iagonalisable) T k : L( χ) L ( χ), ( T k f )( V1 ) = k( V1, V) f ( V) V f L ( χ) (1.6) Dans le cas où convergente. N = χ, la série est alors presque partout absolument et uniformément Remarque 1 La séquence { ψ est une base orthonormale e H k. Il s ensuit que toutes fonctions } N i i= 1 f H k s expriment sous la forme : f ( V1 ) = aiψ i ( V1) N i= 1 Le théorème 1 nous appren que tout noyau éfini positif amet la représentation suivante : N N k ( V 1, V ) = λ iψ i ( V 1 ) ψ i ( V ) = λ iψ i ( V 1 ) λ iψ i ( V ) =< Φ ( V 1 ), Φ ( V ) > (1.7) i = 1 i = 1 Nous pouvons alors éfinir explicitement l espace e escription engenré par la fonction noyau k : j i j

35 Chapitre 1 : Recherche par le contenu ans les bases images fixes Φ : χ H k V1 ( λ1ψ 1( V1 ), λψ ( V1 ),..., λnψ N ( V1 )) (1.8) M représente la imension e H k, et peut être e imension infinie. A tout RKHS H, on associe un prouit scalaire et une norme, éfinis par les équations (1.30) k et (1.31) : soit f ( V1 ) = aiψ i ( V1) et par : La norme e N i= 1 < f ( V ), h( V1 ) > H H k est éfinie par : N 1 ) = b i i ( V1 ) i= 1 h( V ψ, le prouit scalaire ans H k est éfini = N N N aibi aiψ i ( V1 ), biψ i ( V1 = (1.30) i= 1 i= 1 H i= 1 λi 1 ) k f H k =< f ( V ), f ( V ) > 1 1 H k N ai = λ i= 1 i k (1.31) De l équation (1.7 ), on peut voir que k( V 1, V1 ) correspon à l évaluation un prouit scalaire ans le RKHS H k inuit par k. Cette constatation a e granes conséquences pratiques que nous explicitons au travers e la proposition 1. Proposition 1 «L astuce u noyau»(kernel Trick) Tout moèle ne nécessitant ans sa construction que la manipulation e prouits scalaires entre observations (et non leur coronnées explicites) peut être construit implicitement ans un espace e Hilbert en remplaçant chaque prouit scalaire par l évaluation un noyau éfini positif sur un espace quelconque. Ce procéé e substitution a pris le nom e l «astuce u noyau». L astuce u noyau est qu elle permet e transformer e nombreux algorithmes linéaires (e.g. régression, classification, réuction e imensionnalité) en algorithmes non-linéaires tout en conservant les mêmes propriétés optimisation. Nous verrons par la suite comment l astuce u noyau peut être exploitée pour éfinir une mesure e similarité (istance) généralisée ans l espace H k. Dans le paragraphe suivant nous présentons les ifférentes fonctions noyaux les plus citées ans la littérature. 4. Fonctions noyaux classiques Les fonctions noyaux les plus fréquemment utilisées sont : le noyau linéaire, polynomial, triangulaire et le noyau Gaussien. o Le noyau linéaire : k ( Vi, V j ) =< Vi, V j >, Cette fonction exprime le prouit scalaire usuel et elle nous permet e nous comparer à une utilisation sans approche noyau. Par exemple, elle exprimera la istance Eucliienne si la mesure e similarité est calculée à travers une istance Eucliienne. o Gaussienne avec une istance Eucliienne k V i V j ( V, ) δ i V j = e C est cette approche que nous utiliserons ans le care e ce travail o Polynomiale e egré m : k( V, V ) =< V, V m i j i j >

36 Chapitre 1 : Recherche par le contenu ans les bases images fixes o Triangulaire : 1 k( Vi, V j ) = 1 Vi V j r Ce noyau [Ber 84] a été introuit pour la recherche images pour ces propriétés invariance aux échelles [Sah 03]. Afin avoir un noyau symétrique éfini positif, les onnées sont placées ans une sphère e rayon r / o Gaussienne avec une istance Chi (Gaussien Chi ) ist( Vi, V j ) k( V, V ) = e δ N ( Vti Vtj ) Avec ist une istance au sens u Chi : ist( Vi, V j ) =. V + V Le noyau le plus utilisé ans la littérature est le noyau Gaussien : k i j ist( V i, V j ) ( V, ) δ i V j = e tel que δ est le paramètre e l échelle. Ce paramètre permet e éfinir une manière implicite l espace e projection à partir uquel on éuit la mesure e similarité. Généralement, une petite valeur e δ correspon à un espace e onnées riche ans le sens où les frontières entres les ifférentes classes e onnées sont bien istinguées, et une grane valeur e δ correspon à un espace e onnées pauvre ans le sens où les onnées sont moins iscriminantes ans l espace projeté. Le noyau Gaussien épen e la istance ist ( V i, V j ), ce qui nous permettra e choisir la istance la plus appropriée aux onnées traitées. Une comparaison entre les ifférents noyaux qui existent ans la littérature en terme e classification et qualité e la recherche a été effectuée par Philippe Henri et al. [Phi 08]. La comparaison montre que la mesure e similarité avec un noyau linéaire (sans noyaux) prouit e mauvais résultats, tanis que l utilisation une mesure e similarité basée sur un noyau Gaussien avec une istance Chi onne e meilleurs résultats. Par ailleurs, les fonctions Gaussiennes avec une istance Eucliienne et avec une istance triangulaire sont moins performantes qu une Gaussienne Chi. Finalement, le problème e la recherche par le contenu consistera à trouver la bonne istance pour mesurer la similarité entre les escripteurs images. Ceci est équivalent au problème e trouver une fonction e représentation ϕ : V1 V qui permet e représenter le vecteur V 1 ans un espace e projection avec un autre vecteurv. Iéalement cette représentation evrait une part être informative et compacte (avoir le maximum information en ayant la imension la plus petite possible) et autre part séparer au mieux les ifférentes classes e onnées. Le choix u noyau est crucial et correspon à un choix a priori sur la notion e similarité entre escripteurs. Dans le reste u ocument, nous avons choisi e travailler avec le noyau Gaussien. Cette fonction comme nous allons le montrer est bien aaptée à nos objectifs. En effet, avec un noyau Gaussien, il est relativement aisé e composer (aitionner, multiplier, ) es noyaux semiéfinis positifs pour en obtenir autres, permettant ainsi une aaptation aux onnées. Nous verrons ans le chapitre 3 comment cette propriété sera exploitée ans le care e l apprentissage pour éuire e nouvelles mesures e similarité aaptées à la nature es onnées et aux besoins e l utilisateur. t= 1 ti tj

37 Chapitre 1 : Recherche par le contenu ans les bases images fixes 4.3 Généralisation e la notion e istance à travers l astuce u noyau L astuce u noyau peut être appliquée à une istance Eucliienne. Dans l espace entrée χ la istance Eucliienne entre eux vecteurs V1 et V est onnée par : ist ( V, V ) V V =< V, V > + < V, V > < V V > 1 = , On éfinit un noyau k ( V 1, V) ans le RKHS H k tel que : k V, V ) =< Φ( V ), Φ( ) > ( 1 1 V où Φ : χ H k est une fonction, qui à tout vecteur V 1 fait corresponre un nouveau vecteur ans l espace H k L astuce u noyau explicitée à travers le théorème e Mercer et la proposition 1 est exploitable puisque les vecteurs ans l expression e la istance Eucliienne n interviennent que par leur prouit scalaire. Si l on ispose onc un noyau k, alors on ispose une istance généralisée qui s exprime en fonction es évaluations u noyau ans l espace H k e la manière suivante: ( Φ( V1 ), Φ( V)) =< Φ( V1 ), Φ( V1 ) > + < Φ( V), Φ( V) > < Φ( V1 ), Φ( V) > (1.3) = k( V, V ) + k( V, V ) k( V, V ) 1 1 Les istances ans l espace transformé s expriment facilement à l aie u noyau k et il est onc inutile e calculer Φ. 5 Synthèse Dans ce chapitre, nous avons présenté certaines techniques utilisées ans le care e la recherche images par le contenu que ce soit pour la escription ou pour la mesure e similarité. Dans la première partie, nous avons aboré la escription e l image par la couleur, la texture et la forme. Ces attributs bas niveau sont les escripteurs les plus largement rencontrés ans es SRIC. La mesure e similarité repose généralement sur un calcul e istances entre escripteurs ans un espace multiimensionnel. Dans la euxième partie, nous avons passé en revue les ifférentes mesures qui permettent évaluer la similarité entre les ifférents ces escripteurs. Le choix une mesure e similarité par rapport à une autre épen e l attribut en question, par exemple ans le cas e la couleur, l intersection histogrammes est la mesure la plus fréquemment utilisée tanis que pour la forme on fera souvent appel à la istance Eucliienne notamment si les escripteurs e type ART. Cepenant, la similarité evient plus ifficile à évaluer si plusieurs attributs (couleur, texture, forme) sont utilisés simultanément pour écrire l image images. La littérature fait un état e iverses approches pour mesurer la similarité es escripteurs visuels., Celles-ci se trouvent confrontées à e nombreux problèmes telle que le choix es ponérations ou l inépenance ans le traitement es ifférents attributs, iminuant ainsi leurs efficacité à trauire fièlement la similarité visuelle entre les images. Dans la troisième partie e ce chapitre, nous avons aboré la mesure e similarité par l approche noyau. Nous avons présenté nos motivations et nos arguments quant à l utilisation es fonctions noyaux en tant que fonction e similarité. Cette approche permet l utilisation un gran nombre e techniques analyse et exploitation e onnées. Deux paramètres que nous allons utiliser pour personnaliser ou orienter le choix u moèle e similarité, comme nous le verrons ans le chapitre 3, sont la imension e l espace e projection et le paramètre e l échelle δ e la fonction noyau Gaussienne. Outre les ifférents avantages en termes analyse et exploitation e onnées, l approche noyau présente un avantage particulièrement intéressant en inexation multiimensionnelle image u fait qu elle permet e séparer le problème e structuration u problème e la représentation es onnées. Nous pouvons ainsi utiliser un seul espace e onnée, onc une 1

38 Chapitre 1 : Recherche par le contenu ans les bases images fixes seule structure inex, tout en ayant la possibilité e travailler avec plusieurs types attributs à la fois, sous réserve bien éviemment avoir construit une fonction noyau aaptée.

39 Chapitre : Inexation multiimensionnelle Chapitre Inexation multiimensionnelle Ce chapitre présente, un état e l art sur les principales méthoes inexation multiimensionnelles utilisées pour la structuration e l espace e escription es images fixes. Nous présentons abor le principe général, les points forts et les points faibles e ces techniques. Ensuite, nous présentons le problème e la maléiction e la imension, ainsi que les principales techniques e la réuction e la imension qui permettent e contourner les problèmes liées aux espaces e grane imension. Les techniques inexation basées sur l approche approximation qui améliorent les performances en granes imension sont enfin présentées suivies une synthèse. 1 Introuction L émergence es technologies numériques ans le omaine u multiméia a mis en valeur l importance es problèmes e l inexation multiimensionnelle et e la recherche par le contenu ans granes bases e onnées. Les méthoes conventionnelles inexation multiimensionnelles ont été proposés pour organiser les escripteurs ou aussi les vecteurs caractéristiques issus es images numériques afin éviter le parcours séquentiel exhaustif es granes bases permettant ainsi un accès et une interrogation rapies lors une recherche par le contenu. Généralement les escripteurs es images sont représentés par es vecteurs multiimensionnels ans un espace e grane imension. Chaque composante e vecteurs correspon à une imension ifférente e l espace e onnées et représente un attribut spécifique un escripteur. Les onnées appartiennent alors à un espace multiimensionnel où chaque imension représente un axe ifférent e l espace e onnées. Ce format e représentation est souvent employé par les méthoes inexation multiimensionnelles grâce à sa flexibilité et sa simplicité pour représenter un gran nombre e ifférents types information. Dans ce contexte, le problème majeur es méthoes inexation multiimensionnelles est comment inexer efficacement une grane collection e onnées multiimensionnelles pour réponre rapiement et efficacement aux requêtes es utilisateurs. De ce fait, les méthoes inexation multiimensionnelles oivent réponre à un certain nombre exigences en ce qui concerne les aspects suivants : 7

40 Chapitre : Inexation multiimensionnelle o Problème e la imension : réponre efficacement aux problèmes liés à la maléiction e la imension. o Passage à l échelle : permettre le éploiement à grane échelle e la structure inex. o Performance e la recherche : assurer une bonne précision e la recherche en un temps raisonnable et acceptable par l utilisateur. o Dynamique : Supporter les insertions et suppression e onnées sans affecter significativement l organisation e la structure inex. o Aaptabilité : Prenre en compte la répartition spatiale es onnées, et en tenir compte lors u processus inexation et e structuration. La réponse à toutes ces conitions est un gran éfi pour les méthoes inexation multiimensionnelles. Dans le paragraphe suivant nous passons en revue les inex multiimensionnels permettant l organisation es images fixes. Nous présentons leurs principes e base ainsi que leurs points forts et points faibles en ce qui concerne les performances en granes imension. Il existe eux granes familles e méthoes inexation multiimensionnelles : les méthoes inexation conventionnelles et les méthoes inexation basées sur l approche approximation ite aussi filtrage. Le paragraphe suivant présente les principales méthoes e ces eux familles. Méthoes inexation conventionnelles Les techniques conventionnelles inexation multiimensionnelles reposent sur le principe e regrouper es vecteurs e la base en paquets, puis e les englober ans es formes géométriques simples à manipuler. L iée est e réuire le parcours lors e la recherche à un sous ensemble e paquets en sélectionnant les plus pertinents et e n accéer qu un un nombre réuit e vecteurs. Les premiers travaux e recherche sur les algorithmes inexation multiméia ans un espace à plusieurs imensions ont été réalisés entre 1979 et Une première classification es méthoes inexation multiimensionnelles a été réalisée par Gaee [Gae 98] En effet, Gaee a classifié ces méthoes selon les types e onnées qu elles supportent. On istingue eux familles e méthoes : o Méthoes accès par point (Point Acces Methos- PAM) où les onnées sont représentées par es points (vecteurs). o Méthoes accès spatiales (Spatial Acces Methos - SAM) où les onnées sont représentées par es objets spatiaux complexes (segment, roite, polygones, etc.). Une euxième classification es méthoes inexation conventionnelles a été établie par la suite se basant sur la méthoe e partitionnement et l organisation es onnées ans l espace e vecteurs multiimensionnel. En vertu un tel critère, eux granes familles e méthoes peuvent être consiérées : o Méthoes basées sur le partitionnement e onnées qui regroupent les onnées en fonction e leur proximité ans l espace. Elles sont toutes érivées e la méthoe R-Tree [Gut 84] où chaque groupe e vecteurs est englobé ans une forme géométrique particulière (hyper-sphère, hyper-rectangle, etc.). Le tout est structuré ans un arbre équilibré. o Méthoes e partitionnement e l espace. Ces méthoes sont toutes érivées e K-D-Tree [Ben 75, Bfe 79] et Qua-Tree [Sam 84], elles écoupent l espace multiimensionnel en régions isjointes et ensuite, stockent les onnées selon ce écoupage. La majorité es techniques inexation basées sur le partitionnement e l espace e onnées sont es méthoes accès par point PAMs. Elles sont fréquemment appliquées sur un nuage e points ans un espace e vecteurs multiimensionnels.

41 Chapitre : Inexation multiimensionnelle Nous présentons ans la suite les principales caractéristiques et limites e ces eux familles e méthoes, en se focalisant sur les techniques inexation les plus connues ans la littérature. Un état e l art exhaustif sur les méthoes inexation conventionnelles peut être trouvé ans [Gae 98] et [Ber 04]..1 Méthoes e partitionnement e onnées L inexation multiimensionnelle basée sur le partitionnement e onnées tient compte e la istribution es vecteurs ans l espace multiimensionnel. Ces méthoes sont toutes érivées u R-Tree [Gut 84] ou les onnées sont groupées ans es formes géométriques simples (hyperrectangles, hyper-sphères, etc. selon leur proximité ans l espace. Ces formes géométriques issues u partitionnement e onnées sont organisées sous forme un arbre ans lequel les vecteurs sont stockés ans les feuilles et les formes géométriques sont stockées ans les nœus interne e l arbre. Dans ce paragraphe, nous étaillerons quelques méthoes les plus connues ans la littérature.1.1 Famille u R-Tree Les arbres e la famille R-Tree [Gut 84] inexent un espace multiimensionnel e points par un écoupage hiérarchique équilibré en hyper-rectangles. Le R-Tree [Gut 84] est l extension irecte u B-Tree [Bay 71] aux espaces multiimensionnels. Le R-Tree, est un arbre équilibré ans lequel chaque nœu est associé à un rectangle minimum englobant (REM), ce ernier est le REM e tous les rectangles e ses fils. Les feuilles e l arbre contiennent une liste entrées e type (REM, oi), où REM est le rectangle minimum englobant e l objet ientifié par son oi. La taille es nœus et es feuilles est limitée et fixée a priori. Elle correspon à la taille une page isque. La figure.1 illustre un exemple simplifié ans lequel nous avons représenté les onnées par es points rons et les régions par es rectangles. 1 C C 6 C 1 C 3 C 7 C 1 C C 3 C 4 C 5 C 6 C 7 C 8 C 6 V 1 V Fig..1 : Structure u R-Tree C 8 C 7 Le R*-Tree [Bec 90] est une variante u R-Tree. Pour améliorer les performances u R-Tree, Beckmann et al. Proposent la réinsertion e onnées stockées ans R-Tree. Au lieu e écouper un nœu surchargé, les entrées supplémentaires sont supprimés et réinsérer ans l arbre au même niveau. Dans plusieurs cas, ceci permet éviter le fractionnement envisagé, et, par conséquent augmente le taux exploitation e l espace mémoire alloué. L insertion un nouveau vecteur ans l arbre R*-Tree se base sur eux critère : minimiser les volumes es REMs lors une insertion ans un nœu et minimiser le taux e chevauchement lors e l insertion ans une feuille. Le partitionnent es REMs se base sur un critère qui pren en compte la minimisation u taux e chevauchement ainsi que le périmètre es hyper rectangle.

42 Chapitre : Inexation multiimensionnelle En Résumé, la famille es techniques inexation multiimensionnelle érivées u R-Tree possèe les propriétés suivantes : les cellules sont es hyper-rectangles englobant minimaux (REMs) ; elles sont organisées en hiérarchie où un niveau supérieur englobe les REMs u niveau inférieur ; les REMs permettent optimiser les règles e filtrage par l utilisation une istance précise les formes englobantes se recouvrent, ce qui iminue l efficacité es procéures e recherche; ce problème s amplifie lorsque la imension es onnées croît. les REMs se représentent par eux points multiimensionnels, ce qui pose es problèmes sur la quantité éléments que l on peut stocker lorsque que la imension augmente, ce qui peut entraîner la construction arbres e grane hauteur ; L algorithme e construction u R-Tree par insertions successives est non éterministe : le même ensemble e onnées ne sera pas représenté par le même arbre selon l orre insertion ans l arbre..1. M-Tree M-Tree [Cia 97] est une structure arborescente basée sur le partitionnement e onnées. Les vecteurs e onnées sont groupées une manière hiérarchique à partir e leur proximité ans l espace e onnées et en se basant sur une istance métrique. C est l une es premières méthoes inexation qui vise à réuire, en plus u nombre entrée/sorties, le coût CPU es calculs e istances. En se basant sur es istances recalculées ainsi que l inégalité triangulaire, cette technique évite certains calculs e istances inutiles lors e la recherche en éliminant es sous arbres non pertinentes à la requête. Dans un M-Tree, chaque nœu e l arbre est composé un objet e la base appelé objet e reirection et un rayon appelé rayon e couverture. M-Tree est construit par insertions successives es objets (vecteurs e la base). Le critère u choix u chemin insertion vise à minimiser les rayons e couverture es objets e reirection. Le partitionnement es nœus saturés permet e sélectionner eux objets u nœu puis e répartir les objets restant en minimisant le volume e eux régions obtenues ainsi que leurs taux e chevauchement. Un schéma représentatif e la structure u M-Tree est onné par la figure.. La sélection e eux objets e reirection peut être effectué une manière exhaustive, aléatoire ou en consiérant uniquement un échantillon objets en se basant sur les rayons e couverture. M-Tree souffre u problème u chevauchement qui permet élargir le nombre e chemins à parcourir lors une recherche, le chevauchement augmente également le nombre e calculs e istance pour réponre à une requête e l utilisateur ce qui iminue fortement la performance e la méthoe. L arbre Slim [Tra 00]est une méthoe qui a été proposée pour améliorer le M-Tree en réuisant le chevauchement entre les REMs, elle est présenté ans le paragraphe suivant. Rout(pk) r(pj) pj pi Rout(pj) ptr(t(pj)) grn(pj) grn(pk) Fig... Structure géométrique u M-Tree

43 Chapitre : Inexation multiimensionnelle.1.3 Slim-Tree L arbre Slim [Tra 00] est un arbre ynamique et équilibré qui regroupe les onnées ans es pages isques e taille fixe où chaque page correspon à un nœu e l arbre, et les objets (vecteurs) sont stockés ans les feuilles e l arbre. Il se base sur une technique simple pour quantifier le egré e chevauchement entre les nœus e l arbre. Il est bien connu que le egré e chevauchement touche irectement la performance es inex multiimensionnels, e ce fait l arbre Slim est l une es premières méthoes qui a été spécialement conçue pour réuire e taux e chevauchement. Cette technique organise les objets ans une structure hiérarchique à travers un représentant es onnées qui est le centre e la plus petite région qui couvre les objets ans un sous arbre. Tout comme la méthoe M-Tree, la istance u représentant et l inégalité triangulaire sont utilisées pour éliminer e la recherche les sous arbres non pertinents. La construction e la structure inex e l arbre Slim se fait par insertions successives es ifférents vecteurs e la base e onnées. A partir u nœu racine, l algorithme insertion cherche le nœu e l arbre corresponant à une région e l espace qui peut contenir le vecteur à insérer. Si aucun nœu n est trouvé, le nœu ont le centre est plus proche u vecteur est choisie. Si l algorithme insertion trouve plus qu un nœu qui peuvent contenir le vecteur, l algorithme insertion choisit le nœu soit une manière aléatoire, soit il choisit le nœu qui a une istance minimale entre le vecteur et le centre u nœu, ou bien le nœu qui possèe le minimum e vecteurs. Notons que le chevauchement est un es problèmes majeurs ont souffrent la majorité es techniques inexation, et qu il est généralement ifficile e le quantifier en raison e l impossibilité e calculer le volume e l intersection es régions. Pour résoure ce problème, l arbre Slim estime le taux e chevauchement par le nombre relatif es objets couverts par eux (ou plus) régions et puis applique un algorithme appelé "Slim-own" pour iminuer le taux e chevauchement entre les régions. Cet algorithme se compose e trois étapes. Dans la première étape, l algorithme calcule le vecteur p1 e plus loin e son vecteur représentatif p 0 (centre u nœu), pour chaque nœu. Dans la euxième, l algorithme ientifie les nœus qui couvrent le vecteur p 1, le éplace vers le nœu le plus proche et corrige le rayon u nœu résultant. La figure.3 illustre le fonctionnement e l algorithme "Slim-own" p 1 p 1 p p 0 p p 0 p 3 p 4 p 3 p 4 Avant la correction Après la correction Fig..3 Fonctionnement e l algorithme "Slim-own" Notons que l algorithme "Slim-Down" réuit bien le taux e chevauchement en comparaisons avec M-Tree, par contre celui-ci prouit es nœus triviaux contenant peu e vecteurs ou es nœus vies ce qui réuit fortement les performances e l inex.

44 Chapitre : Inexation multiimensionnelle.1.4 PM-Tree PM-Tree (Pivot Metric Tree) [Sko 04] est une méthoe inexation multiimensionnelle qui combine l approche u pivot [Cha 01, Mic 94] et la méthoe M-Tree ans l objectif e réuire le volume e la région élimitant les vecteurs e onnées. Une telle réuction permet augmenter le taux e rejets es sous arbres non pertinents et par la suite augmente l efficacité e l inex. La structure inex u PM-Tree est construite e la même manière que M-Tree, par contre elle introuit es éléments e la base e onnées appelés Pivot pour ientifier les plus petites régions contenant les vecteurs. Etant onné un ensemble e pivots ( Piv 1, Piv,..., PivN ) S, avec S est l ensemble e N vecteurs e la base, l ensemble S est parcouru pour calculer un tableau e N ' entrées. Le tableau e N ' entrées contient les istances minimales HR[i]. min et maximales qui élimitent chaque pivot (voir figure.4) et son objet corresponant. Pour chaque objet est éfinie une région appelée "hyper-ring" ( MBR ans la figure.4) telle que son intersection avec l hyperpère où se trouvent les onnées constitue la plus petite région élimitant un sous ensemble e vecteurs. Lors e la recherche une requête Q, la istance ist( Q, Piv j ) est calculée pour chaque pivot, l algorithme e la recherche élimine les objets Oi qui vérifient ( Oi, Pivt ) ( Q, Pivt ) RQ telle que RQ est l intervalle e la requête. Les objets non éliminés sont ensuite irectement comparés avec la requête. HR [i]. max HR[i].min MBR Piv i Fig..4 La structure géométrique e la méthoe u pivot métrique PM. Notons que la ifférence entre PM-Tree et M-Tree résie ont le fait que PM-Tree utilise es régions "sphère-ring" au lieu es hyper sphères pour élimiter les zones qui contiennent les sous groupement objets stocké ans les feuilles e l arbre, ceci réuit une manière consiérable le volume es régions et augmente ainsi les performances e l inex..1.5 MH-Tree Récemment, MH-Tree est un inex proposé par Guoren et al. [Guo 07] foné sur le partitionnement es onnées par es hyperplans. L arbre MH est ynamique et équilibré, il est conçu pour supporter les onnées ynamiques et ne nécessite pas e réorganisations périoiques e la structure, il se base sur l utilisation un hyperplan e partitionnement au lieu une imension clé pour le partitionnement es onnées ainsi que le filtrage e ces erniers. Notons que l arbre MH convient uniquement aux espaces Eucliiens en raison es caractéristiques e l hyperplan utilisé pour le partitionnement. L iée utiliser un hyperplan e partitionnement pour iviser les onnées et non pas une seule imension vient u faite que ans la plupart es applications, il existe plusieurs imensions es onnées qui peuvent contenir une grane quantité information. Pour cela, il convient onc e garer les imensions qui contiennent es

45 Chapitre : Inexation multiimensionnelle valeurs maximales e la variance pour construire un hyperplan e partitionnent en utilisant ces imensions. L arbre MH se base sur les étapes suivantes pour éterminer l hyperplan e partitionnent es onnées : Premièrement l arbre MH sélectionne eux points e références en se basant sur la méthoe m-rad- [Cia 97] pour éterminer le centre es eux sous espaces, ensuite calcule la valeur absolue e la ifférence entre les eux points et finalement choisit les imensions qui ont la plus grane valeur absolue comme es imensions clés. Le filtrage es régions lors e la recherche un vecteur requête s appuie sur les istances entre un vecteur et l hyperplan une part, et autre part, sur l utilisation e l inégalité triangulaire comme ans la méthoe M-Tree. (a) (b) Fig..5 le partitionnement e onnées selon (a) M-Tree (b) MH-Tree La figure.5 montre un exemple e partitionnement e onnées selon la méthoe (a) M-Tree et (b) MH-Tree. M-Tree subivise l espace e onnées en eux sous espaces en s appuyant sur les istances entre les vecteurs. L arbre MH par contre utilise eux niveaux e partitionnement ans le premier niveau les onnées sont partitionnées selon la méthoe m-rad- en eux sous espaces et ans le euxième niveau les eux sous espaces sont partitionnées en eux sous nœus suivant les imensions clés choisies. L arbre MH utilise un hyperplan e partitionnent au lieu une imension clé, l hyperplan peut être ifférent es eux sous espaces e onnées et sa irection peut être moifiée selon la istribution e onnées ans l espace consiéré. La stratégie u partitionnement étermine un hyperplan e partitionnement en fixant un certains nombre e imensions ainsi que leurs coefficients corresponant en s appuyant sur la istribution es onnées..1.6 Synthèse Les méthoes conventionnelles inexation multiimensionnelles basées sur le partitionnement e onnées se basent sur l utilisation es formes géométriques englobantes qui permettent e affiner le filtrage es régions pouvant contenir l ensemble es résultats. Malheureusement ces méthoes souffrent es problèmes e la maléiction e la imension, leurs performances se égraent ès que la imension augmente. Le principal inconvénient e ces méthoes et le chevauchement entre les formes géométriques englobant les vecteurs. En effet, le chevauchement ren les règles e filtrages incapables éliminer les formes géométriques non pertinentes. Par conséquent, un gran nombre e régions (rectangles, sphères, etc.) est visité au cours e la recherche entraînant ainsi une augmentation u temps e réponse. Pour cela le principal objectif e la plupart e es méthoes basées sur le partitionnent est e réuire autant que possible le taux e chevauchement entre les formes géométriques englobantes. Ci-essous

46 Chapitre : Inexation multiimensionnelle le tableau.1 récapitule les principaux avantages et les inconvénients es ifférentes méthoes présentées précéemment. Méthoe Avantages Inconvénients R-Tree *Formes englobantes permettant affiner le e filtrage es caniats *Chevauchement entre les formes géométriques * égraation es performances au passage à l échelle & grane imension R*-Tree *Formes englobantes permettant affiner le e filtrage es caniats * Réuction u taux e chevauchement par rapport à R-Tree M-Tree * *Formes englobantes permettant affiner le e filtrage es caniats *Réuction u temps e calcul par le stockage e le istance ans les nœus. *Réuction u cout CPU par l utilisation e l inégalité triangulaire Slim-Tree *Formes englobantes permettant affiner le e filtrage es caniats *Réuction u taux e chevauchement par rapport à M-Tree * Bonnes performances par rapport à M-Tree PM-Tree *Formes englobantes permettant affiner le e filtrage es caniats *Réuction u volume es régions élimitant les onnées=> bonnes performances par rapport à M-Tree MH-Tree *Formes englobantes permettant affiner le e filtrage es caniats *Méthoe e partitionnement tient compte e la istribution es onnées *Aapté aux onnées fortement groupées *Supporte les mises à jour (structure ynamique) *Chevauchement entre les formes géométriques *Dégraation es performances au passage à l échelle & grane imension *Chevauchement entre les formes géométriques *Dégraation es performances au passage à l échelle & grane imension *Méthoe e partitionnement non aapté aux onnées fortement groupées *Possibilité e prouire es nœus triviaux lors u partitionnement es onnées * Dégraation es performances au passage à l échelle &grane imension *Possibilité u chevauchement. * Dégraation e performance au passage à l échelle & grane imension *Exploitée uniquement ans les espaces Eucliiens * Non aaptée aux onnées uniformes *Convient uniquement à l espace Eucliien *Dégraation es performances au passage à l échelle & grane imension Tableau.1 Récapitulatif es avantages et inconvénients es ifférentes méthoes citées précéemment

47 Chapitre : Inexation multiimensionnelle. Méthoes e partitionnement e l espace Contrairement aux méthoes inexation basées sur le partitionnement e onnées ont le principal inconvénient est le chevauchement entre les formes géométriques choisies pour le groupement es onnées, les méthoes e partitionnent e l espace partitionnent l espace e onnées en es formes géométriques (hyper-sphère, hyper-rectangle, etc.) isjointes. Plusieurs techniques ont été proposées. Nous citons par exemple : K-D-B-Tree [Rob 81], Gri-File [Nhs 84], LSD-tree [Hsw 89]. D autres techniques plus récentes ont été proposées comme Pyramie-Tree [Bbk 98], iminmax [Ooa 00], P + -Tree [Zot 04], ViTri [Soz 05], Kpyr [Thi 05]. Ces méthoes sont présentées ans le sous paragraphe suivant...1 Pyramie La technique e la pyramie [Bbk 98] est l une es premières méthoes proposée ne subissant pas les problèmes e la maléiction e la imension, elle ivise l espace en pyramies, puis affecte aux onnées un numéro e pyramie et sa hauteur jusqu au sommet e la pyramie. Chaque pyramie possèe une base ayant une surface e 1 imensions, elle est écoupée en tranches parallèlement à sa base. Les tranches près u sommet sont plus petites que celles qui sont proches e la base. Ce écoupage e l espace a la propriété e créer un nombre e cases linéairement croissant avec la imension. D un autre côté, les vecteurs multiimensionnels selon la méthoe e la pyramie sont représentés par une clé composée u numéro e la pyramie et sa hauteur jusqu au sommet, ces clés sont ensuite inexées par un arbre B + -Tree [Bay 7]. Ainsi, les pyramies formant un hyper cube, issues u écoupage e l espace e onnées sont représentés avec une même structure. La technique u pyramie transforme un point multiimensionnel en une clé à une seule imension. La figure.6 représente un exemple e numérotation e quartes pyramies Py 1, Py, Py 3, et Py4 ans eux imension 1et. Les performances e la technique e la Pyramie se égraent lentement lorsque la imension es onnées augmente. Cepenant, elles épenent fortement e la istribution es onnées et e la position e la requête ans l espace (requête intervalle : rang query). En effet, lorsque la istribution es onnées n est pas uniforme, le choix u sommet es pyramies n est pas significatif, ce qui étériore la qualité inexation et la rapiité e la recherche. De même, lorsqu une requête est proche e la base une pyramie elle peut générer es accès inutiles à un ensemble e onnées n ayant pas forcément e similarité avec la requête. Ceci risque affecter consiérablement les performances e la recherche. D un autre côté, la performance e la pyramie épen e la istribution es onnées. En effet, si les onnées sont regroupées ans un coin e l espace, toutes les requêtes evraient être ans le même coin que les onnées puisque la répartition es requêtes souvent suit celles es onnées, c est pour cette raison que la méthoe e la pyramie est mois performante qu une séquentielle pour les onnées fortement groupées. La technique e la pyramie n est pas efficace ans le cas où les requêtes ont une forme non hyper cubes comme ans le cas e la figure.7. D après la figure si le rectangle e la requête est situé à la position p 1, le temps u parcours lors e la recherche peut être acceptable. Par contre si le rectangle e la requête est situé à la position p, le cout e la recherche la région accéée est plus élevé que celui u rectangle e la requête. Ceci ren également la technique e la pyramie inefficace.

48 Chapitre : Inexation multiimensionnelle 1 1 Py 3 Py 0 Py p Py 1 p 1 p 5 p 4 p 3 (a) (b) Fig..6 La corresponance entre les régions (b) et les pyramies (a) en eux imensions selon la technique e la pyramie. Le rectangle e la requête p 1 p.. + La région accéée Fig..7 Exemple e requête e forme non-hyper cube.. IMinMax Tout comme la technique Pyramie-Tree, iminmax [Ooa 00] écompose l espace multiimensionnel en pyramies. La ifférence entre les eux méthoes résie ans la stratégie avec laquelle les onnées sont représentées. En effet, chaque vecteur multiimensionnel ans iminmax est représenté par une clé composée e sa cooronnée la plus proche e la surface relatif à la imension 1 et sa magnitue. Cette méthoe utilise une seule transformation pour projeter les vecteurs multiimensionnels ans un espace à une imension (clé es vecteurs). Soient x min et xmax respectivement la valeur minimale et maximale un vecteur p suivant la imension et min et max sont respectivement les imensions relatifs aux cooronnées xmin et x max. Le vecteur p est projeté sur la imension 0 suivant la transformation ci-essus: min + xmin si xmin + θ < 1 xmax 0 = max + xmax sin on (.1) En moifiant la valeur u paramètreθ, on obtient ifférentes structures e iminmax. Par exemple, pour θ 1, les onnées sont projetées sur une imension avec la valeur minimale, alors que pour une valeur e θ supérieur à 1, les onnées sont projetées sur une imension avec la valeur maximale. Un exemple illustratif e l influence u paramètre θ sur la création e la structure inex est illustré ans la figure.8. Les clés es vecteurs multiimensionnels calculées à travers l équation (.1) et ils sont ensuite inexées à travers l arbre B+. Les performances e iminmax et Pyramie-Tree sont ientiques pour es onnées uniformes et pourθ = 0. Pour une istribution non uniforme es onnées, les performances e iminmax

49 Chapitre : Inexation multiimensionnelle épenent largement u choix e la valeur e θ, le choix e cette valeur n est pas évient et il peut être aaptés selon la istribution es onnées. 1 y θ = 0 1 y θ = y θ = x 1 x 1 (a) (b) (c) x Fig..8 Résultat u partitionnement un espace à eux imensions selon la méthoe iminmax où (a) 0 0. θ = (b) θ = 0. 5 (c) θ = 5..3 P + -Tree P + -Tree [Zot 04] est une amélioration e la technique Pyramiale. Cette approche associe une méthoe e ivision e l espace basée sur Bissecting K-means [Sbb 0] et la technique e la Pyramie. En effet, P + -Tree ivise l espace en hyper rectangles, puis applique la technique e la Pyramie à chacun e ces sous espaces. Chaque sommet e la pyramie représente le centre un groupement e onnées. Dans le cas où les onnées se situent autour u sommet, et malgré l existence e certaines requêtes au bor e la pyramie prouisant bien éviemment lors u processus e la recherche un accès à une large zone. Les onnées parcourues ne sont pas nombreux u fait que la plupart entre eux se situent autours u sommet e la pyramie. De plus, la région parcourue est réuite par le processus e partitionnement, c est ainsi que la méthoe P + -Tree réuit bien l inefficacité e la pyramie. Notons que la construction u P + - Tree est réalisée à travers une euxième structure appelée "Space-Tree", cet un arbre ont les feuilles stockent les informations relatives à la transformation e l espace e onnées, cet arbre est construit au cours u partitionnement e l espace e onnées. Un exemple e partitionnent e l espace e onnées ainsi que la construction e la structure "Space-Tree" corresponant est illustré ans la figure.9. y x Feuille e l arbre (a) (b) Fig..9. Exemple e partitionnement e l espace e onnées (a) et (b)e construction e la structure space-tree Les performances e cette méthoe épenant essentiellement e la istribution es onnées et e la méthoe e partitionnement e l espace. Ce ernier ne tient pas compte e la

50 Chapitre : Inexation multiimensionnelle istribution es onnées, ceci réuit une manière consiérable la performance e la méthoe P + -Tree..4 ViTri (Vieo Triplet) Shen et al. [Soz 05] ont proposé une nouvelle méthoe inexation viéo ViTri sous forme arbre B+. Une séquence viéo est tout abor ivisée en un certain nombre e groupes contenant es "frames" similaires. Chaque groupement est ensuite moélisé par une hypersphère ans un espace à imensions où représente également la imension u vecteur multiimensionnel relatif à chaque "frame". Chaque hyper-sphère est représentée par le triplet : (position, rayon, ensité) qui représentent respectivement, la position u centre u groupement, son rayon et le nombre e "frames" ans le groupement. Le rayon u groupement (où l hypersphère) est calculé par la moyenne es écarts types entre les ifférent "frames" et le centre u groupement. La similarité entre eux groupements est évaluée par l estimation u nombre e "frames" similaires entre les eux groupes, ceci est calculé par l intersection entre les eux hyper-sphères multipliées par la plus petite ensité. Ainsi, l information locale au niveau e chaque groupement est ientifiée une manière efficace. La recherche exhaustive au niveau e la structure e ViTri pour un gran nombre e onnées est très couteuse. Pour cela, Shen et al. proposent e transformer les onnées multiimensionnelles en un espace uniimensionnel, et puis appliquer une analyse en composantes principale (ACP) sur les onnées uniimensionnelles afin e ésigner par la suite un point e référence optimal (O ans la figure.10) pour lequel la istance originale entre les vecteurs multiimensionnels soit maximale après la transformation. Les onnées résultantes sont ensuite inexées par l arbre B+. Q O Fig..10. Représentation géométrique e l inexation selon la méthoe ViTri..5 Kpyr Thierry et al. [Thi 05] ont proposé une méthoe inexation qui associe une méthoe e classification à une technique inexation multiimensionnelle. Kpyr procèe abor par une étape e classification à travers l algorithme K-Means [Mac 96] ans laquelle les onnées sont partitionnées en un certain nombre e groupements homogènes. Ensuite, à chaque groupement est effectué un changement e base u sous espace corresponant en un hyper cube unitaire sur

51 Chapitre : Inexation multiimensionnelle lequel est appliqué la technique pyramiale. Les onnées e chaque groupement sont inexées par un arbre B +. La structure u Kpyr est une structure arborescente binaire appelée "arbre espace" telle que les nœus e l arbre stockent les frontières calculées à partir es istances inter groupes alors que les feuilles e l arbre sont représentées par les arbres B + es groupements. Un exemple e représentation géométrique e Kpyr est onné par la figure.11. La recherche s effectue en eux étapes. La première consiste à éterminer les régions concernées par la recherche en s appuyant sur les frontières es régions pour en éuire les groupements atteints par la requête. La secone correspon à la recherche une requête à l intérieur e la pyramie e chacun e ces groupements. A B C D A C B D Fig..11. La structure inex u Kpyr[Thi 05] Les performances e Kpyr sont affectées par le volume es onnées traitées lors e la recherche. Le fait accéer à un gran nombre e vecteurs non pertinents à une requête onnée égrae consiérablement le temps e la recherche. En effet, l inexation par la technique e la pyramie ne tient pas compte u nombre important e vecteurs inutiles explorés au cours e la recherche, ce nombre augmente rapiement ans les espaces e très granes imensions. Plus la imension augmente, plus les zones proches e la base e la pyramie sont volumineuses. Une requête appartenant à cette zone entrainera le parcours un nombre important e vecteurs non pertinents à la requête recherchée. Pour contourner ce problème Tierry et al. proposent le KpyrRec [Thi 06] une nouvelle méthoe inexation multiimensionnelle qui procèent e la même manière que Kpyr. L iée principale e cette méthoe est effectuer un partitionnement efficace e l espace e onnées pour réuire le nombre e onnées accéées lors une recherche. KpyrRec réalise un écoupage e l espace e onnées équilibré en volume e onnées en faisant une récurrence e la technique e la pyramie sur l ensemble es onnées appartenant à la même tranche, où chaque récurrence réuit le nombre e imension e 1. Un seuil corresponant au nombre e onnées maximum par tranche est fixé pour arrêter la récurrence. L inex récurent résultant inuit un surcroit négligeable e mémoire par rapport au gain important en temps e réponse, cette technique garantit une réuction u temps e réponse e 0% en moyenne. Ces performances ne sont affectées ni par le volume e onnées, ni par leur istribution. Elles ne sont affectées que par les granes imensions.

52 Chapitre : Inexation multiimensionnelle..6 Synthèse Dans le tableau. nous récapitulons les avantages et les inconvénients es ifférentes méthoes inexation basées sur le partitionnement e l espace e onnées présentées précéemment. Contrairement aux méthoes inexation conventionnelles basées sur le partitionnement e onnées, ont le principal inconvénient est le recouvrement es formes géométriques englobantes, ces méthoes partitionnent l espace e onnées en es formes géométriques isjointes sans aucun chevauchement. Le partitionnement s effectue sans prenre en consiération la istribution es onnées, qui permet e générer es formes géométriques régulières simple à gérer. La plupart e ces méthoes ne supportent pas les onnées réelles e istribution non uniformes ou fortement groupées. Tout comme les méthoes conventionnelles basées sur le partitionnement e onnées, ces méthoes souffrent es problèmes e la maléiction e la imension, leurs performances se égraent notablement lorsque la imension augmente. Méthoe Avantages Inconvénients Pyramie *Peu affecté par l augmentation e * Non aaptée pour les onnées la imension es onnées fortement groupées (moins *Performante pour les onnées performante qu une séquentielle pour uniformes les onnées fortement groupées) * Nombre e cellules créer est *Dégraation es performances au linéairement croisant en fonction passage à l échelle & grane e la imension imension iminmax * Peu affecté par l augmentation e la imension es onnées *Nombre e cellules créer est linéairement croisant en fonction e la imension *Aaptée aux onnées uniformes et fortement groupées P + -Tree * Performante au passage à l échelle et en grane imension par rapport à la Pyramie ViTri Kpyr *Aaptée aux onnées corrélés linéairement * Réuction e la imension es onnées * Aaptée aux onnées fortement groupées * classification es onnées-> meilleure ivision e l espace par rapport à la pyramie *réuction u temps e calcul par rapport à la pyramie * Inexation efficace par rapport à la pyramie (l espace à inexer par *Paramétrage ifficile pour les onnées fortement groupées *Dégraation es performances au passage à l échelle & grane imension *Algorithme e ivision e l espace e onnées peu performant *Dégraation es performances pour les onnées fortement groupées *Non aaptée aux onnées non linéairement corrélées * Non aaptée aux onnées uniformes * Problème accès inutile * Dégraation es performances au passage à l échelle & en grane imension

53 Chapitre : Inexation multiimensionnelle la pyramie est réuit) KpyrRec * Aaptée aux onnées fortement groupées * classification es onnées-> meilleure ivision e l espace par rapport à la pyramie * Performante au gran volume e onnées *Réuit le nombre e onnées à accéées lors e la recherche par rapport à Kpyr *Non aaptée aux onnées uniformes * Occupe un espace mémoire plus gran que celui e Kpyr *Dégraation es performances au passage à l échelle & en grane imension Tableau. Récapitulatif es avantages et inconvénients es ifférentes méthoes citées précéemment Dans le paragraphe suivant, nous rappelons les problèmes liés aux espaces e grane imension 3 Maléiction e la imension La maléiction e la imension fait référence aux problèmes ont souffrent la majorité es méthoes inexation multiimensionnelles en grane imension. Cette expression trouve ses origines ans les travaux e Bellman [Bel 61], elle inique que le nombre e vecteurs nécessaires pour estimer une fonction arbitraire avec un certain niveau e performance croit exponentiellement avec le nombre e imensions. Par exemple, optimiser une fonction à plusieurs variables par une méthoe exhaustive consiste à partitionner le omaine e éfinition e chacune es variables à intervalles réguliers. Chaque point intersection e ces intervalles et un optimums possible. Il s agit onc évaluer la fonction coût en chacun e ces points et e calculer la valeur optimale. Le nombre évaluation nécessaire, croît exponentiellement avec le nombre e variable. Dans le cas e la recherche par similarité en particulier, la recherche es plus proches voisins, cela signifie que le nombre e cellules (formes géométriques) qui oivent être examinés croît e façon exponentielle avec la imension. Par exemple, ans un cube unitaire e imension eux, si chaque imension est partitionnée en eux intervalle, cellules sont générées est parcourues lors e la recherche. En imension 10 ans les mêmes conitions 10 cellules sont examinées lors e la recherche. Plusieurs travaux, par exemple ceux e weber et al. [Web 98] ainsi que la thèse e Berrani [Ber 04], ont étuié les ifficultés rencontrés lors e l utilisation les onnées multiimensionnelles. Une synthèse es ifférents problèmes cités ans la littérature est présentée ans le paragraphe suivant. 3.1 Problèmes inexation et e recherche ans les espaces e grane imension Les problèmes qui se posent ans les espaces e granes imensions sont nombreux et il est généralement ifficile étenre ans ces espaces les techniques que l on a ans les espaces à eux ou à trois imensions. Un premier problème qui se pose lors e la manipulation es onnées e grane imension est le phénomène es vecteurs équiistants. En effet, Beyer et al. [Bey 99], remarquent que sous certaines conitions sur la istribution es onnées, les vecteurs ont tenance à evenir équiistants lorsque la imension augmente. Ce phénomène entraine

54 Chapitre : Inexation multiimensionnelle l inutilité es inex multiimensionnels pour la recherche par similarité et le manque e pertinence es résultats retournés. Un secon problème qui ren les techniques inexation fonées sur le partitionnement e l espace inefficaces est celui e la croissance exponentielle u nombre e cellules en fonction e la imension. Cela pose e sérieux problèmes pour les procéures e recherche. En effet, ans le cas où un vecteur requête se trouve suffisamment près une frontière entre cellules, le processus e recherche es plus proches voisins oit nécessairement examiner la ou les cellules voisines ce qui augmente par conséquent le temps e la recherche. Les techniques inexation basées sur le partitionnement e onnées regroupent les onnées en es formes géométriques particulières (rectangles, sphères, ). Toutefois les propriétés géométriques e ces formes ne sont plus maitrisables en grane imension. Par exemple, il est simple e montrer que la limite u volume une hyper-sphère lorsque le nombre e imensions ten vers l infini est nulle. Si les onnées ont une répartition homogène ans l espace, l observation précéente implique que la grane majorité es onnées se situent à l extérieur e la sphère. Ce phénomène que nous retrouverons ans les volumes e recouvrement es méthoes telle que la famille u R-Tree, SS-Tree, SR-Tree etc. est appelé phénomène e l espace vie [Sco 83], il complique le groupement es vecteurs en paquets car le nombre e vecteurs n est pas suffisamment élevé par rapport au nombre e imension. Ceci prouit par conséquent es formes géométriques volumineuse qui se chevauchent et avec peu e vecteurs iminuant ainsi la performance es inex en grane imension. D un autre côté, Weber et al. [Web 98], montrent que ans un espace e imension supérieure à 16, la recherche séquentielle est meilleure que la plupart es techniques inexation basées sur le partitionnement e onnées et e l espace. Dans le même orre iées, Weber constate que la complexité es approches basées sur le partitionnement et le groupement e onnées ten vers θ (N) où N, le nombre e vecteurs ans la base lorsque la imension augmente. Les auteurs ont montré également que pour toutes les méthoes e partitionnement et e groupement, il existe une imension telle que toutes les formes géométriques qui englobent les onnées sont examinés lors e la recherche. En conclusion, les techniques inexation restent aaptées à es vecteurs e petites imensions, or ans es applications réelles les onnées sont généralement représentées par un gran nombre e caractéristiques ce qui ren l utilisation e la plupart es inex multiimensionnelles ifficiles. Pour contourner les problématiques liées aux granes imensions es onnées manipulées, es techniques e réuction e la imension sont par conséquent nécessaires. Dans la suite nous présentons les principales techniques e la réuction e la imension qui existent ans la littérature, nous istinguons eux granes familles : les méthoes ites linéaires e la réuction e la imension et les méthoes non linéaires. 3. Techniques e réuction e la imension Les techniques e la réuction e la imension ont été éveloppés ans le omaine e la statistique et l analyse e onnées pour transformer les onnées un espace appelée espace entrée χ "input space" ans un nouvel espace e caractéristiques F "feature space" e imension réuite en garant le maximum information portée par les onnées ans leurs espace original. Mathématiquement, le problème que visent à résoure ces méthoes peut être formulé e la manière suivante : étant onné un vecteur e imension ' T, p = ( p1,... p ' ), il s agit e trouver une autre T ' représentation e imension réuite q = ( q 1,... ) avec <, qui exprime le plus fièlement q

55 Chapitre : Inexation multiimensionnelle possible l information contenue ans les onnées initiales. Notons que la imension correspon aux composantes es vecteurs multiimensionnels, ans ce manuscrit, la imension est parfois appelée composante es vecteurs, attribut en encore caractéristique. Les techniques e la réuction e la imension ont été présentées ans plusieurs travaux [Wu 00, Cha 01, Bha 06], comme étant une solution palliative aux problèmes e la maléiction e la imension. Ces travaux suggèrent e réuire la imension e l espace e onnées avec une méthoe e la réuction e la imension avant inexer les onnées avec une méthoe inexation multiimensionnelle. Dans la littérature, il existe plusieurs manières e classifier les méthoes e la réuction e la imension: 1) une classification basée sur la méthoe utilisée pour la réuction u nombre e caractéristique. On istingue eux granes familles : - Méthoes basées sur la sélection es composantes : l iée est e réuire le nombre e caractéristiques utilisée ans la classification tout en garant un taux e classification acceptable. L objectif e ces méthoes est éliminer les informations non iscriminantes tout en garant un ensemble information suffisant pour la iscrimination es classes. - Méthoes basées sur l extraction es caractéristiques : l iée e cette famille e méthoes est e transformer les onnées originales ans un espace e imension réuite e façon à générer un nouvel ensemble e onnées significatif. La transformation est basée sur certains critères, comme la maximisation e la variance ou la minimisation e l erreur, etc. ) une euxième classification es méthoes e la réuction e la imension est basée sur la méthoe utilisée pour générer une représentation es onnées e imension réuites. Nous istinguons eux granes familles - Les méthoes projectives : L objectif e ces méthoes est e trouver les projections e imension réuite qui permettent extraire es informations utile à partir es onnées originales, par une maximisation une fonction certaine fonction appelée fonction objective. La fonction objective est typiquement la variance e l erreur e reconstruction. - Méthoes basées sur la moélisation : Ces méthoes tentent e trouver les sous structures es onnées se trouvant ans es espaces complexes e grane imension 3) Une troisième classification est basée sur le type e la fonction e transformation. Nous utilisons cette classification pour représenter les méthoes e la réuction e la imension. Dans cette catégorie on trouve : -Les méthoes linéaires : Ces méthoes réuisent la imension es onnées originales on appliquant es transformations linéaires sur ces onnées. Ces méthoes sont plus efficaces si les onnées originales sont istribuées une manière uniforme ans l espace entrée. - Les méthoes non linéaires : lorsque les onnées sont corrèles une manière non linéaire, les méthoes linéaires e la réuction e la imension ne sont plus efficaces. Les méthoes non linéaires sont plus aaptées ans ce cas, leurs objectifs est e la transformation non linéaire qui permet e réuire la imension tout en garant un maximum information possible. Dans la section suivante, nous présentons les méthoes e la réuction e la imension les plus citées ans le omaine e l inexation multiimensionnelle et la recherche es k plus proches voisins. Nous classifions ces méthoes en eux granes catégories : les méthoes linéaires e la réuction e la imension et les méthoes non linéaires.

56 Chapitre : Inexation multiimensionnelle 3..1 Méthoes linéaires Ces méthoes permettent e transposer avec une transformation linéaire les onnées e l espace ' entrée e imension ans un nouvel espace e imension réuite. La transformation linéaire associe à chaque axe u nouvel espace un inice sur la quantité information portée par la composante associée. Elle permet e étecter toutes les corrélations linéaires entre les onnées. La réuction e la imension est effectuée par la projection es vecteurs originaux ans un sous espace vectoriel e imension plus réuite. La imension e l espace est réuite en éliminant les composantes qui portent peu information, elle est généralement fixée a posteriori. Toutes les techniques linéaires reposent sur le même principe. Elles se istinguent par la transformation linéaire utilisée ans la projection. Dans la suite, nous présentons eux méthoes principales pour la réuction linéaire e la imension: l analyse en composante principale (ACP), et le positionnement multiimensionnel (MDS) L ACP : l analyse en composantes principales L analyse en composantes principales (ACP) est la méthoe linéaire e la réuction e la imension la plus utilisée, elle trouve ses origines ans les travaux e Hotelling [Hot 33], Karhumen [Kar 47] et e Loève [Loe 48]. L ACP étermine es axes e projections orthogonaux, qui maximisent la variance e la projection ans l espace e caractéristiques, ce qui est équivalent à minimiser l erreur quaratique moyenne e reconstruction. La variance es onnées représente généralement la quantité information portée par chacun es axes : plus la variance es onnées selon un axe est grane, plus l information portée par celui-ci est importante. En fait, ceci consiste à effectuer une translation suivie une rotation u repère e l espace pour privilégier les axes e variance maximale par rapport à un ensemble e onnées. Les axes où la variance es onnées est faible sont éliminés pour atteinre une réuction e la imensionnalité avec une perte minimale e l information Formellement l ACP se calcule e la manière suivante : Etant onné un ensemble e N observations centrées p, i = 1,... N telle que : i pi N N R, p i i= 1 = 0. L ACP iagonalise la matrice e covariance Cov avec : 1 N t Cov = p j p j. N j=1 Ceci se ramène à résoure l équation : λ V = CovV. (.) N 1 N Où λ 0. Les λ i sont les valeurs propres et ν R /{ 0}. Donc Cov. ν = ( p j. ν ) p j. N j= 1 L équation (.) est équivalente à : λ( p j. ν ) = ( p j. Cov. ν ) pour tout j = 1,... N. (.3) Le calcul e L ACP se ramène onc à un calcul e valeurs propres et vecteurs propres e la matrice e covariance es observations entrée MDS : Positionnement multiimensionnel Dans e nombreux cas, on connaît les istances entre les points un ensemble e vecteurs (généralement on utilise une istance eucliienne), et on cherche à obtenir une représentation e faible imension e ces vecteurs. Le positionnement multiimensionnel MDS (Multiimensional Scaling) [Has 01] permet e construire cette représentation. En projetant

57 Chapitre : Inexation multiimensionnelle ans un espace métrique, un ensemble e points tout en conservant le plus exactement possible l orre es proximités es points. MDS (Multiimensional Scaling) permet e construire une configuration e N points ans espace χ e imension à partir es istances entre N objets (vecteurs par exemple). Dans ce contexte, on n observe plus les points irectement ans l espace origine mais plutôt les N ( N 1) / istances corresponant à ces points. MDS prouit un positionnent es objets ' ans un espace F avec une imension <, e façon à minimiser l erreur quaratique moyenne entre les istances fournies à l algorithme et celles es points générés. Les istances fournies à MDS ne oivent pas nécessairement être Eucliiennes et peuvent par conséquent représenter es similarités e tout genre entre es objets. Formellement MDS cherche une configuration e points q i = ( 1,... N) ans un espace e imension plus réuite qui conserverait les istances entre les points initiaux p i, autrement it, ' on cherche les qi R avec < tels que : ist ( q i, q j ) Δi, j avec Δ i, j = ist( pi, p j ). l l Ceci revient à optimiser un critère : J = ( Δ ist( q, q )) Définition 1 Une matrice e istance t a Δ = ( p p ) ( p p ) ij i j i j Δ = ] i= 1j= 1 La méthoe u MDS est basée sur le théorème suivant. ij i j l l [ Δij R est ite eucliienne si pour es points,( i 1,... l) p i =, on Théorème 1 1 Soit la matrice A = [ a ij ] avec aij = Δij, et la matrice M = ZAZ où Z est une matrice e 1 t t l centrage es onnées éfinie par Z = I l 1 l 1 l avec 1 l = (11...1) R. La matrice Δ = [ Δij ] est l ite eucliienne ssi la matrice M est semi-éfinie positive. t Dans ce cas, la matrice es prouits scalaires U = X c X c calculée avec les onnées centrées X c = ZX. Si les onnées sont centrées, les istances Δij peuvent s exprimer en fonction es t prouits scalaires U ij = pi p j et inversement. Connaissant uniquement les istances Δ ij, il est possible e trouver une configuration e points ans un espace Eucliien vérifiant ces istances en réalisant la écomposition spectrale e M. L algorithme MDS se présente e la manière suivante : o Contruire à partir e la matrice Δ, la matrice M = ZAZ avec : A = [ a ij ] et aij = 1/ Δij l l o Réaliser la écomposition spéctrale e M R T l l M = W W avec W = [ v 1... v l ] R et = iag( λ 1,... λ l ) ' La matrice M a au plus valeurs propres non nulles (en supposant que l > ). 1/ o D après le théorème, on a X c = ZX W. Pour obtenir une configuration e points ans un espace e imension réuite, il suffit e consiérer alors : 1 / Y = ' ' avec V = [ v 1,... v ], et = iag( λ 1,... λ ) t l Sachant que structure e la matricey est Y = y... ] R [ 1 y l 3.. Méthoes non linéaires Les algorithmes e la réuction e la imension peuvent être généralisés afin e consiérer les relations non linéaires entre es onnées. Ces méthoes reposent sur l iée e transformer les

58 Chapitre : Inexation multiimensionnelle onnées e grane imension ans un espace e imension réuite tout en préservant les proximités entre les vecteurs et leurs corresponants ans l espace projeté. Parmi les méthoes, les plus connues e la réuction non linéaire e la imension nous trouvons : l analyse en composante principale KPCA [Sch 98], la Locally Linear Embeing (LLE) [Row 00] et la méthoe Isomap [Ten 00]. Dans la suite, nous présentons les eux ernières méthoes, le KPCA sera présenté ans le chapitre Isomap Isomap [Ten 00] est une généralisation non linéaire e la méthoe MDS, cette technique e réuction e imension se base sur la connaissance une matrice e issimilarités entre les paires e vecteurs e onnées. Elle exploite le fait que pour es points proches, la istance eucliienne est une bonne approximation e la istance géoésique sur la l ensemble es onnées. Définition Une istance géoésique entre eux points est une courbe localement e longueur minimale. Une géoésique ésigne le chemin le plus cout, ou l un es plus court chemins (s il en existe plusieurs), entre eux points un espace pourvu une métrique. Les onnées 3D peuvent être vues comme un ensemble où chacune peut être consiérée localement appartenir à un espace Eucliien D. Un exemples une istance géoésique entre eux point p1 et p est illustré ans le figure.1 P P 1 Fig.1. Exemple estimation une istance géoésique entre eux point p 1 et p L algorithme Isomap construit un graphe reliant chaque point à ses k plus proches voisins. Les longueurs es géoésique sont alors estimées en cherchant la longueur u plus court chemin entre eux points ans le graphe. La méthoe e positionnement multiimensionnel (MDS) est appliquée aux istances obtenues afin obtenir un positionnement es points ans un espace e imension réuite. En résumé, Isomap consiste en trois étapes. o Dans la première étape, l algorithme étermine quels points sont voisins sur l ensemble e vecteurs S en se basant sur les istances is ( p i, p j ) entre les paires e points i, j ans l espace initiale χ afin e construire un graphe G approximant l ensemble S. o La secone étape consiste essentiellement à approximer les longueurs es géoésiques ist G ( pi, p j ) entre toutes les paires e points i, j e l ensemble S et e calculer le plus court chemin ist p, p ). G ( i j

59 Chapitre : Inexation multiimensionnelle o L étape finale applique MDS à la matrice e istances DG afin e fournir un positionnement es vecteur e imension respectant le plus possible les longueurs es géoésiques. Pour toutes les paires e points inice i, j la istance ist G ( pi, p j ) converge asymptotiquement vers la istance réelle entre ces points. La vitesse e convergence épen e la courbure e l ensemble es vecteurs et e leur ensité. Si la ensité es points n est pas uniforme ou si la courbure e la variété est extrêmement forte, la convergence asymptotique est toujours garantie, mais la taille e l échantillon nécessaire à l estimation acceptable es longueurs es géoésiques peut être arbitrairement grane, onc impossible à obtenir en pratique. De plus, Isomap est non itérative, e complexité polynomiale et assez couteux en temps e calcul LLE Le prolongement localement linéaire (locally linear embeing (LLE)) [Row 00], tente e résoure le même problème que Isomap par une approche alternative. Chaque point est caractérisé par sa reconstruction par ses plus proches plus voisins. L iée consiste à construire une projection vers un espace linéaire e faible imension en préservant autant que possible le voisinage. Chaque point p i est exprimé comme une combinaison linéaire e ses voisins, et l image e p i est construite ans l espace e faible imension en respectant cette combinaison linéaire. Les ifférentes étapes e l algorithme LLE sont : o Trouver un certain nombre es plus proches voisin e chaque point p i. o Trouver pour chaque point p i les pois w ij sur les voisins p j qui minimisent l erreur e quaratique globale : ( p i j w i, j p j ) avec la contrainte wi, j = 1 i. Cette contrainte assure l invariance par translation es points j et e ses voisins. T o Transformer la matrice e pois W en M = ( I W ) ( I W ) symétrique. Calculer k vecteurs propres v j e plus petite valeur propre (excluant la plus petite, qui est 0, ce qui onne les cooronnées réuites es onnées ( v 1i,..., v ki ). Notons que les vecteurs propres sont les cooronnées réuites q i pour chaque vecteur p i qui minimisent l erreur : qi wi, jq j sous la contrainte q ij = 1, (normalisation es coronnées) et qijq ik = 1 j = k. i j La figure qui suit résume les ifférentes étapes e cet algorithme. i i

60 Chapitre : Inexation multiimensionnelle (1) Sélection es voisins (3) Projection p i () Reconstruction avec es pois linéaires w q i ik w ij q j q k p i w ik w ij p j p k Fig..13.Principe e fonctionnement e l algorithme LLE 3..3 Synthèse Les méthoes e la réuction e la imension ont pour objectif e réuire la imension es onnées tout en préservant le maximum information. Ces méthoes sont utiles ans le omaine e l inexation multiimensionnelle pour contourner les problèmes e la maléiction e la imension exposés précéemment (paragraphe 3.1). Nous avons istingué eux granes familles : la famille es méthoes linéaires et la famille es méthoes non linéaires e la réuction e la imension. Les méthoes linéaires transforment les onnées linéairement ans un espace e imension réuite, elles consièrent les istances Eucliiennes entre les onnées. Si on suppose que les onnées supportent une imension plus faible que la imension es onnées originales, l ACP par exemple ne pourra trouver un système e cooronnées en imensions exact que si les épenances entre les onnées sont linéaires. Dans le cas contraire, c-à- si les épenances entre les onnées sont non linéaires, l ACP ne pourra pas créer une représentation en plus faible imension respectant les istances entre les onnées. Dans le même orre iées, si les istances fournis à MDS sont les istances Eucliiennes, cet algorithme ne pourra pas non plus générer un positionnement es vecteurs qui présentent es corrélations non linéaires entre les ifférents attributs. Généralement, les onnées observées ans la nature exhibant très souvent es caractéristiques hautement non linéaires. Pour cela, les méthoes linéaires e la réuction e la imension ont

61 Chapitre : Inexation multiimensionnelle été généralisées pour supporter les onnées réelles, c-à- ont les épenances sont non linéaires. L iée principale es méthoes non linéaires e la réuction e la imension est e trouver un nouvel espace e représentation e onnées e imension réuite qui permet e préserver le plus fièlement possible les istances entre les vecteurs. Contrairement aux méthoes linéaires e la réuction e la imension, le choix e la imension e l espace réuit oit être effectué a priori. Ceci, constitue le principal inconvénient e ces méthoes. Le choix e la imension optimale n est pas évient et la fiabilité e la projection en épen fortement. Des méthoes plus efficaces ont été proposé ans la littérature, pour réponre aux problèmes e la maléiction e la imension, elles sont présentées ans le paragraphe suivant. 4 Méthoes inexation multiimensionnelles basées sur l approche approximation Dans ce paragraphe, nous présentons les techniques basées sur l approche approximation ou filtrage. Contrairement aux techniques conventionnelles inexation multiimensionnelles, ces techniques ont pour pas mal occasions prouvé e bonnes performances en grane imension [Web 98][Ter 0]. L iée principale repose sur la compression es vecteurs e la base et la gestion e eux ensembles e onnées lors e la recherche: un premier ensemble contenant es représentations compressées es onnées et un euxième ensemble contenant les vecteurs réels e la base e onnées. Lors une interrogation, un premier parcours séquentiel u fichier approximations permet e sélectionner les approximations es onnées les plus pertinentes au vecteur requête au sens e la similarité. Cette étape n est pas couteuse puisqu elle est effectuée sur un ensemble e vecteurs e taille beaucoup plus réuite que l ensemble es vecteurs original, elle permet 'élire rapiement les approximations es vecteurs pouvant figurer parmi les plus proches voisins. Ensuite, les vecteurs corresponant aux approximations sélectionnées ans la première phase sont visités séquentiellement pour calculer les k ppv. Ainsi, le nombre opérations E/S est réuit et le coût e calcul CPU est petit par rapport à la recherche séquentielle qui, elle, analyse la totalité e la base. Dans l'approche approximation, nous istinguons eux granes familles e méthoes inexations: celles qui se basent sur es approximations locales et celles qui utilisent es approximations globales. Dans la suite, nous présentons les principales méthoes e chaque famille. 4.1 Approximation globale Comme toutes les méthoes inexation multiimensionnelles, les méthoes basées sur l approximation globale partitionnent l espace e onnées en es formes géométriques hyper rectangulaires chacune est coée par un certain nombre e bits. L approche approximation globale repose sur l iée appliquer la même stratégie u partitionnement sur toutes les onnées e la base. La istribution es onnées, par conséquent, n a aucune influence ni sur la stratégie e partitionnent ni sur le coage es formes géométriques issus u écoupage. De plus, ces méthoes n ont aucune structure particulière (arbre, graphe, etc.), les onnées et les approximations sont stockées ans es fichiers et l accès s effectue séquentiellement. Il existe à notre connaissance uniquement eux méthoes principales basées sur l'approximation globales : la méthoe VA-File et ses érivées, et la méthoe LPC-File. Ces méthoes sont étaillées ans les sous paragraphes qui suivent.

62 Chapitre : Inexation multiimensionnelle 4..1 La famille VA-File VA-File (Vector Approximation File) [Web 98] est une technique inexation qui améliore la recherche séquentielle, c est la première technique efficace pour la recherche es k ppv ans l espace e grane imension. Cette méthoe est composée e trois étapes, une étape e compression e vecteurs pour laquelle es onnées sont coées par une chaine compressée e bits, une étape e filtrage qui permet e sélectionner les vecteurs caniats et une étape accès au onnées réelles qui permet e calculer les vecteurs les plus proches u vecteur requête. -Etape e compression es vecteurs : bi Chaque imension i est partitionnée en intervalles chacun est coé sur b i bits. A chaque cellule est attribué un coe binaire e longueur b = b i et un numéro e 0 à b 1 selon chaque i= 1 imension. Les escripteurs e la base sont ainsi lus les uns après les autres, et l approximation e chaque vecteur est éterminée par le numéro e la case qui le contient. Le fichier approximations est ainsi composé e paires (ientifiant u vecteur, numéro e case). La figure.14 illustre un exemple e coage e vecteurs ans un espace e imension eux. b Le nombre e cellules ( ) prouites lors e la quantification e l espace e onnées est beaucoup plus gran que le nombre e vecteurs N. D où, la majorité es cellules sera vie (Seules les informations liées aux cases contenant au moins un escripteur sont stockées, évitant ainsi le problème avoir à gérer un très gran nombre e cases vies). De plus, la probabilité pour que eux vecteurs appartiennent à une même cellule, et par la suite partagent la même approximation, est très faible [Web 98] Espace e onnées à D Vecteurs e la BD Approximations Fig..14 Construction u VA-File -Etape e filtrage : Lors e la recherche es k ppv, le fichier approximations est parcouru entièrement. Les istances maximales et minimales par rapport au vecteur requête peuvent être facilement éterminées en se basant sur les cellules rectangulaires représentées par l approximation. Supposons que D min est la plus petite istance maximale trouvée jusqu à l instant. Si une approximation est rencontrée telle que sa istance minimale est supérieure à D min, alors l objet corresponant est éliminé puisqu au moins un meilleur caniat existe. De la même manière, on peut éfinir une étape e filtrage lorsque k ppv oivent être retrouvés. Un facteur critique e la performance est la sélectivité e cette étape e filtrage (% es vecteurs restants). Plus la quantité es approximations es vecteurs iminuent plus la performance augmente.

63 Chapitre : Inexation multiimensionnelle -Accès aux vecteurs : Après l étape e filtrage, un petit ensemble e points caniats reste. Ces caniats sont alors visités selon un orre croissant e leur istance minimale par rapport au point requête q, et la istance exacte à q est calculée. Cepenant, on ne parcoure pas tous les caniats. Plutôt, si une istance minimale rencontrée est supérieure à la plus poche istance jusqu à cette étape, alors l'algorithme s arrête. Un paramètre important e performance est le pourcentage es vecteurs visités (parmi les vecteurs restants) par rapport au nombre total es vecteurs e l espace e onnées. p min max q Fig..15 Distance minimale est maximale par rapport au vecteur requête Les performances u VA-File épenent essentiellement e eux paramètres, la taille u fichier es approximations et u taux e filtrage. Si le fichier es approximations est très gran (épasse la taille e la mémoire), les performances e la méthoe VA-File se égraent et eviennent plus mauvaise que la recherche séquentielle [Ams 01]. Le taux e filtrage quant à lui épen u nombre e bits utilisés pour coer un vecteur. Le choix e ce ernier est critique : un gran nombre u bit e coage entraine une taille très grane u fichier approximation par contre prouit une approximation fine et précise. Plusieurs méthoes ont été proposées ans la littérature pour améliorer les performances u VA- File. Par exemple Cha et al. [Cha 0] remarquent que les performances u VA-File ne peuvent être améliorées que par une augmentation u nombre e bits utilisées lors u coage. Mais une telle augmentation peut entrainer un surcroit e la taille u fichier es approximations. Pour cela, Cha et al. [Cha 0] proposent le LPC-File où les informations coées sont enrichies par l introuction es cooronnées polaires es vecteurs lors u calcul es approximations, cette techniques sera étaillée ans le paragraphe 4... Rappelons que la méthoe VA-File est basée sur le partitionnement e l espace e onnées. Son efficacité iminue au passage à l échelle, car le nombre e cellules crées urant le partitionnent croit exponentiellement en fonction e la imension [Web 98], ceci ren cette méthoe moins performante qu une recherche séquentielle exhaustive en grane imension. Pour résoure ce problème Chen et al. [Cva 0] proposent C-VA-File (Clustere Compact VA) qui permet éliminer les imensions contenant les informations les moins importantes pour éviter e générer un gran fichier approximations pour es onnées e grane imension et ainsi gagner au niveau temps e réponse urant la recherche. L iée e base est e réuire les imensions un vecteur ont les cooronnées sont inférieures à une valeur onnée et composer un nouveau système axe pour ce vecteur avec le reste es imensions. Par ailleurs, VA-file est particulièrement aaptée aux onnées uniformément istribuées ans l espace. Or les onnées réelles sont souvent groupées en classes et leurs imensions sont corrélées, e ce fait, Hakan et al. [Hak 00] proposent e transformer l espace e onnés en utilisant la transformation e KLT (Karhunen-Loeve Transform) afin e réuire la corrélation es onnées pour les ifférentes imensions. Un algorithme allocation non uniforme e bits et

64 Chapitre : Inexation multiimensionnelle un scalaire e quantification optimal sont appliqués inépenamment à chaque imension pour construire le fichier approximation. OVA-File [Lu 06] est une autre méthoe qui améliore consiérablement les performances u VA-File au passage à l échelle et en grane imension. En effet, un es inconvénients majeurs u VA-File est le parcours séquentiel exhaustif e tout le fichier approximation lors e la recherche, ce parcours est généralement très coûteux si le fichier est très gran et ne peut plus tenir en mémoire. Pour réuire l ensemble es approximations à parcourir urant la recherche Lu et al. [Lu 06] ont proposé le OVA-File (Orre Vector Approximation File), une structure inex basée sur le groupement es vecteurs en fonction e leurs istances les un par rapport au autres. Cette structure permet éviter le parcours complet u fichier approximations en sélectionnant juste les régions les plus proches u vecteur requête. Selon OVA-File, les approximations es vecteurs sont oronnées et ensuite partitionnées sur plusieurs fichiers appelés slices. Chaque slices étant caractérisé par le nombre approximation qu il contient, son centre, et un rayon égal à la istance entre son centre et le vecteur le plus loin appartenant au slice. La structure u OVA-File est constituée e trois fichiers ; le fichier es onnées réelles, le fichier es approximations oronnées, et le fichier contenant les sommaires es slices, c.à., le centre, le rayon, et le nombre approximation. La recherche ans OVA-File se fait en eux étapes : premièrement les slices sont triés en fonction es istances e leurs centre par rapport au vecteur requête u plus proche au plus loin. Une recherche séquentielle est effectuée au sein e chaque slice ans l orre u tri. Deuxièmement, sur chaque slice visité une recherche es k ppv est effectuée séquentiellement. Soit S l ensemble es vecteurs résultats et S max le vecteur le plus loin appartenant à S, un slice n est visité que si : N S k ou ist ( q, O) ist( q, Smax ) + δr δ [0,1], telles que N S et le nombre approximations, O le centre u slice, R son rayon et δ est un paramètre e qualité : plus sa valeur et grane, plus e slice seront visités et par conséquent plus on a une bonne qualité e la recherche. 4.. LPC-File LPC-File (Local Polar Coorinate File) [Gua 0a] est une méthoe basée sur l'approche filtrage. Tout comme le VA-File, l espace e onnées est partitionné en cellules rectangulaires, celles-ci sont utilisées pour générer l approximation coée en bits pour chaque vecteur. Pour améliorer le taux e filtrage u VA-File, Guang et al. [Gua 0a] proposent enrichir les approximations es vecteurs coés en introuisant les cooronnées polaires ans le calcul es approximations. Le coage es vecteurs ainsi que l algorithme e recherche s en trouvent ainsi moifiés par rapport à VA-File : O v v O Fig..16 Coage es vecteurs selon LPC-File

65 Chapitre : Inexation multiimensionnelle -Coage es vecteurs : L espace est tout abor partitionné en cases e taille ientique et à chaque cellule est attribué un coe binaire e la même manière que ans le VA-File. A chaque vecteur sont associées aussi ses cooronnées polaires ( r et θ ). Ces cooronnées sont calculées par rapport au coin inférieur gauche e la case et la iagonale reliant ce ernier et le coin supérieur roit. Le vecteur v e la figure.16 reçoit le coe ( c, r, θ ) où c est le coe e la case contenant le vecteur v : 0101 en l occurrence, r la istance eucliienne entre v et o et θ l angle entre la iagonale oo et le vecteur ov. Il est à noter que plusieurs vecteurs peuvent avoir le même coe ans un espace e imension 3, les vecteurs ayant le même coe formant un cercle. Dans un espace e imension supérieure à trois, les vecteurs ayant le même coe forment une hyper sphère. -Algorithme e recherche : Tout comme le VA-File, en présence un vecteur requête, le fichier es approximations est abor parcouru pour effectuer une première phase e filtrage. Entre chaque approximation et le vecteur requête, une istance maximale max et une istance minimale min e la istance entre le vecteur e onnée et le vecteur requête sont calculées. Un vecteur est sélectionné si la borne inférieure e sa istance vers le vecteur requête est inférieure à la borne supérieure un autre vecteur. Dans la euxième phase, les vecteurs retenus sont lus ans l orre e leurs min. La istance entre chaque vecteur lu et le vecteur requête est calculée et l ensemble es résultats est mis à jour au fur et à mesure. La recherche s arrête es que la istance min u prochain vecteur à lire est supérieure à la istance au plus proche voisin courant. Cette procéure est ientique à celle utilisée par le VA-File. La nouveauté e cette technique résie ans le calcul es bornes min et max qui fait intervenir les cooronnées polaires. Consiérons un vecteur requête q et une approximation app un vecteur requête (voir figure.15), calculer les istances min et max entre le vecteur requête q et app revient à calculer la istance la plus proche et la istance la plus lointaine entre le vecteur requête q et l hyper sphère ayant comme surface les points e coe app. Si on note u le vecteur reliant o et app, et v le vecteur reliant o et q, alors min et max se calculent comme suit : = u + v u v cosθ θ min max = u v u v cos( θ + θ ) 1 1 Où θ 1 et θ sont les angles entre la iagonale e la case et les vecteurs u et v respectivement. a o u θ 1 θ v max Fig..17 Calcul e la istance minimale et e la istance maximale entre un vecteur requête et l ensemble e vecteurs ayant la même approximation q min

66 Chapitre : Inexation multiimensionnelle Il est évient que le taux e filtrage e l algorithme e recherche u LPC-File est meilleur que celui u VA-File car les approximations u LPC-File sont plus précises que celles u VA-File. Néanmoins, il est important e signaler que les calculs e min et max sont nettement plus coûteux ans le cas u LPC-File. Le choix u nombre e bits e coage reste un problème et les coes plus long que ceux u VA-File. 4. Approximation locale Les méthoes basées sur es approximations locales reposent sur l utilisation es formes géométriques (rectangles, sphères, ect.). Ces formes n ont pas nécessairement les mêmes propriétés : taille ifférente, possibilité e chevauchement, coage ifférent, etc. Ces formes sont ans la plupart es cas inexés par une structure arborescente. Cette approche est plutôt aaptée aux onnées réelles ont la istribution est généralement non uniforme. Nous étaillons ans les sous paragraphes qui suivent les méthoes A-Tree, IQ-Tree, RA-Blocks, GC- Tree, Active Vertice, et PCR-Tree A-Tree A-Tree [Syu 00] est une méthoe inexation hiérarchique similaire au R * -Tree. La ifférence entre les eux méthoes est ans la stratégie approximation es MBRs (Minimum bouning rectangle). A-Tree introuit la notion es rectangles englobant virtuels (VBRs) qui repose sur l iée approximer chaque MBR ou vecteur relativement par rapport à son MBR père. Cette approximation est plus précise que le R*-Tree et permet avoir un arbre avec une grane capacité e stockage. En effet les VBRs sont es rectangles contenant une approximation es MBRS ou es onnées réelles selon le niveau e l arbre à qui ils appartiennent. Ils se calculent e la manière suivante : Etant onné un rectangle multiimensionnel Re ctp représenté par eux vecteurs multiimensionnels p et p ' corresponant au côté bas gauche et haut roit tel que : ' ' ' ' p = [ p 1,..., p ], p = [ p 1,..., p ] et pi p i pour i = { i =1,... } avec est la imension e l espace ' multiimensionnel. Soit Rectq un rectangle ans P représenté par eux points q et q telle ' que p q q p ' i i i i. ' L iée e l approximation relative est e quantifier l intervalle ( qi, q i ) relativement par rapport à ' l intervalle ( p, ) avec la fonction e quantification Quant éfinie : i p i p ' ' nb 1 si( qi = pi ) ( i p i ) h( q Quant q p i ) ( i ) = i +, avec h( qi ) = qi ai nb. nb sin on ' p i pi ' nb est un entier supérieur à 1. qi se calcul e la même manière que q i. Le rectangle virtuel englobant VBR est le rectangle Re ctvb représenté par les eux vecteurs v et ' ' ' ' v telle que : v = ( Quant( q1),..., Quant( q )) et v = ( Quant( q1),..., Quant( q )) sachant que Q est inclus ans RectVq et RectVq est inclus ans Re ctp. Soit U un vecteur e onnées contenu ans le rectangle P, ce vecteur e onnées est vu comme étant un rectangle e iagonal nulle, e ce fait son VBR peut être éfinie e la même manière que précéemment. La figure.18 montre un exemple e VBR.

67 Chapitre : Inexation multiimensionnelle Rectangle Re ctp Re ctv q Rectangle Re ct q Fig..18. Exemple e VBR A-Tree est une structure arborescente, elle contient trois éléments : le nœu racine, les nœus interméiaires, et les feuilles. Le nœu racine représente l espace e onnées, les nœus interméiaires contiennent les MBRs ainsi que les coes es VBRs relatifs aux MBRs es nœus fils. Finalement les nœus feuilles contiennent les vecteurs e onnées réels. Lors e la construction e la structure inex, les coes es VBRs e chaque nœu e l arbre sont calculés à partir es informations stockées ans les MBR es parents et es fils u même nœu. Lors e la recherche un vecteur requête, la position exacte u VBRs fils un nœu peut être calculée à partir u MBR père et es coes es VBRs stockés ans le nœu. Un exemple e cette structure est illustré ans la figure.19. Dans la figure.19, le rectangle Rect représente l espace e onnées, M 1 et M sont eux rectangle ans Rect. M 1 et le MBR e M 3 etm 4. M 3 est le MBR u vecteur e onnées P 1 et P. Dans cette structure V 1, V, V 3, et V 4 sont les VBRs respectivement e M 1 ans Rect, M ans Rect, M 3 ans M 1, et M 4 ans M 1. C 1 et C sont les VBRs respectivement e P 1, P et M 3 M 1 Rectangle Rect Fig..19 Structure inex u A-Tree L algorithme e la recherche es kppv u A-Tree est une amélioration e l algorithme présenté ans [Hja 95]. Ce ernier se base sur le calcul es istances MINDIST, c.à. les istances minimales entre les MBRs un nœu et un vecteur requête onnée sont calculées et stockées avec un orre écroissant ans une structure nommée queue e priorité. Les nœus sont visités ans l orre écroissant e leurs istances MINDIST, et une liste es kppv est crée urant la recherche pour stocker les vecteurs les plus proches e la requête. Dans la queue e priorité les nœus éliminés e la recherche sont ceux ont la istance par rapport au vecteur requête est supérieure au k ème vecteurs proche ans la liste. Dans A-Tree, la queue e priorité contient les

68 Chapitre : Inexation multiimensionnelle istances MINDIST et un pointeur sur le nœu, l algorithme e recherche améliore le taux e filtrage en utilisant eux listes es kppv. La première appelée NNOVL, elle correspon aux vecteurs kppv usuels comme ans [Hja 95], elle contient les objets caniats stockées avec leurs istances par rapport au vecteur requête. La euxième liste NNVL contient les istances maximales entre le vecteur requête et les VBRs es onnées réelles. En résumé eux conitions guient le processus e la recherche : les onnées sont retenues si la istance entre le vecteur requête et le VBRs contenant le vecteur réel est inférieur ou égale à la k ème istance ans NNOL. Si la istance entre le vecteur requête et le vecteur réel est inférieur au k ème vecteur ans NNOL ce vecteur est retenu et insérer ans NNOL. Le étail e l algorithme e recherche est onné ans [Syu 00]. Les performances e A-Tree sont intéressantes par rapport à VA-File. En effet, à la ifférence u VA-File, qui se base sur es approximations exactes es vecteurs e onnées, A-Tree quant à lui utilise es approximations relative qui permettent e aapter à la istribution es onnées, un autre côté, l erreur e l approximation relative est beaucoup moins inférieure à celle une approximation exacte, ce qui ren cette technique bien aaptée aux istributions non uniforme es onnées. Par ailleurs, les valeurs es approximations sont représentées une manière compacte iminuant ainsi la taille es entrées e chaque nœu, par conséquent, la capacité es nœus augmente ce qui iminue par la suite le nombre es nœus parcourus urant la recherche et ainsi le temps CPU. Un autre avantage e la structure A-tree est chaque nœus contient es informations relative à eux niveaux, celui u père et u fils. Cette configuration es nœus est très utile pour l efficacité es opérations e mise à jour. A-Tree présente par contre une limitation au niveau e l erreur approximation, cette ernière égrae une manière consiérable la qualité e la recherche particulièrement en grane imension IQ-Tree Berchtol et al. [Bbj 00] ont proposé le IQ-Tree ( Inepenent Quantization Tree) un structure inexation constituée e trois niveaux inexation répartis sur trois fichiers ifférents: un premier niveau appelé "irectory", répartit les onnées ans une structure hiérarchique e type R*-Tree [Bec 90], ce niveau contient les représentations exacte es MBRs. Le secon niveau nommé "quantize ata pages" conserve une approximation u style VA-File pour chaque rectangle minimum englobant (REM), enfin le ernier niveau correspon aux onnées réelles. Chaque MBR ans un "irectory" contient un pointeur sur un "quantize ata page" qui contient à son tour un pointeur sur une page e onnées réelle. Les "quantize ata page" possèe une taille maximale e blocks, c.à., étant onnée un nombre e bit e coage chaque "quantize ata page" peut stocker un nombre maximale e points coés par une chaine e bit ans une seule "quantize ata page". Tout comme le VA-File, un nombre b i e bits par imension est utilisée pour approximer la localisation es points en ivisant virtuellement les MBR suivant chaque imension en bi partitions e taille égale. Les points contenus ans une région sont représentés par une chaine e bits comme ans le VA-File. Le pas e quantification b i (qui correspon au nombre e bit e coage) varie en fonction e la ensité es points ans les MBRs. La structure e IQ- Tree est illustrée ans la figure.0.

69 Chapitre : Inexation multiimensionnelle Fig..0 structure inex IQ-Tree La recherche ans IQ-Tree s effectue e la même manière que ans le A-Tree. En effet, la conition générale pour guier le processus e la recherche est la suivante : si une région spécifique ans un certain niveau e l arbre est non exclue e la recherche, le processus e la recherche suit le pointeur corresponant au MBR e la région courante et escen récursivement jusqu à le niveau le plus bas. Cette conition peut être appliquée aux MBRs un ensemble e points ainsi aux approximations es MBRs relatif aux points. Cette conition permet également e limiter le nombre accès aux vecteurs réelles ans le sens où ceux-ci sont parcourus uniquement que s ils sont les vrai réponses à la requête ou si la requête ne peut pas être évalué à la l aie e la représentation compressée. Etant onnée un requête, les approximations es MBRs sont insérées ans la queue e priorité comme ans le A-Tree. Les vecteurs réels corresponant à ces approximations sont parcourus uniquement ans le cas où leurs approximations eviennent es pages e la queue e priorité, c.à. que leurs approximations possèent les istances minimales min par rapport à un vecteur requête q onnée parmi tout les autres MBRs e la que e priorité. S il existe un point telle que sa istance par rapport au vecteur requête q est inférieure à la plus petite max ans la queue e priorité, les cooronnées réelles e ce point sont examinées pour calculer la istance réelle. Dans le cas contraire, il existe aucun point qui vérifie la conition précéant, le point p est sélectionné car il constitue le voisin le plus proche u vecteur requête. Il n existe en effet, aucune stratégie raisonnable qui permet éliminer ou e retarer la sélection u point p si son approximation est une page e la queue e priorité, puisque la vrai istance entre p et q est la plus petite possible. IQ-Tree a e bonnes performances par rapport au VA-File : Le nombre accès aux onnées et le temps e recherche sont consiérablement réuits. Par contre lorsque la imension augmente la structure arborescente souffre es problèmes e la maléiction e la imension, sa conception reste complexe par rapport aux autres structures GC-Tree Le GC-Tree (Gri Cell Tree) [Gua 0b] est une technique qui combine les avantages e l approche approximation es vecteurs permettant accéer à un nombre réuits e vecteurs réelles et les avantages es inexes multiimensionnels permettent e regrouper et organier les onnées ynamiquement ans l inex. GC-Tree repose sur une stratégie basée sur la ensité pour le partitionnement e l espace e onnées

70 Chapitre : Inexation multiimensionnelle -Partitionnement e l espace basé sur la ensité : Pour approximer la ensité es points, le GC-Tree partitionne l espace e onnées en es cellules hyper carrées e même volume, ceci est effectué en ivisant chaque imension en es intervalles réguliers e même taille ce qui permet e prouire par conséquent e cellules e même volume. Le nombre e vecteur ans chaque cellule est utilisé pour approximer la ensité e la cellule. Pour une base statique, la ensité une cellule est éfinie comme étant le quotient u nombre e points ans la cellule sur le nombre maximale e vecteurs qui peuvent être logés ans une page isque. Par contre, ans le cas une base e onnées ynamique, GC-Tree éfinit la ensité une cellule comme étant le nombre e vecteur ans la cellule sur la capacité e la page isque sachant qu un sous espace e l espace e onnées correspon à un nœu ans l arbre GC et il est physiquement stocké ans une page isque. Une cellule est ense si sa ensité est supérieure ou égale à un seuil τ. Sinon elle est ite éparse. Le partitionnent e l espace e onnées basée sur la ensité consiste en trois étapes : (i) L espace e onnées est partitionné en se basant sur une fonction e ensité ientifiant les régions enses et les régions éparses. (ii) Le partitionnement est concentré sur les régions enses. (iii) Les vecteurs es régions éparses sont traités comme s ils se trouvent ans une seule région. La figure.1 montre un exemple e partitionnent e l espace e onnées basé sur la ensité ans un espace à eux imensions. Dans cet exemple, la capacité es cellules est fixée à 4. Si la cellule contient au maximum 3 points elle est appelée "cluster", sinon elle est nommée "outliers". La figure.1 montre le résultat e trois niveau e partitionnent selon GC-Tree. Lors u premier partitionnent les point 1,, 3, 4, 5 et 6 sont ientifier en tant que "outliers", onc le "cluster" corresponant est subivisé. Lors u secon partitionnent, les points 7, 8 et 9 sont ientifiés comme étant es "outliers" et les points 10, 11, et 1 sont également ientifiés comme étant es "outliers" lors e u 3 eme niveau e partitionnent. Finalement, nous obtenons, un seul "cluster" ans 3 eme niveau, et trois "outliers" ans le niveau, 1 et Niveau Fig..1 Partitionnement e l espace selon GC-Tree Niveau 1 Niveau Cluster ans le niveau 3 Structure inex Le GC-Tree est organisé sous forme un arbre ynamique où les nœus internes e l arbre contiennent les cellules corresponant aux sous espaces et les feuilles contiennent les onnées réelles. L entrée e chaque feuille e l arbre contient l approximation u vecteur réelle, cette approximation est calculée suivant la méthoe LPC-File (voir paragraphe 4..) et un pointeur vers un nœu e onnées ans lesquelles les onnées réelles sont stockées. L entrée un nœu interne e l arbre contient la cellule corresponant au sous espace couvrant les onnées e cette

71 Chapitre : Inexation multiimensionnelle cellule ainsi qu un pointeur vers le niveau inférieur. Un exemple e construction e la structure inex u GC-Tree est illustré ans la figure.. La figure.a représente un espace e onnées e eux imensions ivisé en 16 cellules avec un nombre e bits e coage fixé à. La ensité maximale es cellules est fixée à 3/(capacité es nœus). La racine contient trois entrées. La cellule (00,11) u secon niveau représenté ans la figure.a corresponant au nœu C forme une partition fine u cluster corresponant au nœu C 4 et un "outlier". Le nœu C 4 à son tour forme une partition fine ans le "cluster" corresponant au nœu C 5 et un "outlier". La construction e l inex se fait par insertion successive es onnées réelles. La recherche es k ppv s effectue en eux étapes : une première étape e filtrage et une secone étape accès aux onnées réelles. L algorithme e recherche utilise trois structures globales : eux listes bl_list et can_list et un tableau k_element contenant les k vecteurs les plus proches. La liste bl_list contient les branches es nœus internes e l arbre avec leurs istances minimales et maximales par rapport au vecteur requête. La liste can_list contient la liste es nœus caniats, c-à- ceux susceptible e contenir les vecteurs les plus proche à la requête, cette liste contient également les istances minimales et maximales qui séparent chaque caniats et le vecteur requête. Ces eux structures (bl_list et can_list) sont calculées en utilisant l algorithme min heap [Min 95]. Lors e la recherche si une approximation est rencontrée telle que sa istance minimale est supérieure à la plus petite istance maximale, le vecteur corresponant est éliminé e la recherche. (a) (b) Fig... Construction e l inex e l arbre GC. (a)partitionnent e l espace e onnées. (b) la structure inex corresponante [Gua 0b] GC-Tree améliore les performances e la majorité es techniques inexation basées sur l approximation à savoir : IQ-Tree, LCP-File, VA-File et la recherche séquentielle. Par contre, cette méthoe souffre es problèmes e la maléiction e la imension. En effet, l espace e onnées est partitionné suivant la méthoe KD-Tree en es hyper cubes e petits volume. Or en grane imension, les istances entre vecteurs ont tenance à converger ceci risque e regrouper tout les vecteurs ans le même hyper cubes ce qui iminue par conséquence la performance e l inex ainsi que celle e la recherche.

72 Chapitre : Inexation multiimensionnelle RA-Blocks RA-Blocks [Ter 0] est une technique basée sur l approximation es régions. L espace e onnées est tout abor partitionné en cellules hyper rectangle e taille ientique et à chaque cellule corresponant à un vecteur est attribué un coe comme ans le VA-File. L espace e onnée est partitionné en es régions selon l algorithme KDB-Tree, l algorithme e partitionnent est guié une part par les valeurs e quantification issues u écoupage e l espace e onnées en cellules et autre part par la capacité es régions préalablement fixé au cours e l inexation. Les régions résultantes u écoupage e l espace e onnées sont coées par les eux cellules corresponant la cellule u bas à gauche et en haut à roite. L algorithme e la recherche es k ppv est composé e eux étapes : une étape e filtrage ans laquelle les régions caniates sont sélectionnées en se basant sur leurs istances minimales et maximales par rapport au vecteur requête. Dans la euxième étape ite accès au vecteurs, les régions sélectionnées seront accéées et une recherche séquentielle est exécutée afin e calculer les vecteurs les plus proches au vecteur requête (cette méthoe est présenté en étail ans le paragraphe 1.4 u chapitre 3) Comme le VA-File RA-Blocks n utilise aucune structure arborescente, elle repose sur la gestion e eux ensembles e fichiers, un fichier contenant les approximations es régions et un autre contenant les onnées réelles. À la ifférence es méthoes qui se basent sur une structure arborescente, L insertion e nouveau vecteurs ne nésite aucune réorganisation e l espace e onnées, sa structure est simple et ynamique. D un autre côté, RA-Blocks combine les avantages es méthoes basées sur une structure arborescente permettant e regrouper localement les onnées et les organiser en inex, ainsi que les avantages es méthoes basées sur l approximation globale permettant e réuire le temps e calcul es istances et accéer à un nombre réuits e vecteurs réelles. La structure u RA-Blocks par contre, semble plus aaptée aux onnées e istribution uniforme, elle souffre aussi et comme la majorité es techniques inexation basées sur l approximation es problèmes e la maléiction e la imension. Contrairement au VA-File, le nombre e bit e coage b i n a pas l influence significative sur la taille u fichier approximations et les performances e la méthoe. Un gran nombre e bits e coage prouit une approximation précise par contre elle augmente légèrement la taille u fichier approximation puisque celui-ci contient uniquement les approximations es régions représentés par eux cellules Active Vertice Balko et al. proposent une méthoe appelée AV (Active Vertice) [Bal 04] pour l inexation es onnées multiimensionnelle. Cette méthoe repren les techniques basées sur les arbres quaternaires [Sam 84] pour le partitionnement e l espace, elle construit les approximations es vecteurs ans l espace et associe à ces approximations es coes binaires Bi comme ans le VA- File. Cepenant, les cellules régulières ans VA-File sont remplacées ans la méthoe AV par un arbre équilibré pour refléter la istribution es vecteurs ans l espace. Chaque nœu Ci e l arbre étermine une région e l espace écrite par un point représentatif, le nœu C i est élimité par l intersection un ellipsoïe et un hyper-rectangle. Le rayon maximum e l ellipsoïe est un paramètre fixé au ébut e l inexation. La taille e l hyper-rectangle épen u niveau u nœu élimité par l hyper-rectangle. Elle est réuite e moitié lorsqu on passe un nœu onnée aux nœus e niveau irectement inférieur en cas e istribution uniforme

73 Chapitre : Inexation multiimensionnelle es onnées. Le coe binaire B i est entièrement éfini par le chemin parcouru pour aller e la racine e l arbre au nœu contenant le vecteur, sa longueur est onc variable. La élimitation es régions par l intersection une ellipsoïe et un hyper-rectangle ans la méthoe AV permet obtenir, es approximations plus rigoureuses e la istance entre un vecteur requête quelconque et un vecteur onnée e l espace. Un exemple approximation selon la méthoe AV est illustré ans la figure.3. La recherche es k ppv est similaire à celle u VA-File, elle s effectue en eux étapes, ans la première étape le fichier es approximations est parcouru séquentiellement et la listes es approximations caniates est éterminée en se basant sur les istances minimales min et maximales max e vecteur requête par rapport à l approximation. Ces istances sont calculées e la manière suivante (voir figure.3) : q, B ) max ( q, B ), ( q, B ) ( q, B ) = max q p r,0 max ( i = { max, i max, i }, avec { } s c max, s i i ( q, B ) = min{ ( q, B ),, ( q, B )}, avec ( q, B = q p + r Et, min i min, s i min c i min, s i ) wi c i = i = LB ( q, B ) (max ( q[ j] c [ j] ),0 ), wi est la longueur arrête e l hyper cube j 1 UB ( q, B ) = c i wi ( q[ j] ci[ j] ) j= 1 i Hypercube (c) p 0 p 1 p p t=0 p 0 Hypersphère (S) p 1 t=1 p Fig..3 le principe e l approximation e la méthoe AV t=3 LB sphère UB sphère UB cube LB cube r p i q Fig.4. Exemple e calcul e la istance minimal et maximal u vecteur requête par rapport à l approximation suivant la méthoe AV

74 Chapitre : Inexation multiimensionnelle Notons que la méthoe AV présente e bonne performance au passage à l échelle et en grane imension en comparaison avec VA-File et LPC-File, par contre cette technique exige un paramétrage assez complexe pour aapter cette méthoes aux applications réelles ce qui ren la méthoe ifficile à appliquer. D un autre côté, l utilisation e l arbre qua-tree pour le partitionnement e l espace e onnées et pour l inexation es points e référence ren cette méthoe inaaptée aux onnées uniformes PCR-Tree Plus récemment, l arbre PCR (Principal Component R-Tree) est introuit par Cui et al. [Cui 07] pour réponre aux problèmes e la maléiction e la imension ont soufflement la majorité es méthoes inexation multiimensionnelles ainsi que le problème e la istribution non uniforme es onnées réelles. Cette méthoe a été proposée pour supporter les onnées non uniformes ans un espace e vecteurs multiimensionnel. Elle combine l approche filtrage ainsi que la compression es onnées pour accélérer la recherche séquentielle une requête onnée. L arbre PCR a une structure à trois niveaux : le premier niveau correspon aux nœus e l arbre contenant les rectangles englobant (REMs) et les approximations relatifs aux vecteurs. Le euxième niveau correspon aux feuilles e l arbre contenant les approximations es vecteurs réelles ans l espace e imension réuite. Le troisième niveau contient les vecteurs réels exprimés ans l espace e grane imension. La ifférence entre PCR-Tree et R-Tree se manifeste principalement ans la stratégie u groupement e vecteurs sous forme e rectangles. En effet, ans R-Tree les REMs sont construits en se basant sur les cooronnées réelles es vecteurs alors que ans l arbre PCR, les REMs sont crées à partir es approximations es vecteurs coés en bits (voir figure.5). Notons que le principal inconvénient e la méthoe R- Tree est le chevauchement entre les REMs prouisant les égraations rapies ans les performances en grane imension. La structure e l arbre PCR est construite par contre ans un espace e imension réuite pour contourner les problèmes e la maléiction e la imension. La construction e la structure inex e l arbre PCR est résumée en 3 étapes : Etape 1 : les onnées sont projetées ans un espace e imension réuite en utilisant la transformé e KLT Etape : calculer les approximations es vecteurs projetés ans l espace KLT en utilisant la méthoe présentée ans VA + -File [Hak 00] Etape 3 : choisir le nombre es composantes principales (c.à. la imension e l espace transposé) Etape 4 : Construire l arbre PCR selon les approximations es vecteurs ans l espace e imension réuite A la ifférence u VA-File, la recherche ans l arbre PCR s effectue en une seule étape, elle se base sur une technique similaire à celle utilisée ans la méthoe R-Tree. La conition générale pour guier la recherche est la suivante : si le REM un certain niveau e l arbre n est pas exclu e la recherche, l algorithme e recherche suit le pointeur associé au REM et escen un niveau e l arbre. Et si une approximation un vecteur n est pas exclue e la recherche, l algorithme e recherche accèe aux vecteurs réels corresponant. Un tableau e max est utilisé pour stocker les k plus petites istance trouvées lors e la recherche. Durant la recherche, les istances minimales min entre es caniats et le vecteur requête sont calculés. Si une approximation est rencontrée telle que sa istance minimale est plus grane que

75 Chapitre : Inexation multiimensionnelle la plus petite istance trouvée jusqu à maintenant, le vecteur corresponant peut être éliminé e la recherche. La istance minimale entre le REM et le vecteur requête est aussi calculée. Si la istance minimale entre le REM et le vecteur requête est plus grane que la plus petite istance trouvée, tous les vecteurs englobés par le REM sont éliminés e la recherche. L arbre PCR présente e bonnes performances en terme temps e réponse par rapport à GC- Tree et VA + -File, c est une technique aaptée au onnées non uniforme e grane imensions par contre sa structure est non ynamique. Le changement e la istribution es onnées nécessite la reconstruction e la structure inex ans l espace e imension réuite. MBR u R-Tree [ ]X[ ] 11 3 MBR u PCR-Tree [00,11]X[10,11] l mbr 00 q Fig..5. MBRs e l arbre PCR et u R-Tree 4.3 Synthèse Ce paragraphe présente une synthèse sur les caractéristiques, les avantages et inconvénients es techniques inexation basées sur l approximation pour la recherche es plus proches voisins présentées précéemment. Les tableaux.3,.4,.5, et.6 récapitulent les principales caractéristiques, avantages et inconvénients es méthoes présentées précéemment. Nous avons istingué eux granes familles : la famille es méthoes basées sur l approximation globale (VA-File, VA+-File, C-VA-File et LPC-File) et les familles es méthoes basées sur l approximation locale. La première famille e méthoes se caractérise une part par le fait appliquer uniformément la même stratégie u écoupage e l espace e onnées et éventuellement le coage es formes géométriques (cellules) issu e ce écoupage. En effet, la stratégie u écoupage est guié uniquement par le nombre e bits e coage fixée préalablement et aucune conition sur la istribution es onnées n ai prise en consiération lors e la création e la structure inex. D autre part ces méthoes ont la particularité utiliser uniquement eux fichiers pour la gestion es onnées : un premier fichier contenant les approximations es vecteurs et un euxième contenant les onnées réelles. Ainsi aucune structure hiérarchique n est aoptée par ces méthoes, ceci présente un premier point fort e ces techniques. En effet, la structure hiérarchique es onnées notamment la structure arborescente, exige certaines propriétés (équilibre, taille es nœus, etc.). La prise en compte e ces propriétés ren les procéures insertion, suppression es onnées ifficile, ces structures sont généralement non ynamiques et non aaptées à la mise à jour. Un euxième point fort e ces techniques est le fait e ne plus utiliser es formes géométriques englobantes. Les méthoes

76 Chapitre : Inexation multiimensionnelle basées sur l approximation globale procèent par un coage es vecteurs e onnées, l approximation est par conséquent exacte. Cette famille par contre est aaptée surtout aux onnées e istribution uniforme puisque les onnées sont inexées est coées e la même manière quelques soit leurs istribution. La euxième famille e méthoe est basée sur l approximation locale, son principe étant e partitionner et coer les onnées localement en se basant sur leurs istributions. Elle est basée sur l utilisation es formes géométriques qui n ont pas nécessairement les mêmes propriétés : taille ifférente possibilité e chevauchement, etc. Ces formes sont inexées par une structure arborescente, la structure arborescente, permet une certaine flexibilité lors e l inexation es ifférentes régions e l espace e onnées ans le sens ou chaque région peut être représentée et coée ifféremment. Par contre l utilisation e cette structure pose es problèmes aux passages à l échelle par exemple, la taille e l arbre augmente au fur et à mesure que la taille e onnées évolue. Par ailleurs le fait utiliser les formes géométriques avec es propriétés ifférentes génère une part es approximations précises mais par contre pose e nombreux problèmes en grane imension (possibilité avoir es régions vies, possibilité e chevauchent, problème optimisation e l espace mémoire ). Cette famille e méthoes a l avantage e pouvoir manipuler es onnées réelles (e istribution non uniforme) mais par contre elle reste limitée pour les onnées à grane échelle (grane imension, gran volume e onnées). Pour comparer les caractéristiques es ifférentes méthoes présentées précéemment, nous avons choisi es critères que nous avons jugé primoriales pour la comparaison es ifférentes structures inex: la structure e méthoe, sa capacité e supporter les granes imensions, le volume es onnées, l aaptabilité par rapport aux onnées réelles, et la sélectivité. Notons que ces critères ne sont pas exhaustifs. Nous n avons pas inclus par exemple le critère temps e réponse, celui-ci se éuit e la sélectivité et e la structure e l inex. Le passage en revue es principales méthoes basées sur l approximation montre clairement que ces techniques ont e bonnes performances au passage à l échelle et au grane imension en comparaison avec les techniques conventionnelles inexation multiimensionnelles, leurs performances sont liées cepenant selon la méthoe à es paramètres comme le nombre e bits e coage, la taille u fichier es approximations ou la méthoe u partitionnent e l espace e onnées et parfois à la istribution es onnées. Ces méthoes restent néanmoins les plus utilisées et les plus efficaces à ce jour pour l inexation es granes bases e onnées réelles où la imension épasse 100 et la taille e la base e onnées est consiérable. En se basant sur les ifférents tableaux comparatifs il est facile e montrer qu aucune es méthoes citées précéemment ne peut être utilisée efficacement ans le omaine e la recherche images basée sur le contenu, ou nous avons un gran volume e vecteurs multiimensionnels e nature hétérogène (istribution non uniforme) et e grane imension. Les méthoes basées sur l approximation globale sont généralement aaptées aux onnées e istribution uniforme excepté la méthoe C-VA-File. Les performances e cette méthoe sont par contre limitées aux granes imensions et au passage à l échelle. Les méthoes basées sur l approximation locale quant à elles sont aaptées aux onnées réelles. En revanche, certaines ont es structures inex complexe (IQ-Tree), autres souffrent consiérablement es problèmes e la maléiction e la imension (A-Tree, PCR-Tree, GC-Tree, Active Vertice). Sur la base e cette étue comparative, nous avons remarqué que RA-Blocks possèe es propriétés intéressantes en comparaison avec les autres méthoes. A la ifférence es techniques présentées ans ce chapitre, cette méthoe combine les avantages e la famille es méthoes basées sur l approximation globale en utilisant uniquement es fichiers pour la

77 Chapitre : Inexation multiimensionnelle gestion es onnées, et les avantages e la famille es méthoes basées sur l approximation locale en utilisant es formes géométriques englobantes (es régions) pour regrouper les onnées. RA-Blocks possèe les meilleurs caractéristiques (meilleur taux e sélectivité, structure inex aaptée au gran volume e onnées, etc.). Comme toutes les méthoes inexation multiimensionnelle, RA-Blocks souffrent es problèmes e la maléiction e la imension. Sa mise en place ans un système e recherche par contenu nécessite es améliorations. Le chapitre 3 présente en étail la méthoe RA-Blocks ainsi que les améliorations apportées à cette méthoe pour réponre aux problèmes e la maléiction e la imension. Le traitement es problématiques liées à l intégration e cette méthoe ans un système e recherche images par le contenu sera présenté ans le chapitre 4. Méthoe Avantages Inconvénients A-Tree * Aaptée aux onnées réelles *Chevauchement entre les *Flexible à la mise à jour *Grane capacité e stockage * Améliore les performances u VA- File MBRs*Dégraation es performances aux passage à l echelle & grane imension * Erreur approximaion consiérable *Petite taille es entrées en grane imension inex (arbre compact) IQ-Tree * Bonne selectivité es région * Aaptée aux onnées réelles * Améliore les performances u VA- File * Structure inex complexe * Non performante pour es onnées volumineux * Non aaptée au onnées uniformes *Dégraation es performances en grane imension * Dégraation es performances pour un gran volume e onnées. GC-Tree Active Vertice * Aaptée aux onnées réelles * Améliore les performance u VA- File, LPC-File et IQ-Tree * Structue ynamique flexible à la mise à jour * Améliore les performances u VA- File et LPC-File * Aaptée aux onnées réelles. * Dégraation es performances en grane imension * Dégraation es performances pour un gran volume e onnées. * Dégraation es performances en grane imension * Dégraation es performances pour un gran volume e onnées. * Non aaptée au onnées uniforme * paramétrage complexe

78 Chapitre : Inexation multiimensionnelle PCR-Tree RA-Blocks * Aaptée aux onnées réelles * structure réuisant le chevauchement entre les MBR * Améliore les performances u GC- Tree et VA+-File *Structure ynamique * Améliore les performances es méthoe conventionnelles et u VA- File * Aucune structure arborescente *Structure ynamique, flexible à la mise à jour * Bon taux e selectivité * Non performante au passage à l echelle & grane imension * Non aaptée au onnées uniforme *Structure non ynamique, non flexible à la mise à jour * Non aaptée aux onnées avec es correlations non linaires * Non aaptée au onnées réelles * Dégraation es performances en grane imension * Dégraation es performances pour un gran volume e onnées. * Tolère e granes valeurs u nombre e bits e coage=>bonne precision ** Améliore les performances es méthoes inexation conventionnelles et u VA-File Tableau.3 Récapitulatif es avantages et inconvénients es méthoes inexation basée sur l approche approximation locale citées précéemment Méthoe Avantages Inconvénients VA-File * Aaptée aux onnées uniformes * Améliore les performances es méthoes inexation conventionnelles * Non aaptée au onnées groupés (onnées réelles) * Approximations non précises pour un b i faible, égraation es performances pour un b i gran * Dégraation es performances en grane imension * Dégraation es performances pour un gran volume e onnées. VA+-File *Aaptée aux onnées réelles * Améliore les performances es méthoes inexation conventionnelles et u VA-File * Approximations non précises pour un b i faible, égraation es performances pour un b i gran * Dégraation es performances en grane imension * Dégraation es performances pour

79 Chapitre : Inexation multiimensionnelle un gran volume e onnées. C-VA-File OVA-File LPC-File *Aaptée aux onnées réelles * Améliore les performances es méthoes inexation conventionnelles et u VA-File * Structure mieux aapté à l espace e grane imension en comparaison avec VA-File *Aaptée aux onnées uniformes * Améliore les performances es méthoes inexation conventionnelles et u VA-File * Aaptée au gran volume es onnées et aux granes imensions * Aaptée aux onnées uniformes * Coage ou Approximation précise * Améliore les performances es méthoes inexation conventionnelles et u VA-File * Approximations non précises pour un b i faible, égraation es performances pour un b i gran * Dégraation es performances pour un gran volume e onnées. * Non aaptée aux onnées avec es corrélations non linéaires * Non aaptée au onnées groupés (onnées réelles) * Approximations non précises pour un b i faible, égraation es performances pour un b i gran * Non aaptée aux onnées réelles * Dégraation es performances pour un gran volume e onnées. * Non aaptée aux onnées avec es corrélations non linéaires Tableau.4 Récapitulatif es avantages et inconvénients es méthoes inexation basée sur l approche approximation globale citées précéemment Méthoe Structure Dimension Volume e Données sélectivité onnées A-Tree R*-Tree réelles +approximation es vecteurs/ MBR(VMBRs) IQ-Tree R*-Tree réelles +approximation es vecteurs (VA-File) RA- Aucune structure + uniformes Blocks approximation es régions GC-Tree arborescente+approxi réelles mation es vecteurs selon LPC-File Active Intersection réelles -- Vertice région/sphère+ structure arborescente + approximation u VA-File PCR- R-Tree+ PCA+ réelles

80 Chapitre : Inexation multiimensionnelle Tree Approximation u VA-File Tableau.5 Récapitulatif e quelques propriétés générales es méthoes inexation basées sur l approximation locale citées précéemment Méthoe Structure Dimension Volume e onnées VA-File Aucune structure +Approximation es vecteurs VA+-File Aucune structure +Approximation es vecteurs C-VA- Aucune structure File +Approximation es vecteurs LPC-File Aucune structure +Approximation es vecteurs Distribution es onnées séléctivit é uniformes réelles réelles -- Uniformes Tableau.6 Récapitulatif e quelques propriétés générales es méthoes inexation basées sur l approximation globale citées précéemment Légene : imension faible : imension moyenne : Base e onnées e petite taille : Base e onnées e taille moyenne : Base e onnées e grane taille : faible taux e séléctivité : taux e selectivité moyen : meilleur taux e sélectivité 5 Synthèse Dans ce chapitre nous avons présenté ans un premier temps les principales techniques conventionnelles inexation multiimensionnelles. Nous tenons à préciser que l état e l art que nous avons mené sur ces méthoes n est pas exhaustif. Nous nous sommes limités aux méthoes les plus citées et les plus utilisées ans le omaine e l inexation multiimensionnelle. Sur la base cette étue, nous avons remarqué une part que la performance e la plus part e ces méthoes se égraent au passage à l échelle et en grane imension, et autre part, parmi ces méthoes certaines sont particulièrement aaptées à un espace Eucliien et autre sont convenables uniquement à es istributions e onnées particulières, notamment uniformes. Nous avons présenté par la suite les problèmes e la maléiction e la imension qui se posent lors e la manipulation es onnées e grane

81 Chapitre : Inexation multiimensionnelle imension et les méthoes e la réuction linéaires et non linéaires e la imension qui ont été proposé ans la littérature pour faire face à ces problèmes. Nous avons montré que ces méthoes réuisent la imension e l espace e onnées, mais leur application reste liée à es contraintes comme la linéarité es onnées, le paramétrage, etc. Des méthoes inexation basées sur l approche approximation plus efficaces ont été proposées pour pallier aux problèmes e la maléiction e la imension. Leurs principe e base est la représentation es onnées par une approximation compactes afin e réuire le temps e parcours lors u processus e la recherche. Nous les avons classé en eux granes familles : les méthoes basées sur l approximation globale et celles basées sur l approximation locale. La première famille est performante au passage à l échelle et en grane imension en comparaison avec les méthoes conventionnelles par contre elle est plutôt aaptée aux onnées e istribution uniforme, la secone famille a l avantage e pouvoir manipuler es onnées réelles mais par contre sa mise en place ans e applications réelles nécessite es améliorations. Nous avons finalement comparé les ifférentes méthoes que nous avons présentés. Sur la base e cette comparaison nous concluons que la méthoe basée sur l approche approximation local RA-Blocks présente les meilleurs caractéristiques, c est une méthoe que nous trouvons prometteuse pour faire face aux problèmes e la maléiction e la imension et au passage à l échelle, et c est pour ces raisons que nous avons choisi e l étuier e plus prêt pour améliorer ces performances et l intégrer ans un système e recherche images par le contenu.

82 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels Chapitre 3 Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels : RA + -Blocks Ce chapitre présente le RA + -Blocks, une nouvelle technique inexation multiimensionnelle basée sur l approche approximation (filtrage). Tout comme RA-Blocks, RA + -Blocks repose sur le écoupage e l espace e onnées en régions compactes et isjointes, chaque région est approximée par eux chaines e bits. Notre nouvelle méthoe apporte une amélioration au niveau e la phase e écoupage es régions par rapport à RA-Block, qui se base sur l algorithme e écoupage KDB-Tree. Nous présentons abor la méthoe KD-Tree et KDB-Tree, ensuite nous étaillons la méthoe RA-Blocks suivie par notre nouvelle méthoe inexation RA + -Blocks. 1 Introuction Comme nous l avons présenté ans le chapitre, les performances es techniques conventionnelles inexation multiimensionnelles se égraent ramatiquement lorsque la imension e l espace e onnées augmente. Contrairement à ces techniques, les méthoes inexation basées sur l approche filtrage ont été proposées en prenant en compte explicitement les problèmes liés aux espaces e granes imensions. Plusieurs travaux ont montré que ces méthoes effectuent es recherches es plus proches voisins une manière efficace ans les espaces e granes imensions (>16) [Web 98]. A partir e l état e l art que nous avons mené ans le précéent chapitre sur les principales méthoes inexation qui existent ans la littérature. Nous avons pu nous positionner et proposer une nouvelle méthoe inexation multiimensionnelle basée sur l approche approximation (RA + -Blocks) qui est une amélioration e la méthoe RA-Blocks. Rappelons que RA-Blocks présente es propriétés intéressantes par rapport aux autres méthoes inexation multiimensionnelles. En effet elle améliore les performances en terme temps e réponse u VA-File, la méthoe représentative e l approche approximation. RA-Blocks possèe une structure ynamique flexible à la mise à jour, sa structure n est pas affectée par la moification e la taille e la base. Le point fort e cette méthoe est qu elle combine les avantages es méthoes basées sur l approximation globale en utilisant uniquement es fichiers pour la gestion es onnées et les avantages es

83 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels méthoes basées sur l approximation locale en utilisant es formes géométriques englobantes (es régions) pour regrouper les onnées. Ces avantages comme nous allons le voir, permettent une part augmenter la capacité e stockage es onnées par rapport aux autres structures inex notamment le VA-File et autre part améliorer le temps e réponse en traitant es régions enses et compactes au lieu e consiérer les vecteurs ou les approximations es vecteurs. Notre étue comparative montre finalement que RA-Blocks possèe les meilleurs caractéristiques (meilleur taux e sélectivité, structure inex aaptée au gran volume e onnées, etc.). En s appuyant sur ces avantages, nous avons choisi améliorer les performances u RA-Blocks ans l objectif e pouvoir l appliquer au gran volume e onnées e imension élevé. Malgré les bonnes performances e la méthoe RA-Blocks, cette ernière se trouve confronté aux problèmes liées à la maléiction e la imension notamment au niveau es régions obtenues lors e la phase u écoupage e l espace e onnées. En effet, le partitionnement e l espace e onnées se base sur l algorithme KDB-Tree [Rob 81], ont le principal inconvénient est la prouction un gran nombre e régions vies ou es régions contenant peu e vecteurs par rapport à leur capacité. Ceci entraine une augmentation consiérable ans le temps e la recherche et une mauvaise exploitation e l espace mémoire et par conséquent égrae les performances e la structure inex. Pour reméier à ce problème, nous avons proposé la méthoe RA + -Blocks, une amélioration e RA-Blocks. Elle permet la recherche es k ppv un vecteur requête onné selon trois étapes: ans la première étape ite phase e compression, l espace e onnées est partitionné sous forme e cellules hyper rectangulaires. Ensuite, en se basant sur une nouvelle technique e subivision inspiré e l algorithme e partitionnent KD-Tree [Ben 79], l espace e onnées est partitionné en es régions compactes et isjointes chacune correspon à un ensemble e cellules, et chaque région est ensuite approximée par les eux cellules corresponant aux eux cellules en bas à gauche et en haut à roite e chaque région. La euxième étape est appelée phase e filtrage. Elle consiste à sélectionner les régions qui ont une forte chance e contenir les voisins les plus proches u vecteur requête en se basant sur leurs istances minimales et maximales par rapport au vecteur requête. Enfin, ans la troisième étape accès aux onnées, un parcours séquentiel est effectué sur les vecteurs contenus ans les régions retenues ans la phase e filtrage pour calculer les voisins les plus proches e la requête en se basant sur les istances réelles. Dans ce qui suit nous présentons abor les eux méthoes inexation KD-Tree et KDB- Tree avant e étailler les eux techniques RA-Blocks et RA + -Blocks. Notons que KDB-Tree et KD-Tree sont eux méthoes inexation multiimensionnelles utilisées respectivement par les eux méthoes RA-Blocks et RA + -Blocks ans un objectif e écoupage e l espace e onnées et non pas pour un objectif inexation es onnées, leurs structures corresponantes ainsi que leurs algorithmes e recherche ne sont pas exploités par les eux méthoes RA-Blocks et RA+- Blocks. De ce fait, nous étaillons ans le paragraphe suivant uniquement le principe e partitionnent e l espace e onnées e KD-Tree et KDB-Tree. KD-Tree KD-Tree [Ben 79] est une méthoe inexation multiimensionnelle permettant organiser les onnées ans un espace multiimensionnel e imension, c est une structure arborescente binaire basée sur une subivision récursive e l espace en régions hyper-rectangulaires isjointes [Ben90][Bff 77], appelées cellules. Chaque nœu ans l arbre est associé à une région ainsi qu à l ensemble es vecteurs se trouvant ans cette région. Le nœu racine e l arbre est associé au care limite qui contient tous les vecteurs, les nœus internes contiennent

84 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels l hyperplan séparateur en plus es eux fils corresponant aux eux sous espaces générés par le partitionnent. Enfin, les feuilles e l arbre contiennent l ensemble es vecteurs contenus ans le sous espace corresponant. Un exemple e la structure KD-Tree est illustré ans la figure 3.1. La construction e la structure inex u KD-Tree se fait par es insertions successives es ifférents vecteurs e la base e onnées. Consiérant un nœu arbitraire ans l arbre, à chaque fois que le nombre e vecteurs associés à ce nœu est plus gran qu une petite taille, qu on appelle capacité e la feuille, le care associé à ce nœu est ivisé en eux par un hyper plan orthogonal à un axe e cooronnées. Plusieurs algorithmes e partitionnement existent, ils ifférent ans le choix u plan séparateur, et ans la conition arrêt e l algorithme. Dans le paragraphe suivant nous étaillons une stratégie générale e la construction u KD-Tree Fig.3.1. La structure u KD-Tree et ses partitions ans le plan.1 Construction un KD-Tree Comme nous allons le présenter ans les sections suivantes, il existe ifférentes stratégies e ivision e l espace e onnées, chacune faisant un choix ifférent pour l hyperplan e ivision. Si un nœu est saturé, le sous espace relatif à ce nœu est ivisé en eux sous espaces par un hyperplan orthogonal à un axe e cooronnées, les eux sous espaces résultants sont associés aux eux fils relatif à ce nœu. L ensemble es vecteurs se trouvant ans le sous espace original est partagé entre les eux fils, selon leurs positions par rapport à l hyperplan e ivision. Les vecteurs qui se trouvent sur l hyperplan lui-même peuvent être associés aux eux fils simultanément (ou suivant la règle ictée par la méthoe e ivision). Quan le nombre es vecteurs associés au sous espace courant evient inférieur à la taille amise e la feuille (ou bien le nombre e partitionnent u nœu corresponant à cet espace épasse un certain seuil), le nœu est éclaré feuille, et ses vecteurs sont mémorisés ans ce nœu. La structure globale u KD-Tree contient es informations telles que le nombre e vecteurs, la imension e l espace et la taille e la feuille. Toutes les feuilles e l arbre contiennent le nombre e vecteurs associés à cette feuille (un nombre qui varie e 0 et la taille e la feuille) ainsi que leurs inices. Le nœu interne contient les informations suivantes : 1) une valeur entière qu on appelle imension e ivision (allant e 0 à 1) iniquant l axe e cooronnées orthogonal à l hyperplan qui a réalisé la ivision.

85 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels ) une valeur réelle qu on appelle la valeur e ivision iniquant la position à laquelle l hyperplan coupe l axe e cooronnées. 3) eux pointeurs, l un sur son fils gauche et l autre sur son fils roite. Il existe plusieurs algorithmes e partitionnent e l espace e onnées ans KD-Tree, chacun fait référence soit à un choix ifférent u plan séparateur, soit à un critère ifférent e partitionnent es nœus. Pour le plan séparateur, le choix se base sur eux critères : l orientation et la position. Pour l orientation, ce choix correspon au plan perpeniculaire à chacun es axes u repère à tour e rôle alors que pour la position, ils existent plusieurs choix corresponant à plusieurs stratégies. Deux entres elles seront étaillés ans le paragraphe suivant. En ce qui concerne le partitionnement e l espace e onnées on istingue eux critères : le premier critère se base sur le nombre e vecteurs ans le sous espace. Si ce nombre est supérieure à une certaine valeur, le processus e partitionnement est éclenché. Le euxième critère se base sur le nombre maximal e subivision. L algorithme général e la construction u KD-Tree est onné ans l annexe. Stratégies e subivision Plusieurs méthoes e partitionnent e l espace e onnées selon la structure KD-Tree existent. Dans ce paragraphe nous allons en étailler uniquement eux, ont érivent l ensemble es autres techniques : la méthoe stanar, et la ivision u point méian. Soit S l ensemble es N vecteurs à inexer avec la méthoe KD-Tree. On note C le nœu courant et R(C) le sous espace limitant ce nœu. R (S) énote le rectangle limite ans lequel se trouvent tous les vecteurs e S. Au ébut, C est la racine e l arbre, onc R ( C) = R( S) Définitions 1.On éfinit le rapport hauteur/largeur un rectangle (sous espace), qu on notera RHL, et qui est le quotient e la longueur e son plus gran côté sur celui e son plus petit côté..soit i une imension onnée 0 i <. On éfinit la iffusion e S le long e la imension i comme étant la ifférence entre la plus grane et la plus petite cooronnée suivant cette imension. 3.Une partition méiane e N nombres e S, est une partition e S en eux sous ensembles, l un avec N / éléments ont les valeurs sont plus granes que la méiane e S, et l autre avec les N / autres éléments ont les valeurs sont inférieures à la méiane e S...1 La ivision stanar Dans cette stratégie, la imension e ivision est celle qui correspon au maximum e iffusion e S et la valeur e ivision est la méiane es cooronnées e S suivant cette imension. Cette procéure ne tient pas compte e l aspect RHL es cellules résultantes. Un exemple e partitionnent avec la méthoe stanar est illustré ci-essus :

86 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels (a) Avant subivision (b) Après subivision Fig. 3. La subivision 'un espace e onnées par la méthoe stanar.. La ivision u point méian Cette stratégie ivise une cellule par un hyperplan orthogonal à son plus gran côté suivant le point méian e ce ernier. Un hyper cube e côté x est partitionné en eux hyper cubes e côté x / chacun. Bien éviement cette procéure est simple mais elle a l avantage e prouire es cellules aspect RHL borné. Cepenant, elle peut prouire es cellules triviales, ans le sens où tous les points se trouvent un même côté e l hyperplan e ivision. En conséquence, l arbre peut avoir une taille arbitrairement grane et peut même épasser N si les points sont très proches. Un exemple e partitionnent suivant cette méthoe est onnée par la figure 3.3. Finalement le KD-Tree permet une structuration spatiale e l espace à -imensions, il aopte une structure arborescente binaire permettant accélérer le traitement es onnées multiimensionnelles. Il a l avantage être plus ou moins précis ans la construction e la structure inex puisque les stratégies e partitionnent utilisées suivent la concentration es onnées selon les ifférentes zones e l espace, contrairement à KDB-Tree, comme nous allons le voir, qui ne pren pas en consiération la istribution es onnées ans l espace e onnées ans le processus u partitionnement. (a ) Avant subivision (b) Après subivision Fig. 3.3 Application e a stratégie e ivision u point méian à l ensemble e points e l exemple précéent 3 K-D-B-Tree et ses variantes K-D-B-Tree est une structure 'inex multiimensionnelle se basant sur le partitionnement e l'espace en es régions isjointes organisées ans une arborescence équilibrée. C est une structure qui écompose l espace multiimensionnel comme K-D-Tree et équilibre l arbre résultant comme B-Tree. Elle combine les propriétés e K-D-Tree et B-Tree [Bay 71] pour pouvoir manipuler les onnées multiimensionnelles ans une mémoire externe. Le nœu racine

87 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels e l'arbre correspon à l espace e onnées qui contient les escripteurs es images. Les nœus internes e l'arbre appelés " region pages " contiennent les pairs ( RR, ID) avec RR est la région élimitant l'ensemble e onnées et ID est un pointeur sur les feuilles/nœus internes. Les feuilles e l'arbre nommées "pages points" contiennent les vecteurs réels. Le nombre maximal e vecteurs pouvant être contenu ans chaque feuille est limité par une certaine taille e la feuille appelée capacité. La figure 3.4 représente la structure générale u KDB-Tree ans un espace e imension eux. La écomposition e l espace e onnées s effectue selon eux niveaux. Dans le premier niveau, les " region pages ", sont partitionnées suivant un hyperplan e subivision parallèle aux ifférents axes e l espace e onnées. Dans le euxième niveau, les "pages points" corresponant aux " region pages " intersectés avec l hyperplan e subivision sont également partitionnées. Le fractionnement une "page point" se prouit lors e l'insertion 'un nouveau vecteur ans une "page point" saturée (c.à.. le nombre e vecteurs e la "page point" est supérieur à la capacité). Dans ce cas, la "page point" est partitionnée en eux sous pages suivant un hyperplan e subivision perpeniculaire à un axe e cooronnée. La position u partitionnement est fixée arbitrairement et la imension est choisie cycliquement. La "page point" initiale est remplacée par les nouvelles "pages points" résultantes u partitionnement, et une nouvelle entrée est insérée ans la "pages points" racine relative à la nouvelle "page point". La propagation e la subivision "pages points" est ite upwar. Un exemple 'une écomposition 'une "page point" est illustré ans la figure 3.4. Racine Racine Elément e subivision a. Avant b. Après Fig.3.4. Partitionnement une page point Page point Page Région Fig.3.5. Structure 'un -D-B-Tree

88 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels Une "region pages" est partitionnée, si le nombre 'entrées ID ans cette page épasse la capacité e la région. Dans ce cas, le nombre 'entrées e cette région est subivisé en eux. L'hyperplan e subivision écompose la "region pages" en eux sous régions telle que l'union es sous régions résultantes constitue la région mère. Par la suite, toutes les régions ( RR, ID) u nœu interne ayant une intersection non nulle avec l'hyperplan e subivision sont alors partitionnées e la même manière. Ceci entraîne par conséquent, le partitionnement es pages points corresponantes. Donc la propagation e la subivision es "region pages" se propage u haut vers le bas, elle est ite ownwar (voir figure 3.6). La construction e la structure inex e KDB-Tree s effectue par insertion successive es vecteurs e la base e onnées. Notant que l orre insertion es vecteurs est important ans la construction e la structure u KDB-Tree, et un orre insertion ifférent prouit es structures inex ifférentes. Malheureusement il n y a aucune étue sur le choix e l orre insertion es vecteurs, généralement l insertion est effectuée e manière arbitraire. L algorithme e la construction e la structure inex est écrit ans l annexe. Le euxième niveau e partitionnement corresponant à celui es "region pages" constitue le principal inconvénient e la méthoe KDB-Tree. En effet, la structure e KDB-Tree vérifie eux propriétés : - absence e chevauchement : les régions prouites u partitionnement sont isjointes et leurs union constitue la région mère. - arbre équilibré :. les chemins séparant toutes les feuilles et la racine sont égaux. Pour préserver ses propriétés lors u partitionnement es nœus internes saturés e l arbre, KDB-Tree procèe à une restructuration e la totalité e l arbre entrainant le partitionnement, es nœus internes non saturés, leurs escenants et les feuilles corresponant, prouisant ainsi es régions vies où presque vies. Ceci augmente, le nombre e régions prouites lors u partitionnent et par conséquent le temps e la recherche, et le taux occupation e l espace mémoire. Notons que ces restructurations eviennent e plus en plus fréquentes lorsque la imension es onnées augmente. D un autre côté, la stratégie u partitionnent une page saturée ne épen pas e la istribution es onnées : la imension est choisie cycliquement et la position u partitionnent est fixée arbitrairement ce qui augment encore plus les chances avoir es partitionnements triviaux ans le sens où ils prouisent les régions vies ou peu enses. Elément e subivision Avant Après Fig. 3.6 écomposition une page région

89 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels Plusieurs méthoes ont été proposé ans la littérature pour contourner le problème u partitionnent es nœus internes e la structure KDB-Tree. Une es méthoes consiste à reprouire le même partitionnement es niveaux inférieurs (les feuilles) ans les niveaux supérieures, le partitionnement es nœus internes s effectue suivant l hyper plan e subivision avec lequel les feuilles sont partitionnées pour la première fois. Cette stratégie est appelées première ivision ou "FD-splitting". Cette stratégie permet éliminer le partitionnement es nœus internes e l arbre ainsi que la subivision "ownwar", elle garantit une occupation e l espace mémoire inférieur à 60% [Hen 89, See 90] Une euxième méthoe KDB HD -Tree plus récente a été proposé par Orlanic et al. [Orl 0], elle se base sur la méthoe "FD-splitting" pour éliminer la subivision "ownwar" e la structure inex e KDB-Tree, sa principale iée est e réuire la taille e la structure inex en éliminant les informations reonantes e l intérieure es nœus. En effet, ans l espace e grane imension, chaque région est partitionnée le long un petit ensemble e imensions. Les imensions restantes e chaque région s étenent sur toute la face e l espace initiale. Dans la méthoe KDB HD -Tree, ces imensions sont éliminées es vecteurs appartenant à la structure inex. Une troisième méthoe KDB KD -Tree [Yu 03] est proposée ans la même optique, elle propose éliminer l information reonante es nœus internes e l arbre par la moification e la structure es nœus internes en un arbre KD-Tree ou la représentation e toutes les entrées e l inex ans un nœu, evient une séquence e partitions qui contient les vecteurs et les pointeurs sur les nœus. Malheureusement, malgré les stratégies utilisées pour la suppression e l information reonantes aopté par la méthoe KDB HD -Tree et KDB KD -Tree, les problèmes e partitionnent inutiles e certaines régions ainsi que mauvaise répartition es vecteurs ans les régions sont toujours présents. Ces eux méthoes sont moins performantes e que KDB-Tree. Yi et al [Yi 05] ont proposé une autre technique pour éviter le partitionnement es nœus internes e la structure KDB-Tree. Dans cette méthoe, les sous espaces corresponant au régions se trouvant au même niveau e l arbre sont partitionnés selon une imension spécifiée. Le partitionnement se prouit lors e l insertion un vecteur ans une feuille saturée. Contrairement aux autres méthoes, au lieu e partitionner la feuille saturée, l espace non utilisé ans le nœu racine relatif à la feuille cible est exploité pour stocker la surcharge e onnées. Les nœus fils e la région mère relatif à la feuille cible sont également exploités pour isperser la surcharge e onnées e la région mère. Cette stratégie permet éviter le fractionnement es nœus internes e l arbre, elle garantit l existence un nombre minimal entrée ans chaque nœu. Les performances e cette méthoe améliorent ceux e la méthoe FD-splitting et KDB KD -Tree [Yi 05]. Par contre, le risque e prouire es régions vies ou presque vies est toujours présent notamment lorsque la imension e l espace e onnées augmente. Dans le paragraphe suivant, nous présentons la méthoe inexation basée sur l approche approximation : RA-Blocks, cette technique se base sur la méthoe KDB-Tree pour le partitionnent e l espace e onnées en es régions compactes et isjointes. 4 RA-Blocks Comme toutes les méthoes inexation multiimensionnelles, RA-Blocks est constituée e 3 étapes : Approximation ou coage au cours e laquelle les onnées sont compressées et coées par es chaines e bits, l inexation où les escripteurs e la base sont organisés ans une structure inex et finalement l étape recherche ans la quelle un parcours e la structure

90 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels inex est effectué pour calculer les plus proches voisins. Nous étaillons ces trois étapes ans la suite 4.1 Approximation RA-Blocks (Region Approximation Blocks) [Ter 0] est basée sur le filtrage es régions. Elle suit la même émarche u VA-File ans la quantification e l espace e grane imension. En effet, l espace e onnées est partitionné abor en es cellules hyper rectangles, chacune est représentée par une chaîne e bits. Puis, il est subivisé en es régions contigües et isjointes ayant la même capacité. Ces régions sont ensuite coées par eux chaînes e bits corresponant aux eux cellules en bas à gauche et en haut à roite e chaque région, formant ainsi le fichier approximations à gérer. On istingue eux ensembles e onnées : un fichier qui contient tous les vecteurs e la base e onnées et un autre e petite taille contenant les approximations coées en bits e chaque région. Un exemple e coage es régions ans un espace e imension eux est illustré ans la figure 3.7. Dans cet exemple, le nombre e bits par imension est fixé à 3, chaque imension est ivisée en 8 segments e même taille, on obtient ainsi 3 intervalles suivant chaque imension. Dans l exemple, on suppose que chaque région contient uniquement 5 vecteurs, c.à.. que le écoupage récursif une région en sous régions est réalisé tant que le nombre e vecteurs est supérieure à 5. Les lignes en pointillées élimitent les cellules et les lignes en gras élimitent les régions. Le partitionnement en régions se fait selon l algorithme KDB-Tree [Rob 81], l élément e subivision e chaque région correspon aux frontières es cellules. En effet, chaque imension est écomposée en 3 segments (3 bits par imension), et chaque cellule possèe un inice i selon chaque imension (ans l exemple i varie e 0 à 7), par conséquent les bornes e chaque région sont représentées par : x = i L / 8, y = i h / 8 où L et h représentent respectivement la largeur et la hauteur e l espace e onnées et i, l inice es cellules qui élimitent la région. Chaque région est approximée par le coage e la cellule e ébut et celle e fin. Par exemple on utilise ( , ) pour coer le ébut et la fin e la région qui contient les trèfles Approximation ébut fin ébut fin ébut fin Fig Exemple e coage es régions ans un espace e imension eux.

91 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels 4. Inexation L étape inexation ou structuration consiste à organiser les escripteurs afin que les procéures e recherche réponent le plus rapiement possible. Cette organisation se trauit généralement par une structuration es escripteurs en e "petits" ensembles et par l implémentation es stratégies e recherche capable e retourner un résultat en n examinant qu un "petit" nombre ensembles e vecteurs. La structuration e l espace e escription selon la méthoe RA-Blocks consiste ans un premier temps à quantifier l espace e onnées avec un pas e quantification fixé au préalable et ans un euxième temps à écouper l espace en régions, chacune étant approximée par eux chaines e bits. Ce écoupage s effectue suivant l algorithme e écoupage KDB-Tree que nous avons présenté ans le paragraphe 1.. Il est basé une part sur la grille e coage issue u processus e quantification et autre part sur l orre insertion es vecteurs e la base e onnées ans la structure inex u RA-Blocks. A l issu u partitionnement e l espace es escripteurs, un certain nombre e régions est obtenu ont l union constitue l espace e onnées e épart. Ces régions sont utilisées pour construire la structure inex u RA-Blocks. RA-Blocks a une structure inex ynamique, elle est composée e eux éléments principaux ; les "RA-Data" et les "Data-Pages". Les "RA-Data" interviennent ans l étape inexation alors que les "Data-Pages" sont utilisées pour stoker les onnées réelles. Une page région contient les approximations e la région qui corresponent en réalité à sa position réelle ans l espace e onnées, en plus un pointeur sur une page point contenant les vecteurs réels e cette région. Chaque page région correspon à une région ans l espace e onnées, elle est généralement stockée ans une page isque. Une page e onnées contient les vecteurs réels e la région corresponante. Un exemple illustratif e la structure inex u RA-Blocks est onné par la figure 3.8. En résumé, la structure inex u RA-Blocks est une structure à eux niveaux. Dans le premier niveau sont stockées les approximations es régions "region pages", ces ernières sont utilisées ans l étape e filtrage pour sélectionner les régions susceptibles e contenir les voisins les plus proches (régions caniates). Dans le euxième niveau sont stockés les onnées réelles "pages points" qui servent à calculer les voisins les plus proches u vecteur requête ans la phase accès aux onnées réelles. I pages N RA- Data RA- Data1 RA- Data. RA- DataN RA-Data N e onnées Page e onnées i Bit Maps (chaine e bits e ébut et e fin) Data-Page I pages N e vecteur ans la page Bit Maps ata1. DataM Fig Structure inex u RA-Blocks

92 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels 4.3 Recherche La recherche es k ppv est effectuée en eux phases. Dans la première ite e filtrage, les régions issues u écoupage e l espace e onnées sont parcourues séquentiellement, et les régions caniates sont sélectionnées suivant leurs istances minimales et maximales par rapport au vecteur requête. Lors e la euxième phase appelée étape accès aux vecteurs, les k ppv sont éterminés en calculant la istance réelle (Eucliienne) par rapport au vecteur requête. Etape e filtrage Pour calculer les k ppv, le fichier es approximations est parcouru entièrement. Les istances min et max par rapport au vecteur requête sont calculées (voir figure 3.9) et la liste es caniats LC est initialisée par les k / régions ayant les plus petites max par rapport au vecteur requête. Cette liste est triée par orre croissant e la istance max. Ensuite, Le fichier es approximations est parcouru : si une approximation est rencontrée telle que sa istance minimale min est inférieure à la plus grane istance maximale D max e la liste LC, la région corresponante est insérée ans LC en garant la liste triée. B A min (q,a) q max (q,b) Fig Les istances minimales et maximales une région par rapport à un vecteur requête Accès aux vecteurs réels Soit LR, la liste es résultats evant contenir les vecteurs les plus proches e la requête. LR est abor initialisée par les k premiers vecteurs es premières régions e LC. Cette liste est ensuite triée selon la istance réelle (Eucliienne) au vecteur requête. Ensuite, l algorithme e recherche parcours les régions retenues ans LC selon un orre croissant e leur min en calculant la istance réelle entre les vecteurs e chaque région et le vecteur requête. Supposons que Dmax est la istance réelle maximale trouvée. Si une région est rencontrée telle que sa istance minimale par rapport au vecteur requête est inférieure à D max, les vecteurs e cette région sont examinés séquentiellement. Notons que le coût e la séquentielle ans ce cas est faible puisqu elle est effectuée sur un ensemble e vecteurs au maximum égal à la capacité es régions. Ensuite, si la istance réelle qui sépare un vecteur e cette région et le vecteur requête est inférieure à D max, alors le vecteur est inséré ans LR en garant la liste triée, et le ernier vecteur e LR est supprimé. Par contre, si une région e LC est rencontrée telle que sa istance min est supérieure à D max alors l algorithme e recherche s arrête. L algorithme e recherche es k ppv est étaillé ans la figure Algorithm_e_recherhce_RA_Blocks ( LA : liste es approximations es régions e l'espace e onnées, NR : le nombre e régions ans LA, q : le vecteur requête) return LR : liste es k ppv u vecteur requête triée par la istance réelle par rapport à q. { Variables :

93 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels // k : constante qui représente le nombre es plus proches voisins // LC : liste es régions caniates // NC : nombre e régions caniates ans LC // min et max : les istances minimale et maximale qui séparent le vecteur q et la région courante // ata : liste es onnées réelles // Etape e filtrage 1: Initialiser LC par les k / régions ayant les plus petites max par rapport à q triée par orre croissant e et NC par k / max : Dmax MAX ( max, LC) // La plus grane max e LC 3 : Pour toutes les autres régions qui restent ans LA Faire { 4 : Soit i l inice e la région courante 5 : Si min ( LA[ i]) Dmax { 6 : Insérer LA [i] ans LC 7 : NC NC : Trier LC par orre croissant e min 9 :}// FinSi }//FinPour // Accès aux vecteurs 10 : Initialiser la liste LR par les k premiers vecteurs es régions e LC triée par orre croissant e leurs istances réelles par rapport à q 11 :Soit Dm la plus grane istance réelle trouvée ans LR 1 :Pour toutes les autres régions qui restent ans LC Faire { 13 : Soit i l inice e la région courante 14 : Si min ( LC[ i]) Dm alors arrêter 15 : Sinon 16 : Pour tous les vecteurs V j e la région LC[i] Faire { 17 : Si ist( V j, q) Dm { // ist est la istance réelle 18 : Insérer V j ans LR 19 : Supprimer le ernier vecteur e LR 0 : Dm MAX ( ist( V j, q), Dm ) // la plus grane istance réelle e LR } // FinSi }// FinPour }// Fin Pour }// Fin Fig L algorithme e recherche es k ppv u RA-Blocks 4.4 Synthèse RA-Blocks est une méthoe inexation et e recherche es k ppv basée sur l approche approximation es régions. Cette méthoe a été proposée pour combler l insuffisance es techniques conventionnelles et leur inefficacité ans les espaces e grane imension. Elle combine les avantages e l approche approximation globale en utilisant uniquement eux fichiers pour la gestion e l inex, un fichier es approximations et un fichier e onnées réelles, et les avantages e l approximation locale en utilisant les formes géométriques sous

94 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels forme e rectangles pour l approximation es onnées. Le principe e base e RA-Blocks est abor e quantifier l espace e onnées comme le VA-File, puis e partitionner l espace e onnées en un "petit" nombre e régions compactes et isjointes. Ensuite, parcourir un sous ensemble e onnées sélectionné ans la phase e filtrage par leur approximations et enfin accéer séquentiellement à l ensembles es vecteurs qui correspon aux régions sélectionnées ans la phase e filtrage. Contrairement au VA-File qui approxime chaque vecteur par la cellule qui le contient, le RA-Blocks quant à lui approxime les régions, où chaque région peut contenir plusieurs vecteurs. Ceci permet une part augmenter la capacité e stockage es onnées en mémoire et autre part e réuire le temps e parcours par rapport au VA-File. A la ifférence u VA-File, les performances u RA-Blocks épenent essentiellement e la capacité es régions et non pas u nombre e bits e coage. En effet, une grane capacité es régions permet e regrouper les vecteurs e la base ans un nombre réuits e régions, ceci entraine l exécution u parcours séquentiel sur un petit ensemble e vecteurs réuisant consiérablement le temps E/S et le temps e la recherche. En revanche, une petite valeur e la capacité es régions prouit un nombre important e celles-ci, les performances u RA- Blocks ans ce cas s approchent ou eviennent ientique (pour une capacité= 1) à celles u VA- File, i.e elles eviennent épenantes u nombre e bits e coage et e la taille u fichier es approximations. Par conséquent, la capacité es régions est un paramètre critique et ifficile à fixer, il est étroitement lié au processus u écoupage e l espace e onnées. De notre point e vue, une bonne méthoe e partitionnement evrait générer un "petit" ensemble e régions enses et compactes, ceci permettra une meilleure gestion e l espace mémoire alloué et un temps e parcours optimal. Par ailleurs, le partitionnement e l espace e onnées en régions par la méthoe RA-Blocks, s effectue suivant l algorithme e écoupage KDB-Tree, ceci constitue le principal inconvénient e la méthoe RA-Blocks. En effet, comme nous l avons éjà présenté, KDB-Tree prouit un certain nombre e régions vies où presque vies lors u partitionnent es nœus internes e l arbre pour préserver les propriétés e la structure alors que celle-ci n est pas exploitée ans le processus e la recherche. Ceci entraine une mauvaise gestion e l espace e onnées alloué ainsi qu une perte importante u temps e la recherche. Pour cela nous avons proposé une nouvelle méthoe inexation multiimensionnelle basée sur l approximation es régions RA + -Blocks. Cette méthoe apporte une amélioration consiérable au niveau e la phase e écoupage e l espace e onnées, elle permet une meilleure gestion e l espace mémoire et réuit le temps e recherche par rapport à la méthoe RA-Blocks. Cette méthoe est étaillée ans le paragraphe suivant. 5 RA + -Blocks Cette méthoe a été proposé [Dao 08] pour réponre aux principales limitations e la méthoe RA-Blocks, notamment les problèmes liés au écoupage e l espace e onnées. Notre méthoe RA + -Blocks repose sur l approximation es régions, elle suit la même émarche u RA-Blocks ans la quantification e l espace e onnées. En effet, chaque imension i est partitionnée en b i intervalles où chaque intervalle est coé sur b i bits. Ensuite, l espace e onnées est écomposé en régions compactes et isjointes e même capacité. Comme RA-Blocks, les régions obtenues sont approximées chacune par eux chaînes e bits formant ainsi le fichier approximations à gérer. RA + -Blocks se compose e eux étapes principales : une phase hors ligne e structuration e onnées ans laquelle l espace e onnées est partitionné en régions et les vecteurs e la base sont organisés et stockés ans les régions, et une autre phase en ligne interrogation (la

95 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels recherche) e la base. Les phases e quantification qui consiste à subiviser l espace e onnées en es cellules hyper rectangulaires ainsi que la phase interrogation e la base sont ientiques à celles u RA-Blocks, la principale ifférence entre les eux méthoes résie ans la phase e la structuration, c est pour cela seule cette étape est étaillée ans le paragraphe suivant. 5.1 Structuration es onnées La structuration e l espace e escription est une amélioration e la stratégie e structuration aoptée par la méthoe RA-Blocks. Dans ce paragraphe, nous revenons succinctement sur cette phase et nous onnons ses points faibles par rapport à la tâche e recherche envisagée. Nous présentons ensuite les améliorations et les moifications que nous apportons à cette phase. Enfin nous écrivons e façon étaillée notre algorithme e écoupage pour la formation es régions Retour sur la phase e structuration u RA-Blocks La phase e structuration es onnées est une étape qui s effectue hors ligne ont le but principal est organiser les vecteurs e la base en régions. Le nombre e régions ainsi que leurs compacités est basée une part sur la taille e la mémoire allouée à la construction e l inex et autre part sur la stratégie e l algorithme u écoupage. Ce ernier étant basé sur KDB- Tree, il présente trois limitations principales : * Le choix e la imension e partitionnement se fait inépenamment e la istribution es onnées, celui-ci s effectue une manière cyclique pour toutes les irections e l espace e onnées. Ce choix risque e provoquer le partitionnement es sous espaces corresponant aux régions selon les imensions contenant peu e concentration e onnées par rapport à autres imensions. * Le choix e la position u fractionnement correspon au premier point qui génère eux régions non saturées. Ce choix est également inépenant e la istribution es onnées, il risque e prouire es régions non équivalentes en nombre e vecteurs. * Le fractionnement es nœus internes e la structure arborescente u KDB-Tree, provoque le partitionnement un certain nombre e régions vies où presque vies (le nombre e vecteurs est inferieur à la capacité es régions). Ces trois limitations influent mutuellement la performance e la stratégie u partitionnement et iminuent l efficacité e la structure inex notamment en grane imension et au passage à l échelle. De notre point e vu, une bonne méthoe e partitionnement evrait prouire es régions vérifiant les propriétés suivantes : * Compactes et isjointes : Cette propriété permet e renre la phase e filtrage plus efficace et e réuire le nombre e vecteurs à parcourir lors e la recherche. * Le moins e chevauchement possibles : le chevauchement est un événement nuisible au processus u filtrage ainsi que la recherche, l absence u chevauchement entrainera un gain consiérable ans le temps e la recherche. *enses ( Un nombre e vecteurs > capacité/) :Il est important avoir es régions enses lors u processus e partitionnement e l espace e onnées. Si par exemple on obtient un gran nombre e régions peu enses lors u partitionnement, le processus e recherche evrait explorer un gran nombre e régions pour obtenir les plus proches voisins ce qui aura pour effet

96 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels augmenter le temps e la recherche. Le fait avoir es régions enses augmente les chances avoir les plus proches voisins ans la même région, et iminue onc le nombre e istances à calculer et par la suite le temps e la recherche, ce gain est autant plus important que le nombre e vecteurs et la imension e l espace e onnées sont grans. Pour cela, nous avons proposé une nouvelle stratégie e écoupage e l espace e onnées vérifiant les critères cités auparavant. Notre algorithme e écoupage est inspiré e l algorithme e écoupage KD-Tree pour le choix e la imension et e la position e partitionnement. Notre algorithme repose sur l amélioration es principales limitations e la méthoe KDB-Tree aoptée par RA-Blocks, notamment au niveau u partitionnement es nœus internes e la structure KDB-Tree. Les moifications ainsi que les améliorations que nous avons apportés sont étaillées ans le sous paragraphe suivant Moifications et améliorations apportées Les principales moifications et améliorations que nous avons apporté à la phase e partitionnement e l espace e onnées e la méthoe RA-Blocks concernent les trois problèmes cités précéemment à savoir, le choix e la imension e partitionnement, le choix e la position e partitionnement et le fractionnement es nœus internes e la structure e KDB-Tree. Elles sont résumées ans les trois points suivants : * Pour contrôler la taille es régions obtenues lors u partitionnent e l espace e onnées, nous avons choisi un critère e sélection e la imension u fractionnent se basant sur la istribution es onnées. En effet, la concentration es onnées suivant chaque imension permet e guier le processus e écoupage. Ainsi, les zones contenant peu e vecteurs seront moins partitionnées par rapport aux zones e l espace où il y a plus e concentration e vecteurs. Ce choix permettra e garantir l existence un nombre significatif e vecteurs ans les régions et par la suite évitera la création es régions triviales. * Nous avons opté pour l algorithme stanar e subivision e la méthoe KD-Tree pour le choix e la position u fractionnement. A la ifférence e la stratégie u partitionnement u KDB-Tree, qui choisit la position une manière arbitraire (le premier vecteur qui provoque le fractionnement), cette technique a l avantage e prouire à chaque partitionnent eux régions avec le même nombre e vecteurs ans chaque région, évitant ainsi le problème e la création es régions vies ou presque vie lors e la construction e la structure inex. * Contrairement à la majorité es techniques inexation multiimensionnelles notamment le RA-Blocks qui organise les régions ans une structure arborescente, nous avons utilisé une structure inexation linéaire. En effet, la structure arborescente exige certaines propriétés que nous avons présentées auparavant. Ces propriétés entrainent ans la plupart es cas es restructurations e la totalité e l arbre provocant ainsi le partitionnement es régions peu enses. Nous avons choisi e ce fait e remplacer la structure arborescente puisque celle-ci n est pas exploitée lors u processus e la recherche, par une structure inex à liste chainée. Cette structure nous permet e localiser les régions enses et par la suite, e réaliser un partitionnent local, et viser uniquement les régions qui nécessitent le partitionnent (les régions ont le nombre e vecteurs est supérieur à leur capacité).

97 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels L algorithme e écoupage e l espace e onnées Notre algorithme u partitionnent en régions est inspiré e la ivision stanar e l algorithme KD-Tree pour ce qui est e la recherche u côté susceptible être ivisé, iniquant l axe e cooronnées orthogonal à l hyperplan réalisant la ivision (imension e partitionnement), et u calcul e la valeur e subivision suivant cette imension. La écomposition une région saturée s'effectue suivant l'hyperplan e subivision iniquant la position à laquelle l hyperplan coupe l axe e cooronnées en passant par la valeur e subivision. Les choix e la imension et e la valeur e la subivision sont fixés e la manière suivante : -Dimension e subivision : la subivision s effectue suivant la imension posséant le maximum e iffusion e onnées, c.à.. la imension qui correspon à la plus grane ifférence es composantes es vecteurs. Cette conition garantit le partitionnement es zones e l espace ou il y a plus e concentration e vecteurs, elle permet ainsi la création es régions avec un nombre minimal e vecteurs. -Valeur e subivision : la valeur e subivision est la valeur e quantification la plus proche e la valeur méiane suivant la imension e subivision. Le choix e cette valeur pren explicitement en compte la istribution es onnées, il garantit l existence un nombre équivalent e vecteurs ans les régions prouites lors u fractionnement. D un autre côté, notre algorithme e écoupage repose sur le principe 'éliminer le partitionnement es nœus internes (subivision ownwar) e la structure K-D-B-Tree. Rappelons que l inconvénient majeur e celle-ci est le fait qu'elle prouit es restructurations importantes e la totalité e l'arbre pour préserver les propriétés e la structure K-D-B-Tree (équilibre, pas e chevauchement). Ces structurations provoquent souvent la création 'un très gran nombre e feuilles vies ou presque vies, ce qui ne peut garantir un taux optimal 'utilisation e l'espace alloué, et par la suite augmente le temps e recherche es k plus proches voisins. D où l'iée e base e notre méthoe qui est e partitionner uniquement les "pages points" saturées. Dans ce cas, seules les "pages points" non vies sont gérées par notre algorithme e écoupage. En effet, notre algorithme élimine le partitionnement es nœus internes e l arbre en transformant structure arborescente en une liste e régions. Notre structure est composée uniquement e eux niveaux. Le premier niveau correspon au nœus/nœus internes e la structure e KDB-Tree, il contient les régions représentées par leurs approximations ainsi qu un pointeur sur le niveau inférieur. Dans le euxième niveau sont stockées les onnées réelles e chaque région. Les eux niveaux sont stockés ans eux fichiers binaires. Notre structure est construite par insertion successive es vecteurs e la base e onnées. Lors e l insertion un vecteur ans une feuille saturée, celle-ci est subivisée en eux feuilles contenant le même nombre e vecteurs, les régions corresponant à la feuille saturée sont également partitionner e la même manière, ils sont par la suite remplacées par eux nouvelles régions (région gauche, région roite) ayant chacune un pointeur vers la nouvelle feuille. Notre structure permet 'une part 'éliminer les régions triviales (vies) et e prouire que es régions enses, et autre part elle garantit l existence es k ppv ans une même page isque, ce qui entraine par la suite la réuction u temps e la recherche. Notre algorithme e partitionnent e l espace e onnées est étaillé ans la figure Algorithme_ecoupage_RA + -Blocks (vecteur ata[ ] : les vecteurs réels e la e la base e onnées, entier N : la taille es vecteurs) retourne ListReg : liste es régions contenant le résultat e la subivision. { Variables :

98 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels //Pos : entier //Region Rg, R : les régions résultantes e la subivision 'une région mère 1. Initialiser ListReg par la région corresponant à l espace e onnées. Pour i allant e 1 à N Faire{.1. Pos= GetIRegion(ata [i]) // retourne l'inice e la région evant contenir le vecteur ata[i].. Soit Reg la région inice pos.3. Inserer(ata[i], Reg) // insérer ata[i] ans Reg.4. Si (saturer(reg)) { // le nombre e vecteurs e la région Reg>capacité; la région Reg est saturée.4.1. split(reg, Rg, R) // écomposer Reg en eux sous régions.4.. Si (nbreata(rg)!=0) et (nbreata(r)!=0) { // le nombre e vecteurs e R et Rg est non nul a. Remplacer(ListReg, Reg, Rg) // remplacer la région Reg par Rg ans ListReg b. InsererFin(listReg, R) // insérer la région R à la fin e ListReg. }// FinSi } // FinSi }// FinPour }// Fin Fig.3.11 L algorithme e écoupage e l espace e onnées u RA+-Blocks Racine Elément e subivision 1 3 Feuille Nœu interne a. Avant subivision b. Après subivision Fig. 3.1 Exemple e subivision es régions selon K-D-B-Tree Elément e subivision 1 3 Espace e onnées Notre structure 1 3 a. Avant subivision b. Après subivision Fig Exemple e subivision es régions selon notre méthoe

99 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels Les figures 3.1 et 3.13 présentent un exemple e écoupage 'un espace par la méthoe K- D-B-Tree et par notre méthoe où la capacité es régions est fixée à 3. Selon la méthoe K-D- B-Tree (fig.3.1), toutes les régions ayant une intersection avec l'élément e subivision sont partitionnées en eux sous régions, y compris celles qui ne sont pas saturées (région 3). Par la suite, les pages points résultantes sont peu enses et parfois vies (régions 3.1 et 3.). Par contre, selon notre méthoe (fig. 3.13), l'élément e subivision partitionne uniquement les régions saturées (région ) évitant ainsi le problème e la création es régions vies ou peu enses. 5. Structure inex La structure inex u RA + -Blocks est composée e eux niveaux. Le premier niveau correspon à un fichier e petite taille contenant les approximations coées en bits e chaque région e l espace e onnées (voir fig. 3.8). Le euxième niveau correspon à un fichier où sont stockés les vecteurs réels. Pour insérer un nouveau vecteur, on cherche la région evant le contenir en se basant sur les approximations. Si la région est saturée, c.à. le nombre e vecteurs épasse la capacité e cette région, alors elle sera écomposée en eux sous régions ayant pratiquement le même nombre e vecteurs. Dans ce cas, les approximations es eux nouvelles régions sont calculées et insérées ans le fichier es approximations, puis l approximation e la région écomposée est supprimée. La suppression un vecteur consiste à localiser la région le contenant. Si le nombre e vecteurs restant après la suppression est inférieur à la capacité/, alors une restructuration es régions est effectuée. 5.3 Interrogation e la base e onnées Tout comme la méthoe RA-Blocks, la recherche es k ppv ans RA + -Blocks est effectuée en eux phases. Dans la première (phase e filtrage), les régions sont parcourues séquentiellement, et les régions caniates sont sélectionnées en se basant sur leurs istances minimales et maximales par rapport au vecteur requête. Lors e la euxième phase (accès aux vecteurs), les k ppv sont éterminés en calculant la istance réelle es vecteurs relatif aux régions caniates par rapport au vecteur requête. L algorithme e recherche u RA + -Blocks est ientique à celui u RA-Blocks (voir figure 3.10). 6 Synthèse Dans ce chapitre, nous avons présenté une nouvelle méthoe inexation multiimensionnelle basée sur l approche approximation RA + -Blocks. Cette méthoe combine les propriétés e l algorithme e écoupage KD-Tree et l approximation es régions pour générer es approximations plus précises et compactes par rapport à celles générées par la méthoe RA- Blocks. Nous avons tout abor présenté les méthoes u écoupage e l espace e onnées KD-Tree, KDB-Tree et ses variantes. Le écoupage e l espace e onnées selon KD-Tree s effectue une manière récursif en prenant en consiération la istribution es onnées ans le choix e l hyper plan e partitionnement (la position et la imension u partitionnement). La méthoe KDB-Tree quan à elle choisie une manière arbitraire la position u partitionnement

100 Chapitre 3 : Méthoe proposée pour l inexation et la recherche ans les espaces multiimensionnels et une manière cyclique la imension e partitionnement. La istribution es onnées n est pas incluse ans le calcul e l hyper plan e partitionnement. KDB-Tree présente une limitation principale au niveau u processus e partitionnement, celui-ci prouit le fractionnement inutiles es nœus internes e l arbre générant ainsi un gran nombre e régions vies ou peu enses. Plusieurs méthoes ont été proposé pour résoure ces problèmes (KDB KD -Tree, FD-splitting, etc). Malheureusement la performance e certaines méthoes sont inférieures à celles u KDB- Tree, et autres souffrent es problèmes e la maléiction e la imension. Dans la euxième partie e ce travail, nous avons présenté la méthoe inexation multiimensionnelle RA- Blocks, et nous avons analysé l influence es problématiques liées à la phase e écoupage sur l inexation et la recherche. Sur la base e cette analyse, nous avons proposé une nouvelle méthoe RA + -Blocks une part pour réponre aux problèmes liés à la maléiction e la imension et au passage à l échelle exposés ans le chapitre. Et autre part, pour réponre aux principales limitations e la méthoe RA-Blocks notamment celles liées au processus u écoupage e l espace e onnées. Pour réponre à ces problèmes, nous avons proposé un algorithme e écoupage e l espace e onnées qui tient compte e la istribution es onnées ans le choix e la position e partitionnement ainsi que la imension par laquelle passe l hyper plan e partitionnement. Ces eux conitions nous permettent e garantir un nombre minimal ans les régions obtenues lors u partitionnement et éviter ainsi le problème e la création es régions vies ou peu enses. Le euxième principal problème ont souffre la phase e écoupage e l espace e onnées aoptée par la méthoe RA-Blocks, est la propagation u processus u fractionnement u haut vers le bas (subivision ownwar) qui prouit le fractionnement es nœus internes e l arbre. Pour réponre à cette problématique, nous avons remarqué que la structure arborescente n est pas exploitée ans le processus e la recherche. Donc, nous avons remplacé la structure arborescente par une structure linéaire à eux niveaux, où le premier niveau contient les régions et le euxième contient les vecteurs réelles corresponant aux régions. Le partitionnement avec cette structure est ciblé. Seules les régions enses sont partitionnées et remplacées par eux nouvelles régions contenant le même nombre e vecteurs. Notre structure garantit une bonne gestion e l espace mémoire alloué à la structure inex ainsi qu un meilleur taux occupation e l inex. Les régions prouites lors u partitionnement sont moins nombreuses et plus enses que celles prouites par la méthoe e partitionnement aoptée par RA-Blocks. Les résultats expérimentaux confirmeront nos résultats. Par ailleurs, bien que cette méthoe répon aux limitations e la méthoe RA-Blocks, RA + - Blocks reste inaaptée aux applications réelles ou la istribution es onnées est hétérogènes, la taille es onnées et très grane et la imension épasse Dans le chapitre suivant nous proposons une amélioration e la méthoe RA + -Blocks. La méthoe proposée pren explicitement en compte les ifférent problèmes liés à la recherche images par le contenu.

101 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks Chapitre 4 Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans es granes bases images basées sur le contenu : KRA + - Blocks Ce chapitre présente, une nouvelle technique pour la recherche et l inexation es bases e onnées multiméia aaptée aux moteurs e recherche images basés sur le contenu (SRIC). Contrairement à la plupart es inex multiimensionnels, cette technique a été proposée en prenant en compte explicitement les problèmes liés à la nature es onnées utilisées pour écrire les images. KRA + -Blocks est basée sur l approximation es régions et la réuction non linéaire e la imension par l approche noyau. Nous présenterons abor le M-Tree à noyau qui est une méthoe inexation métrique, mais qui utilise l approche noyau pour éfinir e nouvelles istances pour l inexation et la recherche. Nous présenterons également le KVA-File qui se base sur l approximation es onnées et qui s inspire u même principe que le M-Tree à noyau pour le calcul es istances à noyau. Enfin, nous présenterons notre nouvelle méthoe inexation KRA + -Blocks. 1 Introuction La recherche images fixes par le contenu ans les granes bases consiste à sélectionner les images les plus pertinentes à une requête onnée en se basant sur le contenu visuel es images. Ce contenu est généralement représenté par es escripteurs e bas niveau relatifs à la couleur, la texture et la forme. Pour réaliser une recherche rapie est efficace sur ces escripteurs, es techniques inexation multiimensionnelles sont nécessaires. Elles consistent à limiter la quantité es escripteurs à comparer avec le escripteur requête et e iminuer ainsi le nombre opérations e calcul e similarité à effectuer. Malheureusement, ces techniques peuvent s avérer inefficaces ans le omaine e la recherche basée sur le contenu. En effet, les escripteurs visuels (couleur, texture, forme) sont hétérogènes et leurs imension est grane.

102 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks La imension élevé es escripteurs pose e sérieux problèmes e performance aux méthoes inexation multiimensionnelles y compris celles basées sur l approximation. Les propriétés particulières es espaces e grane imension et le problème e la maléiction e la imension font que la qualité e ces inex iminuent lorsque la imension e l espace e onnées augmente. Ensuite, le caractère hétérogène es escripteurs fait que la majorité es techniques inexation multiimensionnelles sont inaaptées aux applications e la recherche images par le contenu car la plupart e ces méthoes sont conçues et valiées sur es onnées e istributions uniformes et sont liées à un espace Eucliien. De plus, ans autres méthoes, notamment RA + -Blocks, aucune sémantique particulière n est utilisée lors u groupement es onnées (ou lors u partitionnent e l espace e onnées). L évaluation e la plupart es méthoes inexation multiimensionnelles s effectue uniquement par rapport à l algorithme e la recherche es k ppv qui exploite les régions pour réuire la recherche à un sous ensemble e vecteurs. De même pour le choix e la capacité es éléments e l inex (rectangles), la seule contrainte qui guie le choix e ce paramètre est la réuction u temps e recherche. Partant e ce constat, nous nous sommes intéressés ans ce travail aux problèmes liés à l intégration e la méthoe inexation multiimensionnelle que nous avons proposée ans le chapitre, RA + -Blocks, ans un système e recherche images par le contenu. Le but e la méthoe proposée est optimiser les performances e la recherche par le contenu une part en évitant le parcours systématique e toutes les images e la base, et autre part, e réponre au problème e similarité qui se pose ans le cas e onnées hétérogènes, en proposant une nouvelle approche pour mesurer la similarité. Notre technique combine eux méthoes : l analyse en composantes principales "kernelisée" (ACPK) et l approche approximation es régions pour améliorer le temps e réponse es systèmes SRIC tout en garant une bonne qualité e la recherche. Dans notre approche, nous supposons que même si elles sont e nature hétérogène, les onnées peuvent être regroupées ans une même structure. Pour cela, une part la phase inexation permet à travers l approche noyau une bonne représentation et une bonne organisation es onnées, et autre part, les mécanismes e structuration et e recherche font appel à es istances appropriées et aaptées à la nature es onnées. Nous étaillons ans ce chapitre les ifférentes étapes e cette méthoe (la réuction e la imension, l inexation et la recherche par similarité) Techniques inexation par approche noyau Les méthoes à noyau forment une nouvelle famille algorithmes aux propriétés intéressantes pour la recherche information [Vap 99, Cri 00, Sch 0, Suy 0]. Leur simplicité est liée à leur efficacité, ce qui a fait e ces techniques un outil incontournable pour certains chercheurs et un sujet e recherche fonamental en apprentissage. Dans ce paragraphe, nous nous intéressons aux méthoes inexation basées sur l approche à noyau. Ces méthoes présentent la particularité e pouvoir introuire la notion apprentissage pour les inex multiimensionnels et e éfinir es istances aaptées au besoin e l utilisateur ans la phase e la recherche. Nous commençons par présenter les eux méthoes basées sur l approche noyau qui existent ans la littérature, le M-Tree à noyau et le KVA-File..1 M-Tree à noyau La plupart es techniques inexation multiimensionnelles ont pour objectif e réuire le temps e réponse penant la recherche sans nécessairement s intéresser aux istances utilisées

103 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks pour l inexation et la recherche. Cepenant, il existe es istances à noyau pour lesquelles la majorité e ces techniques ne peuvent être appliquées. Le M-Tree à noyau [Peng 03] est l une es premières méthoes inexation qui a été éveloppée pour supporter une manière ynamique les istances à noyau. Cette technique utilise l approche u noyau pour construire la structure inex. En effet, le M-Tree à noyau est une structure arborescente similaire au M- Tree et R-Tree, qui se base sur l inégalité triangulaire ainsi que sur es istances pre-calculées pour réuire le temps e réponses. Dans un M-Tree à noyau, les nœus internes e la structure arborescente sont composés un ensemble objets 3 e reirection (routing object), alors que les feuilles e l arbre contiennent les onnées réelles. Un objet e reirection est composé e l objet lui-même et un rayon e couverture (covering raius) qui est égal à la istance maximale entre l objet e reirection et l objet le plus lointain compris ans le sous-arbre corresponant à l objet e reirection. Au niveau e l arbre, à chaque objet est associée sa istance par rapport à son objet e reirection. Cette istance calculée lors e la construction u M-Tree permet appliquer l inégalité triangulaire lors e la recherche afin éviter certains calculs e istance inutiles et ainsi réuire le temps e réponse. Lors e la recherche effectuée à la suite une requête, l inégalité triangulaire est abor appliquée pour éliminer une partie es branches non pertinentes sans calculer la istance entre le vecteur requête et tous les objets stockés ans les nœus. Cela est possible car la istance entre chaque objet stocké ans le nœu et son objet e reirection est stockée ans l arbre et la istance entre le vecteur requête et l objet e reirection u nœu a éjà été calculée. La construction e la structure inex u M-Tree ans l espace à noyau se fait e la même manière que celle u M-Tree [Peng 03] en introuisant la istance Dist ( V1, V) = k( V1, V1 ) k( V1, V) + k( V, V) tels que V1 et V sont eux vecteurs e la base e onnées. La même istance est utilisée pour la recherche es k ppv. Le M-Tree à noyau a été étenu à l espace à noyau afin e réaliser l apprentissage es istances en utilisant le bouclage e pertinence. Cette méthoe a été particulièrement appliquée au cas u One-class SVM[Sch 01]. Cette ernière a pour but estimer le support qui inclut la plupart es éléments positifs e la base apprentissage, i.e. trouver une fonction positive ans une région qui englobe la plupart es onnées et négative ailleurs. Cette approche est équivalente à trouver la surface qui sépare les onnées positives et l origine pour un certain seuil τ (figure 4.1) : f ( p) = sign( w. Φ( p) τ ) tel que w. Φ ( p) τ représente l hyperplan séparateur optimal Si N est le nombre élément (appartenant à la classe positive)e la base apprentissage w 1 V i ( i = 1,..., N), le problème à maximiser est : min w, τ, center[ τ + i centeri ], tels que cst. N 3 Nous avons repris la terminologie utilisée ans [Cia 97]. Un objet est tout simplement un vecteur multiimensionnel appartenant à la base e onnées.

104 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks Hyperplan séparateur optimal Φ ( p) center i Vecteurs support y i = 1 y j = 1 w. Φ ( p ) τ Fig One-Class SVM Φ( Vi ) center w + centeri, centeri 0 pour tout i et où cst [0,1] contrôle le nombre es recherches pertinentes qui peuvent être incluses ans l hypersphère. En introuisant les multiplicateurs e Lagrange, on obtient comme solution au problème optimisation précéant : center * = α Φ( V ) (4.1) i 1 tels que i α i = 1 et 0 α i. Notons que le centre center * (Eq. 4.1) est une combinaison cst. N convexe es recherches pertinentes ans l espace à noyau. Les istances à noyau relatives à One-class SVM sont ainsi calculées comme suit : D( V, q) = k( q, q) α k( v, q) + α α k( v, v ) (4.) i i i Lors u processus u bouclage e pertinence utilisant les istances à noyau es One-class SVM, center * (Eq. 4.1) est initialisé par la projection u vecteur requête ans l espace à noyau Φ (q). Après chaque itération, center * est mis à jour ynamiquement par le bouclage e pertinence (Eq.4.1). Puisque Φ est une fonction non linéaire, nous avons α iφ( Vi ) Φ( αivi ). Ainsi, le critère e la recherche es k ppv evient Φ( q) α Φ( V ). Notons que pour le M-Tree à noyau, les istances utilisées pour la recherche et la construction e la structure inex sont les mêmes. Ceci constitue la principale limite e cette méthoe et es méthoes métriques en générale. En effet, pour les approches telles que One-class SVM, qui ne moifie pas la fonction noyau penant le processus u bouclage e pertinence, le M-Tree à noyau peut être appliqué efficacement. Par contre, si au cours u processus apprentissage le bouclage e pertinence moifie la fonction noyau, comme tel est le cas e l AQK (aaptive Quasiconformal kernel), la structure inex u M-Tree à noyau n est plus valie. Une telle moification suppose la reconstruction e la structure inex avec la nouvelle istance, or cette opération est très couteuse en terme e temps e calcul ce qui ren cette technique inapplicable. Le KVA-File a été proposé pour contourner ce problème. Son principe e base est écrit ans le paragraphe suivant. i i, j i i i j i i j

105 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks. KVA-File KVA-File (Kernel Vector Approximation File) [Dou 05] est une méthoe inexation constituée e eux étapes. Une étape e compression ans laquelle les onnées sont approximées par une chaine e bits et une étape e recherche es k ppv ans laquelle le fichier approximation est parcouru pour calculer les voisins les plus proches u vecteur requête. Nous verrons que ces eux étapes sont elles-mêmes composées e eux phases chacune. En fait, le principe e base u KVA-File repose sur la compression es onnées. niveaux e compressions sont utilisés pour générer le fichier compressé es approximations. Le premier niveau consiste abor à projeter les onnées initiales ans un espace e imension réuite par une application non linéaire Φ : χ F. p φ( p) Ensuite chaque vecteur, sera représenté par sa projection ans l espace e caractéristiques e imension réuite, plus l erreur associée à cette projection. Pour ce faire, Douglas et Jing Peng [Dou 05] utilisent une base orthonormée composée un certain nombre e vecteurs. Le nombre e vecteur e la base orthonormée est fixé à priori, et constitue la nouvelle imension e l espace e caractéristiques. La construction e la base orthogonale, les projections initiales es vecteurs ainsi que l erreur e projection associée à chaque vecteur sont calculées au moyen u procéé othogonalisation e Gram Schmit et l ACPK. L algorithme incrémentale orthogonalisation est écrit ans [Dou 05]. Les onnées ans l espace e projection sont ainsi exprimées en fonction es vecteurs e la base orthogonale en plus e l erreur arronie. Soit e i ( i = 0,..., 1) la base orthonormée e l espace projeté, p un point ans cet espace exprimé par [Dou 05] : 1 P = φ ( x p ) + α v t= 0 avec le nombre e vecteurs e la base. La istance entre eux vecteurs p et q ans l espace e projection est onnée par [Dou 05]: t 1 t t t ( Q, P) = φ ( xq) φ ( xq ) φ ( x p ) φ ( x p ) φ ( xq ) φ ( x p ) + ( αt βt ), (4.3) t 0 ist + = les α t et β t sont les composantes es vecteurs p et q ans l espace e projection. Le terme t φ ( x q ) φ ( xq ) représente le moule e l erreur e projection, onnée par : t t t φ ( xq ) φ ( xq ) = φ ( xq ) φ ( xq ) φ ( xq ) φ ( xq ) cosθ où θ est l angle entre les eux vecteurs p et q. Le euxième niveau e compression est similaire à celui u VA-File. Il consiste abor à partitionner l espace e caractéristiques en cellules hyper rectangulaires contenant le même nombre e onnées réelles, puis à coer en bits l ensemble es localisations es cellules obtenues. Le nombre e bits e coage est fixé à priori. En résumé, l étape approximation est représentée par eux phases, une phase ite e transposition e onnées réelles au cours e laquelle les onnées réelles sont projetées ans un espace e imension réuite, et une secone phase e compression, consistant à partitionner l espace e projection en cellules, puis a approximer chaque cellule par une chaîne e bits. L étape e recherche es plus proches voisins s effectue également en eux phases : abor le fichier es approximations est parcouru pour éliminer les cellules non pertinentes, c est la phase t

106 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks e filtrage. Cette phase se base sur les istances ifférentes cellules onnées par [Dou 05]: 1 min ( q, p) = G ( q, q) + G ( p, p) + G ( q, q) G t t ) t= 0 1 max ( q, p) = G ( q, q) + G ( p, p) G ( q, q) G ( p, p) + ( t βt ) t= 0 min et max entre le vecteur requête et les ( p, p) + ( α β (4.4) α (4.5) t avec G ( q, q) = Φ ( q) Φ ( q) représente le moule e l erreur e projection. Les cellules sélectionnées sont ensuite oronnées selon leur istance minimale, et es accès irects sont effectués au fichier e onnées selon les istances réelles (Eq.4.3) Pour optimiser la qualité e la recherche, KVA-File exploite les propriétés e l espace projeté (espace à noyau) afin apprenre, à partir es onnées, e nouvelles istances à noyau, notamment à l aie e mécanismes e bouclage e pertinence. Contrairement à la méthoe M- Tree, KVA-File peut être utilisée ans le care e l apprentissage avec es approches qui moifie le noyau au cours u bouclage e pertinence. En effet, ans [Dou 05] l auteur montre qu en utilisant uniquement les approximations es vecteurs ans l espace e projection, on peut facilement mettre en œuvre es approches apprentissage qui moifient une manière consécutive la fonction noyau. Particulièrement, la méthoe AQK (Aaptive Quasiconformal kernel) moifie le noyau au cours u bouclage e pertinence, cepenant la structure inex e KVA-File reste intacte et les istances minimales, maximales et réelles sont mises à jours en se basant uniquement sur le bouclage e pertinence et sur les approximations es vecteurs. Les performances u KVA-File, en terme e qualité, épenent essentiellement e la pertinence e la projection et es istances utilisées ans les étapes approximation et e recherche, alors que les performances en terme e temps e réponse épenent e la taille u fichier es approximations et u taux e filtrage. Concernant la qualité e la recherche, celle-ci va notablement se égraer si la projection es onnées initiales n est pas pertinente. En effet, ans KVA-File la projection non linéaire es onnées initiales ans un espace e imension réuite se fait au moyen e l algorithme orthogonalisation e Gram Schmit. Ce ernier, réalise une transposition e manière itérative, il est facile et rapie ans le cas un très gran nombre e vecteurs, en revanche, il présente es limitations au niveau e l erreur associée à chaque localisation. Cette erreur augmente au fur et à mesure que la imension e l espace es composantes augmente. Le procéé othogonalisation est non stable pour les granes imensions, cepenant il est plus pratique en terme e complexité et e temps e réponse lors u passage à l échelle. Le taux e filtrage quant à lui est lié aux règles e filtrage et à la taille u fichier es approximations, sachant que celui-ci épen u nombre e bits e coage et u nombre e vecteurs e la base orthogonale e l espace e projection. En effet, pour es valeurs importantes e ces paramètres, il sera généré une part une grille e coage fine et autre part un espace e projection e grane imension. Ce qui aura pour conséquence e créer un fichier approximation e taille importante et onc augmenter fortement le temps e réponse. En réalité, ces eux facteurs agissent e manière contraictoire sur la qualité e l approximation. Attribuer une grane valeur au nombre e bit e coage permet avoir es approximations précises, alors qu une grane valeur u nombre e vecteur e la base orthogonale permet e générer une approximation mois précise (plus e variance entraîne plus e bruit).

107 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks 3 KRA + -Blocks : structure inexation multiimensionnelle pour la recherche par le contenu KRA + -Blocks est basée sur l approximation es régions et la réuction non linéaire e la imension. De part sa conception, cette méthoe est très bien aaptée aux SRIC travaillant sur es bases e très granes tailles. Elle réuit la imension, inexe la base pour réuire les temps accès et mesure la similarité à l aie e istances prenant en compte la nature hétérogène es onnées et onc améliorant la qualité e la recherche. Enfin, elle supporte un mécanisme e bouclage e pertinence, ce qui permet inclure l utilisateur ans la boucle. Nous écrivons abor, le principe e base e l ACPK et nous montrons ses propriétés et son intérêt ans le care e la classification et la structuration es onnées. Nous présentons ensuite, le moèle e similarité aopté par cette méthoe, ensuite nous montrons comment l organisation es escripteurs es images en régions et l utilisation e la fonction noyau s intègrent ans le processus e l inexation et e la recherche et améliorent, comme nous le prévoyons, la qualité et le temps e la recherche. 3.1 Réuction e la imension Kernel PCA [Sch 98] ou ACP kernelisée (ou à noyau) est une méthoe non linéaire e la réuction e la imension. C est une généralisation e l ACP qui consière les relations non linéaires entre les onnées. Il suffit e remplacer chaque prouit scalaire < p, q > par un noyau k( p, q) ans l algorithme e l ACP. Le choix e k permettra alors e consiérer es prouits scalaires ans un espace e onnées possiblement non linéaire plutôt que ans l espace original observation. En effet, le calcul e l ACPK ne fait intervenir que es prouits scalaires entre les points (pour le calcul e la matrice e covariance) et ne consière jamais les cooronnées un point isolé. Si l on remplace le prouit scalaire par un noyau, on calcule onc les composantes principales ans l espace e caractéristiques H, et on peut ainsi accéer à es corrélations orre supérieur entre les variables. Si Φ ( p) est la représentation un vecteur p ans l espace e onnées, le noyau calcule le prouit e eux vecteurs ans l espace e onnées e imension réuite. k ( p, q) =< Φ( p), Φ( q) > Formellement, l ACPK peut s exprimer e la manière suivante : Etant onnée un ensemble e vecteurs S appartenant à un espace entrée χ L iée est e projeter l ensemble es vecteurs S ans un espace H, appelé espace à noyau, au moyen une application non linéaire φ, associée à un noyau k, telle que k ( p, q) =< Φ( p), Φ( q) >, p et q S, l ACPK calcule l ensemble es vecteurs propres e i, et leurs valeurs propres corresponantes λ i, en utilisant l équation : Cov. e i = λiei (4.6) Cov étant la matrice e covariance onnée par: 1 t Cov = Φ( p) Φ( p) (4.7) N p S Avec un noyau k, on peut utiliser l astuce u noyau pour calculer les prouits scalaires ans l espace transformé sans jamais avoir à faire la transformation explicitement :

108 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks t Φ ( p) Φ( q) = k( p, q) où N est le nombre e vecteurs e l ensemble S. Comme montré ans [Sch 98], le problème e l Eq. 4.6 peut être formulé e la manière suivante: KZi = λizi (4.8) tel que Z = z,..., z ) est un vecteur ont les composantes vérifient: i ( i, 1 i, N ei = Z i, rank( p) Φ( p) p S et K est une matrice symétrique éfinie par: k( p, q) K = p, q S (4.9) p Les Z i sont obtenus en résolvant l Eq.4.8. Les projections αi u vecteur p suivant la th i composante principale sont onnées par: p α = e Φ( p) = Z k( p, ) (4.10) i i, i, rank( q) q q S Le calcul e KACP se ramène à une iagonalisation e la matrice K i, j n Cet algorithme est valable pour es observations centrées Φ( p ) = 0 i = 1 i. Le centrage es onnées est facile à assurer ans l espace origine, beaucoup plus ifficile ans l espace H puisque l on ne peut pas calculer explicitement la moyenne es observations projetées ans cet espace. Il existe cepenant une solution à ce problème il s agit e calculer la matrice e Gram à la place e la matrice K i, j. La reformulation e l algorithme e l ACP à noyau en tenant explicitement en compte u terme e la moyenne est étaillée ans l annexe. Notons que le choix e la imension e l espace réuit ainsi que les paramètres e la fonction noyau est critique et oit être effectué a priori. Ceci constitue le principal inconvénient e cette méthoe. Malheureusement il n existe aucune méthoe universelle permettant e trouver la valeur optimale e la imension e l espace réuit ainsi que le paramètre u noyau. Notons qu il est toutefois possible e se servir e ces ifférents paramètres pour la classification ou la formation es classes ans le omaine e l inexation et e la recherche es k ppv comme nous allons le présenter ans le paragraphe suivant. 3. Propriétés e l ACPK Nous nous intéressons ans ce paragraphe à l intérêt e l ACPK ans le care e la classification et la structuration es onnées, l objectif est e monter que la imension e représentation es onnées et le rayon e la fonction noyau (gaussienne) peuvent moifier une manière consiérable la ispersion es onnées ans l espace e projection ainsi que la structure es onnées transposées. Nous commençons par montrer expérimentalement l influence u rayon e la gaussienne sur la istribution es onnées, ensuite nous montrons l existence un lien entre la imension e l espace e projection et le rayon e la gaussienne. Pour cela, nous avons pris trois ensembles e vecteurs appartenant à es classes ifférentes, chaque classe étant composée e 40 vecteurs e imension 10 chacun. Notant que la 3 ème classe est composée e eux sous classes ajacentes.

109 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks (a) (b) (c) () (e) (f) Fig. 4.. PCs for ifferent δ values. (a) Original ata. (b) PCA. (c) KPCA, = (e) KPCA, = 0. 5 = δ. (f) KPCA, δ 1 δ. () KPCA, = 0. 1 δ. Outre la réuction e la imension, l ACPK permet e séparer un ensemble e vecteurs en utilisant la proximité es vecteurs ans l espace, l objectif étant effectuer une séparation pour laquelle les vecteurs proches ans l espace se trouvent ans le même groupe. Dans notre exemple, une bonne méthoe e séparation e onnées aurait tenance à mettre les 3 classes e vecteurs ans 4 groupes ifférents (les premières classes, et les sous classe), alors que autres méthoes e classification non optimales ne seraient pas capables ientifier et isoler les eux sous classes ajacentes u 3 eme groupe e vecteurs. Pour illustrer l intérêt e l ACPK et le choix e ses paramètres ans le care e la classification, nous avons appliqué l ACP (l analyse en composante principale linéaire) ainsi que l ACPK sur l ensemble es 3 classes écrites précéemment et nous avons ensuite projeté les onnées sur les 3 premières composantes principales en utilisant ifférentes valeurs e δ. La figure (4..a) montre les onnées originales ans un espace e imension trois, la figure 4..b, représente les 3 premières composantes principales e l ACP, et les figures 4..c- 4..f représentent les trois composantes principales obtenues par l ACPK avec es rayons respectivement égaux à 0.01, 0.1, 0.5 et 1. D après les figures, on remarque que le rayon e la gaussienne δ agit sur la structure es onnées transposées ans l espace e représentation. Plus le rayon e la fonction gaussienne est

110 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks petit, plus l ACPK prouit une bonne séparation es onnées. En choisissant la valeur u rayon e la gaussienne, on choisit e manière implicite une transformation qui va moifier la structure es onnées ans l espace e représentation. L avantage potentiel e cette propriété ans la recherche images basée sur le contenu, particulièrement ans le cas ou la recherche images s effectue à travers un inex multiimensionnel, résie ans le fait avoir une certaine flexibilité ans la construction e la structure inex. En effet, les ifférentes projections es vecteurs permettent e prouire ifférentes istributions es onnées, générant ainsi es structures inex ifférentes avec les mêmes onnées initiales. Le choix u rayon e la gaussienne peut moifier e manière importante la structure inex ainsi que les résultats e la recherche. Il est onc possible e se servir e cette propriété e l ACPK pour mieux séparer les onnées avant l étape inexation. Prenons à présent le cas où le rayon e la fonction gaussienne est fixe et la imension e l espace e représentation est variable. Supposons que les vecteurs propres e l ACPK sont stockés par orre écroissant e leurs valeurs propres. Généralement, les premières valeurs propres, corresponant aux premiers vecteurs propres, contiennent la majorité e l information. En revanche, la quantité information contenue ans les premières composantes principales épen aussi u rayon e la gaussienne comme le montre le tableau 4.1. Pour une grane valeur u rayon, nous atteignons les 99% avec peu e imensions, alors que pour une petite valeur u rayon nous avons besoin une imension plus grane pour capter un maximum e variance. Ainsi, la imension e l espace e projection et le rayon e la gaussienne affectent largement la pertinence e la projection utilisée pour représenter les onnées ans l espace projeté. δ PC1 PC1 to PC PC1 to PC3 PC1 to PC4 PC1 to PC5 PC1 to PC6 0,01 0,11 0, 0,33 0,44 0,56 0,67 0,10 0,11 0, 0,33 0,44 0,56 0,67 0,50 0,3 0,40 0,53 0,63 0,7 0,8 1 0,57 0,73 0,8 0,87 0,91 0,95 0,85 0,9 0,95 0,97 0,98 0,99 3 0,93 0,96 0,98 0,99 0,99 0,99 Tableau 4.1. La variance cumulée ans les premières composantes principales en fonction e δ. Les zones en couleur grise corresponent à une variance cumulée supérieure ou égale à 98% Finalement, en peut conclure e ces expérimentations que l ACPK possèe es propriétés intéressantes qui peuvent être exploitées pour mieux gérer la istribution es onnées ans l espace e projection. De notre point e vu, les propriétés souhaitables pour qu une méthoe inexation puisse être utilisée efficacement ans ce contexte peuvent être résumées ans les points suivants Compacité : Il est important avoir es groupements e onnées très compacts qui se chevauchent le moins possible, afin accroître l efficacité e la méthoe e partitionnement et les règles e filtrage, et e confiner ainsi la recherche à un sous ensemble e vecteurs similaires. Bruit : Il est important e supprimer les onnées reonantes, autrement ces onnées seront associées à es groupements et prouiront es partitionnent inutiles, renant ainsi le processus u filtrage complètement inefficace L équilibre : L équilibre es groupements en nombre e vecteurs est une propriété importante qui peut affecter la performance u processus e recherche. Une grane variabilité u nombre

111 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks e vecteurs ans chaque groupement peut entrainer la lecture un nombre important e vecteurs e la base même si le taux e sélection es groupements ans la phase e filtrage est réuit. Espace e grane imension : les onnées manipulées ans le omaine e l inexation sont es vecteurs e grane imension. Par conséquent, il est important que la méthoe e séparation e onnées prenne explicitement en compte le facteur e la imension. Le choix es bons paramètres e l ACPK, permet e mouler ces propriétés e manière à obtenir la bonne projection es onnées ans l espace e projection. 3.3 Inexation L objectif e l étape inexation est e combiner l approche noyau avec une méthoe approximation e régions pour établir une représentation compacte est informative es ifférents escripteurs e la base images, et par conséquent, réuire le temps e parcours lors e la recherche. Le processus inexation u KRA + -Blocks est composé e eux niveaux e compression. Le premier niveau consiste à projeter les vecteurs multiimensionnels ans un espace e imension réuite par une fonction noyau, alors que le euxième consiste à regrouper les vecteurs projetés ans es régions compactes et isjointes. Par la suite, chaque région est coée par une chaine e bits formant une représentation compressée es onnées Pour calculer les approximations géométriques, les vecteurs escripteurs es images sont abor projetés ans un espace e imension réuite par une ACPK en utilisant un noyau Gaussien. L équation 4.9 sera utilisée pour calculer la base orthogonale e vecteurs propres nécessaire à une telle projection. Ainsi chaque vecteur p ans χ, correspon une projection Φ ( p) ans F, qui peut être exprimée par: p p Φ( p) = 1 α = e + α e (4.11), i i 0 i p ème avec α i la i composante u vecteur p ans H (Eq. 4.11) et e une composante orthogonale à la base es vecteurs propres e, représentant la irection e l erreur e projection, et ont la p T p magnitue ( α e ) ( α e ) est onnée par : ' λi α (4.1) p T p i= ( e ) ( α e ) = ' avec ' et respectivement la imension e l espace χ et F, et λ i les valeurs propres e KPCA. En se basant sur la représentation réuite es vecteurs, chaque imension i e l espace b e projection est partitionnée en i intervalles et où chaque intervalle est coé par b i bits. L espace e onnée est ensuite partitionné en régions suivant la même stratégie e partitionnement que celle utilisée par RA + -Blocks. Chaque région est ensuite coée par eux chaines e bits formant le fichier approximations es régions à gérer ans la phase e la recherche. La figure 4.3 représente un exemple approximation un ensemble e 6 vecteurs e imension eux selon la méthoe KRA + -Blocks. i= 0 λ i

112 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks x 3 x 4 x 6 x Φ x I x I x I 1 α α α 1 x 1 x x (b) (a) B (c) x 3 max + α x 3 x x 1 x x 5 α3 A Q α x 3 x 6 min Fig. 4.3 KRA+-Blocks approximations. (a) onnées originales. (b) les onnées projetées avec ACPK. (c) les bornes minimales et maximales 3.4 Mesure e similarité La recherche es contenus visuellement similaires est une étape primoriale ans les moteurs SRIC. De nombreux algorithmes regroupent les caractéristiques calculées sur une image ans un vecteur multiimensionnel appelés "escripteurs". Généralement, les escripteurs se présentent sous forme e vecteurs numériques e grane imension auxquels est associée une mesure e similarité (une istance). Cette mesure permet e quantifier la proximité entre escripteurs, et par conséquent, la similarité visuelle entre images. Parmi les techniques e similarité qui ont été introuites et popularisées par les supports à Vaste Marge (SVM) [Bos 9], certaines utilisent es fonctions noyaux [Sch 0]. Celles-ci offrent, comme nous l avons éjà vu, un care théorique qui permet, grâce à la théorie u «Kernel Trick», la transformation un espace e caractéristiques en injectant cet espace initial ans un espace e plus grane imension. Ce paragraphe repren la notion e la mesure e similarité par une approche noyau que nous allons ensuite appliquer à l inexation et la recherche par le contenu ans les bases e onnées hétérogènes. Avant e présenter l approche e similarité par fonction noyau, rappelons abor la notion u noyau. Définition 1 :

113 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks L ensemble e éfinition D f une fonction f ont l ensemble e épart χ et l ensemble arrivée H, est l ensemble es antécéents e f, i.e l ensemble es éléments e χ que f met en relation avec es éléments H ; c est onc l ensemble es éléments x e χ pour lesquels (x) D f = x χ / y H / y = f ( x) f existe: { } Définition : Soit R et S eux relations binaires sur χ et H respectivement et f : χ H une application e χ ans H. f est un morphisme e ( χ, R) ans ( H, S) si et seulement si : ( x, y) χ, x R y f ( x) S f ( y) Le noyau 'un morphisme est interprété comme une relation 'équivalence sur l'ensemble e éfinition (plus particulièrement, la relation qui relie les éléments qui ont la même image par le morphisme). Avec l approche noyau, on peut obtenir un care mathématique formel à partir uquel une mesure e similarité pour es onnées hétérogènes peut être établie et émontrée. Une mesure monomorphe unique peut être établie pour tous les types e onnées plutôt que avoir une mesure associée à chaque type. Cela permet optimiser le temps e recherche ans un espace multiimensionnel hétérogène Rappelons que l'approche e la similarité par fonction noyau consiste à utiliser un prouit scalaire comme fonction e similarité. Soit p et q les eux escripteurs corresponant à eux images I p et I q. La similarité entre I p et I q peut être exprimée par le prouit scalaire e p et q : s ( p, q) =< p, q > Supposons que nous ayons une injection φ : X Η k, qui a tout vecteur p fait corresponre un vecteur Φ ( p) ans un espace Hilbertien H k associé à un noyau k, telle que la fonction e similarité soit onnée par le prouit scalaire ans H k : sim ( p, q) =< Φ( p), Φ( q) >. Ce prouit scalaire sur les projections es vecteurs par une injection est une fonction noyau k ( p, q) sur X (théorème e Mercer [Hei 01]) : k : X X R p, q k( p, q) =< Φ( p), Φ( q) > Le noyau le plus utilisé ans la littérature est le noyau Gaussien : p q k( p, q) = e δ où δ est le paramètre e l échelle. Ce paramètre permet e éfinir une manière implicite l espace e projection à partir uquel on éuit la mesure e similarité. Généralement, une petite valeur e δ correspon à un espace e onnées riche ans le sens où les frontières entres les ifférentes classes e onnées sont bien séparées, tanis qu une grane valeur e δ correspon à un espace e onnées pauvre ans le sens où les onnées sont moins iscriminantes ans l espace projeté. La mesure e similarité en terme noyau peut être formalisée e la manière suivante : ist( Φ ( p), Φ( q)) = k( p, q) + k( p, q) k( p, q) (4.13) Sachant que les approximations es eux vecteurs p et q ans l espace transposé respectivement onnées par : Φ p = 1 p i α p = ei + α q q ( ) 0 e, Φ( q) = i 1 i = 0 α ei + α e. i L expression e la istance entre p et q ans H evient : k H k sont

114 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks T q p T q q T p p i q i p i i i q i q i p i p i e e e e e e e e e e q p ist ) ( ) ( ) ( ) ( ) ( ) ( )) ( ), ( ( = = = + + = + + = Φ Φ α α α α α α α α α α α α (4.14) Grâce à l approche noyau il est possible e éfinir une istance généralisée qui permet e prenre en compte ifférents types e escripteurs et e gérer les corrélations entre les attributs e ces vecteurs. Toute fois, bien que l iée e la similarité par une approche noyau soit simple, sa mise en œuvre reste ifficile. En effet, le nombre e composantes es vecteurs pour les projections ainsi que le paramètre e l échelle sont variables, ifficiles à fixer et critiques, puisque la précision e la recherche en épen. 3.5 Recherche L algorithme e recherche es ppv k utilise les approximations es régions issues e la phase e écoupage pour accroitre les performances e la recherche. Le principe e base consiste à utiliser les règles e filtrage qui, une part permettent éviter le parcours séquentiel inutile es approximations, et autre part arrêter la recherche ès que toutes les approximations es régions restant à parcourir ne sont pas pertinentes. La recherche est effectuée en eux phases. Dans la phase e filtrage les approximations es régions sont parcourues séquentiellement et les régions caniates sont sélectionnées. Lors e la euxième phase, ite accès, les ppv k sont éterminés en calculant les istances réelles entre les vecteurs es régions caniates et le vecteur requête. Notons que l algorithme e recherche es ppv k u KRA + -Blocks est similaire à celui u RA + - Blocks et RA-Blocks, la ifférence résiant ans le calcul es istances utilisées ans le processus u filtrage et la mesure e similarité. Etant onnée un vecteur requête, q et en se basant sur les équations 4.11 et 4.13, la istance entre ) ( p Φ et ) (q Φ ans l espace e projection est onnée par: T q p T q q T p p i q i p i i i q i q i p i p i e e e e e e e e e e q p ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( = = = + + = + + = Φ Φ α α α α α α α α α α α α (4.15) Afin e calculer la istance entre eux vecteurs p et q ans l espace e projection, H nous utilisons les cooronnées es vecteurs ans H (le premier terme ans l équation 4.15), en plus e l erreur e projection (le secon terme ans l équation 4.15). Ces eux éléments sont obtenus par l algorithme e l ACPK. Le seul terme inconnu ans l expression e la istance est T q p e e ) ( α α. Il est équivalent à θ α α α α cos ) ( ) ( T q q T p p e e e e, θ cos représentant l angle entre les eux vecteurs p et q ans l espace e projection. Les valeurs extrêmes e cette expression sont utilisées pour calculer les bornes maximales et minimales es ifférentes régions par rapport au vecteur requête. Ces bornes sont calculées en consiérant θ cos égal à 1 pour la borne supérieure et -1 pour la borne inférieure. Par conséquent, les bornes maximales min et minimales max sont estimées respectivement avec leurs valeurs maximales et minimales. Ces bornes ont pour expression: T B B T q q T B B T q q i B i q i e e e e e e e e B q ) ( ) ( ) ( ) ( ) ( ), ( 1 0 max = = α α α α α α α α α α (4.16) T A A T q q T A A T q q i A i q i e e e e e e e e A q ) ( ) ( ) ( ) ( ) ( ), ( 1 0 min = + + = α α α α α α α α α α (4.17)

115 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks B et A représentant respectivement les cellules en bas à gauche et en haut à roite e la région concernée (voir figure 4.3.c). Ces eux vecteurs s expriment en fonction e la base orthogonal "e" ans l espace projeté par : q B = α e 1 B B 1 A A 1 q i= 0 α i ei + α e, A = i= 0α i ei + α e, Φ( q) = i= 0 α i ei + Ainsi, le processus e recherche es k ppv sélectionne ans la phase e filtrage les régions pertinentes en utilisant les istances minimales (Eq.4.16) et maximales (Eq. 4.17) entre le vecteur requête et les ifférentes régions. Ces istances sont facilement calculables à partir es approximations es régions qui permettent e éuire les coins e chaque région. Les régions sélectionnées sont oronnées suivant max et min, puis es accès irects au fichier e onnées sont effectués pour sélectionner les k ppv en se basant sur la istance réelle (mesure e similarité) onnée par l équation Bouclage e pertinence En inexation images par le contenu, le bouclage e pertinence offre la possibilité à l utilisateur affiner sa requête. Cette phase, qui permet améliorer l aaptabilité u système aux besoins exprimés, peut être réalisée par un classifieur ont l algorithme apprentissage se base sur le marquage par l utilisateur es images similaires et/ou non similaires à l image requête. Les eux approches classiques utilisées ans les systèmes SRIC consistent à moifier en fonction u marquage e l utilisateur soit l image requête, soit la mesure e similarité. Dans notre approche, nous proposons la création un nouvel espace pour lequel la istance entre les vecteurs similaires est contractée et celle entre les vecteurs non similaires est étenue. Ceci peut être réalisé par la méthoe Aaptive Quasi-Conformal Kernel (AQK) [Hei 01]. Etant onnée eux vecteurs p an p ' relatifs à eux images I p et I p', l iée e AQK est e créer es fonctions noyaux successives à partir u moel initial en utilisant l équation suivante : ~ k ( p, p') = f ( p) f ( p') k( p, p') (4.18) où f ( p) est une fonction semi éfinie positive telle que Pr ( I p / I) f ( p) =, avec : P ( I / R) r p 1 P( I / I) = (( ni+ nr) rank) e r p ni Iq I p q δ 1 et Pr ( I p / R) = (( ni+ nr) ranke ) nr Iq R p q δ où R et I représentent respectivement l ensemble es images marquées pertinentes et non pertinentes par l utilisateur lors la phase u bouclage e pertinence, nr et ni sont respectivement le nombre images pertinentes et non pertinentes, et rank représente le rang e l image I q. En se basant sur les cooronnées es vecteurs ans l espace e projection et en utilisant l équation 4.15, on peut éuire les istances à noyau issues e AQK. La istance réelle entre eux vecteurs p et q est onnée par : ist AQK 1 q p ( p, q) = ( f ( q) α f ( p) α ) i = 0 i + f ( q) p f ( p) f ( q)( α e i q ( α e T q ) α e T q ) α e + f ( p) p ( α e T p ) α e (4.18)

116 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks Les istances minimales et maximales u vecteur requête q par rapport à une région sont onnées par les équations suivantes max ( q, B) = ( f ( q) α f ( B) α ) 1 i= 0 q i + f ( q) f ( B) α e ( α e ) q B i q + f ( q) α e ( α e ) T B q B q α e ( α e ) T T + f ( B) α e ( α e ) B B T (4.19) min ( q, A) = ( f ( q) α f ( A) α ) 1 i= 0 f ( q) f ( A) q i α e ( α e ) q q A i T + f ( q) α e ( α e ) A q α e ( α e ) A q T T + f ( A) α e ( α e ) A A T (4.0) Les noyaux générés à partir u noyau initial utilisent les informations fournies par l utilisateur lors e la phase u bouclage e pertinence pour créer e nouvelles istances à noyau. Celles-ci sont abor utilisées ans la phase e filtrage pour sélectionner les régions ayant le plus e chance e contenir es vecteurs pertinents pour la recherche et autres part pour mesurer la similarité entre le vecteur requête et les vecteurs es régions retenues lors e la phase e filtrage. 4 Synthèse Dans ce chapitre, nous avons présenté notre méthoe pour l inexation et la recherche par le contenu KRA + -Blocks basée sur l approche noyau. Pour commencer, nous avons passé en revue les eux méthoes qui existent ans la littérature basée sur l approche noyau M-Tree à noyau et KVA-File. Le M-Tree à noyau est une extension e la méthoe M-Tree ans un espace non linéaire à noyau, c est l une es premières méthoes éveloppées pour supporter les istances à noyau. Cette méthoe a été particulièrement appliquée au cas u One class SVM. Malheureusement, elle souffre es problèmes e la maléiction e la imension liés aux espaces e grane imension. De plus, le processus e la structuration est fortement lié à celui e la recherche. En effet, ces eux processus sont basés sur la même istance, ce qui fait que la méthoe M-Tree à noyau ne peut pas supporter les ifférentes techniques apprentissage qui moifient la istance au cours e la recherche. KVA-File a été spécialement conçu pour réponre à cet objectif. Cette méthoe se base sur l utilisation es approximations es vecteurs en se basant sur leurs cooronnées ans l espace non linéaire à noyau. Ces vecteurs sont ensuite coés et stockés ans un fichier approximation. Contrairement à la méthoe M-Tree à noyau, KVA-File permet utiliser les techniques apprentissage es istances pour améliorer la qualité e la recherche. En revanche, KVA-File se trouve confronté également aux problèmes liées à la maléiction e la imension, ces performances épenent fortement e la taille u fichier es approximations et u nombre e bits utilisé pour le coage es vecteurs. Si la taille u fichier es approximations est très grane, les performances u KVA-File se égraent consiérablement. Pour cela, nous avons proposé ans ce chapitre une nouvelle méthoe inexation multiimensionnelle basée sur l approche noyau KRA + -Blocks. Cette méthoe a été proposée une part pour combler l insuffisance es techniques inexation multiimensionnelle et leur inefficacité ans les espaces e granes imensions, et autre part pour surmonter les problèmes qui se posent lors e la manipulation es onnées e nature hétérogène, en particulier ans le cas es méthoes basées sur l approximation. En effet KRA + -Blocks, exploite les propriétés es méthoes basées sur l approximation et les techniques e la réuction e la imension pour faire face au problème e la maléiction e la imension et au passage à

117 Chapitre 4 : Nouvelle méthoe multiimensionnelle par approche noyau pour l inexation et la recherche ans les granes bases images basées sur le contenu : KRA+-Blocks l échelle. Notre méthoe permet améliorer la précision e la recherche à travers l utilisation une mesure e similarité basée sur les fonctions noyaux. En Hors ligne, cette méthoe utilise une technique non linéaire e la réuction e la imension qui permet une part e réuire la imension es vecteurs, et autre part e regrouper les onnées en paquets à travers le choix es paramètres optimaux e la fonction e projection. En ligne, lors e la recherche, notre méthoe utilise es istances basées sur la fonction choisie ans la phase hors ligne pour la projection. Le processus le filtrage est alors exécuté sur les régions en se basant sur les istances pour sélectionner les régions ayant le plus e chance e contenir les plus proches voisins. Ces régions sont représentées par les approximations es cooronnées es eux vecteurs élimitant la région ans l espace e imension réuite. Nous avons également proposé un mécanisme e bouclage e pertinence qui permet apprenre e nouvelles istances basées sur les fonctions noyau et tenant à réuire le fossé entre la escription es images et les attentes e l utilisateur. Contrairement à la méthoe M-Tree à noyau, notre méthoe permet e séparer la phase e la structuration es onnées e celle e la recherche. Les istances utilisées lors e la recherche peuvent facilement être moifiées et améliorées par le processus u bouclage e pertinence sans que la structure inex u KRA+- Blocks soit moifiée. Par ailleurs, tout comme le RA+-Blocks/RA-Blocks les performances e KRA + -Blocks en terme e temps e réponse épenent essentiellement e la capacité es régions et u taux e filtrage. Concernant la capacité es régions, si celle-ci est très petite (voisine e 1 par exemple), alors les performances u KRA + -Blocks eviennent similaires à celles u VA-File. D un autre côté, si la capacité est très grane, le nombre e régions evient petit, ce qui iminue le nombre e comparaisons lors e la phase e filtrage. En réalité la capacité es régions est un paramètre critique et ifficile à fixer, une grane valeur e ce paramètre réuit bien le temps e réponse par contre elle a tenance e regrouper les éléments non similaires ans les mêmes régions ce qui égrae notablement la qualité e la recherche, car certaines régions risquent e ne pas être retenues, bien qu elles contiennent es vecteurs pertinents. Le taux e filtrage est un bon paramètre pour estimer la performance e la méthoe KRA+- Blocks, il est lié, une part à l efficacité e l approximation qui épen essentiellement u nombre e bits e coage et e la istribution es onnées, et autre part aux règles e filtrages liées aux istances maximales et minimales utilisées pour la sélection es caniats. Enfin, à la ifférence u RA + -Blocks, la technique e coage e KRA + -Blocks est particulièrement aaptée aux onnées hétérogènes e istribution non uniforme. Le coage e la méthoe KRA + -Blocks proposée est effectué à eux niveaux : le premier procèe à la projection es vecteurs vers un nouvel espace e imension réuite à l aie une ACPK afin éliminer les éventuelles corrélations non linéaires entre les imensions es vecteurs et e réaliser une meilleure séparation es onnées. Ceci permet une part e réuire la imension es vecteurs, et autre part e moifier leurs istributions e manière à renre plus facile et plus efficace le processus e partitionnent en régions. Le secon niveau applique une technique e quantification et e compression similaire à RA + -Blocks afin effectuer le groupement es onnées en régions et e coer celles-ci.

118 Chapitre 5 : Expérimentations Chapitre 5 Expérimentations Le but e ce chapitre est évaluer nos eux approches pour l inexation et la recherche par le contenu images fixes proposées aux chapitres 3 et 4. Les évaluations concernent à la fois la qualité es résultats retournés à l utilisateur et le temps e réponse. Nous présentons abor les expérimentations relatives à la méthoe RA+-Blocks avant e étailler celles e KRA+-Blocks. 1 Evaluation es performances e RA + -Blocks Ce paragraphe écrit les évaluations e performance e la méthoe inexation multiimensionnelle RA + -Blocks. Ces évaluations concernent le temps e réponse, le nombre e régions obtenues lors u partitionnement e l espace e onnées et le taux e remplissage es régions. En ce qui concerne le temps e réponse, nous comparons notre méthoe avec la recherche séquentielle, VA-File, et RA-Blocks. Nous avons choisi ces méthoes car elles possèent un coût linéaire en fonction e la imension contrairement à la plupart es techniques inexation ont les performances se égraent exponentiellement lorsque la imension augmente [Web98][Ams01]. En ce qui concerne le nombre e régions obtenues lors u partitionnement e l espace e onnées et le taux e remplissage es régions, ces eux paramètres onnent une iée sur l efficacité e l inex en terme e gestion e l espace mémoire et compacité es régions formées. Dans la première expérimentation, nous avons comparé, le nombre e régions obtenues lors u partitionnement e l espace e onnées avec les eux méthoes RA-Blocks et RA + -Blocks en fonction e la imension e l espace et e la taille e la base e onnées, ans la euxième expérimentation, nous avons comparé le taux e remplissage es régions es eux méthoes RA-Blocks et RA + -Blocks et finalement ans la troisième expérimentation nous avons évalué et comparé le temps e réponse es quatre méthoes RA + - Blocks, RA-Blocks, VA-File et la recherche séquentielle. 1.1 Environnement expérimental Les structures inex utilisées ans nos tests sont implémentées en Visuel C++ version 8.0. L évaluation es performances est faite sur un orinateur XP e Microsoft Winows e.3ghz

119 Chapitre 5 : Expérimentations avec 1 Go RAM, et 160 Go e isque local. Deux paramètres sont utilisés pour mesurer les performances e RA + -Blocks, le temps exécution et le nombre e région obtenues lors u partitionnement e l espace e onnées. Les temps exécutions es algorithmes e recherches sont mesurés à l aie es fonctions igo() et istop() e la class Chrono. Le nombre e régions formées est calculé hors ligne après la phase u écoupage e l espace e onnées. 1. Description es onnées Les structures inexation multiimensionnelles sont évaluées sur eux bases e vecteurs multiimensionnels. La première est une base synthétique e vecteurs e imension 50, créée aléatoirement avec la fonction ran (). Les composantes e chaque vecteur sont es valeurs réelles uniformément istribuées sur l intervalle [0 0.01]. La secone est une base e escripteurs e imension 5 corresponant à la concaténation u escripteur couleurs ominante (couleurs ominantes, cohérence spatiale et le pourcentage e la couleur) e 5 composantes, e l histogramme couleur quantifiés es trois canaux couleur (Lab) sur 19 composantes, et u escripteur e forme ART sur 35 composantes. Ces escripteurs sont extraits à partir es images réelles. Les eux bases e onnées sont stockées en mémoire pour évaluer les performances es ifférentes structures en utilisant une moyenne e plusieurs requêtes. Les requêtes utilisées sont tirées aléatoirement es eux bases et l ensemble es requêtes est ientique pour chaque structure inexation. 1.3 Expérimentation 1 : Nombre e régions obtenues Les structures inex u RA-Blocks et RA+-Blocks sont construites en utilisant les eux bases e vecteurs écrites ans le paragraphe précéent. Pour ces expérimentations nous avons fixé le nombre es plus proches voisins à 5, le nombre e bits par imension à 8, la capacité es régions à 50 et la page isque à 16ko Influence e la imension Dans cette expérimentation, nous calculons le nombre e région obtenues par le partitionnement e l espace e onnées en utilisant la stratégie e partitionnent u RA + -Blocks et RA-Blocks en fonction e la imension. Pour cela, nous avons fixé le nombre e vecteurs à , alors que la imension a été tronquée pour mesurer le nombre e région obtenues en fonction e ifférentes imensions. Les expérimentations menées sur les onnées uniformes et réelles montrent que le nombre e régions obtenues lors u partitionnement e l espace e onnées par la méthoe RA-Blocks est plus gran que celui obtenu en utilisant notre stratégie e écoupage. Ceci signifie que les régions obtenues par notre méthoe sont plus compactes et enses en comparaison avec celles obtenues par la méthoe RA-Blocks. Rappelons que notre stratégie e partitionnement se base sur l algorithme KD-Tree, ou le choix e la imension u écoupage est basé sur la istribution e onnées ans l espace selon chaque imension alors que le choix e la position e partitionnement est effectué e façon à garantir un nombre équivalent e vecteurs ans les régions formées. A la ifférence es méthoes conventionnelles inexation multiimensionnelles ou le nombre e partitions croit exponentiellement en fonction e la

120 Chapitre 5 : Expérimentations imension, le nombre e régions obtenues par notre stratégie e écoupage croit plus lentement qu une fonction exponentielle. Cela vient u fait que l hyperplan e partitionnement subivise uniquement les régions contenant un nombre e vecteurs supérieur à la capacité alors que ans la méthoe RA-Blocks l hyperplan e partitionnement subivise toutes les régions ayant une intersection non nul avec l hyperplan e partitionnement pour préserver les propriétés e la structure. De ce fait, le nombre e régions formées croit rapiement en fonction e la imension en comparaison avec notre méthoe. Remarquons qu avec notre stratégie u écoupage, à partir une certaine imension (par exemple 0 ans le cas es onnées uniformes et 30 ans le cas es onnées réelles), le nombre e régions obtenues se stabilise. Ceci peut être expliqué par le fait qu à partir une certaine imension, l hyperplan e partitionnement passe par les frontières entre cellules, ce phénomène est appelé phénomène e saturation. Dans ce cas e figure nous obtenons es régions avec un nombre e vecteurs supérieure à la capacité et pour lesquelles le partitionnement en eux sous régions n est plus possible. Ce phénomène se prouit uniquement en grane imension, particulièrement pour cette stratégie e partitionnement. Il est équivalent au phénomène e l espace vie qui se prouit aussi en grane imension suite au écoupage récursif e l espace e onnées. Il se prouit également ans le cas u RA-Blocks où le nombre e région croit rapiement en fonction e la imension RA-Blocks RA+-Blocks Régions obtenues imension (a) onnées réelles Régions obtenues RA-Blocks RA+-Blocks Dim ens ion (b) onnées uniforme Fig.5.1 Le nombre e régions obtenues en fonction e la imension (a) pour es onnées réelles (b) et uniformes

121 Chapitre 5 : Expérimentations 1.3. Influence u nombre e vecteurs Dans cette expérimentation, nous évaluons le nombre e régions obtenues par le partitionnement e l espace e onnées en utilisant la stratégie u RA + -Blocks et RA-Blocks en fonction u nombre e vecteurs e la base e onnées. Pour cela, nous avons fixé la imension es escripteurs à 1 et nous avons pris plusieurs ensembles e escripteurs e chaque base (réelle et uniforme). Les figures 5. (a) et 5. (b) représentent nombre e régions obtenues u partitionnement e l espace e onnées en fonction u nombre e vecteurs respectivement pour la base e onnées réelle et uniforme. 100 Régions obtenues RA-Blocks RA+-Blocks Nombre e escripteurs (a) onnées réelles Régions obtenues RA_blocks RA+-Blocks Nombre e escripteurs (b) onnées uniformes Fig.5. Nombre e régions obtenues en fonction e la taille e la base e onnées Nous remarquons que le nombre e régions obtenues lors u partitionnement e l espace e onnées avec la méthoe RA-Blocks croit plus rapiement en fonction u nombre e vecteurs par rapport à celui obtenu par notre stratégie e partitionnement. Ceci est û, comme nous l avons éjà expliqué plus haut, à notre stratégie e écoupage qui permet éviter la création es régions vies ou presque vie en partitionnement uniquement les régions saturées et en remplaçant la structure arborescente par une structure linéaire. Le fait avoir un gran nombre

122 Chapitre 5 : Expérimentations e région augmente la taille e l inex et iminue la capacité e stockage et par conséquent iminue les performances e la structure inex. Par conséquent, notre stratégie e écoupage est plus aaptée aux onnées multiimensionnelles e taille importantes en comparaison avec la méthoe RA-Blocks. 1.4 Expérimentation : Taux e remplissage Cette expérimentation présente une comparaison entre la méthoe RA-Blocks et RA + -Blocks en terme e taux e remplissage es régions sur les eux bases e escripteurs (la base réelle et uniforme). Le taux e remplissage est éfini comme étant le rapport entre le nombre e vecteurs ans la base e onnées et la capacité totale e la structure inex, c.à. la capacité totale es régions obtenues lors u partitionnement e l espace e onnées. Ce paramètre est un bon estimateur e performance u fait que la performance es structures inex multiimensionnelles épen largement e leur capacité e supporter le problème u passage à l échelle es onnées û au gran volume e onnées. En effet une grane valeur e ce paramètre (100%) garantit une exploitation optimale es pages isques associées aux régions et iminue par conséquent le nombre e istances à calculer lors u processus e la recherche et par la suite le temps e réponse. La figure 5.3 représente la capacité e stockage (le taux e remplissage) es eux méthoes RA-Blocks et RA + -Blocks, en fixant le nombre e vecteurs à , la imension à 16, la capacité es régions à 50 et le nombre es k ppv à 5. Nous remarquons après ces expérimentations que le taux e remplissage e notre méthoe est plus gran que celui u RA- Blocks par un facteur e 5. Notre méthoe e écoupage prouit relativement peu e régions et celles-ci sont majoritairement enses alors que la stratégie u écoupage u RA-Blocks prouit un gran nombre e régions vies ou presque vie. La capacité e stockage e notre structure est plus intéressante que celle u RA-Blocks, c.à. pour la même taille e la base e onnées notre structure nécessitera une taille mémoire 5 fois plus petite que celle exigée si on inex les onnées avec la méthoe RA-Blocks. 1, 1 0,8 Filling rate 0,6 0,4 RA+-Blocks RA-Blocks 0, 0 Real ata, 1 Ranom ata, Fig.5.3 La capacité e stockage u RA-Blocks et RA+-Blocks

123 Chapitre 5 : Expérimentations 1.5 Expérimentation 3 : Temps e réponse Ces expériences montrent l influence e la imension e l espace e onnées et la taille e la base sur le temps e réponse. Nous comparons ans ces tests le temps e réponse e notre méthoe par rapport à VA-File, la recherche séquentielle et le RA-Blocks. Pour la première expérimentation nous avons fixé la taille e la base e onnées à et nous faisons varier la imension e à 00. Dans la euxième expérimentation, la imension e l espace e onnées est fixée à 1 et la taille e la base e onnées varie e 100 à Influence e la imension D après la figure 5.4, on remarque que les temps e réponse e la recherche séquentielle, e VA-File et e RA-Blocks croissent linéairement en fonction e la imension. Notons que la croissance u temps e réponse e la recherche séquentielle en fonction e la imension est plus rapie que pour le VA-File et celle u temps e réponse u VA-File est également plus rapie que pour le RA-Blocks. Quant au temps e réponse u RA + -Blocks, il croit plus lentement par rapport aux autres méthoes. A titre exemple la recherche e 5 plus proches voisins ans la base e vecteurs réels e imension 15 s effectue en 0s avec une recherche séquentielle, 15s avec le VA-File, s avec le RA-Block et quelques ms avec le RA + -Blocks. Le gain e temps e réponse e notre méthoe evient e plus en plus intéressant en grane imension. Pour e faibles imensions (inférieures à 10 pour les eux bases e vecteurs) les temps e réponse es 4 méthoes sont quasiment ientiques. En grane imension, et comme nous l avons éjà présenté, le nombre e régions obtenues par notre méthoe est inférieur à celui obtenu avec la méthoe RA-Blocks. Ceci a une influence irecte sur le temps e calcul es istances minimales et maximales par rapport au vecteur requête lors e la phase e filtrage. D un autre côté, le nombre e régions parcourues et explorées lors e la phase accès est également plus faible, réuisant ainsi le nombre e comparaison et par la suite le temps e la recherche. Concernant le VA-File, il est évient que les temps e réponse e RA-Blocks et e RA+-Blocks soient meilleurs e par la stratégie e structuration aoptée par chaque méthoes. En effet, étant onné que le VA-File approxime les vecteurs par es cellules, ce qui est une amélioration e la recherche séquentielle, le temps e la recherche est celui u parcours e tout le fichier es approximations associées aux cellules contenant les vecteurs alors que ans le cas u RA- Blocks et RA + -Blocks le temps e la recherche est réuit à celui u parcours et l exploration es régions. Pour montrer la ifférence en temps e réponse entre RA-Blocks et RA+-Blocks, nous avons présenté sur es figures séparées le temps e la recherche sur les eux bases images précéentes. Les résultats sont montrés sur la figure 5.5

124 Chapitre 5 : Expérimentations Database size CPU times (ms) séquentielle VA-File RA-Blocks RA+ Blocks Dimensions (a) onnées réelles Database size CPU Times (ms) sequential VA-FILE RA-Blocks RA+ Blocks Dimensions (b) onnées uniformes Fig.5.4. Temps e réponse en fonction e la imension Temps CPU (ms) RA-Blocks RA+-Blocks Dimensions CPU Time (ms) RA-Blocks RA+ Blocks Number of imensions Dimensions (a) onnées réelles (b) onnées uniformes Fig.5.5. Temps e réponse en fonction e la imension

125 Chapitre 5 : Expérimentations 1.5. Influence u nombre e vecteurs Dans ces tests, nous évaluons le temps e réponse e notre méthoe par rapport à la recherche séquentielle, VA-File et RA-Blocks lors u passage à l échelle. Nous remarquons comme précéemment que le temps e réponse e la recherche séquentielle croit plus rapiement que celui u VA-File, RA-Blocks et RA + -Blocks en fonction u nombre e vecteurs e la base onnées, et que les performances u RA + -Blocks épassent celles u RA-Blocks et VA-File. De nouveau notre méthoe présente e bonnes performances en terme e temps e réponse au passage à l échelle par rapport aux autres méthoes. Le gain en temps e réponse evient e plus en plus intéressant lorsque le nombre e vecteurs croit. = CPU Times (ms) Séquentielle VA-File RA-Blocks RA+ Blocks Database size (a) onnées réelles = CPU Times (ms) Database size Séquentielle VA-File RA-Blocks RA+ Blocks (b) onnées uniformes Fig. 5.6 Temps e réponse en fonction e la taille e la base e onnées Rappelons que la construction e la structure inex es ifférentes méthoes inexation se fait par insertions successives es vecteurs e la base e onnées. Lorsque la taille e la base e onnées augmente, la construction prouit le partitionnent es régions enses ans le cas u RA + -Blocks et es régions enses et parfois peu ense où vies ans le cas e la méthoe RA- Blocks. Comme nous l avons éjà vu ans les expérimentations précéentes, le nombre e régions augmente rapiement en fonction u nombre e vecteurs avec la méthoe RA-Blocks.

126 Chapitre 5 : Expérimentations Le nombre e régions obtenues avec la méthoe RA + -Blocks par contre croit lentement en fonction u nombre e vecteurs e la base et se stabilise à partir une certaine taille. Le paramètre a une influence irecte sur le temps e réponse. En effet, le temps e la recherche est équivalent à celui u parcours es régions (ans le cas u RA-Blocks et RA+-Blocks) / es vecteurs (ans le cas u VA-File), plus le temps accès. La structure inex proposée réuit le temps e la recherche par rapport aux autres méthoes en optimisant la phase u écoupage et la création es régions. Cette structure est bien aaptée aux bases e onnées e grane taille. Pour montrer la ifférence en temps e réponse entre RA-Blocks et RA + -Blocks, nous avons présenté sur es figures séparées le temps e la recherche sur les eux bases images précéentes en fonction e la taille e la base e onnées. Les résultats sont montrés sur la figure 5.7. Ces résultats montrent que le temps e réponse e la méthoe RA+-Blocks est inferieur à celui u RA-Blocks, le gain en temps e réponse evient e plus en plus intéressant avec un gran nombre e vecteurs. Par exemple, avec la base e onnées aléatoires, on obtient un temps e réponse pour le RA-Blocks qui est quatre fois plus gran que celui e RA+-Blocks, pour un nombre e vecteur e temps CPU (ms) RA-Blocks RA+-Blocks CPU Time (ms) RA-Blocks RA+ Blocks Nombre e escripteurs (a) onnées réelles Nombre e escripteurs Database size (b) onnées uniformes Fig. 5.7 Temps e réponse en fonction e la taille e la base e onnées Evaluation es performances u KRA + -Blocks Après avoir présenté l environnement expérimental et écrit nos onnées, nous nous intéressons ans un premier temps, à l étue es paramètres u noyau à savoir la imension e l espace e projection et le paramètre e l échelle. Nous évaluons ensuite la qualité e la recherche e notre approche sur es bases e onnées réelles. Ensuite, nous montrons l intérêt e l utilisation es fonctions noyaux ans l apprentissage et ans la combinaison e escripteurs hétérogènes. Nous évaluons enfin les performances e KRA+-Blocks en terme e temps e réponse lorsque nous traitons es vecteurs e grane taille et lors u passage à l échelle.

127 Chapitre 5 : Expérimentations.1 Environnement expérimental Les algorithmes inexation et e recherche sont implémentés en visuel C++ (version 8.0) sur une machine sous Winows, isposant un processeur e.3 Ghz, une mémoire centrale e Go et un isque local e 50Go. Les temps exécutions es algorithmes e recherches sont mesurés à l aie es fonctions igo() et istop() e la class Chronoi. Par ailleurs, pour mesurer la qualité e la recherche, nous avons utilisé le rappel et la précision ont la éfinition est rappelée ci-après. Q Q Rappel = 100, Pr écision = 100 P R où P est le nombre e toutes les images e la base e onnée pertinentes à la requête, Q est le nombre es images pertinentes retournées par le système et R est le nombre totale es images recherchées. Le rappel éfinit onc la proportion images pertinentes et effectivement retournées en réponse à une requête soumise au système alors que la précision est la proportion images retournées par le système et pertinentes pour la requête consiérée. Description es onnées Pour tester notre méthoe, nous avons utilisé quatre bases e onnées. La première est composée e 700 escripteurs e imension 5. Ces escripteurs sont calculés à partir e la base images COIL-100 e l université e Columbia [Cou], ils corresponent à la concaténation u escripteur "couleur ominante" sur 5 valeurs (5couleurs ominantes, leurs cohérences spatiales et leurs pourcentages e couleur), l histogramme couleur es trois composantes (Lab) quantifié sur 19 valeurs (3 x 64), et le escripteur e forme ART [Kim 99] sur 35 valeurs. Cette base est composée e 100 classes e 7 images chacune et chaque classe est constituée un objet auquel sont appliquées es rotations successives e 5 egrés. Un exemple e cette base est illustré sur la figure 5.8. (a) (b) Fig. 5.8 Un exemple (a) images e la base COIL-100 (b) classes e la base images La euxième base est une extension e la base COIL-100 composée e escripteurs générés e manière calculatoire à partir es escripteurs initiaux, issus e la base COIL-100, e façon à ce qu ils appartiennent aux mêmes classes que celles e la base origine. Au final, cette base est toujours composée e 100 classes, chacune ayant un carinal e 400 images (ou

128 Chapitre 5 : Expérimentations escripteurs). Nous avons eu recours à ce procéé car nous ne isposions pas un ensemble images fixes e cette taille, et pour lequel les classes sont éjà labélisées. Ces eux bases images (COIL-100 et COIL-100 étenue) serviront avantage à évaluer la performance e notre méthoe inexation et e recherche en terme e qualité e la recherche, et onc e pertinence es réponses retournées. La troisième base est une base e escripteurs e imension 5 générés selon une istribution uniforme sur l intervalle [0 1] avec une fonction ran(). Cette base est utilisée pour comparer et évaluer la performance e ifférentes méthoes en terme temps e réponse. La ernière base est une base e escripteurs e imension 60 créés aléatoirement avec une fonction ran() également istribuée sur l intervalle [0 1]. Cette base a été conçue pour comparer notre méthoe aux autres techniques qui existent ans la littérature et qui utilisent ces mêmes paramètres e taille et e imension. Nous utilisons les notations suivantes ans la suite : BD1 la base COIL-100 e 700 images/escripteurs e imension 5. BD la base COIL-100 étenue e escripteurs e imension 5. BD3 la base e onnées aléatoires e vecteurs e imension 50. BD4 la base e onnées aléatoires e vecteurs e imension 60. Notons que les expérimentations reportées ans ce chapitre ne mesurent en aucune manière la capacité e reconnaissance es escripteurs, bien que ans le cas e BD1.et BD, les escripteurs choisis sont bien aaptés à la nature es images contenues ans ces bases. Les tests ont pour vocation étuier les performances e notre méthoe e recherche en termes e temps e réponse et e précision pour le calcul es plus proches voisins retrouvés..3 Expérimentation 1 : Estimation es paramètres u noyau Dans cette section, nous présentons une étue relative aux paramètres u noyau. Le but e cette étue est estimer les bons paramètres e la fonction noyau utilisée pour la projection es onnées ans un espace e imension réuite. De manière générale, il n existe pas e critères universels permettant e choisir ces paramètres. Ce choix épen e l application. Ici, ans le cas e la recherche es plus proches voisins, l objectif est e trouver les paramètres qui onnent e meilleur taux e précision e la recherche. Malheureusement, la relation entre les paramètres u noyau et la qualité e la recherche ne peut être exprimée analytiquement, car elle épen e plusieurs critères : la istribution es onnées, la technique u groupement/ partitionnent es onnées, la méthoe inexation, etc. Le but ici est onc e rechercher les paramètres optimaux u noyau e manière empirique. Rappelons que nous avons aopté une fonction noyau gaussienne e la forme : k p q ( p, q) = e δ Avec p et q eux vecteurs e l espace e onnées. La fonction noyau intervient ans l algorithme e l ACPK pour la réuction e la imension e l espace projeté. Deux paramètres oivent être fixés au préalable : la imension e l espace e projection et le paramètre échelle δ e la Gaussienne. Dans cette section, nous présentons les résultats e l estimation es paramètres et δ relative à la base BD1. Pour estimer les valeurs optimales e et δ, nous utilisons eux paramètres, l inicateur e performance γ et la variance σ.

129 Chapitre 5 : Expérimentations γ est onné par : Intercluster γ = Intracluster où Intercluster et Intracluster représentent respectivement les istances interclasse et intra-classe. La istance interclasse représente la capacité e séparation e classe et peut être calculée par la istance entre les eux vecteurs les plus proches appartenant à eux classes ifférentes. La istance intra-classe, quant à elle, représente la capacité e classification. Elle peut être calculée par la moyenne es istances entre les vecteurs une classe et son centre e gravité. Le secon paramètre σ, représente la variance totale es onnées sur les axes principaux, elle est calculée à partir e l ACPK et a pour expression : 1 = σ eign( i) i= 0 où est la imension e l espace projeté et eing() sont les valeurs propres e la matrice e covariance es onnées initiales. Nous rappelons qu une grane valeur e γ et σ est obtenue respectivement pour une bonne séparation e onnées et pour une faible perte information (paragraphe 3. u chapitre 3). Pour illustrer l influence es eux paramètres et δ sur γ et σ, nous effectuons es tests sur les escripteurs e la base BD1 en calculant γ et σ pour ifférentes valeurs e et δ. Dans es expériences non reportées ici, nous avons abor évalué les ifférentes plages e valeurs que peut prenre le paramètre δ et pour lesquelles nous obtenons une séparation significative es onnées. Sur la base e cette expérimentation, nous avons fixé un intervalle e variation e δ. Dans nos expériences les valeurs e δ varient une manière logarithmique entre les eux valeurs 1 et 100 alors que la imension varie entre et 5 e manière logarithmique ( varie entre la imension minimale et maximale es escripteurs). Les figures 5.9 (a) et 5.9 (b) représentent respectivement l évolution es eux paramètres γ et σ pour ifférentes valeurs e et δ (a) (b) (c) Fig (a), ) γ ( δ (b) σ (, δ ) (c) valeurs optimales es paramètres u noyau Dans les figures, les colonnes représentent la imension e l espace e onnées et lignes le paramètre δ e la fonction noyau. Les pixels sombres corresponent aux faibles valeurs e γ et σ, et les pixels clairs corresponent à es valeurs importantes e ces eux paramètres (en fait, là où les conitions sont meilleures). Il est évient qu une bonne représentation e onnées evrait pouvoir séparer les ifférentes classes e la base tout en garantissant une très faible perte information, c.à. avoir e grane

130 Chapitre 5 : Expérimentations valeurs e γ et σ. Or après les courbes, ceci n est possible qu en fixant e granes valeurs pour et δ. D une part, si la imension e l espace e projection est très grane, il sera ifficile inexer efficacement les onnées à travers une structure inex multiimensionnelle en raison u problème e la maléiction e la imension. D autre part, le paramètre e la gaussienne δ agit quant à lui une manière irecte sur la séparation es onnées. Comme nous l avons éjà présenté ans le paragraphe 3. u chapitre 3, une très grane valeur u paramètre u noyau δ entraîne le chevauchement entre les ifférentes classes e la base e onnées, ce qui est non souhaitable pour les onnées en vu e l inexation. En conséquence, un compromis oit être trouvé lors e l estimation e ces eux paramètres. Pour cela, nous avons aopté une stratégie e sélection à eux étapes. D abor nous procéons par une première étape e filtrage en sélectionnant les couples (, δ ) qui possèent une valeur e l inicateur e performance supérieure à 98% e valeur maximale e γ, c.à. : γ δ 98 γ, % max (5.1) où γ max est la valeur maximal e γ. Dans la figure 5.9 (a), la zone vérifiant cette conition se situe au essus e la courbe qui vérifie l équation : γ, δ = 98%. γ max Dans la secone étape, parmi les couples restant après la première phase e filtrage, nous sélectionnons les couples (, δ ) ont la variance est supérieure à 98% e la variance maximale, c.à.. σ δ 98 σ, % max (5.) où σ max est la valeur maximal e σ. Dans la figure 5.9 (b), la zone vérifiant cette conition se situe au essus e la courbe qui vérifie l équation σ, δ = 98%. σ max Dans le tableau suivant, nous iniquons pour les ifférentes régions corresponant aux γ et σ en fonction e et δ si les équations 5.1 et 5. sont vérifiées ou pas. D après la figure 5.9 et le tableau 5.1, nous remarquons que les granes valeurs e γ et σ se situent ans la région 4. De notre point e vu, les valeurs optimales e γ et σ sont les valeurs minimales qui vérifient les équations 5.1 et 5.. Ces points se situent autour u point intersection es eux courbes e la figure 5.9 (a) et 5.9 (b), c.à. le cercle e la figure 5.9 (c) Région Equation 5.1 Equation 5. 1 Non Non Non Oui 3 Oui Non 4 Oui Oui Table 5.1 Valiation es équations 5.1 et 5. pour les régions e la figure 5.9 Pour valier notre choix, nous avons mené es expérimentations sur la qualité e la recherche en utilisant ifférents paramètres corresponant aux ifférentes régions e la figure 5.9. Nous avons tracé les courbes e rappel et e précision en fixant 5 ifférentes valeurs pour le couple (, δ ). Les trois valeurs ( = 5, δ = 14 ), ( = 0, δ = 33) et ( = 16, δ = 9 ) appartenant à 3 régions ifférentes e la figure 5.9. et les eux valeurs ( = 6, δ = 11) et ( = 65, δ = 10 )

131 Chapitre 5 : Expérimentations corresponent respectivement au point intersection es eux courbes et à un point voisin. D après la figure 5.10, Nous voyons clairement que les meilleurs résultats e la recherche sont obtenus pour les couples ( = 6, δ = 11) et ( = 65, δ = 10 ) Ce test permet un part e valier notre stratégie e sélection es paramètres u noyau et autre part e montrer l influence u choix e ces eux paramètres sur la qualité e la recherche. En effet, une bonne représentation es onnées ans l espace e imension réuite est obtenue avec l utilisation es paramètres optimaux e la fonction noyau qui permettent e séparer au mieux les ifférentes classes e la base e onnées et e réuire la imension e l espace projeté. Ceci permet e faciliter le processus u partitionnent e l espace e onnées et le groupement e ces erniers en inex et par conséquent améliorer la qualité e l inexation et e la recherche. Notons que nous avons mené autres expérimentations non reportées ici sur une autre base image [Aloi] pour valier le choix e notre stratégie e sélection es paramètres optimaux u noyau. Les résultats sont similaires, ans le sens où les meilleures performances e la recherche sont obtenues lorsque le couple es paramètres (, δ ) est pris ans la zone intersection. Fig les courbes e rappel et e précision pour ifférentes valeurs u paramètres u noyau..4 Expérimentation : Qualité e la recherche par similarité Nous proposons ans cette section évaluer les performances e la recherche par le contenu basée sur notre méthoe KRA + -Blocks. Pour cela, nous fixons les valeurs es paramètres u noyau aux valeurs optimales trouvées précéemment ( = 6, δ = 11). Nous montrons, e façon comparative, l efficacité e la méthoe proposée KRA + -Blocks. Nous montrons également, ans le care u passage à l échelle, que l utilisation e la structure inex KRA + -Blocks conuit à e meilleures performances par rapport à autres méthoes, et ceci pour ifférentes tailles e la base image. Les évaluations sont essentiellement menées sur la base BD 1 e 700 escripteurs e imension 5 et BD e escripteurs e imension 5. Pour toutes ces expérimentations, le protocole interrogation es eux bases est ientique. Ainsi, pour chaque base, 600 images tirées aléatoirement sont consiérées comme requête, puis nous étuions les réponses retournées jusqu à *carinal es classes (144 pour BD 1 et 800 pour BD ). Les

132 Chapitre 5 : Expérimentations résultats sont enfin évalués et comparés pour les méthoes résumées ans le tableau 5.. Les graphiques sont tracés sur la base e la moyenne es valeurs obtenues pour les 600 images requêtes tirées e chaque base. SCAN: recherche séquentielle PCA: RA + Blocks +PCA RA + - Blocks Distance Eucliienne X X Distance noyau X X KRA + - Blocks Table 5.. Les quatre méthoes utilisées pour la comparaison e la qualité e la recherche Trois méthoes ont été utilisées pour comparer la performance e la structure proposée (Tab 5.). La recherche séquentielle exhaustive avec une istance à noyau. En effet, pour se mettre ans les mêmes conitions que KRA + -Blocks, nous avons abor projeté les onnées initiales ans un espace e imension réuite en utilisant la même fonction e projection et les mêmes paramètres u noyau utilisés ans KRA + -Blocks ( = 6, δ = 11). Puis une recherche séquentielle exhaustive est exécutée sur les onnées projetées e imension réuite en utilisant les mêmes istances à noyau que ans KRA + -Blocks. Les eux autres méthoes utilisées ans la comparaison sont RA + -Blocks et RA + -Blocks avec une ACP. Le choix e ces méthoes n est pas pris au hasar, mais possèe au moins eux justificatifs. Tout abor RA+-Blocks est l une es méthoes récentes qui contourne les problèmes e la maléiction e la imension, elle a montré e bonnes performances au passage à l échelle et ans les granes imensions, et enfin elle améliore VA-File qui est la méthoe représentative e l approche par approximation. Ensuite, RA+-Blocks combiné avec une ACP est, quant à elle, utilisée ans la comparaison pour mettre en évience l impact e la réuction linéaire e la imension sur la représentation es onnées, sur l inexation et par la suite sur la recherche. Cette méthoe est mise en place pour comparer l influence une réuction linéaire ou non linéaire e la imension sur les onnées utilisées. La figure 5.11 onne les courbes e rappel et e précision pour les quatre méthoes. Comme le montre cette figure, la structure inex proposée améliore la méthoe RA+-Blocks et RA+-Blocks avec l ACP. Ces performances sont égraées par rapport à une recherche séquentielle puisque KRA + -Blocks est une méthoe approximative e la recherche. En comparant KRA + -Blocks, qui se base sur une istance à noyau, et RA + -Blocks, qui utilise une istance Eucliienne, nous pouvons conclure es résultats e nos expérimentations que l utilisation e istances à noyau ans notre care applicatif, permet améliorer significativement la performance e la recherche. Nous pouvons également conclure à partir e la comparaison KRA + -Blocks / RA + -Blocks avec ACP, que l utilisation une méthoe non linéaire ne peut être que bénéfique pour les processus inexation et e recherche, notamment ans le cas e onnées hétérogènes.

133 Chapitre 5 : Expérimentations (a) (b) Fig Les Coubes e rappel et e précision en utilisant (a) la base B1 (700) et (b) la base B (40000) Notons que la méthoe proposée gare une bonne qualité e la recherche au passage à l échelle en comparaison avec RA+-Blocks et RA+-Blocks associé à une ACP (figure 5.11.b), les conclusions sont u même orre, c.à. KRA + -Blocks améliore RA + -Blocks et RA + -Blocks avec une ACP. Un exemple es résultats retournés par notre méthoe est illustré ans la figure 5.1

134 Chapitre 5 : Expérimentations Fig.5.1. Les résultats e la recherche avec la méthoe KRA+-Block ans la base COIL- 100 : la première image e chaque ligne représente l image requête et le 11 images représentent les résultats triés par orre croissant e similarité

135 Chapitre 5 : Expérimentations.5 Expérimentation 3 : Bouclage e pertinence Le but e cette expérience est e montrer l efficacité es fonctions à noyau ans le care e l apprentissage. Il s agit évaluer et e comparer la précision es résultats obtenus par rapport à ce que l utilisateur a spécifié à travers le retour e pertinence. Nous avons utilisé les eux bases e onnées BD 1 et BD. Pour interroger les eux bases, nous avons utilisé 600 vecteurs requêtes tirés aléatoirement es eux bases, le nombre es k plus proches voisins est fixé à 144 pour la base BD 1 et à 400 pour la base BD. Un seul cycle u bouclage e pertinence est exécuté pour chaque requête. Notons que le marquage es images pertinentes et non pertinentes est effectué une manière automatique par le système en se basant sur les classes e la base images, celle-ci étant éjà labellisée. La figure 5.13 illustre les résultats e la recherche en terme e rappel et e précision avec et sans bouclage e pertinence. Un exemple es résultats retournés par notre méthoe est illustré ans la figure5.14. (a) (b) Fig Les Coubes e rappel et e précision en utilisant (a) la base BD 1 (700) et (b) la base BD (40000) Comme nous pouvons le voir, le mécanisme u bouclage e pertinence améliore significativement la qualité e la recherche, ce qui prouve la pertinence es istances utilisées ans le processus e recherche. Rappelons que le mécanisme u bouclage e pertinence appren à partir es informations introuites par l utilisateur (ans notre cas le système) et recalcule, en se basant sur la fonction noyau e base (la Gaussienne avec les paramètres optimaux), e

136 Chapitre 5 : Expérimentations nouvelles fonctions noyau. Celles-ci sont obtenues en multipliant la fonction noyau e base par e nouveaux noyaux éuits u retour e pertinence. Les nouvelles istances à noyau sont alors utilisées pour projeter les onnées ans un espace avec une nouvelle istribution. En effet, les onnées sont classées en eux groupes, les images pertinentes et les images non pertinentes par rapport au vecteur requête. Cette projection à tenance à maximiser la istance autour es images non pertinentes à la requête et minimiser les istances autours es images pertinentes. Ceci a pour conséquence e faciliter le processus u filtrage es régions et par la suite améliorer le processus e la recherche. a. Recherche initiale b. Une itération u BP a. Recherche initiale b. Une itération u BP Fig Résultat e la recherche en utilisant a. KRA+-Block avec les paramètres optimaux et b. en utilisant une itération u bouclage e pertinence: la première image e chaque ligne représente l image requête et les autres 11 images sont les résultats retournés

137 Chapitre 5 : Expérimentations.6 Expérimentation 4 : Intérêt sur la combinaison es escripteurs globaux Nous évaluons ans cette section l intérêt e la combinaison e ifférents types e escripteurs u contenu e l image par rapport à l usage un seul type e escripteur, ans le contexte e la recherche par le contenu. Nous montrons également l efficacité es istances à noyau pour mesurer la similarité globale entre es escripteurs ont les composantes sont hétérogènes et e nature ifférente, en comparaison avec une simple istance Eucliienne. La base BD1 est utilisée comme base e recherche. Les escripteurs e cette base on abor été normalisés par composantes avant être inexés à l aie e RA + -Blocks. D un autre côté, ces escripteurs ont été projetés ans un espace e imension réuite à travers une fonction Gaussienne utilisant les paramètres optimaux pour être inexés par KRA + -Blocks. La recherche es k ppv est effectuée avec l inex u RA + -Blocks au moyen e la istance Eucliienne et avec l inex KRA + -Blocks au moyen e la istance à noyau. Le même algorithme e recherche es k ppv est appliqué ans les eux cas. 600 images requêtes e la base BD 1 sont soumises comme requêtes au système. Nous avons choisi e retourner 144 plus proches voisins (*carinal e la classe). Les résultats e précision utilisant les escripteurs couleur, et la combinaison entre la couleur et la forme sont illustrés ans le tableau suivant : N Images Descripteur couleur recherchées (couleur ominante,histogramme) RA+-Blocks KRA+- Descripteurs couleur et forme (couleur ominante, Histogramme, ART) RA+-Blocks KRA + -Blocks Blocks Tableau 5.3. Comparaison e la précision (en %) utilisant la couleur et la couleur + la forme Le tableau montre que la combinaison e eux types e escripteurs e nature ifférente (couleur et forme) onne un taux moyen e précision plus élevé que celui obtenu en utilisant uniquement le escripteur couleur. Nous passons ainsi e 5% à 6% ans le cas où la recherche est effectuée avec les istances à noyau (KRA + -Blocks) et e 46% à 48% pour la istance Eucliienne (pour k ppv = 40 ). On peut conclure qu il est plus avantageux e combiner plusieurs types e escripteurs pour arriver à un meilleur taux e précision. Cette combinaison est autant plus intéressante si nous utilisons une istance à noyau avec es paramètres aaptés plutôt qu une simple istance Eucliienne. Par ailleurs, pour montrer l intérêt es fonctions noyau crées lors u bouclage e pertinence et éventuellement utilisées pour mesurer la similarité entre ces ifférents types e escripteurs, nous avons mené les mêmes expérimentations que les précéentes en utilisant le bouclage e pertinence. Les résultats u pourcentage e la précision en fonction es escripteurs utilisés sont montrés ans le tableau suivant.

138 Chapitre 5 : Expérimentations N Images recherchées Descripteur couleur (couleur ominante,histogramme) Sans bouclage e pertinence Avec bouclage e pertinence (it1) Descripteurs couleur et forme (couleur ominante, Histogramme, ART) Sans bouclage e pertinence Avec bouclage e pertinence (it1) Tableau 5.4. Comparaison e la précision (en %) utilisant la couleur et la couleur avec la forme Les résultats obtenus confirment nos conclusions concernant la combinaison e plusieurs types e escripteurs ainsi que les istances que nous pouvons utiliser pour une telle combinaison. Notons que ans ce test, l amélioration u taux moyen e la précision est significative en comparaison avec les résultats précéents. Par exemple, pour k ppv = 40, le taux e précision obtenu avec un escripteur couleur (couleur ominante, histogramme) est e 63.6% alors qu avec les eux types e escripteurs (couleur et forme) on obtient 78.8%, soit un taux amélioration e 15% contre un taux amélioration e 10% sans bouclage e pertinence. Ceci peut être expliqué par le fait que les istances à noyau utilisées lors u bouclage e pertinences sont plus aaptées à la nature es onnées..7 Expérimentation 5 : Temps e la recherche Le but ici est étuier le comportement e notre méthoe e recherche lorsque le nombre images ainsi que la imension e l espace e onnées varient. Pour cela, nous avons évalué notre méthoe sur eux bases e onnées e granes tailles, BD 3 et BD 4. Nous comparons une part notre méthoe (KRA + -Blocks) avec la méthoe KVA-File [KVA] et la méthoe e recherche séquentielle sur la base BD 4. Et autre part, nous étuions le comportement e notre approche lors u passage à l échelle (gran nombre e vecteurs) ainsi qu en grane imension (grane taille es vecteurs), en calculant les temps e réponse sur la base BD 3 que nous avons conçue spécialement pour cet objectif..6.1influence e la imension Cette expérience étuie l influence e la imension es escripteurs sur les performances e la recherche. Nous utilisons pour cela les eux bases BD 3 et BD 4. Rappelons que la imension e BD 3 et BD 4 est respectivement 50 et 60, ce qui fait que la imension peut varier respectivement pour ces eux bases entre et 50 et entre et 60. Notons que nous avons fixé la capacité es régions à , la taille e la page isque à 00 KB, le nombre e bits par imension à 8 Ainsi, pour ifférentes valeurs e la imension, nous avons cherché les 10 plus proches voisins e chaque vecteur requête une part en utilisant KRA + -Blocks, KVA-File et la recherche séquentielle sur escripteurs e la base BD 4 (Fig 5.15.a), et autre part en utilisant

139 Chapitre 5 : Expérimentations uniquement notre méthoe KRA + -Blocks sur la totalité es escripteurs e la base BD 3.(Fig 5.15.b). Comme nous pouvons le voir sur la figure 5.15.a, la recherche séquentielle gare un coût linéaire lorsque la imension augmente (e 10 à 60). La courbe montre aussi que l évolution u temps e réponse e la méthoe KVA-File est linéaire aussi, mais avec une pente beaucoup moins importante que la recherche séquentielle. Le temps e réponse e notre méthoe quant à lui évolue légèrement en fonction e la imension. A titre exemple, lorsque la imension est égale à 35, le temps e réponse e la recherche séquentielle est e 600ms, alors que celui u KVA-File est e 150 ms et celui e notre méthoe est e 40 ms. Pour cet exemple, KRA + - Blocks est 3 fois plus rapie que le KVA-File et 15 fois plus rapie que la séquentielle. Notons que ce rapport évolue linéairement avec une pente assez grane en fonction e la imension pour la recherche séquentielle et avec une pente moins importante ans le cas u KVA-File. (a) (a) (b) Fig le temps e réponse en fonction e la imension pour la base (a) BD 3. (b) BD 4 Dans la euxième expérimentation (fig.5.15.b), nous avons étuié le comportement e la méthoe KRA +- Blocks sur la base BD 3 e escripteurs e imension 50. Nous

140 Chapitre 5 : Expérimentations montrons sur cette figure le temps e réponse e la structure KRA + -Block lorsque la imension varie e 10 à 180. Nous avons arrêté les tests à la imension 180 u fait que le processus inexation, même s il est hors ligne, evient très couteux au elà e la imension 100. D après la figure, on remarque que le temps e réponse suit une fonction linéaire croissante en fonction e la imension. L évolution u temps e réponse est relativement faible en fonction e la imension par rapport à la recherche séquentielle. A titre exemple, entre la imension 0 et 40, on a une pente e 1.5 pour un nombre e vecteurs égal à alors que pour la recherche séquentielle, ans le même intervalle (entre la imension 0 et 40), on trouve une pente e 1.5 mais pour un nombre e vecteurs égal à On peut conclure que KRA + - Blocks est performante en grane imension..6. Influence u nombre e vecteurs Ce test a pour but étuier l évolution u temps e réponse en fonction u nombre e vecteurs ans la base. Pour cela nous avons utilisé les eux bases BD 3 et BD 4 et nous avons fixé la imension à sa valeur maximale (50 pour la base BD 3 et 60 pour la base BD 4 ). Les résultats sont illustrés ans la figure Celle-ci montre que le temps e réponse e notre approche évolue légèrement en fonction e la imension en comparaison à KVA-File et à la recherche séquentielle. Ainsi, le temps e réponse obtenu par notre méthoe pour vecteurs e imension 60 est e 40 ms alors que pour la même imension et le même nombre e vecteurs, nous obtenons 130 ms pour KVA-File est 630 ms pour la recherche séquentielle, soit un facteur accélération e 3 par rapport à KVA-File et e 15 par rapport à la recherche séquentielle. Ceci montre bien que notre approche améliore le temps e réponse par rapport aux autres méthoes lors u passage à l échelle. Dans la figure 5.16.b, nous montrons le comportement e KRA+-Blocks au elà e escripteurs. On remarque que le temps e réponse évolue linéairement en fonction e la taille e la base e onnées. En revanche, l évolution est relativement faible en comparaison avec la recherche séquentielle (a)

141 Chapitre 5 : Expérimentations (b) Fig Evolution u temps e réponse en fonction e la imension pour la base (a) BD3. (b) BD4 3 Synthèse Nous avons évalué ans un premier temps ans ce chapitre les performances en terme temps e réponse, nombre e régions obtenues lors e la phase e écoupage, et taux e remplissage e la méthoe inexation multiimensionnelle RA + -Blocks. Les performances ont été comparées avec la recherche séquentielle, VA-File et RA-Blocks sur une base e escripteurs réels e vecteurs e imension 5 et sur une base e escripteurs uniformes e imension 50. Dans notre approche, les bases images sont représentées par es vecteurs e caractéristiques e grane imension. Les résultats obtenus en terme temps e réponse, nombre e régions obtenues ainsi que temps e remplissage montrent que la structure inex RA+- Blocks est performante en grane imension et aux passage à l échelle. Notre méthoe améliore la recherche séquentielle, le VA-File et RA-Blocks en optimisant la phase e écoupage e l espace e onnées et en créant es régions compactes et isjointes réalisant ainsi une bonne gestion e la mémoire et augmentant la capacité e stockage e la structure inex. Dans la secone partie e ce chapitre, nous avons évalué la méthoe inexation et e recherche proposée, appliquée au cas e la recherche images par le contenu KRA+-Blocks. Nos résultats liées aux performances aussi bien en temps e réponse u système qu en terme e précision sont comparés à ceux e la recherche séquentielle, e KVA-File et e RA + -Blocks sur es bases e tailles 700, 40000, et avec eux types e escripteurs, un pour la couleur et un pour la forme. Dans notre approche, les bases images sont représentées par es vecteurs e caractéristiques e grane imension. Ces vecteurs sont projetés à l aie un noyau ont les paramètres sont calculés hors ligne, ans un espace e imension réuite à travers une ACPK. Nous construisons la structure inex KRA + -Blocks ans l espace e projection, puis nous établissons les istances à noyau corresponantes. La recherche es k ppv à travers la structure inex u KRA + -Blocks permet avoir rapiement e meilleurs résultats en comparaison avec RA + -Blocks et RA + -Blocks associé à une ACP linéaire. En effet, la projection non linéaire ans notre approche permet une part établir une bonne séparation

142 Chapitre 5 : Expérimentations es onnées ans l espace e projection, mais également e proposer une mesure e similarité à noyau aaptée à la nature es onnées. Les propriétés es fonctions noyau sont également exploitées ans la phase apprentissage pour éfinir es istances flexibles qui réponent au besoin es utilisateurs. D un autre côté, notre approche est plus rapie que la recherche séquentielle exhaustive ainsi que la méthoe KVA-File. Notre algorithme e recherche inuit un orre qui ren prioritaire le traitement es régions les plus intéressantes en se basant sur es istances à noyau aaptées. D autre part, l utilisation e l approche u filtrage permet e réuire le nombre e régions à explorer et par la suite réuit le temps e la recherche. Les expérimentations conuites sur les bases BD 1, BD, BD 3, et BD 4 montrent que notre approche améliore consiérablement le temps e la recherche ainsi que la précision e la recherche par rapport à KVA-File et RA + -Blocks. En recherche, le gain important e temps obtenu par rapport à KVA-File et à la recherche séquentielle u à l utilisation e l approche approximation es régions est pénalisé par une perte relative e qualité e la recherche, notamment en comparaison avec la recherche séquentielle exhaustive. L étue e l impact u nombre et e la taille es vecteurs a montré que notre méthoe s aapte bien aux granes bases image e vecteurs multiimensionnels en comparaison à autres méthoes. Nos expérimentations ont montré également que la combinaison es escripteurs hétérogènes ans la même structure inex est possible avec les istances à noyau, celles-ci améliorant notablement la précision e la recherche en comparaison avec la istance Eucliienne.

143 Conclusion Conclusion Dans le care e ce travail, nous avons abor amélioré les performances e la méthoe inexation et e recherche images basée sur l approximation RA-Blocks. Ensuite nous avons étenue cette méthoe à l espace à noyau (KRA+-Blocks) puis nous l avons intégré ans un système e recherche images par le contenu IMALBUM. Nous commençons par résumer point par point les travaux effectués ainsi que les résultats obtenus pour les eux méthoes (RA+-Block et KRA+-Blocks), puis nous présentons nos perspectives pour le prolongement e ce travail. Synthèse es travaux effectués La recherche et l inexation basée sur l approximation Notre objectif a été tout abor améliorer les performances es méthoes inexation multiimensionnelles pour ensuite pouvoir évelopper une approche rapie et efficace inexation et e recherche, particulièrement aaptée aux applications e recherche images fixes par le contenu. Pour atteinre cet objectif, nous avons commencé par un état e l art sur les méthoes inexation multiimensionnelles. Les travaux présentés ans cet état e l art montrent que les performances es méthoes inexation conventionnelles se égraent lorsque la imension e l espace e onnées et/ou la taille e la base e onnées augmente. Cette étue montre aussi que certaines méthoes sont liées à es contraintes concernant par exemple la istribution es onnées (istribution uniforme) et la istance/espace utilisé (Eucliien). Ensuite, nous avons mis en avant le problème e la maléiction e la imension et rappelé les principaux problèmes liés à l inexation multiimensionnelle es images (le problème e l espace vie, vecteurs équiistants en grane imension, etc.). Des méthoes e la réuction e la imension ont été proposées pour contourner certains problèmes liés aux espaces e grane imension. Ces méthoes possèent cepenant plusieurs inconvénients. Soit elles ne fonctionnent que pour les onnées qui appartiennent à un espace linéaire (méthoes linéaires e la réuction e la imension), soit leur mise en place nécessite un paramétrage ifficile à réaliser par un utilisateur non spécialiste. Par ailleurs, nous avons remarqué que les travaux présentés ans la littérature contournent le phénomène e la maléiction e la imension par un recours aux méthoes basées sur l approximation (filtrage). C est pour cette raison que nous avons écié e nous placer ans ce contexte. Nous avons cherché parmi les méthoes inexation existantes celles qui peuvent être aaptées à nos besoins. Sur la base e cette étue, nous avons choisi e travailler avec la méthoe RA-Blocks [Ter 0] pour les avantages qu elle présente. C est une technique posséant une structure ynamique se basant sur l approximation es onnées, e plus, elle améliore la performance à la fois es méthoes conventionnelles (R-Tree [], X-Tree [3], etc.), et u VA- File [web 98], qui est la méthoe représentative e l approche "approximation". En revanche,

144 Conclusion RA-Blocks présente es limitations au niveau e la phase e écoupage e l espace e onnées. En effet, le partitionnement e celui-ci s effectue selon l algorithme KDB-Tree [Rob 81], ont le principal inconvénient est la génération un très gran nombre e régions vies ou ne contenant que très peu e vecteurs par rapport à leur capacité. Par conséquent, ceci entraîne une mauvaise gestion e l espace mémoire, ce qui iminue la capacité e stockage e l inex et augmente le temps e la recherche. Pour pallier à ces problèmes, nous avons proposé le RA+- Blocks qui améliore nettement la stratégie u écoupage e l espace e onnées. Notre stratégie cherche à partitionner uniquement les régions contenant un nombre e vecteurs supérieur à la capacité es régions. Ceci est possible en remplaçant la structure arborescente u KDB-Tree par une structure linéaire, et en utilisant un algorithme e écoupage inspiré u KD-Tree pour subiviser les régions enses. Les régions ainsi obtenues sont compactes est isjointes et leurs nombre est beaucoup plus faible que celui obtenu par l algorithme e écoupage KDB-Tree. Plusieurs expérimentations ont été menées en comparant notre approche à autres méthoes inexation existantes. Les résultats e ce travail ont été solés par un article publié ans la revue Engineering Letters []. Mesure e similarité pour les onnées hétérogènes Disposant une méthoe efficace inexation basée sur l approximation, nous nous sommes intéressés par la suite à son intégration à un système e recherche images par le contenu. Il est évient que l efficacité e la recherche images épen largement e la mesure e similarité utilisée. Particulièrement, si les onnées sont inexées à travers une structure inex multiimensionnelle, il est important e faire appel à une mesure e similarité globale aux ifférents types e escripteurs, afin e pour pouvoir les inexer avec la même structure. C est pour cette raison que nous nous sommes intéressés au problème e la mesure e similarité entre les escripteurs es images. Pour établir une mesure e similarité aéquate, nous avons passé en revue les principales approches pour la escription e l apparence visuelle es images fixes (escripteurs), puis les ifférentes approches proposées ans la littérature pour mesurer la similarité entre ces escripteurs. Une attention particulière a été accorée au problème e l hétérogénéité es onnées ainsi qu à la combinaison e ifférents types e escripteurs ans l objectif e les inexer plus tar à travers une même structure inex. Sur la base e cette étue, nous avons remarqué que la notion e similarité par approche noyau offre un care théorique qui permet e combiner les mesures e similarité e plusieurs types e escripteurs en limitant autant que possible les problèmes qui se posent lors e la combinaison es escripteurs hétérogènes (normalisation, ponération, etc.) Cette approche nous a permis e généraliser la notion e istance et e éfinir un moèle à partir uquel, une seule mesure e similarité est établie pour les ifférents types e escripteurs. La recherche et l inexation basée sur l approximation : application à la recherche images par le contenu La euxième partie e notre travail concerne la conception et l intégration une méthoe inexation multiimensionnelle basée sur l approche approximation ans un système e recherche images par le contenu. A ce stae, plusieurs problèmes ont été soulevés : Le premier se pose lors e l étape inexation. En effet, cette étape consiste à générer, à partir e la base images, un espace e vecteurs e caractéristiques ayant généralement un très gran

145 Conclusion nombre e composantes, onc une très grane imension, ifficile à gérer par les méthoes inexation existantes. Le euxième problème se présente lors e l étape e la structuration e l espace e onnées. Il s agit organiser en inex, es vecteurs multiimensionnels composés e escripteurs e ifférentes natures «escripteurs hétérogènes». Le troisième problème consiste à éfinir une istance appropriée pour mesurer la similarité entre ces escripteurs hétérogènes. La méthoe proposée apporte une solution à l ensemble e ces problèmes. Elle permet e réuire la imension e l espace e onnées à l aie e l analyse en composantes principale à noyau, ACPK, et utilise es istances aaptées, érivées e l approche à noyau. En effet, l ACPK permet e projeter les onnées initiales ans un espace e imension réuite par un noyau avec un ouble intérêt : une part cette projection élimine les corrélations non linéaires entres les caractéristiques es vecteurs, ce qui permet e générer une représentation compact est informative es onnées, et autre part, grâce à la fonction noyau, elle éfini une mesure e similarité aaptée aux onnées hétérogènes. Il est bien établi que l efficacité e la recherche es plus proches voisins épen fortement e la compacité et e la séparabilité es classes e vecteurs. Si ces eux propriétés ne sont pas satisfaites, le chevauchement entre les classes e vecteurs est important. Par conséquent, la phase e filtrage utilisée lors e la recherche evient inefficace ce qui ne permet pas e sélectionner correctement les plus proches voisins. Ainsi, le bon choix es paramètres u noyau est primorial pour assurer une recherche efficace es k ppv. Afin e garantir une bonne représentation e nos onnées, nous avons exploité certaines propriétés e l ACPK. En effet, nous avons remarqué que la imension e l espace e projection ainsi que le paramètre e l échelle e la fonction noyau gaussienne que nous avons aopté, agissent une manière significative sur la istribution es onnées générées ans l espace e projection. Nous avons mené es tests expérimentaux ans ce sens et nous avons proposé une stratégie e sélection es paramètres optimaux qui permettent atteinre un maximum e séparation es onnées avec le minimum e imension possible. Les expérimentations sur la qualité e la recherche ont confirmé l efficacité e notre stratégie e sélection. Notre méthoe inexation multiimensionnelle KRA+-Blocks utilise l approximation es régions pour réuire le temps e la recherche, elle consiste abor en une phase hors ligne servant à quantifier l espace e onnées en es cellules hyper rectangles, ensuite l espace e onnées est partitionné en régions isjointes et compactes selon la stratégie e écoupage u RA+-Blocks. Puis, chaque région est approximée par une chaine e bits corresponant aux eux cellules "en bas à gauche" et "en haute à roite", sachant que le processus e recherche sélectionne les régions caniates selon leurs istances minimales et maximales par rapport au vecteur requête. Enfin, les régions sélectionnées sont explorées pour calculer les k ppv. Les istances utilisées ans la phase e filtrage ainsi que pour le calcul es k ppv sont toutes érivées e l approche à noyau. Les expérimentations menées pour évaluer le temps e réponse montrent bien que la combinaison une méthoe e la réuction e la imension avec l approche approximation es régions réuit bien le temps e la recherche. Pour améliorer la qualité e la recherche, nous avons aopté un moèle probabiliste e bouclage e pertinence qui s appuie sur la théorie u Kernel Tricks, ce moèle éfinit une manière flexible les mesures e similarité en fonction u retour e l utilisateur. Il exploite les propriétés es fonctions noyaux pour générer à partir un noyau onné, e nouvelles istances à noyau afin estimer la similarité entre es escripteurs hétérogènes et e s approcher le plus possible es besoins e l utilisateur.

146 Conclusion Evaluation Expérimentale Pour évaluer notre méthoe, nous avons mené une étue expérimentale étenue portant à la fois sur le temps e réponse et sur la qualité u processus e la recherche. Nous avons abor réalisé une étue comparative en terme e précision entre notre méthoe, la recherche séquentielle, RA+-Blocks et RA+-Blocks avec ACP. Cette étue a montré que notre méthoe est efficace pour ce qui est e la qualité es réponses par rapport aux autres méthoes. En fait, elle présente e meilleurs taux e rappel et e précision tout en restant moins performante qu une recherche séquentielle exhaustive. En effet, notre approche se base sur l approximation, ont l iée principale est e favoriser le gain en temps e réponse au étriment une faible égraation e la qualité e la recherche. D un autre côté, les mêmes comparaisons ont été reprises sur une base e plus grane taille pour étuier le comportement e notre méthoe lors u passage à l échelle. Nous avons remarqué que notre méthoe gare les meilleurs taux e rappel et e précision par rapport aux autres méthoes à l exception, encore une fois, e la recherche séquentielle exhaustive ont la qualité reste meilleure pour un temps e réponse e loin supérieur. Dans une euxième expérimentation, nous avons montré l efficacité u mécanisme u bouclage e pertinence aopté ans notre méthoe. Les résultats montrent qu avec seulement une itération u bouclage e pertinence, nous améliorons significativement les taux e précision et e rappel. Nous avons également montré ans une troisième expérimentation l intérêt e l utilisation une mesure e similarité par une fonction noyau sur la combinaison es escripteurs e nature hétérogène. Nous avons conuit es expérimentations sur es escripteurs e forme et e couleur. Les résultats montrent que la combinaison e ces escripteurs avec l utilisation une istance à noyau améliore consiérablement la qualité e la recherche en comparaison avec l utilisation une istance Eucliienne. Une ernière expérimentation a été menée sur une base e onnées synthétiques pour montrer la performance e notre méthoe en terme e temps e réponse. Des comparaisons ont été effectuées entre notre méthoe, KVA-File, et RA+-Blocks en fonction e la taille e la base e onnées et e la imension es escripteurs. Nous avons montré à nouveau que notre méthoe est plus performante que les autres, et qu elle gare un coût e recherche assez faible aussi bien en grane imensions qu au passage à l échelle. Perspectives Les perspectives que nous envisageons ans le prolongement e ce travail e thèse s articulent autour es points suivants. Coût e l inexation Un point que nous n avons pas aboré ans ce manuscrit est le coût u processus inexation. Bien que l inexation une base soit hors ligne, ce processus est généralement très couteux notamment au passage à l échelle et en grane imension. Il serait onc intéressant étuier la complexité e l algorithme inexation et optimiser les opérations u partitionnent e l espace e onnées et la création e l inex.

147 Conclusion Le choix es paramètres e la structure inex La capacité es régions et le nombre e bits e coages sont eux paramètres critiques, ifficiles à fixer alors que les performances es eux inex RA+-Blocks et KRA+-Blocks en épenent fortement. Il serait onc intéressant e mener une étue pour quantifier la relation, une part entre la capacité e région et la qualité e l approximation, et autre part entre le nombre e bits e coage et le nombre e régions obtenues lors u partitionnement e l espace e onnées. Quantifier la relation entre le nombre e bit e coage, la capacité es régions et la qualité e l approximation serait un atout pour construire une structure inex optimale en terme e qualité e l approximation et e capacité e stockage notamment pour les grans volumes e onnées multiimensionnelles. La mise à jour e la structure inex Dans les eux méthoes inexation basées sur l approximation RA+-Block et KRA+-Blocks, nous avons travaillé avec es bases images e taille fixes. L extension es eux méthoes à la problématique e l ajout e nouvelles images ans une base reste à traiter. Les nouvelles images rajoutées à la base sont susceptibles e moifier la istribution es onnées ans l espace es caractéristiques, et un travail e construction es fonctions noyaux reste nécessaire pour tout changement e onnées. Il serait intéressant là encore, une part e mettre en place une procéure e mise à jour afin e maintenir ynamiquement la structure inex, et autre part, étuier l impact e ces moifications sur le choix e la fonction noyau et e ses paramètres car, vu que la istribution es onnées risque être moifiée, cela peut entraîner es changements nécessaires ans le choix e la fonction noyau et e ses paramètres. Apprentissage e la fonction noyau Bien que l approche noyau nous permette améliorer la qualité e la recherche, elle reste néanmoins basée sur le critère e maximisation u taux e séparation es classes (inicateur e performance ans notre manuscrit). Or ans notre contexte, c est le taux e précision qui est éterminant. Il serait onc un atout e construire les fonctions noyau les plus aaptées à la recherche images par le contenu, en se basant irectement sur un paramètre évaluation e la qualité e la recherche (précision moyenne par exemple).

148 Annexe Annexe 1 Construction e l inex KDB-Tree Algorithme Construction_inex_KDB_Tree ( P : ensemble e vecteurs, Racine : la région corresponant à l espace e onnées, RR, ID : les couples régions et le pointeur corresponant sur la feuille, feuille : une page point, x : hyperplan e subivision) i 1: Si Racine est nulle, : alors créer une page point contenant p est une région ( RR, ID) telle que ID est un pointeur sur la page point 3: Sinon{ 4: chercher la page point evant contenir p soit 5: Inserer p ans 6: Si feuille 1 } feuille 1 1 est non saturée 7: alors terminer 8: Sinon { 9: éterminer un hyperplan e subivision x i 10: Subiviser la page suivant x i} 11: Si feuille = Racine 1 feuille 1 1: alors aller à 13: Sinon 14: remplacer ( RR, ID) par ( RR _ gauche, ID _ gauche) et ( RR _ roite, ID _ roite) 15: Si feuille est saturée 1 16: alors répéter à partir e 8 17: Insérer ( RR _ gauche, ID _ gauche) et ( RR _ roite, ID _ roite) respectivement à gauche et à roite e la page région Construction e l inex KD-Tree Algorithme construction_kd_inex recconst(sous espace V, objets O) 1 : Tester s il faut iviser le sous espace courant V : : Si non : Renre la Feuille(O) contenant la liste es objets O 3 : Si oui : Continuer 4 : Trouver le bon plan séparateur p 5 : Couper le voxel V avec p pour obtenir VG et VD 6 : Repartir les objets O ans VG et VD ) OG et OD 7 : Renre le Nœu ( p, recconst(vg,og ), recconst(vd,od) )

149 Annexe 3 Algorithme e recherche VA-NOA Proc VA-NOA (Vect : vector) ; Var i,can, Li, Hi : int Heap : HEAP ; Init (Heap) ; //La phase filtrage 1. Can : = Initcaniate () ;. For i : = 1 TO Vect Do 3. Li, Ui : = Getbouns ( Ai, Vect ) ; 4. If Li <= Can THEN 5. Insertheap ( Li, i ) ; En ; En ; //La phase accès au vecteurs 6. Can : Initcaniate () ; 7. Li, i : = PopHeap ( Heap ) 8. While Li < Can Do 9. D : = Caniate ( Lp ( Vect(i), Vect(q) ), i ) ; 10. Li, I : = PopHeap (Heap) En ; En VA NOA ; 4 centrage es onnées ans l espace à noyau Etant onnée un ensemble e vecteurs S = { p1, p,... p N } appartenant à un espace entrée χ et φ, une application non linéaire associée N à un noyau k, telle que k ( p1, p ) =< Φ( p1), Φ( p ) >. ~ 1 Les vecteurs : Φ( pi ) = Φ( pi ) Φ( pi ) sont centrés. N Donc la matrice (, ) i= 1 K = k p q ans la reformulation e l ACP u paragraphe evient : p, q ~ S ~ K ~ i, j = k ( pi, p j ) = ( Φ( pi ), Φ( p j )) ans l espace H. ~~ ~ ~ ~ Le problème es valeurs propres evient : KZ i = λi Z i tel que Z ( ~,..., ~ i = zi, 1 zi, N ) est un vecteur ont les composantes vérifient: ~ ~ e ~ i = Z i, rank( p) Φ( p) Puisque les onnées ne sont pas centrés, p S le calcul e K ~ n est pas irect, il peut etre exprimé en fonction e K i, j = ( Φ( pi ), Φ( p j )). Soient 1 i, j = 1 pour tout i et j, 1 N ( i, j) = 1/ N ~ K i, j = (( Φ ( p = K = ( K i, j i 1 N 1 N 1 ) N N t = 1 N t = 1 1 it K K 1 K M Φ ( p tj t 1 N + 1 M )).( Φ ( p N l = 1 K 1 M ) K ij j ) il 1 lj 1 N + N t = 1 N 1 Φ ( p N t, l = 1 t 1 it ))) K tl 1 lj Donc K ~ peut etre calculé à partir e K, pour résoure l problème e l ACP à noyau il suffit e iagonaliser la matrice K ~.

150 Références e l auteur Référence e l auteur Revues: Conferences: [1] : I. Daoui, K. Irissi, S.E. Ouatik, A. Baskurt, an D. Aboutajine, An efficient High-Dimensionnal Inexing Metho for Content-Base Image Retrieval in Large Image Databases, EURASIP Journal, Signal processing : Image communication, 009, (A apparaître) [] : I. Daoui, S.E. Ouatik, A. El Kharraz, K. Irissi, an D. Aboutajine, Vector Approximation Base Inexing for High-Dimensional Multimeia Databases. Engineering Letters, Volume 16 Issue, 008, Pages [3] : I. Daoui, K. Irissi, S. E. Ouatik, "A multi-class metric learning for contentbase image retrieval, " IEEE international Conference on Image processing, ICIP 009. (papier soumis) [4] : I. Daoui, K. Irissi, S. E. Ouatik, Une mesure e similarité par une approche noyau pour l inexation et la recherché par le contenu ans les bases e onnées hétérogènes, COmpression et Representation es Signaux Auiovisuels, CORESA 009. [5] : I. Daoui, K. Irissi, S. E. Ouatik, Kernel Base Approach for High Dimensional Heterogeneous Image Features Management in CBIR Context, Avance Concepts for intelligent Vision Systems, ACIVS 08, Juan-les-Pins, France, October 0-4,008 [6] : I. Daoui, K. Irissi, S. E. Ouatik, Kernel Region Approximation Blocks For Inexing Heterogonous Databases, IEEE International Conference on Multimeia & Expo, ICME, Hannover, Germany June3,6, 008. [7] : S.E. Ouatik, A. El Kharraz., I. Daoui, D. Aboutajine, Une Structure Inex Multiimensionnelle pour la Recherche ans les Granes Bases e Données Multiméia, The 3r International Symposium on Image/Vieo Communications over fixe an mobile networks, ISIVC, September 13-15, Hammamet, Tunisia, 006.

151 Références e l auteur 005 [8] : I. Daoui, S.E. Ouatik, El Kharraz., An Inexing Metho for Similarity Search in High-Dimensional Image Databases, Secon International Symposium on Communication, Control an Signal Processing, ISCCSP, March, Marrakech, Morocco, 006. [9] : I. Daoui, S.E. Ouatik, El Kharraz, Une Méthoe Inexation es Granes Bases e Données Multiimensionnelles par une Approche e Filtrage, Workshop on Telecom an Information Systems, E-Week 06, Morocco Stuent Technical Paper Competition, First Best Paper Contest Awar, February 1, fez, Morocco, 006. [10] : I. Daoui., S.E. Ouatik, El Kharraz., D. Aboutajine, Recherche par approximation ans les granes bases e onnées multiméias, Workshop sur les Technologies e l Information et e la communication, WOTIC 05, June 4-5, Kenitra, Morocco 005.

152 Références Bibliographiques Références Bibliographiques [Aloi] [Ams 01] [Aro 50] [Baj 73] [Bal 04] [Bay 7] [Bay 71] [Bbj 00] [Bbk 98] [Bec 90] [Bel 61] [Bel 0] Amsaleg, L. & Gros P.. Content-base retrieval using local escriptors: problems an issues from atabase perspective. Pattern Analysis an Applications, Special Issue on Image Inexation, 4: , 001 Theory of reproucing kernels. Transactions of the American Mathematical Society, 68 : Bajscy, R. Computer Ientification of Visual Surfaces. Computer Graphics an Image Processing,, ,1973 Balko, S., Schmitt, I., et Saake, G.The active Vertice Methoe :a performant Filtring Approach to High-Dimensional Inexing. Data an Knowlege. Engineering, 51(3, ,004 R. Bayer, E. McCreight, Organization an maintenance of large orere inexes, Acta Informatica 1 (3) ,197 R. Bayer, Binary B-Trees for Virtual Memory, Proceeings of 1971 ACM- SIGFIDET Workshop on Data Description, Access an Control, San Diego, California, November 11-1, S. Berchtol, C. Böhm, H. V. Jagaish, H. P. Kriegel, an J. Saner. inepenent quantization : An inex compression technique for highimensional ata spaces. In Proceeings of 16-th Int. Conf. on Data Engineering, IEEE ICDE, pages , San iego, California, USA, 000. S. Berchtol, C. Bohm an H.-P. Kriegel, The Pyrami Technique: Towars Breaking the Curse of Dimensionality, in Proc. ACM SIGMOD Int. Conf. on Management of Data,p ,1998 N. Beckmann, H.P. Kriegel, R. Schneier, an B. Seeger. The r*-tree : An efficient an robust access metho for points an rectangles. In Proceeings of ACM SIGMOD International conference on Management of Data, pages 3 331, Atlantic City, NJ, USA, ACM Press. R. E. Bellman.Aaptive Control Processes. Princeton University Press, Princeton, NJ. [points: high imensional ata; curse of imensionality] cite in F.P (p.xvi), F.4 (p.486), F.4.6 (p.663), 1961 Belongie S., Malik J., Puzicha J., shape matchnig an object recognition

153 Références Bibliographiques using shape context, IEEE transaction on Pattern Analysis an Machine intelligence, vol. 4, n 4, p.509-5, 00 [Ben 75] [Ben 90] [Ben 79] [Ber 04] [Ber96] [Ber 84] J. L. Bently. Multiimensional binary search tree use for associative searching. Communications of ACM, 18(9): , J.L Bentley. K-trees for semi-ynamic point set. In 6 th Ann. ACM, pages , Sympos. Comput. Geom,1990 J. L. Bentley an J. H. Frieman, \Data structures for range searching," ACM Computing Surveys, vol. 11, pp. 397{409, Si-Ahme Berrani Recherche approximative e plus proches voisins avec contrôle probabiliste e la précision ; application à la recherche images par le contenu., 004 S. Berchtol, D.A. Keim, H.-P. Kriegel, The X-tree: an inex structure for high-imensional ata, in: VLDB, 1996, pp Berg, C., Christensen, J. P. R., & Ressel, P. Hamonic analysis on semigroups. Springer-Verlag,1984 [Bey 99] [Bfe 79] [Bff 77] Beuer, K. S., Golstein, J., Ramakrishnan, R., et Shaft, U. (1999). When Is Nearest Neighbor Meaningful? In Proceeing of the 7 th International Conference on Database Theory (ICDT 99), pages 17-35, Lonon, UK, Springer-Verlag J. L. Bently an J. H. Frieman. Data structures for range searching. ACM Computing Surveys, 11(4): , J.L Bentley, J.H Frieman, an R.A Finkel. An algorithm for fining best matches in logarithmic expecte time. ACM Transaction on Mathematic Software, 3(3) :pages 09 6, [Bha 06] Bharat, R. A comparative analysis of imensionality reuction techniques [BIM 99] Del Bimbo A., Visual information retrieval, Morgan Kaufmann, 1999 [Bos 9] Boser, B. E., Guyon, I., & Vapnik, V. N. (199). A training algorithm for optimal margin classi_ers. Proceeings of the Fifth Workshop on Computational Learning Theory (pp ). [Cha 01] Charu, C. Aggarwal. On the effects of imensionality reuction on High Dimensional Similarity search, In Procceing of ACM Symposium on Principles of atabase systems (PODS), 001 [Cha 98] Cha G.-H., CHUNG C.-W., Object-Oriente Retrieval Mechanism for Semistructure Image Collections, 6 th ACM International Conference on Multimeia Bristol, Royaum-Uni, september 1998 [Cha 01] E. Chavez, G. Navarro, R. Baeza-Yates, an J. Marroquın. Searching in Metric Spaces. ACM Computing Surveys, 33(3):73 31, 001. [Cha 0] [Cia 97] Cha, G.-H., Zhu, X, Petkovic, D., & Chang, C.-WAn efficient inexing metho for nearest neighbor searches in high-imensional image atabases. IEEE Transactions on Multimeia, 4(1) :76-87, 00 P. Ciaccia, M. Patella, P. Zezula, M-tree: an efficient access metho for

154 Références Bibliographiques similarity search in metric spaces, in: M. Jarke, M.J. Carey, K.R. Dittrich, F.H. Lochovsky, P. Loucopoulos, M.A. Jeusfel (Es.), Proceeings of the 3r International Conference on Very Large Data Bases, VLDB 97, Morgan Kaufmann, Greece, pp , 1997 [Cou] [Cri 00] [Cva 0] [Cui 07] [Dao 08] [Dao 00] [Dau 85] [Dou 05] [EAK 99] [Ebe 94] [Fal 94] [Fer 05] Cristianini, N., & Shawe-Taylor, J. (000). An introuction to support vector machines. Cambrige University Press. H. Chen, J. An, K. Furuse, an N. Ohbo, CVA: Trim High Dimensional Inexes, The Thir Inter. Conf. on Web-Age Information Management (WAIM), Beijing, China, 00, pp J. Cui., S. Zhou, s. Zhao, PCR-Tree: a compression-base Inex Structure for similarity searching in High-imensional Image Databases. In Proceeing of the Fourth International Conference on Fuzzy Systems an Knwlege Discovery (FSKD 07), 007 I. Daoui, S.E. Ouatik, A. El Kharraz, K. Irissi, an D. Aboutajine, Vector Approximation Base Inexing for High-Dimensional Multimeia Databases. Engineering Letters, Volume 16 Issue Pages 10-18, 008 M. Daoui an S. Matusiak. Visual image retrieval by multiscale escription of user sketches. Journal of Visual Computing an languages, 11 :pages , 000. special issue on image atabase visual querying an retrieval. J.G. Daugman: Uncertainty relations for resolution in space, spatial frequency, an orientation optimize by two-imensional visual cortical filters, Journal of the Optical Society of America A, vol., pp , 1985 Douglas R. Heisterkamp an Jing peng. Kernel Vector approximation Files for Relevance Feeback Retrieval in Large Image Databases In Computer science: Multimeia tools an applications, volume 6, pages , 005 John P Eakins an Margaret E Graham, Content-base Image Retrieval, A report to the JISC Technology Applications Programme. Institute for Image Data Research, University of Northumbria at Newcastke. January 1999 D.H. Eberly. Geometric Methos for analysis of Riges in N-imensional Images. Ph thesis, University of North Carolina at Chapell Hill, Faloutsos C., Barber R., Flickner M., Hafner J., Niblack W., Petkovoc D., efficient an effective querying by Image Content, Journal of Intelligent Information Systems, vol. 3, n 3-4, p.31-6, Ferecatu M., Image retrieval with active relevance feeback using both visual an keywor-base escriptors, these e octorat, université e versailles Saint-Quentinen-Yvelines, Juillet 005. [Fli 95] M. Flickher, H. Sawhney, W. Niblack, J. Ashley, Q. Huang, B. Dom, M. Gorkani, J.Hafner, D. Lee, D. Petkovic, D.Steele, an P. Yanker, "Query by Image an Vieo Content: The QBIC System," IEEE Computer, vol. 8, no. 9, pp. 3-3, Sept [GEV 00] Gevers T., Smeulers A., Pictoseek: combining shape an color invariant features for image retrieval., IEEE transactions on Image Processing, vol. 9,

155 Références Bibliographiques n 1, p , 000. [GEV 04] Gevers T., Smeulers A. W., Content-base image retrieval: An overview,meioni G., Kang S., Es., Emerging topics in Computer Vision, Prentice Hall, 004. [Gae 98] V. Gaee an O. G unther. Multiimensional access methos. ACM Computing Surveys, 30():170{31, [Gua 0a] Guang- Ho Cha, an al. An Efficient Inexing Metho for Nearest Neighbour Searchs in high-dimensional Image Databases. IEEE Transactions On Multimeia, Vol4, N June 00. [Gua 0b] [Guo 07] [Gut 84] [Ha 93] [Haf 95] [Hak 00] [Har 73] [Has 01] [Has 95] [Hei 01] [Hen 89] [Hja 95] Guang- Ho Cha, Chen-Wan Chung. The GC-Tree : A High-Dimensional Inex Structure for Similarity Search in Image Databases. IEEE Transactions On Multimeia Vol 4, N 1 March 00. Guoren W., Zhou X., Bin W., Qiao B., Han D., A hyperplane base inexing technique for high imensional ata, In Proceeing of Information Sciences 177 (007) A. Guttman. R-trees: A ynamic inex structure for spatial searching. In Proc. of the ACM SIGMOD Int. Conf. on Management of Data, pages 47-57, Boston, MA, June Haon, J. F. et Boyce, J.FCo-occurrence Matrices for Image Analysis. IEE Electronics an communication Engineering Journal, 5(), 71-83,1993. J. Hafner et al, "Efficient color histogram inexing for quaratic form istance functions", IEEE trans. Pattern Analysis an Machine Intelligence, Vol. 17, pp , H. Ferhatosmanoglu, E. Tuncel, D. Agrawal, Vector approximation base inexing for non-uniform high imensional ata sets, Proc. of the ACM Int 1 Conf. on Information an Knowlege Management(CIKM000).New York, 000, pp Haralik, R. M., Shanmugam, K., et Dinstein, I.Textural features for Images Classification. IEEE Transaction on System, Man, Cybernetics, 3, ,1973. [T. Hastie, R. Tibshirani, an J. Frieman. The elements of statistical learning. Springer, New York, 001. : Hasting S., «Query categories in a stuy of intellectual access to igitize art images, 58th Annual meeting of the American Society for information Sciences, 1995 Heisterkamp, D., Peng J., Dai, H.: An Aaptive Quasi-conformal Kernel Metric for Image Retrieval. In Proceeings of IEEE CVPR, Kauai Marriott, Hawaii. pp ,( 001). A. Henrich, H.S. Six, an P. Wimayer, The LSD tree: spatial access to multiimensional point an non-point objects, Proc. 15th VLDB Conference, pp ,1989 [ G. R. Hjaltason an H. Samet. Ranking in Spatial Databases. In Proceeings of the 4th Symposium on Spatial Databases, pp ,

156 Références Bibliographiques [Hot 33] [Hsh 89] [Hua97] [Hu 6] [Ir 03] [Ir 01] [Ing00] [Iqb0] [Iso 00] [Jai 98] [Jea 01] [Kar 47] [kat97] [Kel 95] Portlan, Maine, August Hotelling, H. (1933). Analysis of complex statistical variables into principal components. Journal of Eucational Psychology, 4: , A. Henrich, H.-W. Six, an P. Wimayer. The LSD-tree: Spatial access to multiimensional point an non-point objects. In Proceeings of the 15th International Conference on Very Large Data Bases (VLDB), pages 45-53, Amsteram, The Netherlans, Huang, J., Kumar, S., Mitra, M., Zhu, W.-J., an Zabih, R. Image inexing using color correlogram. In Proc. of IEEE Conf. on Computer Vision an Pattern Recognition., pages Hu M., Visual Pattern recognition by moment invariants, IEEE Transactions on Information Theory, vol. 8, p , 196 Khali Irissi. Segmentation et escription e la couleur pour l inexation, la navigation visuelle et la recherche ans les bases images fixes., 003 K.Irissi, J. Ricar, A. Anwaner, A. Baskurt, «An image retrieval system base on local an global color escriptors», In Proc.of the n IEEE Pacific PIM conference on Multimeia, pp.55-6, Beijing, China, October, 001. Ingemar J. Cox, Matthew L. Miller, Thomas P. Minka, Thomas Papathomas, an Peter N. Yianilos. The bayesian image retrieval system, PicHunter: Theory, implementation an psychophysical experiments. IEEE Transactions on Image Processing, pages Q. Iqbal an J. K. Aggarwal, CIRES: A System for Content-base Retrieval in Digital Image Libraries, Invite session on Content Base Image Retrieval: Techniques an Applications International Conference on Control, Automation, Robotics an Vision (ICARCV), Singapore, pp , December -5, 00. J.B. Tenenbaum, V. e Silva, an J.C. Langfor. A Global Geometric Framework for Nonlinear Dimensionality Reuction. Science, 90 :319 33, December 000 Jain A., Vailaya A., «image retrieval using color an shape», Pattern recognition, vol.9, n 8, p , 1998 Jeannim, S. «MPEG-7 visual pary of experimentation moel, Version 9.0» ans ISO/IEC JTC1/SC9/WG11/N3914,55th Mpeg Meeting. Pisa, Italy.001.pages 7, 39, 41 Karhumen, K. (1947). Uber linear Methoe n wahrsche in linlichtstsrechnug. Ann. Aca. Sci. Fenn.37. N. Katayama, S. Satoh, The SR-tree: an inex structure for high-imensional nearest neighbor queries, in: Proc. Int. Conf. on Management of Data, vol. 6, no., 1997, pp Kelly, P. M., Cannon, T. M., et Hush, D. R.Query by Image Example: The CANDID Approach. SPIE Storage an retrieval for Image an Vieo Databases III, 40, 38-48,1995 [Kim 99] W.Y. KIM, Y.S.Kim: A new region-base shape escriptor, TR# 15-01, December 1999

157 Références Bibliographiques [Kim 00] [Kul 59] [LEV 76] [LLE00] [Loe 48] [Lon0] [LS90] [Ma99] [Mac 96] [Man 0] [Maj 96] [Man 96a] [Man 96b] [Mar 80] [Man 96] [MB+] Kim H., Kim J., Sim D., Zernike moment shape escriptor invariant to translation, rotation an scale for similarity base image retrieval, IEEE International Conference on Multimeia expo, p , juillet 000. Kullback, S.Information theory an statistics. Wiley (New York),1959 Levy-Schoen, A. «Exploration et connaissance e l espace visuel sans vision pèriphérique ; quelques onnées sur le comportement oculomoteur e l aulte normal». Journal Psychologique, 39(1) : pages 37,1976. : Sam T. Roweis an Lawrence K. Saul. Nonlinear Dimensionality Reuction by Local Linear Embeing. Science, 90 :33 36, December 000. Loève, M. (1948); fonnctions aléatoires e secon orre. Hermann, Paris. Fuhui Long, Hongjiang Zhang, Davi D. Feng: Funamentals of Contentbase Image retrieval, in Multimeia Information Retrieval an Management Technological Funamentals an Applications, D. Feng, W.C. Siu, an H.J.Zhang. (e.), Springer, 00. D. Lomet an B. Salzberg. The hb-tree: A multiattribute inexing metho with goo guarantee performance. ACM Transactions on Database Systems, 15(4):65-658, Wei-Ying Ma an B. S. Manjunath. Netra: A toolbox for navigating large image atabases. Multimeia Systems, 7(3): , MacQueen J., «Some methos for classification an analysis of multivariate observations»,in Proc. Fifth Berkeley Symp, University of California Press 1, p ,1996 B. S. Manjunath, P. Salembier, T. Sikora, "Introuction to MPEG-7", Willey, 00. F. Mokhtarian, S. Abbasi,, an J.Kittler. Robust an efficient shape inexing through curvature scale space. Proceeings of the sixth British Machine Vision Conference, BMVC 96, pages 53 6, 10-1 September Manjunath, B. S. et Ma, W. Y.,, «Texture features for Browsing an Retrieval of Image Data», IEEE Transaction on Pattern Analysis an Machine Itelligence, 18(8), , 1996 Manjunath, B. S., Salembier, P.; et Sikora, T. Introuction to MPEG-7. John Wiley & Sons,00 Marcelja, S. Mathematical escription of the response of simple cortical cells Journal of Optical Society of America, A 70(11) : pages 18,1980. Manjunath, B.S., S., Salembier, P., et Sikora, T. 00. Introuction to MPEG-7. John Wiley &Sons [7] M. Ishikawa, H. Chen, K. Furuse, J.X. Yu, N. Ohbo, MB+tree: a ynamically upatable metric inex for similarity search, in: H. Lu, A. Zhou (Es.), Proceeings of the 1st International Conference on Web-Age

158 Références Bibliographiques Information Management, WAIM 00, Springer,Shanghai, China, pp ,000 [Mer 09]. [Min 95] [Mic 94] [Mok 9] [MTR97] [Nas 98] [Nhs 84] [Nib 93] [Lu 06] [Ogl95] [Ooa 00] [Orl 0] Functions of positive an negative type an their connection with the theory of integral equations. Philosophical Transactions Royal Society Lonon, A09 : E. Horowitz, S. Sahni, an D. Mehta, Funamentals of Data Structures in C++. Rockville, MD: Computer Science, L. Mico, J. Oncina, an E. Vial. A new version of the nearest-neighbor approximating an eliminating search (aesa) with linear preprocessing-time an memory requirements. Pattern Recognition Letters, 15:9 17, Mokhtarian F., Mackworth A., A theory of multiscale, curvature-base shape representation for planar curves, IEEE Transactions on Pattern Analysis an Machine Intelligences, Vol. 14, n 8, p , 199 P. Ciaccia, M. Patella, P. Zezula, M-tree: an efficient access metho for similarity search in metric spaces, in: M. Jarke, M.J. Carey, K.R. Dittrich, F.H. Lochovsky, P. Loucopoulos, M.A. Jeusfel (Es.), Proceeings of the 3r International Conference on Very Large Data Bases, VLDB 97, Morgan Kaufmann, Greece, pp , 1997 Nastar, C., Mitschke, M., Meilhac, C., etboujemaa, N. Surfimage : a flexible Content-base Image Retrieval System. In proceeing of the 6th ACM International Conference on multimeia (MULTIMEDIS 98), pages , Bristol, UK,1998 J. Nievergelt, H. Hinterberger, an K. Sevcik. The gri _le: An aaptable symmetric multikey _le structure. ACM Transactions on Database Systems, 9(1):38-71, Niblack, W., Barber, R.,Equitz, W., Flickner, M., Glasman, E., Petkovic, D., Yanker, P., Faloutsos, The QBIC project: Quering images by content unsing color, texture an shape. In proceeing of SPIE Conference on Storage an Retrieval for image an Vieo Databases, -3 February, San Jose, CA, pp , 1993 H.Lu, B.C.Ooi, H.T.Shen, X.Xue «Hierarchical Inexing Structure for Efficient Similarity Search in Vieo Retrieval». IEEE Transactions On Knowlege An Data Engineering, Vol 18, No. 11, November 006. Virginia E. Ogle an Michael Stonebraker. Chabot: Retrieval from a relational atabase of images. IEEE Computer, 8(9):40-48, September B.C. Ooi., K.L. Tan, C. Yu, S. Bressan, Inexing the Eges - A Simple an Yet Efficient Approach to High-Dimensional, in 19th ACM SIGMOD SIGACT SIGART Symposium on Principles of Database Systems, Dallas, USA, May, p , 000 R. Orlanic, an B. Yu, A retrieval technique for high-imensional ata an partially specifie queries, Data an Knowlege Engineering 4(1), 00,

159 Références Bibliographiques [Ort97] [OTYB00] [Pas96 a] [Pen 96] [Peng 03] [Per 77] [Pet 00] [Pic 96b] [Phi 08] [Sko 04] [Pre 9] [Puz 97] [Rob 81] pp.1- Michael Ortega, Yong Rui, Kaushik Chakrabarti, Shara Mehrotra, an Thomas S. Huang. Supporting similarity queries in MARS. In Proceeings of the 5th ACM International Multimeia Conference, Seattle, Washington, 8-14 Nov. '97, pages , B. C. Ooi, K. L. Tan, C. Yu, an S. Bressan. Inexing the eges - a simple an yet efficient approach to high-imensional. In Proceeings of 19-th ACM SIGMOD SIGACT SIGART Symposium on Principles of Database Systems, pages , Dallas, Texas, USA, 000. Pass G., Zabih R., «histogram refinement for content base image retrieval», 3r IEEE workshop on Applications of computer Vision, IEEE Computer Society, page 96, 1996 Pentlan A., Picar R, Sclaroff S., Photobook: Content-base Manipulation for Image Databases International Journal of Computer Vision, vole.18, n 3, p , Peng. J.; Heisterkamp, D.R. Kernel inexing for relevance feeback image retrieval Image Processing, 003. ICIP 003. Proceeings. 003 International Conference on Volume 1, Issue, Sept. 003 Page(s): I vol.1 Persson E., Fu K., Shape iscrimination using Fourier Descriptors, IEEE Transactions on Systemes, Man an Cybernetics, vol.7, n)3, p , 1996 Petrakis E., Milios E., shape retrievzl base on ynamique programming, IEEE Transactionon image Processing, vol. 9, n 1, p , 000 Picar R., Minka T., Szummer M., Moeling subjectivity in Image Libraries, IEEE international Conference on Image, Lausanne, september Philip, H., Matthieu, C., Sylvie, P., «Combining visual ictionary, kernel base similarity an learning strategy for image category retrieval, Computer Vision an Image Unerstaning ,008) T. Skopal, J. Pokorny, V. Snasel, PM-tree: pivotin metric tree for similarity search in multimeia atabases, in: G. Gottlob, A.A. Benczur, J. Demetrovics (Es.), Proceeings of the 8th East-European Conference Avances in Databases an Information Systems, ADBIS 04, Springer, Buapest, Hungary, pp , 004 W.H. Press, S.A. Teukolsky, W.T. Vetterling, an B.P. Flannery. Numerical Recipes in C The Art of Scientific Computing. Cambrigge University Press, n eition, 199. Puzicha, J., Hofmann, T., & Buhmann, JNon-parametric similarity measures for unsupervise texture segmentation an image retrieval. IEEE Conference on Computer Vision an Pattern Recognition (pp. 67{7),1997. J. Robinson. The k--b-tree: A search structure for large multiimensional ynamic inexes. In Proc. of the ACM SIGMOD Int. Conf. on Management

160 Références Bibliographiques of Data, pages l0-18, [Row 00] [Rui99] [Rub 99] [Sah 03] [Sam 84] [San 95] [Sbb 0] [See 90] [Sch 98] [Sch 01] [Sch 0] [Scl 95] [Sco 83] [Set 95] [Slim00] S. Roweis an L. Saul. Nonlinear imensionality reuction by locally linear embeing. Science, 90(5500) :33 36, 000. Yong Rui, Thomas S. Huang, an Shih-Fu Chang, Image retrieval: current techniques, promising irections an open issues, Journal of Visual Communication an Image Representation, Vol. 10, no. 4, pp. 39-6, April Rubner, YPerceptual metrics for image atabase navigation. Doctoral issertation, Stanfor University,1999 Sahbi, H., Machnies a vecteur e support pour une étection hiérarchiques es visages»,003 Samet, H.The quatree an Relate Hiearchical Data structures. ACM Computing Surveys, 16(), ,1984 Santini, S. et Jain, R. «Similarity Matchnig», In Proceeing of the n Asian Conference on Computer Vision (ACCV 95), pages , Singapore, 1995 S. M. Savaresi, D. Boley, S. Bittanti, an G. Gazzaniga. Cluster selection in ivisive clustering algorithms. In Proceeings of the Secon SIAM International Conference on Data Mining, Arlington, VA, USA. SIAM, 00 B. Seeger, an H.P. Kriegel, The Buy-tree: An Efficient an Robust Access Metho for Spatial Data Base Systems, Proc. 16th VLDB Conference, pp , 1990 B. Schölkopf, A. Smola, an K. Müller. Nonlinear component analysis as a kernel eigenvalue problem. Neural Computation, 10 : , Scholkopf, B., Platt, J. C., Shawe-Taylor, J. C., Smola, A. J., an Williamson, R. C. (001). Estimating the support of a high-imensional istribution. Neural Computation, 13(7) : B. Schölkopf, A. Smola. Learning with kernels. MIT Press, Cambrige, MA,00 Sclaroff S., Pentlan A., Moel Matching for corresponance an recognition, IEEE Transactions on Pattern Analysis an Machine intelligence, vol. 17, n 6, p , 1995 Scott, D.& Thompson, J. R. Probability ensity estimation in higher imensions. In the 15th Symposium on the Interface, North Hollan-Elsevier, Amsteram, New York, Oxfor., pages Sethi, I., & Patel, N. Statistical approach to scene change etection. Storage an Retrieval for Image an Vieo Databases (pp ).1995 C. Traina Jr., A. Traina, B. Seeger, C. Faloutsos, Slim-trees: high performance metric trees minimizing overlap between noes, in: C.Zaniolo, P.C. Lockemann, M.H. Scholl, T. Grust (Es.), Proceeings of the 7th International Conference on Extening Database Technology, EDBT 00, Springer, Konstanz, Germany, pp , 000

161 Références Bibliographiques [Smi 96] [Soz 05] [Str 95] [Str 96] [Str 95] [suy 0] [Swa 91] [Syu 00] [Sye 00] [Tea 80] [Thi 06] [Thi 05] [Ten 00] [Ter 98] Smith J., Chang S.-F., VisualSEEK: A Fully automate Content-base Image retrieval System, 4th ACM International Conference on Multimeia, Boston, Massachussets, Etats-Unis, p , November 1996 H. T. Shen, B. C. Ooi, an X. Zhou. Towars effective inexing for very large vieo sequence atabase. In Proceeings of the ACM SIGMOD International Conference on Management of Data, pages , Baltimore, Marylan, USA. ACM, 005 M. Stricker, A Orengo, "Similarity of color images", In Proc. SPIE Storage an Retrieval for Image an Vieo Databases III, Vol 40, pp , February M. Stricker, A. Dimai, "Color inexing with weak spatial constraints", In Proc. SPIE Storage an Retrieval for Image, Vol 670, pp. 9-40, 1996 Stricker, M., & Orengo, MSimilarity of color images. SPIE, Storage an Retrieval for Image Vieo Databases III (pp ).1995 Suykens, J. A. K., Van Gestel, T., De Brabanter, J., & De Moor, B. Least square support vector machines. Worl Scientifc Publishing Co., Pte, Lt., Singapore. 00 Swain M., Ballar D., Color Inexing, International Journal of Computer Vision, Vol. 7, n 1, p. 1-13, Y. Sakurai, M. Yoshikawa, S. Uemura, an H. Kojima. The a-tree : An inex structure for high-imensional spaces using relative approximation. In VLDB 000, Proceeings of 6th International Conference on Very Large Data Bases, September 10-14, 000, Cairo, Egypt, pages Morgan Kaufmann, 000. T. Syea-Mahmoo, D. Petkovic, "On escribing color an shape information in images", Signal Processing: Image Communication, Vol 16, pp , 000. Teague M., image analysis via the general theory of moment, Journal of optical society of America, vol. 0, n 8, p , 1980 Thierry Urruty, Fatima Belkouch an Chabane Djeraba. Inexation Multiimensionnelle : KpyrRec, une amélioration e Kpyr. ème journées Informatique es Organisation et Systèmes Information et e Décision (INFORSID-006), p , Hermès E., ISBN , Hammamet, Tunisie, 1er au 3 Juin 006. Urruty, T.; Belkouch, F.; Djeraba, C. KPYR: An Efficient Inexing Metho, Multimeia an Expo, 005. ICME 005. IEEE International Conference on volume, Issue, 6-6 July 005 Page(s): J. Tenenbaum, V. De Silva, an J. Langfor. A global geometric framework for non linear imensionality reuction. Science, 90(5500) :319 33, 000. Terrillon C., Davi M., Akamatsu S., «Automatic etection of human faces

162 Références Bibliographiques in natural scene images by use of a skin color moel an of invariant moments», IEEE transaction in natural scene images by use of a skin color moel an of invariant moments», IEEE International Conference on Automatic Face an Gesture Recognition, p , avril 1998 [Ter 0] T. Chen, M. Nakazato, S. Huang. Speeing up the similarity search in multimeia atabase.c00 IEEE. [Tor 65] Torgeson, W. S. Multiimensional Scaling of Similarity. Psychometrika, 30, , 1965 [Tra 00] C. Traina Jr., A. Traina, B. Seeger, C. Faloutsos, Slim-trees: high performance metric trees minimizing overlap between noes, in: C. Zaniolo, P.C. Lockemann, M.H. Scholl, T. Grust (Es.), Proceeings of the 7th International Conference on Extening Database Technology, EDBT 00, Springer, Konstanz, Germany, 000, pp [Tve 77] Tversky, A. Feature of Similarity. Psychological Review, 84-(4), 37-35, 1977 [Vap 99] [Wal 95] [Web 98] [Wu 00] [Yi 05] [YOT 01] [Yu 03] [Zha 01] [Zhang 04] [Zot 04] Vapnik,, V. N. (1999). Statistical learning theory. Wiley-Interscience, New York. Walin A., Kubller O., compete sets of complex Zernik moments an the role of pseuoinvariancets, IEEE Transactions on Pattern Analysis an Machine intelligence, vol. 17, n, p , 1995 R. Weber, H.Schok, S. Blott.A Quantitative Analysis an Performance Stuy for Similarity-Search Methos in High-Dimensional Space. Proceeings of the 4th VLDB Conference New York, USA Wu, P., Manjunath, B.S., & Shin, H. D. (000). Dimensionality reuction for image search. In Proceeings of the 7th International conference on Image Processing, Vancouver, Canaa Yi Lin, h., Huang P., Perfect KDB-Tree; A compact KDB-Tree Structure for inexing Multiimensional Data. In Proceeing of the Thir International Conference on Information Technology an Applications (ICITA 05), 005. C. Yu, B.C. Ooi, K.-L. Tan an H.V. Jagaish, Inexing the istance: An efficient metho to Knn processing, in VLDB, September 001, p B. Yu, T. Bailey, R. Orlanic, an J. Somavaram, KDBKD-Tree: a compact KDB-tree structure for inexing multiimensional ata, Proc. International Conférence on Information Technologie, 003. Zhang D., Lu G., Content-base shape retrieval using ifferent shape escriptors: a comparative stuy, IEEE International conference on multimeia an Expo, p , août 001 Zhang D. an G. Lu. Review of shape representation an escription techniques. Pattern Recognition, 37:1-19, 004. R. Zhang, B.C. Ooi an K.L. Tan, Making the Pyrami Technique Robust to Query Types an Workloas, in IEEE ICDE, 0th International Conference on Data Engineering, Boston, USA, April p ,004

163 Références Bibliographiques

164 UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat DOCTORAT Résumé e la Thèse* Discipline : Sciences e l ingénieur Spécialité : Informatique & Télécommunications UFR : Informatique & Télécommunications Responsable e l UFR : Pr. Driss ABOUTAJDINE Périoe accréitation : Titre e la thèse : «Recherche par similarité ans les bases e onnées multiméia : application à la recherche par le contenu images» Prénom, Nom : Imane, DAOUDI Résumé L émergence es onnées numériques multiméia ne cesse augmenter. L accès, le partage, le stockage et la recherche e ces onnées sont evenus es besoins réels et les problématiques sont nombreuses et variées. Afin e renre cette masse information facilement exploitable pour tout utilisateur, il est nécessaire e isposer e techniques inexation et e recherche rapies et efficaces. Mes travaux e thèse s inscrivent ans le omaine es onnées multiméia et plus précisément es images fixes. L objectif principal est e évelopper une méthoe performante inexation et e recherche es k plus proches voisins ( k ppv ) qui soit aaptée à la recherche image par le contenu et aux propriétés es escripteurs images (gran volume, grane imension, hétérogénéité, etc.). Il s agit une part, apporter es réponses aux problèmes e passage à l échelle et e la maléiction e la imension et autre part e traiter les problèmes e mesure e similarité qui se posent, et qui sont liés à la nature es onnées manipulées. Notre première proposition consiste en l utilisation une structure inexation multiimensionnelle basée sur l approximation ou filtrage, par une amélioration e la méthoe RA-Blocks. Elle repose sur un algorithme e écoupage e l espace e onnées qui améliore notablement la capacité e stockage e l inex ainsi que le temps e la recherche. Dans un euxième temps, nous proposons une méthoe inexation multiimensionnelle aaptée à es onnées hétérogènes (couleur, texture, forme). Notre méthoe combine une technique non linéaire e la réuction e la imension à une structure inexation multiimensionnelle basée sur l approche approximation. Cette combinaison permet e réponre à travers, un formalisme unique, aux ifférents verrous que nous nous sommes fixés e lever. Mots-clefs : Inexation, multiimensionnelle, k ppv, recherche par similarité, fonction noyau, CBIR * Le présent résumé sera publié conformément à l article 10 u écret N u 19 Février Faculté es Sciences, 4 Avenue Ibn Battouta B.P RP, Rabat Maroc Tel +1 (0) /35/38, Fax : +1 (0) ,

Montrer encore