INDEXATION des IMAGES. Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007

Documents pareils
Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

N. Paparoditis, Laboratoire MATIS

Introduction au datamining

Introduction au Data-Mining

Introduction au Data-Mining

Apprentissage Automatique

Mesure agnostique de la qualité des images.

Big Data et Graphes : Quelques pistes de recherche

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

La classification automatique de données quantitatives

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

ISTEX, vers des services innovants d accès à la connaissance

INF6304 Interfaces Intelligentes

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Big Data et Graphes : Quelques pistes de recherche

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Business Intelligence avec Excel, Power BI et Office 365

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Veille - recherche enrichissement. Veille sur les technologies et pratiques émergentes Recherche :

Ebauche Rapport finale

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Business Intelligence

MABioVis. Bio-informatique et la

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos

Quels apprentissages info-documentaires au collège?

INTRODUCTION AU DATA MINING

Master Informatique Aix-Marseille Université

Analyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains

Traitement bas-niveau

Partager en ligne 2.0 Nokia N76-1

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus..

Vers une Optimisation de l Algorithme AntTreeStoch

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Systèmes d information et bases de données (niveau 1)

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Recherche bibliographique

Table des matières La gestion de musée en toute simplicité Atouts fonctionnels Atouts techniques > > > > > > > > > > > > > >

Partage en ligne 3.1. Édition 1

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Travail collaboratif à distance

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Géométrie discrète Chapitre V

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

Traitement numérique de l'image. Raphaël Isdant

Sauvegarde collaborative en pair-à-pair

Laboratoire 4 Développement d un système intelligent

Couplage d une base de données documentaire à une visualisation interactive 3D sur l Internet

De la production collaborative à la capitalisation des connaissances Le rôle des documentalistes

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES


Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Évaluation et implémentation des langages

10ème Congrès Français d'acoustique Lyon, Avril 2010

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

ACQUISITION. Traitement de l image. Classement. Préparation. Ouverture. Performance

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

4.2 Unités d enseignement du M1


FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Cognit Ive Cas d utilisation

données en connaissance et en actions?

Protection des données personnelles : Vers un Web personnel sécurisé

Coup de Projecteur sur les Réseaux de Neurones

Chapitre 1 : Introduction aux bases de données

Concevoir sa stratégie de recherche d information

Les algorithmes de fouille de données

Les tablettes. Présentation tablettes Descriptif Fournisseurs Caractéristiques Comparatifs Conseils Perspectives Démonstration

et les Systèmes Multidimensionnels

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Base de données bibliographiques Pubmed-Medline

Enjeux mathématiques et Statistiques du Big Data

Spécificités, Applications et Outils

Compte-rendu re union Campus AAR 3 mars 2015

Usages pédagogiques des tablettes

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Classification non supervisée

Mode d emploi. Bienvenue sur notrehistoire.ch et merci de votre inscription. Introduction

L évaluation d algorithmes d analyse vidéo Quelques pistes

Étude Olfeo 2013 : La réalité de l utilisation d Internet au bureau page : 1/15

Transcription:

INDEXATION des IMAGES Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007

Plan du cours Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Plan du cours Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Eemple participatif : photothèque personnelle De combien d'images disposez vous? Comment gérez vous vos photos numériques (organisation, classement)? Comment accédez vous au photos que vous recherchez (types de requêtes)? N'importe qui peut-il trouver une photo dans votre base?...

Eemple participatif : photothèque personnelle informations disponibles avec les photos Informations attachées : date, auteur Informations globales sur le contenu : personnage central, événement, etc. Est-ce suffisant? Comment stocker ces informations simultanément? Votre système pourrait-il fonctionner avec un million de photos?

Indeer? Indeer = etraire une information synthétique des images afin de faciliter l'accès à leur contenu domaines scientifiques concernés : fouille de données (data mining), classification, ingénierie des connaissances, vision artificielle, SGBD,... information = élément susceptible d'être codé pour être conservé, traité, communiqué inde = clé d'accès à l'information contenue dans l'image

Définitions Catalogue : Classification : Eploitation de données globales sur le document visuel, indépendantes du contenu Eploitation d une caractéristique globale du document visuel Indeation Eploitation d une analyse fine du contenu du document visuel

Quelques chiffres INA (http://www.ina.fr/) : 100 000 h d'émissions TV et radio à télécharger, archivage de toutes les émissions Google (http://images.google.com/): > 2 milliards d'images indeées et maintenant vidéos, films Flickr (http://www.flickr.com/) : partage de photos personnelles (annotations collaboratives) http://www.fotosearch.fr/ : 700 000 photos et vidéos de plus de 50 éditeurs de banques de photographies, d'images et de séquences vidéo, ainsi que des cliparts, illustrations et cartes géographiques Musées nationau (http://photo.rmn.fr/) : fonds de 500 000 images d'art (200 000 numérisées) Images médicales (http://www.bmlweb.org/image.html) : images spécialisées

pourquoi indeer? Conservation d un patrimoine (culturel, scientifique, ) Valorisation en facilitant l accès et l eploration indeer pour retrouver, trier indeer pour connaître Eploitation commerciale (photos numériques, TV numérique, ) indeer pour naviguer

Les difficultés majeures de l'indeation "Fossé sémantique" : comment accéder à/coder une information visuelle? Spécificité des images : médicales, satellitaires, vidéo, photos, 3D,... Diversité des formats des images : compression, prétraitements Grande taille des bases de données => vers une automatisation des procédés Comment eploiter des informations associées («multimodalité»)?

Quelle est l'information?

Comment indeer des émotions?

Les mots ne suffisent pas...

Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Quelques dates 1980 : Annotation tetuelle des images 1990 : Indeation par la couleur, la forme et la teture 1993 : Requête en utilisant la similarité des images 1997 : Requête par images eemplaires et mesure de la pertinence (relevance feedback) 2000 : apprentissage sémantique et adaptation à l utilisateur Enjeu actuels : annotation interactive, formalisation de la connaissance (ontologies), grosses bases de données (problèmes de stockage, de vitesse d accès, ), données hétérogènes,

Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Acteurs professionnels Bibliothécaires/documentalistes rôle : traitement et analyse du contenu, diffusion de l'information, veille cf Wikipedia : nouvelles technologies => mort de ces métiers?? non car l'information doit être rapidement obtenue, pertinente, actualisée, vérifiée + sources associées, supports multiples «Indeeurs» humains n'importe qui? cf Google Méthodologie? Pb du coût

Acteurs industriels Moteurs de recherche (Google, Yahoo) Virage, QBIC (IBM) technologie = à partir du tete associé Vidéo Les solutions françaises : LTU Technologies NewPheni (CEA) http://www.new-pheni.com/

Acteurs industriels : un eemple français LTU technologies : http://www.ltutech.com/ fondée en 1999 par des chercheurs (MIT, Oford University, INRIA) Image-seeker appliqué à : Police INPI Shopping par l'image Collections privées (Cordis) Moteur de recherche : Ealead

Acteurs académiques VisualSeek (Columbia University) http://www.ee.columbia.edu/ln/dvmm/researchprojects/multimediaindeing/visualseek/visualseek.htm Projets européens passés : DIVAN (INA), actuels : QUAERO, K-Space Projets nationau Infomagic (pôle de compétitivité) ACI masse de données : QUERYSAT, EFIGI,... Projets de labos IMEDIA (INRIA, Rocquencourt), RETIN (ETIS, Cergy), KIWI (Insa, Lyon)

Plan du cours Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Comment interroger une base d'images? Diversité des approches Les systèmes imposent des types de requête : Recherche à partir du tete associé Recherche d une image dans une base (localiser) Recherche d images similaires à une image eemplaire Recherche d images similaires à des images eemples et dissimilaires à d autres Recherche d images contenant une région de l image eemplaire

Définitions

Comment indeer/interroger des images? Point de vue «utilisateur» dépend du type de requêtes (bases ouvertes ou spécialisées, requêtes catégorielles ou eactes) Point de vue epert «Traitement du signal» A partir du tete (requêtes tetuelles) Par le contenu (requêtes par l'eemple) Point de vue epert «Informatique» Problème de représentation des connaissances (ontologies) Problème de stockage des connaissances (bases de données)

Indeation d images à partir du tete

Indeation d images à partir du tete ROME (AFP), 2005-06-11 13:10:52 L'Italienne Clementina Cantoni arrive vendredi 10 juin sur le sol italien après 25 jours de détention en Afghanistan

Recherche d'images par le tete

Indeation d images à partir du tete Une image illustre un document mais le document ne décrit pas forcément l image ; La richesse du contenu d une image dépend du domaine de connaissances de celui qui la regarde ; Le tete accompagnateur d une image ne suffit généralement pas Nécessité de modéliser ce domaine Aspects subjectifs du contenu Plus facile de faire une description des objets contenus dans l image que des émotions qui en résultent

Indeation d images à partir du tete Avantages : eploite les outils d indeation tetuelle, prise en compte plus aisée des aspects sémantiques. Inconvénients : vocabulaire limité (dépend de la langue) difficultés de l annotation : définition du vocabulaire, temps d annotation >> temps réel, subjectivité, etc.

Plan du cours Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Indeation par le contenu : principe (1/2) Images Etraction de caractéristiques Requêtes utilisateur Sélection de caractéristiques Caractéristiques Caract.+ étiquettes Organisation (apprentissage supervisé/ non supervisé) Modèles Modèles étiquetés

Principe (2/2) Off-line : production d inde issus de l analyse du contenu des images Etraction de caractéristiques pertinentes Réduction de la dimension Organisation par classification On-line : gestion des requêtes d un utilisateur «Gap sémantique» Relevance feedback

Etraction de caractéristiques Caractéristiques : Spécifiques : points saillants (Harris, Deriche,...), minuties, SIFT,... Générales : couleur, teture, forme Combinaisons : descripteurs locau autour de des points caractéristiques (gradients, ondelettes,...) Globale ou locale : Blocs arbitraires, segmentation, information topologique

Etraction de caractéristiques Problème de représentation Caractéristiques numériques, symboliques, graphes, Invariances Translation, rotation, homothétie, colorimétrie déformations : taille, cadrage, masquage, perspective, contraste, éclairage, vieillissement toujours nécessaires? Quelles caractéristiques choisir?

Eemple : appariement de minuties

Eemple : appariement de minuties Etraction des points Mise en correspondance Les difficultés classiques détection erronées de points déformations non linéaires des empreintes (appui de la pulpe du doigt) Solution?

Eemple : retrouver un objet sujet à déformations http://www.cs.ubc.ca/~lowe/keypoints/ Approche par points caractéristiques SIFT (Scale Invariant Feature Transform) Lowe, 2004 invariance par échelle, rotation, point de vue, conditions d'éclairage Etraction des points caractéristiques etrema locau du Laplacien dans le «scale-space» Filtrage des points caractéristiques critère de stabilité, seuillage du contraste,... Descripteurs associées au points caractéristiques histogramme local des orientations du gradient Application : Plus proches voisins + transformée de Hough

SIFT : Détection des points caractéristiques Etrait de «Distinctive Image Features from Scale Invariants Keypoints» Lowe, IJCV, 2004

SIFT : Détection des points caractéristiques

SIFT : Caractérisation des points caractéristiques

SIFT : illustration de mise en correspondance Robustesse des 50 100 descripteurs (J. Rabin - 2006) 150 200 250 300 350 400 450 200 400 600 800 1000 1200

3D : quelles caractéristiques?

Eemple : retrouver une scène? Description globale (forme, couleur, teture) Compacte mais... Description locale segmentation + caractérisation des régions

Eemple : retrouver une scène similaire? requête

Eemple : retrouver une scène similaire? J. Chen, Adaptive perceptual color-teture image segmentation, IEEE Trans. Pattern Analysis and Machine Intelligence, Vol: 14, pp. 1524-1536, 2005.

Images et notion de similarité

Images similaires?

Images similaires?

Similarité mathématique Deu images seront comparées par l intermédiaire des caractéristiques etraites Sim( Im1, Im2 ) = Sim( f(im1), f(im2) ), avec f la fonction d etraction des caractéristiques Mesures de similarités, distances (A) s(, ) = s( y, y ) > s(, y ) (B) s(, y ) = s( y, ) (C) d(, ) = 0 (D) d(,y) = 0 = y (E) d(, y) <= d(,z) + d(z,y) (F) d(,y) <= ma( d(,z), d(z,y) ) similarité dissimilarité distance Ultra-métrique

Similarité mathématique Distance euclidienne Distance euclidienne généralisée Malahanobis Chi2 Similarité en cosinus Combinaisons linéaires de similarités (ou distances)

Similarité de l information Comparaison des caractéristiques après une transformation Φ «Truc du noyau» K(,y) = < Φ(), Φ(y)>, K semi-defini positif D(,y) = <,> + <y,y> -2<,y> devient D(Φ(), Φ(y) ) = K(,) + K(y,y) -2K(,y) Intérêt : la spécification de K définit implicitement Φ Intensivement utilisé pour ACP, la discrimination de Fisher, la classification SVM,

Réduction d information Beaucoup de caractéristiques possibles, beaucoup de manières de les comparer : lesquelles sont les meilleures dans un contete donné? Réduction de dimension ACP, ACI Algorithmes de sélection Quantification (forme de clusterisation)

Réduction d information Eploiter la redondance pour etraire une représentation compacte Assurer la complétude de la représentation, dans le contete de l'application

Organisation de l'information SGBD Classification des informations supervisée ou non permet d'accéder à l'information recherchée par raffinements successifs

Organisation de l information Classification supervisée : données X (caractéristiques) et label Y Coût d'obtention des Y? Eemples : kppv, SVM, Bayes, arbres de décision (C45.1) Évaluation d une classification : Décompte des erreurs Validation croisée

Organisation de l information Clusterisation : données X Partitionnement : kmeans Hiérarchique : arbres Minimiser la distance intra-classes et maimiser la distance inter-classes Évaluation : pas évidente Estimation du nombre de clusters : indees de Calinsky, Davies Bouldin, Dunn, MDL Mesure de la qualité? Comparaison : information mutuelle,...

Plan du cours Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Évaluation Critères objectifs/subjectifs? Mesures objectives sur bases de données étiquetées : Courbes ROC, aire sous la courbe ROC (AUC), eploitation du rang (cf MPEG 7) Évaluation et eploitation par un utilisateur boucle de pertinence ou «relevance feedback»

Évaluation objective : Rappel/Précision Source : http://www.webmaster-hub.com/publication/applications-des-outils.html précision = rappel = documents trouvés documents sélectionnés documents trouvés documents pertinents

Évaluation objective : courbes Rappel/Précision Graphe de rappel-précision calculé en faisant varier le nombre de documents sélectionnés nécessite une base étiquetée Tous les documents sélectionnés sont pertinents mais silence important et Tous les documents pertinents sont sélectionnés mais bruit important

Évaluation objective : eemple Ding-Yun Chen, Xiao-Pei Tian, Yu-Te Shen and Ming Ouhyoung, "On Visual Similarity Based 3D Model Retrieval", Computer Graphics Forum (EUROGRAPHICS'03), Vol. 22, No. 3, pp. 223-232, Sept. 2003

Évaluation objective : AUC Aire sous la courbe ROC (Receiver Operating Characteristics) Precision (tau de vrais positifs) fonction de 1Rappel (= bruit ou tau de fau positifs) Source : http://gim.unmc.edu/dtests/roc3.htm

Évaluation objective : eploitation du rang Eploitation du rang de récupération Critère de validation de MPEG7 (Motion Picture Epert group, normalisé en 2001) Rank*(k) = rang(k) si < K(q), 1.25K sinon AVR(q) : moyenne des rangs MRR(q) = AVR(q) 0.5( 1 + NG(q) ) NMRR(q) = MRR(q) / ( 1.25K 0.5(1+NG(q)) ) Critère final : moyenne des NMRR Notations : q = 1 requête ; k = une image pertinente pour la requête ; NG(q) nombre d images pertinentes pour la requête ; K limite de rang acceptable

Évaluation par un utilisateur Défaut majeur des systèmes standards : l utilisateur doit s adapter au système Caractéristiques etraites automatiquement non intuitives Fossé entre la formulation des requêtes et le codage de l information etraite Nécessité d adapter le système à l utilisateur Apprentissage : requêtes, mesures de similarités

Feedback utilisateur Images Requêtes utilisateur Etraction de caractéristiques Sélection de caractéristiques Caractéristiques Caract.+ étiquettes Organisation Modèles Modèles étiquetés

Feedback utilisateur IKONA (INRIA Rocquencourt)

Plan du cours Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un système d'indeation Prochain cours : des eemples pratiques

Applications Imagerie satellitaire : indeation et fouille Vidéo Démonstrations en ligne

Conclusion Indeation des images : problème non résolu, mais il eiste déjà de nombreuses applications (commerciales) Eperts issus de domaines variés (informatique, traitement de l image, psycho-vision, apprentissage machine, ) travaillent ensemble Aes à étudier simultanément : Techniques d analyse d image donc d etraction et de comparaison de l information Pertinence de l information pour un utilisateur

Les sites à visiter http://www.quintura.com/ http://clusty.com/ http://www.searchmash.com/ http://www.like.com/ http://www-rocq.inria.fr/imedia/webdemo/inde.html http://viper.unige.ch//research/cbir.html