Indexation d images. Tina Nikoukhah & Jonathan Pucci

Documents pareils
Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

L évaluation d algorithmes d analyse vidéo Quelques pistes

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Optimisation, traitement d image et éclipse de Soleil

Introduction au Data-Mining

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Géométrie discrète Chapitre V

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Big Data et Graphes : Quelques pistes de recherche

Cognit Ive Cas d utilisation

Traitement numérique de l'image. Raphaël Isdant

Bases de données documentaires et distribuées Cours NFE04

La classification automatique de données quantitatives

Reconnaissance de gestes : approches 2D & 3D

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Codage vidéo par block matching adaptatif

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

7. ECONOMIE 7.1. TRAVAIL DE BUREAU ENCODEUR / ENCODEUSE DE DONNEES

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

Commencer avec doo sous OS X

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Masses de données et calcul : à l IRIT. 8 octobre 2013

Clé USB. Quel type de données peut contenir une clé USB?

Cours Fonctions de deux variables

Big Data et Graphes : Quelques pistes de recherche

rivista & portale media kit 2015 portail, web marketing et guide scanpages France

Introduction aux Bases de Données Relationnelles Conclusion - 1

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Introduction au Data-Mining

IFT3913 Qualité du logiciel et métriques. Chapitre 2 Modèles de processus du développement du logiciel. Plan du cours

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues


Mode d'emploi du plugin Grayscale_Granulometry

IFO. Soleil. Antoine COUSYN 29/07/ /02/2015. Vidéo. Manipur, Inde. Saturation du capteur CMOS. 19 Juin h11 heure locale.

Master d Informatique M1 Université Paris 7 - Denis Diderot Travail de Recherche Encadré Surf Bayesien

Décompresser, créer une archive au format «ZIP»

GMEC1311 Dessin d ingénierie. Chapitre 1: Introduction

Chapitre 2 : Caractéristiques du mouvement d un solide

PROJET ALGORITHMIQUE ET PROGRAMMATION II


Description de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0

Master 2 Recherche en Informatique Responsable du master : Prof. Zoubir MAMMERI

L apprentissage automatique

1S9 Balances des blancs

Analyseur d émotions à partir d expressions faciales

Documalis. Denis SCHIRRA GSM : Plus d information sur notre site Internet


Introduction à MATLAB R

Mesure agnostique de la qualité des images.

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Présentation BAI -CITC

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

TP SIN Traitement d image

Optimiser le référencement naturel de son site web

Nom : Groupe : Date : 1. Quels sont les deux types de dessins les plus utilisés en technologie?

DATA ANALYTICS Des données aux connaissances et à la création de valeur

Synthèse d'images I. Venceslas BIRI IGM Université de Marne La

LIVRE BLANC Décembre 2014

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus..

Traitement bas-niveau

L environnement de travail de Windows 8

Ressources lexicales au service de recherche et d indexation des images

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Entrepôt de données 1. Introduction

Je travaille mon image! Diffuser ses photos sur le web Mardi 14 avril 2015

Analyse dialectométrique des parlers berbères de Kabylie

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Analyse multi-échelle de trajectoires de points critiques pour la reconnaissance d actions humaines

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

Initiation à LabView : Les exemples d applications :

Ministère des Affaires étrangères et européennes

Utiliser Access ou Excel pour gérer vos données

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Comment sélectionner des sommets, des arêtes et des faces avec Blender?

Un duo de choc : DocuWare et Microsoft Outlook

Extraction d informations stratégiques par Analyse en Composantes Principales

Fouille de données massives avec Hadoop

Les escaliers nécessitent quelques particularités pour assurer la sécurité de tous.

Tâche complexe produite par l académie de Clermont-Ferrand. Mai 2012 LE TIR A L ARC. (d après une idée du collège des Portes du Midi de Maurs)

Object Removal by Exemplar-Based Inpainting

Communications immersives : Enjeux et perspectives

FORMATION TIC. Animer une communauté sur les réseaux sociaux

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet.

Apprentissage Automatique

Chapitre 18 : Transmettre et stocker de l information

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

NEC Virtual PC Center

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Cliquez sur une image pour l'agrandir

L usage des concepts du web sémantique dans le filtrage d information collaboratif

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

données en connaissance et en actions?

Licence ODbL (Open Database Licence) - IdéesLibres.org

Sillage Météo. Notion de sillage

ANALYSE CATIA V5. 14/02/2011 Daniel Geffroy IUT GMP Le Mans

Chapitre 02. Gestion de l'information

Atelier numérique Développement économique de Courbevoie

Transcription:

Indexation d images Tina Nikoukhah & Jonathan Pucci

But du jeu :

Comment? Chaque minute de chaque jour : - 72 heures de vidéos sur Youtube 216 000 photos sur Instagram 277 000 messages sur Tweeter 2 460 000 publications sur Facebook Comment organiser au mieux toutes ces données afin de pouvoir retrouver facilement ce qui m intéresse?

L indexation Constituer une base de donnée - extraction des descripteurs - stockage par similarité dans un index Interroger la base - extraction des descripteurs - comparaison

Comment? - par le texte L indexation sémantique (textuelle) Indexation textuelle manuelle - iconographe - hard indexing / soft indexing -> problème du choix des termes : non subjectifs, pas assez variés Indexation textuelle automatique - pas d intervention humaine nécessaire - texte environnant/contenu -> problème de pertinence : beaucoup trop d erreurs

Comment? - par le contenu Etape d extraction des caractéristiques visuelles de l image : Texture, couleur, forme, Histogramme des couleurs -> problème d invariance aux changements de luminosité

Comment? - Contextuel - A/ Detection des points d intérêt : Harris, Laplace, blablabla Detecteur de contours, de coins, de blobs (zones uniformes) - B/ Extraction des caractéristiques Sift,PCA-Sift, SURF : vecteur de pixels but : robuste et rapide - C/ Construction du voc contextuel Caractéristiques -> mots (1 vecteur de feature = 1 mot? Trop) Clustering : 1 mot = centre du cluster Ainsi, un mot est assigné à chaque région et une image peut-être représentée par un histogramme des mots visuels contenus dans cette image. D/ Comparaison des images Recherche dans les arbres avec les notions de distances entre histogrammes (ou simple distance euclidienne des mots)

Comment? - Contextuel _ Feature Detection Détection des caractéristiques: Détecteur de coins/contours de Harris -> Pas invariant aux changement d échelle Détecteur de points d intérêts Maxima de la Hessienne

Comment? - Contextuel _Feature extraction - Extraction des caractéristiques But : se servir des points d intérêt trouvés précédemment pour caractériser l image => extraire les features. Moyen : Une feature = Un mot du vocabulaire visuel. Un mot = Un vecteur à? dimensions. Méthodes : Sift,PCA-Sift, SURF

Scale Invariant Feature Transform (SIFT) Détection de points clés : Défini par ses coordonnées sur l image (x,y) et son facteur d échelle En gros : zone d intérêt circulaire de rayon proportionnel à. Méthode : LoG (Laplacian of Gaussian) Détection des extremums dans l espace des échelles (avec une pyramide)

Scale Invariant Feature Transform (SIFT) Pb des extremums : zones larges, points approximatifs, répétitifs Améliorations : Supprimer les faibles contrastes Supprimer les points sur arrêtes

Scale Invariant Feature Transform (SIFT) Une dernière étape avant de donner le descripteur SIFT: Rendre invariant par rotation 1 descripteur décrit un point d intérêt son orientation : Gradient( ).

Scale Invariant Feature Transform (SIFT) Le descripteur SIFT: Un point clé : - Modifier le sys de coord local Rotation de -θ - Région de 16 16 pixels, subdivisée en 4 4 zones de 4 4 pixels chacune - histogramme des orientations Comportant 8 intervalles 16 histogrammes concaténés, normalisés = Vecteur dimension 128 : DESCRIPTEUR

Speeded Up Robust Feature (SURF) Même principe pour les points d intérêt mais plus rapide! Box filter (Approx. D^2(Gauss)) Image intégrale

SURF Extraction des features : Orientation

SURF Extraction des features : Descripteur

SURF Extraction des features : Descripteur Chaque sous-région est décrite par un vecteur de 4 éléments : (Σdx, Σdy, Σldxl, Σldyl). 16 sous-régions Signature => Vecteur de dimension 64.

SIFT - SURF Clustering Maintenant que les descripteurs sont donnés, on a le vocabulaire visuel de l image. Il faut en faire des classes pour les futures comparaisons. Exemple : K-means

Histogramme visuel

SIFT -SURF Représentation des images avec un vocabulaire créé: - Detection des points d intérêt Elagage Invariant par rotation Définition des descripteurs Indexation par classes Définition de l histogramme des images Comment retrouver mon image dans une base de donnée?

La recherche par similarité -> dépend des choix faits lors de la phase d indexation des images de la base de données Recherche dans un arbre de données La similarité est mesurée par une distance -> méthode d intersection des histogrammes -> distance euclidienne directement entre les descripteurs Algorithme de recherche des plus proches voisins Sélection des cellules les plus pertinentes Sélection des vecteurs les plus pertinents

Un Beau Schéma Pour résumer

CONCLUSION Le choix de la méthode dépend de l application. Les étapes à retenir : extraire des images les descripteurs visuels qui permettent de retrouver efficacement des images similaires, trouver une représentation pertinente de ces descripteurs, trouver une mesure de similarité efficace, accéder rapidement à l'information.