Quelques propriétés et limites des sacs de mots visuels

Documents pareils
Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Recherche d Information(RI): Fondements et illustration avec Apache Lucene. par Majirus

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie

Comment rendre un site d e-commerce intelligent

Master4Light. Caractérisation Optique et Electrique des Sources Lumineuses. Equipement 2-en-1 : source de courant et spectrophotomètre

Apprentissage Automatique

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Jean-Philippe Préaux

Monitoring elderly People by Means of Cameras

Singapore Schools Green Mark Scheme on Indoor Air Quality

Apprentissage symbolique et statistique à l ère du mariage pour tous

Laboratoire 4 Développement d un système intelligent

Algorithmes pour la planification de mouvements en robotique non-holonome

Analyse des réclamations d allocataires de la CAF : un cas d étude en fouille de données

Bases de données documentaires et distribuées Cours NFE04

Intégration de la dimension sémantique dans les réseaux sociaux

Multi-catégorisation de textes juridiques et retour de pertinence

IdR Trading et Microstructure CA Cheuvreux. Charles-Albert Lehalle

Mesure agnostique de la qualité des images.

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Extraction de caractéristiques visuelles d'images médicales pour la recherche par similitude et l'aide au diagnostic

Filtrage stochastique non linéaire par la théorie de représentation des martingales

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' /0 / * 0 4 * 0 6! "##$ % &!

Prof. PhD Mathias J. Rossi

Utilisation des Points d Intérêts Couleurs pour le Suivi d Objets

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Master d Informatique M1 Université Paris 7 - Denis Diderot Travail de Recherche Encadré Surf Bayesien

Evaluation des modèles non-linéaires à effets mixtes

Big$data,$le$Web$et$tout$ça $ De$quel$volume$parleDton$?$ Surcharge$d informa>on$ Introduction à la fouille de texte Master Informatique 1 ère année

Apprentissage statistique dans les graphes et les réseaux sociaux

Safe Browsing: to Track, Censor and Protect

Introduction à la Recherche d information

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

MAD: une plateforme mobile pour l annotation de document vers la classification

Identite. Free Reporting Software

Distinguer les requêtes pour améliorer la recherche d information XML

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Glossaire suivi SEO. Glossaire suivi SEO. Document : Suivi SEO. Projet : Date : 18/02/15. Version : 1

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

MODELE A CORRECTION D ERREUR ET APPLICATIONS

La classification automatique de données quantitatives

Vérification audiovisuelle de l identité


Anne-Sophie FERNANDEZ

Propriétés du Document EMA. Résumé

Face Recognition Performance: Man vs. Machine

5. Apprentissage pour le filtrage collaboratif

Apports des réseaux sociaux dans les SI

Application de K-means à la définition du nombre de VM optimal dans un cloud

Chapitre 5 : Flot maximal dans un graphe

Echantillonnage Non uniforme

Les stratégies de communication des leaders RH

Bases de données réparties: Fragmentation et allocation

Guide D installation de l adaptateur téléphonique analogique HandyTone

Architecture des Systèmes d Information Architecture des Systèmes d Information

Lire ; Compter ; Tester... avec R

MEMOIRE. Présenté par. Pour obtenir DIPLOME. Intitulé : B. Beldjilalii. B. Atmani. Encadreur : F. Barigou. S. Nait Bahloul. M.

Recherche visuo-textuelle d images sur le Web améliorée par sélection de la dimension

Codage vidéo par block matching adaptatif

Adaptation du modèle de langue pour le tri des réponses dans les BD

Réplication adaptative sur les réseaux P2P

Fondation Mérieux 22 avril Un projet Fondateur. J. Breton Thésame

I.1 Introduction. I.2 La recherche d information. I.2.1 Définitions

CURRICULUM VITAE. CHAMP DE SPÉCIALISATION Économie financière. Économétrie financière. Économétrie.

Mesures de temps de propagation de groupe sur convertisseurs de fréquence sans accès aux OL

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Les modes de recherche sur le Web 2.0

Application Form/ Formulaire de demande


ANGULAR JS AVEC GDE GOOGLE

n.paradoxa online, issue 3 May 1997

Entreprise et Big Data

http ://

escan Entreprise Edititon Specialist Computer Distribution

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Enjeux mathématiques et Statistiques du Big Data

Plus courts chemins, programmation dynamique

Université de XY University of XY. Faculté XY Faculty of XY

Démonter)le)moteur) ) de)recherche. Jian%Yun(Nie DIRO h0p:// nie@iro.umontreal.ca

Pascale Betinelli CEA LIST. Demi-journée d'information ECHORD++ 20 avril M.E.N.E.S.R

État de l art sur les Systèmes de Recommandation

Youssef LYHYAOUI Ingénieur Java/J2EE, SOA, ESB, Web services 31 ans Statut : Indépendant SITUATION ACTUELLE

Sélection de Caractéristiques pour le Filtrage de Spams

DESIGN GRAPHIQUE GRAPHIC DESIGN

Recherche de conversations dans les réseaux sociaux : modélisation et expérimentations sur Twitter.

Cours d analyse numérique SMI-S4

Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Reconnaissance de gestes : approches 2D & 3D

Simulation de point de vue pour la localisation d une caméra à partir d un modèle non structuré

Ressources lexicales au service de recherche et d indexation des images

Création intuitive des éléments d un paysage

ArtemiS 12 HEAD Data Portal 2.0 HEAD Recorder

Exemple PLS avec SAS

Utilisation d outils de Visual Data Mining pour l exploration d un ensemble de règles d association

Tour d horizon de l apprentissage statistique. from Machine Learning to Big Data Analytics

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Transcription:

Quelques propriétés et limites des sacs de mots visuels 1, Vincent Claveau 1, Patrick Gros 2 1 CNRS-IRISA, 2 INRIA Rennes 9 juin 2009

Recherche d'images

Vocabulaire visuel [SZ03, CDF + 04]

Modèle vectoriel [SZ03, CDF + 04]

Plan 1 2 3 4

Caltech Caltech-6 5415 images 6 catégories 200 requêtes Caltech-101 8197 images 101 catégories 200 requêtes

Nister 10200 images 4 images pertinentes par requête 300 requêtes

Oxford buildings 5063 images 55 requêtes

Plan 1 2 3 4

Distance de Minkowski avec k < 1 [AHK01] Réduction des eets de la malédiction de la dimension Robustesse au bruit Ecace sur les vecteurs creux [HR05]

- Precision

- MAP

Plan 1 2 3 4

locales l1(ti, dj) Term frequency TF tf ( ij 1 + log(tf l2(ti, dj) ij ) if tf ij > 0 Frequency logarithm 0 otherwise ( tf a Augmented + (1 a) ij if tf max (tf l3(ti, dj) kj ) ij > 0 t d normalized frequency k j 0 otherwise ( 1 if tf l4(ti, dj) ij > 0 Binary 0 otherwise l5(ti, dj) DFR-like normalization tf ij lavg l j l6(ti, dj) Squared TF tf 2 ij k1+1 l7(ti, dj) BM25 TF tf ij l withk1 = 1.2, b = 0.75 tf ij.k1(1 b+b. j lavg )

globales g 0 (t i ) No weigth 1 g 1 (t i ) Inverse document frequency (IDF) log( N df i ) g 2 (t i ) Probabilistic IDF max(0, log( N df i df i )) g 3 (t i ) Squared IDF log( N df i ) 2 g 4 (t i ) (Mean TF) * IDF tf i log( N df i ) g 5 (t i ) Squared (mean TF) * IDF [tf i log( N df i )] 2

- Précision

- MAP

Plan 1 2 3 4

Limites des sacs de mots visuels Inuence du type d'images utilisé Sur les paramètres à employer Sur l'évaluation Bruit dû à la quantication des descripteurs Faiblesse des algorithmes de clustering Problème des bases d'images très variées

Charu C. Aggarwal, Alexander Hinneburg, and Daniel A. Keim. On the surprising behavior of distance metrics in high dimensional space. In Lecture Notes in Computer Science, pages 420434. Springer, 2001. Gabriela Csurka, Christopher R. Dance, Lixin Fan, Jutta Willamowski, and Cedric Bray. Visual categorization with bags of keypoints. In ECCV: Workshop on Statistical Learning in Computer Vision, Prague, Czech Republic, May 2004. Peter Howarth and Stefan Rüger. Fractional distance measures for content-based image retrieval. In In 27th European Conference on Information Retrieval, pages 447456. Springer, 2005. Josef Sivic and Andrew Zisserman.

Video Google: A text retrieval approach to object matching in videos. In Proceedings of ICCV, volume 2, pages 14701477, Nice, France, 2003.