Bases de données multimédia VII Bag of words

Documents pareils
Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Recherche d Information(RI): Fondements et illustration avec Apache Lucene. par Majirus

Bases de données multimédia I - Introduction

Simulation de point de vue pour la localisation d une caméra à partir d un modèle non structuré

Reconnaissance de gestes : approches 2D & 3D

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie

Mesure agnostique de la qualité des images.

Ressources lexicales au service de recherche et d indexation des images

Utilisation des Points d Intérêts Couleurs pour le Suivi d Objets

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

: seul le dossier dossier sera cherché, tous les sousdomaines

Bases de données documentaires et distribuées Cours NFE04

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

Apprentissage Automatique

Enjeux mathématiques et Statistiques du Big Data

Bases de données multimédia I - Introduction

Sécuristation du Cloud

N. Paparoditis, Laboratoire MATIS

L évaluation d algorithmes d analyse vidéo Quelques pistes

Vérification audiovisuelle de l identité

Optimiser le référencement naturel de son site web

Centre de formation digital et communication : www. Komelya.fr

Scénario n 24 : QUOI FAIRE AVEC MON BAC PRO TRANSPORT /LOGISTIQUE?

Plan du cours : électricité 1

Analyse multi-échelle de trajectoires de points critiques pour la reconnaissance d actions humaines

Introduction au Data-Mining

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

Classification Automatique de messages : une approche hybride

Créer un site e-commerce avec PrestaShop Cloud Mise en place et suivi du projet

Dans cette définition, il y a trois notions clés: documents, requête, pertinence.

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus..

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Présentation. Référenciel : textes officiels

Mémoire DEA Système d'information Management and Technology of Information Systems

I.1 Introduction. I.2 La recherche d information. I.2.1 Définitions

Travaux Pratiques : Lucène - Gestion d un index plein texte

Plan d études. Traitement visuel 2D. Techniques d intégration multimédia HU. legault/2d/ 1-2-2

Introduction au Data-Mining

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

Traitement bas-niveau

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Bases de données documentaires et distribuées Cours NFE04

Les modes de recherche sur le Web 2.0

Glossaire suivi SEO. Glossaire suivi SEO. Document : Suivi SEO. Projet : Date : 18/02/15. Version : 1

Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006

Une approche statique quasi-périodique de la capacité portante des groupes de micropieux

INF6304 Interfaces Intelligentes

Big Data et Graphes : Quelques pistes de recherche

Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables

TP SIN Traitement d image

Nécessité de concevoir un outil de recherche PDF Présentation des fonctionnalités d'indexation et de recherche... 3

Brève introduction à la recherche d!information sur le Web à base d!agents logiciels

MEDLINE BANQUE DE DONNÉES EN MÉDECINE INTERFACE PUBMED INITIATION

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Base de données opérationnelle pour les phénomènes PAN Commission SIGMA 2 - AAAF

PrestaShop Cloud. Créer un site e-commerce avec. PrestaShop Cloud. Mise en place et suivi du projet. Créer un site e-commerce avec


Référencement Naturel ou SEO Search Engine Optimization

Big Data et Graphes : Quelques pistes de recherche

CASE-BASED REASONING

Cours de Mécanique du point matériel

COMMENT OPTIMISER MA VISIBILITÉ SUR LE WEB? AMÉLIORER MON RÉFÉRENCEMENT

Les images et les animations sur le web. Guérineau Chloé BTS2 Année 2001/2012

Recherche d information textuelle

GUIDE PRATIQUE DU REFERENCEMENT NATUREL

Bases de données documentaires et distribuées Cours NFE04

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Principes d AdWords. Quelques mots de présentation. Une audience large : les réseaux de ciblage. Réseau de recherche

Object Removal by Exemplar-Based Inpainting

Fouillez facilement dans votre système Big Data. Olivier TAVARD

David BEDOUET, WebSchool Orleans. Cosmina TRIFAN, WebSchool Orleans

NOS FORMATIONS EN BUREAUTIQUE

LES REFERENTIELS DES TROIS BACCALAUREATS PROFESSIONNELS DU TERTIAIRE COMMERCIAL VENTE COMMERCE SERVICES

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

Formation à BCDI abonnement du 27 mars et du 21 avril 2009 LEGTA Dardilly


LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

La recherche d'information sur Internet

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

La classification automatique de données quantitatives

Codage vidéo par block matching adaptatif

MAD: une plateforme mobile pour l annotation de document vers la classification

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Formation GISEH Module rédacteur 7, 9 juin 5, 12 juillet 2011

Identification de nouveaux membres dans des familles d'interleukines

Introduction au datamining

Gestion collaborative de documents

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

Intégration de la dimension sémantique dans les réseaux sociaux

Enregistrement et transformation du son. S. Natkin Novembre 2001

Mesure d'audience et de succès d'une stratégie de référencement

Raisonnement à base de cas textuels état de l art et perspectives

TUTORIEL CartoDB 11/03/15

Transcription:

Bases de données multimédia VII Bag of words ENSIMAG 2014-2015 Matthijs Douze & Karteek Alahari Video-Google! LA référence : Josef Sivic and Andrew Zisserman «Video Google: A Text Retrieval Approach to Object Matching in Videos» International Conference on Computer Vision, 2003 (ICCV 2003) peu vidéo, peu Google... recherche d'une zone sur une image

Video-Google! LA référence : Josef Sivic and Andrew Zisserman «Video Google: A Text Retrieval Approach to Object Matching in Videos» International Conference on Computer Vision, 2003 (ICCV 2003) peu vidéo, peu Google... recherche d'une zone sur une image! Idée : calquer le fonctionnement d un moteur de recherche d images sur celui d un moteur de recherche de texte/page web Video-Google! LA référence : Josef Sivic and Andrew Zisserman «Video Google: A Text Retrieval Approach to Object Matching in Videos» International Conference on Computer Vision, 2003 (ICCV 2003) peu vidéo, peu Google... recherche d'une zone sur une image! Idée : calquer le fonctionnement d un moteur de recherche d images sur celui d un moteur de recherche de texte/page web! Voir le demo: http://www.robots.ox.ac.uk/~vgg/research/vgoogle/

Video-Google! LA référence : Josef Sivic and Andrew Zisserman «Video Google: A Text Retrieval Approach to Object Matching in Videos» International Conference on Computer Vision, 2003 (ICCV 2003) peu vidéo, peu Google... recherche d'une zone sur une image! Idée : calquer le fonctionnement d un moteur de recherche d images sur celui d un moteur de recherche de texte/page web! La plupart des systèmes de recherche d images/de vidéos de l état de l art capable d indexer de très gros volumes de données sont dérivés de cette approche D. Nister and H. Stewenius : CVPR 2006 H. Jegou, M. Douze and C. Schmid : ECCV 2008 Étapes! Description locale : détecteurs + descripteurs! Filtrage spatial et temporel! Bag-of-words! Fichier inversé pour la requête! Re-ranking après vérification de la cohérence spatiale

Video-Google : description locale! Extracteurs MSER Shape adapted (point d intérêt + sélection d échelle + forme elliptique)! Descripteurs SIFT (scale-invariant feature transform) [Lowe 04] Imagette (patch) gradients x " " histogramme 3D y Video-Google : bag-of-words (début)! L objectif est d obtenir l équivalent des mots en requête textuelle! Pour cela, quantification vectorielle des descripteurs via un k-means (rappel) index de quantification = mot visuel représentation grossière du vecteur de description local pas d'information géométrique

Video-Google : bag-of-words (suite) Exercice : où sont - MSER - Harris Video-Google : bag-of-words (fin)! Une fois le clustering défini (une fois pour toutes), un document est représenté par un histogramme de ses mots visuels! Application d une pondération TFIDF aux composantes de cet histogramme objectif : donner plus d importance aux mots visuels rares qu à ceux qui sont fréquents même pondération que celle utilisée en indexation de documents textuels Nb d'occurrences de i dans doc d Nb de mots dans doc d t i = n! id log N $ # & n d " n i % Nb de documents dans la base Nb d'occurrences de i dans toute la base

Video-Google : fichier inversé! Utilisé pour comparer les vecteurs de fréquence épars! Mesure de similarité usuellement utilisée : produit scalaire! Analogie avec le texte description d un document pondération des mots utilisation de stoplists Stoplists! On supprime 5% en haut, 10% en bas

Avec vocabulaire mieux équilibré! Obtenu avec plus de données d'apprentissage pour k-means! Stoplist moins utile! Cas idéal : répartition uniforme. complexité de la recherche en fichier inversé en O(d s 2 ) Video-Google : filtrage spatial et temporel! Idée : obtenue par analogie avec Google Google améliore le score des pages pour lesquelles les mots-clés se retrouvent à des positions proches dans le texte! Filtrage spatial on ne garde un match que si ses voisins géométriques matchent aussi variante : vérification géométrique plus forte (voir chapitre IV) calcul de la transformée affine! Filtrage temporel (pour les vidéos uniquement) utilisation d un modèle dynamique simple d une frame à l autre on ne garde une région de description que si elle est suffisamment stable d une frame sur l autre

Vérification spatiale! Avant et après Vérification spatiale! Avant et après

Variante 1 : méthode hiérarchique de Nister et Stewénius! Motivation : réduire le coût d assignement des visual words! Comment : utilisation d un vocabulaire visuel hiérarchique! Autre éléments de la chaîne modifiés : modification de la métrique de comparaison des mots visuels (L1) Scalable Recognition with a Vocabulary Tree David Nistér and Henrik Stewénius, CVPR 06 Slides courtesy D. Nister

Variante 2 : Jégou, Douze et Schmid! Principales idées : interpréter le système de sac-de-mots comme un système de recherche approximative de plus proche voisins Augmenter la sélectivité de celui-ci en raffinant la description du descripteur Utilisation de la Weak geometry consistency pour intégrer de l information spatiale! Méthode état de l art en indexation image et vidéo utilisée dans la compétition de copyright vidéo Trecvid 08 voir exposé séparé dans le chapitre suivant sur l indexation video Hamming embedding and weak geometric consistency for large scale image search H. Jegou, M. Douze and C. Schmid, ECCV 08

Indexation de descripteurs globaux! Exemple: utiliser LSH trop grande dimension! Indexation par quantification quantification en mots visuels (cette fois-ci pour toute l'image) trouver les mots visuels communs! peu discriminant! Recherche assymétrique sans quantification du descripteur de l'image requête Conclusion! Bag of words principe de base pour l'indexation dans des bases de taille moyenne (< 10 M d'images) descripteurs locaux global! Nombreuses améliorations finesse de la représentation géométrie