Examen de Bases de données multimédia 30 janvier 2013 durée : 2h00

Documents pareils
Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

TD : Codage des images

Le poids et la taille des fichiers

Représentation des Nombres

Limitations of the Playstation 3 for High Performance Cluster Computing

FORMATS DE FICHIERS. Quels sont les différents types d informations numériques dans un document multimédia?

Mesure agnostique de la qualité des images.

Traitement numérique de l'image. Raphaël Isdant

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

nom : Collège Ste Clotilde

La question est : dans 450 combien de fois 23. L opération est donc la division. Le diviseur. Le quotient

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Formats d images. 1 Introduction

N. Paparoditis, Laboratoire MATIS

INFO 2 : Traitement des images

Recherche dans un tableau

Introduction à MATLAB R

Création de maquette web

La recherche avec l interface COLLEGE

Transmission d informations sur le réseau électrique

Partie 7 : Gestion de la mémoire

Bases de données documentaires et distribuées Cours NFE04

Les images numériques. 1. Le dessin vectoriel

Distinguer entre «Enregistrer» et «Sauvegarder»

Bases de données multimédia I - Introduction

Q6 : Comment calcule t-on l intensité sonore à partir du niveau d intensité?

Compression Compression par dictionnaires

Optimiser les images pour l affichage sur votre site

Encryptions, compression et partitionnement des données

TP Sauvegarde et restauration avec le logiciel Cobian Backup. Etape 1 :

1 Recherche en table par balayage

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Débuter avec EXPRESS. Alain Plantec. 1 Schema 2

Définitions. Numéro à préciser. (Durée : )

Algorithmes récursifs

Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

INF6304 Interfaces Intelligentes

COMPAREZ AVANT DE VOUS ENGAGER

Pour vos questions ou une autorisation d utilisation relative à cette étude vous pouvez contacter l équipe via contact@4gmark.com

Licence Sciences et Technologies Examen janvier 2010

Utilisation d objets : String et ArrayList

Architecture des Systèmes d Information Architecture des Systèmes d Information

Algorithmes pour la planification de mouvements en robotique non-holonome

Agrégation des portefeuilles de contrats d assurance vie

DIDAPAGES : CREER UN LIVRE INTERACTIF

Domaine D1 : Travailler dans un environnement numérique évolutif

Sécuristation du Cloud

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

Voici quelques-unes des questions auxquelles répond cette présentation.

Sauvegarde. de données. Nos conseils de prise en main

DE L ALGORITHME AU PROGRAMME INTRO AU LANGAGE C 51

Application de K-means à la définition du nombre de VM optimal dans un cloud

Dans l Unité 3, nous avons parlé de la

Mes documents Sauvegardés

Usage des photos pour Internet et pour la presse

M1 Informatique, Réseaux Cours 9 : Réseaux pour le multimédia

Sauvegarder Bcdi (réseau Novell / Gespere)

Outils permettant la diffusion de l information. Un point sur le droit numérique

L application est utilisable pour toute personne disposant d un compte Qobuz.

Bases de données documentaires et distribuées Cours NFE04

Les puissances La notion de puissance La puissance c est l énergie pendant une seconde CHAPITRE

MapReduce. Nicolas Dugué M2 MIAGE Systèmes d information répartis

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Nombres et calcul numérique

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile

Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Quantification Scalaire et Prédictive

Problèmes de dénombrement.

Catégories de format d'optimisation

TD Architecture des ordinateurs. Jean-Luc Dekeyser

3 Approximation de solutions d équations

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

PARTIE NUMERIQUE (18 points)

Plus courts chemins, programmation dynamique


Optimisation for Cloud Computing and Big Data

Numérisation du signal

PROGRAMME (Susceptible de modifications)

1 de 46. Algorithmique. Trouver et Trier. Florent Hivert. Mél : Florent.Hivert@lri.fr Page personnelle : hivert

Régler les paramètres de mesure en choisissant un intervalle de mesure 10µs et 200 mesures.

BONUS MALUS. Voici, la façon de calculer la prime : Le montant de la prime à acquitter est égale à : P = PB. C où : P

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Certificat Informatique et internet Niveau 1 TD D1. Domaine 1 : Travailler dans un environnement numérique évolutif. 1. Généralités : Filière

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

JPEG, PNG, PDF, CMJN, HTML, Préparez-vous à communiquer!

L EXPORTATION d un PROJET.MVP

Object Removal by Exemplar-Based Inpainting

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Tous les conseils de nos experts pour bien l utiliser.

Vérification audiovisuelle de l identité

Simulation de point de vue pour la localisation d une caméra à partir d un modèle non structuré

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Chapitre 2 Le problème de l unicité des solutions

Clé USB. Quel type de données peut contenir une clé USB?

METHODE IDENTIFIER LA NATURE D UN DOCUMENT

Transcription:

- Examen de Bases de données multimédia janvier durée : h Documents autorisés : transparents du cours, notes de cours. Calculatrice autorisée (mais inutile). Bonus = points en plus hors barème. EXERCICE. Questions à réponses courtes ( pts) Répondez de manière concise. Sauf si cela est explicitement demandé, vous n êtes pas obligé de faire des phrases ni de justifier vos réponses. [Question.] QCM : Choisissez une réponse aux propositions suivantes. Attention : les mauvaises réponses sont pénalisées. Si on compresse un fichier MP de Mo avec un utilitaire de compression sans perte (zip ou gzip), produira-t-il un fichier de (a) 9 ko, (b) ko, (c) ko? Un logiciel de lecture multimedia sur ordinateur affiche le nom de la chanson pour chaque piste d un CD. Lit-il ce nom sur le CD? (a) oui (b) non Amazon mechanical turk est une interface de programmation permettant d exploiter (a) des très gros clusters de calcul, (b) de la main-d œuvre bon marché, (c) un grand espace de stockage. Pour une chaîne Hi-Fi, quel est celle qui produit un signal de meilleure qualité : (a) PSNR=7, (b) PSNR=. La vérité terrain (ground truth) est : (a) un algorithme de base par rapport auquel il faut se comparer, (b) une mesure de pertinence pour l indexation multimedia, (c) le résultat que donnerait un algorithme parfait. Quelle est la requête la plus difficile, pour un système d indexation multimedia : (a) une image est imprimée puis scannée, retrouver l original ; (b) trouver les images de voitures ; (c) trouver les images de la tour Eiffel à partir d une photo de celle-ci. Le descripteur SIFT est invariant à l inversion des niveaux de gris de l image : (a) vrai, (b) faux. Pour vérifier la cohérence temporelle, l algorithme du Dynamic Time Warping est moins robuste a un changement de framerate (vitesse de lecture des videos) qu une transformee de Hough D : (a) vrai, (b) faux.

- [Question.] On a deux histogrammes (a,..., a m ) R m + et (b,..., b n ) R n + tels que m i= a i = n i= b j. On cherche à calculer le Earth mover s distance (EMD) entre les deux histogrammes, sachant que le coût de transfert d une unité de a i vers b j est q ij.. écrire la définition de EMD sous forme d un problème d optimisation.. quel algorithme permet de résoudre ce problème d optimisation? [Question.] Dans un espace de dimension d, soit l hypercube H de côté c. On considère que la périphérie P de l hypercube est l espace qui se situe à moins de c/ de l extérieur de H.. Calculer le volume de H. Calculer le volume de P. Pour quelle valeur approximative de d le volume de P représente-t-il plus de la moitié du volume de C? [Question.] On veut reconnaître des images scannées avec un scanner de résolution connue. On utilise pour cela une mise en correspondance de descripteurs locaux (Harris + SIFT).. quel modèle géométrique est approprié dans ce cas?. combien de paramètres faut-il estimer?. Une homographie est un sur-ensemble de cette transformation. Quel est l inconvénient d estimer une homographie? [Question.] Un système d indexation d une base de documents renvoie une liste de documents en réponse à une requête. L utilisateur sait qu il y a documents corrects dans la base, et de ces documents sont parmi les réponses du système. Quels sont la précision et le rappel du résultat?

EXERCICE. Descripteurs d image denses. - Sur une image de pixels, on utilise des des descripteurs locaux denses. Des imagettes (patches) sont échantillonnés régulièrement sur une grille. Les imagettes font pixels de côté et leurs centres sont sur une grille espacée de pixels. On veut calculer un descripteur SIFT sur chaque imagette. [Question 6.] Quelles sont les étapes de calcul d un descripteur SIFT à partir d une imagette de pixels? [Question 7.] Quelles étapes peuvent être précalculées sur l image en entier? [Question 8.] Quelles sont les quantités qui déterminent la taille d du vecteur SIFT? Le SIFT est constitué d histogrammes. Cependant, les entrées (bins) des histogrammes ne sont pas incrémentées de pour chaque pixel du patch, mais par un poids issu de plusieurs interpolations (soft-assign). [Question 9.] Quelles sont les deux interpolations qui interviennent lorsqu un pixel contribue à une entrée du descripteur?

EXERCICE. Indexation de vecteurs - On décide d implémenter un système d indexation d images utilisant des descripteurs locaux (comme par exemple ceux introduits dans l exercice précédent). Pour cela, on indexe les descripteurs locaux des images de la base, et on utilise comme requête les descripteurs locaux de l image requête. La métrique de comparaison entre descripteurs locaux est la distance euclidienne. Pour accélérer le système, on décide d utiliser une structure de fichier inversé. [Question.] Par rapport à une comparaison exhaustive, comment un fichier inversé permetil d accélérer la recherche de descripteurs? A quel prix cela se fait-il? Pour simplifier, on considère que l image requête ne contient qu un seul descripteur local Q R n (n = ), et qu il y a deux images dans la base. La première a pour descripteurs (B, B, B ), la seconde (B, B ). Q =, B =, B =, B = 6, B =, B = [Question.] faites un k-means sur les vecteurs de la base pour trouver centroïdes (pour l initialisation, vous prendrez les descripteurs de l image ). [Question.] Calculer le Bag-of-words et le VLAD pour les deux images. [Question.] Dessinez une représentation de la structure de données utilisée pour stocker la base avec le fichier inversé. [Question.] Lors de la recherche, à quel centroïde le descripteur requête est-il affecté? [Question.] Quelles opérations sont effectuées par le système pour retourner les vecteurs semblables? [Question 6.] Quels sont les scores des deux images de la base? Les questions suivantes peuvent être traitées indépendamment des précédentes. Au lieu d utiliser un fichier inversé, on décide de comparer directement les descripteurs locaux. Pour chaque descripteur requête on vote pour les images correspondant aux trois plus proches descripteurs de la base. On décide d utiliser un quantificateur produit (QP) pour calculer les distances entre descripteurs. Le principe du QP est de découper les vecteurs en K morceaux (de tailles égales), puis d appliquer une quantification vectorielle sur chaque morceau. Pour { un vecteur requête } Q R n, un vecteur de la base B R n et un dictionnaire D = c l R n L, l [, L] (qu on suppose identique pour chaque morceau k [, K ], avec n multiple de K), alors le calcul de distance en version symétrique s exprime comme : d QP (Q, B) = K d (c Qk, c Bk ) k=

- où Q k et B k sont les indices dans le dictionnaire des centroïdes correspondant à la quantification respective de leur k-ème morceau, et d est la distance euclidienne. [Question 7.] Quel est l intérêt de QP par rapport à une distance euclidienne? [Question 8.] Quel est son inconvénient? [Question 9.] Comment pourrait-on l améliorer a cet égard? On considère le dictionnaire suivant avec K =, L = : D = {[ ], [ ], [ ]} [Question.] Comment sont stockés les vecteurs de la base avec QP? Listez les entrées. Cela a-t-il un avantage par rapport aux descripteurs initiaux? [Question.] Calculez la distance QP de la requête Q avec tous les descripteurs. [Question.] Quels sont les scores des deux images de la base? [Question.] [bonus] comparez les résultats des deux méthodes.