Recherche mul*média et indexa*on séman*que



Documents pareils
Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Comment référencer votre annonce Sur les moteurs de recherche?

Évolu>on et maintenance

SÉLECTIONNER LES MEILLEURS CANDIDATS : L APPORT DES OUTILS D ÉVALUATION AU RECRUTEMENT ET À LA MOBILITÉ INTERNE

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

LA DIGITALISATION DE LA RELATION CLIENT

Cabinet de Conseil STRATÉGIE MANAGEMENT ORGANISATION JURIDIQUE FORMATION AVEC BW CONSULTANTS CHOISISSEZ DE GARANTIR VOTRE DEVELOPPEMENT

Concepon et réalisaon

Offre Azimut CONTENT MARKETING. A l a&en)on de : Date de remise : Version : 3.0

Les bases du SEO (référencement naturel)

Le contrôle fiscal anno 2013

Les méthodes Agiles. Introduc)on aux méthodes Agiles Exemple : Scrum

Présentation Level5. Editeur de Logiciels. «If it s not monitored, it s not in production» Theo Schlossnagle #velocityconf

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Architecture matériel et logiciel 2

SPIP. Gestion de la performance dans SPIP. Préoccupa)on historique

MTI820 Entrepôts de données et intelligence d affaires. Les applica+ons de BI

LA LOGISTIQUE LES BONNES QUESTIONS À SE POSER

Optimisation de la supervision by Somone. - Présentation Générale -!

SEO : COMMENT CONSTRUIRE UNE STRATEGIE DE LINKING LICITE ET DURABLE?

UN GUIDE PROPOSÉ PAR PME-WEB MARKETING GUIDE ULTIME DES MOTS INTERDITS. Un guide pour Éviter de voir vos passer en SPAM. web.

DOCUMENTATION KAPTravel Module de gestion des appels de disponibilité

Design & conception de site web optimisé SEO. augmentez la conversion sur vos sites

Profils du Diplômé (profils de sor2) de la forma2on de médicine au Chile

L essentiel de la communication Web To Store

Présenta6on Isatech. ERP, Décisionnel, Architecture Systèmes & Réseaux. Isatech Tous droits réservés Page 1

Architecture des entrepôts de données

Santé, condi,ons de travail et égalité professionnelle F/H Comment agir?

Catalogue de FORMATIONS 2015

Comment u)liser les réseaux sociaux?

Devenez un virtuose de Google. Atelier en informa5que présenté par Dominic P. Tremblay

Le cycle de vie d'un projet en intelligence d'affaires

Présentation du module Base de données spatio-temporelles

22ème Conven*on na*onale de l Intercommunalité 14 octobre Mutualisa*on : déployer les nouveaux ou*ls de la réforme

Programme «INVESTISSEUR»

Alix LASSAIGNE Christophe COTIN VALOIS,

INTRASTAT No ce explica ve Merkbla

Les formations. calipia. novembre 2014 à mai 2015

L ou%l téléphone dans votre stratégie de marke%ng direct

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Sites Internet : les. tendances. Jeudi 30 janvier 2014 Bordeaux L AGENCE CONNECTÉE À L ENTREPRISE

Qu est- ce que Bien- Copyright Quo.ent Factor Inc., 2011

Note technique. Formats de compression vidéo utilisés par CamTrace V11 avantages et inconvénients.

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

STREAMING VIDÉO SUR INTERNET

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Accueils de Loisirs & Périscolaires S INSCRIRE

Dysplasie osseuse. Groupe hétérogène de maladies géné%ques 440 types individuellement très rares Manifesta%ons possibles :

Services complémentaires en Outaouais

OFFRE MIX MARKETING : créateur de consommateurs. A l a&en)on de : Date de remise : Version : 3.0

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Présenta)on DesignBuilder

TRANSFORMATION DIGITALE : COMMENT INDUSTRIALISER ET PÉRENNISER LA MÉTHODE AGILE À PLUS GRANDE ÉCHELLE

GESTION DE CONTENUS (ECM) Ges1on de l informa1on. Nicolas Bürki, Senior Analyst

Consultants, trouvez de nouveaux marchés grâce aux médias sociaux animé par Valérie March au Salon des micro- entreprises 2012

LE SUPPLIER RELATIONSHIP MANAGEMENT EN PRATIQUE

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

PRÉSENTATION DES RÉSULTATS DU LIVRE BLANC BIG DATA

Sécuriser et enrichir les transactions financières. URYX Capital

Gestion collaborative de documents

LES SOLUTIONS DE MESSAGERIE ET BUREAUTIQUE PROFESSIONNELLES

Pe#t déjeuner Prévention des risques professionnels dans la Mutualité

CESI Bases de données

IL Y A- T- IL UN AVENIR POUR LA VENTE EN LIGNE DE MÉDICAMENTS? La rece:e du site idéal

Couplage d une base de données documentaire à une visualisation interactive 3D sur l Internet

MTI820 Entrepôts de données et intelligence d affaires. Gouvernance des données et ges1on des données de référence

Améliorez et industrialisez vos feedback produit

Structure fonctionnelle d un SGBD

Bases de données documentaires et distribuées Cours NFE04

Programme détaillé. Administrateur de Base de Données Oracle - SQLServer - MySQL. Objectifs de la formation. Les métiers

AVIS A MANIFESTATION D INTERET N 017/MPT/2013/UCP/CAB

Programmation Web. Introduction

Bases de données cours 1

L exper>se sur financements européens et autres : quelles opportunités pour les consultants et les universitaires?

et les Systèmes Multidimensionnels

Les 10 étapes clés pour trouver des clients par internet

PREAMBULE. Les réseaux sociaux offrent un espace de prise de parole formidable pour toutes les entreprises qui composent notre filière.

4.2 Unités d enseignement du M1

Sommaire. 1 Introduction Présentation du logiciel de commerce électronique 23

Faire émerger les théma.ques et les opinions : applica.on à l'analyse des médias sociaux

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

FORMATION 101 Webinaire 1 Notions et vocabulaire

Les Organisa+ons Non- Gouvernementales et les réseaux sociaux

ISC Système d Information Architecture et Administration d un SGBD Compléments SQL

SAUVER LA DISTRIBUTION!

Projet Business Object

DÉPLOIEMENT 4G ET FIBRE : PREMIER BILAN ET PERSPECTIVES

Réunion de rentrée Licence PER Programma3on en environnement répar3. Année universitaire

L Europe s engage en Mar/nique auprès des Entreprises

Présentations personnelles. filière IL

Glossaire technique Veditec

Vidéo Protection La R82

Stages intra- entreprise stages de forma,on à des,na,on des managers et dirigeants. Catalogue

SQL Server 2012 et SQL Server 2014

Java et les bases de données

Qu est ce qu une PME? 4. Pourquoi investir dans une PME? 6. Comment investir en direct dans une PME? 10

Transcription:

Recherche mul*média et indexa*on séman*que Stephane Ayache ESIL MIRA 3 ème année

Objec*fs du cours Mise en œuvre d un moteur de recherche MM Stockage Organisa*on des indexes en BD Métadonnées Algorithmes

Objec*fs du cours BDMM vs BD classique Schémas rela*onnels pour le stockage de données mul*médias MPEG- 7 Bases de données avancées : les indexes Index B- tree Index R- tree TP : Mise en œuvre d une BD mul*média pour la ges*on d images personnelles..

Besoins des bases mul*médias Ges*on des images, sons, vidéos Stocker Rechercher Visualiser Niveau de descrip*on? Métadonnées vs Contenu vs Mots- clés Comment indexer? Que stocker?

Pourquoi u*liser un SGBD? Ges*on transparente du système de fichiers (données distribuées) Structura*on des données (index) Accès rapides (index) et concurrents (transac*on) Algorithmes d op*misa*on (requête, jointure) Evolu*vité, sauvegardes

Pourquoi indexer? Pour organiser les données Limiter la quan*té de données examinée durant une recherche Perme]re un accès rapide aux données Marche très bien pour la ges*on de données classique!

Indexa*on par métadonnées Données informa*ves sur le fichier (EXIF) Type : taille, dimension, format, compression, paramètres, Condi*ons de créa*on : date, lieu, réglages, Structure : Chapitres, Pistes, Disponibles sans interven*on humaine lourde Peu u*le pour une recherche réaliste

Indexa*on par métadonnées Point de vue SGBD : A]ributs à une seule dimension, numérique ou chaînes de caractères Pris en compte classiquement par les SGBD Index existants performants : tables de Hashage, B- Tree,

Indexa*on par le contenu Données sur les caractéristiques physiques des documents Image : couleur, texture, formes, Son : rythme, fréquences, mélodie, Vidéo : mouvement, caméra, Automatique mais peu d interprétation sémantique Utile pour une recherche par l exemple

Indexa*on par le contenu Point de vue SGBD : Données non tradi*onnelles : vecteurs numériques de grandes dimensions Pas (encore) d index performants Meilleur méthode : parcours exhaus*f

Indexa*on par le contenu Il y a des différences fondamentales avec les données classiques : Données mul*dimensionnelles! Recherches des plus proches voisins Fonc*on de distance et non comparaison Pas d ordre total possible Conséquences index tradi*onnels impossibles à u*liser Nécessité d index mul*dimensionnels Pistes : SGBD géographique index R- tree Recherche approxima*ve

Indexa*on par mots- clés Données sur le contenu séman*que des documents Images : objets, scènes, évènements, Sons : bruits, catégories musicales, Vidéos : divers Très difficilement automa*sable subjec*f mais séman*que U*le pour une recherche réaliste Pris en charge classiquement par les SGBD

Que stocker dans la BD? Les métadonnées : oui! Evidemment.. Les mots- clés : oui, pondéra*on? Les signatures : oui, si recherche par l exemple et faible dimension Les distances : oui, si recherche par l exemple et grande dimension

Que stocker dans la BD? Les documents? U*lisés pour le calcul des descripteurs! U*lisés pour la visualisa*on Stockage interne Avantage : Consistance, les requêtes portent bien sur les bons documents Inconvénient : Volume dans la base de données A]ribut de type BLOB (Binary Long Object) Stockage externe Avantage : Accès libre, ailleurs que via le SGBD Inconvénient : Inconsistance, sauvegarde de la BD A]ribut de type String : l URL ou le Path du document

Oracle vs MySQL Oracle module Mul*media Stockage Indexa*on (métadonnées et contenu) Distances (entre signatures) Manipula*on (filtres, transforma*on) Diffusion h]p://www.oracle.com/technology/products/intermedia/index.html

Relevance feedback «Bouclage de per*nence» Idée : l u*lisateur peut montrer ce qui est per*nent pour lui même s il ne peut pas l exprimer explicitement But : modifier la représenta*on de la requête pour la rapprocher des documents per*nents

Relevance Feedback Processus itéra*f visant à apprendre le besoin d informa*on (ie : modèle probabiliste) Mise en œuvre : L'u*lisateur visualise les n premiers résultats Il es*me la per*nence de chacun (0 ou 1) Nouvelle requête obtenue à par*r des documents jugés per*nents et non per*nents

Relevance Feedback Adapta*on au modèle vectoriel : formule de Rocchio

Exemple Relevance Feedback

Schéma rela*onnel Mul*média TP : h]p://stephane.ayache.perso.esil.univmed.fr/cours/risem/mse.html