Datation d Images pour la Recherche Temporelle d Information



Documents pareils
Une méthode d apprentissage pour la composition de services web

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

RI sociale : intégration de propriétés sociales dans un modèle de recherche

Ressources lexicales au service de recherche et d indexation des images

La rencontre du Big Data et du Cloud

Apprentissage Automatique

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

ANGULAR JS AVEC GDE GOOGLE

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Forthcoming Database

Laboratoire 4 Développement d un système intelligent

Comprendre un texte fictionnel au cycle 3 : quelques remarques

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Learning Object Metadata

Gérer, stocker et partager vos photos grâce à Picasa. Janvier 2015

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Campagne de Communication Prévisionnelle. Web Intelligence & Réputation Internet

LES REPRESENTATIONS DES NOMBRES

Prototype de canal caché dans le DNS

La recherche d informations sur le Web par les lycéens : Pourquoi et comment faciliter le travail collaboratif?

Contents Windows

1S9 Balances des blancs

LIVRE BLANC Décembre 2014

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

GEIDE MSS /IGSS. The electronic document management system shared by the Luxembourg

Corps des nombres complexes, J Paul Tsasa

Ne cherchez plus, soyez informés! Robert van Kommer

Twitter et Netvibes pour la veille

Travaux pratiques avec RapidMiner

Au-delà de la simple gestion de votre fonds documentaire, évoluez vers la gestion complète de vos flux d informations.

Principe de symétrisation pour la construction d un test adaptatif

Les Ontariens rejettent catégoriquement le projet de création d une école afrocentriste

INF6304 Interfaces Intelligentes

Les modes de recherche sur le Web 2.0

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

DOCUMENTATION - FRANCAIS... 2

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

Entreposage de données complexes pour la médecine d anticipation personnalisée

Differential Synchronization

BI2 : Un profil UML pour les Indicateurs Décisionnels

LES DOSSIERS DOCUMENTAIRES ELECTRONIQUES. Clotilde VAISSAIRE CV CONSEIL SARL

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Académie de Créteil. Projet présenté autour de l album «Trois souris peintres» d Ellen Stoll Walsh

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU

RAPID Prenez le contrôle sur vos données

FICHE N 8 Photodiversité, d une banque d images à un portail d activités en ligne Anne-Marie Michaud, académie de Versailles

Sélection de Caractéristiques pour le Filtrage de Spams

Recherche d information textuelle

Modélisation géostatistique des débits le long des cours d eau.

Soumission des articles pour l ICOFOM Study Series

MOBILEARN : La réalité augmentée au service de l apprentissage informel

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Classification Automatique de messages : une approche hybride

Extraction de caractéristiques visuelles d'images médicales pour la recherche par similitude et l'aide au diagnostic

Trois approches du GREYC pour la classification de textes

«L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?»

Urbanisation de système d'information. PLM 3 (Product Lifecycle Management) Élaborations, versions, variantes, configurations

Modèles graphiques probabilistes pour la reconnaissance de formes

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Hervé Couturier EVP, SAP Technology Development

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Stage Ingénieur en développement logiciel/modélisation 3D

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Revision of hen1317-5: Technical improvements

Introduction à l approche bootstrap

Le Traitement Automatique des Langues en France à l ère du Big Data

Editing and managing Systems engineering processes at Snecma

DEMANDE D INFORMATION RFI (Request for information)

PRÉPARER UN EDIT-A-THON

Relation entre deux variables : estimation de la corrélation linéaire

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu.

RETHINKING JACQUES ELLUL AND THE TECHNOLOGICAL SOCIETY IN THE 21ST CENTURY REPENSER JACQUES ELLUL ET LA SOCIETE TECHNICIENNE AU 21EME SIECLE

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Définir une ligne éditoriale

ARCHIVAGE. FastScan Archiving

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.

Design. Search. Cloud AMOA ECM. Intégration. IT Solutions. Formation. Développement. Mobilité. Open source. Infogérance. Ergonomie

La construction du temps et de. Construction du temps et de l'espace au cycle 2, F. Pollard, CPC Bièvre-Valloire

Cliquez pour du modifier titre le style

TD d économétrie appliquée : Introduction à STATA

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Autonomie et fragilités de la recherche académique Financements sur projet et reconfigurations du travail scientifique

Avril 2013 DIAGNOSTIC NUMERIQUE. Réalisé par l Office de Tourisme Andernos-les-Bains

Les défis statistiques du Big Data

Lesson Plan Physical Descriptions. belle vieille grande petite grosse laide mignonne jolie. beau vieux grand petit gros laid mignon

AGROBASE : un système de gestion de données expérimentales

Les datas = le fuel du 21ième sicècle

Scénarios économiques en assurance

VERS UN SYSTÈME COLLABORATIF POUR LA MISE À JOUR DE RÉFÉRENTIELS GÉOGRAPHIQUE

Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs.

Rapport de Post- Campagne 1

Transcription:

Datation d Images pour la Recherche Temporelle d Information Paul MARTIN 1 Université de Caen Basse-Normandie Campus Côte de Nacre, Boulevard du Maréchal Juin CS 14032 14032 CAEN cedex 5 TEL : +33 (0)2 31 56 74 86 FAX : +33 (0)2 31 56 73 30 paul.martin@unicaen.fr RÉSUMÉ. Cet article s inscrit dans le contexte de la recherche temporelle d information qui est une thématique en plein essor depuis ces cinq dernières années. La temporalité peut être vue comme un axe de diversification permettant de raffiner les résultats des requêtes formulées par les utilisateurs. Dans cet article, nous présentons une étude sur la datation automatique de photographies pour la recherche temporelle d images de la Toile. Ce processus de datation impose de nombreuses considérations à la fois théoriques et techniques caractérisant cette tâche particulière. Nous essayons ici de résumer quelles sont les difficultés et les problématiques associées à ce sujet, avant de chercher à désamorcer les problèmes soulevés en proposant des solutions et des pistes de travail futures. ABSTRACT. This paper presents a new area in the domain of Temporal Information Retrieval, which has received much attention for the last few years. Temporality can be viewed as a way of diversifying Web search results in response to any given user s query. In this paper, we describe a study about image timestamping for temporal web image retrieval. This process imposes a large amount of theoretical and technical considerations that we try to summarize and evidence. Finally, we try to unlock the raised problems by proposing potential solutions and ideas for future works. MOTS-CLÉS : Recherche temporelle d information, datation d images, caractéristiques visuelles et textuelles, classification, régression, classes ordonnées KEYWORDS: Temporal information retrieval, image timestamping, visual and textual features, classification, regression, ordered classes 1. Sous la direction d Antoine DOUCET (GREYC équipe HULTECH) et de Frédéric JURIE (GREYC équipe IMAGE).

Paul MARTIN 1. Introduction Dans le cadre de la recherche d information temporelle, nous proposons de retrouver de manière automatique les dates de prises de vue de photographies. Par exemple, pour la requête «New York», un utilisateur pourrait être intéressé par l évolution au cours du temps de ce sujet (voir Figure 1). Ainsi, nous recherchons comment estimer ces dates à partir de caractéristiques visuelles et textuelles. En particulier, notre but est de permettre l ordonnancement chronologique des images retournées par un moteur de recherche pour des requêtes temporelles. Figure 1. Exemple de résultat de recherche souhaités pour la requête «New York». Le nombre de documents numériques contenant des images augmente de façon considérable. Ces images numériques sont acquises d une part à l aide d appareils photo numérique ou d autre part à l aide de scanner. En particulier, les Archives ainsi que les Musées numérisent leurs fonds documentaires et photographiques pour les rendre accessibles au public via le web 1. En parallèle, l utilisation de plates-formes collaboratives (e.g. Wikipédia) et des réseaux sociaux par un large public est à la base de l explosion des quantités de documents numériques sur la toile. De ce fait il est impératif de pouvoir classer, et en particulier temporellement, cette masse d informations grossissante afin que son exploitation soit améliorée. Pour réaliser cette tâche, nous proposons de combiner des informations textuelles (Ding et al., 2008) et visuelles (Krapac et al., 2010) complémentaires et convergentes, et non nécessairement redondantes, dans le cadre de l apprentissage statistique. Dans cet article, nous définissons le cadre méthodologique de la datation d images à partir de données visuelles et textuelles. Dans la section suivante nous présenterons les problématiques associées aux évolutions de la photographie à travers le temps. Ensuite nous présenterons la datation de photographies d un point de vue manuel, appliquée aux domaines visuel et textuel (Section 3). Dans la section 4, nous définirons des notions spécifiques à la classification temporelle automatique d images et nous conclurons avec quelques résultats préliminaires. 2. La Photographie à Travers le Temps La photographie est un domaine en perpétuelle évolution à travers les générations, tant par ses usages que par les raisons qui poussent à prendre des clichés. Ces différents usages sont régis par l évolution des techniques photographiques à travers le temps. Il est important de considérer que l évolution des usages de la photographie 1. http ://www.flickr.com/commons/ [dernier accès le 13 Décembre 2012]

Recherche Temporelle d Images n est pas continue et qu elle dépend des changements des techniques d acquisition de l information visuelle (cf. section 4.2). Nous pouvons citer comme exemple les écarts des fréquences d usages. Aux origines de la photographie, les usages étaient exclusifs et ponctuels (e.g. souvenir ultime pour la postérité). Les tendances ont évolué jusqu à aujourd hui et les techniques se sont démocratisées. Les usages actuels sont à l inverse beaucoup moins raisonnés et démesurément actifs (e.g. albums de photos sur réseaux sociaux). L origine et la motivation de la prise de vue influencent aussi la temporalité de celle-ci. Il sera plus difficile de dater des photographies d art que des photographies de presse de par leur nature. En effet, les photographies de presse s inscrivent dans le présent lors de leur réalisation et elles ont souvent pour vocation de relater l histoire à un moment donné. À l inverse, les photographies d art où la notion de créativité est plus importante ont une vocation abstraite qui est parfois dénuée de temporalité. De plus, il est à noter que la technologie photographique utilisée a aussi un rôle dans cette étape de datation. Nous pouvons supposer qu il est possible de dater une image à partir du type d appareil photo utilisé (e.g. déformation, résolution, abérations chromatiques, couleurs). Selon cette hypothèse nous pourrions ainsi disposer d une date «minimale» pour définir la date de prise de vue du cliché. Cette date serait la date de mise en service du type d appareil ou de la technologie photographique associée. 3. Datation Les évolutions de la photographie dans ses usages, ses motivations et techniques sont autant de sources d information pour la datation de clichés. Par exemple Coe et Haworth-Booth (1983) proposent de dater manuellement les photographies à partir de l analyse du support (e.g. type de papier, angle de vue), des objets, des lieux, des personnages entre autres. En effet, le contenu donne une information sur la date potentielle de prise de vue. À ce sujet, il existe un nombre important de recueils pouvant tracer l historique d un thème, comme par exemple l évolution des modes (Peacock, 2008). Plus récemment, Kodak (Scalise et al., 2010) a proposé, sous forme d un brevet, une méthode automatique pour dater les images à partir des annotations (e.g. marque du papier, date de développement) se trouvant au dos des clichés. Cette méthode impose que l on dispose des deux faces de la photographie, ce qui est rarement le cas. 3.1. Datation à Partir de Données Visuelles Pour un humain, les informations liées à l aspect et au contenu influencent la perception temporelle des photographies. L humain est capable de percevoir si ces informations concordent ou non. Pour une machine, ces deux notions sont ambiguës et leur différenciation sera donc un enjeu majeur pour la datation. Le tableau 1 illustre les relations pertinentes entre contenu et aspect qui peuvent être autant de tâches pour la datation automatique d image. En fait, il existe une multitude de combinaisons possibles entre les aspects photographiques et les contenus temporels photographiés. Certaines photos paraissent difficiles à dater, comme par exemple les clichés avec

Paul MARTIN un contenu contemporain mais un aspect ancien 2. Mais, majoritairement, les photos présentes sur la toile correspondent à des clichés réalisés avec des appareils contemporains de leurs sujets. Tableau 1. Opposition entre contenu et aspect selon les époques. Contenu Ancien Contenu Contemporain Aspect Ancien Aspect Contemporain Du point de vue de la vision par ordinateur, le contenu visuel est difficile à détecter/reconnaître/classifier et requiert d utiliser des bases de données volumineuses (Krapac et al., 2010). À l inverse, l analyse de l aspect des photographies est une notion plus générale que le contenu. Ainsi, nos travaux se concentreront d abord sur la datation automatique à partir de l analyse de l aspect d une image (e.g. ton jaunâtre, faible résolution, brillance). 3.2. Datation à Partir de Données Textuelles Nous pouvons observer un parallèle intéressant entre la datation visuelle et la datation textuelle. L aspect d une photographie peut être apparenté au style du texte de la page web qui lui est souvent associé. En effet, le style linguistique peut être vu comme une technique que l on utilise pour porter l information du contenu. Parallèlement, le vocabulaire textuel s apparente plus au contenu d une photographie. Les mots apparaissent à la mesure que les objets naissent (e.g. iphone à partir de 2007). De la même façon que nous avons opposé contenu et aspect pour les images, nous montrons dans le tableau 2, l opposition entre style et vocabulaire qui peut être la source d informations importantes pour la datation d images à partir de contenus textuels. Tableau 2. Opposition entre vocabulaire et style selon les époques. Style Ancien Style Contemporain Vocabulaire Ancien «affublé d une redingote» «sapé avec une redingote» Vocabulaire Contemporain «affublé d un short baggy» «sapé avec short baggy» Du point de vue du traitement automatique des langues, la tâche de datation des textes a été particulièrement étudiée à travers des modèles temporels du langage (Berberich et al., 2010), qui reposent sur l analyse de l évolution du vocabulaire dans le temps. Parallèlement, nous suivrons d abord cette approche en utilisant des 2. Le vieillissement artificiel des photographies est un thème «à la mode» (e.g. l application instagram).

Recherche Temporelle d Images ressources importantes comme les Google N-Grams 3 et l introduction de nouvelles fonctions de lissage. 4. Classification Temporelle Récemment, Palermo, Hays et Efros (2012) ont proposé un travail de classification temporelle supervisée à partir de caractéristiques visuelles. Pour ce faire, ils ont constitué un jeu de données comportant 1325 images uniquement en couleur prises entre 1930 et 1980. Leur but a été de classifier ces 5 décennies en 5 classes. Les caractéristiques extraites sont principalement des informations de couleurs (Hue Histogram, L*a*b* Color Histogram, P(Saturation Hue)) 4. La classification se fait à l aide d un SVM classique en mode «Un contre Un». Ils effectuent une validation croisée à 10 plis et ils choisissent de manière aléatoire à chaque pli 80% de la base pour l apprentissage et 20% pour le test. Les résultats de classification montrent une précision de 45,7% dans le meilleur des cas. À titre de comparaison, la précision d un humain non entraîné sur leur base d images est de 26% alors que celle d une classification aléatoire est de 20%. Ceci est donc une approche intéressante car elle offre de bons résultats. Cependant quelques considérations particulières peuvent être émises. 4.1. Création d un Jeu de Données Comme aucune base de données d images temporelles n existait lorsque nous avons commencé nos travaux, nous avons constitué notre propre base. Nous avons choisi de considérer le spectre temporel le plus large possible. Nous avons cherché une grande quantité d images dont les informations de dates de prises de vues étaient connues et étaient au moins précises à l année près. Nous avons donc constitué une base de plus de 42000 documents numérisés (image, titre, description, tags...) proposés par des musées 5. Les photographies de notre base datent des années 1820 à 1999. Après 1999, la majorité des photographies numérisées proposées par les musées sont datées de leurs numérisations et non de leurs dates réelles de prise de vue. Nous les avons donc ignorées. Cette base contient des images couleur, noir et blanc, sépia, contrairement à Palermo, Hays et Efros (2012) qui n utilisent que des images couleurs sur une période de 50 ans. De plus pour la constitution de ce jeu de données nous avons pris en compte la distribution temporelle des images grâce à la possibilité de faire varier la granularité temporelle de notre base. Nous avons aussi pris en compte la distribution temporelle des sujets observés, afin d éviter tout biais lié au contenu des images. 4.2. Granularité Temporelle Comme dit précédemment, notre base est étalée dans le temps et les informations temporelles disponibles sont précises aux années près. De ce fait, nous ne sommes pas obligés de considérer l espace temps découpé en décennies. Nous pouvons donc 3. http ://books.google.com/ngrams [dernier accès le 13 Décembre 2012] 4. Les choix des descripteurs couleurs sont justifiés car en réalité ils permettent d extraire des informations discriminantes d un point de vue temporel. 5. http ://www.flickr.com/commons/ [dernier accès le 13 Décembre 2012]

Paul MARTIN considérer d autres découpages dans le but de trouver une séparation temporelle plus proche de l évolution non linéaire du problème. En effet, l espace temps est continu, et dans un cadre théorique idéal, toute image pourrait recevoir une valeur réelle entre 1820 et 1999 dans notre cas. Ainsi, les modèles les plus adaptés seraient les modèles de régression (Vapnik, 1995). 4.3. Ordre entre les Classes Les résultats obtenus par Palermo, Hays et Efros (2012) sont prometteurs. Cependant, dans le cadre d une estimation de la date de prise de vue d une photographie, les classes étudiées suivent un ordre chronologique. Cette information n est pas prise en compte dans leurs travaux. Il serait donc intéressant d en tenir compte soit dans les modèles d apprentissage (Cardoso et al., 2007) soit au moins dans les mesures d évaluation. En effet, pour les mesures d évaluation classiques, la différence entre la date réelle et la date prédite n est pas prise en compte. Se tromper d une année ou d une décennie revient à la même performance, alors que ce ne devrait pas être le cas. 5. Conclusions et perspectives Dans cet article, nous avons présenté une nouvelle problématique et défini un ensemble de verrous scientifiques qui n ont pas encore été traités dans la littérature. Dans nos expériences initiales, nous avons obtenu des résultats de précision comparables à Palermo, Hays et Efros (2012) mais dans un cadre plus large, ceci pour différents types de classifieurs (SVR, SVM), différentes stratégies de classification («One vs. One», «One vs. Rest»), différentes granularités (2 ans, 5 ans, 10 ans) et différents descripteurs visuels (SIFT, LAB). Dans la suite de nos travaux, nous proposerons de combiner les caractéristiques visuelles et textuelles pour la datation d images. 6. Bibliographie Berberich K., Bedathur S., Alonso O., Weikum G., «A Language Modeling Approach for Temporal Information Needs», 32nd European Conference on Information Retrieval, p. 13-25, 2010. Cardoso J., Pinto da Costa J., «Learning to Classify Ordinal Data : The Data Replication Method», The Journal of Machine Learning Research, vol. 8, p. 1393-1429, 2007. Coe B., Haworth-Booth M., A Guide to Early Photographic Processes, Victoria & Albert Museum, London, 1983. Ding H., Liu J., Lu H., «Hierarchical Clustering-based Navigation of Image Search Results», 16th ACM international Conference on Multimedia, p. 741-744, 2008. Krapac J., Allan M., Verbeek J., Jurie F., «Improving Web-Image Search Results Using Query- Relative Classifiers», 23rd Conference on Computer Vision & Pattern Recognition, p. 1094-1101, 2010. Palermo F., Hays J., Efros A. A., «Dating Historical Color Images», 12th European Conference on Computer Vision, p. 499-512, 2012. Peacock J., La mode de 1900 à nos jours, Thames & Hudson, 2008. Scalise A., Blose A., «Dating Images from Scanned Watermarks», 2010. US Patent Application No : 2010/0329,575 Class : 382218 (USPTO) SERIAL NO 12/491,268. Vapnik V., The Nature of Statistical Learning Theory, Springer-Verlag New York, Inc., 1995.