Journée d'étude sur les résumés multimédia Paris, 17 Mars 2011 ATALA, AFCP, GDR-ISIS. Compte-Rendu



Documents pareils
Apprentissage Automatique

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Forthcoming Database

: Machines Production a créé dès 1995, le site internet

Application Form/ Formulaire de demande

APPENDIX 6 BONUS RING FORMAT

INSERTION TECHNIQUES FOR JOB SHOP SCHEDULING

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

Editing and managing Systems engineering processes at Snecma

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Once the installation is complete, you can delete the temporary Zip files..

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

Exemple PLS avec SAS

Life Companies Borrowing Regulations. Règlement sur les emprunts des sociétés d assurance-vie CONSOLIDATION CODIFICATION

Instructions Mozilla Thunderbird Page 1

How to Login to Career Page

Calculation of Interest Regulations. Règlement sur le calcul des intérêts CONSOLIDATION CODIFICATION. Current to August 4, 2015 À jour au 4 août 2015

Women s State of the Media Democracy 2012 L observatoire international des usages et interactions des médias

Le Traitement Automatique des Langues en France à l ère du Big Data

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Design and Implementation of an Efficient Data Stream Processing System

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

Interest Rate for Customs Purposes Regulations. Règlement sur le taux d intérêt aux fins des douanes CONSOLIDATION CODIFICATION

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

BNP Paribas Personal Finance

Monitoring elderly People by Means of Cameras

REVISION DE LA DIRECTIVE ABUS DE MARCHE

The space to start! Managed by

Contents Windows

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

CONSOLIDATION CODIFICATION. Current to August 30, 2015 À jour au 30 août 2015

Algorithmes de recommandation, Cours Master 2, février 2011

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

Institut français des sciences et technologies des transports, de l aménagement

L impact des délais de paiement et des solutions appropriées. Dominique Geenens Intrum Justitia

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences

Bourses d excellence pour les masters orientés vers la recherche

Tarification et optimisation pour le marketing

The assessment of professional/vocational skills Le bilan de compétences professionnelles

Face Recognition Performance: Man vs. Machine

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Archived Content. Contenu archivé

Règlement relatif à l examen fait conformément à la Déclaration canadienne des droits. Canadian Bill of Rights Examination Regulations CODIFICATION

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

Project 1 Experimenting with Simple Network Management Tools. ping, traceout, and Wireshark (formerly Ethereal)

Borrowing (Property and Casualty Companies and Marine Companies) Regulations

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Credit Note and Debit Note Information (GST/ HST) Regulations

Fiche produit ifinance v4

POSITION DESCRIPTION DESCRIPTION DE TRAVAIL

WEB page builder and server for SCADA applications usable from a WEB navigator

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

I>~I.J 4j1.bJ1UlJ ~..;W:i 1U

Afin de valider votre inscription merci de bien veiller à :

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

1.The pronouns me, te, nous, and vous are object pronouns.

Lean approach on production lines Oct 9, 2014

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

Exercices sur SQL server 2000

Tier 1 / Tier 2 relations: Are the roles changing?

calls.paris-neuroscience.fr Tutoriel pour Candidatures en ligne *** Online Applications Tutorial

RAPID Prenez le contrôle sur vos données

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

VTP. LAN Switching and Wireless Chapitre 4

Resident Canadian (Insurance Companies) Regulations. Règlement sur les résidents canadiens (sociétés d assurances) CONSOLIDATION CODIFICATION

Discours du Ministre Tassarajen Pillay Chedumbrum. Ministre des Technologies de l'information et de la Communication (TIC) Worshop on Dot.

sur le réseau de distribution

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

TEXT MINING von 7

Nouveautés printemps 2013

3615 SELFIE. HOW-TO / GUIDE D'UTILISATION

Revision of hen1317-5: Technical improvements

PeTEX Plateforme pour e-learning et expérimentation télémétrique

Forge. Présentation ( )

Règlement sur les baux visés à la Loi no 1 de 1977 portant affectation de crédits. Appropriation Act No. 1, 1977, Leasing Regulations CODIFICATION

Disclosure on Account Opening by Telephone Request (Trust and Loan Companies) Regulations

UML : Unified Modeling Language

GAME CONTENTS CONTENU DU JEU OBJECT OF THE GAME BUT DU JEU

We Generate. You Lead.

Les Portfolios et Moodle Petit inventaire

ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

Réinvestir les scénarios de test de la plate-forme d'apprentissage Moodle pour stimuler les échanges sur ces fonctionnalités

Ordonnance sur le paiement à un enfant ou à une personne qui n est pas saine d esprit. Infant or Person of Unsound Mind Payment Order CODIFICATION

Improving the breakdown of the Central Credit Register data by category of enterprises

APPENDIX 2. Provisions to be included in the contract between the Provider and the. Holder

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

CONVENTION DE STAGE TYPE STANDART TRAINING CONTRACT

Yes, you Can. Travailler, oui c est possible! Work!

Transcription:

Journée d'étude sur les résumés multimédia Paris, 17 Mars 2011 ATALA, AFCP, GDR-ISIS Compte-Rendu Cette réunion a attiré une quarantaine de participants issus des 3 communautés langage naturel, texte, et signal. 9h30 Conférence invitée: Horacio Saggion (Universitat Pompeu Fabra) Can summaries help natural language processing? Study of the effect of text summarization in opinion classification and other tasks En introduction, les méthodes utilisées en résumé automatique et les paradigmes d évaluation sont passées en revue. Deux tâches courantes en traitement automatique des langues qui peuvent exploiter le résumé automatique sont ensuite exposées. La première tâche est la coréférence entre plusieurs documents. Il s agit de savoir si deux entités nommées (comme les personnes) citées dans plusieurs documents font référence à la même entité, sachant que les noms propres sont très ambigus. La méthode utilisée est de faire du clustering sur un ensemble de documents qui contiennent le même nom de personne jusqu à ce qu un seuil défini soit atteint. Les données pour l évaluation proviennent du 1st Web People Search Evaluation) et la mesure appliquée est le F-score. L utilisation de différents vecteurs de représentation du document (mots, entités, types d entités, différents types de résumés, ) a été évaluée avec différents taux de compression, menant à un total d environ 900 expériences. Généralement l utilisation de résumés ne dégrade pas les résultats, mais n améliore pas les résultats non plus. La seconde tâche est la classification des opinions. Le lexique utilisé est SentiWordNet, en combinaison avec des SVM dans GATE. L expérience consiste à comparer la catégorisation des revues (de banque, de film) et de leurs résumés. Pour les revues de banques, 160 conditions ont été testées avec plus de 7000 résumés. Beaucoup de conditions ont donné des résultats pires en utilisant les résumés que les documents complets, alors que certains en étaient proches. Dans les résultats préliminaires sur les critiques de films, il existe des catégorisations de sentiments qui sont meilleures sur les résumés. 10h30 Frederik Cailliau (Sinequa) Le projet RPM2: résumé pluri-média, multi-documents et multi-opinions Le résumé automatique est la question centrale du projet RPM2 (janvier 2008 juin 2011). Le défi relevé par les partenaires du projet est de construire les méthodes et les outils pour faire du résumé sur le texte, l audio et le vidéo. L application visée est la structuration et la présentation de différentes sources d information sous forme de résumé pour un agrégateur d information (comme Wikio) ou un moteur de recherche (comme Sinequa). 1

Pour le résumé texte, un classement des phrases est faite avec des mesures de similarité, exploitant au passage une compression des phrases. Le choix des segments peut être guidé par l opinion (positif négatif) exprimé. Les résultats ont été évalués avec la mesure Rouge, et une méthode d évaluation sans référence est en cours de développement. Deux corpus sont disponibles pour la communauté sur le site web. Le résumé audio est fait sur du vidéo afin d être plus attractif et peut être orienté différemment selon les besoins. Deux méthodes ont été mises en œuvre (classique et zapping) et ont été évaluées. Le résumé vidéo se fait par la sélection des segments importants et la présentation d affichettes. Les méthodes Video-MMR et AV-MMR ont été implémentées et évaluées avec la nouvelle mesure Vert. 11h30 Karaman Svebor (LaBRI) Résumé en activités du quotidien de vidéos portées Dans le cadre de la recherche sur la maladie d Alzheimer, le projet IMMED propose un dispositif innovant permettant l observation des activités du quotidien au domicile de patients pour l évaluation de pertes d autonomies. Une caméra fixée sur un gilet porté par le patient enregistre une vidéo en plan séquence d un ensemble d activités. La production d un résumé automatique en termes d activités permet au médecin d observer efficacement les éléments d intérêts. 12h Francois Portet (LIG) Génération automatique de résumés textuels de données multimodales pour la prise de décision en unité néonatal Les travaux présentés cadrent dans le projet anglais The BabyTalk Project (http://www.csd.abdn.ac.uk/research/babytalk/). Lors de la surveillance des patients, des données graphiques sont produites en grandes quantités. Pour faciliter l interprétation de ces graphiques un résumé texte est produit qui les traduit en texte. Le défi est donc de générer un résumé de texte à partir de données graphiques. Afin de consolider la terminologie utilisée par les différents modules d analyse des graphiques et de génération de texte, une ontologie a été créée. Elle oblige à fixer les concepts et permet de raisonner. Le résumé comporte environ 20 événements qui sont sélectionnés par un coefficient d importance. Celui-ci est attribué selon des informations d expert et des heuristiques. La génération du texte est faite avec SimpleNLG. L évaluation a été faite sur place avec du personnel médical comme utilisateurs. 12h30 Emilie Guimier De Neef (Orange Labs) Un outil de géolocalisation et de résumé automatique pour faciliter l accès à l information dans des corpus d actualité L outil de résumé automatique multi-documents développé par Orange Labs enrichit les services proposés sur 2424actu, un service d Orange. Ce site d actualités est un agrégateur de contenus produits par des médias professionnels (50 partenaires). L affichage cartographique est brièvement introduit : il exploite les entités nommées et la base Geonames pour projeter des clusters de documents sur une carte. Le résumé des documents a été développé dans le cadre d un contrat Cifre (Aurélien Bossard). L objectif est d extraire les phrases qui maximisent la centralité (pertinence) et la diversité des 2

informations tout en minimisant la redondance. La méthode a été appelé CBSEAS et repose sur un calcul de similarité entre phrases et une classification des phrases. Par classe, une phrase représentative est extraite. On note la participation aux campagnes TAC 2008 et 2009. La classification non supervisée des phrases a été implémentée avec 2 mesures de centralité, comparée avec d autres méthodes et évaluée avec la mesure Rouge sur le corpus RPM2. 14h15 Benoit Favre (LIF) Evaluation du résumé automatique Comme la traduction automatique, le problème de résumé automatique n admet pas une solution unique. En effet, étant donné un ou plusieurs documents, chacun créera un résumé différent. Cette problématique est vraie que le medium à résumer ou le médium dans lequel le résumé est produit soit écrit, audio, ou vidéo. Dans ma présentation, je reviendrai sur les différentes méthodes d évaluation de systèmes de résumé automatique qu elles soient manuelles ou automatiques, intrinsèques ou applicatives, traitant du fond ou de la forme. Je dresserai un bilan de leurs forces et leurs faiblesses et lancerai la discussion sur ce thème essentiel pour mesurer l avancement du résumé automatique multimédia. 14h45 Guillaume Gravier (IRISA) Vers le résumé automatique de l'oral sans transcription De récents travaux sur la découvertes de motifs récurrents dans les contenus sonores permettent de découvrir et de collecter des occurrences de mots réitérés dans les contenus parlé, sans recourir à des connaissances acoustique et linguistique a priori. Les motifs découverts dans les contenus parlés sont d une part des événements liés à la production de la parole (inspirations, euh, etc.) et, d autre part, des mots ou locutions. Ces derniers motifs peuvent servir de base à la construction d'un résumé sonore par sélection de motifs clés dans un premier temps puis de segments contenant ces motifs. La sélection de motifs clés peut se faire à l aide de critères de fréquence ou d'un critère prosodique. Nous présentons une synthèse de récents travaux dans cette direction. Nous abordons tout d abord la découverte de motifs sonores. Nous discutons ensuite leur sélection par des critères prosodiques. Enfin, nous illustrons le concept par une démonstration. 15h15 Geoffroy Peeters (IRCAM) Génération automatique de résumés audio musicaux Plusieurs techniques existent pour la génération automatique d'un résumé audio d'un morceau de musique. Dans tout les cas, l'objectif est d'obtenir un extrait audio court résumant le ou les instants clefs d(un morceau. La technique développée par l'ircam repose sur l'analyse de la structure temporelle d'un morceau de musique en terme de répétition de segments (ou de séquences) au cours du temps. Celle-ci est ensuite utilisée pour générer le résumé. Dans un premier temps, des descripteurs sont d'abord extraits du signal audio afin de représenter son contenu : MFCC, Chroma/PCP, SFM/SCM. Dans l'approche par état, cette suite temporelle des descripteurs est analysée afin d'obtenir une représentation sous forme de segments. Pour cela, des approches de type clustering (k-means ou hierarchical agglomerative clustering) ou HMM peuvent être 3

utilisée. Dans l'approche par séquence, une matrice de similarité est calculée. De ses diagonales (indiquant des répétitions) sont extraites les différentes séquences. Une fois la structure estimée, les segments ou séquences clefs sont déterminés (fonction de leur nombre d'occurrence, de leur position temporelle, de leur sonie moyenne). Les trois segments les plus représentatifs sont finalement concaténés par une technique d'over-lap synchrone à la position de premiers temps. Pour cela un algorithme estime parallèlement la grille temporelle du morceau. Une évaluation de cette technique sur une base de 150 titres, montre que dans 95% des cas, un des trois extraits contient le titre du morceau considéré comme l'instant clef. 16h15 Abderrafih Lehmam (Mining Essential) Le résumé automatique de texte est-il maintenant mature pour une industrialisation logicielle? L'expérience de la société Mining Essential Abderrafih Lehmam a présenté le logiciel de résumé automatique Essential Summarizer commercialisé par Mining Essential. Ce produit multi-plateforme est disponible en 20 langues et couvre 66 domaines. Il utilise les éléments discursifs du texte pour pondérer les phrases et générer un résumé automatique dont la longueur peut être modifiée par l utilisateur en temps réel. Parmi les dernières nouveautés se trouvent la mise en évidence des phrases les plus importantes du texte par une police de caractères agrandie, l intégration d un traducteur automatique du résumé, le résumé de pages web et l affichage de synonymes. Le logiciel peut être testé en ligne sur essential-mining.com. 16h45 Alina Elma Abduraman (Orange Labs) Structuration intra-programmes de contenu TV An important feature for automatic segmentation and structuring of TV programs is to provide tools that allow users to efficiently navigate within TV programs, that is, directly seek a certain part of a program or particular moments of interest. To achieve that, the original structure of each TV program needs to be recovered. In other terms, the start and end times of each part of the program have to be detected. This processing step cannot be performed manually when dealing with the huge amount of available TV programs. This work addresses the unsupervised structuring of recurrent TV programs. These are programs that are periodically broadcasted, e.g. entertainment, shows, magazines... The proposed solution considers for each TV program a set of episodes. The idea is to automatically detect separators. These are short sequences that are inserted between different parts of the program, and that are generally repeated over the episodes or within the same episode. To achieve that, a repeated video sequence detection method is applied over the set of episodes. The detected repeated sequences are further analyzed in order to filter out those that are not separators. The effectiveness of the proposed solution has been shown on 3 different French TV programs. 17h15 Adriana Garboan (Telecom SudParis) Video fingerprinting - a tool for multimedia automated summarization systems Video fingerprinting can be best defined in relation with human fingerprinting: the human fingerprint can be seen as a human summary (a signature) that is unique for every person; similarly the video 4

fingerprint can be seen as a short video feature which can uniquely identify the videos. Although generally not connected to automated multimedia summarization, video fingerprinting can serve applications related to the same field. The challenge our research takes is video identification and retrieval in large databases. In our study we developed an original fingerprinting method which is able to identify video queries of 20s long in a database. The principle is to exploit the mathematical modeling of the DWT coefficients in order to extract unique identifiers and to optimize the detection rule. The experiments proved the viability of the method: the probabilities of false alarm and of missed detection are both lower than 10-4. The corpus consists of 3 hours of original video content, belonging to 7 different movies and combining indoor and outdoor scenes, unstable and arbitrary lighting conditions, still and high motion scenes. These 3h were further processed by some content preserving transformations, like conversion to gray scale, contrast decrease, sharpening, small rotations (2 ), linear filtering (Gaussian filter) and geometric (StirMark random bending). Hence, the corpus sums up to 21 hours of video content. 17h45 Clôture 5