De l information à la connaissance et vice-versa Centre de traitement automatique du langage 17 octobre 2014 UCL, Louvain

Documents pareils
Présentation générale du projet data.bnf.fr

Pérennisation des Informations Numériques

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

Conférence de presse

Compte-rendu de Hamma B., La préposition en français

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Rédiger : le numérique dans la préparation de la thèse

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION

Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

Vue Générale et Cas d Usage

Technologies de la Recherche et standards du Web: Quel impact sur l Innovation?

NOUVEAU! SEPA Service Center

Concevoir sa stratégie de recherche d information

Le fonctionnement d un service d archives en entreprise. Le Service national des archives

Quels apprentissages info-documentaires au collège?

La Valorisation des Acquis de l Expérience (VAE) en Communauté française.

FICHE METIER. «Documentaliste» Documentaliste en radiodiffusion APPELLATION(S) DU METIER DEFINITION DU METIER

Semantic Web Inside Guillaume Érétéo Directeur R&D

Master Technologies numériques appliquées à l'histoire Deuxième année

Logiciels de référencement

EDITEUR ET INTEGRATEUR DE SOLUTIONS METIER.

ISTEX, vers des services innovants d accès à la connaissance

Couplage d une base de données documentaire à une visualisation interactive 3D sur l Internet

ifm electronic vous propose la «facturation dématérialisée»

L ENREGISTREMENT DU COURRIER

ARCHIVISTIQUE ET INGÉNIERIE DOCUMENTAIRE

Vers une convergence. Plateforme en ligne Mathrice

Archivage. des dossiers

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

Déjeuner EIM Enterprise Information Management. Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan

DOCSaaS Cloud Computing Solutions

Fourniture d un outil de gestion du courrier électronique pour les sites internet de la Documentation Française

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

La modernisation technologique du réseau repose alors sur plusieurs axes de travail :

Introduction aux CMS Microsoft. Philippe Sentenac

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ.

LISTE D OPTIONS DE LICENCE

Cycle de vie, processus de gestion

Big Data et Graphes : Quelques pistes de recherche

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

VOIP Mobilité Ubiquité. Jacques Debouche Fondateur Synsip

armasuisse Office fédéral de topographie swisstopo Cours geocat.ch 28 avril 2014

Archiviste - Documentaliste / Gestionnaire de l information / Consultant en archives et documentation

Normes et description. des ressources continues et données d autorité Analyse de l information Recherche documentaire : méthodes et outils

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

«Le portail unique des solutions de logement pour les seniors»

Table des matières détaillée

Université de Lausanne

MASTER LPL : LANGUE ET INFORMATIQUE (P)

Master Informatique Aix-Marseille Université

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. VOUS POUVEZ COMPTER SUR NOUS

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

Optimiser votre relation client via la souscription 100% numérique

LE KIT DU MANAGER DE PROJETS

INTERNET. INTERNET (7 H) Le 12 SEPTEMBRE 2011 à REIMS OU CHALONS EN CHAMPAGNE

Acquisition Indexation Classement & Recherche & Stockage Consultation. Solution d archivage sur mesure

Portail collaboratif Intranet documentaire Dématérialisation de processus

Cabinet de recrutement IT.

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ.

Master 120 en Sciences de Gestion Nouveau track «Financial Management» Programme membre du «CFA University Recognition Program»

Comité sectoriel de la Sécurité sociale et de la Santé Section «Sécurité sociale»

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Cours Bases de données

PRESENTATION 2009 L'ingénierie Documentaire

Gérez efficacement vos mails avec Outlook 2013

Jean-Marc Rietsch, PCI DSS Roadshow Paris juillet

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Applications pour le travail

Powerbat Portail web de services énergétiques

VOS INFORMATIONS ONT UNE VIE. Nous sommes là pour vous accompagner à chaque étape

Etat. factures. portail. res. dématérialiser EDI. fournisseurs. Etat EDI CO2. Dématérialisation des factures. portail. fiabilité.

La mise en œuvre d'une gestion électronique des documents

HYPERSUITE/5. La solution de GED et d Archivage Légal intégrée à Delta-Bank

Titre du MASTER : Lettres, Langues et Sciences humaines Mention : Sciences de l Information et Métiers de la Culture Spécialité : Archivistique

Accompagnement de la série STMG. Repères pour l enseignement des sciences de gestion

La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

Mise en œuvre d un Serveur d Archivage Electronique pour les factures client. 28/01/2015 Sébastien Dufrene

Programme Type de Formation SEO

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

La dématérialisation révolutionne la gestion du courrier

Dans un contexte économique difficile, comment exploiter tout le potentiel d'un assistant virtuel en ligne? Odile BEURIER & Frédéric DURKA

Avant-propos... Introduction... Première partie Comprendre : les concepts. Chapitre 1 La gestion des données de référence... 3

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Compte-rendu re union Campus AAR 3 mars 2015

CATALOGUE DE PRESTATIONS D ACCOMPAGNEMENT METIER DES CENTRES DE CONTACTS

Le langage SQL pour Oracle - partie 1 : SQL comme LDD

Le MIC lance un appel à projet «Serious Game»

COLLOQUE INTERNATIONAL

Extensions, Documentation, Tutoriels, Astuces

Génie Logiciel avec Ada. 4 février 2013

Conception des systèmes répartis

Annonces internes SONATRACH RECHERCHE POUR SA DIRECTION CENTRALE INFORMATIQUE ET SYSTÈME D INFORMATION :

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Présentation du PL/SQL

Big Data et Graphes : Quelques pistes de recherche

«Du développement des centres d appels à l émergence du BPO au Maroc»

Archivage à long terme des données de la recherche scientifique

Transcription:

1 2 De l information à la connaissance et vice-versa Centre de traitement automatique du langage 17 octobre 2014 UCL, Louvain 3 Xavier Jacques-Jourion Responsable des Archives, Direction Générale Technologie & Exploitation, RTBF Professeur Associé, Master en Gestion Globale du Numérique, HELB Membre du Media Management Committee, Fédération Internationale des Archives de Télévision 4 RTBF Institution Publique Francophone 3 chaînes de Télévision 5 chaînes de Radio Portails internet

5 Archives Média de la RTBF Création d une filiale, la Sonuma, pour la numérisation et commercialisation des archives d avant le 1/01/2008. Environ 200.000 heures de contenus. Archivage de la production quotidienne pour TV et Radio. Service de recherches dans la collection. Conseil dans l organisation de l Information. 6 7 Stratification des informations Accumulation de documents au cours d une longue période de temps Evolution des systèmes Evolution des méthodes Evolution de la langue 8 Que cherche-t-on? Une émission pour la rediffuser, Une image historique, Une image prétexte, Ou tout simplement les informations contenues dans les médias.

Comment cherche-t-on? 9 Outils développés en interne, Media Asset Management, Métadonnées comme proxy d indexation, La date de diffusion comme méthode la plus efficace. 10 Comment reconnaître une suédoise? 11 12

13 14 La technologie sémantique De la donnée à la connaissance 15 Premier avion lancé sur la tour Nord du World Trade Center à New York. 11/09/2001-08:46 EST 1315730760 De la donnée à la connaissance 16 Connaissance Information / Contenu Donnée brute

De la donnée à la connaissance 17 De la donnée à la connaissance 18 19 En résumé 20

21 22 23 Pistes de solutions 24 MediaMap Intégration de la chaîne de création de contenus TV. Acquisition de métadonnées tout au long. Gestion des rôles dans un système sémantique Outil de recherche / Player enrichi

25 GEMS1 - Quincaillerie 26 Module d import de nos données. Moteur sémantique. Système d élévation sémantique par détection des entités nommées. Speech-to-text, ou reconnaissance vocale, synchrone avec référence temporelle. Interface utilisateur moderne. Module d import Linked Open Data. Ontologies spécifiques. GEMS2 27 Montée en charge sur les contenus Focus sur les médias TV numérisés par la Sonuma Uniquement speech-to-text Conclusions en cours Speech to text 28 Maturité suffisante si cadrage réaliste du projet. Génération de métadonnées d indexation. Synchronisation de texte existant. Deux modes d utilisation distincts, avec ou sans entraînement spécifique au locuteur.

Speech to text généraliste 29 Projet de test en Radio, pour les tranches News (Matin Première). Spécificité de la langue française en Belgique: accents, vocabulaire, noms de famille, noms de lieux. Entraînement sur un corpus disponible. Peu d acteurs sur le marché. Perroquet 30 Test de la technologie pour la production de sous-titrage. Entraînement du moteur sur un nombre limité de locuteurs. Entraînement spécifique au champ lexical du programme. Utilisation en direct. Technologie Dragon Dictate intégrée au logiciel de sous-titrage FAB. News Web 31 Suggestion de mots-clés automatique. Suggestion d articles apparentés. A l étude: veille réseau sociaux, veille concurentielle, moteur de recherche avancé. Knowbel - Early Tracks 32 Vision

Généralisation 33 Généralisation de l enrichissement automatique de façon transversale. Lien entre les différentes sources d information dans l entreprise Ex: bottin interne, données comptables. Gestion centralisée des listes de référence: Lieux, Personnes, Mots-clés, Evénements. 34 35 "Now this is not the end. It is not even the beginning of the end. But it is, perhaps, the end of the beginning." Winston Churchill 36 En tout cas, il y a peu de gens qui peuvent se vanter de savoir à ce point que vous n'êtes nulle part. Anonyme

37 Conclusions Encore beaucoup de choses à améliorer, Mais surtout beaucoup de maturité à gagner dans des solutions logicielles existantes qui dominent le marché. Nous sommes ouverts à tout projet de recherche, que ce soit par l accueil d un étudiant ou chercheur, ou la participation active à un projet. 38 0473-52-4269 xja@rtbf.be 39