Plan de la présentation

Dimension: px
Commencer à balayer dès la page:

Download "Plan de la présentation"

Transcription

1

2 Plan de la présentation 1) Intro Problématique, réussites globales, chronologie 2) «Face aux données» (aperçu de la base) L'objet documentaire, les PDFs, les facettes 3) Explication de la méthodologie Choix des méthodes probabilistes, de l'outil grobid et du protocole 4) «Cycles qualité» Evaluations de l'extraction sur échantillons, données d'entraînement 5) Tests de montée en charge Parallélisation, choix du périmètre à enrichir, résultats 6) Perspectives [enrichissement refbibs 18/03/2015] 2

3 (1) = intro [enrichissement refbibs 18/03/2015] 3

4

5

6 (1) Réussites principales Environnement d'essais Qualité : cycles d'amélioration tri détaillé des erreurs, croisement par aggrégats rapport automatique, rangement par corpus de test sous-corpus => entraînement => modèle => test des refbibs sorties améliorations obtenues de dure lutte pour les modèles intermédiaires + 15 % de rappel (mais après en avoir perdu au début!) «prépareur» de formats d'entraînement à partir des bases Quantité : «essai transformé» sur 2,4 M docs mise en oeuvre des modèles de l'étape précédente montée en charge testée à plusieurs reprises 17,5 M refbibs extraites, classées selon source, balisées en 3 jours [enrichissement refbibs 18/03/2015] 6

7 (2) = aperçu des données [enrichissement refbibs 18/03/2015] 7

8

9 ici exemples pdf ou graphe md [enrichissement refbibs 18/03/2015] 9

10

11

12 (3) = méthodologie [enrichissement refbibs 18/03/2015] 12

13 (3a) Méthodologie choisie Un modèle probabiliste => robustesse à long terme entraînées sur des données réelles connues («gold») souplesse face aux erreurs d'ocr adaptation aux styles Zhou XH, Gao S. Confidence intervals for the log-normal mean. StatistMed. 1997;16(7): X. H. Zhou and S. Gao, Confidence intervals for the log-normal mean, StatistMed, vol. 16, no. 7, pp , Zhou, X. H.; Gao, S. StatistMed 1997, 16, Le choix de l'outil Grobid s'appuie sur des librairies reconnues pdftoxml / wapiti a les meilleurs scores ex aequo avec Cermine prévoir un système de montée en charge à travers un service REST [enrichissement refbibs 18/03/2015] 13

14 (4c) Préparation de corpus d'entraînement Procédure pour recomposer du corpus d'entraînement automatiquement Développement d'un script de «ragréage» On utilise nos données déjà annotées (notices riches) Fusion des informations typées avec le texte Le texte tel que Grobid le verrait Différence entre les formats l'infos structurée des notices ne préserve pas tout : les virgules ni les tirets, les parenthèses, ni les mots d'escorte dédiés «Vol:» «In:» «and» ça paraît peu de choses... mais en fait => détails typiques fondamentaux pour reconnaître les champs [enrichissement refbibs 18/03/2015] 14

15

16

17

18

19 (4) = «Cycles» qualité [enrichissement refbibs 18/03/2015] 19

20 (4a) Suivi qualitatif détaillé [enrichissement refbibs 18/03/2015] 20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45 (4c) Préparation de corpus d'entraînement Procédure pour recomposer du corpus d'entraînement automatiquement Développement d'un script de «ragréage» On utilise nos données déjà annotées (notices riches) Fusion des informations typées avec le texte Le texte tel que Grobid le verrait Différence entre les formats l'infos structurée des notices ne préserve pas tout : les virgules ni les tirets, les parenthèses, ni les mots d'escorte dédiés «Vol:» «In:» «and» ça paraît peu de choses... mais en fait => détails typiques fondamentaux pour reconnaître les champs [enrichissement refbibs 18/03/2015] 45

46 (4d) Exemple : le modèle segmentation Objectif du modèle : Déterminer la zone des refbibs Quelle séquence d'étiquettes? pseudo-tei teiheader front body listbibl notes + les sauts de ligne <lb/> #document 1078 tei 1078 text 1078 body 5039 lb page 3560 lb 3344 note 2381 lb 2692 listbibl 1661 lb front 1394 lb lb 191 teiheader 1078 filedesc 1078 le flux textuel est celui issu du «ragréage» [enrichissement refbibs 18/03/2015] 46

47

48 (5) = Montée en charge [enrichissement refbibs 18/03/2015] 48

49

50 (5b) Aperçu résultats quantitatifs Nombre de bibs/doc selon le type de document [enrichissement refbibs 18/03/2015] 50

51 (5b) Aperçu résultats quantitatifs Nombre de bibs/doc selon le type de document [enrichissement refbibs 18/03/2015] 51

52 er (5c) 1 bilan de montée en charge 17,5 M de bibliographies! permettent de mettre en place la procédure de ré-intégration à la base Globalement prêts pour tout volume Optimisations RAM (très grands PDFs), accès disque, bugs Vitesse de traitement améliorée 1ers tests => 0,8 docs/s oct/nov => 5 docs/s mars => 9 docs/s 0,8 M de documents / jour Dépouillement complémentaires à venir type digital estimation qualité dédoublonnage [enrichissement refbibs 18/03/2015] 52

53 (6) = Perspectives [enrichissement refbibs 18/03/2015] 53

54 Choix des objectifs pour la suite Préparation en amont meilleure maîtrise du txt en amont corrections post-ocr typologie du document segmentation du document front, tables, sections, zone biblio Poursuite cycles qualité + de corpus d'entraînement nouvelles «features» traits descriptifs => indices «piste rouge» du CRF suite intégration Usages avancés ajout aux index résolution de liens métadonnées => OpenUrl stats agrégées cas de figures API estimation qualité au fil de l'eau consolidation (dédoublonnage) fonctionnalités de recherche [enrichissement refbibs 18/03/2015] par ex, visualisation du graphe des co-citations par ex, agrégé entre revues par ex, évoluant dans le temps... 54

55 Conclusion On a tenté de suivre les bonnes pratiques Participé aux reflexions sur l'indexation avancée Obtenu des résultats à grande échelle R&D => adaptation => production Développement d'un environnement d'essais selon la méthode ML Développement d'outils pour traiter un flux de bibs Procédures calées sur l'api et loadistex Mode service débuggé, paramétré Les volumes de sortie ouvrent déjà de nombreuses possibilités Mais (qualité X quantité) => prend du temps Nécessaire de continuer les cycles d'améliorations [enrichissement refbibs 18/03/2015] 55

56 «Références :» Besagni & Belaïd (2004). Citation recognition for scientific publications in digital libraries. Cortez, da Silva, Gonçalves, Mesquita & de Moura (2007). FLUX-CIM: flexible unsupervised extraction of citation metadata. Giles, Bollacker & Lawrence (1998). CITESEER: An automatic citation indexing system. Jewel (2004). PARATOOLS: ParaCite Reference Parsing Module. Kim, Bellot, Faath & Dacos (2011). BILBO: Automatic annotation of bibliographical references in digital humanities books, articles and blogs. Lopez (2009). GROBID: Combining automatic bibliographic data recognition and term extraction for scholarship publications. Peng & McCallum (2006). Information extraction from research papers using conditional random fields. Seymore, McCallum & Rosenfeld (1999). CORA: Learning hidden Markov model structure for information extraction. Shotton, Dutton & O Steen (2014). JISC: Open Citations Database. Tkaczyk & Bolikowski (2011). Workflow of metadata extraction from retro-born-digital documents.

57 Annexe : Scripts et protos complémentaire Des développements complémentaires Outils de traitement du document Echantilloneur «Trieurs» «Re-formateuses» selon leur taille selon le domaine selon le style typo/biblio bibl (markups plats) <=> biblstruct (markups arborés) de 5 formats «natifs» vers la TEI Divers Afficheuse arbre XML [enrichissement refbibs 18/03/2015] 57

58 Annexe : Echantillonage et score attendu Un corpus difficile mais passionnant Un volume exceptionnel Une archive d'archives Réunion de textes plus ou moins préservés origine du texte => diversité des pré-traitements à la source «label rouge» => intérêt d'un classifieur de textes en amont Taux de réussite réel et taux théorique choix d'échantilloner le corpus avec ses défauts selon source selon version PDF selon type de document selon style typographique de la citation fruit d'une analyse approfondie des métadonnées en présence ainsi les taux de succès reflètent l'horizon d'attente face au «tout-venant» [enrichissement refbibs 18/03/2015] 58

59 Annexe : Explication traitements formulaire La citation biblio. est une séquence linguistique «formulaire» LG : de l'intention à la chaîne de signes BIB <= DATE + ART + JOURN ART <= (k x AUT) + [TIT] + [pp] JOURN <= NomJ ital + vol Exemple courant : les chaînes Unitex partir des formes connues observer les règles de capture utilisées dans la vie modéliser les règles en graphes génératifs Problème l'adaptation à des règles proches + mode passée? [enrichissement refbibs 18/03/2015] 59

60

en 20 slides! GROBID: Un outil d extraction pour les publications scientifiques Patrice.Lopez@inria.fr Nancy 25.11.2014

en 20 slides! GROBID: Un outil d extraction pour les publications scientifiques Patrice.Lopez@inria.fr Nancy 25.11.2014 GROBID: en 20 slides! Un outil d extraction pour les publications scientifiques Patrice.Lopez@inria.fr Nancy 25.11.2014 GROBID GeneRation Of BIbliographic Data Un outil d analyse et d extraction d informations

Plus en détail

Introduction aux CRF via l annotation par des modèles graphiques. Isabelle Tellier. LIFO, Université d Orléans

Introduction aux CRF via l annotation par des modèles graphiques. Isabelle Tellier. LIFO, Université d Orléans Introduction aux CRF via l annotation par des modèles graphiques Isabelle Tellier LIFO, Université d Orléans Plan 1. Annoter pour quoi faire 2. Apprendre avec un modèle graphique 3. Annnoter des chaînes

Plus en détail

LES ARCHIVES OUVERTES AVEC HAL : PRÉSENTATION DE LA VERSION 3. Juin 2014

LES ARCHIVES OUVERTES AVEC HAL : PRÉSENTATION DE LA VERSION 3. Juin 2014 LES ARCHIVES OUVERTES AVEC HAL : PRÉSENTATION DE LA VERSION 3 Juin 2014 PLAN Authentification CAS centralisée Mon espace : Mes dépôts Mes partages de propriété Mon profil Mon idhal : menu de gestion de

Plus en détail

Conférence OCP Facteurs-clés de succès d une veille scientifique et technique : Objectifs, Méthodologie, Organisation, Solutions

Conférence OCP Facteurs-clés de succès d une veille scientifique et technique : Objectifs, Méthodologie, Organisation, Solutions Conférence OCP Facteurs-clés de succès d une veille scientifique et technique : Objectifs, Méthodologie, Organisation, Solutions Qwam Content Intelligence Denis Guedez Consultant Qwam Content Intelligence

Plus en détail

Gestion collaborative de documents

Gestion collaborative de documents Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,

Plus en détail

Typologie des fonctionnalités textométriques selon un point de vue utilisateur : illustration par leurs implémentations dans des logiciels

Typologie des fonctionnalités textométriques selon un point de vue utilisateur : illustration par leurs implémentations dans des logiciels EDITION DU 19 NOVEMBRE 2009 Typologie des fonctionnalités textométriques selon un point de vue utilisateur : illustration par leurs implémentations dans des logiciels Bénédicte Pincemin (éditeur) Les différents

Plus en détail

Frantext : une base de données pour la recherche

Frantext : une base de données pour la recherche Frantext : une base de données pour la recherche veronique.montemont@a.lf.fr www.atilf.fr Frantext : une base de données pour la recherche Trésor de la Langue Française (TLF) TLF - 1971-1994 - 100 000

Plus en détail

Présentation de la plateforme d analyse linguistique médiévale

Présentation de la plateforme d analyse linguistique médiévale Présentation de la plateforme d analyse linguistique médiévale 1. Introduction Tout au long de ce document, notre projet sera présenté à travers la méthodologie suivie pour développer la plateforme d analyse

Plus en détail

Gérer ses références bibliographiques avec Zotero

Gérer ses références bibliographiques avec Zotero Gérer ses références bibliographiques avec Zotero Elsa Poupardin / Strasbourg Mars 2012 A partir du travail de Marie Laure Malingre Plan Présentation / Installation / Interface Récupérer des références,

Plus en détail

Digital Workplace et Gestion des connaissances Concepts et mise en oeuvre

Digital Workplace et Gestion des connaissances Concepts et mise en oeuvre Avant-propos 1. Objectif du livre 17 2. Illustrations des exemples de ce livre 18 2.1 Office 365 comme plateforme technologique pour une digital workplace 18 2.2 SharePoint et Yammer à l honneur 18 3.

Plus en détail

ANR DifdePo : numérisation et mise en ligne du fonds en dépôt à la BnF Olivier Jacquot

ANR DifdePo : numérisation et mise en ligne du fonds en dépôt à la BnF Olivier Jacquot ANR DifdePo : numérisation et mise en ligne du fonds en dépôt à la BnF Olivier Jacquot Coordonnateur à la recherche, délégation à la Stratégie et à la recherche 2 Opérations envisagées : plan Numérisation

Plus en détail

MYXTRACTION. 2009 La Business Intelligence en temps réel

MYXTRACTION. 2009 La Business Intelligence en temps réel MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables

Plus en détail

Un serveur d'archivage

Un serveur d'archivage Un serveur d'archivage destiné au Service Commun de Documentation de l'université de la Méditerranée Encadrement : Noël Novelli Représentants client (S.C.D.) : Axelle Clarisse Ronan Lagadic Equipe Projet

Plus en détail

! Text Encoding Initiative

! Text Encoding Initiative Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique

Plus en détail

AVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION...

AVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION... AVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION... 8 DANS MS WORD (SUR WINDOWS)... 8 DANS MS WORD (SUR MAC)... 8 DANS

Plus en détail

Programme de formation InDesign : Initiation 24 heures de formation (3 jours) 1/2

Programme de formation InDesign : Initiation 24 heures de formation (3 jours) 1/2 Programme de formation InDesign : Initiation 24 heures de formation (3 jours) 1/2 Graphistes, maquettistes ou toute autre personne en charge de la mise en page de documents pour l impression ou la publication

Plus en détail

Les humanités numériques à l ère du big data

Les humanités numériques à l ère du big data Les humanités numériques à l ère du big data D. A. ZIGHED djamel@zighed.com Journées Big data & visualisation Focus sur les humanités numériques ISH Lyon 18-19 juin 2015 Co-organisées par EGC AFIHM - SFdS

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

L évolution des pratiques d observation. de l outil Servist pour mesurer le potentiel

L évolution des pratiques d observation. de l outil Servist pour mesurer le potentiel Séminaire EuroLIO 2010 «Les indicateurs d innovation localisés» L évolution des pratiques d observation avec les pôles de compétitivité : l apport de l outil Servist pour mesurer le potentiel scientifique

Plus en détail

Traitement des données

Traitement des données Formation «Le protocole OAI-PMH» Formation pour les Pôles associés de la Bibliothèque nationale de France BnF, 21 juin 2013 Traitement des données Processus de conversion Qualité des métadonnées Françoise

Plus en détail

Utiliser un logiciel libre de gestion bibliographique : Zotero 2.0

Utiliser un logiciel libre de gestion bibliographique : Zotero 2.0 Utiliser un logiciel libre de gestion bibliographique : Zotero 2.0 David Vivarès URFIST Strasbourg 1.Définition Les logiciels de gestion bibliographiques sont des outils spécialisés permettant de gérer

Plus en détail

Zotero Logiciel de gestion bibliographique. Daniela Ziegler Bibliothécaire Informationniste Centre de documentation du CHUM

Zotero Logiciel de gestion bibliographique. Daniela Ziegler Bibliothécaire Informationniste Centre de documentation du CHUM Logiciel de gestion bibliographique Daniela Ziegler Bibliothécaire Informationniste Centre de documentation du CHUM PLAN DE PRÉSENTATION Réputation Interface de travail Importation des références Exportation

Plus en détail

Documents musicaux à la Médiathèque de l Ircam Michel Fingerhut Directeur de la Médiathèque de l Ircam

Documents musicaux à la Médiathèque de l Ircam Michel Fingerhut Directeur de la Médiathèque de l Ircam Michel Fingerhut Directeur de la Médiathèque de l Ircam La numérisation de documents principalement sonores a débuté à l Ircam en interne et sur ressources propres lors de l établissement de sa Médiathèque

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Pré-traitements & indexation B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Master of Science HES-SO en Sciences de l information Rentrée Année académique 2015

Master of Science HES-SO en Sciences de l information Rentrée Année académique 2015 Master of Science HES-SO en Sciences de l information Rentrée Année académique 015 Formulaire relatif aux enseignements en prérequis en vue de demandes d équivalence Seuls les étudiants devant effectuer

Plus en détail

Guide d utilisation Novaxel

Guide d utilisation Novaxel Guide d utilisation Novaxel 1 Objectifs Aucun Prérequis Type Guide explicatif 110 pages Objectifs de ce guide Comprendre les principes de la GED Savoir gérer de l arborescence de classement Ressources

Plus en détail

ELOECM Conference2015

ELOECM Conference2015 ELOECM Conference2015 Les solutions ELO Fonctionnalités Stéphane MONTRI Consultant ELO France s.montri@elo-digital.fr Intégration E-Mail Serveur / Client Serveur- Backup Signature électronique Optimisation

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Charte Éthique et Big Data : parce que mon corpus le vaut bien!

Charte Éthique et Big Data : parce que mon corpus le vaut bien! Charte Éthique et Big Data : parce que mon corpus le vaut bien! Alain Couillault, Karen Fort To cite this version: Alain Couillault, Karen Fort. Charte Éthique et Big Data : parce que mon corpus le vaut

Plus en détail

La Gestion Electronique des Documents

La Gestion Electronique des Documents La Gestion Electronique des Documents La mise en place d une solution La gestion de l information est devenue un enjeu stratégique majeur à l intérieur des organisations. D après l observation des projets

Plus en détail

Migration et consolidation de systèmes d archivage de documents électroniques

Migration et consolidation de systèmes d archivage de documents électroniques Migration et consolidation de systèmes d archivage de documents électroniques 26/10/2013 Page 1 sur 8 Sommaire : Pourquoi décider de migrer les documents vers un système d archivage unique?... 3 Une migration

Plus en détail

3 logiciels «gratuits» pour gérer sa bibliographie

3 logiciels «gratuits» pour gérer sa bibliographie 3 logiciels «gratuits» pour gérer sa bibliographie EndNoteWeb, Zotero, Mendeley D après Infodoc Express 2012 Zotero et Mendeley de D. Fournier, C. Roure et C. Silvy (Montpellier Supagro/INRA) et Panorama

Plus en détail

Point sur les expériences avec XCRF, Shared Task CoNLL 2009

Point sur les expériences avec XCRF, Shared Task CoNLL 2009 Point sur les expériences avec XCRF, Shared Task CoNLL 2009 Erwan Moreau erwan.moreau@lipn.univ-paris13.fr Réunion CRoTAL 8 avril 2009 Point sur les expériences avec XCRF, Shared Task CoNLL 2009 1/18 Approche

Plus en détail

Repérage dans le support de cours. D3.js ~ Data Driven Document. Notes. Notes

Repérage dans le support de cours. D3.js ~ Data Driven Document. Notes. Notes Visualisation interactive de données sur le web Présentation Généralités Repérage dans le support de cours Sur les slides projetés, le numéro de page entre parenthèse correspond à celui de votre support

Plus en détail

Les enjeux de la dématérialisation du courrier entrant

Les enjeux de la dématérialisation du courrier entrant Les enjeux de la dématérialisation du courrier entrant EMC Solutions for Digital MailRoom 1 Introduction à l Input Management 2 Une organisation dépendante des flux papier? Site 1 Gestionnaires Formulaires

Plus en détail

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3)

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3) Organisation de la présentation Reconnaissance automatique des langues RMITS 28 http://www.irit.fr/~jerome.farinas/rmits28/ Jérôme Farinas jerome.farinas@irit.fr Équipe SAMOVA (Structuration, Analyse et

Plus en détail

A la rencontre de MEET. lou.burnard@tge-adonis.fr

A la rencontre de MEET. lou.burnard@tge-adonis.fr A la rencontre de MEET lou.burnard@tge-adonis.fr A la rencontre de l'action MEET MEET c'est une action transversale pour la... Mutualisation d' Experiences sur l' Encodage TEI Avec financement du TGE ADONIS

Plus en détail

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype Raymond BERARD, directeur de l ABES 0 Sommaire 1. La genèse du projet 2. Etude de faisabilité

Plus en détail

Business Intelligence simple et efficace avec Excel et PowerPivot

Business Intelligence simple et efficace avec Excel et PowerPivot Présentation de PowerPivot A. L analyse de données 7 1. Activité 7 2. Définitions 8 a. Mesures et dimensions 8 b. Traitement et analyse 8 c. Robustesse et confiance 9 B. Des solutions pour les gros volumes

Plus en détail

Cyclops : Une interface de modélisation adaptable aux communautés de pratique

Cyclops : Une interface de modélisation adaptable aux communautés de pratique Démonstration Cyclops : Une interface de modélisation adaptable aux communautés de pratique Erik Gebers 1, Bruno Bachimont 1, Nicolas Esposito 1 et Johann Holland 1 1 Laboratoire Heudiasyc, Université

Plus en détail

Manuel de Formation. 2 - Créer des dossiers rapidement pour mieux organiser vos références

Manuel de Formation. 2 - Créer des dossiers rapidement pour mieux organiser vos références 1 Pratique Manuel de Formation A tout moment, vous pouvez consulter l aide en ligne et le tutoriel. 1 Créer un compte : 2 - Créer des dossiers rapidement pour mieux organiser vos références 2.1 Cliquer

Plus en détail

MASTER LLCER ANGLAIS SPECIALITE RECHERCHE ENSEIGNEMENT A DISTANCE. Semestre 1 (30 ECTS) composé de 3 UE

MASTER LLCER ANGLAIS SPECIALITE RECHERCHE ENSEIGNEMENT A DISTANCE. Semestre 1 (30 ECTS) composé de 3 UE MASTER LLCER ANGLAIS SPECIALITE RECHERCHE ENSEIGNEMENT A DISTANCE Semestre 1 (30 ECTS) composé de 3 UE - Une UE consacrée à des enseignements méthodologiques (10 ECTS) - Une UE composée de 3 séminaires

Plus en détail

Etablissement d une grille d'évaluation des outils de veille

Etablissement d une grille d'évaluation des outils de veille Etablissement d une grille d'évaluation des outils de veille Cette étude a été conduite en utilisant différentes sources et en exploitant des résultats obtenus sur le terrain à partir de tests menés en

Plus en détail

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux URFIST DE TOULOUSE Des formations dans le domaine de l information scientifique et technique et de la publication web PROGRAMME DES STAGES JANVIER-MARS 2013 15/01/2013 : Initiation à LateX 21/01/2013 :

Plus en détail

Nécessité de concevoir un outil de recherche PDF... 3. Présentation des fonctionnalités d'indexation et de recherche... 3

Nécessité de concevoir un outil de recherche PDF... 3. Présentation des fonctionnalités d'indexation et de recherche... 3 1 Table des matières Nécessité de concevoir un outil de recherche PDF... 3 Présentation des fonctionnalités d'indexation et de recherche... 3 Architecture IFilter... 4 Performances et extensibilité : des

Plus en détail

LA RECHERCHE DE TERMES DANS LES TEXTES SPÉCIALISÉS : INTERNET ET LA CONSTITUTION DE CORPUS DE RÉFÉRENCE

LA RECHERCHE DE TERMES DANS LES TEXTES SPÉCIALISÉS : INTERNET ET LA CONSTITUTION DE CORPUS DE RÉFÉRENCE LA RECHERCHE DE TERMES DANS LES TEXTES SPÉCIALISÉS : INTERNET ET LA CONSTITUTION DE CORPUS DE RÉFÉRENCE ESIT 9 JANVIER 2002 Marc Van Campenhoudt Centre de recherche Termisti Institut supérieur de traducteurs

Plus en détail

ETL. Extract, Transform, Load

ETL. Extract, Transform, Load ETL Extract, Transform, Load Plan Introduction Extract, Transform, Load Démonstration Conclusion Plan Introduction Extract, Transform, Load Démonstration Conclusion Identification Problématique: Quoi?

Plus en détail

I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures.

I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures. COMMUNIQUE DE PRESSE Bruxelles, le 22 juin 2005 I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures. Une solution robuste

Plus en détail

Cahier des Clauses Techniques Particulières

Cahier des Clauses Techniques Particulières Cahier des Clauses Techniques Particulières MARCHE RELATIF A L ACQUISITION D UNE SOLUTION D ARCHIVAGE DEMATERIALISE DE DOCUMENTS 1. Présentation générale 1.1 Identification de la structure 1.2 Objet du

Plus en détail

Environnements de développement

Environnements de développement Environnements de développement UFR d Informatique Paris 7, LIAFA, 175 rue Chevaleret, Bureau 6A7 http://www.liafa.jussieu.fr/ sighirea/cours/edi/ Extension de la plate-forme Eclipse Résumé 1 Rappels de

Plus en détail

Journée PLUME Ens-Lsh, Lyon, 20 mars 2009

Journée PLUME Ens-Lsh, Lyon, 20 mars 2009 Journée PLUME Ens-Lsh, Lyon, 20 mars 2009 Gérer vos références bibliographiques avec des logiciels libres Le cas de Wikindx Laure Endrizzi, veille scientifique et technologique, INRP 1 Wikindx : ses caractéristiques

Plus en détail

Vous recherchez un outil pour récupérer les notices et vous guider lors de vos acquisitions.

Vous recherchez un outil pour récupérer les notices et vous guider lors de vos acquisitions. Récupérer des notices Préparer vos acquisitions Établir vos bons de commandes Zébris est le service que vous attendiez si vous souhaitez diminuer votre budget d acquisition de notices Zébris est fait pour

Plus en détail

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire Formation continue des personnels URCA Offre de la Bibliothèque Universitaire Année 2012-2013 Bibliothèque Universitaire Formation continue pour le personnel de l URCA Modalités o Public : personnels de

Plus en détail

plateforme de partage de documents gestion de documents avancée administration conviviale SOLUTIONS LOGICIELLES

plateforme de partage de documents gestion de documents avancée administration conviviale SOLUTIONS LOGICIELLES plateforme de partage de documents gestion de documents avancée administration conviviale SOLUTIONS LOGICIELLES imageware Document Server Une solution de partage de documents simple, mais puissante. Essentiellement,

Plus en détail

Google Analytics - Analysez le trafic de votre site pour améliorer ses performances inclut Universal Analytics (2ième édition)

Google Analytics - Analysez le trafic de votre site pour améliorer ses performances inclut Universal Analytics (2ième édition) Chapitre 1 : Introduction A. Présentation du Web Analytics 10 1. Présentation des différentes solutions de Web Analytics quantitatives du marché 10 2. La législation européenne et les solutions de Web

Plus en détail

ELO Office / Pro Les avantages : Archivage et gestion documentaire

ELO Office / Pro Les avantages : Archivage et gestion documentaire Les avantages : Archivage et gestion documentaire ELO Office / Pro est une solution de Gestion Electronique de l information et des Documents d Entreprise (GEIDE) Dématérialiser le document Rendre accessibles,

Plus en détail

MarcXimiL. http://marcximil.sourceforge.net. Analyse de similarité

MarcXimiL. http://marcximil.sourceforge.net. Analyse de similarité MarcXimiL Analyse de similarité détection de doublons détection préprint/article bibliométrie suggestions à l'usager structure de collections veille documentaire détection de plagiat http://marcximil.sourceforge.net

Plus en détail

La recherche en ligne d information avec le dispositif SIST

La recherche en ligne d information avec le dispositif SIST La recherche en ligne d information avec le dispositif SIST Séminaire CTA Les implications du changement climatique sur les systèmes de production agricole durables dans les pays ACP Octobre 2008 Burkina

Plus en détail

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information SCI6052 (Automne 2014) cours 6 1/32 SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information Cours 6 Systèmes de gestion de bases de données (SGBD) textuels

Plus en détail

Séminaire technique services ISTEX

Séminaire technique services ISTEX Séminaire technique services ISTEX À l Inist-CNRS, Vandœuvre-lès-Nancy, les 18 et 19 mars 2015 ANR-10-IDEX-0004-02 Mercredi 18 mars 2015 Participants présentiel et audio/visioconférence N NOM PRENOM Etablissement

Plus en détail

A LA DÉCOUVERTE DE ZOTERO 3.0

A LA DÉCOUVERTE DE ZOTERO 3.0 A LA DÉCOUVERTE DE ZOTERO 3.0 Un logiciel libre et gratuit pour gérer facilement ses références bibliographiques! 1 Isabelle Zimmermann - BU de Médecine PARTONS À LA DÉCOUVERTE DE ZOTERO : 1. Qu est-ce

Plus en détail

Gestion collaborative de documents

Gestion collaborative de documents Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,

Plus en détail

Zotero. La gestion de sa bibliographie en opensource. UCL Bibliothèque des sciences et technologies Q1 2012-2013 fabienne.moreau@uclouvain.

Zotero. La gestion de sa bibliographie en opensource. UCL Bibliothèque des sciences et technologies Q1 2012-2013 fabienne.moreau@uclouvain. Zotero La gestion de sa bibliographie en opensource zotero, c'est quoi? module complémentaire de Mozilla Firefox la version 3 "Standalone" permet l'utilisation avec Safari et Google Chrome collecter des

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

Scénarios d usage Modèles d analyse

Scénarios d usage Modèles d analyse Scénarios d usage Modèles d analyse Valérie Legrand (FMSH ESCoM-AAR) Paris, Fondation Maison des Sciences de l Homme (FMSH) 11 Mars 2014 PLAN I. Scénario général: Archivage / Analyse / Publication 1. Etapes

Plus en détail

BIRT (Business Intelligence and Reporting Tools)

BIRT (Business Intelligence and Reporting Tools) BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»

Plus en détail

Le signalement des publications de la recherche :

Le signalement des publications de la recherche : Enjeux du signalement des ressources numériques produites LES ENJEUX Les universités et les consortiums universitaires produisent de plus en plus de ressources numériques (pédagogiques, articles, thèses

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail

Séminaire: Méthodes et outils d'analyse de données textuelles, un nouveau souffle?

Séminaire: Méthodes et outils d'analyse de données textuelles, un nouveau souffle? Séminaire: Méthodes et outils d'analyse de données textuelles, un nouveau souffle? Daniel K. Schneider TECFA FPSE - Université de Genève daniel.schneider@unige.ch Unité de technologie de l'éducation Université

Plus en détail

Navigation dans les fichiers de configuration

Navigation dans les fichiers de configuration Navigation dans les fichiers de configuration page ORI-OAI-search : entrées principales 2 ORI-OAI-search : fichier principal de configuration 5 ORI-OAI-md-editor : entrées principales 6 ORI-OAI-md-editor

Plus en détail

FabLab et MOOC à l UFR des sciences:

FabLab et MOOC à l UFR des sciences: FabLab et MOOC à l UFR des sciences: Premiers pas d une pédagogie par projets où l étudiant apprend à faire avec l accompagnement des services de la BU 1 Sommaire 1. Un constat / Un enjeu. 2. Une volonté

Plus en détail

FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD)

FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD) FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD) BIEN GERER SES REFERENTIELS DE DONNEES : UN ENJEU POUR MIEUX PILOTER LA PERFORMANCE DE SON ETABLISSEMENT octobre 2008 GMSIH 44, Rue de Cambronne 75015 Paris.

Plus en détail

GESTION D UNE BASE BIBLIOGRAPHIQUE

GESTION D UNE BASE BIBLIOGRAPHIQUE GESTION D UNE BASE BIBLIOGRAPHIQUE BTS Bioanalyses et contrôles Gil Voge Lycée Louise Michel, Grenoble Base de données (BD ou DB, database) Ensemble de données relatif à un domaine particulier des connaissances

Plus en détail

La gestion du cycle de vie des documents dans la banque de détail Société Générale : GED et Archivage électronique

La gestion du cycle de vie des documents dans la banque de détail Société Générale : GED et Archivage électronique Décembre 2007 JJ Mois Année La gestion du cycle vie s documents dans la banque détail Société Générale : GED et Archivage électronique 2 Sommaire Contexte : les projets GED et archivage électronique Constat

Plus en détail

Logiciels et services web gratuits utiles à l élaboration d une thèse

Logiciels et services web gratuits utiles à l élaboration d une thèse Logiciels et services web gratuits utiles à l élaboration d une thèse En 5 étapes Corinne Habarou Sessions 2015 (Journée 2) Programme de la seconde journée Mettre en relation automatisée deux services

Plus en détail

Diagnostic adaptatif d'un flux d'alarmes par méta diagnostic distribué Application à la détection d'intrusions dans un serveur Web

Diagnostic adaptatif d'un flux d'alarmes par méta diagnostic distribué Application à la détection d'intrusions dans un serveur Web LogAnalyzer Thomas Guyet 1,2, René Quiniou 2 et Marie Odile Cordier 3 1 AGROCAMPUS OUEST 2 INRIA/IRISA Centre de Rennes (Équipe DREAM) 3 Université de Rennes/IRISA (Équipe DREAM) Contact : thomas.guyet@irisa.fr

Plus en détail

FONCTIONS CLEFS. Gestion documentaire. Chaîne de validation des documents. Espaces de travail collaboratif. Gestion des accès basée sur des rôles

FONCTIONS CLEFS. Gestion documentaire. Chaîne de validation des documents. Espaces de travail collaboratif. Gestion des accès basée sur des rôles Nuxeo Collaborative Portal Server 1 FONCTIONS CLEFS Gestion documentaire Chaîne de validation des documents Espaces de travail collaboratif Gestion des accès basée sur des rôles Sécurité Suivi des versions

Plus en détail

SSII et éditeur de logiciels, spécialisé dans l'informatique documentaire et dans l'édition électronique:

SSII et éditeur de logiciels, spécialisé dans l'informatique documentaire et dans l'édition électronique: Présentation SSII et éditeur de logiciels, spécialisé dans l'informatique documentaire et dans l'édition électronique: un ensemble de produits éprouvés et performants, des services de haute qualité. Dématérialisation

Plus en détail

MARCHE RELATIF A L ACQUISITION D UNE SOLUTION D ARCHIVAGE DEMATERIALISE DE DOCUMENTS

MARCHE RELATIF A L ACQUISITION D UNE SOLUTION D ARCHIVAGE DEMATERIALISE DE DOCUMENTS MARCHE RELATIF A L ACQUISITION D UNE SOLUTION D ARCHIVAGE DEMATERIALISE DE DOCUMENTS QUESTIONNAIRE DE LA CONSULTATION MEMOIRE TECHNIQUE Par la signature finale de ce document par une personne habilitée

Plus en détail

FORMATION A LA RECHERCHE DOCUMENTAIRE BU SANTE. ZOTERO v.2.0 SOMMAIRE

FORMATION A LA RECHERCHE DOCUMENTAIRE BU SANTE. ZOTERO v.2.0 SOMMAIRE SOMMAIRE ZOTERO v.2.0 Introduction...2 1 Gérer ses références...2 1.1 Installation de l extension...2 1.2 Importer des notices à partir d un site web compatible...3 1.4 Nouvelle note indépendante...5 1.5

Plus en détail

Expériences de structuration et modélisation des contenus dans le projet Corpus 14

Expériences de structuration et modélisation des contenus dans le projet Corpus 14 Expériences de structuration et modélisation des contenus dans le projet Corpus 14 Praxiling UMR 5267 Université de Montpellier 3 CNRS 30 juin 2014, Lyon Giancarlo Luxardo Cette présentation est mise à

Plus en détail

Programmation des Applications Réparties. Parsers XML DOM et SAX

Programmation des Applications Réparties. Parsers XML DOM et SAX Programmation des Applications Réparties Parsers XML DOM et SAX Luiz Angelo Steffenel luiz-angelo.steffenel@univ-reims.fr Steffenel Programmation des Applications Réparties Master M1-2007-2008 1 Comment

Plus en détail

Présentation générale du projet data.bnf.fr

Présentation générale du projet data.bnf.fr Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données

Plus en détail

ORI-OAI : un outil pour le référencement et l indexation des ressources numériques. URFIST de Bordeaux / Médiaquitaine Bordeaux, 7 avril 2009

ORI-OAI : un outil pour le référencement et l indexation des ressources numériques. URFIST de Bordeaux / Médiaquitaine Bordeaux, 7 avril 2009 ORI-OAI : un outil pour le référencement et l indexation des ressources numériques URFIST de Bordeaux / Médiaquitaine Bordeaux, 7 avril 2009 Sommaire ORI-OAI :: Historique, organisation, périmètre Valorisation

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Quoi de Neuf dans Cumulus 9.1?

Quoi de Neuf dans Cumulus 9.1? INFORMATION PRODUIT : Quoi de Neuf dans Cumulus 9.1? Meilleure intégration Adobe et beaucoup plus avec Cumulus 9.1 Beaucoup de choses se sont passées depuis la disponibilité de Cumulus 9.0 en Septembre

Plus en détail

Dossier de presse ELP

Dossier de presse ELP Dossier de presse ELP ELP présente sa nouvelle génération de solutions pour SharePoint, fruit d une véritable innovation technologique Editeur de logiciels documentaires et bibliothéconomiques, ELP a réalisé

Plus en détail

De la solubilité de Postgresql dans les SIG

De la solubilité de Postgresql dans les SIG De la solubilité de Postgresql dans les SIG VincentPicavetMakinaCorpus Pgday2008 Vincent Picavet / Makina Corpus vincent.picavet@makina-corpus.com Ingénieur Systèmes d'information Géographique SSLL Française

Plus en détail

Comment choisir les bons formats?

Comment choisir les bons formats? Comment choisir les bons formats? Philippe Martin, s exprimant au nom de l Aproged Administrateur de l Aproged, responsable du Pôle Normalisation Directeur Associé au Bureau van Dijk Ingénieurs Conseils

Plus en détail

Conférence de presse 17 mars 2008. Jean-Charles Hourcade, Directeur Général adjoint et CTO Thomson

Conférence de presse 17 mars 2008. Jean-Charles Hourcade, Directeur Général adjoint et CTO Thomson Conférence de presse 17 mars 2008 Jean-Charles Hourcade, Directeur Général adjoint et CTO Thomson 17 Actualité La Direction générale de la concurrence de la Commission européenne approuve le financement

Plus en détail

Présentation de la future plateforme internet du Réseau francophone de l'innovation. Réunion de lancement OIF 9-10 juillet 2013

Présentation de la future plateforme internet du Réseau francophone de l'innovation. Réunion de lancement OIF 9-10 juillet 2013 Présentation de la future plateforme internet du Réseau francophone de l'innovation Réunion de lancement OIF 9-10 juillet 2013 Une initiative francophone au cœur d un écosystème 2.0 Placer aujourd'hui

Plus en détail

Logiciel QDA Miner. Deuxième partie Gestion du livre des codes et codage manuel

Logiciel QDA Miner. Deuxième partie Gestion du livre des codes et codage manuel PLAN DE COURS «ANALYSE DE DONNEES TEXTUELLES» Trois approches pour l analyse de textes Analyse qualitative Analyse quantitative Fouille de textes Introduction au logiciel QDA Miner Introduction et gestion

Plus en détail

Adonya Sarl Organisme de Formation Professionnelle 75 Avenue Niel 75017 PARIS, France

Adonya Sarl Organisme de Formation Professionnelle 75 Avenue Niel 75017 PARIS, France WORD Sommaire Word... 1 Introduction... 3 Formations... 3 WORD 2003... 4 WORD 2007... 8 Maîtriser Word 2010, perfectionnement... 14 Maîtriser Word 2010... 16 Word 2007, prise en main... 18 Word 2007, perfectionnement...

Plus en détail

Aspects techniques. Présentation :

Aspects techniques. Présentation : Présentation : Le programme des "Bibliothèques Virtuelles Humanistes" a été conçu en 2002 avec la collaboration de l'irht (section de l'humanisme). Il constitue, avec l'élaboration des catalogues des "Incunables

Plus en détail

Projet ORI-OAI Outil de Référencement et d Indexation Réseau de portails OAI. Notions et standards. ORI-OAI : Formation fonctionnelle

Projet ORI-OAI Outil de Référencement et d Indexation Réseau de portails OAI. Notions et standards. ORI-OAI : Formation fonctionnelle Projet ORI-OAI Outil de Référencement et d Indexation Réseau de portails OAI Notions et standards ORI-OAI : Formation fonctionnelle Notions et standards 1. Concept de métadonnées 2. Schémas de métadonnées

Plus en détail

X2BIRT : Mettez de l interactivité dans vos archives

X2BIRT : Mettez de l interactivité dans vos archives Présentation Produit Présentation Produit X2BIRT : Mettez de l interactivité dans vos archives L accès à l information est capital pour les affaires. X2BIRT, la dernière innovation d Actuate, prend le

Plus en détail

Adobe Technical Communication Suite 5

Adobe Technical Communication Suite 5 Adobe Technical Communication Suite 5 Comparatif des versions Adobe Technical Communication Suite 5 est arrivé Adobe Technical Communication Suite 5 Adobe Technical Communication Suite 5 est une solution

Plus en détail