Plan de la présentation

Dimension: px
Commencer à balayer dès la page:

Download "Plan de la présentation"

Transcription

1

2 Plan de la présentation 1) Intro Problématique, réussites globales, chronologie 2) «Face aux données» (aperçu de la base) L'objet documentaire, les PDFs, les facettes 3) Explication de la méthodologie Choix des méthodes probabilistes, de l'outil grobid et du protocole 4) «Cycles qualité» Evaluations de l'extraction sur échantillons, données d'entraînement 5) Tests de montée en charge Parallélisation, choix du périmètre à enrichir, résultats 6) Perspectives [enrichissement refbibs 18/03/2015] 2

3 (1) = intro [enrichissement refbibs 18/03/2015] 3

4

5

6 (1) Réussites principales Environnement d'essais Qualité : cycles d'amélioration tri détaillé des erreurs, croisement par aggrégats rapport automatique, rangement par corpus de test sous-corpus => entraînement => modèle => test des refbibs sorties améliorations obtenues de dure lutte pour les modèles intermédiaires + 15 % de rappel (mais après en avoir perdu au début!) «prépareur» de formats d'entraînement à partir des bases Quantité : «essai transformé» sur 2,4 M docs mise en oeuvre des modèles de l'étape précédente montée en charge testée à plusieurs reprises 17,5 M refbibs extraites, classées selon source, balisées en 3 jours [enrichissement refbibs 18/03/2015] 6

7 (2) = aperçu des données [enrichissement refbibs 18/03/2015] 7

8

9 ici exemples pdf ou graphe md [enrichissement refbibs 18/03/2015] 9

10

11

12 (3) = méthodologie [enrichissement refbibs 18/03/2015] 12

13 (3a) Méthodologie choisie Un modèle probabiliste => robustesse à long terme entraînées sur des données réelles connues («gold») souplesse face aux erreurs d'ocr adaptation aux styles Zhou XH, Gao S. Confidence intervals for the log-normal mean. StatistMed. 1997;16(7): X. H. Zhou and S. Gao, Confidence intervals for the log-normal mean, StatistMed, vol. 16, no. 7, pp , Zhou, X. H.; Gao, S. StatistMed 1997, 16, Le choix de l'outil Grobid s'appuie sur des librairies reconnues pdftoxml / wapiti a les meilleurs scores ex aequo avec Cermine prévoir un système de montée en charge à travers un service REST [enrichissement refbibs 18/03/2015] 13

14 (4c) Préparation de corpus d'entraînement Procédure pour recomposer du corpus d'entraînement automatiquement Développement d'un script de «ragréage» On utilise nos données déjà annotées (notices riches) Fusion des informations typées avec le texte Le texte tel que Grobid le verrait Différence entre les formats l'infos structurée des notices ne préserve pas tout : les virgules ni les tirets, les parenthèses, ni les mots d'escorte dédiés «Vol:» «In:» «and» ça paraît peu de choses... mais en fait => détails typiques fondamentaux pour reconnaître les champs [enrichissement refbibs 18/03/2015] 14

15

16

17

18

19 (4) = «Cycles» qualité [enrichissement refbibs 18/03/2015] 19

20 (4a) Suivi qualitatif détaillé [enrichissement refbibs 18/03/2015] 20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45 (4c) Préparation de corpus d'entraînement Procédure pour recomposer du corpus d'entraînement automatiquement Développement d'un script de «ragréage» On utilise nos données déjà annotées (notices riches) Fusion des informations typées avec le texte Le texte tel que Grobid le verrait Différence entre les formats l'infos structurée des notices ne préserve pas tout : les virgules ni les tirets, les parenthèses, ni les mots d'escorte dédiés «Vol:» «In:» «and» ça paraît peu de choses... mais en fait => détails typiques fondamentaux pour reconnaître les champs [enrichissement refbibs 18/03/2015] 45

46 (4d) Exemple : le modèle segmentation Objectif du modèle : Déterminer la zone des refbibs Quelle séquence d'étiquettes? pseudo-tei teiheader front body listbibl notes + les sauts de ligne <lb/> #document 1078 tei 1078 text 1078 body 5039 lb page 3560 lb 3344 note 2381 lb 2692 listbibl 1661 lb front 1394 lb lb 191 teiheader 1078 filedesc 1078 le flux textuel est celui issu du «ragréage» [enrichissement refbibs 18/03/2015] 46

47

48 (5) = Montée en charge [enrichissement refbibs 18/03/2015] 48

49

50 (5b) Aperçu résultats quantitatifs Nombre de bibs/doc selon le type de document [enrichissement refbibs 18/03/2015] 50

51 (5b) Aperçu résultats quantitatifs Nombre de bibs/doc selon le type de document [enrichissement refbibs 18/03/2015] 51

52 er (5c) 1 bilan de montée en charge 17,5 M de bibliographies! permettent de mettre en place la procédure de ré-intégration à la base Globalement prêts pour tout volume Optimisations RAM (très grands PDFs), accès disque, bugs Vitesse de traitement améliorée 1ers tests => 0,8 docs/s oct/nov => 5 docs/s mars => 9 docs/s 0,8 M de documents / jour Dépouillement complémentaires à venir type digital estimation qualité dédoublonnage [enrichissement refbibs 18/03/2015] 52

53 (6) = Perspectives [enrichissement refbibs 18/03/2015] 53

54 Choix des objectifs pour la suite Préparation en amont meilleure maîtrise du txt en amont corrections post-ocr typologie du document segmentation du document front, tables, sections, zone biblio Poursuite cycles qualité + de corpus d'entraînement nouvelles «features» traits descriptifs => indices «piste rouge» du CRF suite intégration Usages avancés ajout aux index résolution de liens métadonnées => OpenUrl stats agrégées cas de figures API estimation qualité au fil de l'eau consolidation (dédoublonnage) fonctionnalités de recherche [enrichissement refbibs 18/03/2015] par ex, visualisation du graphe des co-citations par ex, agrégé entre revues par ex, évoluant dans le temps... 54

55 Conclusion On a tenté de suivre les bonnes pratiques Participé aux reflexions sur l'indexation avancée Obtenu des résultats à grande échelle R&D => adaptation => production Développement d'un environnement d'essais selon la méthode ML Développement d'outils pour traiter un flux de bibs Procédures calées sur l'api et loadistex Mode service débuggé, paramétré Les volumes de sortie ouvrent déjà de nombreuses possibilités Mais (qualité X quantité) => prend du temps Nécessaire de continuer les cycles d'améliorations [enrichissement refbibs 18/03/2015] 55

56 «Références :» Besagni & Belaïd (2004). Citation recognition for scientific publications in digital libraries. Cortez, da Silva, Gonçalves, Mesquita & de Moura (2007). FLUX-CIM: flexible unsupervised extraction of citation metadata. Giles, Bollacker & Lawrence (1998). CITESEER: An automatic citation indexing system. Jewel (2004). PARATOOLS: ParaCite Reference Parsing Module. Kim, Bellot, Faath & Dacos (2011). BILBO: Automatic annotation of bibliographical references in digital humanities books, articles and blogs. Lopez (2009). GROBID: Combining automatic bibliographic data recognition and term extraction for scholarship publications. Peng & McCallum (2006). Information extraction from research papers using conditional random fields. Seymore, McCallum & Rosenfeld (1999). CORA: Learning hidden Markov model structure for information extraction. Shotton, Dutton & O Steen (2014). JISC: Open Citations Database. Tkaczyk & Bolikowski (2011). Workflow of metadata extraction from retro-born-digital documents.

57 Annexe : Scripts et protos complémentaire Des développements complémentaires Outils de traitement du document Echantilloneur «Trieurs» «Re-formateuses» selon leur taille selon le domaine selon le style typo/biblio bibl (markups plats) <=> biblstruct (markups arborés) de 5 formats «natifs» vers la TEI Divers Afficheuse arbre XML [enrichissement refbibs 18/03/2015] 57

58 Annexe : Echantillonage et score attendu Un corpus difficile mais passionnant Un volume exceptionnel Une archive d'archives Réunion de textes plus ou moins préservés origine du texte => diversité des pré-traitements à la source «label rouge» => intérêt d'un classifieur de textes en amont Taux de réussite réel et taux théorique choix d'échantilloner le corpus avec ses défauts selon source selon version PDF selon type de document selon style typographique de la citation fruit d'une analyse approfondie des métadonnées en présence ainsi les taux de succès reflètent l'horizon d'attente face au «tout-venant» [enrichissement refbibs 18/03/2015] 58

59 Annexe : Explication traitements formulaire La citation biblio. est une séquence linguistique «formulaire» LG : de l'intention à la chaîne de signes BIB <= DATE + ART + JOURN ART <= (k x AUT) + [TIT] + [pp] JOURN <= NomJ ital + vol Exemple courant : les chaînes Unitex partir des formes connues observer les règles de capture utilisées dans la vie modéliser les règles en graphes génératifs Problème l'adaptation à des règles proches + mode passée? [enrichissement refbibs 18/03/2015] 59

60

Gestion collaborative de documents

Gestion collaborative de documents Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,

Plus en détail

Gérer ses références bibliographiques avec Zotero

Gérer ses références bibliographiques avec Zotero Gérer ses références bibliographiques avec Zotero Elsa Poupardin / Strasbourg Mars 2012 A partir du travail de Marie Laure Malingre Plan Présentation / Installation / Interface Récupérer des références,

Plus en détail

Conférence OCP Facteurs-clés de succès d une veille scientifique et technique : Objectifs, Méthodologie, Organisation, Solutions

Conférence OCP Facteurs-clés de succès d une veille scientifique et technique : Objectifs, Méthodologie, Organisation, Solutions Conférence OCP Facteurs-clés de succès d une veille scientifique et technique : Objectifs, Méthodologie, Organisation, Solutions Qwam Content Intelligence Denis Guedez Consultant Qwam Content Intelligence

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

! Text Encoding Initiative

! Text Encoding Initiative Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique

Plus en détail

Frantext : une base de données pour la recherche

Frantext : une base de données pour la recherche Frantext : une base de données pour la recherche veronique.montemont@a.lf.fr www.atilf.fr Frantext : une base de données pour la recherche Trésor de la Langue Française (TLF) TLF - 1971-1994 - 100 000

Plus en détail

AVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION...

AVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION... AVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION... 8 DANS MS WORD (SUR WINDOWS)... 8 DANS MS WORD (SUR MAC)... 8 DANS

Plus en détail

Un serveur d'archivage

Un serveur d'archivage Un serveur d'archivage destiné au Service Commun de Documentation de l'université de la Méditerranée Encadrement : Noël Novelli Représentants client (S.C.D.) : Axelle Clarisse Ronan Lagadic Equipe Projet

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

Guide d utilisation Novaxel

Guide d utilisation Novaxel Guide d utilisation Novaxel 1 Objectifs Aucun Prérequis Type Guide explicatif 110 pages Objectifs de ce guide Comprendre les principes de la GED Savoir gérer de l arborescence de classement Ressources

Plus en détail

MYXTRACTION. 2009 La Business Intelligence en temps réel

MYXTRACTION. 2009 La Business Intelligence en temps réel MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables

Plus en détail

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype Raymond BERARD, directeur de l ABES 0 Sommaire 1. La genèse du projet 2. Etude de faisabilité

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Nécessité de concevoir un outil de recherche PDF... 3. Présentation des fonctionnalités d'indexation et de recherche... 3

Nécessité de concevoir un outil de recherche PDF... 3. Présentation des fonctionnalités d'indexation et de recherche... 3 1 Table des matières Nécessité de concevoir un outil de recherche PDF... 3 Présentation des fonctionnalités d'indexation et de recherche... 3 Architecture IFilter... 4 Performances et extensibilité : des

Plus en détail

Les enjeux de la dématérialisation du courrier entrant

Les enjeux de la dématérialisation du courrier entrant Les enjeux de la dématérialisation du courrier entrant EMC Solutions for Digital MailRoom 1 Introduction à l Input Management 2 Une organisation dépendante des flux papier? Site 1 Gestionnaires Formulaires

Plus en détail

I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures.

I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures. COMMUNIQUE DE PRESSE Bruxelles, le 22 juin 2005 I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures. Une solution robuste

Plus en détail

3 logiciels «gratuits» pour gérer sa bibliographie

3 logiciels «gratuits» pour gérer sa bibliographie 3 logiciels «gratuits» pour gérer sa bibliographie EndNoteWeb, Zotero, Mendeley D après Infodoc Express 2012 Zotero et Mendeley de D. Fournier, C. Roure et C. Silvy (Montpellier Supagro/INRA) et Panorama

Plus en détail

Climat Scolaire - Manuel utilisateur - Chapitre 2 : «Créer, Editer et suivi d un texte»

Climat Scolaire - Manuel utilisateur - Chapitre 2 : «Créer, Editer et suivi d un texte» Climat Scolaire - Manuel utilisateur - Chapitre 2 : «Créer, Editer et suivi d un texte» Espace collaboratif Co-Ment Date : 01/12/2013 Référence du Projet : Chef de Projet : www.cndp.fr/climatscolaire Caroline

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Pré-traitements & indexation B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques

Plus en détail

Séminaire technique services ISTEX

Séminaire technique services ISTEX Séminaire technique services ISTEX À l Inist-CNRS, Vandœuvre-lès-Nancy, les 18 et 19 mars 2015 ANR-10-IDEX-0004-02 Mercredi 18 mars 2015 Participants présentiel et audio/visioconférence N NOM PRENOM Etablissement

Plus en détail

Charte Éthique et Big Data : parce que mon corpus le vaut bien!

Charte Éthique et Big Data : parce que mon corpus le vaut bien! Charte Éthique et Big Data : parce que mon corpus le vaut bien! Alain Couillault, Karen Fort To cite this version: Alain Couillault, Karen Fort. Charte Éthique et Big Data : parce que mon corpus le vaut

Plus en détail

SemWeb : Interrogation sémantique du web avec XQuery. Les membres du projet SemWeb

SemWeb : Interrogation sémantique du web avec XQuery. Les membres du projet SemWeb SemWeb : Interrogation sémantique du web avec XQuery Les membres du projet SemWeb Contexte et objectifs Le projet SemWeb s inscrit dans les efforts de recherche et de développement actuels pour construire

Plus en détail

FORMATION A LA RECHERCHE DOCUMENTAIRE BU SANTE. ZOTERO v.2.0 SOMMAIRE

FORMATION A LA RECHERCHE DOCUMENTAIRE BU SANTE. ZOTERO v.2.0 SOMMAIRE SOMMAIRE ZOTERO v.2.0 Introduction...2 1 Gérer ses références...2 1.1 Installation de l extension...2 1.2 Importer des notices à partir d un site web compatible...3 1.4 Nouvelle note indépendante...5 1.5

Plus en détail

ELOECM Conference2015

ELOECM Conference2015 ELOECM Conference2015 Les solutions ELO Fonctionnalités Stéphane MONTRI Consultant ELO France s.montri@elo-digital.fr Intégration E-Mail Serveur / Client Serveur- Backup Signature électronique Optimisation

Plus en détail

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux URFIST DE TOULOUSE Des formations dans le domaine de l information scientifique et technique et de la publication web PROGRAMME DES STAGES JANVIER-MARS 2013 15/01/2013 : Initiation à LateX 21/01/2013 :

Plus en détail

Séminaire: Méthodes et outils d'analyse de données textuelles, un nouveau souffle?

Séminaire: Méthodes et outils d'analyse de données textuelles, un nouveau souffle? Séminaire: Méthodes et outils d'analyse de données textuelles, un nouveau souffle? Daniel K. Schneider TECFA FPSE - Université de Genève daniel.schneider@unige.ch Unité de technologie de l'éducation Université

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Dossier de presse ELP

Dossier de presse ELP Dossier de presse ELP ELP présente sa nouvelle génération de solutions pour SharePoint, fruit d une véritable innovation technologique Editeur de logiciels documentaires et bibliothéconomiques, ELP a réalisé

Plus en détail

Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif.

Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif. Un SIG collaboratif pour la recherche historique Partie 1 : Naissance et conception d un système d information géo-historique collaboratif Claire-Charlotte Butez, Francesco Beretta To cite this version:

Plus en détail

Présentation générale du projet data.bnf.fr

Présentation générale du projet data.bnf.fr Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données

Plus en détail

plateforme de partage de documents gestion de documents avancée administration conviviale SOLUTIONS LOGICIELLES

plateforme de partage de documents gestion de documents avancée administration conviviale SOLUTIONS LOGICIELLES plateforme de partage de documents gestion de documents avancée administration conviviale SOLUTIONS LOGICIELLES imageware Document Server Une solution de partage de documents simple, mais puissante. Essentiellement,

Plus en détail

Diagnostic adaptatif d'un flux d'alarmes par méta diagnostic distribué Application à la détection d'intrusions dans un serveur Web

Diagnostic adaptatif d'un flux d'alarmes par méta diagnostic distribué Application à la détection d'intrusions dans un serveur Web LogAnalyzer Thomas Guyet 1,2, René Quiniou 2 et Marie Odile Cordier 3 1 AGROCAMPUS OUEST 2 INRIA/IRISA Centre de Rennes (Équipe DREAM) 3 Université de Rennes/IRISA (Équipe DREAM) Contact : thomas.guyet@irisa.fr

Plus en détail

Google Analytics - Analysez le trafic de votre site pour améliorer ses performances inclut Universal Analytics (2ième édition)

Google Analytics - Analysez le trafic de votre site pour améliorer ses performances inclut Universal Analytics (2ième édition) Chapitre 1 : Introduction A. Présentation du Web Analytics 10 1. Présentation des différentes solutions de Web Analytics quantitatives du marché 10 2. La législation européenne et les solutions de Web

Plus en détail

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES Gestion Electronique de Documents (GED) Système d Archivage Electronique (SAE) Coffre Fort Numérique (CFN) et modules complémentaires

Plus en détail

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3)

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3) Organisation de la présentation Reconnaissance automatique des langues RMITS 28 http://www.irit.fr/~jerome.farinas/rmits28/ Jérôme Farinas jerome.farinas@irit.fr Équipe SAMOVA (Structuration, Analyse et

Plus en détail

ELO Office / Pro Les avantages : Archivage et gestion documentaire

ELO Office / Pro Les avantages : Archivage et gestion documentaire Les avantages : Archivage et gestion documentaire ELO Office / Pro est une solution de Gestion Electronique de l information et des Documents d Entreprise (GEIDE) Dématérialiser le document Rendre accessibles,

Plus en détail

A LA DÉCOUVERTE DE ZOTERO 4.0

A LA DÉCOUVERTE DE ZOTERO 4.0 A LA DÉCOUVERTE DE ZOTERO 4.0 Un logiciel libre et gratuit pour gérer facilement ses références bibliographiques! 1 Isabelle Zimmermann - BU de Médecine PARTONS À LA DÉCOUVERTE DE ZOTERO : 1. Qu est-ce

Plus en détail

Cahier des Clauses Techniques Particulières

Cahier des Clauses Techniques Particulières Cahier des Clauses Techniques Particulières MARCHE RELATIF A L ACQUISITION D UNE SOLUTION D ARCHIVAGE DEMATERIALISE DE DOCUMENTS 1. Présentation générale 1.1 Identification de la structure 1.2 Objet du

Plus en détail

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire Formation continue des personnels URCA Offre de la Bibliothèque Universitaire Année 2012-2013 Bibliothèque Universitaire Formation continue pour le personnel de l URCA Modalités o Public : personnels de

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

La gestion du cycle de vie des documents dans la banque de détail Société Générale : GED et Archivage électronique

La gestion du cycle de vie des documents dans la banque de détail Société Générale : GED et Archivage électronique Décembre 2007 JJ Mois Année La gestion du cycle vie s documents dans la banque détail Société Générale : GED et Archivage électronique 2 Sommaire Contexte : les projets GED et archivage électronique Constat

Plus en détail

ETL. Extract, Transform, Load

ETL. Extract, Transform, Load ETL Extract, Transform, Load Plan Introduction Extract, Transform, Load Démonstration Conclusion Plan Introduction Extract, Transform, Load Démonstration Conclusion Identification Problématique: Quoi?

Plus en détail

Logiciels libres de Bibliothèques numériques : présentation. Castore & Greenstone. Les autres : CDS Invenio, EPRINTS, Dspace.

Logiciels libres de Bibliothèques numériques : présentation. Castore & Greenstone. Les autres : CDS Invenio, EPRINTS, Dspace. Formation continue Logiciels libres de Bibliothèques numériques : présentation Castore & Greenstone Les autres : CDS Invenio, EPRINTS, Dspace 12, 13 juin 2006 - Genève Benigno Delgado Assistant d enseignement

Plus en détail

Un outil open source de gestion de bibliographies

Un outil open source de gestion de bibliographies Un outil open source de gestion de bibliographies Généralités... 2 Installation... 2 L interface zotero... 2 Ajouter une notice bibliographique manuellement... 4 Modifier ses notices bibliographiques...

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Scénarios d usage Modèles d analyse

Scénarios d usage Modèles d analyse Scénarios d usage Modèles d analyse Valérie Legrand (FMSH ESCoM-AAR) Paris, Fondation Maison des Sciences de l Homme (FMSH) 11 Mars 2014 PLAN I. Scénario général: Archivage / Analyse / Publication 1. Etapes

Plus en détail

GESTION D UNE BASE BIBLIOGRAPHIQUE

GESTION D UNE BASE BIBLIOGRAPHIQUE GESTION D UNE BASE BIBLIOGRAPHIQUE BTS Bioanalyses et contrôles Gil Voge Lycée Louise Michel, Grenoble Base de données (BD ou DB, database) Ensemble de données relatif à un domaine particulier des connaissances

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

ZOTERO. Installation. Bibliothèque de Pharmacie. Service Formation

ZOTERO. Installation. Bibliothèque de Pharmacie. Service Formation ZOTERO Bibliothèque de Pharmacie. Service Formation Zotero est un logiciel de gestion de références bibliographiques, gratuit et open source. Il permet de de créer et gérer une base de données de références

Plus en détail

BIRT (Business Intelligence and Reporting Tools)

BIRT (Business Intelligence and Reporting Tools) BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»

Plus en détail

ver 2.0 http://www.zotero.org

ver 2.0 http://www.zotero.org ver 2.0 http://www.zotero.org LARDY Jean-Pierre URFIST de LYON - UCBL http://urfist.univ-lyon1.fr DADI : http://dadi.enssib.fr Maj : janvier 2010 1 - Installation de Zotero... 1 2 - Réglages du menu Préférences

Plus en détail

Programmation des Applications Réparties. Parsers XML DOM et SAX

Programmation des Applications Réparties. Parsers XML DOM et SAX Programmation des Applications Réparties Parsers XML DOM et SAX Luiz Angelo Steffenel luiz-angelo.steffenel@univ-reims.fr Steffenel Programmation des Applications Réparties Master M1-2007-2008 1 Comment

Plus en détail

Ouvrir ce texte avec Word ou open office- Enregistrez-le dans un format portable sous le nom DM_votreNom

Ouvrir ce texte avec Word ou open office- Enregistrez-le dans un format portable sous le nom DM_votreNom STAGE DOCTORAL INFORMATIQUE POUR LA RECHERCHE Objectif général : BUREAUTIQUE TRAITEMENT DE TEXTE Il s agit de mettre en forme un document libre de droit (le discours de la méthode), de procéder à un certain

Plus en détail

Présentation de la future plateforme internet du Réseau francophone de l'innovation. Réunion de lancement OIF 9-10 juillet 2013

Présentation de la future plateforme internet du Réseau francophone de l'innovation. Réunion de lancement OIF 9-10 juillet 2013 Présentation de la future plateforme internet du Réseau francophone de l'innovation Réunion de lancement OIF 9-10 juillet 2013 Une initiative francophone au cœur d un écosystème 2.0 Placer aujourd'hui

Plus en détail

Antidot v7 - Product Note. Antidot Information Factory versus ETL. Référence : CORP/PNv7/AIF/vs-ETL

Antidot v7 - Product Note. Antidot Information Factory versus ETL. Référence : CORP/PNv7/AIF/vs-ETL Antidot v7 - Product Note Antidot Information Factory versus ETL Référence : CORP/PNv7/AIF/vs-ETL Révision du 17.06.2013 1. Antidot Information Factory Antidot Information Factory (AIF) est une solution

Plus en détail

25 octobre 2012. JD EDWARDS ENTERPRISEONE et DÉMATÉRIALISATION

25 octobre 2012. JD EDWARDS ENTERPRISEONE et DÉMATÉRIALISATION 25 octobre 2012 JD EDWARDS ENTERPRISEONE et DÉMATÉRIALISATION Sommaire Oracle Webcenter Suite Processus de dématérialisation Intégration de la Solution dans JDE Facture Fournisseurs Démonstration dématérialisation

Plus en détail

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information SCI6052 (Automne 2014) cours 6 1/32 SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information Cours 6 Systèmes de gestion de bases de données (SGBD) textuels

Plus en détail

GERER SES REFERENCES BIBLIOGRAPHIQUES AVEC ZOTERO

GERER SES REFERENCES BIBLIOGRAPHIQUES AVEC ZOTERO Bibliothèque GERER SES REFERENCES BIBLIOGRAPHIQUES AVEC ZOTERO Juin 2012 Fonctionnalités de Zotero Constituer sa base personnelle de références en ligne en saisissant ou important les données Trier, classer

Plus en détail

Solution documentaire globale. Présentation du 14 janvier 2010

Solution documentaire globale. Présentation du 14 janvier 2010 Cadic Intégrale Solution documentaire globale 1 Cadic SA et ses activités Société française, créée en 1986, éditeur de Siège : 146 rue Montmartre 75002 PARIS Domaine d activité : Information Documentation

Plus en détail

Un outil de géolocalisation et de résumé automatique pour faciliter l accès à l information dans des corpus d actualité

Un outil de géolocalisation et de résumé automatique pour faciliter l accès à l information dans des corpus d actualité Un outil de géolocalisation et de résumé automatique pour faciliter l accès à l information dans des corpus d actualité Journée Résumé Automatique Multimédia 2011/03/17 Emilie Guimier De Neef Plan de la

Plus en détail

Faire sa bibliographie avec. Noël Thiboud

Faire sa bibliographie avec. Noël Thiboud Faire sa bibliographie avec Noël Thiboud Qu est-ce que Mendeley? Version actuelle : 1.12.3 Application multiplateforme Tous navigateurs Accès par iphone, ipod, ipad A la fois Un logiciel de gestion de

Plus en détail

SAP Extended ECM. Application Governance & Archiving for SharePoint. Marc WOLFF Associé fondateur Certified CDIA+

SAP Extended ECM. Application Governance & Archiving for SharePoint. Marc WOLFF Associé fondateur Certified CDIA+ SAP Extended ECM Application Governance & Archiving for SharePoint Marc WOLFF Associé fondateur Certified CDIA+ Michaël Fréchet Sylvain Hubert Consultant AEROW - EXPERTS ECM Notre but : vous aider à tirer

Plus en détail

Archives Ouvertes : retour d expérience et rôle des documentalistes

Archives Ouvertes : retour d expérience et rôle des documentalistes Archives Ouvertes : retour d expérience et rôle des documentalistes Claire Büren - Inria «L édition scientifique : sortez enfin du labyrinthe!» - IECL - 16 décembre 2013 Plan Le contexte Les débuts : les

Plus en détail

SSII et éditeur de logiciels, spécialisé dans l'informatique documentaire et dans l'édition électronique:

SSII et éditeur de logiciels, spécialisé dans l'informatique documentaire et dans l'édition électronique: Présentation SSII et éditeur de logiciels, spécialisé dans l'informatique documentaire et dans l'édition électronique: un ensemble de produits éprouvés et performants, des services de haute qualité. Dématérialisation

Plus en détail

X2BIRT : Mettez de l interactivité dans vos archives

X2BIRT : Mettez de l interactivité dans vos archives Présentation Produit Présentation Produit X2BIRT : Mettez de l interactivité dans vos archives L accès à l information est capital pour les affaires. X2BIRT, la dernière innovation d Actuate, prend le

Plus en détail

Rédiger : le numérique dans la préparation de la thèse

Rédiger : le numérique dans la préparation de la thèse Rédiger : le numérique dans la préparation de la thèse Master class Beyrouth-18 et 19 juin 2014 «Méthodologie de la recherche et culture numérique» Formation d Alexandre Gefen - alexandre.gefen@paris-sorbonne.fr

Plus en détail

NOUVELLES FONCTIONNALITES VERSION 2013R2

NOUVELLES FONCTIONNALITES VERSION 2013R2 NOUVELLES FONCTIONNALITES VERSION 2013R2 Décembre 2014 INTRODUCTION La version 2013R2 s inscrit dans la continuité de la version 2013 et de la version 2011, dont elle approfondit les aspects d ergonomie

Plus en détail

Focus sur : Comparatif de 3 logiciels de gestion des références bibliographiques

Focus sur : Comparatif de 3 logiciels de gestion des références bibliographiques Focus sur : Comparatif de 3 logiciels de gestion des références bibliographiques Les logiciels de gestion des références bibliographiques : Il existe plusieurs dizaines de logiciels de gestion de références

Plus en détail

SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES

SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES SÉMINAIRE TECHNIQUE SERVICES À VALEURS AJOUTÉES NANCY 18-19 MARS 2015 Jean-Marie Pierrel Université de Lorraine OBJECTIFS DES SERVICES À VALEURS AJOUTÉES Définir des services à valeurs ajoutées sur la

Plus en détail

Customer Intelligence

Customer Intelligence Customer Intelligence Prenez le lead sur les données consommateur Partenaire Développement commercial Les 3 principaux challenges selon les Directions Marketing #1 Prise en compte du digital dans la relation

Plus en détail

WHITE PAPER Une revue de solution par Talend & Infosense

WHITE PAPER Une revue de solution par Talend & Infosense WHITE PAPER Une revue de solution par Talend & Infosense Master Data Management pour les données de référence dans le domaine de la santé Table des matières CAS D ETUDE : COLLABORATION SOCIALE ET ADMINISTRATION

Plus en détail

La gestion bibliographique avec EndNote X4

La gestion bibliographique avec EndNote X4 La gestion bibliographique avec EndNote X4 David Fournier-Viger Conseiller en documentation Téléphone : (819) 762-0931 poste 1100 Bibliothèque Cégep-Université Abitibi-Témiscamingue Plan de l atelier Introduction

Plus en détail

Apprentissage Statistique. Bureau d étude :

Apprentissage Statistique. Bureau d étude : Apprentissage Statistique Bureau d étude : Score d appétence en GRC Hélène Milhem IUP SID M2 2011/2012 Institut de Mathématiques de Toulouse UMR CNRS C5219 Equipe de Statistique et Probabilités Université

Plus en détail

Vue d ensemble. Initiatives des données. Gestion de la trésorerie. Gestion du risque. Gestion des fournisseurs 2 >>

Vue d ensemble. Initiatives des données. Gestion de la trésorerie. Gestion du risque. Gestion des fournisseurs 2 >> Access MD Online Vue d ensemble Access MD Online fournit aux organisations un accès en temps réel à leurs programmes de carte commerciale au sein d un environnement sécurisé, n importe où et n importe

Plus en détail

Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données

Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011

Plus en détail

Panorama des solutions analytiques existantes

Panorama des solutions analytiques existantes Arnaud LAROCHE Julien DAMON Panorama des solutions analytiques existantes SFdS Méthodes et Logiciels - 16 janvier 2014 - Données Massives Ne sont ici considérés que les solutions autour de l environnement

Plus en détail

Information & Content Management IDC FRANCE

Information & Content Management IDC FRANCE Information & Content Management IDC FRANCE Alain Navarro, Software & Sales Director France/Iberia Paris, 13 Octobre 2010 KOFAX Comment contrôler les processus métier en capturant les informations pertinentes

Plus en détail

URFIST DE TOULOUSE Stages de novembre 2011 à mars 2012. Lundi 28 novembre ET mardi 28 novembre matin : Zotero : un logiciel de gestion bibliographique

URFIST DE TOULOUSE Stages de novembre 2011 à mars 2012. Lundi 28 novembre ET mardi 28 novembre matin : Zotero : un logiciel de gestion bibliographique URFIST DE TOULOUSE Stages de novembre 2011 à mars 2012 Lundi 28 novembre ET mardi 28 novembre matin : Zotero : un logiciel de gestion bibliographique Formateur : François Magnan, consultant Durée : une

Plus en détail

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement Cursus Outils & Développement Vous êtes Consultant, Chef de Projets, Directeur des Systèmes d Information, Directeur Administratif et Financier, Optez pour les «formations Produits» Nous vous proposons

Plus en détail

Atelier 1. Portails documentaires : BioLib et Cemadoc

Atelier 1. Portails documentaires : BioLib et Cemadoc Atelier 1 Portails documentaires : BioLib et Cemadoc Intervenants Emmanuelle Jannes-Ober, responsable de la médiathèque - Institut Pasteur Odile Hologne, chef du service de l infomation scientifique et

Plus en détail

Zotero Présentation et guide d utilisation

Zotero Présentation et guide d utilisation Zotero Présentation et guide d utilisation Évelyne Mouillet Sauf mention contraire le contenu de ce document est sous contrat creative commons accessible à : http://creativecommons.org/licenses/by-nc-nd/3.0/deed.fr

Plus en détail

Catalogue des formations Edition 2015

Catalogue des formations Edition 2015 Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(

Plus en détail

LES FICHES Domaines. Domaine D1. Travailler dans un environnement numérique

LES FICHES Domaines. Domaine D1. Travailler dans un environnement numérique LES FICHES Domaines Domaine D1 Travailler dans un environnement numérique D1.1 Organiser un espace de travail complexe D1.1.a Connaître le principe de localisation physique des ressources locales et distantes

Plus en détail

Master Technologies numériques appliquées à l'histoire Deuxième année

Master Technologies numériques appliquées à l'histoire Deuxième année Master Technologies numériques appliquées à l'histoire Deuxième année Octobre 2014 Octobre Novembre Décembre Semaine 1 Semaine 2 Semaine 3 Semaine 4 Semaine 5 Semaine 6 Semaine 7 Semaine 8 Semaine 9 Semaine

Plus en détail

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA OBJECTIFS : manipuler les fenêtres et l environnement Windows, gérer ses fichiers et dossiers, lancer les applications bureautiques présentes sur son poste. PUBLIC

Plus en détail

Contenu des cellules 36 Sélectionner des cellules 37 Sélectionner des lignes, des colonnes et des plages spéciales 38

Contenu des cellules 36 Sélectionner des cellules 37 Sélectionner des lignes, des colonnes et des plages spéciales 38 1 2 Introduction XVII Débuter avec Excel 1 Démarrer Excel 2 Nouveau! La fenêtre Excel 3 Utiliser le ruban 4 Nouveau! Choisir des commandes 5 Nouveau! Utiliser le ruban et les barres d outils 6 Nouveau!

Plus en détail

CONNECTEUR QLIKVIEW POUR INFORMATICA POWERCENTER

CONNECTEUR QLIKVIEW POUR INFORMATICA POWERCENTER CONNECTEUR QLIKVIEW POUR INFORMATICA POWERCENTER Tirer pleinement profit de l ETL d Informatica à l aide d une plate-forme de Business Discovery rapide et flexible De plus en plus d entreprises exploitent

Plus en détail

Compétences documentaires et numériques (basées sur le PACIFI) à acquérir de la 6 à la terminale

Compétences documentaires et numériques (basées sur le PACIFI) à acquérir de la 6 à la terminale Compétences documentaires et numériques (basées sur le PACIFI) à acquérir de la 6 à la terminale En 6 : On attend d'un élève de 6 qu'il sache se repérer dans le CDI, trouver une fiction et un documentaire,

Plus en détail

CIMAIL SOLUTION: EASYFOLDER SAE

CIMAIL SOLUTION: EASYFOLDER SAE 01100011 01101001 01101101 01100001 01101001 01 CIMAIL SOLUTION: EASYFOLDER SAE IRISLINK le 15 Février 2012 01100011 01101001 01101101 01100001 01101001 01101100 Un monde d informations en toute confiance

Plus en détail

L analyse de séquence dans R avec la librairie TraMineR

L analyse de séquence dans R avec la librairie TraMineR L analyse de séquence dans R avec la librairie TraMineR Alexis Gabadinho, Gilbert Ritschard Nicolas S. Müller, Matthias Studer Institut d études démographiques et du parcours de vie Université de Genève

Plus en détail

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel Excel est un des meilleurs outils de manipulation de données et parfois il est nécessaire d exploiter des données

Plus en détail

Projets de stage. Présentation

Projets de stage. Présentation Présentation Exxoss est une société B2B qui offre depuis 2003 des solutions globales et innovantes pour les systèmes informatiques. Les infrastructures que nous mettons en place sont étudiées afin de correspondre

Plus en détail

Adobe Technical Communication Suite 5

Adobe Technical Communication Suite 5 Adobe Technical Communication Suite 5 Comparatif des versions Adobe Technical Communication Suite 5 est arrivé Adobe Technical Communication Suite 5 Adobe Technical Communication Suite 5 est une solution

Plus en détail

Etat de l art sur l utilisation des techniques Web Sémantique en ECD

Etat de l art sur l utilisation des techniques Web Sémantique en ECD Etat de l art sur l utilisation des techniques Web Sémantique en ECD Hicham Behja ENSAM Meknès(1,2,3) Brigitte Trousse Projet AxIS INRIA Sophia Antipolis (2) Abdelaziz Marzak Faculté des sciences Casablanca

Plus en détail

Solutions documentaires intelligentes

Solutions documentaires intelligentes Solutions documentaires intelligentes Therefore * Bien sûr, vous pouvez you can* Accédez rapidement à tous vos documents. L accès instantané aux informations clés Optimisez votre efficacité en accédant

Plus en détail

EndNote X7. fabienne.moreau@uclouvain.be

EndNote X7. fabienne.moreau@uclouvain.be EndNote X7 fabienne.moreau@uclouvain.be EndNote X7 permet : de sauvegarder et d'organiser un nombre illimité de références bibliographiques l'encodage manuel ou la récupération de notices à partir de bases

Plus en détail

L'ILM pour donner une valeur «temps» à la donnée

L'ILM pour donner une valeur «temps» à la donnée L'ILM pour donner une valeur «temps» à la donnée Gestion de l'actif informationnel Thèmes abordés Défis & Enjeux de la croissance exponentielle des volumes de données Une approche de la Gouvernance de

Plus en détail

METHODE ET INTERET DE L'INSTALLATION D'UN ARCHIVAGE NEUTRE Exemple du CHU et du CRLCC - NANCY

METHODE ET INTERET DE L'INSTALLATION D'UN ARCHIVAGE NEUTRE Exemple du CHU et du CRLCC - NANCY METHODE ET INTERET DE L'INSTALLATION D'UN ARCHIVAGE NEUTRE Exemple du CHU et du CRLCC - NANCY C. Lefondeur (1), N. Labonne (2), F. Lefevre (1) (1) Direction du Système d Information (2) Service d Imagerie

Plus en détail

Business Intelligence simple et efficace avec Excel et PowerPivot

Business Intelligence simple et efficace avec Excel et PowerPivot Présentation de PowerPivot A. L analyse de données 7 1. Activité 7 2. Définitions 8 a. Mesures et dimensions 8 b. Traitement et analyse 8 c. Robustesse et confiance 9 B. Des solutions pour les gros volumes

Plus en détail

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives Jean-François Gigand, Geonef Raphaël Velt, IRI http://geonef.fr/sigll-opendata L'Institut de Recherche et d'innovation (IRI)

Plus en détail