DONNÉES DE LA RECHERCHE MODULE IV: PUBLICATION ET SERVICES RENÉ SCHNEIDER HAUTE ECOLE DE GESTION, GENÈVE LICENCE: CC-BY
APERÇU Publication Origines et présent Modes et formes de la publication des données de la recherche Problèmes et solutions possibles Rôles et services Rôles Services Roadmaps et portfolios
BUTS DU MODULE Travailler de manière individuelle et collaborative Acquérir une vue d ensemble de la publication des données Avoir une idée sur les problèmes existantes Connaître les services possibles Réfléchir sur la création des services et les pistes à prendre
PUBLICATION: ORIGINES ET PRÉSENT
ORIGINE (1) 5 janvier 1665 Le Journal des sçavans
ORIGINE (1) De la comète, Le Journal des sçavans I, 5 janvier 1665, p. 41-48.
EXEMPLE I. Domenico Cassini. Durée de la rotation de Mars. Le Journal des sçavans II,1666, p. 259-262.
ORIGINE (2) 6 mars 1665 Philosophical Transactions
PRÉSENT (1) Large Hadron Collider, CERN 1) Raw 2) Reconstructed 3) Reduced 4) Published
PRÉSENT (2) GenBank
PRÉSENT (3) Brick inscribed with the sutra of dependent origination Gorakhpur, 5-6 ème siècle
BIG DATA & SMALL DATA http://www.nature.com/neuro/journal/v17/n11/fig_tab/nn.3838_f1.html
MODES ET FORMES DE LA PUBLICATION DES DONNÉES DE LA RECHERCHE
BRAINSTORMING Sous quelles formes se publient les données de la recherche?
LA PYRAMIDE DE LA PUBLICATION DES DONNÉES
PUBLICATION DES DONNÉES 1. Transfert à un centre de données, une archive ou un dépôt particulier 2. Transfert à un dépôt institutionnel 3. Dans l annexe d une publication scientifique 4. En tant que data paper dans un journal de données 5. Sur le site d un projet ou d un site web institutionnel 6. Auto-publication via un système nuage (p. ex. figshare)
LA PYRAMIDE DE LA PUBLICATION DES DONNÉES http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ode- ReportOnIntegrationOfDataAndPublications-1_1.pdf
L ESSENTIEL Best practice pour les connaissances les plus importantes: http://guides.main.library.emory.edu/datamgmt/cite
EXERCICE DÉPÔT INSTITUTIONNEL Regardez la roue de la fortune! Quelles sont les positions des roues pour la création d une archive institutionnelle Open Access pour les données de la recherche?
SOLUTION
DATA CONTINUUM MODEL Transfert Transfert Publication Private domain Group domain Persistant domain Open access domain Métadonnées simples Métadonnées enrichies
DATA CONTINUUM MODEL http://www.dlib.org/dlib/september07/treloar/treloar-table1.png
DATA CONTINUUM MODEL
COLLABORATION, PUBLICATION ET LA LIGNE DE LA CURATION
COLLABORATION, PUBLICATION ET LA LIGNE DE LA CURATION
EXERCICE IDENTIFICATION Cherchez et expliquez les acronymes suivants : re3data.org, zenodo, datacite/doi, crossref, epic, ark/n2t, orcid, isni, ddi) Collectez les faits les plus importants ainsi que les avantages et inconvénient dans un framapad!
RE3DATA.ORG
ZENODO
DATA CITE & DOI
CROSSREF
ARK, N2T
EPIC
ORCID
ISNI
DDI: DATA DOCUMENTATION INITIATIVE
RÉSULTATS SUR FRAMAPAD https://mensuel.framapad.org/p/m72ndpf9dx
CITATION DES DONNÉES : EXIGENCES L objet de données ainsi que ses parties doivent être identifiables de manière univoque. L objet de données doit être identifiable et accessible de manière directe via le web. Il devrait être traitable par les être humains ainsi que par les machines. La citation de l objet devrait être mesurable, pour être utilisée dans les métriques et participer à la réputation du chercheur.
LES DÉFIS DE LA PUBLICATION DES DONNÉES Granularité: Qu est-ce qu un jeu de données? Quelles sont ses composantes et quelle est la structure? Micro-attribution: Qui est responsable pour quelle action et quel résultat pendant la production et le traitement des données? Identification de l auteur: L auteur, est-il identifiable de manière univoque? Lieu de la citation dans un article : dans le texte, à la fin ou séparée?
DATA PAPERS & DATA JOURNALS
LES DÉFICITS DE LA PUBLICATION SCIENTIFIQUE No Slow Incomplete Inaccurate Unmodifiable Nosek / Bar-Anan (2012): Scientific communication is changing and scientists should lead the way. Psychological Inquiry, 23 (3), 308-314.
LES DÉFICITS DE LA PUBLICATION SCIENTIFIQUE Non : Seulement les résultats positifs sont publiés. Lent : Peer reviews, corrections, refus, re-soumission, etc. Incomplet & pas soigneux: Certains aspects restent cachés, difficulté de vérifier pour trouver des erreurs, seulement le chercheur décide ce qui doit figurer dans la publication. Pas modifiable: après la publication, l article devient un objet statique et gelé
EXERCICE DATA PAPERS Répondez aux questions suivantes : 1. Qu est-ce qu un data paper? 2. Quelles sont ses composantes? 3. Quelles pourraient-être les valeurs ajoutées?
DATA PAPER - DÉFINITION «A scholarly publication of a searchable metadata document describing a particular online accessible data set, or a group of data sets, published in accordance to the standard academic practices.» Vishwas Chavan/ Lyubomir Penev: The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics. 15. Dezember 2011. Vol. 12, no. Suppl. 15, S. S2.
CONCEPT MAP: DATA PAPER http://fr.slideshare.net/mariekeguy/the-rise-of-the-data-journal
DATA PAPERS
METAJOURNALS ET LES DONNÉES DE LA RECHERCHE
DATA JOURNALS Vous trouverez une liste de data papers sous : http://proj.badc.rl.ac.uk/preparde/blog/datajournalslist
DATA PAPERS: UN RÔLE DE CATALYSEUR https://zenodo.org/record/30761#.vhjghstocdp
VALEURS AJOUTÉES Les data papers rassemblent tout ce qui est fondamental pour une bonne gestion des données de la recherche. Cohérence entre les DOI et les IDS Un pas logique après la publication des données et avant la publication de l article méthodologique qui contient les résultats scientifiques Possibilité d un «post publication open peer review»
POST PUBLICATION PEER REVIEWS
LES DÉFICITS DE LA PUBLICATION SCIENTIFIQUE (Non) : Les data papers empêchent que la recherche se réplique sans nécessité (Lent) : Les data papers accélèrent la rapidité de la publication scientifique, permettent une revue par les pairs ouverte et/ou après publication (Incomplet & pas soigneux) : Les data papers permettent la reconstruction, la simulation et l analyse des erreurs. (Pas modifiable) : Les jeux de données peuvent être intégrés dans la recherche courante.
SERVICES
BRAINSTORMING Quels services pouvez-vous imaginer concernant la gestion de données de la recherche? (en général, pas seulement à l intérieur de votre institution)
All cartoons courtesy of Jørgen Stamp, Digitalbevaring.dk. CC BY 2.5.
RÔLES
CONSULTANT
CURATEUR active and on-going management of data through its lifecycle of interest and usefulness to scholarship, science, and education through activities that enable data discovery and retrieval, maintain quality, add value, and provide for re-use over time. http://hdl.handle.net/2142/3493
MULTIPLICATEUR
COMPÉTENCES Train2Dacar
Manage Contingency Plan Coordination of Practice Data Legislation Monitoring Process Store Promotion Advocation Data Analysis Raising Awareness Meta Data Identify Integration Data Preservation Mashing Extracting Information Scope Risk and Disaster Management Merging Data Security Manipulation Retention Documentation Facilitation Context From IM to KM Appraisal Communication Protect Negotiation Skills Standards Development Data Modelling Access Authentication Conditions of Use Value of Data Evaluate Economic Issues Marketing Provide Complaints & Expectation Management Train2Dacar
SERVICES
SERVICES
EXERCICE SERVICES 1. Allouez à chaque prestation de service a) l image b) et les activités correspondantes. 2. Développez le roadmap pour un service ou un portfolio de services au sein de votre institution.
RDM Policy and Strategy Détermination du statu quo et des objectifs visés par la stratégie Plan d'action pour la mise à disposition de l'infrastructure et des services futurs Formulation d'une politique avec principes de RDM Ratification de la politique Faire connaître le RDM Réalisation d'études pilotes et d'études de cas
Business Plans and sustainability Création d'un business plan sur la base de la stratégie, avec projections sur 3, 5 et 10 ans Identification de l'effort et des coûts par année comptable Clarification de la réduction des coûts, par exemple par la facturation de services Réalisation d'une analyse coût-avantage pour la rentabilité des investissements Clarification des questions de durabilité et de coûts à long terme
Data Management Planning Etablissement de directives pour la gestion des données Mise en place d'un service d'assistance pour la gestion des données Mise à disposition d'exemples de gestions des données efficaces Collecte et mise à disposition d'outils pour la création de plans de gestion de données Coaching sur le thème du plan de gestion des données
Managing Active Data Examen des pratiques RDM pour évaluer l'infrastructure et les systèmes en place Estimation et investissement dans de l'espace de stockage supplémentaire Etablissement de procédures pour l'attribution et la gestion des capacités de stockage Mise en place de systèmes RDM flexibles ou extensibles
Data Selection and Handover Identification des données Préparation de critères pour l'archivage Accords entre les chercheurs et le centre de données quant à l'enregistrement et l'archivage Utilisation de dépôts déjà existants pour faciliter le transfert Promotion des avantages du RDM pour faciliter la réception et le transfert Encadrement des groupes de chercheurs et aide à la décision lors du développement de directives pour le RDM Définition de critères pour l'utilisation à différents niveaux de la curation, en fonction de la nature des données
Data Repositories Développement/extension du dépôt institutionnel pour la mise à disposition de données de recherche Adaptation du dépôt aux systèmes existants pour le RDM Décision sur les rôles que jouent les dépôts de données externes Conseil et encadrement des chercheurs dans l'orientation vers les dépôts adaptés
Data Catalogues Définition de métadonnées pour la description de jeux de données de recherche Etablissement d'un système pour la saisie et la représentation de notices et de collections de données de recherche Intégration du processus de création des métadonnées dans les processus existants Adaptation du système au «data harvesting» Mise à disposition de métadonnées pour l'intégration dans des catalogues nationaux ou d'autres services pertinents
Training Développement de modules de perfectionnement sur le RDM destinés aux chercheurs Développement de modules de formation continue destinés au personnel du centre de données
Guidance Mise en commun et comparaison des services existants pour la création d'un site web unique sur le RDM, destiné à orienter les utilisateurs Orientation et soutien des chercheurs lors de la recherche de services pertinents
Support Soutien et encadrement de groupes de chercheurs lors du développement de directives et lors des premières décisions Coordination lors de la régulation de l'encadrement, soit par un service d'assistance, soit par des personnes de contact bonnes en communication
EXERCICE : SERVICES Développez - le roadmap pour un service - un portfolio des services pour votre institution. Quels sont les buts, premiers pas, phases, actions concrètes, livrables?
QUE FAIRE? Constituer un groupe de pilotage, mené par un chercheur expérimenté Pour la réalisation: créer un groupe de travail RDM, avec différentes responsabilités et compétences Analyse des besoins sur la base du statu quo, ainsi que des lacunes dans le service et l'encadrement Créer des services correspondant aux exigences internes et externes, mais tout de même poursuivre la culture d'entreprise existante Applications pilotes pour chaque service avant le lancement public
EXEMPLE: UNIVERSITY OF BRISTOL
EXEMPLE: ROADMAP RDM UNIVERSITY OF EDINBURGH http://www.ed.ac.uk/files/imports/filemanager/uoe-rdm-roadmap-140106.pdf
LITTÉRATURE Ball, A. & Duke, M. (2015). How to Cite Datasets and Link to Publications. DCC How-to Guides. Edinburgh: Digital Curation Centre. Available online: http://www.dcc.ac.uk/resources/how-guides - See more at: http://www.dcc.ac.uk/resources/how-guides/cite-datasets Candela, L., Castelli, D., Manghi, P., Tani, A. (2015): Data Journals: A Survey. Journal of the Association for Information Science and Technology, http://dx.doi/10.1002/asi.23358..
LITTÉRATURE Jones, S., Pryor, G. & Whyte, A. (2013). How to Develop Research Data Management Services - a guide for HEIs. DCC How-to Guides. Edinburgh: Digital Curation Centre. 2013, http://www.dcc.ac.uk/resources/how-guides. Research Data Alliance: 23 Things: Libraries for research data. https://rdalliance.org/system/files/documents/23things_libraries_for_data_managem ent.pdf
ÉVALUATION