Partage des données de la recherche. Dossier suivi par : I. Blanc (Sup SIS), C. Gaspin (MIA) et O. Hologne (DIST)



Documents pareils
OPEN SCIENCE CATI CODEX MONTPELLIER 14 FÉVRIER 2013

Les données de la recherche dans l'écosystème des publications scientifiques Institut Pasteur 12 février 2014

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Le plan de diffusion et de valorisation des résultats et la notion d impact dans les projets H2020

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Frequently Asked Questions

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Application Form/ Formulaire de demande

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

setting the scene: 11dec 14 perspectives on global data and computing e-infrastructure challenges mark asch MENESR/DGRI/SSRI - France

THE OUAGADOUGOU RECOMMENDATIONS INTERNET INFRASTRUCTURE FOR AN AFRICAN DIGITAL ECONOMY 5-7 MARCH 2012

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

Préconisations pour une gouvernance efficace de la Manche. Pathways for effective governance of the English Channel

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Stéphane Lefebvre. CAE s Chief Financial Officer. CAE announces Government of Canada participation in Project Innovate.

Instaurer un dialogue entre chercheurs et CÉR: pourquoi? Me Emmanuelle Lévesque Centre de génomique et politiques Université McGill

Discours du Ministre Tassarajen Pillay Chedumbrum. Ministre des Technologies de l'information et de la Communication (TIC) Worshop on Dot.

Marie Curie Individual Fellowships. Jean Provost Marie Curie Postdoctoral Fellow, Institut Langevin, ESCPI, INSERM, France

APPENDIX 2. Provisions to be included in the contract between the Provider and the. Holder

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Natixis Asset Management Response to the European Commission Green Paper on shadow banking

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management

Nouveautés printemps 2013

WEB page builder and server for SCADA applications usable from a WEB navigator

ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

LE FORMAT DES RAPPORTS DU PERSONNEL DES COMMISSIONS DE DISTRICT D AMENAGEMENT FORMAT OF DISTRICT PLANNING COMMISSION STAFF REPORTS

Paxton. ins Net2 desktop reader USB

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Editing and managing Systems engineering processes at Snecma

CEPF FINAL PROJECT COMPLETION REPORT

Archived Content. Contenu archivé

RETHINKING JACQUES ELLUL AND THE TECHNOLOGICAL SOCIETY IN THE 21ST CENTURY REPENSER JACQUES ELLUL ET LA SOCIETE TECHNICIENNE AU 21EME SIECLE

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

DOCUMENTATION - FRANCAIS... 2

Syllabus Dossiers d études

F1 Security Requirement Check List (SRCL)

Cedric Dumoulin (C) The Java EE 7 Tutorial

ERA-Net Call Smart Cities. CREM, Martigny, 4 décembre 2014 Andreas Eckmanns, Responsable de la recherche, Office Fédéral de l énergie OFEN

en SCÈNE RATIONAL Rational Démonstration SDP : automatisation de la chaîne de développement Samira BATAOUCHE sbataouche@fr.ibm.com

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

Le projet WIKIWATER The WIKIWATER project

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Forthcoming Database

Plateforme Technologique Innovante. Innovation Center for equipment& materials

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

Technical Assistance for Sustainable National Greenhouse Gas Inventory Management Systems in West Africa (West Africa GHG Project)

Sub-Saharan African G-WADI

Comprehensive study on Internet related issues / Étude détaillée sur les questions relatives à l Internet. November/Novembre 2014

Instructions Mozilla Thunderbird Page 1

AUDIT COMMITTEE: TERMS OF REFERENCE

Les contraintes de financement des PME en Afrique : le rôle des registres de crédit

Enhancing cybersecurity in LDCs thru multi-stakeholder networking and free software

How to Login to Career Page

INDIVIDUALS AND LEGAL ENTITIES: If the dividends have not been paid yet, you may be eligible for the simplified procedure.

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

We Generate. You Lead.

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

Statement of the European Council of Medical Orders on telemedicine

This is a preview - click here to buy the full publication NORME INTERNATIONALE INTERNATIONAL STAN DARD. Telecontrol equipment and systems

CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009

Completed Projects / Projets terminés

NOM ENTREPRISE. Document : Plan Qualité Spécifique du Projet / Project Specific Quality Plan

COPYRIGHT Danish Standards. NOT FOR COMMERCIAL USE OR REPRODUCTION. DS/EN 61303:1997

Consultants en coûts - Cost Consultants

Notice Technique / Technical Manual

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

calls.paris-neuroscience.fr Tutoriel pour Candidatures en ligne *** Online Applications Tutorial

Gouvernance européenne sur les technologies énergétiques

Enseignement Vocationnel sur les Operations de Business to Business

Contents Windows

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

EN UNE PAGE PLAN STRATÉGIQUE

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

Must Today s Risk Be Tomorrow s Disaster? The Use of Knowledge in Disaster Risk Reduction

Fondation Health On the Net : Accès à l information de santé digne de confiance

Empowering small farmers and their organizations through economic intelligence

La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

Provide supervision and mentorship, on an ongoing basis, to staff and student interns.

Les marchés Security La méthode The markets The approach

Titulaires de marques

La diffusion du Registre du Commerce et des Sociétés en France

FÉDÉRATION INTERNATIONALE DE NATATION Diving

Discours de Eric Lemieux Sommet Aéro Financement Palais des congrès, 4 décembre 2013

La solution idéale de personnalisation interactive sur internet

MANAGEMENT SOFTWARE FOR STEEL CONSTRUCTION

Exemple PLS avec SAS

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

Photoactivatable Probes for Protein Labeling

Transcription:

Partage des données de la recherche Dossier suivi par : I. Blanc (Sup SIS), C. Gaspin (MIA) et O. Hologne (DIST)

Plan Contexte international, scientifique et politique Approche de l Inra Exemples d actions ou projets Conclusion 2

_02 Contexte Science, politique et publications

Dissemination dans R e s e a r c Dissemination plan Research Results Data management plan Decision to disseminate/ share Decision to exploit Publications Depositing reserach data Patenting Gold OA Green OA Repositories (institution, disciplines ) Restricted access h 4

Celina Ramjoue (Head of Sector Open Access to scientific Publications and Data, EC DG CNECT)

Infrastructure européenne Open access, Open data publi : OpenAire Données : OpenAire + Zenodo ZENODO is a repository service that enables researchers, scientists, projects and institutions to share and showcase multidisciplinary research results (data and publications) that are not part of existing institutional or subject-based repositories.

Code de la recherche modifié par la loi ESR de juillet 2013

Du côté de l édition Des nouvelles revues : BGI Shenzhen and BioMed Central GigaScience aims to revolutionize data dissemination, organization, understanding, and use. An online openaccess open-data journal, we publish 'big-data' studies from the entire spectrum of life and biomedical sciences. To achieve our goals, the journal has a novel publication format: one that links standard manuscript publication with an extensive database that hosts all associated data and provides data analysis tools and cloud-computing resources. Not just 'omic' type data imaging, neuroscience, ecology, cohort data, systems biology and other new types of large-scale sharable data. Note aux auteurs revues classiques Data and materials availability All data necessary to understand, assess, and extend the conclusions of the manuscript must be available to any reader ofscience. ] [ Science supports the efforts of databases that aggregate published data for the use of the scientific community. Therefore, appropriate data sets (including microarray data, protein or DNA sequences, atomic coordinates or electron microscopy maps for macromolecular structures, and climate data) must be deposited in an approved database, and an accession number or a specific access address must be included in the published paper. We encourage compliance with MIBBI guidelines (Minimum Information for Biological and Biomedical Investigations). De nouveaux entrepôts de données Dryad is an international repository of data underlying peer-reviewed articles in the basic and applied biosciences. Dryad enables scientists to validate published findings, explore new analysis methodologies, repurpose data for research questions unanticipated by the original authors, and perform synthetic studies. Dryad is governed by a consortium of journals that collaboratively promote data archiving and ensure the sustainability of the repository.

Data citation index DEFINITIONS: Data repository: a database or collection comprising data studies, data sets and/or microcitationswhich stores and provides access to the raw data. Constituent data studies, and sometimes individual data sets, are marked up with metadata providing a context for the available raw data. Data study: description of studies or experiments held in repositories with the associated data which have been used in the data study. (Includes serial or longitudinal studies over time). Data studies can be a citable object in the literature and may have cited references attached in their metadata, together with information on such aspects as the principal investigators, funding information, subject terms, geographic coverage etc. The level of metadata provided varies between repositories. Data set: a single or coherent set of data or a data file provided by the repository, as part of a collection, data study or experiment.data sets may present in a number of file formats and media types: they may be number based files such as spreadsheets, images, video, audio, databases etc. Datasets can be a citable object in the literature and may have cited references attached in their metadata, but more commonly they inherit the metadata of the overall study in which they are used.

Des opportunités au niveau international Build the social, organisational and technical infrastructure to reduce barriers in data sharing (March 2013) Share relevant agricultural data available from G-8 countries with African partners and develop options for the establishment of a global platform to make reliable agricultural and related information available to African partners (April 2013) seeks to support global efforts to make agricultural and nutritionally relevant data available, accessible, and usable for unrestricted use worldwide. (Oct. 2013)

_03 Approche de l Inra

Partage des données à l Inra : étapes clés 2011-2012 : le CS instruit la question Groupe de travail piloté par D. Pontier 9 recommandations pour l Inra (rapport Juin 2012) Fin 2012 : élaboration d une politique 11 principes pour mieux gérer et partager les données de la recherche Avril 2013 : lancement des chantiers de mise en œuvre 3 chantiers disciplinaires / familles de données Chantier juridique Chantiers techniques (outils et méthodes) Chantier compétences Rapport CS http://prodinra.inra.fr/record/206746 Note de cadrage : Principes en matière de partage des données de la recherche Chantier «Data Partage»

Reco du rapport du CS : fil rouge des actions 13

Les données à l Inra? Differentes familles : Omics Observation Social sciences, cohortes du génome à l ecosystème

http://www.stm-assoc.org/2011_12_5_ode_report_on_integration_of_data_and_publications.pdf

Partager? Le partage : «déjà un bénéfice interne» Différentes modalités Via des entrepôts : données liées aux publications «underlyingdata» (H2020) = métadonnées + données Via des applications (Bases de données et Web services) Nécessité d avoir une vision stratégique du partage pas uniquement obligation des agences de financement) ou technique, Évaluation du caractère «sensible» de la donnée Clarification des règles éthiques et juridiques, 16

Développement de nouveaux services Annuaire comme outil permettant d'identifier le patrimoine numérique Inra sur les données et, plus généralement, sur les SI Inra, Entrepôt (métadonnées + jeux de données) Attribution de DOI Favoriser l ouverture des SI Inra en place et concevoir leur interopérabilité -> vers des e-infrastructures labellisées «open science» 17

Exemples de services ou projets 18

Portail : annuaire et entrepôt de données

Attribution des DOI identifiants numériques Objectif : donner des identifiants pérennes aux jeux de données pour qu ils soient citables, trouvables Ex : 10.5061/DRYAD.525VM Etude des besoins et des modalités d attribution plateformes / individus granularité historisation 20

Research Data Alliance Lancé en mars 2013 par Commission européenne, NSF, Australie Contribution à la création de 2 groupes (intérêt, travail) The Research Data Alliance aims to accelerate and facilitate research data sharing and exchange Co chair : E. Dzalé (IST Inra), R. Fulss (CYMMIT)

Wheat Data Interoperability (WDI) WG Status Recognized and endorsed by the Research Data Alliance (RDA) March 2014 Part of the Wheat Initiative Information System project Focus: The WG aims to provide a common framework for describing, representing linking and publishing Wheat data with respect to open standards. The WG will focus first on the following data types: SNP, Genomic annotations, Phenotypes, Genetic Maps, Physical Maps, Germplasm, expression data.

Réalisation d une enquête Data management and data standards in the wheat research community Wheat data interoperability WG (RDA, 2014) Objectives: To focus on two main pillars of the semantic interoperability : Data Structures Controlled vocabularies, ontologies To identify: Use of common metadata and ontologies Use of standards and formats Level of accessibility Level of interoperability or data exchange Case study

Survey results Data storage practices 114 of the196 respondents currently store their data on local drives; 84 are willing to use shared databases and repositories. Data storage 120 100 114 80 84 60 71 74 73 64 Currently Wanted 40 48 43 20 5 5 0 Files in a local drive Files in a shared drive Local databases Shared databases Other

Survey results Ontologies Why not? Lack of knowledge (don t know, too difficult, etc.) Lack of trust (lots of talk about their development, but little/no implementation, no agreement, standards, incomplete) Lack of interest (not useful) In progress. No need/required/relevant Too complicated Not available Other ontologies mentioned are: ECPGR Ontologies to develop conceptual ABM PATO, XEML Plant Environmental conditions ontology plant pathogens:: http://www.pathoplant.de/; PLEXdb; QUDT

Programme National de Développement Agricole et Rural, objectif 3 // GIS Relance Agronomique 26

Créer un data journal Open access, basé sur OJS Partenariat international, sans éditeur privé Open Knowledge for Agricultural development Collection F1000

Ethique du partage des données Commande des présidents Inra et Cirad au comité d éthique calendrier : 2014-2015 (lancement 4/7/14) Quelques facettes : anonymisation des données personnelles éthique du partage conséquences d une «data-driven» science crowdsourcing, citizen science : retour vers le citoyen 28

Pour conclure De nombreuses incitations au partage ou à l ouverture : H2020 Publications Demande des «usagers» Ne pas le faire n importe comment Règles éthiques et juridique Aspects techniques Moyens nécessaires Nécessité d inclure la dimension «partage» dans les SI pour être capable de la gérer correctement : identifiant, métadonnées, protocoles interopérabilité : normes, standards historisation droit d accès embargo Situer notre action à différentes échelles : Inra et ses partenaires National International 29

Colloque dans le cadre de l IAVFF open data et agriculture : quels leviers de croissance? impacts sur : Recherche, formation, développement, innovation création de valeur, modèles économiques : Données de la recherche vers l entreprise Données de l entreprise vers la recherche semaine du 8 juin 30

Merci pour votre attention Odile.hologne@versailles.inra.fr @Holo_08