NOTE. Compte-rendu de la journée thématique «L accès aux données de la recherche»



Documents pareils
Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux

Programme-cadre européen pour la recherche et l innovation. Horizon Lignes directrices pour la gestion des données dans Horizon 2020

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

ISTEX, vers des services innovants d accès à la connaissance

Position de l ASTEE sur l innovation en matière de services d eau et de déchets

La feuille de route du Gouvernement en matière d ouverture et de partage des données publiques

Accès aux données Sentinelles

Nouvelle stratégie européenne d action pour la jeunesse «Investir en faveur de la jeunesse et la mobiliser»

European IPR Helpdesk

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Agriculture et Finances

Compte rendu de l intervention de Jean-Louis LACOMBE. Rencontre européenne de la technologie du 23 mars La Fondation d entreprise EADS

L action du gouvernement espagnol et de l Institut de la jeunesse concernant le Pacte européen pour la jeunesse

«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes

Journées de formation «Kit Europe» 8 septembre 2009 Lucía Sirera lucia.sirera@ua.es

Comité stratégique de la démarche Alsace 2030 : des ambitions fortes, une vision partagée

Présentation générale du projet data.bnf.fr

Rapport d évaluation du master

Pourquoi et comment les collectivités locales associent d autres acteurs à la définition et à la mise en œuvre d actions publiques?

CHARTE DES UNIVERSITÉS EUROPÉENNES POUR L APPRENTISSAGE TOUT AU LONG DE LA VIE

De la captation de données à la Datavisualisation

Assemblée générale Aristote

Master recherche Histoire des mondes moderne et contemporain

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

L INDUSTRIE AGROALIMENTAIRE : LE PREMIER SECTEUR ECONOMIQUE FRANCAIS

La gestion globale des contenus d entreprise

Mise en place d une politique institutionnelle d archives ouvertes

FONDS UNIQUE INTERMINISTERIEL DE SOUTIEN AUX PROJETS DE RECHERCHE ET DEVELOPPEMENT COLLABORATIFS DES POLES DE COMPETITIVITE

Axe de valeur BMC Identity Management, la stratégie d optimisation de la gestion des identités de BMC Software TM

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

with the support of EFMET cooperation partners:

Rapport d évaluation du master

Conseil Interrégional des Chambres des Métiers de la GR 2

Votre Intranet Collaboratif et sa dimension Réseau Social d Entreprise

Bureau du Projet de l ONU sur la Gouvernance (UNPOG)

ESTIM. Égalité d accès aux Sciences, aux Technologies, à l Innovation et au Multimédia

Sommaire. AXA et Polytechnique s offrent une chaire de data science orientée assurance Silicon.Fr - 02/07/2015

P résentation. L ensemble des concepts et des outils de la Gestion des Ressources Humaines. La Gestion des Ressources Humaines (collection Les Zoom s)

Aspects juridiques des projets européens dans le 7e PCRD

QUESTIONS FREQUENTES SUR LA SRI SI (Stratégie de Recherche et d Innovation pour une Spécialisation Intelligente)

Les ressources numériques

Réduire la pauvreté : comment les collectivités territoriales peuvent-elles être des catalyseurs du développement économique pro-pauvre?

Stratégies gagnantes pour les prestataires de services : le cloud computing vu par les dirigeants Dossier à l attention des dirigeants

SERDALAB - INFORMATION NUMERIQUE B2B - SOMMAIRE

Les personnes handicapées ont les mêmes droits

Big Data : Quel usage au sein des projetsinternet?

Focus : Des bibliothèques dans l'économie du livre (droit de prêt, copie privée, acquisitions papier et numérique) au prêt de livres numériques

L ANI du 11 janvier 2013 : une petite révolution!

Le projet SIST. Internet et Grilles de calculs en Afrique Agropolis- Montpellier Décembre 2007

LES OUTILS DU TRAVAIL COLLABORATIF

LUTTER POUR UNE MEILLEURE SANTÉ : QUE PEUT-ON FAIRE DANS NOTRE QUARTIER?

Place de Wallonie, 1 à 5100 Jambes Secrétariat : 081/ Accompagnement.recherche@spw.wallonie.be. Guide pratique pour les études de faisabilité

COMMUNIQUE DE PRESSE CONJOINT MODELLIS & DATAVALUE CONSULTING

Un Consortium de Recherche Européen Expérimente de Nouvelles Solutions pour Assurer le Respect de la Vie Privée Numérique au Lycée et à l Université

S engager à agir pour le développement durable dans une période de changement

LA DÉCLARATION SOCIALE NOMINATIVE

PRÉSENTATION GÉNÉRALE

Playbook du programme pour fournisseurs de services 2e semestre 2014

Le projet collaboratif 2.0

Thales Services, des systèmes d information plus sûrs, plus intelligents

ITSM - Gestion des Services informatiques

Augmenter l impact économique de la recherche :

Infrastructures de recherche: Positions de la France dans Horizon 2020

PUBLICATIONS Salto Youth EuroMed

Plan de mise en œuvre du concept national maladies rares

Réforme du crédit à la consommation. Statut des enseignants chercheurs. Point sur les États généraux de l outre-mer

APPEL A COMMUNICATIONS

Digital Lëtzebuerg Conférence de presse du 20 octobre 2014

L innovation chez OSEO en 2010 L. REINHART Séminaire Aristote «La Recherche en quête d Innovation» Jeudi 18 Novembre 2010

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

UN PROJET SCIENTIFIQUE ET CULTUREL POUR LA SOCIÉTÉ DE LA CONNAISSANCE

CENTRES D APPUI À LA TECHNOLOGIE ET À L INNOVATION (CATI) GUIDE DE MISE EN ŒUVRE

Formation e-commerce : Community Management Les clés pour créer et animer vos communautés

Portail d informations et de données de marchés publics ou la commande publique augmentée

Position du CIGREF sur le Cloud computing

Introduction Frédéric PETITBON Un contexte difficile Nicolas PERNOT

L évolution (révolution) du métier d enseignant-chercheur est-elle favorable à une plus grande employabilité?

L organisation interne et la gestion des ressources humaines. Un outil d aide à la structuration

Open Data. Enjeux et perspectives dans les télécommunications

AGROBASE : un système de gestion de données expérimentales

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Licence professionnelle Radioprotection, démantèlement et déchets nucléaires : chargé de projets

Cliquez pour du modifier titre le style

sommaire L organisation et la gestion des archives d entreprise...7

Membre de la Commission européenne, chargé du Marché intérieur et des Services

Les obstacles : Solutions envisageables :

Rapport d évaluation du master

Ingénierie des méthodes Agiles : Que cache l opposition entre déploiement et livraison en continu? Faut-il adopter DevOps 1?

Les nouveaux tableaux de bord des managers

MASTER 1 MANAGEMENT PUBLIC ENVIRONNEMENTAL CONTENU DES ENSEIGNEMENTS

Assises du livre numérique 21 mars h30-18h00 Salon du livre de Paris Salle Nota Bene

Transcription:

NOTE Compte-rendu de la journée thématique «L accès aux données de la recherche» Date 21/04/2015 Auteur(s) Florian BOUCHERIE (CPU), Armande COCQUEREZ (CEA), Jean-François HUON (CPU), Catherine IVANOV- TROTIGNON (CNES), Michel LOYER (INRIA), Jean-François MASSET (Ifremer) Référence 2015/6 Panorama de la problématique de l accès ouvert aux données de la recherche et la démarche de la Commission européenne José COTTA, Head of Unit C3 DG Connect José Cotta, chef d unité à la DG CONNECT, s est chargé d introduire les principales problématiques à envisager en matière d accès aux données de la recherche et d open science dans Horizon 2020. En introduction, la nouvelle Commission Européenne en place depuis novembre 2014 est présentée comme une «fusée à étages» pour ce qui est du numérique : le 1 er étage étant composé des commissaires Oettinger (numérique) et Moedas (recherche), le 2 e étage du Vice- Président en charge du marché unique du numérique (digital single market) (Andrus Ansip), le 3 e étage du 1er Vice-Président (Frans Timmermans), le 4 e étage étant le président Juncker, relativement attaché au numérique. Un point est fait sur l initiative Digital Single Market (DSM) de la CE. Pour rappel, le DSM vise à créer une zone au sein de laquelle les individus et entreprises peuvent accéder à des données et exercer des activités en ligne de façon sécurisée, quels que soient leurs nationalité ou pays de résidence. Il s agit d une des 10 priorités du président Juncker, dont l une des pièces de base est la science ouverte et via laquelle la façon de faire de la science est en train de changer. La politique de science ouverte a démarré par l Open Access aux publications scientifiques, ainsi que par la mise en place d une initiative pilote sur les données scientifiques. L open science consiste principalement en la transformation, l ouverture et la démocratisation du processus scientifique et de la R&I via les sciences informatiques. Il s agit là d une opportunité de promouvoir une interaction élargie entre la science et la société (exemple de Galaxy Zoo 1 ) et d assurer un impact sociétal pus large. Une consultation intitulée «Science 2.0» a été menée à l été 2014. Les résultats de cette consultation (environ 500 réponses) ont été suivis par l organisation de 4 workshops à travers l Europe. José Cotta a ensuite soulevé les principaux challenges de l Open Science : 1 http://www.galaxyzoo.org/ 1

Besoin d infrastructures numériques ; Accès ouvert aux résultats et processus de recherche : processus de «décollage» des logiciels open source, ce qui ne semble pas être le cas pour la communauté académique ; Politiques fondées sur des «preuves» (evidence-based / systèmes scientifiques globaux: demandent des outils d analyse de données sophistiquées. «les systèmes scientifiques globaux» s entendent au sens géographique, mais également au sens interdisciplinaire du terme ; Participation publique, science pour les citoyens, production participative. Dans ce panorama, plusieurs défis apparaissent : Pas de limitations d accès, objectif d un «European science cloud» Modèles de publications alternatifs / normes des données de recherche, métadonnées ouvertes / open source / test et exploration de données + copyright /protection des données. Lien entre science et société dans les décisions politiques : utilisation des mégadonnées pour faire de la politique. Passage d exemples isolés (type Galaxy zoo) à des méthodes de recherche. Défis transversaux : Système d évaluation alternative de la recherche (la problématique de l open access se croise avec celle des infrastructures) Open peer review Problématique de la science pour l innovation Il s agit là d un changement culturel majeur à la fois pour les chercheurs, les établissements et l industrie. Les décideurs politiques jouent le rôle de catalyseur dans ce processus de changement. Le rôle de la CE apparaît davantage comme celui de capacity builder. Open Access dans H2020 : L open access est rendu obligatoire dans H2020. Un pilote a été lancé via le projet OpenAire2020, la question principale restant la façon de piloter le Gold open access après la fin du projet (problématique de financement). Pilote sur l accès ouvert aux données de la recherche (Open Research Data). Les bénéficiaires du pilote rendront possible l accès, l exploration, l exploitation, la reproduction et la dissémination gratuite des données via le référentiel de données de leur choix. Ils fourniront également des informations au sujet des outils et instruments à leur disposition et nécessaires à la validation des résultats. Sur 3054 propositions H2020 formulées dans le cadre de ce pilote, le taux d opt-out s élève à 24,2% pour les appels des domaines clés (27,2% dans les autres domaines), ce qui semble encourageant. Les principales justifications formulées en cas d opt-out sont les suivantes: Pas de données générées (4%) Protection de la propriété intellectuelle (25%) Confidentialité (7%) Protection de la vie privée (23%) Mise en péril des objectifs principaux (4%) Autres (7%) Conclusions : les principales problématiques à traiter du point de vue de José Cotta sont: 2

Questions de la standardisation et de l interopérabilité. Question de l évaluation alternative de la recherche Question des données et de la propriété de ces données (Ex. des données médicales qui n appartiennent pas aux patients). Propriété des données de la recherche Marco GIORELLO, Head of Unit DG Connect La Commission a annoncé une réforme du droit d auteur pour 2015. Les questions de droits d auteur et de recherche n ont été rapprochées que récemment. Pourquoi l UE s intéresse-t-elle au copyright? La responsabilité du copyright était, jusque novembre 2014 sous responsabilité de l ancienne DG Marché Intérieur et Services, mais cette compétence appartient désormais à la DG Connect, d où un rapprochement avec la dimension scientifique des données. Les responsabilités de la DG Connect sont : le financement des projets, la politique de l Open access, le Copyright (propriété des publications scientifiques, dissémination ). Les fondamentaux de l encadrement du copyright remontent à loin, et déjà dans un contexte international (Convention de Berne 1886). Actuellement, dix directives européennes traitent d aspects du copyright. Le texte de référence est la Directive 2001/29 sur «l'harmonisation de certains aspects du droit d'auteur et des droits voisins dans la société de l'information». L UE s intéresse à la question dans le contexte du marché unique : pour la circulation des biens, il faut que les supports et contenus soient standardisés. Et puisqu aujourd hui les supports et les contenus sont numériques, et leur circulation dématérialisée plus facile, il faut un règlement européen adapté. Généralement, la règlementation du copyright est une combinaison de droits exclusifs et d exception à ces droits. La recherche est reconnue comme un objet d intérêt commun pour lequel il peut y avoir une exception à l exclusivité. Quand il s agit de droit exclusif, la situation des données de recherche est particulière car l auteur est le chercheur mais, en règle générale, la propriété, donc le copyright, est transféré par contrat à l éditeur (publisher). Ce modèle peut être source de tensions. Actuellement, nous sommes en pleine transition entre ce modèle traditionnel et différents modèles d open access où le scientifique reste propriétaire, paye pour la publication et où les données qu il a produites sont disponibles. Les grandes maisons d édition se dirigent de plus en plus vers les modèles de publication en open access (numérique ou non, suivants plusieurs approches). Quelle interaction entre droit d auteur et recherche dans le cadre juridique européen? Nous sommes dans le domaine des exceptions au copyright pour des raisons d intérêt public, qui s appliquent dans l enseignement (accès aux contenus, par exemple les bibliothèques peuvent donner l accès à des publications dont le contenu est soumis à copyright sans autorisation particulière). Les exceptions sont vagues, larges, et non obligatoires. A-t-on besoin de règles européennes pour l accès des scientifiques aux données? Les Etats membres doivent-ils harmoniser leurs approches? 3

Dans la modernisation du cadre légal sur le copyright, attendue pour l automne 2015, la recherche fait l objet d un point spécifique Text and data mining* * text and data mining ou «fouille de textes et extraction de connaissances à partir de données» : ensemble de traitements informatiques consistant à extraire des connaissances à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques. Il n y a pas encore de décision précise sur la direction que prendra la nouvelle loi sur ces questions, mais les débats sont en cours depuis 2 ans. Y aura-t-il une règle spécifique (une exception?) pour la recherche? Le problème central est le text and data mining sur les publications de la recherche auxquelles les chercheurs ont déjà accès. Peut-on mettre en place des règles sûres au niveau européen pour assurer aux chercheurs qu une fois qu ils ont accès aux données ils peuvent lancer une procédure de text and data mining sans devoir obtenir d autres autorisations? Le cadre légal actuel aurait pu gérer le text and data mining sans autorisation supplémentaire, sans nécessairement mettre en place une nouvelle règlementation mais il fallait harmoniser les approches entres Etats membres. Des discussions sont également en cours sur les objectifs commerciaux/non commerciaux de la recherche : les exceptions s appliquent aux projets de recherche sans objectif commercial. La Commission réfléchit à la possible mise en place d exceptions pour les projets commerciaux également, car la politique générale de la Commission est de faire en sorte que la science trouve des débouchés commerciaux. A noter qu il n existe pas de définition, au niveau communautaire, des «objectifs commerciaux» ou «non commerciaux», à part une référence dans le considérant 42 de la directive de 2001. La définition est ouverte, par exemple à des financements privés ne correspond pas nécessairement une visée commerciale Les projets Openaire et Openaire Plus, Foster Supporting H2020 Open Access policies Eloy RODRIGUEZ, Université de Minho (Portugal), Coordinateur des projets Openaire L Open access n est pas un nouveau concept. En 2008, le pilote sur l Open access aux publications couvrait 20% des domaines de recherche de FP7. Le pilote se fondait sur une simple exhortation aux chercheurs de «faire les meilleurs efforts» en la matière. Aujourd hui, l Open access est encadré par des règles plus strictes. Tous les accords de subvention ont une clause sur l Open access. L accès aux publications est obligatoire pour tous les projets, la période d embargo des publications pouvant aller de 6 à 12 mois. Il existe également un pilote sur l accès ouvert aux données (couvrant sept domaines). Enfin, il est demandé aux Etats membres de développer et d aligner leurs politiques pour l Open access et infrastructures. Nouvelles dispositions sur l open access dans Horizon 2020 : Clause 29.2 du model grant agreement : Open access aux publications scientifiques 4

L Open access doit être assuré pour toutes les publications résultant de projets H2020. Le bénéficiaire doit aussi faire de son mieux pour déposer en même temps que la publication les données de recherche nécessaires à la validation des résultats présentés. Il doit aussi renseigner les métadonnées bibliographiques Le dépôt des données se fait dans un répertoire et doit respecter certains critères formels Clause 29.3 : Open access aux données Il y a deux méthodes, non exclusives, d Open access : le «Green» et le «Gold». Green : «self archiving» l article publié est mis en ligne dans un répertoire, l accès est généralement retardé (période d embargo) Gold : «open access publishing» : l article est immédiatement en accès libre, via la maison d édition. Les coûts sont couverts par l auteur/l institution/le bailleur de fonds. Le pilote d Open access aux données de la recherche, concerne sept domaines d Horizon 2020 (les autres domaines peuvent participer sur la base du volontariat): - les FET, - les infrastructures de recherche, - les LEIT - la partie «Smart cities» du défi Energie - le défi «Changement climatique», excepté la partie «matières premières» - le défi «Société inclusives» - la science avec et pour la société. Les projets participant au pilote doivent répondre à plusieurs exigences: - Le projet doit développer un plan de gestion des données (data management plan) - Les données de recherche doivent être déposées dans un répertoire (repository) - L accès et l utilisation des données doit être rendu possible - Il faut fournir les informations sur les outils et instruments permettant de valider ces données. La Commission a lancé des actions pour soutenir l Open access, et plusieurs projets ont été menés dans ce sens : Pasteu4OA (alignement des stratégies politiques) 2 Projet sur l alignement des politiques des Etats membres sur la politique européenne en matière d Open access. Il s agit de développer un réseau de points clés (key nodes). Pour la France il s agit de Couperin, le consortium universitaire de publications numériques 3. Des études de cas sont menées en collaboration avec ces key nodes. Les différentes approches et politiques sont répertoriées et analysées à l échelle mondiale. Le taux de dépôts, dans les faits, est assez bas PASTEU40A a fait quelques recommandations quant aux critères atour desquels les politiques nationales devraient s aligner : le dépôt doit être obligatoire, on ne peut en être dispensé, il pourrait être lié à l évaluation. 2 http://www.pasteur4oa.eu/ 3 http://couperin.sciencesconf.org/ 5

FOSTER (formation et capacity building) 4 Soutien aux stakeholders et plus particulièrement aux jeunes chercheurs pour qu ils appliquent l Open access. Un portail d information été créé, qui recense aussi les évènements de formation, les cours en ligne. Des objectifs de connaissances à maîtriser ont été établis, certains sont communs à tous les acteurs, d autres diffèrent selon les acteurs concernés : chercheurs, bibliothécaires... Evènements à venir en France : 29-30 juin 2015 (Paris) : «Open access et gestion des données dans Horizon 2020 : intégrer les nouveaux attendus dans vos projets de recherche» 19-23 octobre 2015 (Montpellier) :»Open access trends and Open data for the Agropolis scientific community» Openaire 2020 (Infrastructure et capacity building) 5 Projet Openaire en 2010, Openaire Plus en 2012-2014. Aujourd hui, le projet Openaire 2020 a une vision large: il court sur 42 mois et rassemble 50 partenaires. Sa mission est d utiliser et de réutiliser les données de la recherche, et d établir des infrastructures pour l Open access. En pratique, Openaire vise donc à encourager le dépôt, et à faciliter la recherche dans les répertoires. Openaire deviendra une entité légale en 2016. Openaire 2020 travaille avec le réseau des répertoires Open access : il faut que les répertoires soient liés et interopérables. L objectif est aussi de soutenir l Open access dans H2020 (couvrir 100% des publications, intégration du pilote sur les données de la recherche), de mettre en œuvre les subventions post-pilote sur le Gold open access du FP7, de renforcer les collaborations internationales, de tester de nouvelles formes de communication En ce qui concerne le dépôt, Openaire veut encourager les chercheurs à déposer dans leur répertoire institutionnel. Ils sont orientés vers les répertoires pour les publications (opendoar) ou les répertoires pour les données de la recherche (RE3DATA), ou, en dernier recours vers le Zenodo du CERN (sponsorisé par Openaire). Récolte de neuf millions de publications, de 570 fournisseurs de données (répertoires, journaux ). L idée existe de rassembler également les métadonnées ou de les récolter via le data mining pour pouvoir classer les publications (par auteur, par organisme, etc.) pour en faciliter la recherche et l accès. Enfin, Openaire accompagne les chercheurs dans l Open access : des formations sont prévues et plusieurs kits de soutien sont en préparation. Ils devraient être prêts en octobre (politique de l Open access dans H2020) et en novembre (Pilote Open access aux données), mais certains éléments de ces kits sont déjà disponibles dans les FAQs du site Openaire. Q&A Quel est le projet de durabilité du projet? 4 https://www.fosteropenscience.eu/ 5 https://www.openaire.eu/ 6

La forme finale est en discussion. Mais dans tous les cas l entité légale doit être mise en place en 2016. Et, idéalement, l accès devrait rester gratuit pour les utilisateurs finaux. La question du financement (par les agences de recherche? les maisons d éditions?) est en suspens. Exemple des données satellitaires Vincent TOUMAZOU, Expert National Détaché à la Commission, Unité Copernicus infrastructures, DG GROW Vincent Toumazou, Expert National Détaché à la Commission, a tout d abord présenté le programme Copernicus, anciennement GMES, qui a vu le jour début 2000 et qui est une réponse de l UE à des besoins globaux pour suivre et prendre soin de l environnement. Ce programme est également l essence même de l idée européenne puisqu aucun Etat Membre n aurait pu le développer seul. Ce programme s'appuie sur des données spatiales et in-situ et des techniques de modélisation. Il se décline ainsi en composante spatiale une constellation de six missions dédiées- et six services thématiques. Copernicus est doté d une base légale : le règlement Copernicus adopté en 2014 auquel est adossé un règlement délégué sur l accès aux données. Le budget du programme est de 4,3 milliards d euros dont 3,377 pour le segment spatial. L article 23 fixe les objectifs de Copernicus : - Promouvoir l utilisation et le partage des données - Soutenir le développement des marchés liés à l Observation de la Terre par les acteurs européens - Soutenir l emploi et la croissance - S assurer de la continuité et de la pérennité du programme - Supporter la recherche européenne En ce qui concerne l Acte délégué qui porte sur la politique de données (2013) : L article 2 : définit les plateformes de dissémination de GMES. Les données distribuées y sont libres et gratuites. L article 5 : définit le caractère de l information distribuée en conformité avec la directive pour la dissémination des données L article 6 : concerne la plateforme de dissémination et le rôle de la Commission. La Commission reste le leader sur la gouvernance, l accès aux données, la politique de données et le déploiement de stations de réception des données spatiales en provenance des satellites dédiés. Vincent Toumazou a ensuite listé les différentes missions de la composante spatiale et les services y afférent, dont 3 terrestres et 3 horizontaux. Conclusion : Copernicus est un service public qui donne accès à une information libre et gratuite. Sur demande des utilisateurs la Commission, pour la gestion de crise par exemple, achète des données aux opérateurs. La recherche a accès à une partie de ces données. Les Etats Membres peuvent soutenir le développement des services avals sur leur territoire par le 7

déploiement de structures dédiées à l'accès aux données (PEPS pour la France) complétées de services de soutien et d'expertise. Le traitement et la distribution d'un tel volume de données restent un défi. Les accès dédiés le sont en fonction des utilisateurs. Point de vue des industriels Léopold DEMIDDELEER, Président du Conseil de Surveillance McPHY Energy M. Demiddeleer est actuellement Président du Conseil de Surveillance McPHY Energy, après avoir été longtemps Directeur de la R&D au sein du groupe Solvay. Dans son introduction, M. Demiddeleer évoque son expérience de l innovation, et notamment de la protection du savoir-faire (dépôt de brevets) combinée avec la coopération avec des tiers (partage des connaissances et des données). Il peut en dégager une vision dynamique, qui va d une période où une activité industrielle pouvait se déployer à l abri des brevets, vers un nouveau type d activité industrielle où prime la rapidité d adaptation au marché avec des produits innovants conçus en «Open sourcing». La principale raison de cette évolution est que l ensemble des composantes d une innovation ne peut plus être développé en interne, même par de grands groupes industriels, ceux-ci se retrouvent donc confrontés au dilemme du partage de l innovation avec des tiers sans perdre pour eux-mêmes le bénéfice du développement abouti. Beaucoup de grands groupes ont eu pour origine la mise au point d une technologie de rupture, suivi d une longue phase profitable d exploitation protégée par des brevets, où la stratégie d entreprise se résumait à être un acteur dominant du marché : soit une stratégie de joueur d échec. Mais avec le danger d être brutalement remis en question quand une nouvelle innovation de rupture vient à son tour mettre en péril le business établi : c est par exemple l apparition de la photo numérique, rendant périmée en peu d années la pellicule photo et les industriels de ce secteur qui n ont pas su s adapter à temps. Les nouveaux marchés, maintenant dominés par les attentes des consommateurs, sont devenus plus imprévisibles, conduisant les industriels à faire des paris, à miser avec une certaine probabilité d échec, c est-à-dire à adopter une stratégie de joueur de poker. La rapidité d adaptation pour mettre sur le marché le produit attendu prime sur la taille de l entreprise. A cela s ajoute la globalisation d une innovation industrielle dont toutes les composantes sont conçues, mises au point et fabriquées grâce à un réseau mondialisé de sous-traitants. Ces deux facteurs, rapidité et globalisation, ont conduit récemment certains industriels à considérer l ouverture en grand de leurs connaissances et de leurs données comme une nécessité: l exemple récent de Toyota qui vient rendre public 5600 brevets déposés pour les véhicules à piles à combustibles, celui de Tesla sur les voitures électriques, l ouverture par IBM de son système informatique cognitif aux étudiants de 7 Universités. Cette option «open sourcing» de l innovation, c est pour les industriels le pari d aboutir rapidement dans un développement innovant ouvert, d en récupérer quand même le bénéfice grâce à leur savoir-faire d ensemblier comme d en faire bénéficier les consommateurs et la société en général. Les données de la recherche pour les défis sociétaux : «BIG DATA EUROPE : Understanding the requirements of agrifood domain» Effie TSIFLIDOU, Agro-Know/ Data Curation Manager & Phil ARCHER, ERCIM / W3C's European operations 8

Big Data Europe (BDE) est une CSA (Coordination and Support Action) sélectionnée dans le cadre d Horizon 2020 qui a démarré en février 2015. Le coordinateur de Big Data Europe est Fraunhofer IAIS, le consortium comprend douze partenaires. Les objectifs de BDE sont : - En matière de coordination : fédérer les communautés des acteurs impliqués dans chacun des sept défis sociétaux d Horizon 2020. - En matière de soutien : définir, développer et évaluer une plateforme ouverte d agrégation des mégadonnées pour les acteurs de ces défis sociétaux. Pour ce faire, BDE va constituer des groupes d intérêt - sur le modèle de ceux du W3C (le World Wide Web consortium) - auxquels participeront les acteurs des différents défis sociétaux et des experts des technologies des mégadonnées. Ces groupes d intérêt analyseront les besoins, propres à chaque communauté, relatifs aux mégadonnées et leur traitement (collecte, modalités de traitement, conservation, publication, visualisation, élaboration de services, ). A partir de l analyse de ces besoins, BDE mettra en place une plateforme, reposant sur des technologies «cloud» et «web». Cette plateforme offrira des solutions ouvertes («Open Source») pour le traitement par lots ou en temps réel des données (comme par exemple Hadoop, Cassandra et Storm) et bénéficiera de l expérience du W3C en matière de définition de standards pour la représentation des données du web. Effie Tsiflidou présente ensuite la démarche adoptée pour comprendre les besoins de la communauté agroalimentaire pour mettre à disposition en accès libre ses résultats de recherche (publications et données) et pour examiner les solutions les plus à même d y parvenir. L objectif n est pas de permettre aux acteurs de se conformer à la politique «Open Access» du seul programme Horizon 2020 mais aussi de se conformer aux recommandations ou politiques en la matière établies par d autres instances. Les travaux entrepris dans le cadre de Big Data Europe pour cette communauté ont notamment pour objectif de renforcer les services offerts par aginfra, le projet visant à connecter les données agricoles via la mise en place d une infrastructure de données ouverte et participative (voir : www.aginfra.eu). Dans une première étape, il est prévu de comprendre les difficultés qu ont les participants de certains projets H2020 à satisfaire aux obligations liées à l «Open Access», et de leur fournir des recommandations et un soutien pour s y conformer. Pour plus d information voir le site www.big-data-europe.eu Table ronde avec l ensemble des intervenants de la journée et Philippe FROISSARD, DG R&I, Chef adjoint de l unité B4 (Infrastructures de recherche) Faut-il avoir une politique européenne plus volontariste par rapport à l Open Science? Comment doit-on faire avancer l Europe face à ces défis? Il ne faut pas trop imposer aux chercheurs, il n est pas possible d aller jusqu à interdire aux chercheurs de publier dans les magazines de recherche. 9

L Open Access, déjà initié dans le 7 ème PCRD, est une révolution dans Horizon 2020. C est une démarche positive, la gestion des données est maintenant intégrée aux projets ; cela a permis de commencer à changer les mentalités. Il ne faut cependant pas que les décisions soient prises de manière unilatérale et imposée par le sommet. L approche ne doit pas être contraignante, il est important que les chercheurs sur Open Data puissent choisir de souscrire ou non aux phases de tests. Il s agit encore d une phase d apprentissage en ce qui concerne l accès aux données de la recherche, il serait prématuré d imposer une norme pour contraindre les chercheurs à ce sujet. Il faut prendre du temps pour faire évoluer les mentalités. Il existe néanmoins des différences dans l appréciation de l Open Data en fonction des disciplines : certaines sont beaucoup plus faciles à mobiliser que d autres. Il existe aussi des différences en fonction de l âge des chercheurs. Les jeunes chercheurs sont en effet plus fermés à l ouverture des données, y voyant un possible frein à leur carrière. Il pourrait être utile, pour palier ce problème, de mettre en place un système de «récompense académique» à chaque fois que les données d un chercheurs sont citées, pour faire face à un environnement compétitif qui impose de nombreuses difficultés. Il faut apprendre aux chercheurs à ouvrir l accès aux données. Le monde industriel, de par sa dimension internationale, se heurte à plusieurs types d environnements, ce qui induit plusieurs types de risques dans l ouverture des données. Les exemples industriels offrent cependant de bons exemples aux chercheurs académiques. Les données de la recherche publique peuvent également être utiles aux industriels. Il est en revanche parfois difficile pour eux d exploiter des données dont ils ne sont pas les auteurs. Il est également primordial de s assurer de la qualité des données mises à disposition. Un système de «peer review» permettrait leur évaluation, et ainsi s assurer de leur qualité. Cela permettrait également de limiter les cas de fraudes dans la recherche. Le coût de l ouverture des données reste toutefois problématique. Bien que le «gold open access» ait l avantage d inclure la publication dans le budget de recherche, les inégalités de coûts en fonction des publications restent totalement floues. Le «gold» répare aussi une inégalité et en crée une autre : il fait peser le coût de la publication sur l auteur plutôt que sur le lecteur. 10