Partage de données: opinions, usages et besoins Enquête DARIS auprès des chercheuses et chercheurs en sciences sociales en Suisse Eliane Ferrez et Martina Bichsel Lausanne, mars 2012
Introduction Le Service de données et d'information sur la recherche DARIS a pour mission principale de faciliter l'accès de la communauté scientifique aux données de la recherche en sciences sociales en Suisse. DARIS met ainsi à disposition une collection variée de jeux de données, dont certains peuvent être explorés et téléchargés directement en ligne. Dans le but d'améliorer et de développer nos services, nous avons mené une enquête auprès des chercheurs-ses en sciences sociales en Suisse. Nous nous sommes principalement intéressés à leur point de vue concernant le partage de données, à leurs pratiques en matière de production et d'analyses secondaires de données quantitatives et qualitatives, ainsi qu'à leur intérêt pour de futurs développements envisagés par DARIS. Un grand merci à toutes les personnes qui ont pris le temps de participer à notre enquête et qui nous ont fait part de leurs suggestions. Méthodologie de l enquête L'enquête en ligne, programmée à l'aide du logiciel LimeSurvey, a été menée d avril à juin 2011, dans trois langues (français, allemand, anglais). L enquête, comptant 20 questions, a été adressée par courrier électronique à 8712 personnes, dont 7178 répertoriées dans notre base de données et 1534 utilisateurs de notre serveur FORS NESSTAR. Au total, 867 questionnaires ont été validement complétés. Ce taux de réponse de 10% est relativement bas mais dans la norme quand il s agit d enquêtes menées en ligne, sans incitation 1. De plus, la forte mobilité professionnelle dans la branche fait que les adresses ne sont pas toujours actuelles. A cet égard, les informations collectées montrent que la très grande majorité (78%) des répondants sont des utilisateurs et/ou des producteurs 2 réguliers de données, qu elles soient qualitatives ou quantitatives. On note encore que la quasi-totalité (90%) des répondants à l enquête font partie du milieu de la recherche, en tant que doctorant ou assistant diplômé (38%), membre du corps professoral ou du corps intermédiaire porteur d un doctorat (34%) ou encore chercheur des secteurs public (14%) ou privé (4%). Finalement, l équilibre numérique entre les disciplines des répondants (13% de sociologues, 13% de psychologues, 12% d économistes, 12% issus des sciences de l'éducation, 11% de politologues, 39% d autres filières très variées) reflète la diversité des publics touchés. 1 Ni chèque, ni tirage au sort d un prix n ont été proposés. 2 Chercheurs-ses qui produisent des données et personnes collaborant à la production de données. 1
Résultats a) Importance du partage des données L'enquête visait tout d'abord à connaître l'opinion des chercheurs concernant le partage des données de recherche. La presque totalité d'entre eux l'estime important pour les sciences sociales en général (64% très important, 30% plutôt important). Les chercheurs en sciences politiques sont les plus convaincus de l'importance de cette pratique pour leur propre discipline (83% la considèrent très importante), suivis des économistes (74%) et des sociologues (66%). Si, comme on l'observe, le partage de données est jugé très important par une nette majorité des chercheurs interrogés, qu'en est-il du rôle des institutions spécialisées dans ce domaine? Bien que plus nuancés, les résultats montrent que les chercheurs accordent de l'importance au fait que le partage des données soit assuré par des institutions spécialisées dans l'archivage de données (41% le considèrent très important, 37% plutôt important). b) Pratique de l'analyse secondaire Si l'on s'intéresse maintenant aux pratiques elles-mêmes, on constate que la moitié des chercheurs interrogés environ (52%) analysent parfois ou régulièrement des données quantitatives qui n'ont pas été produites par eux-mêmes ou leur équipe de recherche. La proportion est sans surprise moins élevée pour les données qualitatives (36%), la tradition de réutilisation étant moins forte. Les disciplines les plus convaincues de l'importance du partage de données, à savoir les sciences politiques, l'économie et la sociologie, sont également celles au sein desquelles l'analyse secondaire de données est la plus répandue. Globalement, plus de 70% des chercheurs dans ces trois disciplines analysent parfois ou régulièrement des données produites par d'autres, qu'elles soient quantitatives et/ou qualitatives. c) Des nouvelles ressources pour la communauté scientifique DARIS souhaite étayer son offre et mettre de nouvelles ressources à disposition de la communauté scientifique. Ces nouvelles ressources, qui sont actuellement à l étude et qui seront mises à disposition progressivement, comprennent : une base de données des questions posées dans les enquêtes en Suisse, interrogeable en ligne et notamment utile à la conception de questionnaires ; des pages web thématiques (par ex. éducation, santé, immigration) regroupant les descriptions des données pertinentes du catalogue ; des modules d'enseignement comportant des données ainsi que du matériel didactique relatif à l'analyse secondaire ; un open data repository permettant aux chercheurs-ses de déposer et de diffuser plus rapidement leurs données de recherche ; des fonctions de réseautage en ligne facilitant la communication et le partage de données avec des collègues en Suisse ; l acquisition et mise à disposition de davantage de données qualitatives. 2
Le graphique ci-dessous montre qu il y a un intérêt évident des chercheurs-ses pour l'ensemble des ressources proposées, les pages web thématiques et la base de données des questions rencontrant le plus d'intérêt. Utilité des nouvelles ressources à l étude en % 100% 90% 80% 70% 60% 50% 40% 33 36 41 44 40 35 assez utile 30% 20% 10% 58 50 36 30 30 31 très utile 0% Pages thématiques Base questions Open data repository Modules enseignement Réseautage en ligne Données qualitatives Les importants investissements en cours liés à la nouvelle plateforme informatique interactive actuellement en développement dans notre service vont faciliter la mise en place de ces ressources. La partie ouverte du questionnaire a confirmé qu elles coïncident avec des attentes réelles: Plusieurs chercheurs-ses se sont prononcés sur l'importance de l'archivage des données qualitatives et une intégration plus forte de la recherche qualitative. Les questions de droits d'auteur, de protection des données et d'anonymisation sont dans ce contexte très importantes et ont été étudiées par DARIS. Les lignes directrices spécifiques récemment mises en place pour l'acquisition, l'archivage, la documentation et la distribution de telles données répondent aux préoccupations évoquées par les chercheurs-ses (cf. site web DARIS -> données qualitatives). Un partage des données plus systématique et rapide est demandé. Le renouvellement en cours des outils d'archivage va faciliter le processus dans son entier, du dépôt à l'obtention des données. De plus, l'open data repository permettra de déposer aussi des jeux de données anciens, 3
incomplets ou d une portée plus régionale, afin qu ils soient préservés pour la communauté scientifique. Plusieurs chercheurs-ses soulignent l'importance d'une information accrue sur les outils existants et mentionnent aussi la mise à disposition des questionnaires en ligne (recherche de variables/questions). DARIS va intensifier les efforts déjà entrepris pour accroître sa visibilité en informant régulièrement sur les nouvelles données publiées et la réalisation des nouveaux services, par le biais de son site web, du FORS Data Bulletin, de la FORS Newsletter, par Facebook et Twitter, ainsi que par des présentations dans les universités et les hautes écoles. Ces dernières sont effectuées à la demande des chercheurs-ses. 4