Cahier des clauses techniques particulières C.C.T.P. Objet du marché : Prestations de Cartographie de la Recherche, Paris Sciences et Lettres-PSL Research University Marché n 2017-008 Articles 25 et 66 à 68 du décret 2016-360 du 25 mars 2016 1 sur 7
Table des matières Article 1 Objet et nature des prestations... 3 1. Objet du marché... 3 2. Allotissement du marché...4 3. Nature et objectifs des livrables...4 Article 2 Calendrier des prestations... 6 1. Pour le livrable Idex... 6 2. Pour l outil pérenne... 6 Article 3 Type de données à utiliser... 6 1. Principe... 6 2. Spécificités propres à chaque livrable... Erreur! Signet non défini. Article 4 Difficultés éventuelles... 6 Article 5 Méthodologie de collecte de données... 7 2 sur 7
Article 1 Objet et nature des prestations PSL est une université de recherche composée de vingt-six établissements et organismes de recherche. Elle a été labellisée IDEX en 2011, puis le projet a été reconduit pour une nouvelle période probatoire en 2016. Un nouveau passage devant le jury international Idex est prévu début 2018, avec un enjeu fondamental pour la poursuite du projet. Dans ce contexte, il est essentiel pour PSL de disposer d éléments permettant d éclairer ses choix de politique scientifique, de les suivre au cours du temps, et d en démontrer publiquement la logique. C est pourquoi PSL souhaite élaborer un système de research intelligence. Afin de disposer des informations nécessaires à la prise de décision, la production de tableaux de bords dynamiques au niveau de l université intégrée est un impératif. Ce besoin concerne différents champs de l activité de PSL (recherche, formation, relations internationales, valorisation, etc.). Le recueil et l analyse de données sont déjà pratiqués par les établissements, sur des thématiques diverses, avec des outils différents et à des niveaux d analyse variables. L appartenance à des tutelles différentes et à des regroupements universitaires distincts est un facteur de complexité supplémentaire. La valeur ajoutée d une cartographie proposée par PSL réside dans : - la production d une vision consolidée qui lisse les disparités de collection de données d un établissement à l autre, - la possibilité de visualiser le positionnement de chaque établissement par rapport aux autres au sein de PSL, - la caractérisation de l activité scientifique de l ensemble PSL afin de benchmarker PSL par rapport à quelques établissements de référence, - à terme, le recueil des données pour les classements globaux (THE, Leiden, QS, etc.). 1. Objet du marché L objet du marché est décomposé en deux phases distinctes : - Tout d abord, il comprend la mise en place d un livrable «Idex» (initiatives d excellence). PSL doit constituer un rapport d auto évaluation en octobre 2017 et être évalué par un jury international en avril 2018. Une cartographie décrivant l activité scientifique de PSL et l organisation de ses forces de recherche est très importante pour l argumentaire. Notamment, PSL souhaite que plusieurs informations se dégagent de cette cartographie et qu elles puissent être visualisées : les frontières exactes de son périmètre, les collaborations entre les différents établissements, la lisibilité de cette structuration et la mise en avant d aires d excellences. - A partir de cette première étude, PSL souhaite disposer d un outil pérenne pour collecter et analyser en temps réel des données sur son activité académique. Il constituera alors un support d informations indispensable pour tous ainsi qu une aide au pilotage. L objectif général de la mission est donc (a) la production d un rapport décrivant la réalité scientifique actuelle de PSL appuyé sur des données quantitatives et visualisations ; (b) la production d une plateforme d interrogation des données. Cette plateforme sera une solution technique de type tableau de bord permettant à PSL de s appuyer sur des données fiables, à la fois internes et externes, afin d instruire ses 3 sur 7
décisions stratégiques, et de développer un outil permettant aux différentes communautés de PSL d obtenir au fil de l eau des informations à partir de requêtes par mots clefs. La solution retenue devra impérativement permettre l intégration de données quantitatives externes (données officielles, open data) et internes aux institutions. 2. Allotissement du marché Le présent marché ne fait pas l objet d allotissement au sens de l article 12 du décret n 2016-360 du 25 mars 2016. Il s agit d un marché unique dont les prestations seront réalisées en deux phases. Il existe en effet une extrême proximité entre les données recensées, les fonctionnalités développées et les informations recherchées. Cette interconnexion entre les deux phases justifie le non-allotissement. 3. Nature et objectifs des livrables La présente partie détaille les deux livrables attendus par PSL, et leurs objectifs précis. Il est à noter que ces livrables doivent être une base adaptable utilisable dans d autres contextes. 1.1. Livrable Idex Le premier livrable consistera en un rapport interprétatif sur la recherche au sein de PSL, appuyé sur une série de visualisations fondées sur l intégration de données quantitatives. Le rapport et les visualisations devront être pensés spécifiquement pour permettre d éclairer la série de thèmes suivants : - La clarté du périmètre : il s agit de connaître les parties dont PSL est constitué, le tout pour être capable de : o Clarifier le périmètre PSL intégré, au niveau des 178 laboratoires et UMR, voir même à l intérieur même des UMR si nécessaire ; o Chiffrer les effectifs que nous considérons comme relevant du périmètre «PSL intégré» ; o Chiffrer les effectifs, cette fois par grands champs disciplinaire, à l intérieur du périmètre «PSL intégré». o Identifier les publications portant la signature commune PSL, afin de permettre l optimisation du repérage. - Complémentarité et intrication des acteurs : devront nécessairement apparaitre les collaborations internes à PSL, et les collaborations avec les acteurs extérieurs. o Montrer le niveau de collaboration entre les 26 établissements, et leur progression depuis le début de l Idex ; o Montrer le niveau de collaboration par UMR ; o Montrer les aires de spécialisation des établissements (voire laboratoires), et la proximité et la complémentarité de ces aires respectives. - Lisibilité du paysage : l enjeu sera de donner une visibilité efficace de la structuration de PSL, en deux niveaux : un premier niveau statique (établissements et laboratoires), et un niveau dynamique (Labex, IRIS, centres interdisciplinaires et établissements, EUR). o Montrer une autre configuration des 178 laboratoires et UMR de PSL, en fonction des ensembles dynamiques (rattachement des laboratoires au Labex, Grands Programmes ) ; 4 sur 7
o Etudier la dynamique des réseaux de collaboration autour des composantes du niveau dynamique (Labex principalement). - Les Aires d excellence : le but est d y faire apparaitre les champs disciplinaires ou thématiques, où PSL se différencie des autres acteurs, qu ils soient nationaux ou internationaux, aussi bien en termes de publication, mais aussi de projets de recherches financés. 1.2. Outil pérenne Le deuxième livrable est une plateforme d interrogation de données, permettant l intégration de données internes et externes aux institutions. Elle devra permettre plusieurs applications. - La mise à disposition de données facilement lisibles, en fonction de requêtes par mots-clés (nom du chercheur, de laboratoire, mot-clé thématique ) ; - Le croisement de différents types de données (publication, RH, projets ANR, projets européens, brevets, récompenses ) afin de mesurer en temps réel l activité de PSL à différents niveaux : global, par établissement, par laboratoire, par champ disciplinaire, par domaine thématique précis ; - Un usage par différents publics, avec différents niveaux d accès à l information : Présidence PSL, Décanat Recherche, Directions internationales, Directeurs de laboratoire, chercheurs, étudiants, entreprises et extérieurs. Le système doit garantir la sécurité, la confidentialité et la propriété des données. - La plateforme doit donner accès à ces informations sous une forme analytique et visuelle, permettant leur exploration et exploitation, et permettre de télécharger les jeux de données bruts produits en réponse à différentes requêtes. Tâches nécessaires en vue du développement de l outil - Accompagner la constitution de corpus exhaustifs et fiables. - Aider à définir le bon process pour la collection et la mise à jour des données en fonction de l existant dans les différents établissements. Le prestataire devra présenter : 1. Une description des types de données (bibliométriques, RH, autres) qu il sera possible d intégrer et de croiser, ainsi qu une description des informations qui seront produites par ces analyses. Une description devra être fournie pour la phase 1 (rapport Idex), une autre pour la phase 2 (outil pérenne). 2. Une description précise de la solution technique mise en œuvre pour l intégration et la mise à jour des données. L outil devra obligatoirement être compatible avec le logiciel Vivo (développé par Cornell University). 3. Une description de l ergonomie de la plateforme, des modalités d accès aux données, et des exemples de visualisations qui pourront être réalisées. 4. Une description de la méthode et des étapes à parcourir pour permettre à terme une remontée automatisée des données, sur la base d un diagnostic des SI utilisés par les établissements. L outil sera développé en association avec un ingénieur informatique de PSL pour favoriser la transmission de l'outil et la future autonomie de développement et de gestion par PSL 5 sur 7
5. La solution proposée devra reposer sur des technologies open source afin de permettre la mise en place d un système réplicable et qui pourra être développé de manière modulaire. Idéalement la plateforme pourra être transposable dans un autre environnement. Article 2 Calendrier des prestations Des dates de livraison différentes sont attendues en fonction des prestations du marché. 1. Pour le livrable Idex Les analyses et visualisations destinées au rapport IDEX sont attendues pour le 30 septembre 2017. 2. Pour l outil pérenne La plateforme d interrogation des données est attendue pour le 15 décembre 2017. Ce délai supplémentaire est prévu pour deux raisons : - Il est indispensable que cet outil se fonde sur des données exhaustives, notamment pour ce qui concerne les corpus de publications. Ces corpus demanderont plus de temps pour être constitués. - Le développement de l outil, l élargissement à d autres types de données, l implication des différentes communautés pour qu il soit intéressant et bien adapté, et les phases d implémentation concrète et de test demanderont plus de temps. Article 3 Type de données à utiliser 1. Principe Pour les deux livrables, les mêmes types de données seront mobilisés : - Les données bibliométriques : publications + facteurs d impact (citations, etc.) ; - Les données RH : effectifs, effectifs par statuts, données nominatives (pour croisement avec les données bibliométriques) ; - Les données AAP : o Financements recherche obtenus (PIA, ANR, ERC) avec en plus si possible les candidatures aux AAP (ERC, Européen collaboratif, ANR) ; o Si possible, et si les informations sont pertinentes, il conviendra d analyser les AAP internes à PSL financés sur fonds Idex. o L outil pérenne pourra cependant mobiliser d autres données. L une des missions du prestataire sera de contribuer à identifier celles-ci. Article 4 Critères d évaluation - Compréhension du besoin - Méthode et qualité de la solution proposée - Connaissance stratégique des établissements d enseignement supérieur et de leurs problématiques. Connaissance des pratiques d open data actuelles (grandes universités internationales, associations professionnelles, gouvernements). 6 sur 7
- Compétences techniques en analyse bibliométrique et en développement de systèmes d information - Capacité à accompagner la création d un outil pérenne en interaction avec les équipes de PSL, à orienter les choix et à coordonner le projet. - Utilisation d une technologie open source - Prix Article 5 Méthodologie de collecte de données Il sera nécessaire d affiner avec le titulaire du marché les informations recherchées et donc les données à collecter. Pour les grands corpus de données (publications et RH) et les processus mixtes de données, la collecte est automatisée via des sources existantes (Scopus et Annuaires CNRS) mais peut aussi impliquer la mobilisation des établissements lorsque c est nécessaire notamment pour les unités non mixtes (enrichissement des bases de données relatives aux publications). En raison des délais fixés pour le livrable Idex la récupération des données auprès des établissements pourra se faire grâce à des interactions indirectes plutôt que par l élaboration d un système d informations optimisé dont la construction demandera plus de temps. La plateforme doit impérativement être pensée pour faciliter la mise à jour des données, et en particulier pour s articuler avec les SI des établissements. En ce qui concerne l outil pérenne, le système mis en place devra a minima prévoir une interface de saisie, mais gagnera à offrir une remontée automatisée des informations depuis les établissements et les services de PSL. 7 sur 7