Belgrand: un Grand Equipement pour l utilisation des Bases de Données Olivier Bonin et Jean-Paul Hubert Projet EQUIPEX et DRI du PRES Université Paris Est porté par l INRETS
Grand Equipement pour les SHS Pourquoi un «grand équipement de recherche» pour la recherche en SHS sur la ville, la mobilité et l environnement? Les équipements existants ont permis à la France de rattraper le retard en matière de diffusion des données Les sources de données se multiplient (observatoires) et les données diversifient et se complexifient (données en continu, géoréférencement, etc.) mais Le travail d ingénierie des données dans le monde académique reste dispersé, dupliqué et peu valorisé Il ne peut pas jouer un rôle d entraînement pour l utilisation des données dans les services techniques ou les entreprises
Ingénierie des données 1/2 Pression pour faciliter la diffusion et la réutilisation Directive INSPIRE, geoportail, géocatalogue, observatoires ouverts sur le web, portails fédérateurs, etc. Nombreux travaux sur l interopérabilité des données : permettre que les données (format de fichiers, schémas de bases de données, etc.) et les traitements soient exploitables par différents logiciels et échangeables Demandes croissantes venant des entreprises, décideurs politiques, recherche Des problèmes méthodologiques de fond qui demeurent (références spatiales, concepts utilisés, apurement des données, pondération, etc.), d où un travail croissant, au cas par cas et coûteux en temps
Ingénierie des données 2/2 Difficultés actuelles du travail sur les données Compétences diffuses dans le monde académique, la fonction publique (FPE, FPT et FPH) et le secteur privé Quelques réseaux d échange spécialisés Peu d interface entre le monde de la statistique et celui de l information géographique Tendance à se limiter aux bases de données qu on connaît Habitude de refaire «tout seul» depuis les fichiers bruts Besoin d un «lieu reconnu» (équipement) pour éclairer sur les données disponibles et capitaliser le travail d ingénierie (méthodes, outils, logiciels, données de référence, données intégrées )
Positionnement de Belgrand Complémentarité avec les équipement de diffusion de données, les observatoires et les living labs, en se focalisant sur l ingénierie des données Modèle collaboratif inspiré des réseaux sociaux : les chercheurs et les techniciens doivent trouver un intérêt à partager et capitaliser leur expertise, les producteurs doivent trouver un intérêt à participer Diversité des approches : données, logiciels, SIG, méthodes, connaissances pratiques et théoriques... Neutralité thématique : pas de gouvernance des projets, pas d ingérence, sinon pour mettre en valeur les bonnes pratiques d ingénierie des données
Cercle vertueux d accumulation de données et d expertise
Belgrand : centre de ressources pour le montage de projets Equipement pour l utilisation des bases de données en phase avec les attentes des chercheurs et les technologies du web: réseau scientifique sur l usage des données, et ensemble de ressources distribuées accessibles depuis un portail web exploration et recherche dans les catalogues de fournisseurs de données et les métadonnées base de connaissances sur les modalités pratiques d accès, les conditions juridiques de mise à disposition, et l utilisation des bases de données (bibliométrie) outils logiciels et SIG, méthodes et référentiels spatiaux facilitant le travail d interopérabilité des données données intégrées ou méthodes d intégration, capitalisées au fur et à mesure des projets de recherche.
Interfaces de l équipement Belgrand Monde académique : Accès libre aux ressources et données Assistance juridique et administrative au montage de projet Lien avec le MEEDDM, partenariat avec l IGN Monde non académique : mêmes ressources que le monde académique (sauf restrictions éventuelles des producteurs de données) plus : Aide aux montage de projet à partenariat élargi (recherche, CT, privé) respectant la propriété intellectuelle et commerciale Valorisation des études (bibliométrie) Travail méthodologique ad hoc dans le cadre de thèse CIFRE
Montage du projet Projet «réseau GEBD» subventionné par la DRI du MEEDDM 2011-2013 : création de l amorce du réseau scientifique et du portail, travaux méthodologiques implémentés dans un SIG Réponse EQUIPEX Belgrand : changement de dimension, industrialisation d outils et production de données de référence statistiques et géographiques, effet accélérateur Partenariat étendu (INRETS-LCPC, Lab Urba, ENSG, Ecole des Ponts, LIRMM, IRD US Espace, IRSTV), avec des acteurs économiques (IGN et BIPE) Budget : 7,4 M, dont 2,4 M demandé au programme Investissements d avenir
Equipement Belgrand axe données de référence et données d'intégration Catalogue SOeS axe métadonnées Catalogue INSEE Géoportail Référentiels spatiaux rétropolés Données intégrées OrbisGIS SIRIUS Capitalisation et dissémination de produits d'intégration Portail Belgrand Catalogues partenaires Conditions d'accès et propriété intellectuelle et commerciale Ressources juridiques Catalogue de données historiques IGN Base d'ontologies Catalogue Quetelet MapInfo Geoxygene Outil IGN orthophotos Logiciels Open Source pour la diffusion des méthodes Equipement Belgrand Mutualisation des connaissances Méthodes algorithmes Bibliométrie usage des données Ressources pratiques Wikipedia axe logiciels HAL axe connaissances SAS R