Rapport sur les initiatives apparentées dans le cadre du projet de mise sur pied de l infrastructure de données Premier rapport d une série de cinq Préparé par Patrice Pitre et Éric Robitaille octobre 04
Dépôt, corrections et mises à jour du document DATE DU DOCUMENT Dépôt, corrections et mise à jour réalisés par 26 septembre 2004 Premier dépôt par P.Pitre et É.Robitaille 4 octobre 2004 Correction par I. Thérien, P.Pitre
TABLE DES MATIÈRES INTRODUCTION 1 Structure du Centre 1 Cadre générale d analyse 1 Démarche rédactionnelle 2 RÉSUMÉ 3 CONTEXTE DE LA MISE EN PLACE DU CENTRE LÉA-ROBACK EN RELATION AVEC CES INITIATIVES APPARENTÉES 4 Qu est-ce qui définit le Centre? 4 Le Centre : une infrastructure de recherche 4 Le Centre : un facilitateur 4 MÉTHODOLOGIE DE RECHERCHE ET PRÉSENTATION DE LA GRILLE D ANALYSE 6 ANALYSE PAR THÈME ET SYNTHÈSE DES INITIATIVES 7 Initiatives reliées aux inégalités sociales et de santé 7 Centre for Neighbourhood Research 7 Townsend Centre for International Poverty Research 9 Élément à retenir de cette catégorie d initiative 9 Initiatives de type entrepôt de données et SIG 11 New York State Geographic Information Systems (GIS) Clearinghouse 11 GéoBase et Géogratis 13 Le portail de Statistique Canada 15 Éléments à retenir de cette catégorie d initiative 15 Initiatives combinatoires 17 Le cas du MAIGIS (Multi-Agency Internet Geographic Information Service) 17 Le Centre de coordination de la surveillance, Infrastructure SIG 18 Carrefour montréalais d'information sociosanitaire 20 Éléments à retenir de cette catégorie d initiatives 21 Autres initiatives inspirantes 22 Le réseau inter-universitaire en études urbaines et régionales : Villes, régions, mondes 22 Cartographie sur les risques, les abus et les besoins des enfants (CRABE) 24 Initiatives financés par IRSC 25 RECOMMANDATIONS DE DÉVELOPPEMENT DU SITE INTERNET À LA LUMIÈRE DE CES INITIATIVES 26 Contenus généraux et particuliers offerts en vitrine du site Léa-Roback 27 Contenus généraux et particuliers offerts en intranet du site Léa-Roback 28 Page i
BIBLIOGRAPHIE 29 ANNEXE, DÉFINITIONS 30 ANNEXE, ABRÉVIATIONS 38 ANNEXE, LISTE DES INITIATIVES 39 ANNEXE, RÉSUMÉ DE RENCONTRE AVEC CMIS 98 ANNEXE, LISTE DES CENTRES FINANCÉS PAR LES IRSC 101 Page ii
INTRODUCTION La mise sur pied du Centre de recherche Léa-Roback sur les inégalités sociales de santé de Montréal, si après nommé le «Centre», nécessite une évaluation des besoins en matière d analyse des données géocodées et des systèmes d information géographique (SIG). Une équipe en SIG a été constituée et mandatée afin de fournir les connaissances essentielles à la mise sur pied du Centre sur ces aspects. Le mandat touche cinq objectifs d analyse qui se concrétiseront par la rédaction de cinq rapports qui ont pour objectif global d évaluer les besoins (en terme de bases de données et d expertise géomatique) et de proposer une stratégie opérationnelle de mise en place d une infrastructure de données. STRUCTURE DU CENTRE La réalisation de ce mandat se fait en concertation avec les autres membres du Centre mandatés sur les aspects de bases de données documentaires (Malijaï Caulet), d enquêtes sociologiques (Rana Charafeddine) et sur les aspects de communications du Centre (Karine Souffez). L équipe du Centre est coordonnée par Isabelle Thérien. Les rapports de l équipe SIG sont rédigés par Patrice Pitre et Éric Robitaille sous la supervision de Philippe Apparicio (INRS-Urbanisation, Culture et Société), de Marie-Claude Boivin (DSP de Montréal) et de Lise Gauvin (Université de Montréal), membres du comité d orientation sur la mise en place de l infrastructure de donnée. CADRE GÉNÉRALE D ANALYSE De manière générale, les objectifs du Centre tendent vers l élaboration d outils «réseautés» qui permettront une exploitation optimale des banques de données pour des fins de recherche sur les inégalités sociales de la santé. Au terme du mandat d évaluation, l équipe SIG proposera une infrastructure soutenant des bases de données (entrepôts de données / datawarehouse) et des possibilités d interaction avec celle-ci par les chercheurs. D autres bases de données provenant de nouvelles enquêtes des chercheurs du Centre pourront être intégrées à cette infrastructure et être interrogées au besoin. Le mandat de l équipe SIG vient précisément définir l infrastructure de l entrepôt de données géomatique et les besoins des chercheurs en interaction avec les bases de données. À cette infrastructure de données sera juxtaposé un Atlas des inégalités sociales de la santé. Celui-ci permettra de produire des cartes et des tableaux de manière à mieux illustrer les résultats des études qui font état des relations entre les inégalités sociales et les inégalités de santé, tant sur le plan individuel que sur la base d unités géographiques. Page 1
DÉMARCHE RÉDACTIONNELLE La démarche d évaluation des besoins se fait en cinq étapes où cinq rapports viennent étayer des éléments particuliers. Voici la liste des objectifs qui sous-tendent les cinq rapports: Faire la recension des écrits sur les initiatives qui s apparentent à la nôtre; Faire l inventaire des banques de données utilisées par les chercheurs du Centre; Évaluer les besoins de la recherche en terme de données (existante et à venir); Étudier les possibilités de mise en commun des données; Étudier les modes d utilisation possibles de l infrastructure. Le premier rapport touche le premier point mentionné à cette liste d objectifs et se structure de la manière suivante: Contexte de la mise en place du Centre en relation avec ces initiatives; Méthodologie de recherche; Notions de base soutenant l analyse; Présentation de la grille d analyse; Analyse courte, systématique et synthèse des initiatives; La structure des quatre autres rapports sera précisée à l intérieur de ceux-ci. Un glossaire technique est également produit en annexe de chacun des rapports afin de fournir un maximum de contenu explicatif au lecteur peu familier avec le domaine des systèmes d information géographique. Page 2
RÉSUMÉ Ce premier rapport dresse des éléments de réflexion en relation avec les systèmes d information géographique (SIG) et les bases de données, les deux composantes que l équipe SIG du Centre Léa-Roback a pour mission de développer. Pour améliorer nos connaissances sur le sujet, une recherche sur Internet des initiatives s apparentant au Centre a été réalisée et constitue la matière première des réflexions et des orientations suggérées dans ce rapport. La première partie de ce rapport porte principalement sur une description générale du Centre et des principales caractéristiques d une infrastructure Internet. Celle-ci suggère de distinguer d une part, la vitrine promotionnelle du Centre, et d autre part, celle offrant des possibilités d accès à des ressources SIG et aux bases de données du Centre. Par exemple, pour l équipe de communication, les objectifs sont surtout orientés vers la diffusion des informations génériques du Centre (publication, congrès, coordonnées, thèmes de recherche, chercheurs associés, etc.). Par ailleurs, pour l équipe SIG et bases de données, les objectifs sont orientés autour de la création d un entrepôt de données et de l exploitation à l aide d un SIG des différentes bases de données. Ces deux objectifs bien que complémentaires sont grandement différents lorsque l on évalue les besoins en termes d équipement informatique, de logiciels et d objectifs de soutien aux chercheurs. Dans ce contexte, il apparaît important d évaluer distinctement le développement informatique, les achats de logiciels et d'équipement informatique dans chacune des équipes. Il est également possible de coordonner les objectifs de chacune des équipes afin de faciliter l intégration des contenus qui seront accessibles dans l infrastructure du site Web du Centre. Les réalisations des équipes doivent donc s appuyer sur des normes et des formats reconnus. Finalement, l analyse des initiatives a permis de relever les différentes fonctions et possibilités de développement d une infrastructure qui puissent répondre aux objectifs des différentes équipes de recherche. Pour y arriver, cette infrastructure se devra d être flexible. Il nous apparaît qu elle pourrait facilement être logée sur un intranet. Cependant, cette infrastructure devrait être développée de manière décentralisée, c est-à-dire sur des serveurs distincts, ce qui offrirait une relative stabilité et une flexibilité de gestion du contenu. Page 3
CONTEXTE DE LA MISE EN PLACE DU CENTRE LÉA-ROBACK EN RELATION AVEC CES INITIATIVES APPARENTÉES L analyse entourant le premier objectif du mandat de l équipe SIG du Centre touche la recension des initiatives ayant des intérêts similaires à ceux du Centre, soit par l analyse des phénomènes sociaux et sanitaires, soit par la mise sur pied d un entrepôt de données. À la suite de cette recension, une analyse synthèse est produite et les éléments les plus significatifs sont retenus et «contextualisés» à la démarche du Centre. Il convient dans un premier temps d identifier ce qui définit le Centre dans le cadre plus spécifique du mandat de l équipe SIG. QU EST-CE QUI DÉFINIT LE CENTRE? Le Centre vise à créer un lieu virtuel ou physique d accès, de traitement et de diffusion des données pour les chercheurs. Le Centre se propose: «[ ] de créer des réseaux qui favorisent l émergence de projets conjoints. En mettant en place des infrastructures de recherche qui viennent répondre aux besoins des chercheurs, le Centre facilitera l exécution des travaux et permettra de développer une masse critique de chercheurs qui s intéresseront aux questions relatives aux inégalités sociales de la santé. De plus, le Centre verra à accélérer le transfert des connaissances et de l expérience entre les milieux de recherche, de décision et d intervention afin que des actions éclairées puissent être mises de l avant.» (tiré du projet de recherche présenté aux IRSC ; l emphase est donnée par les auteurs du présent rapport) Cette démarche pourrait s associer à la création d un entrepôt de données ayant comme particularité le suivi géographique et sociologique des inégalités sociales et des inégalités de santé contrairement à des entrepôts classiques du milieu des affaires où l aspect temporel des suivis visent les fluctuations des marchés. LE CENTRE : UNE INFRASTRUCTURE DE RECHERCHE Le Centre regroupe plus d une vingtaine de chercheurs de différentes disciplines qui peuvent être associés à des approches méthodologiques utilisant les systèmes d information géographique. Nous pouvons dire, plus justement, que les chercheurs utiliseront la géomatique en appui à leur discipline de recherche principale. Certains en feront un usage minimal (représentation des phénomènes sur une carte), d autres plus intense (calcul des distances moyennes ou autocorrélation spatiale entre différents phénomènes). Cependant, tous s entendent pour dire que l outil SIG est un facilitateur dans l exécution de la recherche qui, par un ancrage géographique des données, apporte une plus-value à l interprétation des résultats d analyse. L infrastructure repose donc en partie sur les possibilités d analyse que le Centre pourra offrir aux chercheurs. L infrastructure sur l aspect géomatique est aussi liée à l entrepôt de données. L entrepôt de données est un lieu virtuel accessible à tous les chercheurs du Centre désirant orienter ou planifier un programme de recherche lié aux orientations du Centre. L entrepôt de données doit fournir des informations sur la nature, la qualité et les possibilités d accès aux bases de données existantes. Mentionnons au passage que l infrastructure ne peut concrètement se réaliser qu à travers un intranet puisqu une partie des données accessibles sont de nature stratégique ou confidentielle (obtenues par entente restreinte dans le cadre de réalisation de projets spéciaux). L entrepôt doit être en mesure d alimenter les chercheurs en bases de données. Ils pourront ainsi faire des analyses dans leur propre lieu de recherche ou bien être soutenus dans la réalisation de celles-ci par une équipe fournie par le Centre. LE CENTRE : UN FACILITATEUR Sous l aspect géomatique, l infrastructure est également liée à une expertise afin de développer et de maintenir l entrepôt de données. Il apparaît qu au départ, une partie de l utilisation de l infrastructure pourrait se faire à travers l intranet. Toutefois, un soutien personnalisé offert à chacun des membres peut devenir économiquement plus rentable. Dans le rapport final, il sera proposé une liste des fonctionnalités Page 4
accessibles à travers l intranet et une autre qui serait plutôt disponible de manière personnalisée par un «expert» du Centre. L infrastructure vise les caractéristiques suivantes : Elle doit être flexible pour être mise à jour rapidement. Nombre de bases de données sont produites sans qu on puisse y avoir accès, car elles sont peu structurées (inutilisables rapidement pour des fins de recherche). Elle doit être fiable, reposant sur un cadre normatif, afin d assurer l accès aux données de manière sécuritaire, et la réalisation d analyses rigoureuses. Le cadre normatif en géomatique est en ébullition. Il touche, par exemple, les normes d échange de données et le catalogage de celles-ci. À noter que l aspect normatif de l infrastructure sera développé dans le cadre du second rapport. Le cadre technique de l entrepôt de données sera défini dans le dernier rapport. Il proposera une infrastructure reflétant les besoins des chercheurs du Centre. Tout au long de ces rapports, un ensemble de contenus explicatifs sur les aspects de réalisation de l entrepôt de données géomatique seront abordés: 1. Développement d applications sur le réseau ; 2. Sécurité des échanges des informations ; 3. Formatage et exploitation des données ; 4. Concepts d analyses spatiales liées aux fonctionnalités possibles de l entrepôt de données géomatique. Elle doit être conviviale, ce qui implique l accessibilité de l entrepôt par tous les chercheurs au moyen d un intranet. La convivialité est rendue par la simplicité des procédures d accès et de traitement des bases de données, de même que par une documentation soutenant chacune des bases de données. Malgré la disponibilité de certaines procédures de réalisation de tâches liées à la géomatique, il apparaît nécessaire qu un soutien aux chercheurs soit disponible compte tenu du caractère infiniment technique de la gestion et de l exploitation des bases de données de type géospatiale. L évaluation des besoins en termes de compétences géomatiques sera réalisée lors de l activité du troisième rapport du mandat de l équipe SIG. Page 5
MÉTHODOLOGIE DE RECHERCHE ET PRÉSENTATION DE LA GRILLE D ANALYSE La recension des initiatives s est déroulée sur une période de deux mois : juin et juillet. Au départ, une grille de saisie des informations à analyser a été mise en place. Les initiatives recensées sont accessibles en annexe. Voici la liste des rubriques couvertes par chacune des initiatives. Le nom de l initiative; Une description sommaire de l initiative; L adresse du site Internet; Les mots-clés qui semblait appropriés de retenir pour définir le site; La région d intérêt du site ou de l initiative; Informations de type SIG qui semblaient appropriées de retenir; Informations de type base de données qui semblaient appropriées de retenir ; La date de visite du site. Il est à noter que la rubrique des mots-clés a été remplie sans lien avec une liste formelle. Les termes décrits ci-dessous couvrent les thèmes généraux du Centre et du mandat de l équipe SIG. Nous avons suggéré la création d une liste de mots-clés plus systématique pour le Centre. La liste est en cours d élaboration et accessible en annexe. Toutefois, pour ce rapport la liste des mots-clés utilisés pour la recherche sur Internet est la suivante : cartographie / cartography. centre de recherche / research center ; entrepôt de données / datawarhouse ; inégalités / inequalities ; pauvreté / poverty ; santé / health ; santé publique / public health ; SIG (Système d information géographique) / GIS (Geographic Information System) ; sociaux ou sociale / social ; Les rubriques concernant les informations relatives aux SIG et aux bases de données peuvent servir à identifier les associations qui pourraient y avoir avec le Centre. De plus, le Centre pourrait s inspirer de ces informations afin de développer sa propre infrastructure reliant le milieu des SIG à celui des bases de données. Ces initiatives ont été, pour la plupart, trouvées sur Internet à l aide de termes de recherche significatifs combinés les uns avec les autres. Aucun logiciel, de type engin de recherche, n a été utilisé. Google et Scirus ont été les principaux outils de recherche. Page 6
ANALYSE PAR THÈME ET SYNTHÈSE DES INITIATIVES En lien avec la mission du Centre, et plus particulièrement avec celle de l équipe SIG, le texte qui suit présente une analyse par thème des initiatives apparentées au Centre. Dans le chapitre ci-dessous, les thèmes exposent, au travers des exemples d initiative, les caractéristiques diverses qui peuvent inspirer le Centre. Nous croyons que ces thèmes auront l avantage de fournir un ensemble de concepts qui serviront de base commune lors de l évaluation des besoins des chercheurs à l étape trois du mandat de recherche. Il faut retenir également que les initiatives retenues ont toutes passé par une phase que le Centre s apprête à réaliser : le déploiement d un site Web ou d un intranet. L analyse des initiatives se fait à travers les sites Internet des organisations. La liste de toutes les initiatives que nous avons recensées, avec les informations sommaires recueillies lors de la recherche, sont présentées en annexe. De manière plus concrète, la première partie de ce chapitre aborde les initiatives qui ont une thématique spécifique reliée aux inégalités sociales et de santé. La deuxième partie traite de celles associées aux entrepôts de données spatiales. La troisième partie porte son regard sur les initiatives qui tentent de combiner les aspects «inégalités de santé» et «inégalités sociales» dans une perspective d analyse géographique, dont deux offrant des intérêts particuliers dans le cadre de la réalisation de l infrastructure du Centre. Une quatrième partie retient des initiatives inspirantes, mais qui n ont pas nécessairement de lien avec les autres catégories d initiative. La dernière partie porte un regard attentif sur les projets de recherche financés par l Institut de recherche en santé publique et des populations des Instituts de recherche en santé du Canada pour la création de centres de développement de la recherche, comme le Centre Léa-Roback sur les inégalités sociales de santé de Montréal. INITIATIVES RELIÉES AUX INÉGALITÉS SOCIALES ET DE SANTÉ Il est prouvé par plusieurs recherches que les conditions sociales et économiques d un individu et du quartier dans lequel il habite auraient un rôle à jouer sur sa santé. Par ailleurs, ceci a été récemment soulevé par Tunstall et coll. (2004), Macintyre et coll. (2002), Frohlich et coll. (2001) et Hanna et Coussens (2001). On peut penser que parmi ces recherches, certaines ont permis la réalisation d infrastructures qui abordent cette thématique d une manière plus soutenue, comme des centres de recherche et d excellence, des instituts, des chaires, etc. Elles offrent un accès Internet à des ressources et à des services divers. La plupart de celles-ci sont issues du milieu universitaire (voir en annexe les initiatives : 1, 2, 3, 5, 7, 8, 9, 12, 33, 35, 38, 44 et 50). La mission de ces centres vise surtout le partage des connaissances et la promotion de la recherche dans le domaine des inégalités sociales et de santé. Parfois, les centres aborderont avec plus d insistance les thématiques sociales que celles de la santé et vice-versa. Par exemple, les initiatives 6, 7, 8, 12, 35, 38 et 44 sont plus vouées aux recherches sur les inégalités sociales, sur la pauvreté ou sur le bien-être des individus. Toutefois, comme dans le cas du Centre Léa-Roback, on y aborde les questions de recherche dans une perspective interdisciplinaire Les sites Web de ces initiatives comprennent généralement des informations sur les membres du groupe de recherche, sur les publications les plus récentes et les projets de recherche en cours. Quoiqu elles ne soient pas nombreuses, certaines initiatives peuvent contenir des entrepôts de données et aussi quelques éléments à caractère spatial (cartes en format image du territoire à l étude par exemple). Centre for Neighbourhood Research Les recherches de ce centre portent principalement sur les problématiques actuelles des quartiers urbains incluant les relations entre les inégalités sociales et économiques et la santé des individus, ce qui revêt un intérêt pour le Centre (voir par exemple le rapport de recherche de Parkes et Kearns, 2004). Le centre se démarque par la présence d un module de recherche donnant accès facilement aux différentes questions qui sont présentes dans les grandes enquêtes sociales nationales ou régionales, réalisées ou en cours de réalisation, au Royaume-Uni (voir le lien Question Bank sur la page d accueil). À travers cette section, il est possible de faire une sélection de l enquête désirée, selon la période couverte, la région concernée et les thèmes privilégiés de la ou des questions d enquête. Le résultat de la recherche montre les différentes questions répondant aux critères de recherche. Chaque question d enquête est reliée à une fiche descriptive complète comprenant entre autres les champs suivants : le nom de l enquête, les mots-clés, la méthodologie de l enquête, la couverture géographique, les années d apparition de cette question suivant l enquête, les résultats principaux trouvés à partir de cette question, etc. Cette fonctionnalité permet aux chercheurs du Centre de connaître les enquêtes accessibles et en cours, et ainsi orienter leur recherche en fonctions du contenu de celles-ci. (http://www.neighbourhoodcentre.org.uk). Page 7
Figure 1. Page d'accueil du ESRC Centre for Neighbourhood Research. Page 8
Townsend Centre for International Poverty Research Ce centre à vocation internationale utilise ses analyses à des fins de recherche afin de proposer des politiques visant la réduction et même la disparition de la pauvreté à l échelle mondiale. Pour arriver à cet objectif, le centre a développé un programme de recherche important qui comprend: Le développement d indicateurs de mesure de la pauvreté et l élaboration de recherches sur les causes qui mènent à cette pauvreté; L analyse des conséquences et des coûts de la pauvreté individuelle, familiale, communautaire et sociétale; Le développement de recherches sur la conceptualisation et la définition de la pauvreté et sur les possibles applications dans le domaine des politiques publiques Le centre de recherche comprend une importante section sur les inégalités en santé en lien avec la pauvreté. Les recherches du centre sur les inégalités se concentrent sur les politiques qui peuvent réduire les inégalités en santé, la distribution équitable des services de santé par le biais de l utilisation du modèle social, la mesure des inégalités en santé. Il est à noter que plusieurs projets de recherche de la section inégalités en santé utilisent la cartographie thématique pour illustrer la problématique (pauvreté, inégalités de santé). Un exemple de ceci, est le projet du «Mapping Deprivation in the South West», qui présente une série de cartes thématiques sur la défavorisation dans le sud-ouest de l Angleterre. Cet exercice vise au développement de la représentation spatiale d indices de défavorisation à l échelle d unités géographiques variables pouvant par la suite être employés avec des données sur la morbidité et la mortalité de la région. La cartographie demeure sous un médium statique (au travers de documents PDF) comme la majorité des cartes accessibles facilement sur Internet (http://www.bris.ac.uk/poverty). Voir figure «Page d'accueil du Townsend Centre for International Poverty Research». Élément à retenir de cette catégorie d initiative Cette première catégorie d initiative vise à informer les internautes des activités des chercheurs (recherches en cours, publications, subventions de recherche, partenariats, bases de données accessibles, etc.) et parfois à offrir une aide à la recherche. Les sites de ce type peuvent constituer de bons exemples pour le développement de la vitrine promotionnelle du Centre. Elle permettra de mettre de l avant les idées et les objectifs du Centre sans divulguer des informations stratégiques (bases de données, accès à des applications Internet spécialement développées pour les chercheurs, etc.). D une part, certains éléments sont rédigés dans l esprit de fournir une information de référence pour le centre, mise à jour périodiquement (évènements publics, congrès à venir, publications récentes, appels d offre, liste de personnes à rejoindre, etc.). Cette vitrine sert habituellement de portail vers d autres sections, du site, réservées aux membres. L infrastructure requise pour développer ce type de contenu sur un site Internet (ou intranet) est minimale. Cette porte d entrée vers l information primaire du Centre doit se retrouver dans un endroit sécurisé et maintenu par des spécialistes et ce, en tout temps. L achalandage au site risque de ralentir l accès à des contenus non stratégiques, ce qui enverrait une mauvaise perception aux utilisateurs internes et externes du site. La maintenance réseau, du site, doit, pour cette raison, être assurée par une compagnie spécialisée. Actuellement, la compagnie TELUS est celle qui gère les sites de la DSP et de l OMISS. TELUS représente également une compagnie fiable et reconnue mondialement dans l hébergement de site. Une recherche sommaire des possibilités d hébergement pour le site du Centre-Léa-Roback a porté notre choix vers TELUS. Ce choix représente une option appropriée pour le moment. Page 9
Figure 2. Page d'accueil du Townsend Centre for International Poverty Research. L entretien du site nécessite une mise à jour périodique du contenu. Cette tâche peut être facilitée par l utilisation de l un des nombreux systèmes de gestion de contenu Web (Content management system, CMS). L équipe propose que le Centre porte son choix sur «Mambo Open Source» (www.mamboserver.com), un outil qu elle connaît déjà et qui a l avantage d être facile à mettre en place. Ce logiciel jouit d une certaine reconnaissance dans la communauté internaute et nombreux sont ceux qui supportent son développement. En plus d être gratuit, il permet la gestion à distance du contenu du site par plusieurs responsables, il assure la sécurité de certaines sections par un accès réservé aux membres et il est relativement facile de personnaliser des styles associés aux pages Internet. La vitrine promotionnelle du Centre doit-elle être distincte de celle de l OMISS? Certes, nous croyons qu il ne doit pas avoir de duplication des contenus dans l un et l autre des sites Internet. Peut-il y avoir fusion des deux vitrines dans un même site? Dans une approche de type portail, des contenus spécifiques à l une ou l autre des organisations (OMISS et Centre Léa-Roback) peuvent cohabiter dans une même interface (à une même adresse Web). Les deux organisations pourraient se distinguer simplement par une signature graphique particulière. Nous pouvons penser qu une section «recherche» (Centre Léa-Roback), peut cohabiter avec une section «diffusion de l information publique» (OMISS), et une autre sur l Atlas des inégalités sociales. De cette manière, l architecture du site qui est propre aux besoins en terme de SIG et de bases de données du Centre peut se développer pour l équipe SIG dans des lieux décentralisés (sur des serveurs distincts). L entrée principale du site, le portail, redirigerait les internautes vers les serveurs appropriés (Centre, OMISS, entrepôt de données, Atlas, etc.). Cette configuration offre ainsi une souplesse de configuration de l infrastructure et de l architecture du site en fonction des besoins des équipes. Nous décrirons une ébauche d architecture du site Web au dernier rapport. Page 10
INITIATIVES DE TYPE ENTREPÔT DE DONNÉES ET SIG L absolue nécessité de la surveillance de la santé, de la criminalité ou de l environnement par les organisations publiques entraîne une utilisation, au moins modeste, des outils de repérage spatiaux que représentent les SIG. Les premiers grands utilisateurs des SIG à vocation publique ont engendré la réalisation de travaux gigantesques créant des bases de données colossales. Ces deux aspects de surveillance et de gestion de bases de données ont fait émerger des outils facilitant le mandat de ces organisations. Aujourd hui, le nouvel aspect de ces outils est sa décentralisation sur le réseau Internet sous un intranet ou extranet. Aux États-Unis, les SIG sont utilisés depuis de nombreuses années par les organisations publiques et leur usage est maintenant généralisé. Les exemples décrits ci-dessous sont caractéristiques des possibilités qu offrent les entrepôts de nature géospatiale. Notez au départ que dans tous projets de développement de SIG, comme pour tout système d information d ailleurs, une large part des efforts doit être mis sur l accessibilité aux données, la structure et l exploitation de ces dernières (comme tout système d information). De manière générale, les facteurs qui influencent la mise en place des portails SIG sont : 1) la démocratisation des données, 2) le déploiement des technologies reliées aux systèmes d information géographique - ces dernières sont de plus en plus conviviales et 3) la récente fiabilité du réseau Internet capable de supporter un transfert de données important. Les entrepôts de données SIG ont comme principale caractéristique d offrir une interface cartographique interrogeable multipliant les possibilités d interactions entre les chercheurs et les bases de données. Cette particularité des SIG en ligne, qui génèrent des flux d information énormes, a fait que ce n est que tout récemment qu ils ont pu être exploités par les systèmes des organisations publiques. Aux États-Unis, chaque État comprend son entrepôt de données à caractère spatial. Plus ou moins élaborés, ceux-ci visent le partage des données spatialisées les plus importantes. Les données accessibles seront plus axées sur des problématiques physiques ou humaines selon les particularités des États (initiatives 20, 21, 22, 23, 24, 25, 28, 52, 53, 54, 59). La catégorisation des types de données reflète les intérêts des organisations. L architecture des entrepôts de données à caractères spatiaux est orientée par les travaux d organismes de normalisation. Aux États-Unis, les agences fédérales, telles que la Federal Geographic Data Committee (FGDC), ont une place importante dans ces initiatives. Au Canada, l Infrastructure canadienne de données géospatiales (ICDG, http://www.geoconnections.org) agit comme organisme-conseil sur les infrastructures SIG. Nous discuterons de ces organisations et des normes sous-jacentes dans le second rapport du mandat. New York State Geographic Information Systems (GIS) Clearinghouse Dans le cas du New York State Geographic Information Systems (GIS) Clearinghouse, les fichiers cartographiques disponibles sont reliés aux domaines suivants: (1) limites cartographiques de base; (2) aspects culturels; (3) aspects démographiques; (4) environnement; (5) services en santé; (6) infrastructures; (7) sécurité publique; (8) autres. Au travers ces domaines, il est possible de télécharger les fichiers géométriques des différents thèmes (localisation des écoles et des services de santé, limites des census track, orthophotos des régions urbaines, etc.). La liste des produits de type bases de données géoréférencées, est longue : c est la démocratisation des données, aux États-Unis, qui explique ce volume important de données disponibles. L État propose aussi des formations sur les SIG à tous ses partenaires via l initiative NYS GIS Help Desk Pilot. L implication du gouvernement américain dans ce type de projet est importante On peut penser notamment à la mise en place du projet Geospatial One-Stop (http://www.geo-one-stop.gov/), où l on peut faciliter, en partenariat avec les institutions locales (ex. : New York State Geographic Information Systems (GIS) Clearinghouse), le partage de l information spatiale, la planification dans l acquisition et la mise en place de nouvelles bases de données spatialisées, la possibilité d étendre le réseau de partenaires et finalement, la collaboration au développement des infrastructures de données spatiales des organismes locaux. Les autres services disponibles par le biais des entrepôts de données sont reliés à la production de cartes et au soutien offert aux communautés dans l utilisation de ces technologies. Cette aide est apportée par les listes de discussion animées par le personnel de la GIS Clearinghouse. Les informations contenues dans ces entrepôts ne répondent peut-être pas explicitement aux problématiques de notre Centre. Toutefois, elles peuvent donner des pistes à suivre dans le développement de notre propre entrepôt de données. Sur ce site, sont également compris les éléments de référence décrits dans la première catégorie d initiatives. (http://www.nysgis.state.ny.us/). Page 11
Figure 3, Page d accueil du New York State Geographic Information Systems (GIS) Clearinghouse Page 12
GéoBase et Géogratis Du côté du Canada, ce type d initiative est moins présent. Les sources d information sont plus centralisées : une organisation maintient son propre entrepôt de données. Deux initiatives peuvent toutefois retenir notre attention : www.geobase.ca et www.geogratis.ca. GéoBase est une initiative des gouvernements provinciaux, territoriaux et fédéral. Elle vise principalement à offrir un accès à des bases de données à caractère spatial de qualité et sans frais. GéoBase n offre pas de services de présentation cartographique ou de générateur de cartes en ligne. Sa fonction principale est d entreposer les données et de permettre un téléchargement direct ou différé. Les étapes de téléchargement sont simples. Il suffit de savoir ce que peut contenir les différentes bases de données reliées au Système national de référence cartographique (SNRC). Figure 4, Page de sélection des bases de données accessibles. À titre informatif, les fichiers accessibles sur le site sont des fichiers de référence du ministère des ressources naturelles du Canada. Ces derniers ne peuvent pas, immédiatement servir à la cartographie thématique comme ceux de Statistique Canada. Ces fichiers servent en fait de base à une bonification (par les ajouts de codifications diverses, retraçage des limites de recensement) des fichiers cartographiques. Ce travail est en partie réalisé par l Agence de statistique canadienne, mais cette bonification au fichier n est pas accessible sur GeoBase. Elle l est, par ailleurs, à travers l Initiative de démocratisation des données (IDD) de Statistique Canada, que nous discuterons dans le second rapport sur les données. L utilisation des fichiers sur GéoBase se fait dans des cas particuliers de réalisation de cartes d équipement et d infrastructure urbaine, de cartes de localisation générale ou d utilisation d images satellite ou d orthophotos en superposition avec d autres couches générales. Page 13
Ces fichiers ne contiennent aucune variable sociodémographique. Les métadonnées du GéoBase reflètent la norme FGDC. Il est à noter que GéoBase prévoit la mise en disponibilité d autres fichiers géographiques (vectoriels et matriciels) actuellement peu nombreux pour le Québec. Ces fichiers sont couramment utilisés dans le cadre d analyse pancanadienne (les produits de la BNDT couvrent tout le Canada) et plus rarement en milieu urbain (les données provinciales ou locales servent plus souvent de référence pour les chercheurs). Notez, toutefois, que les métadonnées reposent sur une norme en vigueur et un système de téléchargement relativement simple et gratuit à tout les internautes. Géogratis est une initiative similaire à celle de GéoBase. Elle donne accès à plusieurs fichiers cartographiques. Plus récente que celle de GéoBase, l interface est plus rudimentaire. Les fichiers sont disponibles via un site de type FTP (File Transfer Protocol). Elle regroupe principalement des fichiers de l Atlas national du Canada, des données qui ont peu d intérêt pour des problématiques d analyse urbaine et précise du territoire montréalais. Cette infrastructure, c est-à-dire un site FTP, est très facile à mettre en place, mais nécessite une connaissance plus grande des moyens pour l acquisition des fichiers, car moins intuitive. Figure 5, Page d'accueil du site Géogratis Page 14
Le portail de Statistique Canada Le portail de Statistique Canada offre via l Initiative de démocratisation des données (IDD) des moyens faciles de télécharger les données du recensement. Figure 6, Page de téléchargement, via un serveur mandataire, chez Statistique Canada Ce portail renferme une mine d informations pour les chercheurs utilisant les données des recensements canadiens récents (1996 et 2001). Ce dernier est la porte principale vers, entre autres, les données descriptives des recensements canadiens. Notez que cette page est protégée et constitue un intranet en soit. Pour y accéder vous devez être physiquement dans un lieu où Statistique Canada reconnaît votre appartenance au groupe de l IDD ou valide par un serveur mandataire (proxy), en fait, votre affiliation (un mot de passe et un code d usager vous sont demandés, ceux-ci sont donnés par votre institution). Les données disponibles sur le site Statistique Canada sont en format Beyond 20/20. Par le fait même, elles doivent subir un léger traitement avant de pouvoir se loger dans un logiciel de SIG. D autres sites apparentés sont accessibles ou alimentés par Statistique Canada et permettent d atteindre des base de données cartographiques. L un d eux est celui de la Conférence des recteurs et des principaux des universités du Québec (CREPUQ). Ce site donne accès à la plupart des fichiers cartographiques des recensements canadiens (1986 à 2001). Éléments à retenir de cette catégorie d initiative Les formations assurent une utilisation correcte des moyens d analyse que les outils SIG offrent aux membres d une organisation. L adage «qualité médiocre à l'entrée = qualité médiocre des résultats» (Garbage In = Garbage Out) est d autant plus vrai en SIG que dans tout autre processus d analyse de bases Page 15
de données. Toutefois, l usage restreint que l on fait des cartes limite notre esprit critique des résultats. On met rarement en doute des résultats cartographiques produits à partir de système informatisé. Ces outils de formation peuvent correspondre à des cours dans un lieu d apprentissage précis (cours individuel ou en groupe dans une classe) ou dans un espace décentralisé (formation en ligne ou document écrit supporté par des explications et des exercices). Une formation sur l utilisation d un logiciel de SIG pourrait s avérer utile dans le cadre des activités des chercheurs. Par exemple, les assistants de recherche y participeraient afin de les rendre autonomes sur des activités de recherche en lien avec les SIG. D autre part, la rédaction de documents de référence peut être une solution alternative et moins coûteuse car elle mobilise moins le temps des formateurs et des apprenants. Par contre, il est reconnu qu un support individuel personnalisé est plus formateur. Dans l un ou l autre des cas d apprentissage, ce temps de formation ou d autoformation contribue à augmenter la rapidité de réponse à des questions récurrentes par les utilisateurs du système ou permet de dresser la liste des réponses aux questions fréquemment posées (liste des bases de données disponibles, utilité d une analyse, préalables à un traitement cartographique, procédures à suivre pour accéder à une base de données, etc.). Notez qu on évalue à environ trois à cinq heures le temps de préparation pour une heure de formation qu il s agisse d une formation de groupe ou d une formation décentralisée. Les formations sont notamment offertes lorsque les usagers ont en leur possession les données cartographiques. Notez également qu il peut être plus économique d investir dans la rédaction d un document de référence plutôt que d offrir une formation individuelle ou de groupe considérant le temps de préparation des formations et le temps alloué aux formations. Toutefois, dans la réalisation des documents de référence de type «Best Practices», faut-il encore s assurer que les notions de base en SIG et en analyse spatiale soient comprises par l utilisateur. Par ailleurs, la documentation de type métadonnées est un élément incontournable et facile d accès, même pour le non spécialiste. Il apparaît important d évaluer les besoins des chercheurs sur cet aspect de formation et de soutien à la recherche. Le système à construire ne pourra vraisemblablement pas répondre à toutes les questions de recherche mais en sera une outil précieux et incontournable pour qui sauront l utiliser. Notre expérience en géomatique en appui à la recherche nous permet de dire que les entrepôts de données déjà mis en place et accessibles aux chercheurs (e.g. : CMIS, CCS, Statistique Canada, etc.) facilite de toutes les manières possibles l usage et le potentiel d exploitation des bases de données, encore faut-il qu ils soient informés des lieux virtuels existants! Le Centre devrait être un levier pour atteindre ces lieux d information et fournir un arrimage entre les possibilités d usage et l accès aux bases de données. Une documentation de type «Best Practices» peut rapidement être rédigée dans ce sens par l équipe. Les moyens d accéder aux fichiers en protocole FTP ou http, avec ou sans procédure de validation automatique par courriel, sont les formes les plus couramment mises de l avant afin de diffuser les données aux chercheurs. Cette forme peut être rapidement mise en place par le Centre afin de partager les données entre les chercheurs. Page 16