La recherche sur la qualité de l information géographique: solutions, enjeux et perspectives Rencontres SIG La Lettre 2010 Rodolphe Devillers Département de Géographie Université Memorial de Terre Neuve (Canada)
Qualité des données pas nouveau Un programme de recherche actif sur la qualité des données existe depuis plus de 30 ans «Cela m'énerve toujours un peu que l'on soit obligé d'aborder encore et encore le sujet de la qualité des données en géomatique. Depuis le temps qu'on en parle (en tous cas, c'est un marronnier journalistique aussi inépuisable que les régimes dans les magazines féminins)! Et pourtant, il y a toujours matière à réfléchir.» (Françoise de Blomac, 2010)
Qualité des cartes pas nouveau Les cartes ont toujours été inexactes Mercator, 1595
Mesurer la qualité pas nouveau Mesurer cette inexactitude a fait l objet de recherches depuis longtemps Carte 1765 Carte actuelle Vecteurs d erreur vs carte de l Ordnance Survey - UK (Ravenhill, 1974)
Qualité des données Premiers SIG La numérisation des cartes n a rien changé (au contraire) la qualité est devenu rapidement un problème Superposition de deux cartes: création de Production de statistiques ti ti 1503 nouveaux polygones M.F. Goodchild (1977) Statistical aspects of the polygon overlay problem
Données actuelles Données de qualité Les cartes d aujourd hui sont toujours Les cartes d aujourd hui sont toujours imparfaites (oui, même celles de l IGN!) ;-)
Au fait c est quoi la qualité? Deux définitions/visions différentes généralement reconnues: Qualité interne: Défini le niveau d adéquation entre une carte/bd et ce qu elle aurait dû être si elle était parfaite Qualité externe (ou «Fitness for use»): Défini le niveau d adéquation entre la carte/bd et les besoins de son utilisateur
Recherche en qualité de l information géographique Des conférences internationales International Symposium on Spatial Data Quality (ISSDQ) Accuracy Des projets nationaux/internationaux (NCGIA, GEOIDE, etc.) Des livres
Table ronde ISSDQ 2009 Conférence internationale ISSDQ 2009 (St. John s s, Canada) Réflexion sur les succès, échecs et défis dans le domaine de la qualité de l information géographique.
Solutions/Succès de la recherche
Solutions mesure des erreurs Modèles d incertitude pour: Objets bien définis: Points (e.g. ellipses d erreur) Lignes (e.g. ε-band, G-Band) Polygones x,y Shi (1998)
Solutions mesure erreurs Modèles d incertitude pour Objets vagues Théorie des ensembles flous Exemples d objets (régions) vagues (Dilo et al., 2007) Attributs Ex. matrice de confusion
Solutions mesure erreurs Modèles d incertitude pour MNT Modèles de propagation de l incertitude lors d analyses: Polygon overlay Buffer etc. Exemple de propagation de l incertitude pour le calcul de pente sur un MNT (Heuvelink 2002)
Succès normes qualité Définition de critères pour décrire la qualité d un dun jeu de données: Généalogie Précision/Exactitude spatiale Précision/Exactitude sémantique Précision/Exactitude temporelle Exhaustivité Cohérence logique Critères repris et modifiés pour des normes comme FGDC et ISO
Succès normes qualité CD-ROM pour professionels
Succès adoption des normes Adoption de la norme ISO 19113 par les agences cartographiques européennes (EuroGeographics, 2004)
Succès Qualité externe Un des succès est d avoir reconnu que la qualité va plus loin que les critères décrits dans les normes Devillers et Jeansoulin, 2005
Échecs/enjeux de la recherche
Échec Terminologie Les utilisateurs de SIG comme les experts n ont toujours pas de langage commun Précis Vague Flou Ambigu Exact
Échec (partiel) Métadonnées Métadonnées: Fardeau pour le producteur Généralement incomplètes, souvent manquante Surtout utiles pour la recherche de données Souvent incomprises par les utilisateurs typiques Difficile à trouver
Échec (partiel) Métadonnées Et quand trouvées, elles q, n aident pas forcément l utilisateur
Échec Impact de la recherche L impact de la recherche en qualité des données sur: Les chercheurs: Bien meilleure connaissance des problèmes et développement de nombreuses solutions Les producteurs de données et praticiens: Mise à disposition de méthodes pour mesurer et décrire la qualité des données Les utilisateurs lambda: amélioration de la qualité (interne) de jeux de données mais probablement pas grand chose d autre = Les trois groupes ont besoin de mieux communiquer! + - Impact
Échec complexité des solutions Shi (2009)
Échec faible impact sur les logiciels Mesure cette distance Précision = 1μm!!!
Perspectives de recherche
Perspectives Néogéographie
Perspectives Néogéographie
Perspectives Qualité externe Peu de travaux se sont intéressés à la mesure de la qualité externe Besoin de mieux comprendre les besoins des utilisateurs, le lien entre qualité interne et usage, etc. Vasseur et al. (2005)
Perspectives Nouvelles approches Besoin de penser à la qualité différemment Généalogie, précision spatiale, sémantique, temporelle, cohérence logique et exhaustivité
Conclusions On sait assez bien mesurer la qualité interne mais on ne sait pas trop qui utilise ces méthodes On sait bien documenter la qualité interne mais on ne sait pas trop à qui les métadonnées sont utiles On sait que la qualité (externe) est importante mais on ne sais pas vraiment comment la mesurer
Conclusions Donc en gros la qualité risque de faire débat encore longtemps!
Questions Rodolphe Devillers rdeville@mun.ca Pour plus de détails (mais dans la langue de Shakespeare): Pour plus de détails (mais dans la langue de Shakespeare): R. Devillers, A. Stein, Y. Bédard, N. Chrisman, P. Fisher and W. Shi (sous presse). 30 years of research on spatial data quality Achievements, failures and opportunities. Transactions in GIS.