Introduction Les techniques informatiques permettent de stocker et d accéder à des quantités sans cesse croissantes de données, disponibles en ligne ou via des centres documentaires fermés. Cette profusion compromet les capacités des utilisateurs à pouvoir explorer, organiser, comparer, et finalement comprendre ces données en un temps raisonnable. Ce phénomène est encore aggravé par le fait que la richesse et la complexité de ces données tendent également à s accroître. Par exemple, les bibliothèques en ligne disposent maintenant de la trace précise des accès à leur fonds qui, si elle était gardée, permettrait une analyse des usages mais nécessiterait une augmentation sensible des données stockées. Apparue voici une quinzaine d années, la visualisation de l information constitue l une des voies les plus prometteuses pour «produire du sens» dans l observation des masses de données. Comme le souligne Norman (1993), l utilisation d aides externes, en particulier visuelles, augmente considérablement la puissance cognitive de l esprit humain. Les représentations visuelles ont déjà depuis longtemps un rôle essentiel pour nous aider à comprendre des structures ou phénomènes complexes. Les schémas, diagrammes, formules mathématiques constituent des outils indispensables pour synthétiser l information et la présenter à un niveau d abstraction adéquat. Le principe de la visualisation d information est d utiliser la puissance de l outil informatique pour représenter efficacement, d un point de vue cognitif, des données abstraites qui n ont pas nécessairement des représentations physiques usuelles. Ces techniques, qui visent à amplifier la cognition via la perception, ont en particulier pour objectif de faciliter la découverte et la création d idées à partir de masses de données difficiles à appréhender de par la quantité ou la complexité de l information qu elles contiennent. De nombreuses techniques de visualisation de l information ont été proposées ces quinze dernières années comme en témoigne l ouvrage récapitulatif de Card et al. (1999). Parmi les méthodes qui intéressent plus spécifiquement le domaine des bibliothèques numériques, on peut citer : a) les techniques visant à offrir une vue globale de l espace d information, b) les techniques focus+contexte et les métaphores tridimensionnelles, c) Les représentations à niveau de granularité variable appelées multi-échelle. La première catégorie de techniques fournit des vues d ensemble destinées à faire émerger des structures ou des comportements significatifs, des singularités ou des ressemblances qui vont aider l utilisateur à trouver ce qui l intéresse dans la «masse» des informations disponibles. Les Treemaps (Johnson, Shneiderman, 1991), les ConeTrees (Robertson et al., 1991) ou les Starfield Displays (Ahlberg, Shneiderman, 1994) constituent des exemples typiques de ce type de méthodes (voir figure 1). Les techniques de cartographie sémantique (Kohonen, 2006) entrent également dans cette catégorie. Cependant, la plupart de ces techniques, lorsqu elles
8 DN 9/2006. Visualisation des documents sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu. Figure 1. Visualisation par Starfield Display (outil Spotfire) et par Treemap (site www.smartmoney.com) Figure 2. Représentations 3D : mur perspectif (Perspective Wall) et montagne de données (Data Mountain) Les représentations focus+contexte (Lamping, Rao et al., 1995 ; Carpendale, Montagnese, 2001) permettent de représenter le contexte d un point focal, c est-àdire les éléments qui entourent spatialement l objet d intérêt courant (ou qui lui sont liés par une relation donnée) sous une forme dégradée mais néanmoins informante. Ce sont donc des représentations à deux niveaux d échelle qui sont destinées à représenter les détails de quelques objets d intérêt tout en conservant les relations entre ces objets et leur environnement. Plusieurs d entre elles ont été développées pour faciliter la navigation interactive dans les espaces informationnels de grande taille afin d éviter le «syndrome de désorientation» de l utilisateur (Nielsen, 1990). Ce problème résulte souvent d une difficulté de spatialisation dans l espace informationnel due aux discontinuités de l affichage des vues de détails et des vues globales. Ces techniques, qui sont généralement basées sur techniques de déformation de l espace de représentation comportent de nombreuses variantes
Introduction 9 (vues «fish-eyes» (Carpendale, Montagnese, 2001), vues hyperboliques (Lamping et al., 1995), etc.). Un cas particulier est celui des métaphores tridimensionnelles où l effet de perspective résultant de la vision conique est utilisé comme principe de déformation comme le «Perspective Wall» (Mackinlay et al., 1991) ou les «Data Mountain» (Robertson et al., 1998) (voir figure 2). Les représentations à niveau de granularité variable (ou multi-échelle) représentent une alternative aux méthodes précédentes. Elles sont généralement basées sur le concept de zoom sémantique (Furnas, 1986 ; Bederson et al., 1996) ce qui signifie que la notion d échelle n est pas purement géométrique mais que les représentations et leur niveau de détail varient avec le niveau d échelle, comme le montre la figure 3 (Plénacoste et al., 2001). Ces techniques permettent de passer continûment d une vue globale à une vue détaillée et d établir ainsi un lien cognitif entre les détails et la vue d ensemble. Contrairement aux techniques précédentes qui sont basées sur une déformation de l espace de représentation, elles se basent sur le principe du multiplexage temporel et évitent ainsi des effets de distorsion qui peuvent s avérer gênants. Ces deux types de techniques peuvent éventuellement être combinées. Figure 3. Zoom sémantique sur une bibliothèque numérique représentée par une carte zoomable Ces trois catégories de techniques de visualisation peuvent bien entendu être hybridées pour croiser leurs avantages respectifs. De plus, l interaction et la navigation restent un défi majeur pour rendre ces techniques utilisables efficacement et simplement. Application au champ des bibliothèques numériques Comme le montrent plusieurs articles sélectionnés dans ce numéro, l application des techniques de visualisation de l information aux problématiques des bibliothèques numériques est un champ d investigation particulièrement prometteur. En offrant des solutions appropriées elles peuvent permettre ou faciliter : l accès et l organisation des catalogues, grâce à des interfaces adaptées ; l accès aux données multimédias, désormais disponibles dans les nouvelles bibliothèques numériques ;
10 DN 9/2006. Visualisation des documents l analyse de documents ou de collections de documents, via l utilisation de nouvelles méthodes, plus accessibles et plus visuelles ; la diffusion de l information, en permettant la prise en compte d annotations ou de relations intra- et inter-documents ; le partage de documents et la collaboration multi-utilisateur. Ce numéro présente cinq articles qui sont un instantané de la recherche française dans ce domaine. Les deux premiers articles décrivent une démarche visant à utiliser des visualisations interactives existantes pour valoriser des fonds, scientifiques dans le premier et historiques dans le second. Les deux articles suivants proposent de nouvelles visualisations visant à explorer des fonds complexes : des archives des l INA dans le premier cas et les fonds de la bibliothèque des Arts et Métiers dans le second. Enfin, le dernier article décrit une méthodologie d évaluation permettant de sélectionner une visualisation pour une tâche particulière. Cette problématique est très importante et nous pensons que sa mise en œuvre systématique facilitera l adoption de visualisations dans les interfaces d accès aux bibliothèques numériques. Nous espérons que la lecture de ce numéro sera utile aux organismes ayant des fonds documentaires importants et désireux d en faciliter la diffusion et la compréhension. Bibliographie Ahlberg, C., Shneiderman, B., «Visual information seeking: tight coupling of dynamic query filters with starfield displays», Proceedings of the SIGCHI conference on Human factors in computing systems: celebrating interdependence, Boston, Massachusetts, United States, ACM Press, 1994, p. 313-317. Bederson, B. B., Hollan, J., Perlin, K., Meyer, J., Bacon, D., Furnas, G., «Pad++: A Zoomable Graphical Sketchpad for Exploring Alternate Interface Physics», Journal of Visual Languages and Computing, vol. 7, 1996, p. 3-31. Card, S. K., Mackinlay, J. D., Shneiderman, B., Readings in Information Visualization, Morgan-Kaufmann Publishers Inc., 1999. Carpendale, M. S. T., Montagnese, C., «A framework for unifying presentation space», Proceedings of the 14th annual ACM symposium on User interface software and technology, Orlando, Florida, ACM Press, 2001, p. 61-70. Furnas, G., «Generalized fisheye views», Proceedings of CHI 86, Boston, MA, ACM Press, 1986, p. 16-23. Johnson, B., Shneiderman, B., «Tree-Maps: a space-filling approach to the visualization of hierarchical information structures», Proceedings of the 2nd conference on Visualization 91, San Diego, California, IEEE Computer Society Press, 1991, p. 284-291. Kohonen, T., Self-Organizing Maps. Berlin, Heidelberg, Springer, 2006.
Introduction 11 Lamping, J., Rao, R., Pirolli, P., «A focus+context technique based on hyperbolic geometry for visualizing large hierarchies», Proceedings of the SIGCHI conference on Human factors in computing systems, Denvers, Colorado, ACM Press, 1995, p. 401-408. Mackinlay, J. D., Robertson, G. G., Card, S. K., «The perspective wall: detail and context smoothly integrated», Proceedings of the SIGCHI conference on Human factors in computing systems: Reaching through technology, New Orleans, Louisiana, United States, ACM Press, 1991, p. 173-176. Nielsen, J., Hypertext and Hypermedia, Boston, MA, Academic Press, 1990. Norman, D. A., Things That Make Us Smart: Defending Human Attributes in the Age of the Machine, Addison Wesley Publishing Company, 1993. Plénacoste, P., Lecolinet, E., Pook, S., Dumas, C., Fekete, J.-D., «Bibliothèques : comparaisons entre le réel et le virtuel en 3D, 2D zoomable et 2D arborescent», Actes de la conférence franco-britannique IHM-HCI (Interaction Homme-Machine/Human Computer Interaction), Lille, 2001. Robertson, G., Czerwinski, M., Larson, K., Robbins, D. C., Thiel, D., Dantzich, M. v., «Data mountain: using spatial memory for document management», Proceedings of the 11th annual ACM symposium on User interface software and technology, San Francisco, California, United States, ACM Press, 1998, p. 153-162. Robertson, G. G., Mackinlay, J. D., Card, S. K., «Cone Trees: animated 3D visualizations of hierarchical information», Proceedings of the SIGCHI conference on Human factors in computing systems: Reaching through technology, New Orleans, Louisiana, United States, ACM Press, 1991, p. 189-194. Jean-Daniel Fekete INRIA Futurs Université Paris-Sud, Orsay Jean-Daniel.Fekete@inria.fr Eric Lecolinet GET/ENST, Paris Eric.Lecolinet@enst.fr