L Architecture Logicielle UMR pour les Interactions Multicanaux et Multimodales avec les e-services Vincent Chevrin, Alain Derycke, José Rouillard Laboratoire TRIGONE Université des Sciences et Technologies de Lille Cité Scientifique 59655 Villeneuve d Ascq Cedex - France v.chevrin@ed.univ-lille1.fr, alain.derycke@univ-lille1.fr, jose.rouillard@univ-lille1.fr Tél : 33/0 3 20 43 32 70 Fax : 33/0 3 20 43 32 79 RESUME Ce papier présente nos travaux sur la conception d une architecture générique supportant les interactions multicanaux et multimodales dans le contexte des e-services. Dans un premier temps, nous présentons le cadre de nos recherches et la genèse de ces travaux. Dans un second temps nous présentons nos premières investigations et la conception de l architecture utilisant des technologies multiagents. MOTS CLES : Interaction, Multicanaux, Multimodalité, Composition de services interactifs. Les logiciels utilisés pour écrire la soumission sont Microsoft Word 2002 SP2 et Adobe Acrobat 5.0 Cette soumission est pour la catégorie : Articles courts Les thèmes de la soumission sont : Ingénierie de l'interaction
L Architecture Logicielle UMR pour les Interactions Multicanaux et Multimodales avec les e-services Vincent Chevrin V.chevrin@ed.univ-lille1.fr Alain Derycke alain.derycke@univ-lille1.fr José Rouillard jose.rouillard@univ-lille1.fr RESUME Ce papier présente nos travaux sur la conception d une architecture générique supportant les interactions multicanaux et multimodales dans le contexte des e- Services. Dans un premier temps, nous présentons le cadre de nos recherches et la genèse de ces travaux. Dans un second temps nous présentons nos premières investigations et la conception de l architecture utilisant des technologies multiagents. MOTS CLES : Interaction, Multicanaux, Multimodalité, Composition de services interactifs. ABSTRACT This paper deals with the designing of a generic architecture which supports multi-channel interactions in the e-services context. In a first part we present the aim of this study and his framework. In the second part, we discuss about ours first investigations for the design of this architecture using multi-agents technologies. CATEGORIES AND SUBJECT DESCRIPTORS: H.5.2 [User Interfaces]: User interface management system (UIMS); H.5.3 [Group and Organization Interfaces]: Asynchronous interaction Web-based interaction. GENERAL TERMS: Design, Human Factors. KEYWORDS: Interaction, Multichannel, Multimodality, Composition of interactive services. INTRODUCTION L apparition de nouveaux périphériques (téléphones portables, PDA, etc.) ouvrent de nouvelle opportunités pour les professionnels du marketing. Outre les possibilités offertes par la mobilité des clients et prospects, la profusion de ces appareils nous amène à nous intéresser au concept d interfaces multicanaux. Nos récents travaux nous ont menés à l élaboration d un cadre théorique ayant pour objectif la caractérisation des interactions multicanaux [2], en fonction des tâches de l utilisateur et des dimensions communicationnelles et cognitives des canaux. Ces investigations théoriques nous apportent des bases solides à partir desquelles nous voulons établir une architecture logicielle générique capable de gérer ce type d interaction. De même nous voulons capitaliser, dans une nouvelle architecture, l expérience acquise dans le développement et l expérimentation des prototypes ad hoc combinant au sein d un même service interactif, destiné au marketing direct, des modalités d interaction de type Web et de type langagière via les technologies et les serveurs VoiceXML [8]. Il faut bien sûr noter qu il existe d ores et déjà des solutions commerciales gérant des interactions dites multimodales, comme par exemple la plate-forme Kirusa [5]. Cependant ce type de plate-forme met en jeu une «multimodalité» que nous pouvons qualifier de statique, c est-à-dire que le couplage et découplage de canaux sont figés dans l application. Nos besoins et notre cahier des charges sont assez différents pour justifier le développement d une nouvelle plate-forme. Nous allons montrer cela par la suite. La présente étude se place au centre d une collaboration avec le service de Recherche & Développement du Groupe 3 Suisses International. Grâce à cela, nous gardons un point de vue professionnel du marketing dans nos travaux de recherche. UNE ARCHITECTURE POUR LE PROJET UMR Une vue générale UMR signifie «Ubiquitous Marketing Relationships» afin de traduire le potentiel ouvert par l apparition de nouveaux canaux de communication, en particulier dans le domaine du sans fil. Nous avons montré que la complexité résidait notamment dans l existence d une quasi-infinité de couplages potentiels, de canaux et/ou de modalités [2]. Le projet UMR s appuie sur une architecture présentant quatre facettes pour l interfaçage avec son environnement (voir la Figure 1) : - Facette 1 MASI : qui correspond au support d un Modèle d Adaptation aux e-services Interactifs (nos noyaux fonctionnels). Il s agit d interagir avec les e- Services au travers d un protocole et d un langage permettant une abstraction unique quelque soit la nature du e-services. Ceci sera présenté plus précisément dans la suite du document ;
Figure 1 : Vue globale de l'architecture du projet UMR - Facette 2 MACMM : qui correspond au support d un Modèle d Adaptation aux Communications Multicanaux et Multimodales. Elle correspond à la gestion de la «couche présentation», sachant que c est une vision plus large que la Vue dans un patron de conception comme MVC. Cette facette, en cours de spécification et de développement, sera développée également dans ce document ; - Facette 3 MACI : le support d un Modèle d Adaptation aux Contextes Interactionnels : il s agit de collecter (directement via l utilisateur ou indirectement via l environnement) des connaissances sur les contextes d interactions de l utilisateur (par exemples les caractéristiques de ses plates-formes locales d interaction et leurs connectivités) ou ses préférences. Ces connaissances vont servir dans la prise de décisions lors de l analyse des requêtes faites par l utilisateur aux travers des canaux de communications, couplés ou non, et lors de la génération de l information qui lui sera présentée sur le canal ou les canaux adéquat(s). Cette facette est complexe et rejoint bien sûr les travaux en plasticité des IHM. Nous avons décidé de ne porter dans cette première phase qu un effort limité sur cette facette. - Facette 4 MAGRC : support à un Modèle d Adaptation à la Gestion de la Relation Client (GRC ou CRM en anglais). Il s agit d utiliser les connaissances marketing de la relation avec les clients, pour la gestion dynamique de l interaction. Cela nécessite un interfaçage avec des outils dits de CRM. Nous n avons pas abordé cette facette dans la première phase de notre étude. Néanmoins nous avons commencé des investigations sur les possibilités de couplages avec les agents humains qui sont eux-mêmes supervisés par la CRM (opérateurs de centres d appels téléphoniques, et opérateurs en charge des e-mails clients). Il existe une fonction centrale dans l architecture UMR qui est relative au contrôle et à la supervision de l ensemble. Cette fonction étant complexe, nous avons décidé, à ce stade de nos travaux, de la réaliser de manière ad hoc en nous contentant de faire la liaison entre les facettes 1 et 2. Cependant, à plus long terme, nous désirons formaliser ces problèmes de liaison et de coordination entre les facettes d une manière plus abstraite et indépendante par rapports aux services et canaux interfacés. Une approche modulaire et dynamique Dans Chevrin et al. [2], nous présentions un premier modèle d interaction multi-niveau, qui était une description en couches d une interaction Utilisateur/Organisation. Chacune de ces couches est utilisée spécifiquement selon la nature de l interaction et des connaissances construites sur l utilisateur et selon le contexte instantané de l interaction. De plus, leur ordre d exécution n est pas figé et il est régit lui aussi par les contraintes et la cohérence de l interaction. Pour permettre cette flexibilité il faut que l architecture supporte un agencement dynamique de «composants» de transformation de documents (circulant entre les e-services et les adaptateurs de canaux sous la forme de documents XML, transformés notamment via des parseurs XSL-T) et de composants d interfaçage et de coordination/supervision. Notre cahier des charges pour la plate-forme logicielle Notre cahier des charges devait respecter les contraintes suivantes : (1) Décomposition du système interactif, coté facette 1, en différents patterns de tâches identifiables. Notre but est de gérer la composition dynamique des services. Par composition nous entendons tant une composition logique, agrégation de services en des services composites, qu une composition temporelle : une coordination des flots de contrôles et de données. (2) Prise en compte des systèmes existants via des connecteurs logiciels souples en adoptant les standards de l ingénierie du Web (par exemple interface avec la E- CRM en Marketing Direct). (3) Multimodalité : couplage et synchronisation. Les couplages ne doivent pas être automatiques et figés, mais plutôt dynamiques et opportunistes. A terme nous souhaitons que les décisions de couplages et leurs comportements soient déduits de règles de productions faisant appel aux connaissances stockées (MACI et CRM) et à des heuristiques de conception. (4) Multicanaux et Multi plates-formes côté utilisateur. Il faut identifier les canaux possibles, exploiter les couplages intéressants, etc. Pour cela un premier modèle ontologique des canaux, reprenant notamment les propriétés présentés dans Chevrin et al. [2] est en cours d élaboration.
(5) Des hypothèses sur les réseaux intelligents du futur. Beaucoup de travaux sont menés dans ce domaine, notamment sur le concept de «Virtual Device» [11] pour caractériser la plate-forme utilisateur. Ces études ouvrent des perspectives intéressantes, en particulier en ce qui concerne les transformations des flux d interaction qui seraient faites directement au sein même des réseaux gérés par les opérateurs (ex : des passerelles internes, «adaptatives flowpath»). CONCEPTION DE L ARCHITECTURE UMR MASI : La composition de services en vue de l interaction Nous définissons un service interactif comme un groupe de tâches utilisateur formant un tout cohérent du point de vue de l utilisateur et du point de vue du marketing : les grandes fonctions de l entreprise dans sa relation avec le client. Il s agit par exemple d un service accueil client (authentification, message de bienvenue, etc.), du E- catalog (recherche interactive de produits), ou encore, d un service de Tracking répondant à la question «où en est ma commande»? etc. C est une vue partielle sur le back-office à visée interactive. A cette définition fonctionnelle, nous pouvons ajouter une définition non fonctionnelle : un service doit obéir au modèle d ingénierie des Web Services. En effet un service peut-être local (au fournisseur opérant la plateforme UMR) ou distant (opéré par un tiers dans le cadre de sa chaîne de valeur). Cela devient donc un e-service Interactif (E-Service dans la Figure 1). Cependant dans cette première phase nous considérons que les services seront pourvus d une sémantique connue à la conception, et qu ils devront communiquer d une manière abstraite mais connue avec le reste du système gérant l interaction, c est pourquoi, nous nous inspirons de travaux comme ceux de Nylander et al. [7] qui donnent une vue plus abstraite de cette communication entre les composantes de la plate-forme en charge de la gestion de l interaction (supervision du dialogue utilisateur et couche de présentation) et les différents e- Services (équivalent à des noyaux fonctionnels). Nous voulons pouvoir composer ces e-services, c est-àdire assurer le séquencement dynamique (séquencement, entrelacement ) d un ensemble cohérent de services pour un utilisateur donné, une session particulière et un historique de ses relations. Cela signifie qu il n y a pas d ordre a priori dans l orchestration des différents e- Services. Cet ordre sera déterminé à l exécution, notamment en fonction de la nature des canaux utilisés ou mobilisables (Web versus audiotel). Le mécanisme de composition est de plus tel qu un service peut être remplacé à la volée par un autre, équivalent, mais qui n a pas le même comportement interne : par exemple sur une tâche d identification qui peut être réalisée par reconnaissance vocale ou plus classiquement via un «login» et un mot de passe. Par ailleurs, il faut bien faire la différence entre les e- Services interactifs tels que nous les définissons, qui ont une orientation utilisateur, et les Web Services, proposés par le W3C. Cet aspect, qui n est pas l objet de cet article, est traité dans nos travaux [3]. MACMM : la fission et la fusion du flux d interaction en entrée et en sortie avec des grains temporels variables Les notions de multimodalité et de multicanal sont assez proches dans cette architecture UMR. Néanmoins, l étude de ces deux termes n entre pas dans le cadre de cette contribution. Ce que nous cherchons à introduire ici, ce sont les notions de fusion et de fission des données. Imaginons une situation dans laquelle un client fait du shopping sur le web, il remplit son «panier» et lorsqu il a terminé, il se déconnecte. Quelques heures plus tard, il décide de valider et de payer cette commande. Pour cela, il souhaite entrer en contact avec un interlocuteur «humain» représentant l organisation. Il commence par s identifier, c est-à-dire, par exemple, en donnant son numéro de client et son code postal. L opératrice a alors les informations nécessaires pour poursuivre l interaction qui a débutée quelques heures auparavant. Les données concernant ce client doivent donc être «fusionnées», et cela est possible grâce à la gestion de la continuité de l interaction quel que soit le canal de communication utilisé. Si l on se base sur les travaux de Jean Caelen [1], la notion de fusion de données intervient également, mais sous une définition quelque peu différente. Dans notre architecture, cela arrive lorsque la multimodalité employée est de type synergique (ou composée) [1]. C est le cas par exemple d un client qui prononce au téléphone «je veux cette chemise, en taille 38», et qui parallèlement, sur la page Web du catalogue, clique sur l article souhaité. La fusion et la synchronisation des informations doivent être effectuées par le système pour donner du sens à l interaction de l utilisateur. Il faut donc bien faire la différence entre fusion «de sessions» et fusion à l interaction. D un côté, on a un grain très épais, le couplage des canaux n est pas forcément synchrone et l interaction peut se dérouler dans un grand laps de temps (un jour, une semaine, un mois ), et de l autre, on a un grain très fin, la fusion se déroule donc sur un laps de temps très court, la coordination rapide des canaux est alors essentielle pour que l interaction ait un sens. Au même titre que la fusion, la fission de données sera employée, à terme, pour diffuser des informations (redondantes ou combinées) à l utilisateur via de multiples canaux. La fission interviendra alors pour «dupliquer» des contenus sémantiques sur les différents canaux utilisés (diffusion des informations vers le client via plusieurs canaux, appel téléphonique pour l un, message SMS pour un autre, Email pour un troisième, etc.). Pour gérer fusion et fission de données, nous devons mettre en place des «opérateurs» spécifiques. Nous allons en ce sens en nous basant sur des travaux comme
ceux de Moran et al. [6] qui tentent de résoudre ces problèmes à l aide d agents. Enfin, la présentation des données devra être adaptée aux périphérique(s) utilisé(s) (contraintes physiques, réseaux d accès, etc.). Nos récents travaux [9] vont en ce sens. UTILISATION D UN SYSTEME MULTIAGENTS (SMA) POUR NOTRE ARCHITECTURE LOGICIELLE Bien que notre choix aurait pu se porter sur d autres types de solutions technologiques, nos investigations nous poussent à croire que les SMA sont une solution adaptée à nos besoins et aux contraintes que nous pouvons synthétiser dans les points suivants : (1) les agents peuvent encapsuler les connaissances et les traitements ou compétences des composants décrits dans l approche modulaire ; (2) la capacité de ces SMA à gérer des interactions multimodales a déjà été mise en évidence par des travaux passés de Moran et al. [6] ; (3) la dynamicité est obtenue d une part par le comportement proactif des agents et d autre part par la possibilité de créer des réseaux d agents après négociation et recherche d accointances ; (4) le potentiel de tels systèmes à supporter un grand nombre de sessions personnalisées simultanées et toutes différentes (chaque utilisateur est alors représenté par une collection d agents instanciée à la demande) ; (5) le potentiel de ces systèmes pour assurer une personnalisation automatique des informations, par exemple en fonction de son appartenance à un groupe de comportements identifiés (le filtrage collaboratif) ; (6) la possibilité de faire migrer du code côté client, via la mobilité des agents logiciels, afin le cas échéant de gérer la coordination des canaux et modalités au niveau même de la plate-forme présente chez l utilisateur (PC, PDA, téléphone mobile ). (7) Nous pouvons par ailleurs noter l intérêt pour les SMA dans des domaines comme le E-commerce afin d assurer des tâches distribuées et nécessitant des protocoles de négociation entre partenaires affiliés. En ce qui concerne le choix de la plate-forme technologique multiagents, notre choix s est porté sur la plate-forme Jade [4] pour plusieurs raisons : c est une plate-forme technologique pour SMA récente, compatible avec les dimensions JAVA et ingénierie du WEB via les Servlets, elle est supportée par des groupes industriels, dont des opérateurs de télécommunications, sa compatibilité avec des OS de téléphone et la J2ME, et enfin elle adhère à des standards de communication entre agents et SMA de type FIPA. CONCLUSION Dans cette contribution nous donnons nos premières investigations et recherches au niveau d une architecture générique supportant les interactions multicanal. Nous sommes actuellement en train de spécifier le rôle de chaque catégorie d agents et d implémenter le couplage de ces agents fournis par JADE avec quelques e-services expérimentaux et quelques canaux de communications. A court terme, nous désirons implémenter un démonstrateur basé sur cette architecture. REMERCIEMENTS Les auteurs tiennent à remercier Yves Bayart, Directeur de la Recherche et Développement du Groupe 3 Suisses International, et la Cité Numérique, ainsi que le groupe NIPO (Nouvelles Interactions Personnes/Organisations) et la Région Nord Pas de Calais pour leur soutien dans ces travaux de recherche. Ces travaux de conception et de réalisation d une plate-forme fondée sur JADE se déroulent actuellement en collaboration avec l équipe SMAC du laboratoire LIFL. Enfin, un bon travail de développement a été effectué par Nicolas Agache et Matthieu Ribaucourt, étudiants en DESS MICE. BIBLIOGRAPHIE 1. Caelen Jean. 10 ans de recherches en multimodalité(s). Colloque sur les Interfaces Multimodales - 09/10 Mai 2000. IRIT. Toulouse. 2. Chevrin Vincent, Derycke Alain, Rouillard José, Un Cadre Théorique pour la Caractérisation des Interactions Multicanal en E-Marketing, IHM 2003, Caen, 2003. pp. 97-104. 3. Chevrin Vincent, Derycke Alain, Rouillard José, Some Issues for the Modelling of Interactive E-Services from the Customer Multi-Channel Interaction Perspectives. Soumis à ICEC04, Workshop on Modeling E-services. Delft University of Technology. October 2004. 7 pages. 4. JADE : http://jade.tilab.com 5. Kirusa : http://www.kirusa.com/news_press_jul17_02.php. 6. Moran, D. et Al. Multimodal User Interfaces in The Open Agents Architecture. Proceedings IUI 97 ACM conference, Orlando, Florida, 8p. 7. Nylander Stina, Bylund Markus and Waern Annika. The Ubiquitous Interactor - Device Independent Access to Mobile Services. Proceedings of CADUI 2004. 8. Rouillard José et Derycke Alain. La Personnalisation de l'interaction dans des Contextes Multimodaux et Multicanaux : une Première Approche pour le Commerce Electronique, IHM 2002, Poitiers, 2002, pp. 97-104. 9. Rouillard, José, HCI 2003, Plastic ML and its toolkit, Heraklion, Crete, Greece, 2003. 10. Van Der Aalst. Don t go with the flow : Web services exposed. IEEE Intelligent Systems, 18 (1), 2003, pp 72,76. 11. Van Thanh, Do. Vanem Erik, Tran, Dao van &Tore E. Jønvik: Extending the "Always-on" concept to heterogeneous devices, Proceedings of the 14th International Symposium on Services and Local access (ISSLS 2002), Seoul, Korea, April 14-17 2002.