LA GESTION DES COURRIERS ELECTRONIQUES ENTRANTS :



Documents pareils
Cognit Ive Cas d utilisation

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

Plateforme STAR CLM. Gestion intégrée des réseaux multilingues d entreprise

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

Fourniture d un outil de gestion du courrier électronique pour les sites internet de la Documentation Française

QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.

GÉREZ VOTRE RELATION CLIENT SANS QUITTER MICRO SOFT OUTLOOK

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Le Contacteur Hyperphone. Solution communicante plurimédia, téléphonie, SMS, fax, , courrier. Contacter mieux, plus vite, moins cher

Votre expert en flux documentaires et logistiques. Prestations audit/conseils

Livret de Stages 2014 / 2015

CRM Service. Exemples de secteurs concernés. Fonctionnalités clés. Gestion de l activité quotidienne. Gestion complète de la force de vente

Avril 2013 DIAGNOSTIC NUMERIQUE. Réalisé par l Office de Tourisme Andernos-les-Bains

Marier Internet et Centre d appels. Opportunité du Centre de Relation Client

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Les Ateliers Info Tonic

Génie Logiciel LA QUALITE 1/5 LA QUALITE 3/5 LA QUALITE 2/5 LA QUALITE 4/5 LA QUALITE 5/5

Votre infrastructure est-elle? La collaboration informatique. améliore la performance globale

RESPONSABLE DU DEVELOPPEMENT COMMERCIAL IMPORT EXPORT

Conseil et Ingénierie des Systèmes d Information d Entreprise

Les ressources numériques

«Outils de gestion pour TPE CRM / ERP» Club

L externalisation de vos logiciels entreprises : une solution aux problèmes de coûts, de sécurités et de réactivités

GESTION DE PROJET. - Tél : N enregistrement formation :

Les Enjeux du Référencement de Sites Internet. Un livre blanc réalisé par Benchmark Group pour Netbooster

SOCIAL CRM: DE LA PAROLE À L ACTION

DÉMATÉRIALISATION DES DOCUMENTS ET AUTOMATISATION DES PROCESSUS UN PREMIER PAS VERS LA BANQUE SANS PAPIER

LES REFERENTIELS DES TROIS BACCALAUREATS PROFESSIONNELS DU TERTIAIRE COMMERCIAL VENTE COMMERCE SERVICES

La Renaissance de L ing à la Performance

Gagner en performance avec un extranet. et mener son projet extranet?

BUSINESS INTELLIGENCE

GEDEXPERT. La Gestion Electronique de Documents des PME PMI. VOTRE NOUVEL ASSISTANT pour. Pour partager l information au sein de l entreprise

Les compétences clés en 2015 La révolution du Big Data souffle sur les métiers du commerce et du marketing

MICROSOFT DYNAMICS CRM & O Val

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Solution. collaborative. de vos relations clients.

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

QU EST-CE QUE LE DECISIONNEL?

DEMANDE D INFORMATION RFI (Request for information)

Activité : Élaboration, mise en forme et renseignement de documents

La présentation qui suit respecte la charte graphique de l entreprise GMF

Baccalauréat professionnel vente (prospection - négociation - suivi de clientèle) RÉFÉRENTIEL DE CERTIFICATION

L Edition Pilotée XL

REALISATION D UN OUTIL D EVALUATION DE LA FORMATION INFORMATION-COMMUNICATION DE L IUT DE CAEN

Les 10 étapes incontournables pour réaliser un site internet performant et accessible

Les clients puissance cube

Associer la puissance des nouvelles technologies tout en préservant l environnement

Portail collaboratif Intranet documentaire Dématérialisation de processus

GEDEXPERT. La Gestion Electronique de Documents spécialement conçue pour les Experts Comptables VOTRE NOUVEL ASSISTANT POUR

Introduction. Les articles de la presse spécialisée tendent à nous laisser penser que c est en effet le cas :

Activités. Boîte à idées pour remplir la fiche de poste * Direction. Animation d équipe et organisation du travail. Conduite de projets

MANAGEMENT PAR LA QUALITE ET TIC

PICRIS. Le progiciel des métiers de la Retraite, de la Santé, de la Prévoyance et du Social

catégorie - développement rh

MANAGEMENT PAR LA QUALITE ET TIC

Solutions mobiles MOBILE TO STORE GEOLOCALISATION & COUPONING! MOBILE SOLUTIONS

QUI SOMMES NOUS? Notre équipe se tient à votre disposition pour vous apporter de plus amples informations et vous conseiller.

BusinessHIGHLIGHT GESTION DE LA PRESSION COMMERCIALE. Optimiser ET SI C ÉTAIT UN PROBLÈME D ORGANISATION? n /... SOMMAIRE INTRODUCTION

«Les documents référencés ci-dessus étant protégés par les droits d auteur et soumis à la déclaration au Centre Français d exploitation du droit de

CAHIER DES CHARGES CREATION / AMELIORATION SITE INTERNET

Groupe Eyrolles, 2004 ISBN :

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION

Vue d'ensemble de la formation

La solution pour gérer vos connaissances techniques et scientifiques

De la production collaborative à la capitalisation des connaissances Le rôle des documentalistes

La dématérialisation : un incontournable pour le succès de votre entreprise.

SIMPLIFIEZ-VOUS LE FAX GRÂCE AU CLOUD

Les tendances de la dématérialisation et les besoins des Entreprises

Mesurer le succès Service Desk Guide d évaluation pour les moyennes entreprises :

L USAGE DES NEWSLETTERS BtoB. Enquête exclusive Niouzeo Septembre 2011

Solution de fax en mode Cloud

Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.

Février Novanet-IS. Suite progicielle WEB pour l Assurance. Description fonctionnelle

solution technologique globale qui couvre en

Tous les outils de prospection disponibles avec le logiciel PIKADELLI MARKETING

Gestion d événements et modulation dynamique de choix sous Sphinx par calcul de contraintes en temps réel.

Messagerie & Groupeware. augmentez l expertise de votre capital humain

LES OUTILS DU TRAVAIL COLLABORATIF

Design. Search. Cloud AMOA ECM. Intégration. IT Solutions. Formation. Développement. Mobilité. Open source. Infogérance. Ergonomie

Chapitre 9 : Informatique décisionnelle

Campagne de Communication Prévisionnelle. Web Intelligence & Réputation Internet

WF MEDIA.INFO ET N OUBLIONS PAS QU UNE COMMUNICATION RÉUSSIE, C EST AVANT TOUT UN IMPACT MESURABLE ET

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

S8 - INFORMATIQUE COMMERCIALE

Solution. collaborative. de vos relations clients.

«L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?»

Création d un portail intranet collaboratif sous Microsoft Office SharePoint Server 2007.

A1 GESTION DE LA RELATION AVEC LA CLIENTELE

PRÉVENIR ET DIMINUER VOS RISQUES ANTICIPATE AND REDUCE YOUR RISKS

Ce site intègre des technologies et fonctionnalités à la fois simples et très innovantes pour offrir une interface pratique et performante.

SIMULER ET CONCEVOIR LE TRAVAIL FUTUR

Marketing comportemental. Guide méthodologique de mise en œuvre

Gestion de l activité commerciale

Postes à pourvoir 2015

Étude «analyse, reporting et budget» Niveau d équipement et attentes des PME françaises.

Guide d accompagnement. Document réalisé par Softcomputing et Microsoft France.

Introduction 3. GIMI Gestion des demandes d intervention 5

ISTEX, vers des services innovants d accès à la connaissance

La Business Intelligence & le monde des assurances

Transcription:

LA GESTION DES COURRIERS ELECTRONIQUES ENTRANTS : CARTOGRAPHIE DES OUTILS DE TEXT MINING ET ETUDE D UN FOND DOCUMENTAIRE AVEC LE LOGICIEL TROPES ZOOM Rapport de stage effectué à DOCUMENT PROJECT, Cabinet de conseil en Ingénierie Documentaire, Du 02 avril au 30 septembre 2003 Responsable de stage à DOCUMENT PROJECT : M. Jacques ROBIN Maître de stage à l université : Rapport de stage présentée M. Christian LAUTIER par Delphine DUPAIN DESS Traitement et Valorisation de l Information Textuelle Année académique 2002-2003

SOMMAIRE REMERCIEMENTS...3 INTRODUCTION...4 PREMIERE PARTIE...6 1.PRÉSENTATION DE DOCUMENT PROJECT...7 1.1.Son positionnement...7 1.2.Son expérience...8 1.3.Sa stratégie...10 1.4.Son organisation...10 2.MES MISSIONS AU SEIN DU CABINET...11 1.1.Une mission de consultante en Text Mining : conseil & cartographie...12 1.2.Une fonction d analyste de corpus de courriers électroniques entrants...13 DEUXIEME PARTIE...15 1.LE DÉVELOPPEMENT DE L ACTIVITÉ DE TEXT MINING...16 2.PROSPECTION DU MARCHÉ DU TRAITEMENT AUTOMATISÉ DE COURRIERS ÉLECTRONIQUES ENTRANTS...19 2.1.Le périmètre : détection des outils de Text Mining...20 2.2.Les sources...22 2.3.Définition des solutions...23 3.RÉSULTATS DE LA CARTOGRAPHIE...30 TROISIEME PARTIE...45 1.CONTEXTE CANAL+...46 2.MÉTHODOLOGIE...47 2.1.Démarche globale de la mission...49 2.2.Démarche spécifique CANAL+...49 3.ANALYSE DU CORPUS DE MAILS ENTRANTS...49 3.1.Identification des thèmes rencontrés...51 3.2.Analyse du thème (classe centrale) «abonnement»...52 3.3.Analyse du thème «résiliation»...53 3.4.Conclusion...53 CONCLUSION...56 REFERENCES BILIOGRAPHIQUES...58 ANNEXES...62 2

REMERCIEMENTS Je remercie Monsieur Jacques ROBIN pour les excellentes conditions de travail qu il m a offertes, pour son accueil chaleureux au sein de l équipe, ainsi que pour la confiance qu il m a témoignée tout au long de mon stage. Ma reconnaissance va tout particulièrement à M. Christian LAUTIER, qui m a fait profiter de ses remarques critiques et de ses suggestions, en tant que professionnel de l édition de logiciels de solutions de Text Mining (TEMIS). Merci enfin à Mohamed MTIBAA, stagiaire également à DOCUMENT PROJECT, pour sa sympathie et ses nombreux conseils dans la réalisation de certains documents de la cartographie, ainsi que pour m avoir fait part de sa connaissance fonctionnelle en gestion de projet dans le domaine de l éditique et de la GED. 3

«Loin d être dépassé, le texte est devant nous. Même agrémenté d images ou de musique, il ne se réduit évidemment pas à une suite de sons ou de caractères, mais demeure la dimension essentielle de la culture et de sa transmission» F. Rastier Arts et Sciences du texte puf. INTRODUCTION Le stage que j ai effectué à DOCUMENT PROJECT, cabinet de conseil stratégique positionné sur le marché de l Ingénierie Documentaire, m a permis de travailler sur la méthodologie et le contenu des études documentaires appliquées à la gestion des courriers électroniques dans l entreprise. L objectif était de mettre en place une étude pour proposer des solutions qui permettent aux entreprises de mieux traiter le flux de l information en provenance de leurs messageries électroniques, et d en analyser, a posteriori, le contenu pour alimenter les bases de connaissance et identifier les attentes clients. Cette étude devait être précédée, d un audit documentaire qui permettait, grâce à l analyse d un corpus d un échantillon de mails entrants de l entreprise intéressée, de déterminer la cohérence économique du projet et la pertinence de l étude. L audit documentaire s appuie sur la cartographie des solutions d analyse de contenu de grands ensembles textuels (Text Mining), réalisée pendant mon stage, et sur l analyse des données textuelles d un corpus de mails entrants effectuée avec l aide de l outil d analyse sémantique Tropes Zoom d ACETIC. L analyse de l échantillon de mails doit conditionner ensuite le choix des préconisations qui sont faites quant à l organisation, la technologie et l étude des retours sur investissement possibles de solutions de traitement de mails entrants. La montée en puissance des réseaux (Internet, Intranet, Extranet) modifie en profondeur l ensemble du processus de veille technologique, commerciale ou concurrentielle. Dans ce contexte, disposer d un environnement capable d extraire l information pertinente de ces gisements et de la «mettre en scène» pour la rendre facilement accessible à tous, constitue une évolution majeure du système d information de l entreprise. Ce rapport a donc pour objet de faire un point sur les technologies présentes sur le marché, avec l exemple du projet CANAL+ qui illustre un courant majeur incluant analyse statistique, analyse linguistique, cartographie d information et suivi dynamique de l information. Afin de vous éclairer sur les missions qui m ont été attribuées, j ai pensé nécessaire dans un premier temps de vous exposer le contexte dans lequel j ai pu accomplir mon stage. Ainsi, vous découvrirez la présentation de ma structure d accueil DOCUMENT PROJECT, et de mes fonctions au sein même de celle-ci. 4

Ensuite, dans les deux autres grandes parties de mon rapport, j ai souhaité décrire les différentes phases qui ont constitué mes différentes missions : la conception d une cartographie sur les outils de traitement des mails entrants et, le maniement de l outil d analyse sémantique Tropes Zoom. Enfin avant d amorcer mon rapport, je tiens à souligner que j ai pu mettre en pratique la plupart de mes connaissances personnelles dans le traitement des données textuelles, ainsi que celles acquises au cours de mon DESS. 5

PREMIERE PARTIE Présentation Générale 6

1. Présentation de DOCUMENT PROJECT 51, rue de Verdun 92158 SURESNES CEDEX Tel. : 01.46.97.25.44 Fax : 01.46.97.20.10 Contact : Jacques ROBIN 06.09.05.26.83 jrobin@documentproject.fr DOCUMENT PROJECT est un cabinet de conseil stratégique positionné sur le marché de l Ingénierie Documentaire, et qui présente une totale indépendance par rapport aux différents acteurs du marché (éditeurs, intégrateurs, prestataires). Son rôle est d aider et d accompagner ses clients vers la solution d organisation et la technologie la mieux adaptée à ses besoins, afin qu ils utilisent le document comme un réel levier d optimisation de leur relation client et au-delà. DOCUMENT PROJECT intervient en assistance à maîtrise d ouvrage et assistance à maîtrise d œuvre pour des missions modulaires couvrant les projets, de l analyse de l existant jusqu au déploiement de l organisation cible et au suivi des performances. Sous le terme «d Ingénierie Documentaire» se trouve regroupées toutes les technologies qui permettent de concevoir, analyser, structurer, éditer, archiver, distribuer, classer et rechercher l ensemble des documents électroniques ou papiers émis et reçu entre une entreprise et son client. On peut retrouver ces différentes activités dans les termes génériques comme EDITIQUE, GED, GEIDE, TEXT MINING, 1.1.Son positionnement La relation client est devenue un axe de réflexion stratégique pour les entreprises et le document représente le support de référence pour communiquer une information commerciale qui devient de plus en plus personnalisée. Le nombre de document augmente au rythme de la croissance des 7

données gérées dans les systèmes d informations : 80% de l information circulant en entreprise se trouve dans des documents. DOCUMENT PROJECT propose à ses clients (grands comptes) une expertise métier extérieure nécessaire pour optimiser des processus documentaires qui deviennent dans le contexte actuel, générateurs d une réelle valeur ajoutée pour les entreprises. L offre que propose DOCUMENT PROJECT est découpée en trois domaines : TEXT MINING : c est une expertise qui est proposée aux clients pour l étude et la définition des moyens techniques et organisationnels qui leur permettront d analyser des corpus documentaires de type mails entrants ou fond de courriers existants. EDITIQUE : c est une expertise qui est proposée pour l étude et la définition de chaîne de composition et de production de documents dont la distribution peut s effectuer en mode physique (postale) ou en mode électronique. GED : l expertise proposée permet de définir après l étude des besoins, l organisation et les moyens logiciels et matériels les mieux adaptés à une entreprise pour qu elle assure l archivage électronique et le partage des documents mis et reçus sur les différents canaux : papier, fax, mail. 1.2.Son expérience DOCUMENT PROJECT apporte son expérience dans trois secteurs d activité : Dans le secteur Banque Etude et définition d une chaîne de composition de documents en prenant en compte les besoins stratégiques de la Direction du Marketing et de la Communication afin de proposer une architecture fonctionnelle et technique en collaboration avec la Maîtrise d Ouvrage et la Direction Informatique. Analyse et définition du R.O.I pour présentation et validation par la Direction Générale Réalisation du cahier des charges et de l appel d offres destinés aux intégrateurs après définition restreinte d un choix de logiciels Assistance au dépouillement, au choix et à la négociation commerciale avec la Direction des Achats Accompagnement sur le déploiement jusqu à la mise en exploitation de l application pilote (relevé de compte) Résultats : Un relevé de compte avec une gestion dynamique des messages et des tableaux Une réactivité accrue pour toute modification Une architecture éditique pérenne et évolutive Un retour sur investissement concret en terme de regroupement d envois Dans le secteur Autoroutier 8

Etude d opportunités visant à dématérialiser la gestion des échanges avec les clients : flux entrants et sortants Définition de schéma cible Analyse et mesure d impacts : estimation budgétaire haute et basse pour la mise en œuvre et la reprise de l existant Réalisation du cahier des charges pour la mise en place d une solution complète de GED couvrant les courriers papiers, les mails et les fax entrants, les courriers bureautiques sortants issus du poste de travail et les courriers automatiques issus du site central (factures, relances, ) Rédaction d un cahier des charges pour l appel d offres européens destinés à la fourniture d une solution complète de GED (logiciel, matériel, service d intégration et de composition des courriers) Assistance au dépouillement de l appel d offres et de constitution du dossier de synthèse Assistance au déploiement de la solution en accompagnement du service clientèle Résultats : La consultation à distance de dossiers électroniques clients par les centres d accueil La maîtrise du contenu et de la forme des courriers sortants Une réactivité active pour le traitement des contacts clients La libération de surface par la dématérialisation des archives papiers Dans le secteur de la communication Etude des procédures de traitement des courriers électroniques entrants Cartographie des acteurs dans le domaine des solutions de traitement automatisé de courriers électroniques entrants Analyse d impacts fonctionnels, techniques et financiers à partir de trois scénarios de solutions Analyse d un échantillon de mails entrants, de réponses à ces mails et des réponses en ligne sur le client Définition d un plan d actions visant à automatiser les réponses en ligne, réduire le nombre de mails entrants au contenu récurrent, automatiser le dispatching vers les opérateurs spécialisés par thème, et remonter des indicateurs sur la qualité de la relation client Résultats : La réduction de courriers électroniques entrants Mise en place de réponses en ligne couvrant 80 % des demandes Un retour sur investissement concret par la réduction des coûts de traitements (de l ordre de six mois) Une qualité de réponse optimisée (reconnue et récompensée par Qualiweb) 9

1.3.Sa stratégie L évolution de la Relation Client engage les entreprises vers une réflexion qui porte aussi bien sur leur système d informations marketing, à travers les solutions CRM existantes, que sur la logistique à mettre en place pour exploiter de façon optimale les informations de leur système. Dans ce contexte, les services techniques des entreprises prennent souvent en charge, à la demande de la Maîtrise d ouvrage, des projets de refonte de chaînes de gestion documentaire sans bénéficier d une définition précise et structurée des besoins ni d une expertise des solutions du marché dans ce domaine. (architecture, logiciel, matériel, prestataire). Un projet de refonte de chaîne de gestion documentaires implique les points suivants : interface d alimentation des données, composition des documents en mode interactif, transactionnel, et centralisé, gestion de messages, ordonnancement de tâches éditiques, tri, regroupement, éclatement, rétention, préparation postale, distribution électronique, archivage électronique, Gestion Electronique de Documents, Lecture Automatique de Documents Tous ces points étant structurants dans l implémentation fonctionnelle et technique de la solution, il est important de posséder préalablement une vision globale et stratégique de l approche de l entreprise sur la relation client pour définir un plan de déploiement pragmatique en phase avec les contraintes budgétaires et propice à des retours sur investissement rapides. 1.4.Son organisation Actuellement le cabinet est constitué de trois personnes, mais doit s agrandir dans le futur, lors de mon stage un nouveau stagiaire a été intégré à l équipe formée alors de Jacques ROBIN et de moimême. Jacques ROBIN a créé DOCUMENT PROJECT après une avoir acquis une expérience de 14 ans en SSII éditique et GED à des postes de Direction Technico-Commerciale et une expérience de 3 ans de consultant indépendant dans le domaine de l éditique et de la GED. Cette expérience lui a permis d appréhender les différents processus de traitement du document dans les environnements hétérogènes, et d acquérir une bonne connaissance des métiers clients dans le domaine de la finance (banque, assurance vie, crédit, affacturage), des télécoms, (téléphonie, Internet), de l industrie (automobile) et de la prévoyance (caisse de retraite, mutuelle). Une expérience en cabinet conseil à un poste de directeur associé lui a permis d acquérir la méthodologie de conduite de projet afin de l appliquer au domaine de la gestion documentaire. Jacques ROBIN est intervenu en qualité de consultant, dans des projets de mise en place et de refonte de chaînes documentaires pour les clients suivants : 10

CANAL+ ODDO PINATTON PRESSE INFORMATIQUE NATEXIS BANQUE POPULAIRE BANQUE FEDERALE DES BANQUES POPULAIRES SOCIETE DES AUTOROUTES PARIS-NORMANDIE BRED CNP Assurances L objectif de DOCUMENT PROJECT est de fédérer un réseau de consultants salariés en libérant les énergies personnelles au profit de ses clients et en conférant à ses consultants une autonomie pour assurer leurs missions tout en garantissant le respect rigoureux d une déontologie. Cette déontologie conditionne l indépendance des préconisations effectuées par rapport aux acteurs du marché (prestataire, éditeur, intégrateur, constructeur). Ce point est capital pour répondre aux attentes du marché et garantir l adéquation des solutions proposées avec l analyse des besoins. A ce jour DOCUMENT PROJECT a donc intégré deux consultants supplémentaires pour assurer le développement de ses compétences : Mohamed MTIBAA : a rejoins DOCUMENT PROJECT pour apporter sa connaissance fonctionnelle en gestion de projet dans le domaine de l éditique et de la GED, après une double spécialisation finance systèmes d information concrétisée par l obtention d un MBA ESSEC. Cette formation a été complétée d une première expérience en maîtrise d ouvrage au sein du groupe ODDO PINATTON, où il est intervenu sur un projet migration d un fond de courriers existants. Delphine DUPAIN : j ai rejoins DOCUMENT PROJECT afin de développer l activité de Text Mining appliquée à l analyse textuelle de contenus. Cette expertise acquise au cours de mon DESS (TraValTex) sur le traitement et la valorisation de l information textuelle m a permis aujourd hui d analyser des corpus de courriers électroniques afin d en extraire, grâce à des logiciels d analyse sémantique, le sens et le contenu. Cette analyse conditionne ensuite le choix des préconisations qui sont faites quant à l organisation, la technologie et l étude des retours sur investissement possibles de solutions de traitements de mails entrants. La volonté de DOCUMENT PROJECT est donc de proposer des interventions de consultants spécialisés dans le domaine de la gestion documentaire. 2. Mes missions au sein du cabinet L évolution de la relation Client incite les entreprises vers une réflexion qui porte d une part sur leur système d information marketing, par le biais des solutions CRM existantes et, d autre part sur la logistique à mettre en place pour exploiter de façon optimale les informations de leur système. Mes missions s inscrivent donc dans ce contexte et dans celui de l avènement de nouvelles technologies liées à Internet à travers la gestion documentaire des contenus et des flux de messages électroniques. Au début du mois de mars 2003, M. Jacques ROBIN, consultant indépendant dans le domaine de l éditique et de la GED à Paris, m a sollicité pour un entretien qui a eu lieu à la Tour Montparnasse. 11

Cet entretien avait pour but de me présenter la société DOCUMENT PROJECT et la mission sur laquelle j aurais peut-être à intervenir. Cette mission que m a proposée M. ROBIN reposait principalement sur le fait de réaliser des études de fonds documentaires avec l aide d un outil d analyse sémantique (Tropes), tout en ayant comme objectif de mettre en place une démarche d audit documentaire des messages électroniques. Celle-ci permettrait d appréhender la pertinence d une technologie d analyse sémantique sur un échantillon représentatif, après avoir défini préalablement les attentes fonctionnelles des utilisateurs. 1.1.Une mission de consultante en Text Mining : conseil & cartographie Associée à l activité de conseil du cabinet, dans l assistance à Maîtrise d Ouvrage, ma mission a été de mobiliser mes compétences techniques et mes références «théoriques» acquises plus particulièrement lors de mon DESS : l acquisition (retrouver l information recherchée), le traitement et l analyse (dégagement de tendances thématiques ou émergence de «signaux faibles») et la rediffusion de l information (routage, alimentation d une Base de données, etc.). L objectif du cabinet et, par la même occasion de ma mission, a été de contribuer à transformer une masse d information disponible en synthèse utile à l entreprise. Je partageais un bureau avec M. ROBIN et Mohamed MTIIBA avec à ma disposition un accès à une connexion ADSL. Ce bureau se trouve à l A.D.E.S. (Association pour le Développement Economique de Suresnes), une structure au service du développement économique, qui à cet effet : a mis en place une pépinière qui accueille les entreprises nouvelles qui ont moins de 2 ans, dispose d un site Internet qui a pour vocation de rendre des services concrets aux entreprises de Suresnes, de favoriser l emploi, le dynamisme et l initiative sur le territoire, recense l ensemble des entreprises de la ville au sein d un répertoire, diffuse un journal d informations économiques à destination des entreprises suresnoises et de ses partenaires, intervient dans la mise en place d un pôle de compétence économique en partenariat avec d autres communes du département. Créée en 1988 avec la ville de Suresnes (92), l ADES, association loi du 1 er juillet 1901 relative au contrat d association, parue au Journal Officiel du 2 juillet 1901, stipule, à l article 1 er du Titre I 1, que : L association est la convention par laquelle deux ou plusieurs personnes mettent en commun, d une façon permanente, leurs connaissances ou leur activité dans un but autre que de partager des bénéfices. Elle est régie, quant à sa validité, par les principes généraux du droit applicables aux contrats et obligations. L ADES a donc pour but de faire participer les différents partenaires locaux au développement économique de Suresnes. 1 http://www.reseau-rafael.org/ 12

Je disposais également d un ordinateur portable que j emmenais lors de nos rendez-vous clients (présentation PowerPoint). M. ROBIN m a également fourni le logiciel Tropes, pour lequel il a acquis les droits d utilisation auprès d ACETIC et, tous les documents relatifs à ma mission : comptes-rendus des réunions ou rendez-vous et synthèses d interventions auprès de ses clients, etc. Pour me préparer à ce stage, M. ROBIN m avait également fourni à la fin de l entretien de stage, un document établi pour présenter à ses clients et partenaires, la méthode et le contenu générique des missions d Assistance à Maîtrise d Ouvrage qu il propose dans le cadre de son activité de consultant en Gestion Documentaire & Relation Client : «Description de mission, audit documentaire, Jacques ROBIN, DOCUMENT PROJECT». Ma première tâche au sein de DOCUMENT PROJECT a été de lister les sociétés qui proposent une analyse du courrier électronique, donc connaître le marché des logiciels liés à cette activité (l existant). Mais mes responsabilités ne se sont pas limitées à l étude du marché des solutions dans le traitement des mails entrants. J ai participé à l organisation d une conférence réalisée par DOCUMENT PROJECT le 20 mai 2003 sur le thème «Comment gérer la croissance du nombre de mails entrants» à l hôtel Sofitel-Paris La Défense La Grande Arche avec le témoignage client de CANAL+ en la personne de Barbara RIVES (Chef de projet / direction des abonnements) ; j ai assisté également M. ROBIN lors de réunions sur la gestion du courrier électronique (Petit Bateau, Oddo Pinatton, La Poste, BNP Paribas et CNP Assurances), et j ai participé à la rédaction de comptes-rendus de réunions et de propositions (Etude préalable/audit documentaire) pour des projets d intervention sur la messagerie documentaire pour quelques uns de ses clients. Au début du stage, j ai du également affiner mes connaissances en la matière sur les termes techniques. Par exemple, je ne connaissais pas ou mal la signification exacte de certains mots dans ce contexte de travail comme : ASP (location logicielle), externalisation (prestataire avec obligation de résultats), workflow (système d automatisation des processus administratifs et collectifs. Il concerne un nombre limité de personnes qui doivent atteindre un objectif par une procédure définie), mode push (démarche passive. En fonction de son profil la personne reçoit régulièrement les informations qui peuvent lui être utiles) et mode pull (démarche active de recherche d information. On va chercher l information pour la «tirer» vers soi, la rapatrier), OK station (c est un environnement logiciel dédié à l acquisition, la représentation et l exploitation de terminologies métier, ontologies d entreprise), ontologies (elles sont une branche du «knowledge management» qui permet la représentation et l organisation des concepts d un domaine sous la forme d arbres) Fulfillment (ensemble des services de la réception du courrier au traitement des commandes, ayant un rapport avec le client, hors communication. Mise en œuvre d une logistique comme la mise sous pli et courrier), Intelligence artificielle (ensemble des technologies favorisant la prise de décision, en organisant la chaîne de la valeur qui transforme les données en information, puis en connaissance, enfin en décision et en action), etc. Cette première mission avait pour principal but de déboucher sur la réalisation d une cartographie des solutions d analyses linguistiques du marché pour identifier les caractéristiques et points forts de chaque acteurs, afin de les mettre en adéquation avec les attentes des clients. 1.2.Une fonction d analyste de corpus de courriers électroniques entrants Ma seconde mission était de réaliser l analyse d un échantillon de mails constituant un corpus documentaire pour sonder la richesse du contenu et déterminer en conséquence les capacités de la technologies pressentie, pour répondre aux attentes des utilisateurs. La synthèse des résultats de l analyse permet de préconiser alors les solutions logicielles disponibles ainsi que leurs coûts et leur 13

capacité à s intégrer dans l architecture technique, en s appuyant sur la cartographie réalisée. Cette mission s inscrit dans l intervention que propose DOCUMENT PROJECT à ses clients, elle est constituée de trois étapes : 1. Etape 1 : étude de l existant / analyse des besoins (volumétrie des mails échangés, architecture technique, etc.) 2. Etape 2 : analyse test 2 (analyse d un échantillon de mails entrants pour déterminer le niveau d adéquation de la technologie retenue avec la problématique spécifique du client) 3. Etape 3 : synthèse (les résultats de l analyse sous formes statistique et graphique, la présélection d offres logicielles étudiées dans le cadre de la cartographie réalisée, etc.) A l issu de cette étude préalable, une seconde étude relative au choix d une solution et à son déploiement peut être envisagée par le client. 2 Voir Partie III. Une étude d un échantillon de mails entrants de CANAL+ avec l outils d analyse sémantique d ACETIC : Tropes Zoom 14

DEUXIEME PARTIE Cartographie des différents solutions de Text Mining appliquées à la problématique de la Gestion des mails entrants 15

1. Le développement de l activité de Text Mining 3 De récentes enquêtes ont montré que 8O% de l information sous forme électronique est textuelle et non structurée. La majeure partie de l information à forte valeur ajoutée est donc présente dans des milliers de pages de textes de toute nature et en toute langue, pages qu il faut traiter et analyser pour en extraire le sens et le rendre disponible. L information textuelle est produite au sein des entreprises et des institutions, elle peut émaner des échanges avec le client et les partenaires à travers les e-mails, les courriers, et les données callcenters. Les enjeux du Text Mining En cela le Text Mining est un enjeu clef. Couplant des approches linguistiques et sémantiques et des approches statistiques, le Text Mining permet de faire émerger du sens à partir de grandes masses de textes qui seraient très difficilement exploitables «manuellement». Il permet d en donner une vue globale ou d en extraire une information précise, pour adresser cette information aux bons destinataires pour mettre en relation des données textuelles avec d autres types de données. Parvenir à maîtriser des stocks et des flux textuels est un atout considérable pour les institutions, les organisations et les entreprises, et un enjeu important pour les systèmes d information et d aide à la décision. Cela permet, par exemple, d obtenir de traiter de grosses quantité d information à moindre coût, de mieux gérer la relation client, d accéder de manière plus précise et plus rapide à l information utile. Les chiffres Selon les baromètres multimédia Médiamétrie, plus de 20 millions d individus (39,7% des français) se sont connectés à Internet en France au mois de janvier 2003. Un chiffre en progression de 7% par rapport à décembre 2002. Le taux d équipement des foyers progresse également d une année sur l autre : une hausse de + de 18% par rapport à 2002 (+ de 10 millions soit 42% des foyers sont équipés d un micro-ordinateur). Il semble donc que la population des internautes dans son ensemble continue de s élargir. Rappelons que «Les Baromètres Multimédia» est l étude de référence des équipements et usages multimédia pour observer simultanément les taux d équipement multimédia et le profil des utilisateurs. Elle permet une analyse qualifiée de l ensemble des usages Internet ou téléphonie mobile selon un nombre important de critères socio-démographiques et comportementaux. Cela en fait un outil opérationnel pour anticiper les évolutions des comportements face aux développements des nouvelles technologies. Des volumes importants Les volumes d e-mails professionnels subissent également cette croissance : 20, 9 milliards d échanges par jour en 2003, contre 16,2 milliards en 2002 et 9,7 milliards en 2000 (Médiamétrie, IDC). Devenu un canal de relation client à part entière, l e-mail pose de nouveaux problèmes de gestion aux entreprises. Plusieurs facteurs sont à prendre en compte. Tout d abord le quantitatif : mécaniquement pour les grandes entreprises, le trafic des e-mails clients est multiplié par trois chaque année. Mieux vaut donc s y préparer à l avance avant de crouler sous l avalanche. Selon Benchmark Group, 15% des 405 sites des 1500 premières entreprises françaises reçoivent plus de 40 mails par jour. Les chiffres américains sont évidemment plus spectaculaires, un site comme celui d Excite reçoit plus de 2000 mails par jour. Ensuite, il y a l aspect financier. Le traitement d un 3 Le Text Mining est l ensemble de méthodes et techniques appliquées à des informations textuelles sous forme électronique, visant à structurer et organiser leurs contenus à des fins d analyse, de classement et de prise de décisions. 16

appel téléphonique client coûte en moyenne, 2,5 euros pour une entreprise. Le coût moyen de traitement d un e-mail est de 1 euro. C est donc un canal de contact à privilégier. Enfin, et surtout, l e-mail bien utilisé est un formidable outil de relation client, international et disponible, contrairement au téléphone, 24 heures sur 24 et sept jours sur sept, quand on sait que de plus en plus d internautes ont accès à l ADSL et aux forfaits illimités. Par sa simplicité et la modicité de son coût, le courrier électronique est un très bon moyen de communication entre les clients et les entreprises. Chiffres Clés Prévisions du volume d e-mails professionnels entrants Années Nombre de mails/jours (milliards) 2000 2002 2003 9,7 16,2 20,9 Un traitement des mails insatisfaisant Commandes de produits, demandes de renseignements, plaintes, propositions de collaboration, messages de félicitation, le courrier électronique reçu par les entreprises est souvent très varié. Paradoxalement, beaucoup d organisations n appliquent pas au traitement des mails le même niveau de qualité que pour le courrier papier ou le téléphone, en moyenne, en France, les entreprises ne répondent qu à un mail sur deux, et ce, dans un délai de 48 heures. Selon une étude Qualiweb, baromètre de Cocedal conseil qui évalue la qualité de traitement des mails par les entreprise, dans laquelle 5 messages étaient envoyés à des sites commerciaux, 9% ont répondu systématiquement, 14% n ont pas répondu et 48% ont répondu à 3 messages sur 5. Parmi les secteurs jugés les plus performants : la distribution spécialisée, l assurance, la bourse, l automobile. Le baromètre Qualiweb a été réalisé auprès de 190 sites répartis sur 15 secteurs d activités par l envoi de 950 «mails mystères» au cours du dernier trimestre 2002. Un constat inquiétant, car ne pas répondre, ou pas assez vite, au message électronique d un client ou d un usager, c est un peu comme «lui raccrocher au nez». Les réponses standards ou inadaptées ne valent guère mieux. Les conséquences d un mauvais traitement des e-mails entrants sont loin d être négligeables. Le caractère tardif ou l absence de réponse peut être préjudiciable pour l image de l entreprise, pour la satisfaction du client, provoquer éventuellement la perte d une vente dans le cas d une demande d information relative à une commande, et entraîner le phénomène de «la boucle du mail entrant» : 17

La boucle du mail entrant Augmentation du nombre de mails Augmentation des coûts de traitements Réduction de coûts Insatisfaction: baisse de la qualité de relation client Augmentation des délais de réponse et dégradation du contenu Conférence Gestion des mails entrants/ Document Project 20.05.2003 6 Les outils de Text Mining Le traitement d un mail est différent de celui d un appel téléphonique entrant. En effet, on sait que l e-mail est généralement mieux formulé qu un appel téléphonique. Le client prend le temps d y expliquer sa demande. Nous sommes donc face à un document écrit que les outils de traitement peuvent en analyser le contenu. Globalement le Text Mining organise le contenu lexical d un ensemble de textes en un ensemble de concepts. Il en extrait ensuite les représentations dominantes afin d organiser les documents les uns par rapport aux autres et de résumer le texte. Il en résulte une partition des textes ayant une similarité de contenu. D autre part, l analyse linguistique des documents permet d en extraire des éléments objectifs mais également subjectifs. On distingue sept niveaux d analyse linguistique mais qui ne sont pas tous appréhendés par les systèmes de Text Mining et notamment de traitement du langage naturel : la phonétique est l étude des phonèmes dans et à travers les mots et est utilisée dans les technologies de reconnaissance vocale et de synthèse de la parole, l analyse morphologique s intéresse à la composition des mots (préfixes, suffixes, racines ) en dehors de leurs rapports dans la phrase, le niveau lexicologique consiste en l analyse des mots au travers de leur signification lexicale et des relations qu ils ont entre eux (origine), l analyse syntaxique examine les relations des mots dans une phrase afin d en déterminer la structure grammaticale. Chaque mot peut alors être étiqueté selon sa qualité de nom, de verbe, d adjectif, etc. Ce type d analyse est utilisé dans les systèmes plus sophistiqués de traitement du langage naturel, la sémantique détermine les significations possibles d une unité linguistique (mot, phrase), y compris la désambiguïsation des mots dans le contexte. Cette analyse peut bénéficier de l utilisation d algorithmes statistiques permettant la classification, l élaboration de règles d association, ou d arbres de décision l analyse du discours consiste en l interprétation de la structure et du signifiant du contenu de textes de plus d une phrase. Cette analyse se fonde souvent sur la détection d expressions par l analyse des cooccurences facilitée par l utilisation d algorithmes tels que les règles d association, 18

la pragmatique est l étude des rapports entre la langue et l usage qu en font les locuteurs notamment lors de sous-entendus, pré-requis, ou conventions du discours. Cette analyse se fait à l aide de réseaux neuronaux, d inférences bayésiennes ou encore d arbres de décision. L extraction et la représentation de concepts abstraits à partir d un texte reste une tâche difficile. Un même concept peut être exprimé à travers différents mots (synonymie) et nombre de mots peuvent avoir de multiples sens (polysémie). D autre part, un concept très important peut être exprimé par un terme extrêmement commun alors qu un concept mineur peut l être à l aide d un mot très rare, ce qui peut perturber l approche fréquentielle couramment utilisée en analyse textuelle. Ainsi, le Text Mining diffère sensiblement des techniques plus traditionnelles d analyse textuelle, notamment parce qu il : utilise des traitements lexicaux et des algorithmes dérivés de l intelligence artificielle pour catégoriser et regrouper automatiquement des collections de documents selon leur similarité et réaliser leur indexation par la construction d indexes libres de tout a priori, par exemple à partir de mots extraits par échantillonnage, fournit une identification et une indexation des concepts contenus dans le texte, représente visuellement l ensemble des thèmes contenus dans les données avec la possibilité de naviguer à l intérieur du corpus et de l explorer dans ses moindres détails. Un navigateur lexical permet de représenter le réseau des rapports existant entre les concepts extraits et de se déplacer parmi eux, permet aux utilisateurs de déceler de nouvelles associations et relations ainsi que de détecter les chemins et liens permettant une analyse plus profonde du document, identifie la langue des documents et peut découvrir des paires de textes traduction l un de l autre mais également réunir des textes de langue différente exprimant les mêmes concepts, peut construire automatiquement différents dictionnaires comme par exemple celui des noms propres (personnes, entreprises, marques, lieux géographiques ), des termes composés, des abréviations et autre vocabulaire spécifique (chiffres, symboles monétaires ). Les mots importants dans la collection de documents sont ainsi mis en valeur. Les différentes variations de formes d un nom sont classés sous une seule et unique forme, les abréviations sont traduites dans leur contexte et les dictionnaires se construisent au fur et à mesure de l analyse. 2. Prospection du marché du traitement automatisé de courriers électroniques entrants Comme nous l avons vu précédemment les entreprises croulent de plus en plus sous la masse de l information : surabondance de sources et hétérogénéité du contenu. Comment s orienter dans cette masse croissante? Boussole, repérage, territoire, navigation, faire le point : le vocabulaire souvent employé induit presque naturellement la métaphore de la cartographie. Quels outils sont disponibles et pour quels utilisateurs? C est pour faire un diagnostic indépendant sur le nouveau panorama des solutions de gestion du courrier électronique que DOCUMENT PROJECT m a donné la mission de dresser une véritable cartographie des solutions d analyses sémantiques et linguistiques du marché pour identifier les caractéristiques et points forts de chaque intervenant afin de les mettre en adéquation avec les attentes des clients. 19

2.1.Le périmètre : détection des outils de Text Mining Pourquoi cartographier? La cartographie correspond à cette expérience simple de la vie quotidienne : «la possibilité de renseigner un visiteur qui, dans la rue, demande son chemin dépend essentiellement de notre capacité à se représenter mentalement le plan de la ville». En effet, cartographier signifie vouloir rendre l information accessible à d autres. Ce qui exige de structurer sa propre pensée pour la diffuser efficacement. Cartographier, c est émerger le sens d une masse d information ainsi que l intelligence collective des contributeurs. Les besoins D après une enquête sur la Gestion des e-mails par JDNet Solutions (Benchmark Group) 4 : Comment les entreprises classent-elles les différents problèmes à résoudre suivants? Pour votre entreprise, le principal problème avec les mails, c est de : Beaucoup Un peu Pas du tout Se protéger contre les virus 66% 23% 11% Répondre rapidement aux questions-clients 67% 26% 7% Trier les mails entrants pour établir des priorités 36% 32% 32% Se protéger contre les spam 35% 43% 22% Limiter les échanges incomplets 19% 32% 49% 4 http://solutions.journaldunet.com/0302/030203_enquetemail1.shtml 20