Une approche hybride de gestion des connaissances basée sur les ontologies:

Documents pareils

Ingénierie et gestion des connaissances

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Université de Lausanne

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Une méthode d apprentissage pour la composition de services web

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

INDUSTRIALISATION ET RATIONALISATION

Problématiques de recherche. Figure Research Agenda for service-oriented computing

M2S. Formation Management. formation. Animer son équipe Le management de proximité. Manager ses équipes à distance Nouveau manager

SECTION 5 BANQUE DE PROJETS

ISTEX, vers des services innovants d accès à la connaissance

Mastère spécialisé MS : «Ingénierie de l innovation et du produit nouveau

REFERENTIEL PROFESSIONNEL DU DIPLÔME D ETAT D INGENIERIE SOCIALE (DEIS) Contexte de l intervention

Séminaires Système D Information. Formation Conduite du Changement. Préambule

La solution pour gérer vos connaissances techniques et scientifiques

Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P

Introduction Définition...3

Sujet de thèse CIFRE RESULIS / LGI2P

Concepts clés associés aux outils logiciels, exemples

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

UE 8 Systèmes d information de gestion Le programme

Problématique / Problématiser / Problématisation / Problème

De la production collaborative à la capitalisation des connaissances Le rôle des documentalistes

Les ressources numériques

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats

3-La théorie de Vygotsky Lev S. VYGOTSKY ( )

Université de Haute Alsace. Domaine. Sciences Humaines et Sociales. MASTER Mention Éducation, Formation, Communication UHA, ULP, Nancy 2

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

MEMOIRE POUR UNE HABILITATION A DIRIGER DES RECHERCHES

UN PROGRAMME INNOVANT AU CŒUR DES ENJEUX COMPÉTITIFS DE L ENTREPRISE MODERNE

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

360 feedback «Benchmarks»

Entrepôt de données 1. Introduction

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION

Ressources APIE. La comptabilisation des actifs immatériels : enjeux et applications. immatériel. Pour comprendre. En bref

I) - DEFINITIONS I-A) TERMINOLOGIE

Chapitre 1 : Introduction aux bases de données

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE

THOT - Extraction de données et de schémas d un SGBD

Formation Méthode MDM. Architecture et procédés de modélisation des données de référence

La gestion électronique de l information et des documents entreprise. Présentation

PRÉSENTATION GÉNÉRALE

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Les activités numériques

Evaluation des cursus «Information & Communication»

BTS Comptabilité et Gestion SOMMAIRE

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

ITIL V3. Transition des services : Principes et politiques

Mastère Professionnel Documentation d entreprise

Cours de Management des Systèmes d Information

Consulting & Knowledge Management. Résumé :

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année

Enseignement secondaire technique. Technologies de l'information et de la communication

REFERENTIEL STRATEGIQUE DES COMPETENCES DU RESPONSABLE DE FORMATION EN ENTREPRISE INTERVENTION DU 13 OCTOBRE DE VERONIQUE RADIGUET GARF (*) FRANCE

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB Olivier Augereau Formation UML

Modulo Bank - Groupe E.S.C Chambéry - prérequis à la formation - doc. interne - Ecoute active.doc Page 1

LICENCE PRO MANINFO 2014/2015. LA VEILLE STRATEGIQUE : quels liens avec l intelligence économique, la documentation et le knowledge management?

Chapitre 9 : Informatique décisionnelle

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

A1 GESTION DE LA RELATION AVEC LA CLIENTELE

Qu'est-ce que le BPM?

XML pour la mise en valeur des informations

SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE. alain salvadori IA IPR Sciences de la vie et de la Terre ALAIN SALVADORI IA-IPR SVT

Le Crédit-bail mobilier dans les procédures collectives

Méthodologies de développement de logiciels de gestion

Conseil économique et social

Contexte : «l e-business» TECHNIQUES DE MARKETING EN LIGNE. Contexte : «l e-business» Création de valeur 02/02/12

Présentation du Progiciel de Gestion Intégré

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

sentée e et soutenue publiquement pour le Doctorat de l Universitl

LES RÉFÉRENTIELS RELATIFS AUX ÉDUCATEURS SPÉCIALISÉS

Référentiel d'activités professionnelles et référentiel de certification Diplôme d'état de professeur de musique

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

Sylvie Guessab Professeur à Supélec et responsable pédagogique du Mastère Spécialisé en Soutien Logistique Intégré des Systèmes Complexes

Formation «Système de gestion des documents d activité (SGDA)»

Product Life-Cycle Management

COMPOSANTE 3 Objectif 3.C

L OUTIL COLLABORATIF AU SERVICE DE

Stratégies gagnantes pour les prestataires de services : le cloud computing vu par les dirigeants Dossier à l attention des dirigeants

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

Baccalauréat professionnel vente (prospection - négociation - suivi de clientèle) RÉFÉRENTIEL DE CERTIFICATION

European Assistant Assistant de Manager

EP LOIRE Plateau collaboratif d échange. Intranet / Internet. du plan Loire grandeur nature Note de cadrage

Quels outils pour prévoir?

EDUCATEUR SPECIALISE ANNEXE 1 : REFERENTIEL PROFESSIONNEL

Yannick Prié Département Informatique - UFR Sciences et Techniques Université Claude Bernard Lyon

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

REFERENTIEL PROFESSIONNEL DES ASSISTANTS DE SERVICE SOCIAL

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

I. LE CAS CHOISI PROBLEMATIQUE

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

Maîtriser les mutations

Chapitre 01 Généralités

UNIVERSITÉ DE LORRAINE Master MIAGE (Méthodes Informatiques Appliquées à la Gestion des Entreprises)

Transcription:

N d ordre 2006-ISAL-00110 Année 2006 THESE Une approche hybride de gestion des connaissances basée sur les ontologies: application aux incidents informatiques Présentée devant L Institut National des Sciences Appliquées de Lyon Pour obtenir Le grade de Docteur Ecole doctorale : Informatique et Information pour la société (EDIIS) Spécialité : Documents Multimédia, Images et Systèmes d Information Communicants Par Djida BAHLOUL (épouse YASSIR-MONTET) Soutenue le 15 décembre 2006 devant la Commission d examen Jury MM. Directeur Y. Amghar Professeur (INSA de Lyon) Examinateur B. Bachimont HDR (UTC) - Directeur Scientifique (INA) Examinateur L. Bouzidi Professeur (Université Jean Moulin Lyon3) T. Faivre Responsable Technique du CIRTIL Co-directeur P. Maret Maître de conférences (INSA de Lyon) Rapporteur E. Murisasco HDR (Université du Sud Toulon-Var) Rapporteur F. Sèdes Professeur (Université Paul Sabatier Toulouse3) LIRIS : Laboratoire d'informatique en Images et Systèmes d'information.

A mes parents A Abdel A Malek

Remerciements Je remercie M. Youssef Amghar et M. Pierre Maret pour m avoir proposé le sujet de ma recherche, pour leur encadrement, pour leur aide, patience et soutien tout au long de ces années. Je remercie Mme Florence Sèdes et Mme Elisabeth Murisasco pour avoir accepté d être rapporteurs de cette thèse. Je les remercie également pour les remarques constructives qu elles ont formulées au sujet de mon manuscrit. Mes vifs remerciements s adressent à M. Bruno Bachimont et M. Laid Bouzidi pour l honneur qu ils me font en acceptant de participer au jury, et pour l intérêt qu ils accordent à mon travail. Je tiens à remercier M. Guy Mercier pour m avoir accueilli au CIRTIL, ainsi que toutes les personnes avec lesquelles j ai eu le plaisir de travailler ou tout simplement de «bavarder» au cours des trois années passées au CIRTIL. Mes plus sincères remerciements vont particulièrement à M. Thierry Faivre. Je le remercie pour sa confiance et ses orientations qui ont été fort judicieuses et appréciées. Je remercie également M. Robert Laurini pour m avoir accueilli au sein de son laboratoire ainsi que tous les chercheurs, enseignants et membres du personnel du laboratoire LIRIS pour leur amitié et leur aide. Je remercie particulièrement Anne Courant et Nicolle Pillay pour le temps consacré à relire attentivement tout ou partie de ce manuscrit. Je termine par un grand remerciement à mon mari, à mes parents, à mes sœurs Wahiba, Nabila et Karima, à Claude et Philippe et à Lamia pour leurs encouragements et pour leur soutien moral.

Une approche hybride de gestion des connaissances basée sur les ontologies: application aux incidents informatiques. Résumé Le travail développé dans cette thèse concerne la problématique de gestion des connaissances au sein des organisations. Le but est de proposer des aides méthodologiques et des outils facilitant la capitalisation et la réutilisation des connaissances produites et/ou utilisées par les acteurs d une entreprise. Nous avons proposé une approche hybride basée sur une ontologie du domaine. La mise en œuvre de cette approche privilégie l utilisation des techniques du web sémantique tels que XML et OWL. Dans ce contexte, nous avons conçu une mémoire d entreprise pouvant s interfacer avec le système d information de l entreprise. En nous plaçant dans le contexte d applications logicielles produites et/ ou mises en production par le CIRTIL, organisme attaché à la sécurité sociale, pour le compte de ses clients qui sont les URSSAF, nous avons élaboré une ontologie du domaine des incidents informatiques. Cette ontologie est considérée comme un modèle qui permet, en plus des représentations formelles et consensuelles des connaissances du domaine, un accès unique aux ressources de connaissances via une terminologie partageable et non ambiguë tout en offrant des mécanismes de raisonnement sur les connaissances modélisées. Mots-clés : gestion des connaissances, ontologies, mémoire d entreprise, approche hybride, système de gestion des connaissances, XML, OWL. A Hybrid Approach of knowledge management founded on ontologies : an application on the data-processing incidents. Abstract The work developped in this thesis deals with the problem of knowledge management within the organizations. Its aim is to propose methodological assistances and tools facilitating the capitalization and reuse of knowledge producted and/or used by the actors of a company. We have suggested a hybrid approach based on a domain ontology. Settling down this approach requires the use of the techniques of the semantic Web such as XML and OWL. In this context, we have designed a corporate memory being able to interface with the information system of the company. Looking focustly on the context of software applications produced and/or being in production by the CIRTIL, organization attached to the social security in France for the account of its customers which are the URSSAF, we have developed a domain ontology of tha data-processing incidents. This ontology is regarded as a model which allows not only formal and consensual representations of knowledge of the field, but also a single access to knowledge resources thanks a shareable and nonambiguous terminology while offering mechanisms of rasoning on modelled knowledge. Key-words: Knowledge Management, Ontologies, Corporate Memory, Hybrid Approach, Knowledge Management System, XML, OWL.

Table des matières Introduction générale...4 Première partie...11 La gestion des connaissances basée sur les ontologies : état de l art...11 1 La gestion des connaissances de l entreprise... 12 1.1 Définition de la connaissance... 13 1.2 Les connaissances de l entreprise... 14 1.2.1 Les catégories de connaissances dans l entreprise... 14 1.2.2 La création des connaissances dans l entreprise... 16 1.3 La gestion des connaissances... 18 1.3.1 Définition de la notion de gestion des connaissances... 18 1.3.2 Quelques approches de gestion des connaissances... 20 1.3.3 Les systèmes de gestion des connaissances... 23 1.4 Le processus de la gestion des connaissances... 30 1.5 Les outils de gestion des connaissances... 31 1.5.1 Ce que doit permettre un outil de gestion des connaissances... 32 1.5.2 Les solutions intégrales de gestion des connaissances... 33 1.5.3 Les suites logicielles... 33 1.5.4 Les outils offrant certaines fonctionnalités... 33 2 Rôle des ontologies dans la gestion des connaissances... 35 2.1 Définition et développement des ontologies... 36 2.1.1 Les composants d une ontologie... 36 2.1.2 Les types d ontologies... 37 2.1.3 La construction d une ontologie... 39 2.2 La représentation des connaissances par les ontologies... 47 2.2.1 La représentation des connaissances... 48 2.2.2 L utilisation des ontologies pour la représentation des connaissances... 56 2.2.3 Ontologies et raisonnement... 59 2.3 L indexation et l annotation par les ontologies... 63 2.3.1 L indexation, une ancienne pratique documentaire... 64 2.3.2 Les ontologies comme ressource d indexation des connaissances... 68 2.3.3 L annotation par les concepts de l ontologie... 70 2.4 L exploitation des connaissances basée sur les ontologies... 74 2.4.1 La recherche d information basée sur les ontologies... 74 2.4.2 La manipulation des SBC via les ontologies... 77 2.5 Conclusion... 79 Deuxième Partie...81 Proposition et mise en œuvre d une démarche de gestion des connaissances...81 3 La problématique de gestion des connaissances au sein du CIRTIL... 82 3.1 Domaine d activité et connaissances métier... 83 3.1.1 Le traitement de l information... 84 3.1.2 Le développement d applications logicielles... 88 3.2 Disparité des connaissances dans le Système d Information de l Entreprise (SIE)... 90

3.2.1 Le système d information de la branche Recouvrement... 90 3.2.2 Les bases de données relationnelles... 94 3.2.3 Les bases locales Lotus Notes... 94 3.2.4 Les ressources électroniques... 97 3.2.5 Les documents sur support papier... 98 3.3 La question de l accès centralisé aux connaissances... 99 3.4 La problématique de gestion...102 3.4.1 L absence d une solution globale de gestion des connaissances...102 3.4.2 La gestion des savoir-faire...103 3.4.3 La gestion des connaissances explicites...106 3.4.4 Le partage des connaissances...106 3.5 Les enjeux de la gestion des connaissances pour le CIRTIL...107 3.5.1 L aide à la décision...107 3.5.2 L amélioration du processus de recherche d information...108 3.5.3 L amélioration de la qualité et des processus métiers...108 3.5.4 La capitalisation de l expertise et des expériences passées...109 3.6 Synthèse...109 4 Recommandations pour la mise en œuvre d une démarche de gestion des connaissances... 112 4.1 Définir une approche appropriée...113 4.1.1 Précision des besoins de l organisation en matière de gestion des connaissances...114 4.1.2 Etude de l existant...115 4.1.3 Détermination des connaissances à capitaliser...116 4.2 Prendre en compte les processus déterminants de la gestion des connaissances...117 4.2.1 Le repérage des connaissances cruciales...118 4.2.2 La modélisation des connaissances repérées...120 4.2.3 La réutilisation et l exploitation des connaissances capitalisées...121 4.3 Situer le rôle des employés au sein du projet de gestion des connaissances...122 4.4 Synthèse...124 5 Mise en application de la démarche... 125 5.1 L approche de gestion des connaissances appropriée au CIRTIL...125 5.2 Le repérage des connaissances cruciales...129 5.2.1 La détermination des processus sensibles...130 5.2.2 La distinction des problèmes déterminants...133 5.2.3 La localisation des connaissances cruciales...136 5.3 La modélisation des connaissances...139 5.3.1 Les connaissances relatives aux incidents informatiques...139 5.3.2 Description de la méthode de construction d OntoIncident...141 5.3.3 Structuration sémantique des connaissances du domaine...153 5.4 La réutilisation des connaissances...160 5.4.1 La recherche par les concepts et le raisonnement sur les connaissances...161 5.4.2 L interrogation simultanée de plusieurs sources...162 5.5 Outillage de la démarche...164 5.5.1 La conception d une mémoire d entreprise «métier»...164 5.5.2 Proposition d une architecture de la mémoire d entreprise...167 5.6 Synthèse...172 6 Prototypage et évaluation... 174 6.1 Implémentation de l ontologie OntoIncident...174 6.1.1 Le choix du formalisme OWL...174 6.1.2 La représentation des connaissances ontologiques avec OWL...175 6.1.3 Opérationnalisation de l ontologie OntoIncident...184 6.2 L outil MemConsult...198 2

6.2.1 La conception des interfaces utilisateurs...199 6.2.2 Le schéma de la base de connaissances...200 6.2.3 L exploration selon les types de liens...202 6.2.4 Les règles d'inférence...206 Conclusion générale...208 3

Introduction générale Nous abordons dans cette thèse un sujet qui intéresse aussi bien les dirigeants des entreprises et leurs collaborateurs, que la communauté des chercheurs. Ce sujet s articule autour d une réflexion sur une meilleure pratique de gestion et d organisation du patrimoine des connaissances des entreprises. Nous étudions particulièrement la problématique de gestion des connaissances du CIRTIL 1, qui est l entreprise d accueil au sein de laquelle a été mené le travail que nous présentons ci-après. Cette problématique se résume en : - la disparité des connaissances dans le Système d Information de l Entreprise (SIE), qui est systématiquement alimenté par les connaissances individuelles et collectives des employés, devenues difficilement repérables par ce qu elles sont enfouies dans les différentes sources qui constituent le SIE ; - la coexistence d une multitude d outils et d approches hétérogènes destinés à gérer les sources d informations, la documentation et les savoir-faire que possède l entreprise ; - l absence d un accès centralisé aux connaissances et par conséquent, le manque d un outil fédérateur capable d interroger simultanément et «intelligemment» les ressources de connaissances via une interface unique et centralisée. Ces constats 2 se sont considérablement développés au fil des années nécessitant des études académiques plus poussées. Actuellement, l absence d un système efficace de restitution de connaissances amène les employés de cette entreprise, à passer beaucoup de temps à rechercher des connaissances auprès de leurs collègues ou dans le SIE. Dans de telles conditions, la répercussion sur la production et/ou la qualité des services auprès des clients, s avère notable et embarrassante notamment pour les dirigeants. 1 Centre Interrégional de Traitement de l Information de Lyon 2 Ces constats sont le résultat de l étude de l existant abordée dans le chapitre 3 de cette thèse. 4

Pour remédier à cette situation, les différentes équipes du CIRTIL ont acquis et développé quelques outils et adopté certaines approches intrinsèques à la gestion des connaissances. Malheureusement, ces initiatives ont rendu plus complexe l accès aux ressources des connaissances de l entreprise et ont suscité ainsi, le besoin d un cadre méthodologique pour la gestion des connaissances. L objectif visé par le CIRTIL, est d apporter des aides méthodologiques et des outils facilitant la capitalisation et la restitution des connaissances. Le résultat attendu est une solution intégrale qui soit facilement exploitable par les employés. Cette solution doit pouvoir rendre accessible les connaissances via une interface centralisée, en offrant non seulement le moyen de structuration des connaissances, mais aussi la capacité d orientation des employés vers d autres ressources. Au regard de nos recherches dans la littérature, nous nous sommes rendu compte que la réalisation de tels résultats nécessite la mobilisation de différents domaines : sciences de gestion, sciences cognitives, intelligence artificielle, systèmes d information, etc. 3 Ainsi, l hypothèse de départ sur laquelle nous nous sommes basé dans ce travail, est qu il est nécessaire d'adopter une vision multidisciplinaire pour approcher la problématique de gestion des connaissances au sein du CIRTIL. En conséquence, l approche proposée est une approche hybride qui combine plusieurs méthodes et techniques issues des domaines de l ingénierie des connaissances, de l ingénierie documentaire et des systèmes d information. Le recours à une telle approche se justifie, par le besoin de l entreprise en matière de gestion des connaissances, mais aussi par la nature des connaissances à prendre en compte. Si les employés du CIRTIL manipulent fréquemment les connaissances à travers les documents (dossier URSSAF, procédure d exploitation, code source d une application, cahier des charges, etc.), il est à noter également, que beaucoup de connaissances exploitées au cours des activités quotidiennes relèvent des savoir-faire non explicités. Pour que l approche proposée tienne compte de la dualité : connaissances explicites / connaissances tacites, nous suggérons de coupler les méthodes de l ingénierie des connaissances (ontologie, raisonnement, etc.) avec certaines techniques habituellement attribuées à l ingénierie documentaire (indexation, structuration avec XML, etc.) Une solution est de construire une mémoire d entreprise autour d une ontologie du domaine. 3 La problématique de gestion des connaissances trouve ses origines chez les chercheurs en sciences de gestion et le développement de la gestion des connaissances en tant que discipline dans le domaine informatique est récent (Charlet, 2002). 5

Dans le domaine de l ingénierie des connaissances, de nombreuses études s accordent sur l intérêt de l usage des ontologies pour pallier la problématique de gestion des connaissances (Dieng et al., 2001), (Benjamins et al., 1998), (Charlet, 2002) et (Gandon, 2002). Ces études montrent que les ontologies permettent des représentations formelles des connaissances car elles s appuient sur le raisonnement ; celui-ci étant important dans le contexte de la gestion des connaissances. Par ailleurs, l ingénierie documentaire peut fournir un levier pour la concrétisation de la mise en œuvre de la mémoire d entreprise. Ainsi, l indexation documentaire 4 peut se révéler particulièrement intéressante dans le contexte d une mémoire d entreprise. Cette pratique consiste à associer à une ressource, les mots-clés représentatifs de son contenu, afin d en faciliter l accès. Ces mots-clés sont les métadonnées et les concepts de l ontologie choisis par l indexeur en adéquation avec le contenu de la ressource à décrire. L indexeur devrait être un expert ou un spécialiste du domaine, afin de garantir un certain niveau de pertinence quant à la description des ressources de connaissances. L ingénierie documentaire peut être également exploitée, pour faciliter la formalisation des savoir-faire d experts. Ceci consiste à transcrire les connaissances sous une forme exploitable et échangeable entre les individus mais aussi, entre des applications hétérogènes. L utilisation d XML comme support de formalisation et d explicitation des savoir-faire offre l avantage de structurer les connaissances selon des balises. Ces dernières sont fournies par les métadonnées et les concepts préalablement créés à partir de l ontologie du domaine. Dans cette acceptation, l ontologie est utilisée comme un modèle de représentation conceptuelle des savoir-faire. C est ainsi que la formalisation des savoirfaire peut reposer à la fois sur l XML et les ontologies. Ainsi, nous proposons d utiliser l ontologie comme un cadre conceptuel permettant d assurer différents niveaux de modélisation et de représentation des connaissances (représentation du contenu, modélisation des processus d activité et formalisation des savoir-faire d experts). Basée sur les logiques de description «qui ont pris le pas sur les graphes conceptuels» (Charlet, 2002), cette ontologie offre des représentations formelles et fournit un référentiel sémantique partageable et non ambigu, 4 Il s agit particulièrement de l indexation manuelle ou semi-automatique où c est l être humain qui choisi les mots d indexation les plus représentatifs du contenu à indexer. 6

doté d un mécanisme de raisonnement qui repose sur la logique du premier ordre. Ce référentiel sémantique est également utilisé dans une perspective d indexation des ressources de connaissances formalisées. Les concepts jouent alors le rôle de métadonnées thématiques ou de descripteurs pour identifier le contenu des ressources de connaissances. L ontologie permet ainsi d encadrer les principales facettes du processus de gestion des connaissances (cf. figure 1). Elle est essentiellement utilisée pour faciliter : - la représentation des connaissances et la formalisation des savoir-faire des experts; - l indexation des ressources de connaissances formalisées ; - le signalement et l intégration des connaissances cruciales dans la mémoire d entreprise ; - la restitution des connaissances capitalisées et la manipulation du contenu de la mémoire d entreprise. Figure 1 : L ontologie du domaine au cœur de la mémoire d entreprise Comme nous allons l expliquer dans cette thèse, l expérience montre qu il est recommandé pour la formalisation de l ontologie dans le cadre d une application industrielle, d utiliser un formalisme suffisamment 7

expressif basé sur une syntaxe accessible. Ainsi, notre utilisation du langage de définition d ontologies pour le Web, OWL, répond à ces critères. D une part, OWL est doté d une sémantique issue des logiques de description qui offrent une expressivité suffisamment précise ; et d une autre part, la syntaxe d OWL est basée sur l XML. Comparée aux travaux existants, notre proposition se positionne au carrefour de différents domaines qui s intéressent à la gestion des connaissances. L objectif de notre travail est donc, de construire -pour l employé- une mémoire d entreprise basée sur une ontologie du domaine qui, tenant compte de ses besoins, lui permettra une meilleure restitution et capitalisation des connaissances. L approche que nous proposons dans ce travail, tend à responsabiliser les employés et les amener à jouer un rôle actif dans le processus de gestion des connaissances. Notre contribution vise à enrichir, à travers une ontologie du domaine, les métadonnées traditionnelles par des relations sémantiques, des axiomes et des contraintes logiques générales et constituer ainsi, un référentiel de concepts riche qu on pourrait mobiliser pour effectuer l'indexation des ressources de connaissances formalisées (Bahloul et al., 2003) et (Bahloul et al., 2004a). L utilisation d une ontologie dans le contexte de la gestion des connaissances est d autant plus intéressante, si cette ontologie emploie une terminologie dynamique et évolutive sans ambigüité, dotée d un mécanisme d inférence. Sur le plan méthodologique, notre proposition se distingue par son intention de prendre en compte tous les éléments essentiels à la gestion des connaissances et ce, afin de les intégrer dans une démarche globale qui se veut pragmatique et opérationnelle. Nous nous sommes appuyés sur une étude de cas concrète issue du CIRTIL et qui porte sur la gestion des incidents informatiques auprès des URSSAF de Lyon. Cette thèse est structurée en deux parties. La première présente l état de l art de la question de la gestion des connaissances basée sur les ontologies. Cette partie se compose des chapitres : 1 et 2. Le chapitre 1 est un chapitre introductif qui donne les définitions essentielles du domaine de la gestion des connaissances de l entreprise. Ces définitions se rapportent à la notion de la connaissance, aux connaissances de l entreprise et à la gestion des connaissances de l entreprise. Les approches, les processus et les outils de gestion des connaissances sont également abordés par ce chapitre. 8

Le chapitre 2 explicite la notion d ontologie, ses composants et le cycle de son développement et aborde les méthodes et les outils d aide à la construction d ontologies. Ce chapitre met ensuite l accent sur l intérêt de l usage des ontologies dans la gestion des connaissances. Son objectif est de montrer l apport des ontologies dans les processus de modélisation et de restitution des connaissances. Cet apport, consiste notamment en la représentation des connaissances par les ontologies et l utilisation de celles-ci pour l indexation et la manipulation des ressources de connaissances formalisées. Les principales familles de formalismes de représentation des connaissances sont donc présentées et les mécanismes de raisonnement admis par les ontologies sont évoqués. La deuxième partie de cette thèse expose notre contribution à la résolution du problème posé au cours de cette thèse ; à savoir la gestion des connaissances du CIRTIL à travers une mémoire d entreprise bâtie autour d une ontologie du domaine. Cette partie se compose des chapitres 3 à 6. Le chapitre 3 expose la problématique de gestion des connaissances du CIRTIL qui consiste en la disparité des connaissances dans le SIE, le problème d accès centralisé aux connaissances et le problème de gestion jusque là adopté par l entreprise. Chacun de ces facteurs est décrit et illustré par des exemples extraits de l étude de l existant. Ce chapitre évoque également, les quatre principaux enjeux que représente la gestion des connaissances pour le CIRTIL. Le chapitre 4 présente un ensemble de recommandations destinées à guider toute entreprise dans son projet de capitalisation et de management de ses connaissances. L objectif de ces recommandations est de fournir un cadre méthodologique pour les concepteurs des systèmes de gestion des connaissances. Le chapitre 5 est consacré à l application de la démarche suggérée. Il rappelle en conséquence, la méthode du repérage des connaissances cruciales ainsi que les processus de représentation et de réutilisation de ces connaissances. Il met l accent sur l ontologie du domaine spécialement créée pour modéliser les connaissances à capitaliser et ; décrit le modèle de structuration de cette ontologie. Enfin, ce chapitre montre que l outillage d une démarche de gestion des connaissances peut se concrétiser par une mémoire d entreprise. De fait, il présente l architecture fonctionnelle de cette mémoire d entreprise. 9

Le chapitre 6 est consacré à l expérimentation et à la réalisation d un outil prototype qui implémente l ontologie du domaine et l outil de consultation de la mémoire d entreprise. La conclusion générale rappelle le bilan de nos travaux de recherche et des résultats obtenus. Le bilan est axé sur les propositions de la thèse à partir de la problématique vécue par l entreprise. Enfin, les perspectives et les travaux futurs sont également énoncés. 10

Première partie La gestion des connaissances basée sur les ontologies : état de l art 11

1 La gestion des connaissances de l entreprise Les connaissances de l entreprise sont considérées comme «une ressource stratégique pour la productivité croissante ; un facteur de stabilité dans un environnement instable et dynamique ; et c'est un avantage concurrentiel décisif» (Ermine, 2000). Cette ressource est essentielle pour tous les acteurs de l organisation ; car elle est utile pour les décideurs et managers, mais aussi pour les collaborateurs qui contribuent directement à fructifier cette richesse grâce aux savoirs et savoir-faire acquis et/ou transmis. Il est donc important pour toute organisation de maîtriser la gestion de son capital intellectuel, car comme le confirme Maret «savoir et savoir-faire sont les deux aspects indissociables de la connaissance tant qu ils ne sont pas maîtrisés, ils constituent un capital fragile car, ils ne sont ni partageables, ni persistants, c'est-à-dire non réutilisables en l absence de leur détenteur» (Maret et Pinon, 1997). En effet, la gestion des connaissances devrait permettre pour les organisations de «localiser et rendre visible les connaissances de l'entreprise, être capable de les conserver, y accéder et les actualiser, savoir comment les diffuser et mieux les utiliser, les mettre en synergie et les valoriser» (Grundstein, 1995). Dans ce contexte, la prise de conscience par les entreprises, de l importance de la gestion des savoirs et savoir-faire, individuels ou collectifs, a abouti à la production de nombreux outils et démarches dont certains sont destinés à la capitalisation des meilleures pratiques des collaborateurs. Par ailleurs, si la gestion des connaissances est un nouveau domaine de recherche en termes de formalisation et de théorisation, il existe du point de vue académique, de nombreuses manières d approcher la problématique de la gestion des connaissances. Parmi ces approches, citons la capitalisation des connaissances, la modélisation du système de connaissances, le management des compétences, etc. Nous avons repéré à travers la revue de la littérature les différentes catégories de connaissances qui existent au sein de toute entreprise. Ces catégories de connaissances sont définies et les différentes approches de leur gestion sont discutées dans la section ( 1.3.1). Au cours 12

de ce chapitre, nous abordons également, les processus et les fonctionnalités attendues d un système de gestion des connaissances. 1.1 Définition de la connaissance La définition de la connaissance est un exercice difficile, car la connaissance est une notion abstraite dont la détermination peut impliquer des aspects complexes tels que : les actions, le contexte, les informations, les acquis et expériences, etc. Cependant, nous avons noté quelques définitions proches de notre conception de ce qui est la connaissance. Ces définitions sont donc celles que nous considérons dans le cadre de cette thèse. En effet, nous soutenons l idée que la connaissance est intimement liée aux individus et à la perception humaine. Par conséquent, elle est liée à une faculté mentale et cognitive qui relève de la pensée et de l interprétation. De ce point de vue, la connaissance se défini dans certains ouvrages de références comme : «ce qui est connu, est présent à l'esprit ; ce que l'on sait pour l'avoir appris» 5 ; «une manière de comprendre et percevoir» 6 le monde ; «un ensemble de représentations, idées ou perceptions acquises par l étude ou l expérience» 7 Cette faculté mentale permet de donner un sens à l'information, de la mettre dans un contexte et de l'acquérir. L information n est pas une connaissance mais elle peut en devenir une si elle est comprise et assimilée par un individu. Ainsi, le passage de l information à la connaissance se fait par l individu qui utilise cette information dans un contexte donné. La connaissance est donc le résultat de l interprétation de l information dans son référentiel. Ce référentiel comprend selon Ermine, la sémantique que l individu attache à l information et au contexte dans lequel est intégrée cette information (Ermine, 2000). Cela veut dire qu il y a «connaissance quand il y a contexte d'utilisation de l'information» (Charlet, 2002) et qu un «ensemble de connaissances se manifeste [ ] par un ensemble de messages (visuels, parlés, écrits, ), qui transmettent non seulement de l information, mais aussi du sens.» (Ermine, 2000). 5 Dictionnaire du Robert, 1994 6 Définition du Petit Larousse éd.1991 7 Fascicule de documentation de l AFNOR, 2002 13

1.2 Les connaissances de l entreprise Les connaissances de l entreprise appartiennent à deux grandes familles : connaissances internes et connaissances externes. Les connaissances internes sont crées, transférées et gérées au sein de l entreprise par les collaborateurs. Les connaissances externes, sont l ensemble des connaissances provenant de sources externes à l entreprise. La part des connaissances externes dans le cadre de l activité de l entreprise est de plus en plus importante. Non seulement parce que les collaborateurs ont besoin de ce type de connaissances mais aussi parce qu elles sont de plus en plus disponibles au travers d Internet, des partenaires, de la presse spécialisée, etc. 1.2.1 Les catégories de connaissances dans l entreprise Si les connaissances de l entreprise peuvent être classées selon différents points de vue : type d usage, nature, etc., il convient de rappeler qu au sein de toute organisation les connaissances recouvrent les savoirs et savoirfaire produits et/ou acquis par les employés au fil du temps. Les savoirs sont des connaissances explicites pour lesquelles il existe une trace visible, car elles se présentent sous forme de documents explicites souvent formalisés ; et les savoir-faire sont des connaissances tacites issues de l expérience des spécialistes et d experts souvent emmagasinés dans les têtes des employés et pour lesquelles les informations associées ne sont pas explicites. Ces deux catégories de connaissances ont été distinguées par Nonaka qui s est basé sur les travaux de Polyani (Polyani, 1966) et qui considère que, «les connaissances explicites sont les connaissances transmissibles dans un langage formel alors que les connaissances tacites ont un aspect personnel qui les rend difficiles à formaliser et à communiquer» (Nonaka, 1991). Par la suite, Grundstein a apporté des précisions dans (Grundstein, 1995) et (Grundstein, 1996) en considérant les savoirs comme étant des éléments tangibles qui comprennent les données, procédures, plan, modèles, algorithmes, documents d analyse et de synthèse. Les savoir-faire sont des éléments intangibles tels que les capacités, talents professionnels, connaissances privées, connaissances sur l historique de l entreprise et les contextes des décisions. Ces connaissances comportent selon (Johnson- Larid, 1983), d une part un volet cognitif, à savoir les modèles mentaux 14

que les humains se forment sur le monde (schémas, paradigmes, croyances et points de vue fournissant des perspectives les aidant à percevoir et définir leur vision du monde) et d autre part, des contextes spécifiques. Les savoir-faire souvent transmissibles de bouche à oreille, peuvent dans certains cas faciliter l utilisation des connaissances explicites. Ajoutons que les connaissances peuvent être individuelles ou collectives : la connaissance individuelle, appartient à l individu ; elle peut être tacite ou explicite (Nonaka et Takeuchi, 1995). La connaissance collective n est pas une addition de connaissances individuelles mais c est un ensemble coordonné de savoirs, de comportements et de pratiques. Les connaissances collectives constituent une des ressources essentielles de l entreprise; elles sont le plus souvent transmises oralement de manière implicite ; «en l absence de ceux qui les ont formalisées, elles sont difficiles à repérer et à exploiter» (Maret et Pinon, 1997). Dans ce sens, les connaissances de l entreprise restent fortement dépendantes des personnes et de leur présence dans l entreprise. C est là où intervient le rôle de la gestion des connaissances dont l objectif est «de formaliser les connaissances tacites afin de les rendre mobilisables et opérationnelles au niveau de l organisation entière» (Ermine, 2000) Par ailleurs, les connaissances de l entreprise peuvent se distinguer selon plusieurs niveaux (Barthès, 1997) : les connaissances locales, les connaissances liées à un produit et les connaissances sur l entreprise. Les connaissances locales sont celles qui sont nécessaires à un individu ou un groupe d individus pour accomplir une tâche précise. Elles peuvent prendre par exemple la forme de procédures pour aider à la conduite d un projet, ou d un système expert d aide au diagnostic. Les connaissances liées à un produit sont celles qui concernent ce produit tout au long de sa vie. Elles comprennent tous les documents associés au produit, tous les tours de mains qui ont été utilisés pour concevoir, fabriquer, vendre, maintenir et éventuellement recycler le produit, et toutes les informations souvent non écrites, mais importantes pour le produit (décisions de conception, raisons des modifications, erreurs et échecs, ). Enfin, les connaissances sur l entreprise sont celles utilisées par la direction et concernent les aspects de l organisation globale des activités ainsi que la stratégie de l entreprise. 15

1.2.2 La création des connaissances dans l entreprise Après avoir distingué les connaissances explicites des connaissances tacites, Nonaka et Takeuchi (Nonaka et Takeuchi, 1995) ont formalisé la création des connaissances dans l entreprise en identifiant quatre modes de création et de transfert de connaissances. Ils partent de l'hypothèse que la connaissance est créée à partir des différentes interactions possibles entre connaissances tacites et connaissances explicites (cf. figure 1.1). Pour ces auteurs, la création des connaissances dans une entreprise intervient à trois niveaux qui sont : le niveau individuel, le niveau du groupe et le niveau de l entreprise. Figure 1.1 Modèle de création de connaissances (Nonaka et Takeuchi, 1995) Il s agit au niveau individuel de l'autonomie des individus et au niveau du groupe, il s agit de l'interaction et du dialogue. Le niveau de l'entreprise, concerne la compétition pour l'accès aux ressources. De fait, les connaissances organisationnelles se développent particulièrement dans le temps au cours de deux dimensions : la dimension épistémologique (tacite / explicite) et la dimension ontologique (individus, groupes, organisations). Le processus de création de la connaissance se joue alors dans les différentes circulations entre l'individu et le collectif, les connaissances tacites et les connaissances explicites. - Socialisation (Tacite vers Tacite) : la conversion de connaissances tacites en connaissances tacites se fait par interaction entre individus, ou socialisation. Cette dernière représente le processus de transmission de connaissances tacites. Il s'agit donc de transmettre des 16

modèles mentaux ou des compétences techniques. Cette transmission peut très bien se faire sans échanges verbaux. En effet, la transmission d'un tour de main s'effectue généralement par l'observation, l'imitation et surtout la pratique. Comme le soulignent les auteurs, l'expérience est la clef pour acquérir des connaissances tacites. - Externalisation ou articulation (Tacite vers Explicite) : l externalisation est le processus de conversion du tacite à l explicite. Elle consiste à rendre transmissibles et exploitables les savoirs tacites créés dans l organisation. L externalisation permet de valoriser les compétences acquises en multipliant leurs usages. Mais comme elle repose sur une codification des savoirs, elle favorise leur diffusion et imitation et réduit leur valeur. C est le paradoxe de la valeur : en exploitant le savoir, on le dégrade. L'externalisation est un processus qui permet le passage de connaissances tacites en connaissances explicites, sous la forme de concepts, modèles ou hypothèses. La modélisation d'un concept est très souvent déclenchée par le dialogue et l'échange avec d'autres individus. - Internalisation (Explicite vers Tacite) : l'internalisation est le processus de conversion de connaissances explicites en connaissances tacites. Typiquement, cette conversion est un processus d'apprentissage avec des supports, documents, manuels. L internalisation des connaissances explicites est un processus d appropriation par expérimentation. Les compétences explicites sont progressivement traduites, par essai/erreur et interaction, en compétences tacites qui permettent l application des connaissances explicites. - Combinaison (Explicite vers Explicite) : la combinaison est un processus de création de connaissances explicites à partir de la restructuration d'un ensemble de connaissances explicites acquises par différents canaux de communication. La théorie de la création de la connaissance développée par Nonaka et Takeuchi (Nonaka et Takeuchi, 1995) considère que la première fonction de l'entreprise est de créer un avantage concurrentiel basé sur le savoir collectif et que le rôle des managers est d'orienter les activités de création de la connaissance. Le modèle de création des connaissances repose donc sur la distinction entre savoir tacite et savoir explicite. Le savoir tacite est enraciné dans l action, dans les habitudes, dans un contexte spécifique (ce qui peut donner la productivité personnelle au niveau 17

individuel et l'avantage concurrentiel au niveau de l'entreprise). Le savoir explicite est la connaissance codifiée, transmissible en un langage formel et systématique (production de données au niveau individuel, et gestion électronique documentaire au niveau de l'entreprise). 1.3 La gestion des connaissances 1.3.1 Définition de la notion de gestion des connaissances La gestion des connaissances de l organisation est définie dans (Alavi et Leidner, 2001) comme «un processus spécifique systématique et organisationnel pour acquérir, organiser et communiquer des connaissances tacites et explicites des employés afin que d autres puisse les utiliser pour être plus efficace et productif dans leur travail.» Cette définition est loin d être la définition unique du terme gestion des connaissances compte tenu de la diversité des approches de la gestion des connaissances et de l interdisciplinarité du domaine. Cependant, il est possible d adopter plusieurs points de vue pour aborder la notion de la gestion du capital intellectuel des entreprises. Par exemple, du point de vue de l approche organisationnelle, la gestion des connaissances est un processus qui met en évidence les mécanismes de transmission et d'évolution des connaissances dans les organisations. Son but est de permettre aux différents détenteurs et experts de partager et transmettre les savoirs et savoir-faire plutôt que de chercher à les formaliser et à les modéliser. Dans le domaine de l Ingénierie des Connaissances, la gestion des connaissances est basée sur la représentation des connaissances. Celle-ci consiste en la modélisation des différents éléments du monde réel et la détermination de procédures d interprétation faisant le lien entre le monde et le modèle, tant au moment de l acquisition des connaissances et l élaboration du modèle, que pendant la manipulation de la représentation (pour donner des explications) et, finalement, lors de l application des résultats du modèle au monde réel. A partir de cette représentation et d une capacité de raisonnement appropriée, le système doit pouvoir s adapter et exploiter son environnement (Barr, 1981), (Brachman, 1990). De plus, la gestion des connaissances dans l Ingénierie des Connaissances est guidée par l application des techniques et méthodes développées dans ce domaine comme les modèles de capitalisation ou les langages de représentation. 18

Notons aussi que certains auteurs emploient le concept capitalisation des connaissances pour désigner la gestion des connaissances. Ce concept a été énoncé dès 1990 chez Framatome dans le prolongement de la démarche de déploiement de l'intelligence Artificielle et des Systèmes à Base de Connaissances réalisée dans le Groupe de 1984 à 1991 (Grundstein et al., 1988). Il s'agissait de pérenniser et de valoriser le savoir-faire acquis en Ingénierie des Connaissances. La capitalisation des connaissances est donc un processus qui permet de réutiliser les connaissances d un domaine donné, préalablement modélisées et stockées afin de mieux effectuer de nouvelles tâches (Simon, 1996). En effet, si l on se réfère à la définition de (Grundstein, 1996) selon laquelle «Capitaliser les connaissances de l'entreprise c'est considérer les connaissances utilisées et produites par l'entreprise comme un ensemble de richesses constituant un capital, et en tirer des intérêts contribuant à augmenter la valeur de ce capital», nous pouvons constater que le concept de capitalisation des connaissances est employé au sens gestion des connaissances. Cette idée est soutenue par (Barthès, 1997) pour qui capitaliser les connaissances implique que l'on constitue un capital qui sera ensuite valorisé. Ainsi, la capitalisation des connaissances est un processus qui inclut le repérage ou l'identification des sources de connaissances, leur formalisation, leur organisation et leur stockage, leur distribution, et leur maintenance : «Capitaliser les connaissances de l'entreprise consiste à repérer ses connaissances cruciales, à les préserver et les pérenniser tout en faisant en sorte qu elles soient partagées et utilisées par le plus grand nombre au profit de l augmentation de richesse de l entreprise». En fait il s'agit de renforcer tout ce qui - au delà des tâches répétitives et automatisables - peut améliorer les moyens de gestion des savoirs, permettre de formaliser des pans de savoir-faire et partager les connaissances non structurées (Grundstein, 2000). Enfin, Prax inclut le facteur humain et considère la gestion des connaissances comme un «processus de création, d enrichissement, de capitalisation et de diffusion des savoirs qui implique tous les acteurs de l organisation en tant que consommateurs et producteurs.» (Prax, 2000). Cette définition insiste sur l implication des acteurs de l entreprise dans le processus de gestion des connaissances. 19

1.3.2 Quelques approches de gestion des connaissances Différentes approches de gestion des connaissances ont été identifiées dans la littérature. Vu l interdisciplinarité du domaine : ingénierie des connaissances, systèmes experts, ingénierie documentaire, sciences de la gestion, etc., certains auteurs abordent la problématique de la gestion des connaissances du point de vue de la nature des connaissances : qu elles soient des connaissances tacites ou des connaissances implicites. D autres approches se focalisent sur un aspect plutôt qu un autre : technologique, organisationnel, etc. Nous présentons ci-dessous quelques courants de pensée, et nous mettons particulièrement l accent sur les Systèmes à Base de Connaissances et la mémoire d entreprise. 1.3.2.1 Approche connaissances tacites vs approche connaissances explicites L approche connaissances tacites suppose que les connaissances d une organisation se composent en grande partie des connaissances tacites qui demeurent dans les têtes des individus de l'organisation. En considérant le point de vue de (Sanchez, 2000) et partant du fait que les connaissances sont en soi personnelles, l approche connaissances tacites peut être accomplie par le biais du transfert de personnes en tant que "porteurs de connaissances" d'une partie de l organisation vers une autre. Ce transfert peut se baser sur les formations des employés car la formation favorise l échange des idées. Pour assurer une utilisation assez large des connaissances tacites, celles-ci sont d abord identifiées, ensuite organisées en différentes catégories. Il s agit selon Sanchez, d identifier par les décideurs, les connaissances que possèdent les employés et d organiser ensuite, les différentes catégories d interactions entre les connaissances individuelles qui pourraient aider à l exécution des activités quotidiennes ; transférer les connaissance d'une partie de l'organisation à une autre ; et/ou créer de nouvelles connaissances qui peuvent être utiles pour l'organisation (Sanchez, 2000). De cette façon, les recommandations relatives à la pratique de la gestion des connaissances tacites se focalisent sur la gestion des employés comme des individus porteurs de connaissances. Une telle approche, peut contribuer à l amélioration de la satisfaction et de la motivation des employés en faisant connaître leurs connaissances à d autres parties de l organisation par exemple. En outre, cette approche est susceptible d'éviter certaines difficultés qui peuvent être rencontrées grâce notamment à la coopération entre individus en rendant leurs connaissances explicites. 20

L inconvénient de cette approche est que les connaissances demeurent dans les têtes des individus et que la seule manière de transférer ces connaissances ou des les faire partager est de faire déplacer les personnes. Or, cela nécessite une organisation adaptée pour éviter de causer la perte des connaissances qui ne sont jamais transférées. Un exemple de l'approche orientée connaissances tacites visant particulièrement le transfert de connaissances dans l organisation est fourni par Toyota dans (Spear et Bowen, 1999). Contrairement à l'approche connaissances tacites, l'approche connaissances explicites suppose que les connaissances utiles des employés d une organisation doivent être explicitées sous forme de document, schéma, description structurée de processus, ou toute autre forme d explicitation du capital de connaissances individuelles. Une fois retranscrites, ces connaissances seront accessibles via le système d information de l entreprise et par conséquent elles seront disséminées dans toute l organisation (Sanchez, 2000). Il s agit en effet de la formalisation des savoir-faire d experts qui peut s effectuer selon les techniques et modèles appropriés. Cet aspect est abordé dans la section ( 1.3.3). 1.3.2.2 Approches technologique vs approche managériale Si certaines approches privilégient l aspect technologique, d autres mettent l accent sur l aspect managérial. C est dans le domaine de l Ingénierie des Connaissances, que l approche technologique est le plus souvent utilisée (Barthès, 1999). La gestion des connaissances, dans cette approche, se définit comme «le processus de capture et d'enregistrement de l'expertise collective d'une entreprise quel que soit l'endroit où cette dernière réside (les bases de données internes ou externes, les documents de toute nature et format ainsi que dans la "tête des individus" puis de sa redistribution là où elle est susceptible de produire des profits» (Crié, 2003). Pour cet auteur, les méthodes et outils de la gestion des connaissances doivent être développés à partir de trois axes : stockage de connaissances, partage de connaissances et extraction de connaissances. Il propose alors, des outils de gestion des documents pour le stockage de connaissances, des outils de moteur de recherche traditionnelle pour le partage de connaissances, et des outils de text mining, web mining, et data mining pour l extraction de connaissances. Dans l approche managériale, la gestion des connaissances vise «à permettre aux membres de l organisation d être informés de façon pertinente, à s approprier des connaissances, à les échanger en 21

interagissant avec un collectif jusqu à faire émerger des solutions innovantes et créatrices de valeur qui viendront compléter les connaissances de l entreprise et entraîner leur évolution.» (Barthelme- Trapp, 2001). En effet, l approche managériale suggère de placer les échanges, la transmission de connaissances et les comportements coopératifs des membres de l organisation au cœur des processus de gestion des connaissances. Dans cette approche, «la démarche du gestionnaire sur les besoins précis de l organisation peut conduire à proposer des solutions organisationnelles favorables à une meilleure gestion des connaissances sans pour autant présenter un volet technologique important. [ ] Le but d une approche managériale de gestion des connaissances est d axer la démarche sur une série d objectifs encadrant des aspects techniques et auxquels il est alors possible d associer des gains d efficience et d accroissement de valeur» (Barthelme-Trapp, 2001). 1.3.2.3 Approche orientée informations vs approche orientée connaissances Causannel et Chouraqui distinguent au travers des différents travaux qui ont été réalisés dans le domaine de la gestion des connaissances, l approche «orientée information» de l approche «orientée connaissances». Selon les auteurs, l approche orientée information pour la gestion des connaissances se concentre sur l amélioration de la gestion et de l échange d informations en essayant d éviter les frontières organisationnelles ou professionnelles. Elle se fonde sur l élaboration d outils informatiques facilitant le travail coopératif et la communication entre les différents collaborateurs de l entreprise (ex : outils de groupware). Elle permet également l échange de connaissances explicites au moyen d outils de type workflow ou gestion documentaire (Caussanel et Chouraqui, 1999). L inconvénient de cette approche est que les connaissances gérées ne sont pas formalisées, voire, non clairement identifiées. L approche orientée connaissances, très liée aux recherches effectuées en Ingénierie des Connaissances, se base sur une étape de capitalisation qui consiste à recenser puis à modéliser les connaissances (Abecker et al., 1998). Les connaissances sont alors modélisées (i.e. représentées sous forme d informations) tout en intégrant une sémantique et un contexte pour former une Base de Connaissances. L élaboration d un tel système correspond à une phase de capitalisation d un sous-ensemble ou de l ensemble des connaissances de l organisation. 22

1.3.3 Les systèmes de gestion des connaissances 1.3.3.1 Les Systèmes à Base de Connaissances (SBC) Les Systèmes à Base de Connaissances permettent le stockage et la consultation de connaissances, le raisonnement automatique sur les connaissances stockées (sans préjugé sur le type de raisonnement à mener), la modification des connaissances stockées (ajout ou suppression de connaissances), ainsi que le partage de connaissances entre systèmes informatiques. De manière générale, il s agit de permettre un dialogue et une coopération entre le système et l utilisateur humain (systèmes d aide à la décision, systèmes d enseignement assisté par ordinateur, recherche d information sur le web). Le système doit donc avoir accès non seulement aux termes utilisés par l être humain, mais également à la sémantique que ce dernier associe aux différents termes, faute de quoi aucune communication efficace n est possible. Plus précisément, les représentations symboliques utilisées dans les machines doivent avoir du sens aussi bien pour la machine que pour les utilisateurs c'est-à-dire, relier les informations représentées à d autres informations. Dans cette approche qui s insère dans le courant de la pensée systémique, la connaissance se perçoit comme un élément qui contient de l information avec trois points de vue, la structure, la fonction et l évolution. La gestion des connaissances consiste alors à analyser les connaissances du domaine considéré au travers de cet ensemble de points de vue de manière à en produire une modélisation complète. Elle repose sur la modélisation explicite des connaissances de certains experts ou spécialistes de l entreprise ainsi que la représentation formelle des connaissances sous-jacentes à un document (Dieng et al., 1999). Son but est d aider l utilisateur en lui fournissant des informations appropriées de l entreprise tout en lui laissant la responsabilité d une interprétation et d une évaluation contextuelle de ces informations (Kühn et Abecker, 1997). Elle se traduit par un système à base de connaissances (SBC). Un SBC permet le stockage et la consultation des connaissances, le raisonnement automatique sur ces connaissances et leur modification si nécessaire (ajout ou suppression de connaissances). Avec le développement des réseaux, un SBC permet également le partage de connaissances entre systèmes informatiques. L élaboration d un système de gestion des connaissances utilise les méthodologies d ingénierie des connaissances en particulier les méthodes de modélisation des connaissances. Ces méthodes sont employées selon le niveau de modélisation visé par le concepteur du système. Les 23

niveaux de modélisation des connaissances peuvent varier d un simple annuaire de compétences de l entreprise, à une base de meilleures pratiques (O Leary, 1998) ou un livre de connaissances (Ermine, 1996). Une illustration de la mise en œuvre de cette approche est la méthode CommonKADS. CommonKADS est une méthode permettant de mettre en place un processus d acquisition des connaissances pour la conception de Systèmes à Base de Connaissances (SBC). Elle prend en compte tous les aspects de la gestion des connaissances et permet de faire l'analyse des connaissances et d'aider au développement de systèmes fortement basés sur les connaissances. Ses origines remontent à 1985 lorsque la méthode a été mise au point sous le nom de KADS (pour Knowledge Acquisition and Design System) dans le cadre d un projet européen. Le projet étant reconduit en 1990, la méthode a subi de profonds changements pour devenir CommonKADS à partir de 1992 (Wielinga et al., 1993). CommonKADS propose une synthèse et une amélioration de nombreuses techniques, et permet de traiter le processus d acquisition des connaissances, depuis le recueil de connaissances jusqu au développement d un système complet. Elle repose sur le principe du niveau de connaissance (Knowledge Level) qui stipule que l'on peut s'exprimer en terme d'agent, de but, de tâche et de connaissances (Schreiber et al., 1999). Ainsi, elle se focalise d'abord sur les aspects conceptuels. Elle s appuie sur une bibliothèque de six modèles fortement formalisés pour analyser et représenter les connaissances. Ces modèles permettent aussi bien la capture et la formalisation des connaissances que la compréhension du problème réel de l entreprise et de ses besoins. Ils sont en effet, destinés à couvrir les différents problèmes devant être traités lors du développement d un SBC. Le développement des modèles est conduit par les objectifs du projet et tient compte des risques. En principe, un modèle ne nécessite pas d être entièrement développé avant qu un autre puisse être abordé. Ces modèles sont (De Hoog, 1994) : - Le modèle de l organisation permet de décrire l entreprise dans son ensemble avec ses grandes fonctions et ses capacités en termes de ressources. Il facilite l identification des impacts possibles sur l organisation lors de l intégration d un SBC ; - Le modèle de tâche décrit les tâches qui sont exécutées dans l environnement de l organisation. Ce modèle contient les tâches 24

nécessaires à la réalisation des fonctions décrites dans le modèle de l organisation ; - Le modèle d agent permet de modéliser les agents, humains ou informatiques, impliqués dans la réalisation des tâches ; - Le modèle d expertise (ou de connaissances) décrit les capacités de résolution de problèmes d un agent. Il différencie notamment les connaissances applicatives des connaissances stratégiques ; - Le modèle de communication se charge de rendre compte de la communication nécessaire entre les agents (notamment de la communication homme-machine) pour la réalisation d une tâche ; - Les modèles de conception concernent la conception du SBC qui a pour objectif l opérationnalisation des connaissances modélisées. Le processus d élaboration d un SBC avec CommonKADS est un processus itératif, commençant généralement par une phase de prototypage rapide (cf. figure 1.2). Figure 1.2 : Le processus de développement d un SBC avec CommonKADS CommonKADS est basée sur la séparation des phases d analyse et de conception. Pour la phase d analyse, CommonKADS offre une approche structurée dirigée par les modèles, une structure à quatre niveaux pour formaliser les connaissances (niveau linguistique, conceptuel, logique et implantation) ainsi qu une bibliothèque de modèles d interprétation. Pour 25

la phase de conception, la méthode adopte les méthodes classiques de génie logiciel tout en prenant en compte les spécificités des SBC (Dieng, 1990). Cette méthodologie suit une approche de développement de projet selon un cycle de vie en spirale (Schreiber, 1999). Ce cycle de vie comprend quatre phases qui se déclinent en étapes de modélisation: - l examen des objectifs, qui consiste à évaluer l état courant du projet, puis à établir les objectifs du prochain cycle ; - l analyse des risques qui permet d identifier et d évaluer les risques, ainsi que de prévoir les actions nécessaires afin de les éviter ; - la planification qui sert à planifier le travail à partir des deux premières phases, en le découpant en tâches, en réalisant un planning, en allouant les ressources et en établissant les critères d acceptation du cycle ; - la maintenance qui consiste à superviser le travail spécifié dans les phases précédentes et à préparer l évaluation d une nouvelle étape d examen des objectifs. Des outils dédiés à la mise en œuvre de CommonKADS ont été développés parmi lesquels, il y a OpenKADS et KADS Tools développés par Cap Gémini. 1.3.3.2 La Mémoire d Entreprise (ME) L approche mémoire d entreprise vise à localiser et à rendre visible les savoirs et savoir-faire de l entreprise en vue de leur exploitation par les employés. Ce terme récent résulte «d une prise de conscience par un nombre croissant d entreprises que les connaissances détenues par les employés constituent un capital immatériel qu il convient de gérer au même titre que le capital financier, les machines et le bien immobilier» (Barthès, 1999). Dans (Van Heijst, 1996) la mémoire d entreprise est définie comme la «représentation explicite, persistante et désincarnée des connaissances et des informations dans une organisation». Par ailleurs, (Nagendra Prasad et Plaza, 1996) définissent la mémoire d entreprise comme «l ensemble des données collectives et des ressources de connaissances d une entreprise». La gestion des connaissances selon cette approche, peut être vue comme «la gestion d un réservoir de taille plus au moins importante rassemblant les connaissances de l entreprise. La taille la plus petite correspondant à une mémoire individuelle, celle d un expert d un domaine donné, la taille la plus grande correspondant à la mémoire de l entreprise et rassemblant à ce titre l ensemble des connaissances sur l organisation, les activités, les produits, etc., de l entreprise.» (Meingan, 2002) 26

Selon la typologie de la mémoire d entreprise, celle-ci peut inclure des connaissances sur les produits, les procédés de production, les clients, les stratégies de ventes, les résultats financiers, les plans et buts stratégiques, etc. Elle peut également inclure des bases de données, des documents électroniques, des rapports, des spécifications de produits et de la logique de conception. En effet, il existe une variété de typologies de mémoire d entreprises : mémoire de projet, mémoire métier, mémoire distribuée, mémoire documentaire, mémoire à base de cas, etc. Les caractéristiques de quelques unes de ces mémoires d entreprise sont définies dans (Gandon, 2002). Citons l exemple de la mémoire documentaire dont l objectif est de permettre la capitalisation des ressources documentaires de l entreprise. La notion de mémoire documentaire est proche des entrepôts de connaissances qui contiennent des données qualitatives et regroupent des manuels, des règles de conception, des spécifications et des codes sources (O'Leary, 1998). Ce type de mémoire d entreprise peut être vu comme un système réaliste de gestion des connaissances «Un bon système de documentation est probablement la solution la moins chère et la plus réaliste pour la capitalisation des connaissances.» (Poitou, 1995). La mémoire documentaire se base sur l intégration des documents existant au sein de l entreprise. On peut ainsi introduire toutes les catégories de documents de l organisation désignés comme utiles pour la capitalisation (documents liés aux projets ; rapports techniques, articles scientifiques et techniques, normes, archives, guides, dossiers d'intelligence technologique, documentation en ligne, manuels d'utilisateurs, manuels de référence, dossiers commerciaux, etc. Une mémoire documentaire se matérialise par un système documentaire exploitant les documents existants de l entreprise (Dieng et al., 2000). Ce système peut se traduire par un ensemble de bases documentaires développées sous Lotus Notes par exemple, ou par des applications Web généralement accessibles via l Intranet de l entreprise. Par conséquent, la construction de la mémoire documentaire repose sur les méthodes et techniques de la gestion documentaire issues du domaine de l ingénierie documentaire et des sciences de l information ainsi que les technologies du Web. La construction de la mémoire documentaire se fait suivant un ensemble d étapes proposées dans (Dieng et al., 2000): 27

- Le choix des fonds documentaires qui seront intégrés dans la mémoire : il s agit de déterminer les documents qui devront faire partie de la mémoire, compte tenu des objectifs et des utilisateurs visés par la mémoire. - La numérisation des documents qui consiste en la transformation des documents papiers en documents électroniques, grâce à l utilisation de scanners, ou de systèmes de reconnaissance optique de caractères (OCR). - L homogénéisation éventuelle du format des documents suivant leur nature. Selon le cas, on peut adopter des formats bureautiques classiques (Word, Excel), des formats fortement structurés (SGML, XML) ou des formats pour le Web (HTML). Les formats HTML et XML sont particulièrement intéressants si l on souhaite rendre les documents accessibles via l intranet de l entreprise en utilisant les technologies du Web. Si les documents originaux sont d un format différent de celui choisi pour la mémoire, il est possible de les faire migrer vers un format standard tel que XML par exemple. Mais l entreprise peut aussi préférer garder les formats (éventuellement hétérogènes) des documents originaux, si cela n entrave pas leur gestion et leur accès dans la mémoire documentaire. L entreprise peut ainsi choisir d exploiter un système de gestion documentaire capable de collecter des informations à partir de plusieurs sources documentaires : documents électroniques dans le système de fichiers, pages intranet, pages Web externes, courrier électronique et base de données relationnelles. - L élaboration éventuelle de nouveaux documents : il est envisageable d intégrer des documents décrivant explicitement les savoir-faire d experts (après une phase d acquisition de leurs connaissances). Ce type de documents est considéré comme un livre de connaissances (Ermine, 1998). - L indexation des documents : a pour rôle de faciliter la recherche d information dans la mémoire documentaire. Différents types d index peuvent être utilisés : index intégral, index relatif au domaine de connaissances capitalisées, index relatif aux activités de l entreprise (tâches des utilisateurs par exemple) ou un thésaurus spécialisé. - Le choix de l organisation de la mémoire documentaire : pour être accessible aux utilisateurs, la mémoire documentaire doit être organisée, mise en forme et structurée. Dans certains cas, l organisation de la mémoire peut refléter la structure organisationnelle de l entreprise ou de l unité organisationnelle concernée par l opération de capitalisation (site, département, service, équipe de projet, etc.). Dans d autres cas, cette organisation peut reposer sur un modèle des processus de travail ou des tâches dans l entreprise, voire sur une taxonomie liée au domaine ou au métier concerné. Cette organisation peut par ailleurs, prendre en compte le statut des documents : documents de référence, documents de travail, documents liés à un projet particulier, etc. Il est souhaitable que cette 28

organisation de la mémoire soit stable et ne soit pas modifiée à chaque restructuration de l entreprise ou de l unité organisationnelle concernée. - L utilisation d un système de gestion électronique de documents (GED) : un tel système peut permettre la préparation des documents, l ajout ou le retrait de documents, la recherche documentaire et le traitement des documents. Un système de GED traite en général tout le cycle de vie de certains documents importants de l entreprise. Il offre des fonctionnalités telles que la création et la modification des documents, le stockage, la recherche, la consultation et la diffusion et l archivage. Un tel outil peut gérer aussi bien le contenu des documents que l ensemble des descriptions de ceux-ci, c'est-à-dire les métadonnées. - La mise à disposition des documents dans l intranet de l entreprise : un moteur de recherche, qui peut être intégré dans le système de gestion documentaire, doit permettre aux utilisateurs de rechercher les documents pertinents dans la base documentaire, sans qu ils aient besoin de connaître le format des documents ou leur lieu de stockage. Selon le moteur de recherche, la précision de la recherche peut être améliorée par des capacités sophistiquées (ex : traitement linguistique). - L évolution de la mémoire : l entreprise doit choisir un mode de collecte de nouveaux documents à intégrer dans la mémoire. Selon le cas, cette collecte peut être active ou passive du point de vue de l entreprise. Elle peut être centralisée dans un service administrant la mémoire documentaire ou répartie entre les membres de l entreprise. La mise en place d une procédure de validation de nouveaux documents avant qu ils puissent être intégrés dans la mémoire est alors recommandée. Dans le cas où la collecte des documents est répartie, le service administrant la mémoire documentaire pourra éventuellement vérifier que les nouveaux documents respectent bien les formats institués pour la mémoire. L indexation des nouveaux documents devra être effectuée suivant les normes choisies par l entreprise. Elle peut s effectuer soit manuellement par les auteurs mêmes des documents ou par des personnes chargées de cette tâche, soit automatiquement en s appuyant sur l outil d indexation préalablement développé. 29

Notons qu il est possible de combiner plusieurs techniques pour construire une mémoire d entreprise, car on peut exploiter à la fois des connaissances informelles, tels les documents ; et des connaissances formelles comme les connaissances représentées explicitement dans une base de connaissances au sein d une même mémoire d entreprise (Martin et Alpay, 1996), (Euzenat, 1996). Une architecture intéressante de mémoire d entreprise où celle-ci peut être composée de différentes sortes de mémoires: documents, bases de données, bases de connaissances, etc. est proposée dans (Kühn et Abecker, 1997) et (Abecker et al., 1998). 1.4 Le processus de la gestion des connaissances Un processus de gestion des connaissances se définit tout d abord en fonction de l approche de gestion des connaissances adoptée. Il peut également se définir à partir des fonctionnalités attendues du système de gestion des connaissances à mettre œuvre. Ces fonctionnalités sont généralement axées sur la capitalisation des connaissances en vue de leur réutilisation. Parmi les nombreux processus de gestion des connaissances que nous avons examinés (Gandon, 2002), (Dieng et al., 2000), le processus que propose Grundstein semble suffisamment représentatif et précis (Grundstein, 2002). Ce processus s articule autour de quatre facettes qui sont : le repérage des connaissances cruciales, la préservation, la valorisation et l actualisation des connaissances. Chacune de ces facettes se décline en plusieurs tâches comme le montre la figure 1.3. La gestion des connaissances s effectue alors grâce aux interactions entre les différentes facettes décrites ci-dessous (Grundstein, 2002). - Le repérage des connaissances cruciales, consiste en la collecte des savoirs et savoir-faire nécessaires aux processus de décision et au déroulement des processus essentiels des activités de l'entreprise. Selon l auteur, il faut les identifier, les localiser, les caractériser, en faire des cartographies, estimer leur valeur économique et les hiérarchiser. - La préservation des connaissances : il faut les acquérir auprès des porteurs de connaissances, les modéliser, les formaliser et les conserver. - La valorisation des connaissances : il faut les mettre au service du développement et de l'expansion de l'entreprise c'est-à-dire les rendre accessibles selon certaines règles de confidentialité et de sécurité, les diffuser, les partager, les exploiter, les combiner et créer des connaissances nouvelles. 30

L actualisation des connaissances : il faut les évaluer, les mettre à jour, les standardiser et les enrichir au fur et à mesure des retours d'expériences, de la création de connaissances nouvelles et de l'apport de connaissances externes. Localiser Repérer Identifier Modéliser Préserver Formaliser Patrimoine de connaissances Mettre à jour Actualiser Enrichir Accéder Valoriser Diffuser Figure 1.3 : Le processus de gestion des connaissances selon Grundstein. 1.5 Les outils de gestion des connaissances Il existe une typologie relativement complexe de produits se revendiquant des outils de gestion des connaissances. Des solutions conçues spécialement pour faciliter la gestion des connaissances aux outils qui supportent quelques parties du processus de la gestion des connaissances, l offre du marché dans ce domaine est aujourd hui florissante. Dans ce contexte, Blamisse distingue «les outils de gestion des connaissances» des «outils du gestion des connaissances» (Blamisse, 2004). Selon l auteur, la première catégorie regroupe les outils qui sont des plateformes entièrement dédiées à la gestion des connaissances et étiquetée comme telle sur le marché, tels que KnowledgeManager de Knowings et KnowledgeMaker de Ardans, tandis que la deuxième catégorie regroupe des outils initialement dédiés à d autres activités, mais qui peuvent s appliquer à certaines activités de la gestion des connaissances. C est par exemple le cas des outils de travail collaboratif, comme QuickPlace de IBM/lotus ou eroom de EMC-Documentum. 31

1.5.1 Ce que doit permettre un outil de gestion des connaissances Un outil de gestion des connaissances est un outil informatique dont l objectif est de faciliter l assimilation et la compréhension des informations par les individus pour les transformer en connaissances. En plus des fonctionnalités qui sont évidemment importantes, un outil de gestion des connaissances doit répondre à un certain nombre de caractéristiques. Ces caractéristiques sont décrites dans (Balmisse, 2004). Il s agit selon l auteur de : - Faciliter la mise en contexte de l information, une information est d autant plus vite assimilée qu elle est présentée dans un contexte proche de celui que l individu connaît bien. Pour faciliter la mise en contexte de l information, il est impératif d attacher à celle-ci des métadonnées décrivant son contexte dès son intégration dans l outil de gestion des connaissances. Ensuite, grâce à un système d organisation des connaissances, il sera beaucoup plus facile de manipuler et de gérer les informations en fonction de leur contexte et du contexte recherché par l utilisateur. - Diffuser de manière intelligente l information, la vocation d un outil de gestion des connaissances est de faciliter la compréhension de l information pour pouvoir être utilisée par le collaborateur. Pour être en mesure de répondre à l ensemble des besoins des collaborateurs, un outil de gestion des connaissances doit proposer différents types de diffusion tout en offrant la possibilité de combinaison des différents modes de diffusion en fonction des besoins. - Faciliter les interactions entre les individus, car il est nécessaire qu un outil de gestion des connaissances puisse soutenir et favoriser les échanges sociales entre les collaborateurs. Il s agit non seulement d offrir des fonctionnalités de travail collaboratif traditionnelles, mais de soutenir la volonté des individus de se rassembler spontanément pour interagir entre eux. - Fournir une interface utilisateur soignée, les interactions offertes par une bonne interface utilisateur doivent contribuer à augmenter la confiance de l utilisateur: fonctionnement sans erreurs, organisation fonctionnelle claire et cohérente, stabilité dans le temps, etc. En effet, une interface utilisateur ergonomique et conviviale permet à l outil de gestion des connaissances, un succès auprès des utilisateurs. 32

Trois catégories d outils de gestion de connaissances sont distingués à travers cette étude: les solutions intégrales de gestion de connaissances, les suites logicielles et les outils offrants certaines fonctionnalités (Blamisse, 2004). 1.5.2 Les solutions intégrales de gestion des connaissances Le cœur des outils dédiés à la gestion des connaissances est constitué d une base de connaissances dont la structuration varie d un éditeur à l autre. Cette base de connaissances est généralement valorisée par la mise à disposition de fonctionnalités facilitant les interactions entre individus. Parmi ces outils citons les logiciels suivants : Logiciel Editeur Site web Knowledge Maker Ardans www.ardans.fr KM Server Thalès-Arisem www.arisem.com Athanor Knowesis www.knowesis.fr Knowledge Manager Knowings www.knowings.com ITM Mondeca www.mondeca.com 1.5.3 Les suites logicielles Les suites logicielles sont le résultat de la convergence de produits de portail, de gestion de contenu et de travail collaboratif qui permettent de gérer les différentes fonctions attendues d une plateforme de gestion des connaissances. Parmi les composants les plus fréquemment proposés, nous pouvons citer les composants : - de soutien à la collaboration ; - de gestion de contenu ; - d accès à l information ; - de gestion des processus métier (Business Process Management) ; - de text mining et de Business Intelligence. 1.5.4 Les outils offrant certaines fonctionnalités Il existe un certain nombre d outils qui proposent certaines fonctionnalités de la gestion des connaissances tels que l accès aux connaissances, 33

l extraction de connaissances ou encore le partage des connaissances à travers les espaces de travail collaboratif. En ce qui concerne les outils d accès aux connaissances, il s agit d outils qui ont pour vocation de faciliter l accès à la connaissance explicite disséminée dans le système d informations de l entreprise. Certains éditeurs proposent des outils capables de rechercher également des individus à partir de leur profil d expertise. La vocation des outils d extraction de connaissances est d identifier l information pertinente en mettant des éléments en relation pour restituer une information complète et structurée à partir d un patron prédéfini. Pour se faire, ces outils mettent en œuvre une analyse du texte pour interpréter et construire une représentation formelle qui permettrait d'apporter automatiquement des réponses précises à l'utilisateur. 34

2 Rôle des ontologies dans la gestion des connaissances C est à partir des années 90 que les ontologies sont apparues dans le domaine de l Ingénierie des Connaissances (IC), et plus largement en Intelligence Artificielle (IA), comme une approche de modélisation et de représentation des connaissances. Elles se sont introduites dans le cadre des démarches d acquisition des connaissances pour les Systèmes à Base de Connaissances (SBC) et ont évolué vers la représentation des connaissances et leur organisation. Durant la dernière décennie, l utilisation des ontologies pour la gestion des connaissances s est avérée avantageuse dans le domaine de la recherche en intelligence artificielle où la gestion des connaissances est basée sur la représentation des connaissances de façon à simuler le raisonnement humain afin de modéliser les connaissances d une façon utilisable par la machine (Barthès, 1997). Ainsi, les ontologies sont utiles pour construire des systèmes de gestion des connaissances. Elles permettent la représentation des connaissances et la modélisation des raisonnements qui sont des caractéristiques fondamentales des SBC. Elles ont pour rôle de fournir un système de concepts fondamentaux du domaine, afin de construire une base de connaissances. La conceptualisation permise par les ontologies représente en effet, une base solide sur laquelle sont construites des bases de connaissances partageables et utilisables. Une ontologie 8 modélise à l aide d un formalisme approprié les connaissances spécifiques d un domaine d application. Elle permet ensuite, la recherche et la restitution des connaissances dans des bases de connaissances et des systèmes d informations hétérogènes et distribués. La recherche via une ontologie est souvent basée sur la sémantique en exploitant les mécanismes de raisonnement et l inférence. Nous commençons le présent chapitre par une présentation succincte de ce que sont les ontologies et comment elles sont développées. Pour mieux cerner le rôle des ontologies dans la gestion des connaissances de l entreprise, nous mettons l accent dans notre analyse, sur l utilisation 8 Il s agit ici des ontologies du domaine qui s attachent à décrire le vocabulaire inhérent à un domaine particulier (ex : le tourisme). 35

des ontologies pour la représentation des connaissances ( 2.2) ainsi que leur indexation et/ou annotation ( 2.3). Ensuite, nous abordons dans la section ( 2.4), les différents modes de réutilisation des connaissances basée sur les ontologies. 2.1 Définition et développement des ontologies Le terme ontologie est un terme grec composé des mots «ontos» et «logos» qui veulent dire respectivement l essence de l être. Ce terme, hérité d'une tradition philosophique qui s intéresse à la science de l Etre, est apparu dans le domaine informatique grâce notamment au projet ARPA Knowledge Sharing Effort (Gruber, 1991). La première définition pour les ontologies dans le domaine de l intelligence artificielle est donc donnée par Gruber : «une ontologie est une spécification explicite d une conceptualisation. Le terme est emprunté de la philosophie, où l ontologie est un ensemble de choses existantes. Pour les systèmes d IA, ce qui existe est ce qui peut être représenté.» (Gruber, 1993). Retenons qu une ontologie est un vocabulaire commun qui définit le sens des concepts et les relations entre ces concepts. Ce vocabulaire peut être associé à un modèle qui décrit le contenu d une base de connaissances, ses propriétés, la manière dont elle peut être utilisée ainsi que la syntaxe et les contraintes fournis par le langage de représentation. L objectif est d assurer la spécification explicite des connaissances au niveau conceptuel en utilisant un langage formel offrant une sémantique qui peut être plus ou moins rigoureuse, permettant une utilisation non ambiguë des connaissances du domaine. 2.1.1 Les composants d une ontologie Toutes les définitions citées dans (Mihoubi, 2000) et (Actes, 1999 s accordent sur le fait qu une ontologie est formée par des concepts et des relations entre ceux-ci et qu elle se réfère à un domaine. Ainsi, une ontologie peut être vue comme un treillis de concepts et de relations entre ces concepts destinés à représenter les objets du monde sous une forme compréhensible aussi bien par les hommes que par les machines. Si, certaines divergences relatives à la structure (degré de la formalisation) de l ontologie ont été constatées, les composants d une ontologie sont toujours les mêmes : une ontologie est constituée des concepts et des relations ainsi que des propriétés et des axiomes. 36

- Les concepts : sont des notions (ou objets) permettant la description d une tâche, d une fonction, d une action, d une stratégie ou d un processus de raisonnement, etc. Ils peuvent être abstraits ou concrets, élémentaires ou composés, réels ou fictifs. Habituellement, les concepts sont organisés en taxonomie. Une taxonomie est une hiérarchie de concepts (ou d objets) reliés entre eux en fonction de critères sémantiques particuliers. - Les relations : sont les liens organisant les concepts de façon à représenter un type d interaction entre les concepts d un domaine. Elles sont formellement définies comme tout sous-ensemble d un produit de n ensembles, c est-à-dire R: C1xC2x x Cn. Des exemples de relations binaires sont : sous-concept-de, connecté-à, sorte-de, etc. - Les propriétés (ou attributs) sont des restrictions des concepts ou des relations. - Les fonctions sont des cas particuliers de relations dans lesquelles le n ième élément de la relation est unique pour les n-1 précédents. Formellement, les fonctions sont définies ainsi, F: C1xC2x xcn-1, Cn. Comme exemple de fonction binaire, nous avons la fonction mèrede. - Les axiomes de l ontologie permettent de définir la sémantique des termes (classes, relations), leurs propriétés et toutes contraintes quant à leur interprétation. Ils sont définis à l aide de formules bien formées de la logique du premier ordre en utilisant les prédicats de l ontologie. - Les instances sont utilisées pour représenter des éléments. 2.1.2 Les types d ontologies Deux grandes classes d ontologies sont à distinguer : la première est liée au type de la structure de la conceptualisation ; la deuxième au domaine à conceptualiser. Concernant la première classe, l ontologie se présente de façon différente selon le degré de formalisation du langage utilisé pour définir la signification des termes (Uschold et al., 1997). Une ontologie est dite hautement informelle dans le cas d utilisation du langage naturel sans aucune restriction, semi-informelle lorsque le langage est de type langage naturel mais structuré avec un vocabulaire limité afin de restreindre les 37

ambiguïtés. Si l ontologie est représentée à l aide d un langage artificiel défini de façon formelle tel qu Ontolingua, l ontologie est alors semiformelle. Enfin, lorsque les termes possèdent une sémantique formelle dans un système tel que le calcul des prédicats du premier ordre comme c est le cas de l ontologie TOVE l ontologie est dite rigoureusement formelle. Dans la deuxième classe, l ontologie se définit selon le domaine étudié et le degré de généralité ou de précision des connaissances représentées, les types d ontologie les plus utilisées sont : 2.1.2.1 Les ontologies générales Les ontologies générales portent sur des concepts généraux qui se veulent indépendants d un domaine ou d un problème particulier, tels que les concepts de temps, d espace, de notion mathématiques, «elles sont prévues pour être utilisées dans des situations diverses et variées et peuvent servir une large communauté d utilisateurs, ainsi elles peuvent être utilisées dans l organisation des parties substantielles des connaissances humaines, comme la compréhension du langage naturel.» (Mihoubi, 2000). Plusieurs ontologies ont été développées pour décrire des concepts généraux ou des domaines particuliers. Parmi les ontologies générales il y a i) Cyc développée avec le modèle logique, en utilisant le langage CycL. Cette ontologie a la possibilité de construire des applications pour l extraction des connaissances, la recherche intelligente et la traduction, etc. ; et ii) KR Ontology qui utilise le modèle de treillis et le FCA (Formal Concept Analysis) pour représenter l ontologie. 2.1.2.2 Les ontologies du domaine Ce type d ontologies exprime des conceptualisations spécifiques à des ontologies de domaines particuliers tout en étant générique pour ce domaine. Ces conceptualisations mettent des contraintes sur la structure et les contenus des connaissances du domaine. De nombreuses ontologies de domaine ont été développées notamment dans le domaine de la modélisation de l entreprise : Enterprise Ontology, Tove, et dans le domaine médical UMLS. 2.1.2.3 Les ontologies d application Ces ontologies sont les plus spécifiques. Les concepts correspondent souvent aux rôles joués par les entités du domaine tout en exécutant une certaine activité (Maedche, 2002). Elles peuvent contenir des extensions spécifiques telles les méthodes et tâches. Elles contiennent toutes les définitions nécessaires pour décrire la connaissance requise pour une application particulière. 38

2.1.3 La construction d une ontologie Il existe trois méthodes possibles de création d une ontologie. Une ontologie peut être construite d une façon manuelle, automatique ou mixte. Dans le mode manuel, les experts réalisent l ontologie en s appuyant sur des techniques classiques de collecte et d analyse des connaissances comme c est le cas pour les niveaux supérieurs des ontologies Cyc et Wordnet. La création d une ontologie d une manière automatique se base sur des méthodes formelles et des techniques d extraction des connaissances en employant des outils linguistiques et statistiques. Parmi les méthodes qui peuvent être utilisées, citons l utilisation des méthodes de classification automatique issues de la théorie de l information ou encore les méthodes de regroupement conceptuel (en anglais, conceptual clustering) qui segmentent automatiquement les textes en unités thématiquement homogènes, et regroupent ces unités en fonction d une mesure de similarité fondée sur la fréquence des mots (Ferret et al., 2001). Enfin, dans le mode mixte, les ontologies sont construites par des techniques automatiques tout en intégrant des méthodes permettant d étendre des ontologies ayant été construites manuellement. Quel que soit le mode choisi, l élaboration de toute ontologie doit s appuyer sur un certain nombre de règles qu il est nécessaire de respecter et une méthodologie de construction d ontologies. 2.1.3.1 Les principes de construction d une ontologie Le processus de construction d une ontologie doit respecter certains principes de bases qui permettent d obtenir une ontologie susceptible de répondre aux objectifs de l ontologie. Le concepteur de l ontologie, se doit donc de garder à l esprit ces principaux critères tout au long du cycle de développement de son ontologie (Gruber, 1993) : - La clarté et objectivité : l ontologie doit fournir le sens des termes définis en offrant des définitions objectives ainsi que de la documentation associée en langage naturel. - L exhaustivité : une définition exprimée par une condition nécessaire et suffisante est préférable à une définition exprimée seulement par une condition nécessaire ou par une condition suffisante. 39

- La cohérence, afin de pouvoir formuler des inférences cohérentes avec les définitions. - L extensibilité monotone maximale : les nouveaux termes, qu ils relèvent de la langue générale ou d une langue de spécialité, devraient être inclus dans l ontologie sans entraîner de modifications dans les définitions existantes. - L intervention ontologique minimale: intervenir le moins possible sur le monde en phase de modélisation. L ontologie devrait spécifier le moins possible le sens de ses termes, de façon à ce que les parties impliquées dans l ontologie aient les mains libres pour spécialiser et instancier l ontologie à leur guise. 2.1.3.2 Méthodologies et cycle de développement d une ontologie L ingénierie ontologique ne propose à l heure actuelle, aucune méthode normalisée ou méthodologie générale de construction d ontologies, ce qui rend le processus d élaboration des ontologies long et coûteux. Cependant, certains auteurs ont proposé des méthodologies inspirées de leur expérience de construction d ontologies (Ferandez-Lopez et al., 1997), (Grüninger et Fox,1995), (Uschold et King, 1995) et (Staab et al., 2001). Ces méthodologies proposent à travers un ensemble d étapes, un cycle de développement d ontologies qui peut être adopté lors de la construction d une nouvelle ontologie. Il existe également, des méthodologies qui se focalisent sur une des étapes de construction d ontologies. Parmi ces méthodologies, citons la méthode proposée dans (Aussenac-Gilles et al., 2000) où les auteurs insistent sur l étape de conceptualisation par l analyse d un corpus textuel. Evoquons aussi, la méthodologie Ontospec, qui met l accent sur la structuration des hiérarchies de concepts et de relations durant la phase de conceptualisation (Kassel, 2002) ; ce qui est également le cas des principes différentiels énoncés par (Bachimont, 2001). Il en ressort que le cycle de développement général d une ontologie se déroule en trois principales étapes qui sont : la conceptualisation, la formalisation (appelée également ontologisation) et l implémentation. Ces étapes sont généralement précédées par une étape d évaluation des besoins et de délimitation du domaine de connaissances à modéliser. 40

2.1.3.2.1 L évaluation des besoins Dans (Uschold et King 1995), l évaluation des besoins a pour objectif de cerner le but visé par la construction de l ontologie. Cette évaluation des besoins, se décline en trois aspects qui correspondent à l objectif opérationnel de l ontologie, le domaine de connaissances à modéliser et les utilisateurs potentiels. En effet, il est indispensable de bien préciser l objectif opérationnel de l ontologie, en particulier à travers des scénarios d usage (Biebow et al., 1999). Aussi, le domaine de connaissances doit être délimité aussi précisément que possible, et découpé si besoin en termes de connaissances du domaine, connaissances de raisonnement et connaissances de haut niveau. La délimitation du domaine de connaissances repose sur l utilisation de ressources textuelles et/ou multimédia, constituant le corpus du domaine et au travers desquelles peuvent être appréhendées la terminologie du domaine et les significations des concepts. «Le point de vue actuel est qu un domaine n a de sens que défini par un corpus et une application en vue de laquelle l étude terminologique est effectuée» (Biébow, 2004). En effet, un domaine n est pas seulement défini par le champ de connaissance qu il couvre, mais aussi par le point de vue sous lequel les utilisateurs de l ontologie considèrent ce champ de connaissances (Uschold et King., 1995). Ces utilisateurs, doivent être identifiés en accord avec l objectif opérationnel ainsi que le degré de formalisation de l ontologie. 2.1.3.2.2 La conceptualisation La conceptualisation est un processus d abstraction qui consiste à identifier les concepts essentiels du domaine de connaissances et d établir les relations entre ces concepts, au sein d un corpus représentatif du domaine. Il s agit donc de décrire le domaine de connaissances grâce à des concepts plus ou moins précis et aux relations qui peuvent exister entre ces concepts. L identification des concepts et relations peut se faire selon l analyse des textes (documents, notes, comptes rendus d interviews, etc.) Cette analyse est généralement «une analyse informelle des textes qui peut être doublée par une analyse automatique permettant de détecter les termes et structures sémantiques (définitions, règles) présentes dans le corpus de documents» (Fernandez et al., 1997). 41

Néanmoins, cette analyse ne peut suffire à elle seule à spécifier la sémantique du domaine, car certaines connaissances ne prennent sens que lorsqu elles sont lues par un expert ou un spécialiste du domaine. La sémantique doit donc être précisée ou validée par les experts du domaine. Ces derniers peuvent soit contribuer directement à la construction de l ontologie, soit fournir des spécifications conceptuelles permettant de contraindre la sémantique exprimée. De plus, les experts peuvent faciliter l indication des instances connues des concepts, de leurs propriétés, leur sens ainsi que les contraintes éventuelles. Celles-ci sont établies en collaboration avec le concepteur de l ontologie. Par exemple, en décidant qu une notion est une instance, on pose la contrainte qu une instance ne peut pas être un concept. Pour identifier les concepts, (Uschold, 1996) suggère trois stratégies qui se déclinent en : - une approche descendante, où il s agit de partir des concepts les plus généraux et de les spécialiser par la suite ; - une approche ascendante qui consiste à considérer tous les termes spécifiques et ensuite à trouver les termes génériques associés, et - une approche intermédiaire dans laquelle les concepts se structurent autour des concepts importants du domaine (ni trop généraux, ni trop spécifiques). Ces concepts centraux sont ensuite reliés avec les concepts proches soit par spécialisation soit par généralisation. Après l identification des concepts et termes importants, il faut leur attribuer des définitions. Le but de la définition du sens des concepts dans une ontologie est différent de celui de la définition du dictionnaire. Les définitions d'ontologie ont un rôle normatif et indiquent comment un ensemble réduit de termes peut être utilisé par rapport à un autre (Uschold, 1996). Ainsi, chaque définition exige une bonne compréhension, notamment dans sa relation avec les autres définitions dans l'ontologie. L usage de définitions explicites en langage naturel favorise le partage sémantique. Néanmoins, la principale difficulté rencontrée durant le processus de la conceptualisation réside dans l émergence des différences significatives ou des contradictions au niveau du sens prêté à certains concepts ou relations. De fait, une normalisation sémantique est nécessaire. Cette normalisation doit être le fruit d un dialogue entre les experts (Bachimont, 2000). De manière générale, l échange entre experts est le meilleur moyen de faire émerger une sémantique claire et non ambiguë (Fernandez et al., 1997). 42

L engagement ontologique initialement proposé par Gruber comme un critère pour utiliser une spécification partagée d un vocabulaire est essentiel notamment pour respect la sémantique du domaine. «L engagement ontologique est une garantie de cohérence entre une ontologie et un domaine» (Gruber, 1993), car il spécifie les objets du domaine qui peuvent être associés au concept, conformément à sa signification formelle. Un concept est ainsi doté d une sémantique référentielle (celle imposée par son extension) et d une sémantique différentielle (celle imposée par son intension). Pour Gandon, il existe une complémentarité entre l intension et l extension d un concept : aux intensions qui incluent I1 I2 correspondent des extensions qui incluent E1 E2 et jugent indispensable de spécifier un concept à travers ces deux paradigmes sémantiques (Gandon, 2002). Au cours de ce processus, les connaissances sont structurées grâce notamment à l utilisation des relations et aux définitions spécifiant le sens associé à chaque concept. «La conceptualisation structure les connaissances identifiées, c est à dire, les concepts, instances et relations en représentations intermédiaires semi-formelles, comme le dictionnaire des données, les arbres de classification de concepts, et bien d autres» (Mihoubi, 2000). Ainsi, le processus de la conceptualisation mène à l élaboration d un modèle conceptuel qui décrit, au travers des éléments terminologiques et sémantiques les connaissances du domaine. Ce modèle conceptuel peut être complètement informel (exprimé en langage naturel et présenté sous forme de tableau par exemple) ou semi-formel, combinant langage naturel et propriétés formelles telle que les diagrammes de classes UML. Dans Fürst la structuration des connaissances, le consensus ontologique et la formalisation de l ontologie font partie d un processus appelé l ontologisation (Fürst, 2004). 2.1.3.2.3 La formalisation La formalisation concerne le modèle conceptuel obtenu à l étape précédente. Elle peut être vue comme une représentation explicite et formelle de la conceptualisation. Elle est réalisée par le biais d un langage formel ou formalisme qui est un ensemble de composants sémantiques (contenu), de règles structurelles (mode d'emploi) et d'une notation formelle particulière (forme) destinée à organiser les relations entre les éléments constituant l ontologie. L objectif de l utilisation d un langage de formalisation d ontologies, est de permettre d une part de réduire les 43

ambiguïtés du langage naturel en offrant une plus grande expressivité ; et d une autre part de rendre l ontologie compréhensible par les machines. «Les formalismes offrent un support formel à la composition des concepts et à leur comparaison» (Barry et al., 2001). Différents formalismes tels que les logiques de description, les réseaux sémantiques et les frames (schémas) peuvent être employés pour représenter formellement une ontologie. Les logiques de description représentent la connaissance sous forme de propositions ou affirmations sur le domaine. Les réseaux sémantiques, tout en gardant cette approche propositionnelle, tiennent compte de la structure et les relations entre ces propositions. Les frames représentent le domaine en termes de ses objets et leurs propriétés et relations. Ces paradigmes se différencient les uns des autres par leur formalisme de représentation des connaissances et leurs mécanismes d'inférence permettant de raisonner sur les représentations. Compte tenu de la diversité des formalismes de représentation des connaissances, les concepteurs d ontologies sont amenés à prendre en considération certains critères avant de choisir le langage le plus adéquat. Parmi ces critères, nous avons retenu trois proposés dans l étude comparative de (Barry et al., 2001) : - La puissance d expressivité : l expressivité varie d un langage à un autre, car elle est due à des différences de paradigmes de représentation. Ainsi, on ne retrouve pas dans les graphes conceptuels les mêmes restrictions de type et de cardinalité que dans les Logiques de Description. Elle est également dépendante des choix de conception, comme l association d un langage de règles à un langage de concepts. Ces différences sont également liées à la stabilité du langage. Ainsi, Ontolingua et Flogic possèdent une puissance d expression plus importante que celle de certains langages qui sont en cours d évolution tel que RDF/ RDFS. - La sémantique et la syntaxe : ce sont des éléments déterminants d un modèle uniforme de représentation des connaissances. Certains langages offrent la possibilité d utiliser une syntaxe de format standard permettant l échange des données à travers le Web comme XML. - L existence d outils associés d aide au développement : à chaque langage d écriture d ontologie formelle est associé un outil (logiciel, serveur,..) d aide à la construction de l ontologie. 44

A l issue de l étape de formalisation, on obtient une ontologie formelle. Cependant, certaines connaissances du domaine peuvent être abandonnées, du fait de l impossibilité de lever certaines ambiguïtés, ou du fait des limitations de l expressivité du langage utilisé. 2.1.3.2.4 L implémentation L implémentation consiste à outiller une ontologie pour permettre à une machine de manipuler des connaissances du domaine via cette ontologie. La machine doit donc pouvoir utiliser des mécanismes opérant sur les représentations de l ontologie. Or, si beaucoup de langages réifiant les modèles cités précédemment autorisent l expression des inférences des connaissances, peu sont outillés pour rendre possible la manipulation de ces connaissances. Les graphes conceptuels sont des modèles qui font exception car, la représentation des connaissances sous forme de graphes permet de mettre en œuvre des raisonnements par des opérations formelles sur les graphes (comparaison, fusion, etc.). La façon de mener ces opérations dépend cependant de l objectif opérationnel du système envisagé. Dans le cas où le formalisme utilisé n est pas opérationnel, il est nécessaire, soit d outiller ce langage, dans la mesure du possible, soit de transcrire l ontologie dans un langage opérationnel. Mais certains langages offrent des possibilités de raisonnement limités qui peuvent convenir à certaines applications limitées. Par exemple, les langages à base de frames et les logiques de description permettent de savoir si une connaissance donnée, ou une connaissance plus spécifique qu une connaissance donnée, est présente dans une base de connaissances en utilisant la relation de subsomption. Dans le cas d un simple système de stockage et de consultation de connaissances, de tels langages sont donc suffisants. Une fois l ontologie opérationnalisée, elle peut être intégrée en machine au sein d un système manipulant le modèle de connaissances utilisé via le langage opérationnel choisi. Mais avant d être livrée aux utilisateurs, l ontologie doit être testée par rapport au contexte d usage pour lequel elle a été conçue. 2.1.3.3 Les outils d aide à la construction d ontologies De nombreux outils de construction d ontologies utilisant des formalismes variés et offrant différentes fonctionnalités ont été développés. Nous évoquons ici essentiellement ceux qui constituent des implémentations de méthodologies. 45

Commençons par TERMINAE, qui, à travers l outil d ingénierie linguistique LEXTER, permet d extraire d un corpus textuel les candidatstermes d un domaine (Biebow, 1999). Ces concepts doivent ensuite être triés par un expert et organisés hiérarchiquement, puis la sémantique du domaine est précisée à travers des axiomes. TERMINAE offre ainsi une aide à la conceptualisation. En revanche, tous les autres outils d aide à la construction d ontologies sont plus ou moins indépendants des formalismes de représentation. L éditeur d ontologie DOE (Differential Ontology Editor) (Troncy et Issac, 2002) offre la possibilité de construire les hiérarchies de concepts et relations en utilisant les principes différentiels énoncés par Bachimont, puis en ajoutant les concepts référentiels. La sémantique des relations est ensuite précisée par des contraintes. Ce n est qu une fois l ontologie ainsi structurée qu elle est formalisée en utilisant la syntaxe XML (une extension permettant la transcription en RDF(S)/DAML+OIL est prévue). De même, l outil ODE (Ontology Design Environment) (Blazquez et al., 1998), (ODE, 2002) permet de construire des ontologies au niveau connaissances, comme le préconise la méthodologie Methontology. L utilisateur construit son ontologie dans un modèle de type frame, en spécifiant les concepts du domaine, les termes associés, les attributs et leurs valeurs, les relations de subsomption. L ontologie opérationnelle est alors générée en utilisant les formalismes Ontolingua ou Flogic. OntoEdit (Ontology Editor) (Maedche et al., 2000)) est également un environnement de construction d ontologies indépendant de tout formalisme. Il permet l édition des hiérarchies de concepts et de relations et l expression d axiomes algébriques portant sur les relations, et de propriétés telles que la généricité d un concept. Des outils graphiques dédiés à la visualisation d ontologies sont inclus dans l environnement. OntoEdit intègre un serveur destiné à l édition d une ontologie par plusieurs utilisateurs. Un contrôle de la cohérence de l ontologie est assuré à travers la gestion des ordres d édition. Enfin, un plug-in nommé Ontokick offre la possibilité de générer les spécifications de l ontologie par l intermédiaire de questions de compétences (Sure et al., 2002). Parmi les outils non liés à des formalismes de représentation, citons Protege2000 (Noy et al., 2000), (Protege). Cet outil offre une interface modulaire permettant l édition, la visualisation, le contrôle (vérification des contraintes) d ontologies, l extraction d ontologies à partir de sources textuelles et la fusion semi-automatique d ontologies. Le modèle 46

de connaissances sous-jacent à Protege2000 est issu du modèle des frames et contient des classes (concepts), des slots (propriétés) et des facets (valeurs des propriétés et contraintes), ainsi que des instances des classes et des propriétés. Protege2000 autorise la définition de méta-classes, dont les instances sont des classes, ce qui permet de créer son propre modèle de connaissances avant de bâtir une ontologie. Contrairement aux outils précédemment cités, Ontolingua (Farquhar et al., 2000), (Ontolingua, 2002) est un serveur d édition d ontologies au niveau symbolique : une ontologie est directement exprimée dans un formalisme également nommé Ontolingua, qui constitue en fait une extension du langage KIF (Knowledge Interchange Format) (KIF, 2002). Le langage Ontolongua utilise des classes, des relations, des fonctions, des objets (instances) et des axiomes pour décrire une ontologie. Une relation (ou une classe) peut contenir des propriétés nécessaires (contraintes) ou nécessaires et suffisantes qui définissent la relation (ou la classe). Ontolingua propose un outil permettant d inclure une ontologie dans celle en cours de construction. L inclusion consiste à ajouter à l ontologie courante les axiomes de l ontologie à inclure, après traduction des axiomes (Farquhar et al., 1995). La traduction consiste à établir une relation d identité entre les termes des deux ontologies qui désignent les mêmes classes ou relations. 2.2 La représentation des connaissances par les ontologies De nombreuses ontologies ont été créées dans le but de représenter les connaissances dans des systèmes informatiques. Ces représentations formelles expriment les connaissances sous forme logique. Le travail de représentation des connaissances consiste dans un premier temps à construire une première modélisation partiellement cohérente, correspondant à une conceptualisation semi-formalisée. Le résultat obtenu est alors un modèle conceptuel, semi-formel, dont il est nécessaire de le traduire dans un langage formel et opérationnel. Ce langage doit se doter d un mécanisme de raisonnement et permettre ainsi de représenter les différents types de connaissances (connaissances terminologiques, faits, règles et contraintes). L objectif étant de rendre l ontologie opérationnelle de façon à manipuler les connaissances représentées à travers des mécanismes adaptés à l objectif du système conçu. Il existe plusieurs niveaux d abstraction et de représentation des connaissances et par conséquent différents formalismes. 47

2.2.1 La représentation des connaissances La représentation des connaissances a connu différentes phases d évolution : représentation et transmission des connaissances par le biais du langage naturel, la fixation des connaissances sur des supports divers (pierre, papier) en utilisant des techniques variées (écriture, dessin) et l échange et le partage des connaissances via les réseaux informatiques (Internet, systèmes d informations de l entreprise) et les nouvelles technologies de l information. Pour comprendre cette représentation il faut disposer de modèles de représentation des connaissances qui permettent d associer un sens aux termes et symboles utilisés ainsi qu à leur combinaison. De nombreux modèles spécifiques ont été développés en fonction des besoins particuliers des domaines d applications. Ainsi, une carte de géographie utilise un modèle graphique de représentation des connaissances géographiques. Par ailleurs, les modèles de représentation des concepts mathématiques sont fondés sur la notation mathématique. Dans le domaine de l IA, de nombreux formalismes de représentation de connaissances sont proposés. Nous décrivons ci-après, quelques-uns de ces formalismes. 2.2.1.1 Les logiques de description Les logiques de description (Brachman, 1977), appelés également logiques terminologiques, sont des formalismes logiques de représentation des connaissances (Ducourneau et al., 1998) et (Kayser, 1997). Issues de la théorie des frames couplée avec les principes des réseaux sémantique, les logiques de description offrent un modèle à mi-chemin entre les réseaux sémantiques et les frames. Le système «KL-ONE» (Brachman et Schmolze, 1985), est en effet le premier système représentant des logiques de description. Son objectif était d être un langage de représentation dont la sémantique formelle est fondée logiquement, c'est-à-dire externe à la représentation et aux algorithmes qui opèrent sur cette sémantique. Dans le cas où une ontologie est formalisée à l aide des logiques de description, cette ontologie permet de décrire les concepts d un domaine à travers des concepts atomiques correspondant à des prédicats unaires spécifiant les objets du domaine; et des rôles atomiques, correspondant à des prédicats binaires et décrivant les relations entre les objets (concepts du domaine). Ces rôles sont spécifiés à l aide de constructeurs fournis par le langage formel de description logique. Ainsi, on distingue deux niveaux de représentation des connaissances: le niveau terminologique et le niveau 48

factuel qui ont donné naissance aux notions de T-Box et A-Box, que l'on retrouve dans la plupart des logiques de description: - La T-Box (Terminological Box) correspond au niveau descriptif qui permet de décrire les concepts en fonction d'autres concepts à partir des relations et des contraintes sur ces relations. Elle renferme les connaissances terminologiques. - La A-Box (Assertional Box) correspond au niveau des assertions, et est réservée à la description et la manipulation des individus. Les logiques de descriptions fournissent les primitives épistémologiques qui comprennent trois composantes formelles : le concept, le rôle et l'individu. Le concept représente un ensemble ou une classe d'individus. Un concept correspond à la conjonction de rôles qui expriment les relations existantes entre celui-ci et les autres concepts. Des restrictions ou des cardinalités peuvent être affectées à chaque rôle, de même que les facettes associées à un attribut dans un frame. L'individu correspond à une entité particulière, c'est-à-dire, une instance du concept. Les concepts et les rôles relèvent de la T-Box, alors que les individus sont en général définis dans la A-Box. Au niveau terminologique, on distingue deux types de concepts : les concepts primitifs et les concepts définis. Un concept primitif possède une description incomplète, correspondant à des conditions nécessaires. Les concepts primitifs servent à construire les concepts définis. Un concept défini possède une description complètement spécifiée, qui correspond à des conditions nécessaires et suffisantes exprimées par des rôles. Les concepts du domaine sont organisés en une hiérarchie par la relation de subsomption qu on peut définir de plusieurs manières : - Définition extensionnelle : un concept A subsume un concept B si l'ensemble des individus dénotés par A contient l'ensemble des individus dénotés par B. Par exemple, le concept Humain subsume le concept Femme. - Définition intensionnelle : un concept A subsume un concept B si tout individu décrit par B l'est aussi par A; autrement dit si l'ensemble des propriétés d'un individu dont la description est définie par B contient l'ensemble des propriétés spécifiées par A. Par exemple, l'ensemble des propriétés associées au concept Femme comprend l'ensemble des propriétés associées au concept Humain. - Définition logique : un concept A subsume un concept B, si être un individu décrit par B implique être un individu décrit par A. 49

Concernant le raisonnement permis par les logiques de description, c est un raisonnement déductif qui essaie d expliciter les informations implicites contenues dans une base de connaissances ; vérifier si une assertion est vraie dans un univers représenté par une théorie (l ensemble de formules de la base), consiste à vérifier si la formule qui représente l assertion est une conséquence logique de cette théorie. Le raisonnement logique est associé à la technique logique des prédicats du premier ordre. Une base de connaissances en logique est constituée exclusivement d un ensemble de formules logiques bien formées décrivant l univers du discours. Par exemple, les expressions suivantes sont des formules bien formées d un langage contenant les prédicats à un paramètre homme et voyage et la constante Pierre : 1) homme (Pierre) 2) x homme(x) => voyage(x) De plus, la classification constitue un mécanisme d'inférence important des logiques de description. La classification est un processus permettant de déterminer la position d'un concept donné dans la hiérarchie de subsomption. Elle consiste à placer un concept dans la hiérarchie en spécifiant les concepts qui le subsument et les concepts qui sont subsumés par lui. La classification est mise en œuvre grâce à un programme spécialisé appelé le classifieur (Schmolze et al., 1983). Le classifieur prend une nouvelle description de concept et la place à l endroit correct dans la hiérarchie. 2.2.1.2 Les réseaux sémantiques Les réseaux sémantiques sont issus des travaux de psychologie cognitive sur l'organisation de la mémoire humaine. Leur origine est attribuée à Quillian qui a proposé en 1961 puis en 1968 de construire un modèle de la «mémoire humaine» fondé sur un réseau sémantique de mots construits à partir d expériences en psycholinguistique. Il a voulu programmer l aspect associatif de la mémoire humaine, et reproduire les mécanismes qui nous permettent de comprendre les langues naturelles (Quillian, 1968). Un réseau sémantique est un graphe orienté et étiqueté, constitué d'un ensemble de nœuds et d arcs. Les nœuds correspondent aux concepts du domaine modélisé et les arcs représentent les relations sémantiques entre les concepts. Un concept est donc décrit par les autres concepts du réseau en lien avec lui, comme l illustre la figure 2.1. 50

Figure 2.1 : Exemple d une représentation en réseau sémantique Une telle représentation rend visibles les diverses relations existantes entre les objets, ainsi que la notion de distance entre deux concepts (nombre de liens du chemin connectant les deux concepts). Ce formalisme convient aux domaines où les concepts sont simples et fortement liés entre eux comme les phrases en langage naturel, c est pourquoi il a été adopté pour produire l ontologie Wordnet (Miller, 1990). Les relations les plus spécifiques des réseaux sémantiques sont les liens " sorte de " exprimant la relation d'inclusion des classes, et les liens " est un " qui représente la relation d'appartenance d'un élément à une classe lorsqu'elle n'est pas exprimée dans le lien " sorte de ". Lorsqu'un concept est décrit comme un des composants des classes, cela signifie que cette classe regroupe un certain nombre d'objets (concepts) qui partagent avec lui certaines propriétés. Dans ce cadre, les propriétés peuvent se transmettre des concepts les plus élevés dans la hiérarchie vers les fils au sens de la relation " sorte de " par exemple. Ces différentes relations permettant de définir des notions de déduction par héritage des propriétés sont essentiellement basées sur la transitivité de la relation "sorte de". L héritage consiste à récupérer des informations des nœuds représentant des concepts plus généraux pour les utiliser dans des nœuds plus spécialisés. Cette récupération se fait suivant le lien de spécialisation qui représente l inclusion ensembliste. L héritage est dynamique, dans le sens où l information héritée d une classe n est pas stockée dans la sous-classe mais récupérée chaque fois que le système accède à la sous-classe. Cela garantit que toute modification faite à une classe est prise en compte par ses sous-classes. En plus de l héritage, le filtrage est également un mécanisme utilisé par la plupart des réseaux sémantiques. Il consiste à parcourir le graphe et à chercher tous les sous-graphes du graphe ayant des propriétés 51

ou une structure commune avec un graphe cible. Le mécanisme de filtrage permet de récupérer des informations explicites ou implicites de la base à la manière des associations mentales de l être humain. 2.2.1.3 Les graphes conceptuels Les réseaux sémantiques donnèrent lieu à de nombreux modèles de représentation des connaissances parmi lesquels les graphes conceptuels. Ainsi, le modèle des graphes conceptuels est un modèle de représentation de connaissances du type réseaux sémantiques fondés sur la logique, développés par (Sowa, 1984). La théorie des graphes conceptuels est basée sur la linguistique, la psychologie et la philosophie dans l'objectif de développer un système de logique qui représente de façon plus simple et plus commode les structures du langage naturel. Ainsi le but des graphes conceptuels est d exprimer des connaissances sous une forme logique précise compréhensible par des humains et adaptée à un traitement automatique. Un graphe conceptuel est un graphe fini, connexe, biparti ; composé de deux sortes de nœuds : les nœuds conceptuels, appelés également sommets, et les nœuds relationnels (ou relations). Chacun de ces nœuds a une étiquette. Un nœud concept est étiqueté par un type correspondant à une classe sémantique, et un marqueur précisant une instance particulière de la classe. Toute relation conceptuelle a un ou plusieurs arcs, chacun lié à un concept. Une telle représentation des connaissances offre des facilités d explicitation des connaissances. La définition des graphes conceptuels donnée par (Chein, 1992) est similaire à celle de Sowa, mais elle est exprimée de manière plus formelle sous la forme suivante : Un graphe conceptuel G = (CG, RG, EG, étiqg) défini sur un support S, est un multigraphe non orienté, biparti où : CG est l'ensemble des sommets concepts et RG l'ensemble des sommets relations. EG est l'ensemble des arêtes. Toutes les arêtes d'un graphe conceptuel G ont une extrémité dans CG et l'autre dans RG. étiqg est une application qui à tout sommet de NG et à toute arête de EG associe une étiquette : si r RG, étiqg(r) TR ; si c CG, étiqg(c) TC ; si e EG, étiqg(e) RG. L'ensemble des arêtes 52

adjacentes à tout sommet relation r est totalement ordonné, ce que l'on représente en étiquetant les arêtes de 1 au degré de r. Cependant, (Chein, 1992) propose de définir tout d abord le support (cf. figure 2.2) car, un graphe conceptuel n a de sens que par rapport à un support que va régir l'ensemble des graphes conceptuels portant sur un même domaine de connaissances. Un support S est un couple (TC, TR) tel que : TC, ensemble des types de concepts, est un ensemble partiellement ordonné par une relation «sorte de» (notée ) possédant un plus grand élément (noté T) appelé type universel. TR, ensemble des types de relations, est un ensemble partiellement ordonné, partitionné en sous-ensembles de types de relations de même arité. TR = TR1 TRp, où TRi est l'ensemble des types de relations d'arité i. Tout TRi admet un plus grand élément (noté Ti). Tc T TR T2 Etre vivant Lieu Action Période Agent Lieu Temps Personne Ville Compagne Accident Jour Nuit Homme Femme Autoroute Route départementale Figure 2.2 : Exemple d un support La figure 2.3 ci-dessous présente un graphe conceptuel défini sur le support décrit dans la figure 2.2. Les sommets concepts sont représentés par des rectangles et les sommets relations par des ellipses. Le graphe de la figure2.3 peut être interprété par «Accident mortel» (accident dans lequel une personne est morte). Comme l illustre la figure, la nature graphique des graphes conceptuels fait qu il est facile de les interpréter, de les modifier ou d en créer de nouveaux. Cette facilité de création est renforcée par la séparation explicite de différents types de connaissances, et plus précisément par la définition d un objet distinct des graphes, le support, qui aide lors de la 53

création des graphes, car les étiquettes des sommets doivent être choisies dans ce support. Le modèle des graphes conceptuels est doté d une sémantique logique : les types de relations et de concepts correspondent à des prédicats, les liens «sorte de» sont représentés par des implications et les graphes par des assertions. 1 2 1 2 Accident agent Personne état Mort Figure 2.3 : Exemple d un graphe conceptuel D autres éléments du modèle, comme les contextes imbriqués (pour représenter les négations) et les quantificateurs universels des concepts, permettent d étendre l expressivité du langage. Ainsi, la logique du premier ordre garantit la validité des inférences du modèle. De plus la hiérarchie de graphes facilite la généralisation des inférences obtenues sur un graphe particulier. Par ailleurs, l abstraction des concepts offre un mécanisme utile de définition de concepts complexes. Les graphes conceptuels sont définis par une syntaxe abstraite, indépendante de toute notation, mais ce formalisme peut être représenté au moyen de différentes notations concrètes. Un graphe conceptuel peut être représenté sous forme graphique appelée DF (pour Display Form en anglais), sous forme du format d échange CGIF (Conceptual Graph Interchange Form) ou sous forme linéaire LF (Linear Forem). Chaque graphe conceptuel possède également une représentation équivalente en logique des prédicats grâce au format d échange de connaissances KIF (Knowkledge Interchange Format). 2.2.1.4 Les frames Contrairement aux formalismes présentés ci-dessus qui représentent les connaissances sous forme propositionnelle, les langages de frames (ou schémas) sont des modèles structurels, qui regroupent les connaissances d une situation, d un événement ou d un objet dans des paquets ( chunks ) accessibles en tant qu unités. L idée d empaqueter des connaissances apparaît en psychologie dans les travaux de (Bartlett, 1932). Ensuite, Minsky propose en 1975, le premier formalisme informatique utilisant ces mêmes idées et attribue aux 54

frames la définition suivante : «Un frame est une structure de données représentant une situation stéréotypée, comme se trouver dans un certain type de salon ou se rendre à un goûter d'anniversaire d'un enfant. Divers types d informations sont associés à chaque frame. Certaines d'entre elles concernent l'utilisation de ce frame. D'autres portent sur ce que l'on s'attend à ce qu'il arrive par la suite. D'autres encore portent sur ce qu'il faut faire si ces attentes ne sont pas confirmées.» (Minsky, 1975). Le frame est donc une structure dynamique représentant des situations prototypiques qui contient des informations sur une situation ou un objet standard et prend en compte toutes les formes possibles d'expression de la connaissance. En tant que prototype d un ensemble de situations, «le frame a des informations générales valides pour toutes les situations possibles et des informations spécifiques à chaque situation pour lesquelles il a une valeur par défaut, la valeur la plus probable ; cette valeur par défaut peut être remplacée par une valeur spécifique pour une situation particulière» (Minsky, 1975). Ainsi, le frame sert de référence pour comparer des objets que l'on désire reconnaître, analyser ou classer. Un frame est composé d'un ensemble d'attributs qui sont les propriétés caractérisant le concept. Ces attributs contiennent des facettes qui décrivent l'ensemble des valeurs possibles pour cet attribut. Ces facettes peuvent être de deux formes : déclaratives et procédurales. Les premières associent des valeurs aux attributs, alors que les secondes décrivent les procédures appelées réflexes, qui sont activées lors des accès à ces valeurs. Un frame n'a donc pas de comportement propre décrit par des méthodes. Les frames appartenant à un ensemble de frames propres à un même thème sont organisés dans une même structure hiérarchisée d'héritage d'attributs. Dans le langage de frames classique, la notion d'instanciation n'existe pas, la hiérarchie des frames permet d'affiner successivement les descriptions jusqu'à la spécification d'un concept ne pouvant plus être spécialisé. L évolution des frames a permis de distinguer deux types de frames : les frames classes et les frames instances. Les frames classes représentent les catégories d'objets du monde modélisé alors que les frames instances représentent des individus particuliers. La hiérarchie structurant les frames, classe les uns par rapport aux autres, par la relation de spécialisation (appelée taxinomie). En plus de cette relation de spécialisation, des systèmes de frames proposent implicitement ou explicitement la relation d'instanciation (intitulée est-un dans le cas où elle existe de façon explicite), qui relie une instance à sa classe d'appartenance. Deux mécanismes de raisonnement sont assurés par les frames : le filtrage 55

et la classification. Le filtrage consiste à rechercher parmi un ensemble de frames ceux qui correspondent à des critères donnés; ces caractéristiques sont décrites dans un schéma appelé filtre, qui est apparié avec des schémas de la base. Le filtrage se distingue d une requête classique de bases de données par plusieurs aspects. D une part, les instances d une base de connaissances pouvant être incomplètes, le résultat du filtrage n est pas une liste fixe d instances mais une liste de schémas d instances où chaque schéma peut être complété de différentes façons pour produire diverses instances. D autre part, grâce à la structure hiérarchique des schémas de classes, l ensemble de schémas d instances pouvant répondre au filtrage est vite réduit à ceux dont les classes d appartenance ne sont pas en contradiction avec les contraintes du filtre. Enfin, l étape d appariement entre le filtre et un schéma cible peut faire appel aux mécanismes de raisonnement de bas niveau comme les réflexes et l attachement procédural pour un calcul. En outre, la classification consiste à intégrer un nouveau frame dans une hiérarchie établie. Ceci facilite la mise en correspondance entre une nouvelle situation et les situations connues. 2.2.2 L utilisation des ontologies pour la représentation des connaissances Dans le contexte de la gestion des connaissances, la représentation des connaissances a pour but de construire des modèles du domaine ou d'expertise qui comportent une description des connaissances du domaine d'application et une description du raisonnement tel que le modèle de résolution de problèmes par exemple. La représentation des connaissances par les ontologies doit alors pouvoir s appliquer aux connaissances d un domaine d'application particulier, à la modélisation de l'entreprise ou encore à la modélisation des utilisateurs du système de gestion des connaissances. 2.2.2.1 La modélisation des connaissances du domaine Parmi de nombreuses approches de modélisation des connaissances les ontologies sont apparues comme un outil incontestable de modélisation des connaissances du domaine. Rappelons qu'une ontologie est une description des concepts et des relations caractérisant un domaine. Plusieurs ontologies de domaine ont été développées dans différents secteurs d'activité. Ainsi, l'utilisation des ontologies pour la modélisation des connaissances du domaine s'est vue croître ces dernières années notamment dans les domaines suivants: médecine, biologie, environnement, tourisme et domaine juridique. 56

Par ailleurs, remarquons que la plupart des approches de capitalisation des connaissances intègre dans leur modèle un niveau de modélisation conceptuelle qui s attache à représenter les connaissances du domaine. Par exemple, le modèle d'expertise de la méthode CommonKADS décrite plus haut, propose des représentations proches de celles offertes par une ontologie du domaine. Aussi, la méthode MKSM/MASK qui est une méthode d analyse et de structuration des connaissances (Ermine, 2000) propose au travers de son modèle de concepts une structuration conceptuelle des connaissances qui se présente sous forme d une classification des concepts et des objets du domaine concerné par la modélisation. 2.2.2.2 La modélisation de l'entreprise La modélisation de l'entreprise s'impose dans le contexte de la gestion des connaissances notamment lorsqu'il s'agit de repérer les connaissances cruciales qu'il faudra capitaliser. Il est en effet fondamental d'identifier la structure de l'entreprise, les activités, les différents processus et les ressources de connaissances. Cette identification peut se faire au moyen d'une ontologie qui présentera les connaissances sur l entreprise selon un modèle organisationnel explicite. «Un modèle organisationnel est une représentation explicite de la structure, des activités, des processus, des ressources, des personnes, des comportement, des objectifs et des contraintes de l'organisation. L'ontologie correspondante capture les caractéristiques essentielles des entités modélisées et les formes de relations existantes entre elles dans un vocabulaire consensuel non ambigu.» (Gandon, 2002). Dans ce contexte plusieurs ontologies modélisant l entreprise ont été développées dont, Enterprise Ontology (Uschold et al., 1998), Tove (Fox et al., 1993), Enterprise-wide Data Modelling (Scheer, 1989), GERAM (Bernus, et al., 1996) et IDEF (Fillion et al., 1995). Ayant particulièrement exploité la version informelle de l ontologie Enterprise ontology, nous présentons brièvement cette ontologie ci-dessous. L ontologie Enterprise Ontology s inscrit dans le cadre du projet Enterprise, mené par l Artificial Intelligence Applications Institute (AIAI) à l université Edinburgh en Grande Bretagne. L ambition de ce projet est d améliorer et de remplacer les méthodes de modélisation d entreprise existantes par une nouvelle structure intégrant des méthodes et des outils capables de capturer et d analyser les aspects clés d une entreprise. Ainsi, elle inclut une grande variété de termes largement répandus pour décrire 57

l entreprise en général. Cet ensemble de termes définis, joue le rôle de format d échange de données dans un environnement d interopérabilité et de structuration d une base de connaissances. Pour atteindre ces objectifs, Enterprise Ontology a été implémentée à l aide du langage Ontolingua et elle est accessible à partir de l éditeur d ontologie du laboratoire KSL (Knowledge Systems Lab) de l Université de Stanford. Enterprise Ontology contient 92 concepts et 68 relations. Ces concepts sont structurés autour de cinq catégories dont chacune des catégories contient un ensemble de concepts reliés entre eux. - Meta Ontology et Temps : regroupe les concepts définissant les termes de l'ontologie (par exemple entité, relation, rôle) avec quelques concepts liés au temps tel que intervalle-temps par exemple. - Activité : les concepts sont relatifs aux processus et à la planification (par exemple Planification, Responsabilité, Attribution de Ressource) ; - Organisation : les concepts représentent la façon dont des organisations sont structurées (par exemple : Personne, Personne morale, Unité d'organisation, Partenaire) ; - Stratégie : Les concepts concernent des niveaux élevés de la gestion de l entreprise (par exemple Objectif, Mission, Décision, Facteur critique de succès) ; - Marketing : les concepts sont relatifs au marketing et la vente des biens et services (par exemple Vente, Client, Prix, Marque, Promotion). Cette ontologie fournit un glossaire des concepts exprimés sous une forme structurée en langage naturel complété avec quelques axiomes formels. 2.2.2.3 La modélisation de l utilisateur Dans une perspective de gestion des connaissances, l'utilisateur fait partie du contexte, et comme nous l avons noté plus haut, le contexte est un facteur important pour la manipulation des connaissances. Par ailleurs, si l on souhaite développer un système de gestion des connaissances capable de fournir une interaction personnalisée, il est nécessaire d élaborer un modèle utilisateur. Ce modèle doit contenir des informations sur les buts, les besoins, les préférences ou les intentions des utilisateurs. Les ontologies peuvent être exploitées pour élaborer ce type de modèle. Les premières idées sur l utilisation d ontologies pour la modélisation des utilisateurs ont été rapportées par (Chen et Mizoguchi, 1999). Plus récemment, (Razmerita, 2003) a proposé la modélisation des 58

utilisateurs à l aide d ontologies. Le modèle utilisateur proposé, est défini comme une ontologie utilisateur générique, comprenant diverses caractéristiques d un utilisateur, à base de concepts, sous concepts et relations entre les différents concepts. Afin de réaliser un vocabulaire consensuel, l ontologie utilisateur a été conceptualisée à partir de la spécification «Information Management System Learner Information Package» (IMS LIP, 2001). Ce dernier est structuré en onze catégories incluant: Identification, But (Goal), QCL (Qualifications, Certifications et Licences), Compétence, Accessibilité, Activité, Hobby (Interest), Affiliation, Sécurité, Clé et Relation. Ces catégories sont décrites comme des notions abstraites dans l ontologie. Pour illustration, le concept «Identification» contient des attributs qui aident à identifier une personne (nom, adresse, email, etc.) et le concept «Affiliation» inclut des informations sur la description de l organisation associée à l utilisateur. Le concept «Compétence» décrit les compétences associées avec la formation formelle ou informelle de l utilisateur et son expérience de travail. Le concept «Activité» contient les activités liées au travail et à la formation de l utilisateur tandis que le concept «Accessibilité» décrit les préférences des utilisateurs, langues, et handicaps. Les informations sur les loisirs et les activités recréatrices sont décrites dans le concept «Interest» (Hobby). Le concept «Goal» contient l information sur les buts des utilisateurs. (Razmerita, 2003). 2.2.3 Ontologies et raisonnement La représentation des connaissances par les ontologies peut s accompagner des mécanismes de raisonnement. Le raisonnement concerne la manipulation des connaissances déjà acquises pour produire de nouvelles connaissances. Il utilise des mécanismes d inférence qui permettent la résolution des problèmes pour lesquels il n existe pas de procédures explicites dans le programme. Différents mécanismes de raisonnement sont utilisés selon les objectifs du système à mettre en place : raisonnement logique, raisonnement par classification, le filtrage, l héritage et le raisonnement à base de règles. Une analyse rigoureuse menée par Marino- Drews est proposée dans sa thèse (Marino-Drews, 1992). 59

2.2.3.1 Le raisonnement logique Le raisonnement logique se base sur un mécanisme de déduction qui utilise un ensemble de règles d inférence pour déduire des nouveaux faits à partir des faits connus. Ces règles, le modus ponens, le modus tollens et la spécialisation universelle sont combinées avec des manipulations syntaxiques des formules (filtrage et unification) pour élaborer la déduction (Masini et al., 1989). La règle de spécialisation universelle dit que si une formule est vraie pour tous les individus, elle est vraie pour un individu particulier. Cette règle appliquée aux formules 1) et 2) donne 3) : Prémisses : Conclusion : 1) homme (Pierre) 2) x homme(x) voyage(x) 3) homme (Pierre) voyage(pierre) La règle de modus ponens affirme que si un fait entraîne un deuxième et que le premier est vrai, alors le deuxième est vrai aussi. Appliquer le modus ponens aux formules 1) et 3) donne 4) : Prémisses : Conclusion : 1) homme (Pierre) 3) homme (Pierre) voyage(pierre) 4) voyage (Pierre) La logique fournit un formalisme clair et non ambigu. Cette clarté vient d une part du fait que la signification d une formule ne dépend que de sa structure et de la signification donnée à ses composants atomiques et d autre part du fait que le langage d expression logique est proche du langage naturel (Haton et al., 1991). De plus les connecteurs logiques (et, ou, implication et négation) et les quantificateurs permettent une riche description du monde. Les inférences faites avec la logique du premier ordre sont correctes, complètes et fondées (Stillings et al., 1989). Plusieurs langages de formalisation d ontologies dotés de mécanismes de raisonnement logique sont proposés dans la littérature tels que CLASSIC (Borgida, 1989), LOOM (MacGregor et al., 1991) et OWL (OWL, 2004). 60

2.2.3.2 Le raisonnement par classification Le raisonnement par classification consiste à confronter une nouvelle connaissance à un ensemble de connaissances connues pour déduire des informations liées à cette nouvelle connaissance. Face à une nouvelle situation, une personne tire parti des expériences vécues pour effectuer le choix des actions à entreprendre. Pour ce faire, elle détermine la position la plus appropriée pour cette nouvelle situation dans la structure où elle mémorise celles déjà connues, puis elle infère des connaissances induites par cette localisation. Ce type de mécanisme est appliqué notamment dans les représentations terminologiques, les schémas et les représentations orientées objet. Ainsi, le mécanisme de raisonnement de base des logiques terminologiques est la classification de concepts. Cette classification est réalisée par un algorithme de classification. Pour trouver la place appropriée pour le nouveau concept, l algorithme de classification détermine les relations de subsomption entre ce concept et les autres concepts de la hiérarchie ; ces relations peuvent être spécifiées directement, trouvées par transitivité ou bien calculées à partir de la sémantique. La recherche de la place correcte pour le concept comporte trois étapes : le recherche des subsumants les plus spécifiques SPS (concepts qui subsument le concept à classer et dont les sous-concepts ne le subsument pas), la recherche des subsumés les plus généraux SPG (concepts subsumés par le concept à classer et dont les sur-concepts ne sont pas subsumés par lui) et puis l insertion du concept dans la hiérarchie. Dans des représentations à base de frames la classification consiste à positionner un nouveau schéma dans une hiérarchie de frames connue. En général les systèmes de frames distinguent la classification de classes de la classification d instances. La classification de classes modifie les liens taxinomiques des classes et constitue un mécanisme de gestion et maintien de la base ; la classification d instances est un mécanisme de raisonnement qui permet de compléter la connaissance d une nouvelle instance en la plaçant correctement dans la base et en récupérant l information déduite de ce classement. Le mécanisme de classification d instances correspond à une stratégie de résolution de problèmes spécialement utilisée en diagnostic : face à une nouvelle situation, l être humain la classe dans sa taxinomie de classes de situations connues, puis il récupère des informations générales propres aux instances de cette classe et enfin il les spécialise pour les faire correspondre au cas courant. Les modèles de schémas sont spécialement utiles pour la classification, car la description des classes fournit un moyen déclaratif de spécifier les critères 61

d appartenance à une classe, et la structure taxinomique des classes facilite la classification graduelle (Fikes et Kehler, 1985). 2.2.3.3 Le filtrage Un autre mécanisme de raisonnement est le filtrage. Celui-ci est utilisé par la plupart des réseaux sémantiques. Il consiste à parcourir le graphe et à chercher tous les sous-graphes du graphe ayant des propriétés ou une structure commune avec un graphe cible. Cette recherche correspond à un appariement de graphes. Le mécanisme de filtrage permet de récupérer des informations explicites ou implicites de la base à la manière des associations mentales de l être humain. Le mécanisme de filtrage est également utilisé dans des représentations par schéma (frame). Dans ce cas, le filtrage recherche les schémas satisfaisant certaines caractéristiques données ; ces caractéristiques sont décrites dans un schéma appelé filtre, qui est apparié avec des schémas de la base. Le filtrage se distingue d une requête classique de bases de données par plusieurs aspects. D une part, les instances d une base de connaissances pouvant être incomplètes, le résultat du filtrage n est pas une liste fixe d instances mais une liste de schémas d instances où chaque schéma peut être complété de différentes façons pour produire diverses instances. D autre part, grâce à la structure hiérarchique des schémas de classes, l ensemble de schémas d instances pouvant répondre au filtrage est vite réduit à ceux dont les classes d appartenance ne sont pas en contradiction avec les contraintes du filtre. Enfin, l étape d appariement entre le filtre et un schéma cible peut faire appel aux mécanismes de raisonnement de bas niveau comme les réflexes et l attachement procédural pour un calcul. 2.2.3.4 L héritage L héritage est un mécanisme de raisonnement qui consiste à récupérer des informations des nœuds (ou classes) représentant des concepts plus généraux, pour les utiliser dans des nœuds plus spécialisés ; cette récupération se fait en suivant les liens de spécialisation «est-un». La relation de spécialisation représente l inclusion ensembliste ; cela veut dire que toutes les instances d une classe le sont aussi pour ses superclasses ; à ce titre, elles ont les propriétés décrites dans les superclasses. Une classe doit donc pouvoir récupérer l information de ses superclasses. Le mécanisme d héritage de propriétés permet la récupération de cette information à travers les liens de spécialisation et évite ainsi d avoir à recopier les attributs des superclasses dans la sous-classe. L héritage est 62

dynamique, c est-à-dire, l information héritée d une classe n est pas stockée dans la sous-classe mais récupérée chaque fois que le système accède le sous-classe. Cela garantit que toute modification faite à une classe est prise en compte par ses sous-classes. Bien que cette dernière propriété facilite le contrôle de la cohérence de la base et donc le raisonnement, le mécanisme d héritage est plus un raccourci d écriture (car on n a pas à recopier des informations) qu un réel mécanisme d inférence de nouvelles connaissances. 2.2.3.5 Le raisonnement à base de règles Le raisonnement à base de règles est également un mécanisme de raisonnement sur les connaissances. L élément de base des systèmes à base de règles est la règle de production ; une règle a la forme suivante : SI <condition> ALORS <action> La partie condition est exprimée par un prédicat logique correspondant à une affirmation sur la base de connaissances qui doit être vraie au moment de valider la règle pour que l action soit déclenchée ; la partie action, qui est la partie exécutable de la règle indique des ajouts ou modifications à faire à la base. Un système à base de règles comporte trois parties: une base de règles, un contexte ou base de faits et un moteur d inférence. Les systèmes à base de règles permettent en général de bien résoudre les problèmes de causalité ou de diagnostic traitant des objets simples. Ils offrent un cadre déclaratif pour exprimer des connaissances procédurales, de savoir-faire, ce qui permet de voir clairement les conditions dans lesquelles une règle est applicable. Pour répondre à une question, le moteur d inférence suit un cycle de détection des règles applicables, de choix de la règle à déclencher et d exécution de l action associée à cette règle. Le moteur d inférence peut fonctionner dans deux modes différents, chaînage avant et chaînage arrière. 2.3 L indexation et l annotation par les ontologies L indexation et l annotation sont deux opérations qui peuvent être réalisées par les concepts de l ontologie notamment dans une perspective d enrichissement et de maintenance des systèmes de gestion des connaissances. Notons toutefois que, l indexation est une pratique documentaire à ne pas confondre avec l annotation bien que ces deux techniques visent le même objectif : ajouter de la sémantique aux ressources de connaissances afin de faciliter leur réutilisation. Pour lever l ambiguïté entre ces deux notions, nous définissons d abord ce qu est l indexation ( 2.3.1) et abordons l apport de l indexation par les 63

ontologies ( 2.3.2). Ensuite, nous évoquons l annotation basée sur les ontologies en section ( 2.3.3). 2.3.1 L indexation, une ancienne pratique documentaire L'indexation est une pratique indispensable pour retrouver rapidement les documents pertinents recherchés. La définition normalisée de l indexation est la suivantes : «L indexation est l'opération qui consiste à décrire et à caractériser un document à l'aide de représentations des concepts contenus dans ce document, c'est-à-dire à transcrire en langage documentaire les concepts après les avoir extraits du document par une analyse. La transcription en langage documentaire se fait grâce à des outils d'indexation tels que thesaurus, classification, etc. [ ] La finalité de l indexation est de permettre une recherche efficace des informations contenues dans un fonds de documents et d indiquer, sous une forme concise, la teneur d un document.» (AFNOR, 1993). L indexation est, dans l approche documentaire, une opération de représentation, par les éléments d un langage documentaire, des notions résultant de l analyse d un document ou d une question en vue d en faciliter la recherche. Dans l approche linguistique, l indexation doit offrir la représentation la plus fidèle, ainsi une représentation du document s effectue par le document lui-même. Plus précisément, l indexation est une opération destinée à décrire et à caractériser le contenu d'un document à l'aide de mots (dits mots-clés ou descripteurs) représentant les contenus traités dans ce document, dans un langage plus ou moins artificiel dit langage documentaire. Elle est considérée comme une tâche centrale du traitement documentaire puisqu elle vise la constitution d une description qui sert de substitut au contenu dans la phase de recherche et de consultation des documents, le but étant d'organiser et de faciliter la recherche dans les systèmes documentaires. Du point de vue de son processus, l'indexation est réalisée grâce à trois opérations : - L analyse documentaire consiste soit à consulter prioritairement la table des matières, l'introduction et la conclusion lorsqu il s agit d un texte, soit à repérer un segment documentaire pertinent s il s agit d un document audio-visuel (image ou son). L objectif est d identifier les éléments devant être décrits pour permettre l exploitation ultérieure du document ; 64

- La sélection des concepts à indexer consiste en l identification des concepts (notions) principaux d un document qui ne doit pas se faire à la seule lecture des mots du titre. Le critère principal, dans la sélection des notions, doit toujours être la valeur potentielle d'une notion en tant qu'élément dans l'expression du contenu d'un document et dans sa recherche documentaire ; - La traduction de ces concepts en langage documentaire, les concepts retenus doivent être exprimés à l'aide des termes du langage documentaire afin d associer au document indexé les mots clés représentatifs de son contenu. La pratique d indexation, qui semblait être réservée à l'intelligence humaine, car indexer consiste à affecter aux documents des indices ou des marques significatives de leur contenu, à la suite d'une série d'opérations mentales complexes, est devenue automatisable. De fait, l'indexation peut être manuelle, automatique ou semi-automatique lorsqu elle est faite par un humain assisté d'un outil d aide à l indexation. L'indexation manuelle se fait par des documentalistes souvent spécialisés dans le domaine. Par exemple, pour indexer correctement un fonds documentaire dans le domaine de la chimie, il faut faire intervenir un documentaliste qui maîtrise ce domaine. L'intérêt de l'indexation manuelle est qu'un opérateur humain analyse et interprète le contenu pour le synthétiser et le reformuler. L'indexation automatique est l opération qui consiste à «faire reconnaître par l ordinateur des termes figurant dans le titre, le résumé, le texte complet (s il est enregistré avec la notice documentaire) et parfois même l indexation humaine, et à employer ces termes, soit tels quels soit après conversion en d autres termes équivalents ou conceptuellement voisins, pour en faire des critères incorporés dans le fichier de recherche et utilisables pour retrouver le document» (Van Slype, 1987). L'indexation automatique repose sur des algorithmes associant automatiquement des descripteurs à des parties de document. Dans le cas des documents textuels, chaque mot est potentiellement un index du paragraphe qui le contient. En éliminant les mots "vides" ou "creux", comme les conjonctions, pronoms, etc., ces outils construisent des tables où chaque terme réfère aux parties du/des document/s qui le contiennent. Dans le cas des documents sonores, vidéo(s) et des images, la situation est plus 65

complexe car le document ne se décompose pas en unités facilement repérables comme des chaînes de caractère séparées par des blancs. Il faut donc disposer d'outils capables de segmenter le contenu et de le qualifier. Quel que soit le mode d indexation employé, l indexation documentaire s appuie sur le principe de l utilisation d un vocabulaire contrôlé dit également langage documentaire. Un langage documentaire est un vocabulaire artificiel constitué de descripteurs, au sein duquel il n'existe généralement qu'un seul terme pour désigner un concept / objet (pour améliorer le rappel et éviter le silence) et où chaque terme ne représente qu'un seul concept / objet (pour améliorer la précision et éviter le bruit). Le langage documentaire se compose au minimum : d'un lexique et d une syntaxe. Le lexique est un ensemble des mots et des expressions utilisables pour la représentation et pour la recherche d information. La syntaxe est un ensemble de règles d'utilisation et de combinaison de ces mots et expressions. Un langage documentaire est structuré de façon logique pour permettre la navigation verticale ou horizontale dans l'ensemble du lexique. Le langage documentaire est utilisé pour l'indexation ainsi que pour la recherche d'informations (Hudon, 2002). Un exemple de langage documentaire le plus fréquemment utilisé par les professionnels des sciences de l information et de la documentation, est le thésaurus 9 Un thésaurus est «un langage documentaire contrôlé fondé sur une structuration hiérarchisée d un ou plusieurs domaines de la connaissance et dans lequel les notions sont présentées par des termes d une ou plusieurs langues naturelles et les relations entre notions par des signes conventionnels» (AFNOR, 1985). Le thésaurus est une liste alphabétique, hiérarchique qui présente des descripteurs dans un environnement sémantique. Les descripteurs sont des termes normalisés 10 qu on utilise lors de l indexation et au moment de l interrogation de la base de données. Ils permettent de donner le contexte conceptuel dans lequel se situe le mot. Chaque descripteur a une signification unique et non ambiguë (élimination des cas de polysémie et contrôle des synonymies). Les descripteurs sont reliés entre eux par des 9 D autres outils d indexation tels que les lexiques et les langages classificatoires (CDI et CDD) sont également des langages documentaires. 10 Tout descripteur doit apparaître sous la forme de noms ou de groupes nominaux de préférence au singulier. 66

relations sémantiques (génériques, équivalentes et associatives) exprimées par des signes conventionnels comme le présente le tableau 2.1. Relation Symbole S applique Relations réciproques Symbole Terme générique TG Entre des descripteurs Terme spécifique TS Terme associé TA Entre deux descripteurs Terme associé TA Terme équivalent (employé) EM Entre un non-descripteur et un descripteur Terme employé pour EP Note explicative NE A un descripteur - - Note historique NH A un descripteur - - Tableau 2.1 : Les signes conventionnels des relations sémantiques dans un thésaurus - (Leloup, 1998) Le thésaurus est organisé d une façon logique et se présente sous la forme de tableau (cf. figure 2.4) ou de schéma fléché. Son utilisation permet des recherches optimales grâce à la multiplicité des croisements entre les descripteurs. Ordinateur EP computer TG informatique TS unité centrale TS périphérique TS écran TS clavier TS imprimante TS lecteur de cédérom TA calcul automatisé (synonymie) (terme générique) (termes spécifiques) (association) Figure 2.4 : Extrait d un thésaurus en informatique avec des relations sémantiques (Accart et Réthy, 1999) 67

2.3.2 Les ontologies comme ressource d indexation des connaissances Nous avons vu au cours des sections précédentes qu une ontologie structure les connaissances d'un domaine par des concepts en établissant des relations de proximité entre eux. Ces relations ont un rôle important à jouer dans l indexation sémantique des ressources de connaissances, car «une part importante du sens ou de la compréhension d un concept doit être intimement liée à sa relation avec d autres concepts» (Sfez, 1993). Autrement dit, un concept acquiert son sens par les relations qui le lient aux autres concepts. Dans plusieurs cas, un concept est décrit par les autres concepts du réseau qui lui sont rattachés. Les ontologies définissent différents types de relations sémantiques qui sont des relations taxonomiques telles que «partie de», «sorte de» «est un» ou non taxonomiques comme «concerne», «travaille à», «voyage», etc. Ces relations expriment une sémantique plus riche que celles offertes par les lexiques ou les thésaurus. En structurant les connaissances en réseaux de concepts et de relations, l'approche ontologique permet d'apporter aux index la richesse et la précision nécessaires pour rendre compte de la complexité du contenu des documents. De plus, la sémantique formelle des ontologies favorise leur utilisation dans le cadre d applications informatiques. De fait, le nouveau rôle des ontologies dans les systèmes de connaissances est d'offrir un vocabulaire standard permettant d'indexer les ressources de connaissances que contient la mémoire d'entreprise. L indexation des connaissances à partir d une ontologie présente en plus de l avantage de l expressivité sémantique, une aide considérable à l utilisateur en le guidant dans le choix des termes de sa requête. Dans cette perspective, les travaux de (Dechilly et al., 1999) et (Desmontils et Jacquin, 2002) témoignent de l usage des ontologies comme ressource d indexation au même titre que les langages documentaires. Bien que la fonction d'indexation basée sur les ontologies soit plus présente dans des applications du Web sémantiques, constatons que l objectif final visé par l indexation via les ontologies est de permettre une meilleure exploitation des ressources de connaissances qu elles soient localisées sur le Web, dans des systèmes d information d entreprise ou dans des bibliothèques audiovisuelles. Ainsi, (Dechilly et al., 1999) proposent l utilisation des ontologies pour assurer la continuité sémantique du processus d indexation de documents audiovisuels. Dans cette proposition, les ontologies sont des répertoires hiérarchiques de concepts et de relations 68

qui, à la manière d'un thesaurus, contrôlent le vocabulaire des descriptions effectuées par un indexeur. Néanmoins, là où le thesaurus se contente d'une normalisation - parfois peu rigoureuse - du sens des termes introduits dans les index, l'ontologie apporte une prescription de sens formelle, dans la mesure où ce sens est spécifié de façon à être exploitable par un système à base de connaissances. Par ailleurs, (Desmontils et Jacquin, 2002), utilisent les ontologies pour indexer des sites Web. L idée est de construire un index structuré basé sur les techniques issues du traitement automatique des langues (TAL) couplées avec les ontologies. Le processus d'indexation des documents est un processus semi-automatique (cf. figure 2.5) qui permet d'effectuer une indexation structurée d'un site Web à l aide d une ontologie selon les étapes suivantes : Première étape : l extraction d un ensemble de concepts candidats issus de pages Web, appelé index à plat, à l'aide d'analyses linguistiques et de calcul d un coefficient relatif à leur importance dans la page. Le processus d extraction de concepts, permet de construire les concepts candidats représentatifs du contenu des pages à l'aide du thesaurus Wordnet (Miller, 1990) et d'une mesure de similarité sémantique qui prend en compte le contexte des concepts dans les pages ; Deuxième étape : la désambiguïsation des labels des concepts de l'ontologie pour faire le lien entre les pages Web et les ontologies. Elle s'appuie sur des heuristiques exploitant les relations de généralisation et de spécialisation présentes dans l'ontologie et les relations d'hyperonymie et d'hyponymie présentes dans une ontologie linguistique spécialisée construite à partir d'une ontologie issue du projet SHOE (Heflin et al., 1999) et de Wordnet ; Troisième étape : l'appariement des concepts candidats issus des pages Web et des concepts de l'ontologie. À partir de l'ontologie linguistique, certains concepts candidats de l'index à plat sont retenus et les pages Web sont associées aux concepts correspondant de l'ontologie. Ceci permet de construire un index structuré des documents, la structure étant donnée par l'ontologie. Les ontologies sont alors mieux adaptées pour l indexation des systèmes de connaissances que les thésaurus et terminologies. 69

Figure 2.5 : Le processus d indexation des pages Web par les ontologies proposé dans (Desmontil et Jacquin, 2001) Cependant, ces derniers peuvent être utilisés comme support pour construire des ontologies (Wielinga et al., 2001). La puissance des ontologies réside notamment dans la richesse des relations sémantiques qu elles permettent de modéliser (Saadani et Bertrand-Gastaldy, 2000). Le rôle des relations sémantiques des ontologies dans la recherche d information et l exploitation des connaissances, au sens recherche sémantique, est abordé dans (Bataille et al., 2002) et (Zhuge, 2003). 2.3.3 L annotation par les concepts de l ontologie Les ontologies sont de plus en plus exploitées pour annoter les ressources de connaissances : supports de cours, dossiers médicaux, pages web, documents d entreprise, etc. L annotation est une action qui consiste à mettre en évidence certains éléments d informations qui peuvent sembler importants pour leur auteur et/ou lecteur, ou de joindre une note ou un commentaire personnel (un contexte de traduction, un nouveau sens, un terme spécialisé, ou un commentaire sur l usage ou la connotation par exemple) à un document ou partie de document. La figure 2.6 montre l exemple d un document annoté. 70

Selon la définition du W3C, «est annotation, tout commentaire, note, explication ou remarque pouvant être lié à un document web.» Bringay en s appuyant sur les définitions de (Azouazou et al., 2003), (Desmontils et al., 2002), (Denoue, 2000) et (Zacklad et al., 2003), propose la définition suivante : «Une annotation est une note particulière attachée à une cible par une ancre. La cible peut être une collection de documents, un document, un segment de document (un paragraphe, un groupe de mots, une image, une partie d image, etc.) ou bien une autre annotation. Chaque annotation possède un contenu matérialisé par une inscription. Cette dernière est une trace de la représentation mentale élaborée par l annotateur à propos de la cible. Le contenu de l annotation peut être interprété par un autre lecteur. L ancre lie l annotation à la cible (une ligne, une phrase surlignée, etc.)» (Bringay et al., 2004). Figure 2.6 : Exemple d annotation manuelle (Bringay et al., 2004) 71

L annotation concerne évidement tous les supports ; papiers ou supports électroniques. La pratique de l annotation sur papier avec surligner, encadrement,, s est facilement transposée aux documents électroniques : gras, majuscules, soulignement, association de commentaires, etc. Cependant, les annotations basées sur les ontologies sont des annotations conceptuelles ou sémantiques, où il s agit d associer des métadonnées à une ressource afin de l enrichir. Dans ce contexte (Amous et al., 2004) propose l annotation des documents, notamment les documents multimédias, par un ensemble de métadonnées structurées associées au contenu. Généralement, les annotations s effectuent à l aide d un outil d aide à l annotation selon l une des trois approches suivantes: - annotation manuelle, où on associe des termes dans des documents aux concepts de l ontologie. Cette association est quasiment basée sur le jugement humain, c'est-à-dire que c est l individu qui réalise l annotation avec une certaine forme d interface de type «drag and drop». - annotation automatique, où il s agit d appliquer des techniques de traitement naturel (TLN) pour assigner des mots aux concepts et aux propriétés. - annotation hybride, qui combine les deux approches précédentes. Selon (Bringay et al., 2004), les annotations permettent de contextualiser les connaissances non envisagées par le concepteur et produites pendant l écriture et la lecture, ainsi que de lier des documents et de guider la lecture d un document vers un autre. Dans le contexte d une mémoire d entreprise, les annotations peuvent être considérées comme faisant partie d un mécanisme générique qui associe des métadonnées ou des concepts de l ontologie à des éléments de connaissances comme un paragraphe, une phrase, le nom d un expert, etc. Dans le projet O comma (Comma, 2000) et (Gandon, 2002), les annotations sont basées sur une ontologie formalisée en RDF Schema (RDFS). L'approche consiste à indiquer les concepts envisagés et leurs relations dans une ontologie formalisée dans un schéma RDFS, ensuite d annoter les documents de la mémoire d entreprise en RDF en utilisant le vocabulaire conceptuel fourni par le schéma, et enfin d exploiter les annotations pour manipuler la mémoire d entreprise. 72

De multiples outils d annotation basés sur les ontologies ont été développés notamment dans le cadre du Web sémantique dont une description détaillée est donnée dans (Corcho et al., 2001). Parmi ces outils citons : - OntoAnnotate (Staab et al., 2001), est un outil d annotation semiautomatique qui permet de rassembler les connaissances des documents et des pages Web. Il crée une base de documents comprenant des métadonnées et enrichissant des ressources Web ou des Intranets avec ces métadonnées. Avec cet outil, on peut annoter non seulement les documents statiques en HTML, mais également des documents au format Excel ou Word. - SHOE Knowledge Annotator (Heflin et al, 1999) est un programme en Java qui permet aux utilisateurs de marquer des pages Web avec de la connaissance exprimée en SHOE. SHOE génère des métadonnées à l aide de champs décrits dans Dublin Core. Le programme d annotation est disponible sous forme d applet ou d application autonome en Java. - OntoMarkup (Vargas-Vera et al., 2001), comme son nom l indique, est un outil facilitant l annotation sémantique de documents. OntoMarkup est basé sur une ontologie qui permet à l'annotateur d'incorporer l'information sémantique dans les documents. L'outil d'annotation sémantique contient un composant de marquage basé sur l ontologie, qui permet à l'usager de naviguer et de marquer des segments d information appropriés; un composant d'apprentissage qui apprend des règles à partir d exemples et un composant d'extraction d information qui extrait les objets et les relations entre ces objets. 73

2.4 L exploitation des connaissances basée sur les ontologies L exploitation des connaissances via une ontologie, consiste à retrouver dans la mémoire d entreprise, ou plus généralement dans un système de recherche d information, les connaissances préalablement capitalisées et si possible d en déduire de nouvelles connaissances. Il s agit donc d une approche plus «intelligente» qu une simple recherche classique permettant à l utilisateur de formuler une requête de recherche par l intermédiaire de listes de mots-clés. En employant une ontologie du domaine par exemple, le processus de recherche d information intègre une dimension sémantique mais aussi, un mécanisme de raisonnement. Les ontologies contribuent donc à améliorer le processus de recherche d information et d exploitation des connaissances et ce quel que soit le système concerné : système d information de l entreprise, système à base de connaissances, Internet, etc. Nous allons voir à travers les sections ( 2.4.1 et 2.4.2), l apport des ontologies dans la recherche d information et la manipulation des SBC. 2.4.1 La recherche d information basée sur les ontologies Historiquement, et avant l introduction des ontologies, des treillis de concepts ont été appliqués dans la recherche d'information dès l'apparition de l'analyse de concepts formels (Wille, 1982). Les concepts formels sont vus comme des classes de documents pertinents pour une requête donnée. La relation de subsumption entre les concepts permet le passage d'un concept (ou d'une requête) à un autre plus général ou plus spécifique. Parmi les approches de recherche d'information utilisant les treillis de concepts, (Carpineto et Romano, 1996) proposent une approche qui montre l adaptabilité de la structure de treillis de concepts pour la recherche d information par navigation (browsing retrieval) en mettant l accent sur les performances qui dépassent nettement celles de la recherche booléenne classique. Par ailleurs, Prisse dans (Priss, 2000) propose un modèle de recherche d information appelé (FaIR) basé sur le treillis de concepts dans un système de recherche d information et montre comment ce modèle augmente la transparence et le contrôle du système par l utilisateur final. 74

L amélioration des performances des treillis de concepts s est accentuée en utilisant les ontologies de domaine. Ainsi, dans (Safar et al., 2004) une ontologie du domaine est utilisée pour raffiner la construction du treillis selon les préférences des utilisateurs afin de permettre d'éviter la construction du treillis complet. Par ailleurs, dans le travail de (Messai et al., 2005) les ontologies de domaine sont prises en compte dès la construction du système de recherche d information. La méthode proposée consiste à modifier la requête au lieu du treillis pour améliorer le processus de recherche d'information. Selon les auteurs, «une procédure de raffinement de requête, basée sur des ontologies du domaine, permet d'améliorer le rappel par généralisation ou par spécialisation.» L utilisation d une ontologie pour la recherche d information permet à l utilisateur de : - formuler sa requête en lui donnant l occasion de choisir les termes de sa requête. Pour guider l utilisateur à naviguer dans l arborescence d une ontologie, plusieurs interfaces de visualisation et d exploration d ontologie ont été proposées comme l outil KAON (Bozsak et al., 2002) et l outil Graphlet (Himsolt, 1996) ; - faciliter la recherche d information au sein de collections hétérogènes en indexant tous types de documents à partir des mêmes concepts ; - lever les ambiguïtés terminologiques et améliorer ainsi la précision et le rappel du système de recherche. Dans certaines applications telles que le Web sémantique, les ontologies jouent un rôle très important : elles fournissent le vocabulaire et les structures sémantiques associées aux sources d informations qui peuvent rendre l accès au contenu du Web plus intelligent. En effet, l usage des ontologies est parfaitement adapté pour la recherche d information dans le Web, c est pourquoi les recherches concernant le Web sémantique explorent les apports de l approche ontologique pour l amélioration de l exploitation des ressources de connaissances sur le Web. Un exemple de travaux sur le Web sémantique intégrant les ontologies est le système Ontoseek. Celui-ci est un système de recherche de pages web développé par (Guarino et al., 1999) en utilisant le modèle des graphes conceptuels de (Sowa, 1984). Le contenu des pages web et les requêtes sont représentés sous forme de graphes conceptuels. Ainsi, l ontologie est représentée sous forme de graphe conceptuel et les requêtes et documents sous forme de sousgraphes. La hiérarchie de l ontologie guide l extension de la requête et 75

l appariement documents/requête. Cette fonction d appariement est basée sur l'opérateur de projection de Sowa et recherche donc les spécialisations des nœuds de la requête. Ontoseek exploite l ontologie terminologique Wordnet (Miller, 1990) notamment pour lever les ambiguïtés des termes utilisés comme étiquette des nœuds des graphes. Une des applications de ce système a été de travailler sur l'annuaire des pages jaunes. L'utilisateur peut choisir les composants de son graphe en naviguant dans l'ontologie ou, à partir d'un terme. Ontoseek présente différents concepts à l'utilisateur qui sélectionne ceux qui correspondent le mieux à son besoin. Les réponses retournées par le système sont exprimées à l aide du vocabulaire de l ontologie. Des heuristiques sont utilisées pour valider la cohérence des relations. L architecture fonctionnelle de ce système (voir figure 2.7) intègre une ontologie linguistique généraliste pour représenter finement les informations et tient compte de la grande flexibilité terminologique dans l expression des requêtes, grâce à un mécanisme d intersection sémantique entre les requêtes et la description des pages web. Ce mécanisme est basé sur un calcul de subsomption sur les arcs et les nœuds du graphe. De plus, le système offre une assistance interactive pour la formulation de la requête par généralisation et spécialisation. Figure 2.7 : Architecture fonctionnelle du système Ontoseek (Guarino et al, 1999) 76

Ontoseek n a pas fait l objet de déploiement commercial, mais ce système a bien montré les gains potentiels que peuvent apporter les ontologies aux moteurs de recherche d information classiques sur le Web (Raynaud, 2000). Ce projet a montré l'intérêt d'utiliser une ontologie pour améliorer la recherche d information notamment dans le cas où les besoins en information sont complexes et nécessitent en conséquence l élaboration d informations à partir des informations stockées, par le biais d une ontologie linguistique. 2.4.2 La manipulation des SBC via les ontologies Un des objectifs de l utilisation des ontologies dans des applications de gestion des connaissances est en effet, l exploitation des connaissances capitalisées. L exploitation des connaissances dans un système basé sur les ontologies peut s effectuer selon trois approches qu il est possible de combiner ou d employer séparément. Ces approches sont : 2.4.2.1 L approche raisonnement Cette approche consiste en la manipulation des connaissances déjà acquises pour produire de nouvelles connaissances. Une mémoire d entreprise basée sur une ontologie permet une certaine flexibilité dans sa définition et son évolution. Dotée de mécanismes d inférence, le système d interrogation permet de confronter une nouvelle connaissance à un ensemble de connaissances connues pour déduire des informations liées à cette nouvelle connaissance. Cela signifie que les informations (schéma ou instances) peuvent être incomplètes et que les mises à jour peuvent être faites sans avoir une connaissance complète des informations de l ontologie. 2.4.2.2 L approche exploitation de liens Elle permet de retrouver des connaissances à travers les liens : une ontologie peut en effet, exprimer une sémantique plus riche au travers de la modélisation des liens entre les connaissances (Bataille et al., 2002), (Zhuge, 2003), (Dechilly et al., 1999). Les types de liens habituellement utilisés offrent une expressivité sémantique importante au domaine représenté. 2.4.2.3 L approche base de données Dans cette approche, la mémoire d entreprise peut être manipulée comme une base de données grâce à l exploration des instances de l ontologie en utilisant par exemple des langages de requêtes de type SQL. Ces langages 77

offrent des fonctionnalités algébriques pour interroger les instances de l ontologie. Pour montrer comment sont exploitées les connaissances dans un système basé sur les ontologies, citons l exemple du projet OnToKnowledge qui s appuie principalement sur les ontologies. Son objectif est de développer des méthodes et des outils permettant d utiliser les ontologies pour faciliter la gestion des connaissances. En effet, le projet OnToKnowledge s appuie sur Ontobroker (Fensel et al., 1998) qui est un ensemble d outils permettant l accès aux informations et connaissances sur le Web d une façon intelligente. Ontobroker est considéré comme un logiciel permettant la construction des applications sémantiques. Il exploite les modèles de connaissances et les données de différentes sources pour répondre à des requêtes. Pour cela, Ontobroker utilise une ontologie qui a été développée pour permettre la gestion des connaissances relatives aux laboratoires, projets, chercheurs et publications du domaine. Cette ontologie définit le vocabulaire commun et stocke et organise les connaissances à l'aide du langage F-Logic (Genesereth et Fikes, 1992) sous forme de frames. Son rôle consiste en la création et l exploitation des structures sémantiques pour l accès et le traitement automatisé des connaissances distribuées. Ontobroker se décompose en trois éléments qui sont : - un outil d'interrogation de la base de connaissances. Les requêtes sont des expressions du langage Frame Logic. Une interface sous forme de frame a été développée pour générer des requêtes de manière plus conviviale. Le résultat de ces requêtes est un ensemble de valeurs qui ne sont pas forcement des références à des documents. Par exemple, on peut rechercher tous les mots clés d'une équipe de recherche. - un moteur d'inférence, qui traduit les expressions Frame Logique en formule logique du premier ordre pour pouvoir faire des inférences. Les inférences permettent d'améliorer la cohérence de l'ontologie. Par exemple, si un chercheur a un article dans sa liste de publications, alors cet article doit avoir ce chercheur dans la liste de ses auteurs. - un «webcrawler», parcourant le web pour intégrer de nouvelles connaissances. Celles-ci sont stockées dans la même base. 78

2.5 Conclusion Nous avons dressé au cours de cette première partie, un rapide état de l art sur l intérêt de l utilisation des ontologies comme méthode de modélisation et de réutilisation des connaissances dans le contexte de la gestion des connaissances de l entreprise. Dans un premier temps, nous nous sommes intéressé à la gestion des connaissances de l entreprise en tant que domaine à part entière ayant des approches, des processus et des outils. La définition de ce qui est la gestion des connaissances dans le domaine de l ingénierie des connaissances permet de cerner le point de vue selon lequel nous envisageons d aborder la notion de la gestion des connaissances, et d identifier en conséquence, les différentes approches et méthodes relatives à ce domaine. Ceci nous a permis de réfléchir à l approche de gestion des connaissances la mieux adaptée au contexte de notre application. Dans un deuxième temps, nous nous sommes attaché à définir les ontologies et à présenter les méthodes et outils d aide à leur construction. Approcher les objectifs, les composants, le cycle de développement et l utilisation des ontologies, facilite la compréhension de leur apport dans la gestion des connaissances. Etant donné que le langage utilisé pour représenter formellement une ontologie a un impact direct sur le niveau de formalisation de cette ontologie, nous avons jugé utile d examiner les différentes catégories de langages de représentation d ontologies. Ainsi, l étude de ces formalismes a révélé que les logiques de description sont particulièrement adaptées à la représentation des connaissances formalisées sous forme de documents. Les ontologies permettent également des aspects complémentaires, tels que l indexation et l annotation des ressources de connaissances formalisées. Nous retiendrons donc qu une ontologie du domaine peut être exploitée comme un langage consensuel pour l indexation des ressources de connaissances. Enfin, tandis que l objectif visé par l approche ontologique est la manipulation et la réutilisation des connaissances préalablement modélisées, il a été nécessaire de montrer l'intérêt d'utiliser une ontologie pour améliorer la recherche d information, mais surtout d étudier les différentes approches d exploitation des connaissances dans les systèmes à base de connaissances. Idéalement cette exploitation des connaissances doit 79

combiner l approche bases de données, l approche raisonnement et l approche basée sur les liens entre les connaissances. Nous verrons aux chapitres suivants, que toutes nos propositions sont fondées d une part sur l analyse de ce qui a été évoqué à travers cette revue de la littérature, et d une autre part, sur la problématique particulière au domaine d application auquel sont destinés nos travaux de recherche. 80

Deuxième Partie Proposition et mise en œuvre d une démarche de gestion des connaissances 81

3 La problématique de gestion des connaissances au sein du CIRTIL Nous présentons dans ce chapitre la problématique particulière de la gestion des connaissances du CIRTIL (Centre Inter-Régional de Traitement de l Information de Lyon). Cette problématique a émergé suite aux évolutions qu a connues l entreprise ces dernières années. En effet, la dynamique du CIRTIL au sein de la branche Recouvrement a révélé le manque d une méthode efficace de capitalisation des savoirs et savoir-faire de l entreprise. Par ailleurs, la restructuration et les réformes internes ont accentué ce manque grâce notamment à la banalisation de l utilisation d outils informatiques et à la diffusion d informations semi-structurées et non structurées sur les réseaux informatiques : outils de workflow, messagerie électronique et Internet. Rappelons que le CIRTIL est l un des principaux pôles technologiques de la branche Recouvrement. Le Recouvrement est l une des quatre branches du régime général de la Sécurité Sociale en France 11. Son rôle consiste à collecter les cotisations et contributions pour les mettre à la disposition des caisses des trois autres branches : Allocations Familiales, Assurance Maladie et Vieillesse. La branche Recouvrement compte environ 13500 salariés répartis dans plusieurs organismes sur tout le territoire et organisé en quatre organismes qui sont L ACOSS, les URSSAF, les CGSS et les CERTI : - L'ACOSS (Agence Centrale des Organismes de Sécurité Sociale) est la caisse nationale qui assure la gestion commune et centralisée de la trésorerie du régime général. Elle pilote et coordonne l'activité des organismes du Recouvrement. - Les URSSAF (Unions de Recouvrement des cotisations de Sécurité Sociale et d'allocations Familiales) sont chargées de collecter les cotisations et contributions destinées à financer le régime général de la sécurité sociale. Leur rôle est de simplifier les obligations des employeurs et de professionnaliser l'activité du recouvrement. Chaque URSSAF gère entre 11000 et 935000 comptes cotisants. 11 www.securite-sociale.fr et www.urssaf.fr/urssaf/recouvrement_frm.html 82

- Les CGSS (Caisses Générales de Sécurité Sociale) sont situées dans les départements d'outre Mer. Elles assurent à la fois la collecte et la distribution des ressources de la sécurité sociale. - Les CERTI (CEntres Régionaux de Traitement de l'information) et CNIR (Centres Nationaux d'informatique du Recouvrement) sont des Pôles de compétence et appuis régionaux des URSSAF. Ils exploitent les données informatisées de la branche Recouvrement et jouent un rôle très important notamment dans la gestion technique des systèmes d'information de cette branche. Le CIRTIL est donc l un de ces CERTI. Basé à proximité de Lyon, il est chargé de gérer le système d informations de dix-huit URSSAF situées dans quatre régions : Rhône-Alpes, Auvergne, Bourgogne et Seine et Marne d'ile de France et de deux CGSS en Martinique et Guyane. Il applique les décisions prises par les instances délibératives de l'acoss et approuvées par les ministères de tutelle et il accomplit auprès des URSSAF une mission de service, chaque organisme conservant son autonomie. Pour mieux cerner la problématique de gestion des connaissances au sein du CIRTIL, nous avons organisé le présent chapitre en six sections. Nous nous sommes intéressés dans la première section, au domaine d activité de CIRTIL ainsi qu aux connaissances métier associées. Les sections deux, trois et quatre sont consacrées à la description des principaux facteurs qui sont à l origine de la problématique de gestion des connaissances au CIRTIL. La section suivante rappelle les enjeux de la gestion des connaissances pour l entreprise et la dernière section présente une synthèse du chapitre. 3.1 Domaine d activité et connaissances métier Le CIRTIL est une entreprise informatique chargée de la gestion du système d information de la branche Recouvrement pour le compte de dixhuit URSSAF et de deux CGSS. Son domaine d activité concerne la mise en production et l exploitation des traitements informatiques ainsi que le développement de nouvelles applications logicielles. Dans le cadre de ces activités, le CIRTIL assume également une mission de service qui se traduit par l assistance technique et fonctionnelle 83

aux utilisateurs de ces applications. En conséquence, les connaissances métier associées sont relatives principalement aux deux grands thèmes suivants de l informatique : le traitement de l information et le développement d applications logicielles. 3.1.1 Le traitement de l information Le traitement de l information est la principale activité du CIRTIL. Cette activité concerne toutes les fonctionnalités du Système Informatique de la branche Recouvrement (SIR) à savoir : le stockage des données, le suivi de l exploitation, les éditions de notices, l assistance technique et fonctionnelle aux utilisateurs, la sécurité informatique et le bon fonctionnement du réseau et des infrastructures techniques. Ces activités peuvent être regroupées en deux principaux processus qui sont la mise en production et l exploitation des traitements informatiques d une part, et l assistance aux utilisateurs d autre part. 3.1.1.1 La mise en production et l exploitation des traitements informatiques Cette activité consiste à mettre des applications informatiques à disposition des URSSAF rattachées au CIRTIL et d en assurer l'exploitation et le suivi. Il existe deux familles d applications : les applications à mode d'exploitation continue et les applications à mode d'exploitation alternative. La première famille d applications présente une planification fixe, les applications sont actives en permanence. La deuxième famille d applications présente un système transactionnel de la journée et des traitements par lots (dits traitements batchs ) planifiés par les URSSAF la nuit et les week-ends. Pour ces deux catégories d applications, les équipes du CIRTIL doivent : - exécuter des traitements planifiés ou traitements batchs ; - assurer la mise à disposition du transactionnel ; - assurer l'édition des documents générés par les sessions batchs des URSSAF. L activité de mise en production et d exploitation se décline alors en deux processus : le processus de mise en production et le processus exploitation. La mise en production consiste à assurer pour les vingt organismes de l inter-région CIRTIL les missions de support technique et d évolution fonctionnelle du Système National de Production (SNP), à savoir : 84

- l analyse des lots SNV2 et la diffusion de l information ; - le développement et la maintenance de traitements spécifiques SNV2 ; - les interventions sur bases de données ; - le diagnostic des anomalies SNV2 et leurs corrections ; - la gestion des comités techniques SNP ; - la diffusion des applications Infocentre. En revanche, l exploitation est un processus qui a pour objectif d assurer l ensemble des activités de mise en production et opérations liées à la planification, à l ordonnancement et au traitement des applications. De plus, il faut veiller à ce que toutes les ressources nécessaires à un traitement soient disponibles afin que les applications tournent sans rupture de charge ni saturation. La gestion des entrées/sorties des supports de données fait également partie de ce processus. Ainsi, les principales étapes selon lesquelles se déroule ce processus sont : - la mise à disposition des ressources informatiques ; - la gestion des alertes ; - la sauvegarde ; - la gestion des flux entrants/sortants ; - le lancement des traitements par lots ; - l édition et l expédition des notices. Les connaissances associées à ces activités sont alors des connaissances techniques et fonctionnelles liées aux applications informatiques, aux lots produits dans le cadre du SNP et aux environnements spécifiques à l installation et à la diffusion des traitements informatiques. Une partie de ces connaissances est implicite et se trouve localisée «dans les têtes des employés», il existe néanmoins des connaissances transcrites sous forme de documents qui paraissent dans des procédures, des manuels, des bases documentaires spécialisées et des fichiers localisés dans différentes sources d informations de l entreprise. 3.1.1.2 L assistance aux utilisateurs Ce processus a pour objectif de répondre aux demandes d assistance fonctionnelle ou technique des URSSAF et CGSS rattachées au CIRTIL. Les demandes sont généralement envoyées à l équipe d assistance technique et fonctionnelle de la cellule ASUR (ASsistance aux URssaf). Néanmoins, certains organismes privilégient le contact direct auprès des experts du CIRTIL. La cellule ASUR se doit de prendre en compte toute demande d assistance et de la traiter ensuite, de centraliser 85

puis de diffuser les informations d ordre général aux organismes adhérents. Le traitement des demandes est assuré selon les cas soit par la cellule ASUR soit par les Pôles de compétence concernés (voir le logigramme présenté par la figure 3.1). Les équipes concernées sont chargées de prendre en compte puis de répondre, dans les délais fixés contractuellement, aux demandes d assistance selon trois niveaux d urgences. Théoriquement, le niveau 1 est pris en charge par le service ASUR. Les niveaux d'assistance 2 et 3 sont assurés par les Pôles de compétences spécialisés. Ainsi, l équipe du Pôle Administration Systèmes et Réseaux assure des missions d assistance directe auprès des organismes de l inter-région dans le domaine des environnements micro, dans le cadre du déploiement de machines ou de produits techniques (Lotus Notes, gestion de parc, outils de compression, AFPS, transfert de fichiers), tandis que l équipe du Pôle SNP prend en charge les anomalies fonctionnelles des traitements de niveau expertise sur le SNV2. Dans ce cadre, le Pôle SNP a traité 2256 messages CAP 12 au cours de l année 2001. Le mode d assistance le plus fréquemment assuré est l assistance à distance. Celle-ci s effectue soit par téléphone soit via l outil CAP. Dans certains cas, les demandes formulées par les clients nécessitent une intervention sur site. Les connaissances associées au domaine de l assistance varient selon le domaine d activité et selon le niveau de l assistance demandée par le client. Lorsqu elles sont formalisées, les connaissances relatives à l assistance sont localisées dans la base documentaire CAP et sur les fiches d intervention sur site. 12 CAP est une base documentaire dédiée à l enregistrement et à la gestion des dossiers d assistance aux URSSAF. 86

Figure 3.1 : Description détaillée du processus de traitement des demandes au CIRTIL. 87

3.1.2 Le développement d applications logicielles Le développement de nouvelles applications logicielles pour le compte de la branche Recouvrement est géré au CIRTIL sous forme de projets régionaux et nationaux dans le domaine de la production informatique. L objectif est de développer des applications répondant aux exigences fixées par les clients : URSSAF, CGSS et ACOSS. Le développement d une application consiste en un ensemble de tâches et d actions allant de l analyse des besoins, généralement exprimés dans un cahier des charges, jusqu à la livraison de l application. Ces tâches, illustrées par la figure 3.2, sont prescrites par les services concernés. L analyse des besoins exprimés par le client est la phase initiale qui permet le lancement du projet. Cette phase est suivie de la planification qui se définit par la détermination des tâches qui appuieront l'affectation efficace des ressources au projet, ainsi que l'élaboration d'un plan de travail qui respecte les délais. La planification aboutit à l élaboration du planning du projet. Cette étape est suivie de la rédaction d une analyse fonctionnelle détaillée qui s appuie sur l analyse des besoins et qui vise la définition des fonctionnalités de l application à mettre en place. Arrive ensuite la phase de développement proprement dit qui consiste en la programmation. La validation fait suite à une étape de tests durant laquelle il est permis d apporter des modifications notamment sur le plan du développement et de l analyse fonctionnelle. Le «livrable» est alors une application informatique souvent accompagnée d une documentation d utilisation. Le projet est ensuite clos. Figure 3.2 : Processus de développement d une application logicielle 88

Les applications développées (ou à développer) concernent différents domaines d activité de la branche Recouvrement : la gestion de la comptabilité des organismes de recouvrement dont l exemple est l application SICOMOR (Système Intégré de COMptabilité des Organismes du Recouvrement), la gestion du recouvrement des employeurs de gens de maison concrétisée par le projet CES (Chèque Emploi Service) ou encore la gestion documentaire assurée par des projets de Lecture Automatique de Documents (LAD) et de Gestion Electronique de Documents (GED). Ces projets nécessitent des connaissances métiers ainsi qu une expertise de développement. Pour cela, le développement d applications s appuie sur des ressources propres au Recouvrement ou faisant partie des pôles de production et d études mais également, sur des ressources des partenaires, des fournisseurs ainsi que sur des produits et technologies proposés par des entreprises extérieures. Ce travail monopolise de nombreuses compétences : management de projet, maîtrise de méthodes de conception et de modélisation, maîtrise des langages de programmation, capacité de rédaction de documentation technique, etc. Ainsi, les connaissances relatives au processus de développement d applications logicielles, sont généralement des connaissances qui relèvent du domaine de la gestion des projets informatiques. Néanmoins, nous distinguons les connaissances nécessaires à la réalisation des différentes étapes du projet des connaissances générées par certaines activités constituant le projet même. Dans le premier cas, ces connaissances sont particulièrement relatives aux activités suivantes : - l élaboration de cahiers des charges qui définissent les spécifications auxquelles devra répondre le logiciel à développer ; - la définition de l environnement d exécution (architecture, types et version des systèmes d exploitation, périphériques nécessaires à l enregistrement des données et à la restitution des résultats, ) ; - la conception de l application et de ses composants ; - la mise en place des stratégies de développement ; - les tests du logiciel pour s assurer de son adéquation avec les objectifs pour lesquels il a été créé. Les connaissances générées sont formalisées en une documentation technique spécifique. Parmi ces documents citons les spécifications et dossiers de programmation, les comptes-rendus des tests de validation et les codes sources. 89

3.2 Disparité des connaissances dans le Système d Information de l Entreprise (SIE) Le Système d Information d Entreprise (SIE) du CIRTIL est caractérisé par une grande richesse documentaire : normes de développement et de conception, directives d installation, suivis de projets et fichiers divers. Aussi, il est systématiquement alimenté par les connaissances individuelles et collectives des employés. Cependant, ces connaissances sont difficilement repérables car elles sont enfouies dans les différentes sources qui constituent le SIE. 3.2.1 Le système d information de la branche Recouvrement Le Système d Information du Recouvrement (SIR) peut être vu comme une composante du SIE du CIRTIL. Utilisé par 90000 agents pour gérer plus de 4,8 millions de comptes cotisants 13, ce système, représenté par la figure 3.3, est organisé autour d'une application centrale appelée SNV2 (Système National Version 2) et d un ensemble de sous-systèmes interfacé avec le SNV2. Cet ensemble de sous-systèmes est destiné soit à compléter le SNV2 soit à l adapter aux évolutions législatives et techniques ou aux besoins des utilisateurs. Par ailleurs, le SIR est doté d un ensemble de ressources documentaires généralement stockées dans des bases développées sous Lotus Notes. Parmi ces bases, citons Athéma et CAP. Ces deux sources sont présentées ci-après car ce sont les bases les plus fréquemment utilisées par les employés du CIRTIL. 3.2.1.1 Le SNV2 Le SNV2 est l application centrale du Système National de Production (SNP) d'une URSSAF permettant la gestion des comptes cotisants. Il est structuré autour de trois sous-ensembles : - le système opératif, qui permet de gérer toutes les opérations liées au recouvrement des cotisations et des contributions. Il s agit de la partie du SNV2 que connaît le gestionnaire de compte ; - la gestion du système opératif, qui prend en compte le système de commande, les tables et les sécurités (le système de commande permet 13 Chiffres 2000 90

le traitement de toutes les conséquences d une saisie au sein de la fonction utilisée et assure des liens entre les différentes fonctions) ; - le système informatif, qui traite toutes les relations internes et externes à l URSSAF et collecte des informations, notamment à des fins statistiques. Dotées physiquement et sauf exception, d une composante batch et transactionnelle, les bases de données se situent dans les CERTI chargés de leur gestion. Depuis son origine, le SNV2 s'est développé dans trois environnements techniques différents dont deux sous BULL et un sous IBM. Cette politique a généré de sérieux inconvénients en termes de délais de développement (multiplication par 3 des équipes chargées de la maîtrise des environnements techniques) et d'interfaçage avec d'autres composants de l'informatique du Recouvrement. C est ainsi que la généralisation de la migration du SNV2 sous UNIX a été réalisée en juin 2001 pour toutes les URSSAF et CGSS. Figure 3.3 : La cartographie du Système d Information du Recouvrement 3.2.1.2 Les outils périphériques Des applications complémentaires sont mises en place parallèlement au SNV2. Ces applications sont considérées comme des outils périphériques car elles permettent une gestion des données plus souple dans l environnement client/serveur. Le client est le poste de travail qui peut avoir une ou plusieurs fonctions et qui peut accéder au non par le réseau à des serveurs. Le serveur abrite une base de données complémentaire ou issue de la base SNV2, éventuellement interfacée avec elle. Ces données sont gérées par des applications (logicielles ou programmes) spécifiques à chaque serveur. 91

Ces applications sont développées pour satisfaire des besoins exprimés par les organismes de la branche Recouvrement. Elles peuvent être classées selon trois grands domaines caractérisant le système d information du Recouvrement : la production, la gestion et la bureautique. Les traitements effectués par chaque application sont soit générateurs soit récepteurs de flux d informations. Ces flux d informations inter-applications représentent une ressource de connaissances importante pour les employés du CIRTIL. 3.2.1.3 La base documentaire Athéma Pour les utilisateurs du SIR, Athéma est la base documentaire nationale du SNP (Système National de Production). Elle est directement accessible aux personnes autorisées depuis leurs postes de travail via Lotus Notes (Version 4.5). Sa structuration thématique associe des descriptifs de la législation, des catégories de cotisants concernés, des fonctions de la V2 et des traitements batch correspondants. Sa consultation s effectue à travers les Vues suivantes : Thèmes, Modes d'emploi, Codification V2, Transactions et Batch. 3.2.1.4 La base documentaire CAP Cette base permet une gestion des dossiers de maintenance corrective et évolutive concernant le SIR. Des experts identifiés (techniciens Urssaf, Urssaf pivots, maîtres d'œuvre, groupes de travail et producteurs) assurent la gestion et l'assistance aussi bien fonctionnelle que technique de ces dossiers. La base CAP existe en trois versions : CAP National, CAP Régional et CAP Local. L'installation du CAP local est obligatoire dans tous les organismes. Au CIRTIL, c est la base CAP régional qui est la plus importante. Elle contient 17370 dossiers créés et traités entre 2002 et 2003. Elle offre un accès thématique via les quatre catégories suivantes : Prise en Charge, Dossier, Ressources et Statistiques. Les deux catégories qui sont systématiquement consultées par les employés sont la catégorie Prise en charge et la catégorie Dossier. La première catégorie contient des informations signalant le problème ou l anomalie exprimés par les clients tandis que la deuxième catégorie donne accès à la description détaillée de l anomalie en précisant les modalités de sa résolution, les actions menées et les intervenants. Chacune de ces catégories est organisée en un ensemble de Vues qui permettent l accès aux documents. 92

Un exemple de ce mode de consultation est présenté à travers la figure 3.4. La copie d écran de la base CAP Régional montre à gauche, les différentes Vues de la catégorie Dossier. Ces Vues permettent de consulter les dossiers par : état, application, date de saisie, N de dossier, priorité de traitement ou par organisme. Dans l exemple donné par la figure 4, le choix de la Vue application pour consulter les dossiers permet d afficher les anomalies ou problèmes correspondant à une Application donnée. Les deux Vues les plus utilisées au CIRTIL sont la Vue Date de saisie et la Vue Intervenant : - la Vue date de saisie est la Vue la plus consultée dans la catégorie Dossier. Elle permet à un agent ASUR de prendre connaissance des dernières demandes émises par les clients. Ces connaissances concernent les applications, l objet de la demande et surtout l état de la demande qui peut être soit actif ou soit résolut; - la Vue Intervenant dans la catégorie Ressources, est une Vue qui permet à un employé d avoir accès aux demandes qui lui sont destinées. Ces demandes proviennent soit des URSSAF, soit des collègues qui connaissent l expertise de cet employé. Figure 3.4 : L interface de consultation de la base CAP 93

Un autre mode d accès aux dossiers est l utilisation du moteur de recherche de Lotus Notes. Ce mode de consultation est particulièrement utilisé pour effectuer des recherches multicritères ou multi-bases. Un dossier CAP obéit à une structure type préalablement prédéfinie. Cette structure propose l enregistrement des informations dans les six rubriques suivantes : Description du Dossier, Objet, Intervenant, Actions menées, Résolution, Traçabilité. Les dossiers ont le format nsf de Lotus Notes avec la possibilité de leur rattacher des documents dans d autres formats (doc, rtf, pdf, htm, ) 3.2.2 Les bases de données relationnelles De nombreuses bases de données relationnelles sont utilisées au CIRTIL. Parmi ces bases de données citons les bases Oracle, MySQL et Access. Ces bases de données sont généralement destinées à gérer et à stocker des données et informations ponctuelles. Néanmoins, l analyse de la structure et du contenu de la base MySQL montre l existence dans cette base de certains enregistrements susceptibles de représenter des éléments de connaissances. Nous avons particulièrement identifié ce type d informations dans certaines tables destinées à la description des incidents informatiques et des corrections associées, notamment les tables (INC_DESC) de description des incidents et la table (INC_DESC_CORR) d enregistrement des corrections des incidents. Cette base, qui inclut entre autre des données relatives à l activité d exploitation des applications logicielles, regroupe en plus des données ponctuelles de type date de signalement d incident ainsi que des descriptions plus explicites telles que la description des causes des incidents et les corrections associées ou les actions correctives. 3.2.3 Les bases locales Lotus Notes Ces bases sont dites locales car, elles sont développées en interne par les employés du CIRTIL sous Lotus Notes. Lotus se présente sous la forme d'un outil relationnel client/serveur : un serveur Lotus et un client Lotus. Le client est une sorte de gestionnaire documentaire qui présente des icônes, chaque icône étant une base documentaire contenant des documents Lotus Notes. 94

L'accès à chaque base se fait par simple double-clique. Le contenu des bases est stocké sur le serveur qui dessert trois parties : http, pop3 et smtp. La connexion au serveur se fait par ajout d un document dans le carnet d'adresses Lotus Notes personnel du client (lui aussi sous forme de base de documents) ainsi que de l'ip du serveur, son DNS, etc. Les bases Lotus Notes peuvent être collaboratives, c'est-à-dire que chaque client peut avoir accès à la même base selon les droits d'accès définis dans la liste de contrôle d'accès de la base. Une base Lotus Notes peut être exécutée sur le client Lotus et sur un navigateur Internet. L'exécution d'une base Notes dans le client présente souvent à l'écran des Vues. Celles-ci peuvent contenir un ensemble de documents contenant des informations modifiables ou non. Nous distinguons deux types de bases locales Lotus Notes : les bases de connaissances et les bases documentaires. Les bases de connaissances sont destinées à la capitalisation et à l enregistrement d informations liées aux savoir-faire, tours de main ainsi qu aux réponses à des questions techniques très pointues. Elles regroupent ainsi des connaissances inhérentes à l action qui émergent souvent durant l exécution des tâches par les employés. Le contenu de ces bases est alors axé sur les connaissances implicites transcrites sous forme de documents. Ces derniers sont rédigés comme des messages électroniques en réponse à un problème ou tout simplement en décrivant une situation. Un exemple-type de bases de connaissances est la base Donald développée par l équipe du Pôle Administration Systèmes et Réseaux. Le contenu de cette base est créé par les employés habilités. Ces derniers peuvent intégrer les connaissances dans la base selon un modèle type de structuration des connaissances. La structure des documents exigée obéit à l organisation des connaissances suivant les éléments suivants : Titre, Créateur, Pôle, Catégorie, Logiciel et Matériel. Ces éléments sont suivis d une description du contenu du document qui peut mêler du texte avec des schémas, des images ou encore des liens vers des fichiers attachés localisés sur d autres ressources. Ces fichiers fournissent des explications ou des informations complémentaires. Une fois enregistrées sous forme de documents, ces connaissances sont classées et gérées comme des documents. Leur consultation s effectue alors soit par une navigation dans la base de connaissances soit en utilisant des mots-clés libres. La navigation dans les bases se fait par l accès aux informations à travers les Vues. 95

Dans la base Donald les connaissances sont regroupées sous les cinq catégories suivantes : Erreurs, Problèmes, Trucs et astuces, Notes techniques et Procédures. La figure 3.5 montre un exemple d enregistrement d informations dans cette base. La recherche d un document dans une Vue peut se faire par le biais de mots-clés libres grâce au moteur de recherche de Lotus qui offre une interrogation en mode texte (full text). Notons enfin que la consultation de ces bases de connaissances est restreinte aux seuls membres de l équipe ayant créé la base. Par conséquent, la diffusion des savoir-faire est limitée au sein des groupes. La deuxième catégorie des bases locales développées sous Lotus Notes est celle des bases documentaires. Ces bases sont créées, consultées et gérées de la même façon que les bases de connaissances. La seule différence se situe au niveau de la nature des connaissances contenues dans ces bases. Ainsi, les bases de connaissances font référence à des savoirfaire, tandis que les bases documentaires sont le plus souvent constituées d un ensemble structuré.de documents techniques. La structure des documents techniques obéit en général à un modèle type de présentation des données prédéfini au sein de chaque Pôle. Aussi, le circuit de production des documents se déroule selon un certain nombre de règles. Parmi ces règles, citons la validation d un nouveau document qui doit se faire soit par un expert soit par le responsable hiérarchique de la personne ayant rédigé le document. Parmi les Pôles qui ont développé des bases documentaires, il y a le Pôle Projets Nationaux et le Pôle Application. Une des bases documentaires développées par le Pôle Projets Nationaux est la base de projets. Cette base peut être vue comme une mémoire documentaire vivante de tous les projets réalisés ou en cours de réalisation. Elle contient donc un ensemble de documents relatifs à la gestion et au suivi des projets : cahiers des charges, planning de projets, spécifications, codes sources et comptes rendus de réunions. En revanche, la base documentaire du Pôle Application contient toute la documentation réalisée par les membres de l équipe. Cette documentation contient les procédures d exploitation, les opérations liées à la planification, à l ordonnancement et au traitement des applications mais aussi, les guides utilisateurs des outils de production. 96

Figure 3.5 : Exemple d enregistrement des savoir-faire dans la base de connaissances Donald 3.2.4 Les ressources électroniques En plus des connaissances qui se présentent sous forme de documents dans des bases documentaires et des bases de connaissances, il existe de nombreuses autres ressources de connaissances dont la localisation est difficile à effectuer. Une ressources électronique est par définition un objet numérique (fichiers multimédia, textes, graphismes, vidéo, son, page Web, url, ) Les ressources électroniques forment alors un ensemble d objets cohérents stockés sur des machines interconnectées ou sur des supports informatiques de grande capacité et transportables. Au CIRTIL, chaque Pôle possède son espace serveur sur lequel sont localisées de nombreuses ressources électroniques. On y trouve souvent des fichiers créés ou acquis par les membres de l équipe du Pôle. 97

Ces fichiers sont généralement hétérogènes au niveau des formats et des structures. Les sujets sont variés selon les services de leur provenance. De fait, les thèmes couverts par les ressources électroniques varient selon les activités de chaque Pôle. Du point de vue traitement et diffusion de ces ressources, notons que les conditions de leur gestion ne sont pas bien définies, car il n existe actuellement aucune chaîne de traitement de documents électroniques interne au CIRTIL pour la gestion documentaire. En effet, les documents sont stockés selon une arborescence «maison» appropriée pour chaque Pôle. Cette arborescence appelée «Plan de classement» permet le classement des ressources sur les serveurs d une part, et l accès aux documents d une autre part. 3.2.5 Les documents sur support papier La documentation sur support papier vient alimenter systématiquement le contenu du SIE. Bien que l environnement documentaire soit en grande majorité sous forme numérique, plusieurs catégories de documents sur support papier sont utilisées comme ressources de connaissances. Il y a d abord la documentation spécialisée : manuels, procédures, normes, lots, etc., souvent rangées dans des classeurs et gérée au niveau des Pôles. Ensuite, il y a des documents regroupés dans des dossiers classés par projet ou par organisme. Un dossier est composé d un ensemble de pièces relatives à un même sujet ou un même projet : différentes versions de cahiers des charges, les correspondances, le planning du projet et les comptes rendus de réunions. De plus, il y a les ouvrages de référence et la presse spécialisée dans le domaine informatique. Sept titres de revues spécialisées sont régulièrement reçus par le CIRTIL. Parmi ces titres citons : Réseaux et Télécoms, Le Monde informatique et SVM. L acquisition de ces revues se fait par les responsables des Pôles, tandis que leur gestion est assurée par le Secrétariat de Direction qui enregistre les numéros reçus et veille sur leur distribution à tous les Pôles. Cette gestion se fait d une façon manuelle en inscrivant périodiquement les numéros reçus dans un tableau. En ce qui concerne les ouvrages, la politique de leur acquisition et gestion demeure aléatoire, car elle se fait d une façon tantôt individuelle, tantôt collective au sein d un seul Pôle. Il n existe aucun catalogue; les ouvrages n ont jamais été catalogués ni indexés. 98

3.3 La question de l accès centralisé aux connaissances L accès aux connaissances de l entreprise via une interface unique et centralisée est l un des objectifs de la mise en place d une démarche de gestion des connaissances pour le CIRTIL. Certains utilisateurs notamment les décideurs souhaitent disposer d un outil fédérateur capable d interroger simultanément toutes les ressources de connaissances. Actuellement, l accès aux connaissances s effectue par le biais d une multitude d outils. En effet, plusieurs ressources de connaissances sont accessibles via l Intranet et les bases Lotus Notes. L accès aux ressources de connaissances via l Intranet se fait selon les méthodes classiques de recherche d information. Les deux modes de recherche possibles sont l exploration du système par la navigation dans l arborescence et la saisie de mots-clés basée sur le moteur de recherche Htdig 14. De même, les ressources de connaissances dans les bases Lotus Notes, sont accessibles selon deux modes, à savoir l exploration du contenu de la base à partir des vues d une part, et l utilisation du moteur de recherche de Lotus Notes qui permet la recherche en mode texte intégral (full text), d autre part. L absence d un moteur de recherche permettant l interrogation simultanée des bases de données et des bases documentaires amène les utilisateurs à interroger plusieurs outils séparément avant de réunir les informations répondant à une même requête. Du point de vue de l'utilisateur, il serait souhaitable de n'avoir qu'une seule interface permettant d'interroger plusieurs sources d information. Nous présentons dans cette section un scénario type décrivant les conditions d utilisation des connaissances durant le déroulement de l activité d exploitation. Compte tenu de la particularité de l activité d exploitation, nous montrons l utilisation des connaissances par les techniciens de l exploitation travaillant au Pôle Application. Rappelons que l équipe de ce Pôle a pour mission d assurer le suivi d exploitation des applications utilisées par les URSSAF. Les techniciens de l exploitation doivent veiller à ce que toutes les ressources nécessaires à un traitement informatique soient disponibles et que les applications tournent sans rupture de charge ni saturation. 14 http://www.htdig.org/ 99

Dans le cas où des incidents ou anomalies surviennent au cours du processus de l exploitation, les membres de l équipe interviennent pour gérer et limiter les risques éventuels. La gestion des incidents et la maîtrise des problèmes d'indisponibilité d'applications s accompagnent de l usage des connaissances relatives aux résolutions, aux corrections et à l anticipation d'éventuelles évolutions de l incident. Lorsque le technicien prend acte du signalement d un incident ou d une anomalie, il fait appel à des connaissances personnelles ou collectives qu elles soient implicites ou explicites. Il recherche des éléments susceptibles de l aider à corriger l incident, de mieux comprendre les causes de son déclenchement, et de prendre les mesures et les décisions qui permettraient d en freiner l évolution. L approche de recherche et de coordination de ces éléments consiste d abord en un processus cognitif basé sur le raisonnement du technicien. L objectif étant de réunir les éléments de connaissances nécessaires à la résolution du problème. Ensuite, selon le besoin, le technicien de l exploitation doit collecter les connaissances adéquates à partir de plusieurs ressources, car la réponse à sa requête n existe pas à priori dans une seule source d information. Plus concrètement, considérons l anomalie suivante : l URSSAF de Lyon signale une panne du serveur de l application DUE. Pour pallier cette panne, le technicien de l exploitation doit consulter différentes sources. Cette configuration illustrée par la figure 3.6, montre l interrogation spécifique et indépendante des ressources susceptibles de contenir des éléments de connaissances pertinents à partir : - des fiches d incidents ; - de la documentation technique et spécialisée dans la base Application qui contient des documents concernant l application DUE ; - de la base de données MySQL à travers l espace Dossier Application dans l Intranet ; - des dossiers CAP Ces documents, qui contiennent des connaissances utiles, sont localisés dans des sources distribuées entre des outils différents, notamment l Intranet, la base documentaire Application et la base CAP. Le technicien de l exploitation est donc contraint d interroger successivement ces sources afin de faire lui-même la synthèse des connaissances qui lui seront utiles. 100

Figure 3.6 : L accès aux ressources des connaissances par les employés du CIRTIL Avec une telle méthode et en l absence d un point d accès unique à toutes les ressources, plusieurs inconvénients sont perçus. Parmi ces inconvénients notons : - les délais de recherche d information ; - les risques d omission de la consultation de certaines ressources ; - l absence d une synchronisation, c'est-à-dire une mise en relation active entre les connaissances qui cause une insuffisance d expression sémantique. Nous avons particulièrement noté l absence de liens entre une fiche descriptive d un incident et la documentation de résolution de cet incident. 101

3.4 La problématique de gestion 3.4.1 L absence d une solution globale de gestion des connaissances Le CIRTIL dispose d'un capital de connaissances volumineux, hétérogène et distribué dont la gestion et la sauvegarde ont exigé la mise en place de quelques outils de gestion, de collecte et de diffusion d informations. Il existe en effet, plusieurs outils : l Intranet, les bases de connaissances et les bases documentaires développées sous Notes, le moteur de recherche "Spirit" paramétré et intégré dans le système de la base CAP, etc. Cependant, aucune solution globale techniquement avancée pour maîtriser la problématique de gestion du patrimoine intellectuel de l entreprise et la façon dont il faut le capitaliser, n est disponible. Ces outils ont été développés pour satisfaire des besoins ponctuels en matière d utilisation des ressources de connaissances sans pour autant adopter une approche globale ou utiliser un système approprié de gestion des connaissances. Parmi les facteurs qui freinent l existence d une telle solution citons la diversité des approches dédiée à la capitalisation des connaissances. Au CIRTIL, cette diversité d orientations disponibles a engendré la mise en œuvre simultanée d une diversité d outils de gestion et de diffusion des informations. Nous avons noté plusieurs outils dont le développement s est fait en l absence d une procédure méthodologique. En effet, le besoin de mieux gérer les ressources de connaissances qui ne cessent de croître a conduit à la mise en place des approches suivantes : - Workflow: l approche orientée par le Workflow est historiquement, la première solution adoptée au sein du CIRTIL pour permettre le partage d'informations entre les différents Pôles. Bien qu il ne s agisse pas d une démarche de gestion de connaissances proprement dite, l approche Workflow permet la circulation et le partage des informations entre les membres de différentes équipes. Elle est assurée grâce à l'outil Lotus Notes dont l'utilisation est généralisée au sein de l'entreprise; - Ingénierie documentaire : cette approche est adoptée particulièrement par le Pôle Projets Nationaux et le Pôle Application. La première équipe a développé des bases documentaires par projet sous Lotus Notes. Ceci ressemble à la création d une mémoire de projets. La recherche documentaire se fait par un formulaire qui prédéfinit des 102

métadonnées. L accès et la réutilisation des informations et documents liés à des projets en cours ou terminés sont alors facilités. L équipe du pôle Application a adopté la même approche en créant un espace sur l Intranet pour assurer la capitalisation des informations liées à l activité de l exploitation. - Veille technologique : c est l équipe du Pôle Système Administration et Réseaux qui a adopté cette approche, ce qui a abouti à la création de l'intranet de l'entreprise. - Démarche Qualité : mise en place par la direction depuis 1999 afin d assurer la traçabilité. Cette approche joue un rôle important dans la formalisation et l explicitation de certaines connaissances. 3.4.2 La gestion des savoir-faire L objectif de cette section est de montrer comment sont gérés les savoirfaire et les connaissances implicites au sein du CIRTIL. Comme il a été noté dans le chapitre 1 de ce mémoire, la connaissance est intimement liée à l individu qui l a créée et qui la possède. Dans une entreprise, ce sont les employés qui apportent de la valeur ajoutée aux informations et par là même créent la connaissance. Considérés comme la première ressource de connaissances au sein de toute organisation, les employés acquièrent quotidiennement des informations, compétences et expériences qui forment de nouvelles connaissances et constituent par conséquent le capital intellectuel de l entreprise. Certains employés sont alors désignés comme experts car ils possèdent une expertise acquise de leurs expériences particulières et de leur évolution au sein de l entreprise. Pour rendre cette expertise profitable à l entreprise, la gestion des savoir-faire nécessite leur formalisation et leur explicitation. Il n existe pas une méthode spécifique dédiée à la formalisation des savoir-faire d experts. Néanmoins, la formalisation des savoir-faire et d une façon générale l explicitation des connaissances implicites, s effectuent au CIRTIL à travers deux modes. D abord, de nombreuses actions et tâches sont explicitées par le biais des enregistrements qualité. Bien que l objectif des enregistrements qualité soit d assurer la traçabilité, cette opération garantit une certaine pérennité des connaissances. En effet, la formalisation des connaissances dans le contexte de la démarche Qualité 103

se traduit par la transcription sur des fiches appropriées les actions effectuées durant le déroulement de certaines activités quotidiennes. Un exemple de modèle d explicitation des connaissances est la fiche d intervention sur site (cf. figure 3.7). Cette fiche doit être renseignée par les employés qui interviennent sur les sites des URSSAF pour apporter assistance aux clients. La transcription des informations conformément à ce modèle permet de rendre compte du travail réalisé par l employé avec un certain niveau de formalisation. Lorsqu un technicien mentionne dans la case «Compte-rendu de la mission» les principales étapes qu il a effectuées, cela permet de rendre explicites ses savoir-faire mis en œuvre durant sa mission. Le deuxième mode d explicitation des savoir et savoir-faire s opère à travers la transcription des expériences particulières des employés sous forme de documents enregistrés dans des bases de connaissances thématiques sous Lotus Notes. Certes le système qualité propose à travers les enregistrements qualité différents types de fiches, mais ces fiches ne couvrent pas toutes les connaissances de l entreprise. Le système qualité propose des modèles de documents des procédures normatives qui sont limitées au niveau de la description. Les descriptions actuelles sont très succinctes et ne sont pas porteuses de connaissances suffisamment détaillées. Des modèles de documents sont alors proposés par certaines équipes afin d enregistrer les meilleures pratiques, les erreurs, les trucs et astuces, les problèmes ; mais aussi des procédures et des notes techniques. L objectif visé est d assurer la capitalisation des connaissances de l équipe. Par exemple, l équipe du Pôle Projets Nationaux a développé une base de projets afin de capitaliser toutes les connaissances relatives aux projets réalisés par ce Pôle ; tandis que l équipe du Pôle Administration Systèmes et Réseaux a développé sa base de connaissances Donald 15. 15 Cette base est présentée dans la section 3.2.3 du présent chapitre. 104

Figure 3.7 : Exemple de fiche de formalisation des savoir-faire via les procédures du système Qualité de l entreprise. 105

3.4.3 La gestion des connaissances explicites La gestion des connaissances explicites au sein du CIRTIL s apparente à la gestion documentaire. Les documents, sous leurs différentes natures, représentent un support de connaissances incontournable. Les savoirs et savoir-faire formalisés apparaissent sous forme de documents qui matérialisent les connaissances de l entreprise. En effet, plusieurs documents contiennent des connaissances déclaratives ou procédurales transcrites sous forme de règles, de faits, de cas, de procédures, etc., qui traduisent une part de l expérience acquise par les employés. Ainsi, l approche de gestion des connaissances explicites adoptée au CIRTIL est proche d une approche documentaire. Nous pouvons dire qu elle est pratiquée d une manière officieuse car, elle s intègre indirectement dans certains processus d activités. Considérée comme une activité secondaire, la pratique documentaire s effectue généralement sans se baser sur les règles classiques de la chaîne documentaire, ni celles de la gestion électronique des documents : catalogage, description documentaire, indexation, archivage, etc. Les documents sont gérés au niveau des Pôles par les employés selon diverses politiques de traitement documentaire. Aussi, les processus du traitement documentaire, le choix des outils, les qualités et fonctions des personnes qui s en occupent, diffèrent d un Pôle à un autre. La politique du traitement documentaire dépend des besoins des employés ainsi que de la place de la documentation dans la réalisation des activités de chaque équipe. Ainsi, les équipes chargées des études et développement d applications logicielles ont une forte implication dans la gestion documentaire, si on les compare avec l équipe chargée de l édition par exemple. Remarquons enfin, que l exploitation des NTIC (Nouvelles Technologies de l Information et de la Communication) pour la gestion documentaire demeure modeste au sein du CIRTIL et ce malgré la disponibilité de certains outils dédiés tels que Docubase qui est un système de Gestion Electronique de Documents. 3.4.4 Le partage des connaissances Actuellement, le partage et l échange des connaissances entre les employés du CIRTIL sont pratiqués d une façon non conventionnelle. Dans ce contexte, le vecteur d échange et de partage des connaissances demeure la 106

qualité relationnelle qu entretiennent entre eux les agents en tant que collègues de travail. En dépit de son caractère informel, l échange des connaissances s accomplit grâce à l outil de Workflow de Lotus Notes Domino, d une part, et à la messagerie électronique, d autre part. L envoi des fichiers attachés et des url accompagnant les messages est devenu un moyen incontournable d échange et de partage de connaissances. Par ailleurs, les réunions sont également une occasion d échange informel d idées, d informations et de connaissances. 3.5 Les enjeux de la gestion des connaissances pour le CIRTIL Les activités de gestion et de partage des connaissances favorisent la création de nouvelles connaissances, l apprentissage et la croissance au sein de l entreprise. Le fait de pouvoir accéder facilement à des renseignements rapidement utilisables permet d améliorer le processus décisionnel et d atteindre les objectifs de l entreprise 3.5.1 L aide à la décision Une des attentes répandues chez les décideurs par rapport à la démarche de gestion des connaissances est de pouvoir disposer d informations, mais surtout d éléments de connaissances leur permettant de prendre des décisions. La décision est un processus de transformation d'informations qui conduit une personne ou un groupe de personnes à répondre à une question donnant lieu à une action. La prise de décision est un processus dont la pertinence est dépendante des informations qui vont servir de support à cette décision ainsi que du contexte dans lequel vont être interprétées ces informations. Dans le domaine de la gestion des systèmes informatiques, le système de gestion des connaissances est un moyen incontournable qui alimente substantiellement les processus de décision. Pour prendre de nouvelles décisions, un décideur s appuie sur les connaissances capitalisées concernant une application donnée, un projet ou un problème déjà traité. En effet, une meilleure connaissance du sujet permet, dans un contexte précis, une identification des informations pertinentes et par conséquent facilite le processus décisionnel. Savoir que le même problème a déjà été traité, permet une prise de décision plus efficace. 107

La prise de décision requiert une phase importante d analyse préalable. A partir d un certain niveau de décision, il devient difficile de se contenter de données purement factuelles ou chiffrées. L activité de décision atteint une complexité telle qu il devient alors indispensable de combiner rapidement et efficacement des informations souvent diverses et hétérogènes. Par exemple, la décision d acquisition d une nouvelle machine au CIRTIL doit s appuyer sur certains éléments de connaissances préalablement capturées et capitalisées. Ces éléments de connaissances peuvent par exemple être relatifs à des pannes répétitives d une application dont la principale cause est le manque d espace sur le serveur en raison de la volumétrie du disque et de sa saturation. 3.5.2 L amélioration du processus de recherche d information La mise en place d une démarche de gestion des connaissances a pour objectif de remédier à la problématique d accès aux ressources de connaissances et contribue à améliorer ainsi le processus de recherche d information. En effet, l accès à l information dans le domaine informatique est un enjeu majeur. Les informaticiens ont besoin au cours de leurs activités de disposer de nombreuses informations. En plus d un accès unique aux ressources de connaissances capitalisées, la disponibilité d un système de gestion des connaissances permet aux utilisateurs de communiquer et d échanger leurs points de vue et leurs expériences. Il facilite la circulation des connaissances, explicites et tacites, au sein de l entreprise tout en favorisant le processus d apprentissage. 3.5.3 L amélioration de la qualité et des processus métiers Depuis 2001, le CIRTIL est certifié AFAQ ISO 9002 notamment pour les activités de mise en production et exploitation des traitements informatiques et l assistance aux utilisateurs. Dans ce contexte, une meilleure gestion des savoir-faire permettrait d améliorer la productivité en termes de coûts, de délais et de qualité des prestations. La gestion des connaissances permet en effet d obtenir de meilleurs résultats en termes de qualité et donc d améliorer la valeur perçue par les clients. Citons comme exemple la mise à disposition auprès des téléconseillers de la cellule ASUR d un système de capitalisation des connaissances relatives aux demandes d assistance aux URSSAF, qui pourrait augmenter significativement le taux de réponses satisfaisantes au premier appel. 108

Par ailleurs, les activités opérationnelles du CIRTIL se caractérisent par leur aspect répétitif. La capitalisation des connaissances relatives à ces activités contribue à éviter de reproduire certaines erreurs et de diminuer les ressources utilisées pour produire les biens ou les services. Le savoir-faire acquis au cours de ces activités, est donc primordial si l on souhaite améliorer les processus métier de l entreprise. Grâce à son action de valorisation des savoirs et savoir-faire des collaborateurs de l entreprise, la gestion des connaissances va par exemple permettre de maintenir une productivité élevée et une haute qualité malgré le départ des experts et spécialistes. 3.5.4 La capitalisation de l expertise et des expériences passées Le CIRTIL est connu pour son expertise technologique dans certaines spécialités de l informatique. De plus, les nombreux projets nationaux et régionaux réalisés au fil des années ont permis à l entreprise de développer une expérience remarquable en matière de gestion des projets informatiques. La gestion des connaissances, notamment au travers de la capitalisation et du partage des expériences passées, s attache à en assurer la pérennité. Par exemple, au démarrage du projet, l équipe doit acquérir un grand nombre de savoirs et de savoir-faire pour couvrir très rapidement le champ des compétences nécessaires à la bonne réalisation du produit. Cette phase d apprentissage peut considérablement être réduite si des expériences similaires ont été capitalisées et mises à disposition de l équipe projet. La réalisation des tâches en mobilisant le minimum de moyens grâce à la capitalisation, au partage et à la valorisation des meilleures pratiques issues des expériences passées - qu elles se soient terminées sur un succès ou bien sur un échec - offre de nombreux avantages, notamment d éviter beaucoup de pertes de temps et un risque d échec qui seraient causés par des mauvaises décisions, des tâches redondantes et la mise en place de solutions erronées. 3.6 Synthèse Nous avons présenté dans ce chapitre la problématique de gestion des connaissances au sein du CIRTIL. L analyse des processus métiers de cette entreprise montre que les activités opérationnelles de gestion du système d information et de développement d applications logicielles, monopolisent l utilisation des savoirs et savoir-faire des spécialistes. 109

Par ailleurs, ces mêmes activités génèrent de nouvelles informations et des éléments de connaissances qui alimentent le SIE. Ces connaissances produites et/ou utilisées au cours des processus métiers, représentent pour le CIRTIL, une ressource stratégique qu il est devenu impératif de gérer et de capitaliser. En l absence d une approche globale d une meilleure gestion de ces savoirs et savoir-faire, différentes solutions ont été proposées par la plupart des Pôles. Cependant, ces solutions ont conduit à l émergence d une nouvelle problématique. Les efforts fournis pour la gestion des connaissances ont fait apparaître une véritable hétérogénéité que l on constate à différents niveaux, notamment la multiplication des outils dédiés à la gestion des connaissances, la diversité des approches de traitement et d accès aux ressources de connaissances ainsi que la dispersion entre une variété de terminologies issues principalement des nombreux plans de classement. Actuellement, les ressources de connaissance sont gérées par des outils de Workflow et des outils de traitement de l information. De plus, la banalisation de l utilisation des Nouvelles Technologies de l Information et de Communication (NTIC) a favorisé la mise en place de plusieurs bases documentaires thématiques. La consultation de ces bases se fait selon des modes d accès propres à son contenu et à sa structure : organisation de l'interface, mode d'interrogation, structure des requêtes, présentation des résultats, etc. Cette problématique concerne aussi bien les connaissances tacites que les connaissances explicites. Les connaissances tacites sont occasionnellement explicitées dans le cadre de la démarche qualité ou suivant les recommandations prescrites par les responsables des Pôles. Une fois explicitées, les connaissances tacites sont gérées au même titre que les connaissances explicites. Celles-ci existent sous forme de documents multimédias qui mêlent textes, images, textes, graphiques et tableaux. Ces document hétérogènes sont localisés dans différentes sources d'informations et ressources documentaires tels que : les bases de données relationnelles, l'intranet, le serveur Lotus Notes et les ressources électroniques réservées à chaque Pôle. Les enjeux de la mise en place d une démarche de gestion des connaissances pour le CIRTIL sont donc relatifs à la place qu occupe le CIRTIL au sein de la branche Recouvrement. L aide à la prise de décision, l amélioration de la qualité et des processus métiers, la capitalisation de l expertise et des expériences antérieures et l amélioration des processus de 110

recherche d information et d accès aux ressources de connaissances sont en effet des enjeux qui exigent une approche appropriée de gestion des connaissances. Pour cela, nous proposons dans le chapitre suivant quelques recommandations nécessaires à la mise en œuvre d une démarche de gestion des connaissances adaptée aux entreprises informatiques. 111

4 Recommandations pour la mise en œuvre d une démarche de gestion des connaissances Une démarche de gestion des connaissances est un procédé qui inclut une approche, des processus et des outils dédiés à la gestion des connaissances. La coordination de ces éléments étant complexe, nous proposons au cours de ce chapitre un ensemble de recommandations permettant de guider la mise en œuvre d une telle démarche. Ces recommandations s inscrivent dans un cadre pragmatique qui vise l opérationnalisation de la démarche. La démarche proposée ci-après vise à identifier et à capitaliser les connaissances et compétences utiles à l exécution des activités opérationnelles de l entreprise. Elle a pour objectifs : - d identifier les connaissances cruciales associées aux activités opérationnelles ; - de formaliser ces connaissances de manière à assurer leur accessibilité ; - d intégrer les processus de gestion des connaissances dans les activités quotidiennes de l entreprise. Cette démarche peut s appliquer à toute entreprise dont les activités sont centrées sur des compétences opérationnelles et des ressources tangibles. Son but est de définir la meilleure manière de gérer le capital intellectuel de l entreprise afin de mettre à disposition les savoirs et savoir-faire des différents acteurs de l organisation. Ainsi, nous recommandons de commencer par définir une approche adaptée au cas de l entreprise. La définition d une telle approche repose sur l étude des besoins de l entreprise ainsi que l analyse de l existant. Ensuite, nous proposons de prendre en compte les trois processus déterminants de la gestion des connaissances. 112

Nous argumentons que le repérage des connaissances cruciales, la modélisation et capture de nouvelles connaissances cruciales, et la réutilisation des connaissances capitalisées sont les processus nécessaires à une démarche globale de gestion des connaissances. Aussi, pour permettre la capitalisation et la manipulation des connaissances, il faut envisager l acquisition ou le développement d outils d aide à la gestion des connaissances. Selon les besoins, ces outils peuvent aller d un Intranet d entreprise à un système de gestion des connaissances. Enfin, et parallèlement à ces éléments, nous conseillons de situer le rôle des employés dans le projet de gestion des connaissances. Les employés, qu ils soient des experts, des collaborateurs ou des décideurs, ont en effet chacun un rôle à jouer dans le contexte du projet de gestion des connaissances. 4.1 Définir une approche appropriée La gestion des connaissances est une problématique particulière à chaque entreprise. Cette particularité est due à plusieurs facteurs : secteur d activité de l entreprise, sa taille et son étendu géographique, sa culture et son organisation, son environnement technologique, etc. Par conséquent, l approche de gestion des connaissances qu il faudrait adopter, doit tenir compte de ces différentes caractéristiques. La définition d une approche appropriée repose globalement sur quelques critères. Ces éléments représentés par la figure 4.1 sont définis ci-après. Précision des besoins en matière de gestion des connaissances Détermination des connaissances à capitaliser Approche de gestion des connaissances Exploitation des approches et méthodes existantes Figure 4.1 : Les critères de définition d une approche appropriée de gestion des connaissances. 113

4.1.1 Précision des besoins de l organisation en matière de gestion des connaissances La détermination des besoins de l organisation en matière de gestion des connaissances est un élément fondateur de la définition de l approche la mieux adaptée au cas d une organisation donnée. Cette activité est essentielle et préalable à toute décision quant à l approche et au système à mettre en place. Sachant que la notion de gestion des connaissances peut être confondue avec d autres notions telles que le management de l information, la gestion documentaire ou encore le workflow, l étude des besoins permet d élucider cette confusion et par conséquent de s assurer ainsi de l existence d un besoin réel en matière de gestion des connaissances de l entreprise. Signalons à ce propos l existence de différentes méthodes qui permettent de déterminer si une mémoire d entreprise est nécessaire et si l entreprise peut se lancer dans la construction de cette mémoire. Quelques-unes de ces méthodes sont présentées dans (Dieng et al., 2000). La détermination des besoins vise à recueillir toutes les informations permettant d identifier les besoins de l organisation en matière de gestion des connaissances et à localiser et décrire sommairement les ressources de connaissances à capitaliser. L'analyse des données collectées conduit dans un premier temps à préciser la nature des besoins : besoins immédiats, besoins à moyen terme ou besoins à long terme. Elle permet ensuite de distinguer les différents niveaux des besoins et de les classer par catégorie d utilisateurs par exemple. En effet, les besoins en matière des connaissances exprimés par les dirigeants d une entreprise peuvent être assez différents de ceux de leurs collaborateurs. Par ailleurs, l'analyse des besoins permet la mise en lumière des caractéristiques des ressources à capitaliser (les types de documents, la fréquence de consultation, les noms des responsables, les noms d experts, les domaines d expertise, etc.). Enfin, cette analyse des besoins permet de bien identifier les intervenants avec lesquels mettre en place le système de gestion des connaissances. Un autre élément qui découle de l étude des besoins est l émergence de nouvelles problématiques inhérentes à la gestion des connaissances comme, les difficultés de communication entre certaines équipes, la culture de partage et d échange d informations pratiquée au sein de l entreprise, etc. Dans ce cas, il faut reformuler les besoins afin de s assurer que les attentes de l organisation ont été bien cernées. 114

La qualité des données recueillies est primordiale d où la nécessité de recourir à des méthodes de réalisation des études de besoins. Cependant, l usage de ces méthodes peut varier selon les circonstances. Parmi les méthodes proposées notamment dans le domaine de la conception des collecticiels (Olson et Olson, 1997), citons les trois méthodes classiques suivantes : la revue de la littérature d une part, les entretiens et discussions d autre part, et enfin les observations et expériences. Nous recommandons l utilisation de ces trois techniques à la fois en raison de leur complémentarité. 4.1.2 Etude de l existant Il s agit de prendre connaissance : - des différentes approches, techniques et méthodes de gestion des connaissances ; - des différentes fonctionnalités des systèmes de gestion des connaissances ; - du processus et du cycle de vie de la gestion des connaissances. La prise de connaissances de ces éléments a pour objectif d avoir une vue d ensemble de l existant afin de guider le choix d une approche adéquate et dans une certaine mesure d éviter de «réinventer la roue». Etant donné l existence de différentes approches de capitalisation des connaissances auxquelles sont associées de nombreuses techniques et méthodes, il est judicieux de tirer profit de cette panoplie éprouvée d approches. Le choix d une approche ou d une méthode de gestion des connaissances se définit en partie par rapport aux catégories des connaissances à capitaliser. Par exemple, si la représentation des savoir-faire des experts nécessite une méthode de capitalisation des connaissances telle que REX (Eichenbaum et Tamisier, 1997), la modélisation des documents électroniques quant à elle, se base sur des techniques issues du domaine de l ingénierie documentaire telle que des descriptions documentaires suivant Dublin Core 16. En plus des types de connaissances à modéliser, il existe d autres critères qui déterminent si l approche est appropriée au domaine d application. Ainsi le niveau de modélisation des connaissances peut être un critère déterminant dans le choix de la méthode. Cette dernière sera 16 http://dublincore.org/ 115

donc choisie selon le niveau de détail visé pour la modélisation des connaissances. Selon le cas, il pourra s agir (Dieng et al., 2000) : - de construire un annuaire ou une cartographie des compétences ; - de décrire les activités et tâches menées au sein de l entreprise ; - d expliciter le savoir-faire d experts de l entreprise ; - de constituer une base des «meilleures pratiques» pour un métier de l entreprise. D autres critères tels que la facilité de mise en œuvre de la méthode ou la disponibilité d outils d opérationnalisation accessibles, pourraient jouer un rôle déterminant dans le choix de la méthode. Cependant, la combinaison de plusieurs approches est concevable notamment dans le contexte de l élaboration d une mémoire d entreprise (Dieng et al., 2000). 4.1.3 Détermination des connaissances à capitaliser Les connaissances étant la matière première et l objet de travail, il est fondamental de déterminer quelles sont celles que l on souhaite intégrer dans le système de gestion des connaissances. A ce stade de la démarche, il s agit d effectuer une étude macroscopique de l existant afin d identifier les types de connaissances qu il faudra mettre à la disposition des employés pour leur permettre une plus grande efficacité opérationnelle. Plus particulièrement, il faut préciser si l on va s intéresser aux savoirs formalisés, ou bien aux savoirs informels ou aux deux à la fois. Selon les besoins et attentes de l organisation en matière d objectifs visés par le projet de gestion des connaissances, les choix peuvent varier. Si l intégration simultanée des connaissances tacites avec les connaissances explicites paraît évidente, certaines organisations privilégient la capitalisation des connaissances tacites, tandis que d autres préfèrent capitaliser les connaissances explicites. Dans ces deux derniers cas, nous conseillons de s assurer que le choix n est pas arbitraire car, pour notre part, nous considérons que ces deux catégories de connaissances sont indissociables. En effet, il est nécessaire d intégrer les deux catégories, car se limiter aux connaissances explicites revient à gérer un fond documentaire, en revanche, se limiter à la capitalisation des connaissances tacites peut entraîner une perte importante de connaissances formalisées. Cependant, il est à noter que les caractéristiques divergentes de ces deux catégories de connaissances nécessitent pour chacune des catégories une méthode de modélisation particulière. 116

La synthèse de ces éléments devrait aboutir au choix, ou à la proposition d une approche adéquate de gestion des connaissances. C est ainsi que nous avons proposé dans la section 5.1, une approche qui pourrait être appliquée à des entreprises dont les caractéristiques d organisation et la problématique de gestion sont similaires à celles de notre étude de cas. 4.2 Prendre en compte les processus déterminants de la gestion des connaissances Nous soutenons l idée que la gestion des connaissances doit se dérouler selon un ensemble de processus regroupant les tâches qui permettent la capitalisation et la préservation du capital intellectuel de l entreprise. Et, nous considérons certains processus comme étant déterminants à prendre en compte pour la mise en œuvre d une démarche de gestion des connaissances (Bahloul et al., 2004b). Cette hypothèse est fondée sur l analyse de quelques processus de gestion des connaissances proposés dans la littérature (Grundstein et Barthès, 1996), (Zakled et Grundstein, 2001), (Pomian, 1996), (Dieng et al., 2001) et (Abecker, et al., 1998). En se basant sur les différentes tâches composant la plupart de ces processus (acquisition, identification, formalisation, explicitation, préservation, utilisation et maintenance des connaissances) nous retenons que la gestion des connaissances repose principalement sur l identification des connaissances cruciales de l entreprise qui nécessitent une représentation explicite dans la perspective de leur exploitation et réutilisation. Cela revient à considérer les trois processus suivants : - le processus de repérage des connaissances cruciales ; - le processus de modélisation; - le processus de réutilisation. L importance de ces trois processus réside d une part dans les objectifs visés et d une autre part dans les tâches associées à chacun d entre eux. Ainsi, l objectif des deux premiers processus est la capitalisation des connaissances, tandis que l objectif du troisième processus est la restitution des connaissances capitalisées. Les tâches permettant d atteindre ces objectifs sont alors réparties entre ces trois processus. Une représentation simplifiée des processus déterminants de la gestion des connaissances ainsi que les tâches associées est fournit par la figure 4.2. 117

Figure 4.2 : Les processus déterminants de la gestion des connaissances 4.2.1 Le repérage des connaissances cruciales Nous considérons comme (Grundstein et Barthès, 1996) que seules les connaissances cruciales de l entreprise doivent être capitalisées et ce quel que soit l objectif visé par le projet de gestion des connaissances : construction d une mémoire d entreprise, formalisation des savoir-faire des experts, restructuration des ressources de connaissances de l entreprise, etc. Le repérage des savoirs et savoir-faire peut se faire selon le principe des «arbres de connaissances» proposé en 1992 par (Authier et Lévy, 1992). Ce principe consiste à fournir une représentation cartographique des connaissances considérées comme des éléments d un «capital humain» d une organisation. La réalisation de ces arbres doit guider et soutenir la transmission des connaissances au sein d une communauté donnée. 118

Chaque membre de l organisation est à la fois offreur et demandeur de connaissances. Il est considéré comme détenteur d un capital humain personnel qu il va tenter de maintenir ou faire prospérer en réalisant des échanges au sein de sa collectivité. Graphiquement, les arbres de connaissances apparaissent comme des schémas composés de briques représentant chacune une compétence identifiée. Ils peuvent être réalisés à un niveau individuel, collectif ou organisationnel. Dans un souci de confidentialité, chaque membre n a accès qu à son propre arbre de connaissances et à la représentation de l arbre de la collectivité (Barthelme- Trapp, 2001). Une autre méthode de repérage des connaissances cruciales en vue de leur capitalisation est l analyse des processus d activités de l entreprise. Cette analyse peut s effectuer soit en s appuyant sur le système qualité de l entreprise, soit en utilisant une méthode dédiée, telle que la méthode Gameth proposée dans (Grundstein, 2000). Cette méthode destinée à repérer et à identifier les connaissances cruciales de l entreprise considère les processus sensibles de l entreprise et les problèmes éventuels qui leur sont associés pour identifier les connaissances cruciales. Le processus de repérage des connaissances cruciales consiste alors en : - la détermination des processus sensibles - la distinction des problèmes déterminants - la localisation des connaissances cruciales L application de cette méthode est particulièrement recommandée au début du projet de gestion des connaissances. Néanmoins, pour assurer un repérage systématique des connaissances cruciales et capter au fur et à mesure les connaissances cruciales, il faut employer une méthode qui permettrait aux experts eux-mêmes d effectuer cette tâche de repérage. Une solution est d effectuer le repérage des connaissances cruciales à travers un processus de signalement des connaissances réutilisables. Ce processus devrait reposer sur un modèle de signalement des connaissances réutilisables. La notion de connaissances réutilisables signifie que certaines connaissances possèdent une importance particulière pour une tâche donnée par exemple, et que par conséquent, ces connaissances sont susceptibles d être réutilisées. L objectif est d amener les employés à signaler et à intégrer, toutes les informations et connaissances (ou éléments de connaissances), jugées potentiellement cruciales. 119

4.2.2 La modélisation des connaissances repérées Le processus de la modélisation consiste à formaliser et à représenter sous forme exploitable les corpus textuels, les processus cognitifs et les savoirfaire des experts repérés au cours de la phase précédente. La modélisation doit se faire de telle sorte que ces connaissances puissent être préservées et capitalisées dans la mémoire collective ou dans le système de gestion des connaissances de l entreprise. Elle peut s effectuer selon des méthodes de représentation des connaissances : graphes conceptuels, logique de description, ontologies, selon des approches de capitalisation des connaissances : CommonKADS et MKSM ou encore selon des méthodologies du retour d expérience. L important est d utiliser une méthode de modélisation adéquate aux besoins et objectifs visés par le projet de gestion des connaissances. Pour certaines applications, la méthode adoptée doit permettre de représenter la sémantique du domaine aussi complexe soit-elle, avec différents niveaux de granularité ; dans d autres cas d applications, il s agit de transformer les savoir-faire en connaissances explicites. Dans ce cas, il convient de mener un travail de formalisation en s appuyant sur les méthodologies du retour d expérience telle que REX. L intérêt de ces méthodologies est de concilier la modélisation des connaissances avec une approche dynamique de leur développement, et de mettre l accent sur les modes de diffusion et d accessibilité les plus adaptés (Pomian et Roche, 2002). Le cas d application décrit dans les travaux de (Bologna, 1996), est particulièrement intéressant, car il donne à la mémoire d entreprise un rôle central dans le système. La modélisation prend la forme d une gestion des éléments de connaissances, qui correspondent à l aspect «ressource» d un système de production d information (Mayère, 1990). Parmi ces éléments de connaissances, citons : - les éléments d expérience qui donnent lieu à des fiches comportant un rattachement au domaine de connaissance, un rattachement factuel, et un rattachement au jugement et à l analyse de l auteur de la fiche. - les savoir-faire datés, plus élaborés, qui correspondent selon l auteur «à des connaissances, ou des agrégats de connaissances, à priori plus complexes et/ou plus intégrés». Ils ont un statut de références dans l entreprise. - les autres éléments qui sont : les éléments de connaissances documentaires, les fiches compétences, les fiches d affaires, les glossaires qui définissent les mots du métier et les fiches de description d activité (qui constituent le référentiel métier). 120

En revanche, la modélisation des connaissances à partir de corpus textuels correspond à la manifestation empirique de connaissances telles qu'elles sont explicitées dans l'activité normale d'un domaine. Souvent, leur analyse linguistique et terminologique permet, en particulier, de dégager quelles sont les connaissances mobilisées : les concepts avec leur libellé et leur contenu. 4.2.3 La réutilisation et l exploitation des connaissances capitalisées La gestion des connaissances ne consiste pas seulement à capitaliser les connaissances. La formalisation et la modélisation des savoir et savoir-faire n ont en effet de sens que si ces connaissances sont non seulement capitalisées, mais encore quelles le sont d une manière qui permette de les exploiter par la suite. Pour Pomian, la capitalisation de la connaissance constitue un «aspect statique» et ne suffit pas en tant que telle, car il faut faire vivre cette connaissance en apportant un «aspect dynamique», c està-dire une transmission de cette connaissance (Pomian, 1996). Cette transmission permet une mise en commun du savoir qui est nommé par (Dieng et al., 1998) sous le terme de «socialisation» du savoir. Il s agit de transformer une connaissance individuelle en une connaissance collective. Le savoir détenu par quelques individus va être mis en commun et ouvert à d autres individus. En effet, il s agit de rendre les connaissances accessibles et exploitables, dans le but d en créer de nouvelles. Il s agit également de ne pas perdre la mémoire des expériences acquises. Dans ce contexte, des travaux ont été développés, notamment pour éviter la perte de savoir-faire liée aux départs à la retraite et aux mutations. Parmi ces travaux, certains sont souvent cités dans la littérature, il s agit : - du projet REX du CEA pour capitaliser les expériences de conception de réacteurs nucléaires (Dieng et al., 1998), - de la méthode CYGMA (CYcle de vie et Gestion des Métiers et des Applications) pour des industries manufacturières (Dieng et al., 1998), - du projet RESPECTS qui a pour objet de fournir à une entreprise de chimie un support de mémoire technique appliqué dans ce cas à la recherche et la production d un composant chimique (Pomian, 1996), - du système SACHEM (Système d Aide au pilotage des hauts fourneaux) du groupe USINOR (Pomian, 1996), - du système Lucie pour automatiser la conduite des ateliers de cimenteries (Bourrouilhou, 1999). 121

Précisons que le processus de réutilisation s attache à définir les différents modes selon lesquels les utilisateurs du système souhaitent restituer les connaissances. Cela signifie qu il faut prendre en compte : - les modes de recherche et d accès au savoir : navigation dans une arborescence, recherche par mots-clés ou en texte libre, etc. - les interfaces de recherche et leurs caractéristiques, - le support ou la façon dont ces connaissances doivent être restituées: documents dans leur format natif, format standard de documents, cartographie, portail de connaissances, etc. 4.3 Situer le rôle des employés au sein du projet de gestion des connaissances Dans le prolongement de nos recommandations pour la mise en œuvre d une démarche de gestion des connaissances, nous nous situons dans une approche centrée individu, où l utilisateur final du système doit contribuer à son élaboration et ce afin d optimiser l utilisation du système d une part et de responsabiliser l utilisateur d une autre part. En effet, les employés sont directement concernés par la démarche de gestion des connaissances car ils sont porteurs et utilisateurs de ces connaissances. Il est donc nécessaire de situer leur rôle au sein de la démarche de gestion des connaissances et ce quelles que soient les catégories des connaissances retenues pour être capitalisées. Dans la pratique, le rôle des employés peut aller de la simple description d expériences sous forme de fiches à une implication plus effective à différents niveaux. Si certaines approches de capitalisation des connaissances limitent ce rôle à la description structurée d expériences sous forme de fiches élaborées à partir d'interviews de personnes qui ont vécu ces expériences, notre approche vise à impliquer les employés dans le processus de gestion des connaissances tout au long de son existence, car la démarche de mise en œuvre d un tel système consiste en «un effort de coopération pour construire en commun un objet inconnu» (Grundstein, 1994). L idée est d amener les employés à gérer eux-mêmes leurs connaissances de même qu ils gèrent leurs activités professionnelles. Ainsi, notre approche confère aux employés la responsabilité du management de leurs savoirs et savoir-faire. Selon leur degré d expertise, leur rang hiérarchique dans l organisation ou leur habilitation, les employés peuvent intervenir à différents niveaux de la démarche de gestion des 122

connaissances. Ils doivent contribuer activement aussi bien à l identification et à la validation des connaissances cruciales qu à la mise à jour et à l actualisation de ces connaissances. Ainsi, nous considérons que tout employé, qu il soit expert dans son domaine ou tout simplement responsable d une activité donnée, est capable d identifier les connaissances à capitaliser, d évaluer leur importance dans le cadre d une réutilisation éventuelle et de déterminer l utilité et l intérêt de leur intégration dans le système de gestion des connaissances. Un employé peut également indexer lui-même les ressources documentaires qu il produit et/ou qu il consulte. Cependant, la mise en pratique de cette approche peut se heurter à de nombreuses difficultés qui peuvent interférer et rendre difficile l intention d implication des employés. Parmi ces difficultés citons : - les difficultés d ordre culturel, notamment en ce qui concerne le partage des connaissances. Ce point très sensible est le premier problème auquel il faut faire face, car c est le point de départ. Le dicton celui qui détient l information, détient le pouvoir est bien appliqué dans la majorité des organisations françaises. Cela peut s expliquer par certains enjeux tels que l évolution de la carrière professionnelle par exemple ; - les problèmes de communication interne: les organisations qui fonctionnent selon un système hiérarchique sont les plus confrontées à cette problématique. Dans ce type d organisations, la diffusion de l information passe par une structure pyramidale qui pose le problème d une circulation d information à sens unique ; - les délais qui sont d une importance extrême pour certains secteurs d activité. Dans les entreprises où le travail se fait le plus souvent dans l urgence, il est difficile de faire admettre aux employés et à leurs supérieurs qu une meilleure gestion des connaissances offrirait une plus grande rentabilité. Pour remédier à ces difficultés, nous proposons que l implication de l employé dans le processus de gestion des connaissances soit réellement intégrée au quotidien de son travail, de telle sorte que cette activité lui devienne «spontanée». Un employé travaille le plus souvent dans l urgence et a de nombreuses exigences à remplir vis-à-vis de sa profession et de sa hiérarchie. Il ne peut donc assumer de nouvelles tâches qui ne font pas nécessairement partie de son processus d activité. C est 123

pourquoi, nous suggérons d intégrer certaines activités de la gestion des connaissances dans les différents processus d activités de l entreprise. Cette intégration permettrait à certaines fonctionnalités, telle que l indexation par exemple, de devenir des tâches instinctives dissimulées dans ces processus, comme c est le cas pour la recherche d information. Cette dernière est aujourd hui une pratique courante et simple adoptée par l ensemble des employés ayant accès aux différentes sources d informations : système d information de l entreprise, Intranet, Internet, etc. Aussi, il faut valoriser l effort apporté par les employés et rendre visible le résultat de leur contribution par l élaboration d une cartographie par exemple. Une représentation graphique et descriptive des connaissances va leur permettre de prendre conscience de la valeur ajoutée que pourraient apporter la capitalisation et l organisation des connaissances. Dans cette optique, des outils performants ont été mis au point. 4.4 Synthèse Nous avons proposé au cours de ce chapitre quelques recommandations pour la mise en œuvre d une démarche de gestion des connaissances. Cette démarche est fondée sur des approches déjà éprouvées notamment dans les domaines de l IC et de l ID. L apport de notre proposition consiste en sa capacité de regrouper différents aspects de la gestion des connaissances dans un cadre pragmatique facilement opérationnel. Dans le cadre de ces recommandations, nous avons particulièrement mis l accent sur la nécessité de définir une approche appropriée au cas de l entreprise ainsi que l implication des employés à différents niveaux de la démarche. En effet, nous accordons un intérêt particulier aux individus. Ensuite, nous avons supposé qu il est fondamental de considérer les processus de repérage des connaissances cruciales, le processus de leur modélisation et le processus de leur réutilisation. Ceci nous a permis de conclure que la gestion des connaissances ne peut se développer que dans le cadre de l interaction des éléments développés ci-dessus. Cette démarche peut être alors utilisée comme un levier mis à la disposition des entreprises pour améliorer le processus de capitalisation de leur patrimoine de connaissances. Nous verrons au chapitre suivant l application de cette démarche au cas du CIRTIL. 124

5 Mise en application de la démarche Nous présentons dans ce chapitre, l application de la démarche de gestion des connaissances décrite dans le chapitre précédent, au cas particulier du CIRTIL. D abord, nous mettons l accent sur la définition de l approche la plus appropriée au contexte du CIRTIL. Ensuite, nous exposons les principaux processus de la capitalisation des savoirs et savoir-faire relatifs au domaine des incidents informatiques (Bahloul et al., 2004b). Dans ce contexte, nous abordons particulièrement la méthode de repérage des connaissances cruciales ainsi que la modélisation des connaissances à l aide d une ontologie du domaine. Du point de vue ingénierie ontologique, cette ontologie ne se limite pas à une représentation taxonomique des connaissances car, la représentation des connaissances du domaine des incidents informatiques nécessite l intégration de la dimension sémantique. Nous avons donc suggéré un modèle permettant la structuration des concepts et relations de l ontologie selon les types des liens qui associent les connaissances du domaine. La dernière section est consacrée à la matérialisation de la démarche proposée, à travers la conception d un système de gestion des connaissances organisé autour d une mémoire métier collective. Nous définissons alors les fonctionnalités attendues de ce système, ensuite nous proposons une architecture adaptée à l environnement technologique de l entreprise. 5.1 L approche de gestion des connaissances appropriée au CIRTIL La gestion des connaissances de l entreprise rappelons-le, est une problématique complexe et pluridisciplinaire nécessitant la prise en compte des aspects organisationnels, méthodologiques et techniques. Dans notre contexte de recherche, nous proposons de nous concentrer sur les aspects méthodologique et technique. L aspect organisationnel étant une composante de la problématique qui nécessite une approche managériale issue des Sciences de Gestion (Barthelme-Trapp, 2001). Pour définir une approche compatible avec la problématique industrielle de gestion des connaissances présentée en chapitre III, nous avons considéré les critères exposés dans la section 4.1 du chapitre 4. Nous avons donc étudié et analysé : 125

- les besoins et attentes du CIRTIL en matière de gestion des connaissances ; - les connaissances à capitaliser : catégories de connaissances, types de ressources et comment se présentent-elles ; - les méthodes, techniques et approches existantes en mettant l accent sur les avantages apportés par chacune ; - les utilisateurs potentiels et comment les amener à participer au projet. Les informations collectées, nous ont permis de spécifier les caractéristiques essentielles de l approche appropriée au cas du CIRTIL. L approche de gestion des connaissances à définir pour le CIRTIL doit permettre une meilleure organisation du capital intellectuel de l entreprise. Une caractéristique de l approche à définir est sa capacité de modéliser différentes catégories de connaissances pour répondre à des besoins très variés. Cette modélisation doit permettre d intégrer différents niveaux de représentation des connaissances relatives aux activités opérationnelles de l entreprise; modélisation des processus métier, formalisation des savoirfaire d expert, indexation et élaboration d une terminologie consensuelle. Une autre caractéristique de l approche est de préciser comment sont capitalisées les connaissances et comment les rendre accessibles et exploitables par l utilisateur final. Aussi, l approche à définir doit permettre une gestion simultanée des ressources de connaissances d une entreprise informatique dont les activités reposent essentiellement sur l utilisation fréquente des connaissances tacites et connaissances explicites. Ceci nous amène à adopter une approche hybride qui s appuie sur différentes méthodes et techniques issues des domaines de l ingénierie des connaissances, de l ingénierie documentaire, de l intelligence artificielle et des systèmes d information. Sur le plan théorique, l approche que nous proposons pour la gestion des connaissances du CIRTIL s inspire des approches éprouvées notamment dans le domaine de l ingénierie des connaissances et de l ingénierie documentaire. L avantage de cette combinaison est de bénéficier des solutions complémentaires que fournissent l ingénierie documentaire et l ingénierie des connaissances pour la gestion des connaissances, grâce notamment aux langages et standards tels que SGML, XML et Dubline Core 17 qui permettent la gestion des documents support de la connaissance, et l usage des méthodes de représentation des connaissances qui incluent le raisonnement et l inférence. 17 http://dublincore.org/ 126

L'ingénierie des connaissances correspond à l'étude des concepts, méthodes et techniques permettant de modéliser et/ou d'acquérir les connaissances. De fait, les méthodes et techniques utilisées dans ce domaine sont utiles notamment pour «construire une mémoire d entreprise basée sur le recueil et la modélisation explicite des connaissances de certains experts ou spécialistes de l entreprise. Elle peut aussi servir pour une représentation formelle des connaissances sous-jacentes à un document.» (Dieng et al, 2000). En effet, «L ingénierie des connaissances modélise les connaissances d un domaine pour les opérationnaliser dans un système destiné à assister une tâche ou le travail intellectuel dans ce domaine (résolution de problème, aide à la décision, consultation documentaire, etc.)» (Bachimont, 2004). L ingénierie documentaire quant à elle, désigne «le projet de recourir à des éléments de structuration du contenu des documents et à des métadonnées de description pour faciliter la gestion des documents à travers tout leur cycle de vie» (Parent et Boulet, 1998). Ce projet, assure l accessibilité aux éléments descriptifs d un document de même qu à son contenu. En plus des normes et standards, il existe aujourd hui des logiciels variés qui peuvent intervenir à diverses fins et aux diverses étapes du cycle de vie des documents. De ce fait, l approche que nous proposons est basée sur le principe de la capitalisation préconisé dans les approches d ingénierie des connaissances. La capitalisation des connaissances consiste à constituer un capital qui sera ensuite valorisé (Barthes, 1997). Partant de ce principe, la gestion des connaissances peut s effectuer à travers la construction d une mémoire d entreprise collective. Pour Tarondeau, la mémoire d entreprise se définit comme un processus composé de trois phases qui sont l acquisition, le stockage et la restauration des connaissances de l organisation (Tarondeau, 1998). Cette définition est précisée par Dieng «La mémoire d'entreprise est une représentation explicite et non localisée des connaissances et informations dans une organisation dans le but de permettre son accès et sa réutilisation par certains membres de cette organisation pour leurs activités.» (Dieng et al., 1998) (Dieng et al., 1999) (Dieng. et al., 2000). Cette représentation explicite est réalisée selon des méthodes qui ont recours à un processus qui intègre des techniques issues de l'ingénierie des connaissances. En général, le processus qui s'applique est le suivant : 127

- localisation des connaissances et des experts qui les possèdent ; - entretiens avec ces experts, souvent dirigés par des méthodes bien déterminées (The MOKA consortium, 2001), (Schreiber et al., 1999) et (Moreno et al., 2001) ; - formalisation de ces entretiens sous formes de fiches ; - implémentation de ces fiches dans des modèles formels de représentation de connaissances (Ermine J.-L., 1999), (Ermine J.-L., 1998), (Schreiber et al., 1999) ; - exploitation des modèles par un outil destiné aux utilisateurs finaux. Les modèles utilisés pour représenter les connaissances sont alors des modèles orientés objet, des règles ou des graphes conceptuels. Cependant, notons que récemment, l utilisation des ontologies comme modèle permettant d'établir une base conceptuelle commune, s est imposée dans le but de représenter des connaissances dans différentes applications. Dans ce contexte, nous suggérons l utilisation d une ontologie du domaine comme un cadre conceptuel pour la construction d une mémoire d entreprise pour la gestion des connaissances du CIRTIL. Notre choix de l approche ontologique est motivé par le besoin d utiliser une technique performante capable de couvrir les différents aspects de la problématique de gestion des connaissances : représentation formelle des connaissances, partage des connaissances, prise en compte des aspects sémantiques, recherche d information satisfaisante ; voire «intelligente», accès unique et centralisé aux différentes sources d informations de l entreprise, etc. Une ontologie est un modèle qui permet, en plus des représentations formelles et consensuelles des connaissances du domaine, un accès unique aux ressources de connaissances via une terminologie partageable et non ambiguë tout en offrant des mécanismes de raisonnement sur les connaissances modélisées. Cette terminologie peut également être utilisée dans une perspective d indexation des ressources de connaissances formalisées. Les concepts jouent alors le rôle de métadonnées thématiques ou de descripteurs pour identifier le contenu des ressources. Par ailleurs, pour permettre la description 18 de certaines ressources électroniques, l ingénierie documentaire propose un enrichissement grâce aux balises formelles de description des connaissances qui sont les métadonnées. Ces métadonnées ont pour rôle d offrir la possibilité 18 Il s agit de l analyse et de la description du document, de son contexte, de sa structure ou de son contenu. 128

d'accéder à des parties d'un document à travers sa structure et de pouvoir y naviguer intelligemment (Le Maitre et al., 2004). En effet, avec des métadonnées de type Dublin Core, les balises ajoutent à une ressource électronique des éléments permettant de manipuler la ressource pour un usage donné. Dans ce contexte, Bachimont précise que «Le paradigme de l expression documentaire des connaissances entend enrichir le contenu sans jamais le supprimer. Les balises sont alors les traces de l usage que l on veut sédimenter pour le faciliter et préserver ses modalités.» (Bachimont, 2004). Ainsi, nous suggérons l utilisation de quelques éléments de métadonnées Dublin Core pour la description des ressources électroniques. Le but final est de pouvoir répondre à l objectif de l'identification d'une ressource satisfaisant un besoin particulier tout en gardant la trace des caractéristiques de cette ressource. 5.2 Le repérage des connaissances cruciales Le repérage des connaissances cruciales est un processus fondamental dans le cadre de la gestion des connaissances car, il s agit avant tout de définir le périmètre des connaissances à capitaliser. L approche que nous avons adoptée pour identifier les connaissances cruciales du CIRTIL est celle de l analyse des processus d activités de l entreprise. La méthode de repérage des connaissances cruciales que nous appliquons fusionne les principes de la méthode Gameth (Grundstein, 2000) avec les représentations proposées par le système Qualité de l entreprise. La méthode Gameth considère les processus sensibles de l entreprise et les problèmes éventuels qui leur sont associés. Le système Qualité de l entreprise apporte une aide considérable notamment en ce qui concerne la modélisation des processus d activités de l entreprise. Avant de montrer comment identifier un processus sensible, définissons d abord ce qui est un processus. «Un processus est un regroupement cohérent d activités, disposant de ressources, alimenté par des entrées, qui sont transformées en sorties en y apportant une valeur ajoutée pour le client. Le client peut être une personne ou groupe de personnes, interne ou externe à l organisation». Il s agit donc d un ensemble ordonné d'actions ou activités, réalisées par des acteurs à l'aide des ressources ou moyens, destinées à produire un résultat. Ce résultat est orienté vers un bénéficiaire interne ou externe. 129

Conventionnellement, la représentation d un processus dans le système qualité s effectue à travers l association de quatre éléments qui sont le nom du processus, sa finalité, des entrées et des sorties. Pour être compris de tous, le nom doit être court et évocateur par exemple : processus Commercial, processus de Facturation, processus d Assistance, ). La finalité exprime quelle est la raison d être ou la valeur ajoutée du processus. Les entrées indiquent sur quoi intervient le processus et les sorties indiquent ce que produit le processus. 5.2.1 La détermination des processus sensibles Il existe nécessairement, au sein de toute entreprise, des processus plus sensibles que d autres. Cette sensibilité peut se mesurer par les enjeux que représente un processus donné pour l organisation. Grundstein, pour qui «un processus sensible est un processus qui présente des enjeux reconnus collectivement» propose un certain nombre d étapes permettant d identifier les processus les plus sensibles. Ces étapes consistent à (Grundstein et Rosenthal-Sabroux, 2004): - délimiter les processus organisationnels, les processus de production et les entités organisationnelles (unités opérationnelles, services fonctionnels, partenaires, clients) concernés par la production de ces biens et services ; - modéliser le domaine d'intervention (modèles fonctionnels et structurels des entités organisationnelles, modèle du réseau de communication) ; - déterminer les processus les plus sensibles. Dans le cadre de notre étude de cas, nous avons délimité les processus concernés par la production des biens et services du CIRTIL à travers une approche de management par les processus. Celle-ci consiste en une démarche d'analyse qui présuppose un cadre rigoureusement établi caractérisé par les objectifs de l assurance Qualité suivant les normes ISO 19. Ainsi l application de la norme ISO 9001 permet pour une entreprise donnée, l identification de l'ensemble de ses processus de production. Cette norme distingue les processus élémentaires de l entreprise et permet leur représentation par une cartographie des processus Qualité. 19 Créées en 1987 sur l'initiative de l'international Organization for Standardization, les normes ISO servent de référentiels pour la certification des systèmes d'assurance qualité 130

La cartographie des processus créée dans le cadre de l assurance Qualité du CIRTIL regroupe toutes les activités de l entreprise en trois principales catégories de processus : les processus de Management, les processus de Réalisation et les processus Support. Les processus de Management concernent la gestion du système qualité. Ils fournissent des directives aux autres processus (stratégie, organisation, niveaux de performance attendus, ) à partir de l analyse des différentes informations disponibles (missions assignées à l entreprise, attentes et satisfaction des clients, indicateurs fournis par les autres processus ). Nous trouvons dans cette catégorie, le processus Gestion du système documentaire, le processus Management de la qualité et le processus Mesure et Amélioration. Les processus Support concernent l organisation et la gestion interne de l entreprise et fournissent les ressources (humaines, matérielles, financières ) à tous les processus. Ils couvrent les processus : Achats, Communication, Stockage et Ressources humaines. Les processus de Réalisation sont particulièrement orientés vers les clients (URSSAF, CGSS et ACOSS). Ces processus interviennent dans la réalisation des produits ou des prestations. La description de chaque processus dans le système Qualité est conforme à un schéma composé des éléments d entrée, des éléments de sortie et d un ensemble d étapes ; une étape étant une tâche ou une action. Un exemple de cette description est représenté par la figure 5.1 qui décrit le processus Amélioration dans le domaine informatique. Les éléments d entrée sont des informations qui concernent les produits et le fonctionnement de l entreprise et les éléments de sortie sont les actions maîtrisées pour améliorer en permanence les produits et le fonctionnement de l entreprise. 131

PRP85001.00 Amélioration Informations Non-conformité Causes de nonconformités potentielles Points à améliorer 01 Actions correctives selon PRQ85002 0 2 Actions préventives selon PRQ85003 03 Actions d amélioration selon PRQ85001 Actions maîtrisées Figure 5.1 : Description du processus Amélioration dans le domaine informatique selon (Gruez, 2002) Les différentes étapes du processus sont désignées tout en précisant pour chaque étape la procédure Qualité selon laquelle il faut réaliser l étape en question. Par exemple, pour toute non-conformité, il faut se référer à la procédure qui décrit les actions correctives. L analyse de la cartographie Qualité nous a permis de nous orienter vers les processus de Réalisation. Ceux-là sont : - le processus «Etudes et développement» ; - le processus «Assistance» ; - le processus «Diffusion et mise en production» ; - le processus «Exploitation» ; - le processus «Logistique des formations et réunions». Tous ces processus ont fait l objet d une analyse suivie d une étude des interactions entre les différents processus. Cette analyse s est appuyée sur les documents spécialisés (rapport annuel d activités, manuels, procédures métiers, ), les entretiens informels auprès des employés ainsi que nos observations du fonctionnement de l entreprise. Excepté le processus «Logistique des formations et réunions», les quatre premiers processus sont susceptibles d être considérés comme étant des processus sensibles car, ils se situent au cœur du métier de l entreprise. Par exemple, le processus «Etudes et développement» dont la finalité est de développer 132

des applications répondant aux exigences fixées par les URSSAF, semble être un processus sensible en raison notamment de son orientation vers les clients. Par ailleurs, le processus «Exploitation» peut lui-aussi être considéré sensible vu son objectif qui consiste à assumer les activités coutumières liées à l exploitation des applications par les clients. Pour déterminer parmi ces processus ceux qui présentent les enjeux les plus importants pour le CIRTIL, nous proposons dans le prolongement de l expérimentation de la méthode Gameth, de tenir compte des deux facteurs suivants : - l identification des objectifs de chaque processus ; - l évaluation du degré de sensibilité de chaque processus par les dirigeants de l entreprise. Les dirigeants d une entreprise sont en effet, les mieux placés pour déterminer le degré de sensibilité des processus orientés vers les clients. Nous avons donc recensé les objectifs de chacun des processus cités ci-dessus, ensuite, nous avons demandé aux dirigeants du CIRTIL d établir un classement décroissant de ces quatre processus de façon à repositionner les priorités des activités orientées vers les clients. En terme de priorité, il en ressort que le processus «Etudes et Développement» représente des enjeux moindres que ceux des autres processus. Il est vrai que la gestion de projets et le développement d applications répondant aux exigences fixées par les clients sont des activités sensibles, mais étant donné la mission du CIRTIL (voir section III.1), il est indispensable pour le CIRTIL d assurer les activités d exploitation et de suivi d exploitation des applications mises à disposition des URSSAF. Ainsi, le processus «Exploitation» et le processus «Diffusion et mise en production» ont été désignés comme étant les processus les plus sensibles. Par conséquent, les connaissances à capitaliser s articulent principalement autour des activités qui constituent ces deux processus. 5.2.2 La distinction des problèmes déterminants Cette étape conduit à distinguer les problèmes qui fragilisent les activités critiques qui peuvent mettre en danger les processus sensibles identifiés au cours de l étape précédente. Il s agit selon à (Grundstein et Rosenthal- Sabroux, 2004) de : - modéliser les processus les plus sensibles ; - évaluer les risques encourus par les processus sensibles et déterminer les activités critiques pour ces processus ; 133

- identifier les contraintes et les dysfonctionnements qui pèsent sur ces activités ; - distinguer les problèmes déterminants. La modélisation des processus sensibles induite par Gameth est basée sur le principe d une approche constructiviste. Il s agit de «construire la représentation des processus à partir des connaissances partielles qu'en ont les acteurs au travers des activités réelles qu'ils sont amenés à exercer» (Grundstein 2002). Cette approche s apparente aux représentations des processus proposées par les normes de l assurance Qualité. Les modèles développés dans le cadre du système Qualité du CIRTIL peuvent ainsi être utilisés. L élaboration de ces modèles a été effectuée par les personnes ayant en charge les tâches qui constituent les processus. Ces personnes décrivent les tâches telles qu elles s effectuent au quotidien tout en indiquant les ressources humaines et matérielles nécessaires à la réalisation de chaque tâche. La formalisation de ces descriptions est effectuée par la responsable de la démarche Qualité conformément aux normes. Le résultat obtenu après de nombreuses réunions de révision et de validation regroupant les différents collaborateurs est un ensemble de modèles types par processus. Parmi ces modèles, citons le modèle du processus «Exploitation» (cf. figure 5.2). L évaluation des risques encourus par les processus sensibles et la détermination des activités critiques pour ces processus sont alors facilitées par ces représentations qui permettent de recenser les principales tâches de chaque processus. Ces représentations incluent les informations concernant les ressources humaines et les ressources documentaires nécessaires au bon déroulement des tâches, ce qui permet d approfondir l analyse des risques relatifs à une activité donnée en se référant à la documentation associée et aux personnes concernées. Enfin, l identification des problèmes déterminants passe par la détermination des activités critiques. Pour identifier les contraintes et dysfonctionnement, nous utilisons les procédures Qualité relatives aux processus sensibles. Une procédure Qualité étant un document de support et de communication qui décrit et formalise les tâches à accomplir pour mettre en œuvre le processus. 134

Figure 5.2 : Exemple de modélisation d un processus sensible 135

Les descriptions faites par le biais des procédures Qualité ne disent pas quelles sont les activités critiques. Néanmoins, ces procédures identifient les critères de non-conformité pour chaque activité. Ceci facilite le repérage des contraintes et dysfonctionnements relatifs aux activités. En effet, les activités peuvent présenter des «dysfonctionnements qui peuvent être internes à l activité (directives, procédures, procédés, logiques d'action spécifiques à l'activité et mal adaptées à la situation) ou provenir des contraintes, de matériau non conformes, de données peu fiables, de ressources mal adaptées, de connaissances insuffisantes ou erronées» (Grundstein, 2002b). Quel qu il soit leur origine, ces dysfonctionnements engendrent des problèmes qui peuvent fragiliser les activités et mettre ainsi en danger les processus auxquels elles apportent leur contribution. L'identification des problèmes relatifs aux activités conduit à cerner les activités critiques. Nous avons identifié une série de vingt cinq critères de nonconformités pour une dizaine d activités. Ensuite, une liste des dysfonctionnements éventuels correspondants à ces activités a été élaborée en collaboration avec les employés du Pôle Application. En fin, et pour localiser les problèmes déterminants, nous avons évalué l impact des dysfonctionnements sur les activités en considérant les indicateurs qualité relatifs aux processus sensibles. Nous avons alors recensé les problèmes déterminants suivants : - l indisponibilité des applications DUE, DUCS, SNV2 et Télédep ; - les difficultés de suivi des planifications et déplanifications URSSAF ; - le non respect des délais d expédition des produits V2 et CES. 5.2.3 La localisation des connaissances cruciales L objectif de cette dernière étape est de définir, localiser et caractériser les connaissances à capitaliser. Elle consiste à (Grundstein, 2002) : - clarifier les besoins en connaissances nécessaires pour la résolution des problèmes déterminants ; - localiser et caractériser ces connaissances ; - mesurer la valeur de ces connaissances en terme de vulnérabilité, et analyser l'influence de ce facteur sur la vie de l'entreprise, ses marchés, sa stratégie ; - déterminer les connaissances cruciales. 136

Plus concrètement, il s agit d interviewer les employés afin d identifier leur besoins en matière de connaissances nécessaires à la résolution des problèmes. Cette étude des besoins complète les ressources documentaires déjà identifiées au cours de la modélisation des processus sensibles. Les informations collectées sont organisées d une façon à permettre une localisation structurée des connaissances par activité critique et par problème déterminant. Cette structure peut se présenter sous forme d un tableau (cf. tableau 5.1) composé de trois colonnes qui contiennent respectivement les informations suivantes : Activité critique, Problème déterminant et Sources de connaissances. Les sources de connaissances identifiées avec les techniciens de l exploitation regroupent connaissances tacites et connaissances explicites. Les connaissances tacites sont soit les connaissances personnelles que possèdent l expert du domaine, soit les connaissances de ses collègues : membres de l équipe, personnes travaillant au sein d autres Pôles, etc. Les connaissances personnelles représentent la première source utilisée, car elles sont liées à l action. En effet, lorsque le technicien de l exploitation rencontre un problème, il fait d abord appel aux connaissances enregistrées dans sa tête, à son expérience et à ses capacités personnelles à résoudre le problème. Ensuite, c est la documentation spécialisée qui demeure la principale source des connaissances utilisées. Le recours à son utilisation intervient soit en l absence d éléments de connaissances suffisants pour l expert, soit pour compléter ou confirmer certaines connaissances. Activité critique Problème déterminant Sources de connaissances Sauvegarde Vérification des traitements batch Plantée, présence d'alerte visuelle de couleur rouge dans Time-Navigator Traitement batch (TI19) non OK L expert ou le technicien de l exploitation. Il décide que le problème est soit : - grave, ne pas continuer - pas grave, continuer - redémarrer le serveur - Base documentaire Athéma - Outil CAP - Dossier Exploitation Tableau 5.1 : Localisation des connaissances par activité 137

Pour illustration, le tableau ci-dessus, présente un exemple de connaissances nécessaires aux activités de «sauvegarde» et de «vérification des traitement batch». Cet exemple montre qu il peut y avoir plusieurs sources de connaissances pour une seule activité comme c est le cas pour l activité «vérification des traitements batch». Pour évaluer la valeur des connaissances repérées, Grundstein, propose de mesurer les connaissances en termes de vulnérabilité et d analyse d influence de ce facteur sur la vie de l'entreprise. Selon la valeur de ces connaissances, mesurée en terme de vulnérabilité (rareté, accessibilité, coût et de délai d'acquisition), et des influences de ce facteur sur la vie de l'entreprise (ses marchés, sa stratégie), les connaissances cruciales sont alors identifiées (Grundstein, 2002). Les connaissances vulnérables sont donc des connaissances très importantes et par conséquent, plus les connaissances sont vulnérables, plus elles sont considérées cruciales. A partir de ce postulat, les connaissances vulnérables relatives au processus «Exploitation» sont celles relatives aux incidents informatiques. Elles sont d autant plus vulnérables, car les conséquences des incidents informatiques peuvent parfois pénaliser lourdement l entreprise. Les connaissances relatives aux incidents informatiques doivent être mises à disposition des dirigeants et des collaborateurs assez rapidement car elles couvrent des aspects extrêmement importants. Pour les dirigeants du CIRTIL ces connaissances sont utiles pour la prise de décisions, pour l assurance de la qualité des produits et des prestations et pour le positionnement technologique du CIRTIL par rapport aux autres CERTI. Pour les collaborateurs, il est indispensable de disposer dans les meilleurs délais, des éléments de connaissances nécessaires leur facilitant de résoudre un problème donné. Les connaissances sur les incidents informatiques intéressent plusieurs catégories d employés. D abord, elles sont nécessaires pour les techniciens d exploitation qui sont chargés de veiller sur le bon déroulement du processus d exploitation. Elles peuvent également, intéresser les agents de la cellule ASUR qui doivent intervenir dès qu il y a un incident ou une anomalie signalés par le client ou tout simplement constatés par les agents eux-mêmes. Ces derniers représentent la haut-line de l entreprise ; ils peuvent être sollicités à tout moment pour donner des solutions et des explications ou tout simplement orienter les clients. 138

Enfin, les collaborateurs au niveau des différents Pôles : développeur, spécialiste en réseaux ou expert fonctionnel du Recouvrement, qui interviennent notamment lorsque l incident rencontré nécessite une expertise particulière peuvent avoir besoin de recourir à ces connaissances. 5.3 La modélisation des connaissances Il a été noté dans le chapitre précédent que la modélisation des connaissances est l un des processus déterminants dans la gestion des connaissances. En effet, la modélisation des connaissances est le processus qui va permettre la représentation sous forme exploitable des connaissances cruciales repérées au cours de la phase précédente. Par ailleurs, nous avons souligné dans l état de l art, l intérêt des ontologies dans la représentation des connaissances. Basée sur un ensemble d engagements ontologiques, une ontologie est conçue dans un certain contexte, en fonction de certains objectifs. Son élaboration requiert de ses concepteurs de se placer dans une perspective donnée, de réaliser certains choix sur la manière de penser le domaine à modéliser et d en fournir une conceptualisation explicite. Nous allons montrer à travers la présentation de l ontologie OntoIncident, comment sont modélisées les connaissances du domaine des incidents informatiques dans le contexte d une application industrielle. Après la présentation du domaine des connaissances, nous évoquons la méthode d élaboration d OntoIncident. Ensuite, nous abordons notre approche de structuration des connaissances qui constituent cette ontologie. 5.3.1 Les connaissances relatives aux incidents informatiques Les incidents informatiques relatifs au processus métiers sont gérés au CIRTIL par l intermédiaire d un ensemble de procédures préventives. Les mesures organisationnelles et la responsabilisation du personnel de l entreprise préviennent ainsi l apparition de nombreux incidents informatiques. Grâce à la politique de sécurité informatique mise en place par la Direction du CIRTIL, de nombreux risques informatiques : intrusion dans les réseaux et les systèmes, blocage des systèmes par des applications hors pannes, accès aux données sensibles ou confidentielles, etc., sont maîtrisés. Néanmoins, il existe des incidents qui ne peuvent être prévus malgré l application des actions préventives. Ces incidents trouvent leurs origines dans différentes catégories de menaces internes, externes, accidentelles ou malveillances. 139

Ils peuvent être de différents ordres : bugs, crash d un système ou d une ressource, plantage des équipements, panne, indisponibilité du réseau interne due à des raisons diverses tel que la surcharge du réseau par exemple. De même, la mauvaise utilisation d une application logicielle par un client peut causer des incidents. Les origines des incidents informatiques les plus fréquents au CIRTIL peuvent être classés en trois catégories : Altération des données Les données de gestion ou de production peuvent être altérées suite à des erreurs de saisie ou à des actes de malveillance. Les erreurs de saisies sont généralement faciles à corriger alors que les actes de malveillance sont très souvent difficiles à identifier et à corriger. Les conséquences sont plus ou moins importantes selon le degré de sensibilité des données et du processus d activité concerné. Problèmes liés au matériel Problème d espace sur les machines qui hébergent les applications des clients. Par exemple, la volumétrie non contrôlé des fichiers ainsi que les réseaux défectueux sont une source d indisponibilité d applications. Ce type d incidents peut causer des problèmes de sauvegardes. Erreur humaine Il s agit particulièrement des erreurs de saisie, de programmation, de manipulation, de diagnostic ou de réparation. Elles sont généralement aisées à identifier mais peuvent perturber longuement une activité. Il y a également, d autres incidents ayant pour origine une cause humaine et qui concernent la dégradation matérielle come la chute de matériel par exemple. Les connaissances relatives aux incidents informatiques qui surviennent notamment pendant l utilisation des applications logicielles par les clients du CIRTIL concernent : Les incidents proprement dits : Il s agit des connaissances décrivant l incident. Celles-ci sont généralement enregistrées dans les dossiers CAP, générés automatiquement dans la base de données MySQL à partir du dossier d exploitation ou inscrits dans les fiches de signalement d incidents exigées par l assurance Qualité. Dans certains cas, les incidents sont décrits dans des messages électroniques. 140

Les causes et origines des incidents : Lorsqu elles sont connues, elles sont mentionnées dans les mêmes documents et sources cités ci-dessus. Lorsque le client ignore l origine de l incident ou du dysfonctionnement, ce sont les employés du CIRTIL qui doivent détecter les causes. Une fois identifiées, ces causes doivent être communiquées aux clients si nécessaire, si non, il faut les enregistrer au niveau des rubriques qui leur sont consacrées dans les différents supports d enregistrement d incidents. Les procédures de gestion ou de résolution des incidents : Elles sont de deux types : les procédures Qualité et les procédures métiers élaborées par les collaborateurs d une équipe. Les applications utilisées par les clients : Il s agit plus particulièrement de la documentation d accompagnement d applications, susceptible de contenir des informations ou des éléments de connaissances permettant la résolution de l incident. Par exemple, la documentation de projets ou la documentation faisant référence à une application donnée : documentation d installation, documentation d utilisation ou le code source. En effet, dans certains cas, la relecture du code source facilite l identification du bug et permet ainsi de situer l origine du problème. 5.3.2 Description de la méthode de construction d OntoIncident Nous avons conçu une ontologie du domaine que nous avons appelé OntoIncident. L objectif de cette ontologie est double. Dans le cadre d une mémoire d entreprise, cette ontologie permet d une part la représentation des connaissances et facilite d une autre part, le processus de leur exploitation. En effet, OntoIncident est une ontologie modélisant les connaissances relatives au domaine des incidents informatiques. Elle inclut tous les concepts et relations représentant les connaissances de ce domaine. Ces mêmes concepts sont ensuite utilisés pour indexer les ressources de connaissances et faciliter leur réutilisation. OntoIncident est utilisée non seulement comme un outil de recherche et d exploitation des connaissances capitalisées, mais aussi comme un moyen de mise à jour et d enrichissement de la mémoire d entreprise. La construction d OntoIncident s est déroulée conformément aux méthodologies décrites dans (Grüninger et Fox, 1995) et (Uschold et al, 1997). Nous avons commencé par l acquisition des connaissances du 141

domaine et identifié au sein du corpus de connaissances sélectionné, les primitives conceptuelles (concepts et relations) et la sémantique du domaine (propriétés conceptuelles des primitives). Ensuite, nous avons structuré la description conceptuelle ainsi constituée. Dans ce qui suit, nous mettons l accent sur l acquisition des connaissances, leur conceptualisation et leur structuration. La formalisation et l opérationnalisation de l ontologie sont abordées dans le chapitre suivant. 5.3.2.1 L acquisition des connaissances Il existe plusieurs techniques de recueil des connaissances héritées des recherches effectuées en acquisition des connaissances : analyse de documents, entretiens, observations, etc. Dans notre étude de cas, l analyse des documents a concerné de nombreuses ressources. Parmi ces ressources, certaines concernent directement le domaine des incidents informatiques tandis que d autres servent à mieux structurer les connaissances qui constituent l ontologie. Les entretiens auprès des employés ont pour objectif de définir certains éléments qui constituent l ontologie tels que les propriétés et les axiomes. En effet, si l identification des concepts et de leurs relations peut se faire en s appuyant seulement sur les documents techniques, l axiomatisation quant à elle, fait appel à des connaissances issues de l interprétation des entretiens réalisés auprès des employés. 5.3.2.1.1 La documentation spécialisée Il est évident que les connaissances du domaine utiles à l élaboration de notre ontologie soient identifiées au sein d une documentation spécialisée. Pour choisir un corpus documentaire plus au moins représentatif, nous avons considéré tous les documents susceptibles de contenir des informations et des connaissances utiles à la gestion des incidents informatiques. Ce corpus regroupe alors les documents qui contiennent des descriptions d incidents, des procédures techniques, des documents d accompagnement d applications, des procédures qualité, des dossiers de suivi d exploitation, des fiches et dossiers d enregistrement des nonconformités. Les procédures techniques : elles regroupent les procédures d exploitation des applications et les procédures de leur installation. Toute procédure technique est rédigée par un ou plusieurs collaborateurs et validée par le responsable de Pôle. 142

Dossier d exploitation : est un outil destiné à l enregistrement des contrôles du bon déroulement de chaque étape du processus «Exploitation» afin d assurer dans des conditions maîtrisées, l exploitation par les URSSAF, des traitements informatiques. Le dossier d exploitation est accessible via l Intranet du CIRTIL dans la rubrique "Suivi d'exploitation". Ce support permet aux techniciens de l exploitation la vérification des traitements batch. Cette vérification est de deux niveaux : le contrôle global de la bonne exécution de la session réalisé à l'aide des indicateurs de couleur dans l outil Saturne 20 ; et le contrôle de la bonne exécution de chaque traitement à l'intérieur d'une session qui est réalisé à l'aide des "logs" de traitements. Le dossier d exploitation est également utilisé pour l'enregistrement des incidents. Documents de résolution des incidents : ces documents sont pratiquement les seuls à expliciter les savoir-faire car, ils sont rédigés par les experts. Ces derniers décrivent comment ont été résolus les incidents déjà occasionnés, ou encore comment il faut faire si un incident se produit. Documents d accompagnement d applications : citons parmi ces documents les manuels d utilisation d applications et la documentation de description des fonctionnalités des applications. Ces documents sont produits par les collaborateurs du CIRTIL et destinés aux utilisateurs des applications. Ils fournissent des informations et des éléments de connaissances nécessaires à la compréhension de l utilisation de l application. Rapport annuel d activité : ce document est une source de description des activités effectuées par les employés de l entreprise. Le contenu de ce document permet, en plus de l identification des personnes responsables de certaines activités, une meilleure compréhension du fonctionnement de l entreprise. Le rapport annuel d activité est un document semi-structuré qui contient du texte, des données statistiques, des histogrammes et des schémas. Procédures Qualité : elles se rapportent aux déclarations des nonconformités en rapport avec les risques encourus : répétition des nonconformités ou forte probabilité pour qu'elles se reproduisent et, à la mise en œuvre d'actions correctives ou préventives. 20 Saturne est un outil de surveillance de l exploitation des applications développées en interne. 143

5.3.2.1.2 Les ontologies et thésaurus Les ontologies : lorsqu on s apprête à construire une nouvelle ontologie, on doit impérativement étudier les ontologies existantes qu elles soient des ontologies du domaine ou des ontologies génériques. Nous n avons identifié aucune ontologie qui modélise le domaine des incidents informatiques. Néanmoins, nous avons examiné plusieurs ontologies qui modélisent l entreprise et ses activités. Les deux ontologies que nous avons particulièrement exploitées sont O Comma (Gandon, 2002) et Enterprise Ontology (Uschold et al., 1997). La réutilisation des versions informelles de ces deux ontologies nous a permis d acquérir quelques concepts primitifs. Le thésaurus du Management : a été utilisé comme un outil d aide à la structuration des connaissances. Edité par l Association des responsables des centres d information des écoles de gestion (Aciege, 2003), ce thésaurus contient environ 2228 descripteurs répartis dans 66 champs sémantiques classés sous 15 listes thématiques. Parmi ces listes thématiques, nous avons particulièrement exploité la liste Gestion de l'entreprise et la liste Sciences et techniques de l'information. Cette dernière liste contient le champ sémantique Informatique. L organisation des champs sémantiques selon des schémas fléchés structure les connaissances dans ce thésaurus par des relations hiérarchiques et des relations d association. Les relations hiérarchiques sont établies entre les termes génériques et les termes spécifiques. Elles sont exprimées par des flèches qui vont des termes génériques vers les termes spécifiques : Lancement de Produit Test de Produit. Ces flèches sont utilisées pour une meilleure lisibilité du schéma, sans distinction de sens. Les relations d association représentent les termes associés dans un même schéma. Elles sont exprimées par un trait discontinu comme suit : Produit ----------- Gamme de Produits. 5.3.2.1.3 Les entretiens et observations Nous avons effectué des entretiens semi-structurés auprès des responsables de Pôles et de leurs collaborateurs. Après avoir lancé des questions générales et très ouvertes concernant les tâches et le rôle des personnes interviewées, nous avons structuré les informations collectées. 144

Ces informations ont été ensuite enrichies par des questions plus spécifiques. Enfin, nous avons révisé la synthèse récapitulant les entretiens avec les personnes interviewées. Pa ailleurs, nous nous sommes intéressés à travers la technique de l'observation à la façon dont les personnes travaillent sur des activités réelles. Nous nous sommes concentrés sur des indicateurs choisis (documents consultés, outils manipulés, réseau de connaissances, etc.). Par exemple, l observation des habitudes de travail des techniciens de l exploitation permet de connaître la fréquence de consultation de certaines ressources ainsi que l identification des termes les plus fréquemment utilisés. Les informations acquises des entretiens et observations aident à comprendre quels types de connaissances sont habituellement recherchées et révèlent le vocabulaire lié à l'utilisation et l'organisation des connaissances. La généralisation et les regroupements établis par les personnes interviewées sont particulièrement intéressants pour structurer l'ontologie. La collecte des connaissances à partir de ces différentes ressources s est faite selon une approche d analyse manuelle 21. Cette analyse consiste dans une première étape, à extraire de chaque document les éléments de connaissances les plus significatifs. En considérant l exemple du texte présenté dans la figure 5.3, les éléments de connaissances à retenir peuvent être formulés comme suit : - La DUE est une application sensible notamment à l arrêt et au démarrage ; - L arrêt et le démarrage de la DUE se font selon plusieurs étapes ordonnées ; - L arrêt et le démarrage d Informix font partie du processus de l arrêt et démarrage de la DUE ; - Ces opérations doivent être effectuées par un utilisateur Informix habilité ; - Ce dernier, applique les commandes qui permettent d assurer ces opérations ; Une mise en garde présentée sous la forme de la remarque ATTENTION est signalée par l expert qui a rédigé le document. 21 Cette analyse s appuie sur nos capacités d analyse du contenu documentaire. 145

1 Arrêt et redémarrage de la DUE La DUE est une application sensible dont l arrêt et le démarrage (enfin surtout l arrêt) doivent être fait de manière intelligente et le moins souvent possible. En effet, on surveille (ils sont partout!) le temps durant lequel la machine est disponible pour les cotisants, et on remonte ces informations aux autorités compétentes. Arrêt Un arrêt de l application DUE se déroule toujours dans le même ordre : 1. Arrêt d IRISA 2. Arrêt de CICS 3. Arrêt de SFS 4. Arrêt d INFORMIX A part l arrêt d INFORMIX tout se passe sous le compte ROOT (password ) Type d arrêt : prendre IMMEDIATE INFORMIX Les opérations faites sur la base de données INFORMIX doivent être faites avec l utilisateur infomix (password informix). En règle générale, la base de données n a pas besoin d être arrêtée car INFORMIX marche bien mieux que le reste de l application Commande pour voir l état d INFORMIX onstat Commande pour arrêter INFORMIX onmode -kuy Démarrage de l application Le démarrage de l application DUE se fait obligatoirement dans l ordre suivant : 1. INFORMIX 2. SFS 3. CICS 4. IRISA Là encore à part pour INFORMIX, tout se passe sous le compte de l administrateur système, root (je sais c est pas beau mais c est comme ça!). INFORMIX oninit Le démarrage d INFORMIX se fait à partir du compte informix par la commande : ATTENTION : ne surtout PAS mettre l option i!!! Elle casserait la base (et en plus je vous aurait prévenu) SFS Commande pour démarrer SFS smit cics Puis sélection des menus suivants : Gestion système de fichier Gestion des serveurs SFS Encina Démarrage à froid d un serveur SFS Encina Laisser les paramètres proposés en vérifiant que le nom du serveur vaille /.:/cics/sfs/cer69-due Attention, il faut taper dans la fenêtre de démarrage continue au moment ou smit le demande (après ok) pour qu il démarre bien SFS. Gestion CICS / Configuration des ressources CICS / Configuration des ressources CICS sur serveur SFS Encina / Configuration d un serveur Encina -> Créer la liste des fichiers suivantes : Files: duecicsnlqfile duecicsnrectsqfil duecicsplqfile duecicsrectsqfile Il est possible de voir cette liste de fichiers par la commande : sfsadmin list files Remarque : Si problème de verrou alors que la région cics est arrêté. Faire un cicsrlck a pour enlever les verrous. Figure 5.3 : Texte extrait d un document technique - La base documentaire Application 146

A partir de là, nous avons identifié au cours de la deuxième étape de cette analyse, les termes jugés importants pour représenter le contenu documentaire et avons supprimé les mots vides. Seules les notions significatives ont été conservées. En reconsidérant les éléments de connaissances retenus ci-dessus, les notions significatives seraient par exemple : - Application DUE ; - Etapes d arrêt de la DUE ; - Processus d arrêt et de démarrage de la DUE ; - Commandes de démarrage d Informix. Au final, nous avons obtenu pour chaque document, un ensemble de termes représentatifs de son contenu. L adéquation des termes retenus avec le contenu du document a été systématiquement validée par les experts du domaine. Une fois les termes potentiellement représentatifs ont été validés, nous les avons classé dans un tableau afin de mieux les situer les uns par rapport aux autres notamment en ce qui concerne le niveau de la représentation conceptuelle, la granularité, la synonymie et l identification des relations. Ce travail de classement conduit à l étape suivante qui est la conceptualisation. 5.3.2.2 Conceptualisation et consensus ontologique La conceptualisation est l'opération qui consiste en l'analyse terminologique des notions collectées dans la phase d'acquisition des connaissances et ce, en vue de l identification des concepts, instances et relations potentiellement utiles et utilisables dans le domaine de l application de l ontologie. Elle se fait le plus souvent manuellement car il existe peu d outils qui offrent une aide à la conceptualisation. Néanmoins, on peut citer TERMINAE, qui à travers l outil d ingénierie linguistique LEXTER, permet d extraire d un corpus textuel les termes candidats d un domaine (Biebow et al., 1999), (Terminae, 2002). Le processus de conceptualisation de l ontologie OntoIncident s est effectué donc d une façon manuelle qui a consisté en l identification et la définition des concepts et l élaboration des relations entre ces concepts. 5.3.2.2.1 Identification et définition des concepts L approche de conceptualisation que nous avons adoptée est l approche centrifuge. Cette approche consiste à identifier les primitives conceptuelles du domaine et de structurer ensuite les concepts qui leur sont associés par le biais des relations de généralisation et de spécialisation. 147

L avantage de cette approche est qu elle se focalise sur les thématiques élémentaires du domaine à modéliser. Nous avons tout d abord identifié par un processus d'abstraction les concepts essentiels référencés par les termes du domaine. Ainsi, les concepts Incident, Application, Résolution, Processus et Employé figurent parmi les concepts centraux du domaine des incidents informatiques. Nous avons ensuite effectué une analyse terminologique de ces concepts. Cette analyse s est basée sur les ressources de connaissances et les recommandations des experts du domaine. En effet, une fois les concepts identifiés par leurs termes, l étape suivante consiste à décrire la sémantique en indiquant, a priori en langage naturel, leurs attributs, leurs instances connues et les liens qu ils entretiennent entre eux. Un concept peut être divisé en trois parties : un terme (ou plusieurs), une notion et un ensemble d objets. La notion, appelée également intension du concept, contient la sémantique du concept, exprimée en termes de propriétés et d attributs. L ensemble d objets appelé extension du concept, regroupe les objets manipulés à travers le concept ; ces objets sont appelés instances du concept 22 Par exemple, le terme Application renvoie à la fois à la notion d application comme objet de traitement informatique de type logiciel possédant des fonctionnalités de traitement de l information, et à l ensemble des objets correspondant à cette description. La description de chaque primitive conceptuelle est effectuée selon les propriétés du concept. Les propriétés portant sur des concepts sont: - l abstraction : un concept est abstrait si seuls ses concepts fils possèdent des instances. Un exemple de concepts abstraits est le concept Evènement, dont toutes ses instances sont aussi les instances de ses deux concepts fils : Incident et Réunion ; - l équivalence : deux concepts sont équivalents s ils ont la même extension. Par exemple, Incident et Dysfonctionnement sont deux concepts équivalents ; - la disjonction : deux concepts sont disjoints si leurs extensions sont disjointes. Par exemple, Incident et Réunion sont deux concepts disjoints ; 22 Bachimont emploie le terme de concept formel pour désigner l extension d un concept, et il utilise le terme de concept sémantique pour désigner l intension d un concept. (Bachimont, 2000) 148

- la subsomption : un concept C1 subsume un concept C2 si toute propriété sémantique de C1 est aussi, une propriété sémantique de C2, c est-à-dire si C1 est plus spécifique que C2. L extension d un concept subsumé est forcément plus réduite que celle du concept qui le subsume. Son intension est par contre plus riche. La subsomption sert à la hiérarchisation de l ensemble des concepts de l ontologie. Par exemple, Panne de Serveur subsume Incident et Incident subsume Evènement. La définition des concepts consiste également en l identification, pour chaque concept, des attributs qui le caractérisent. Par exemple, les attributs du concept Incident sont : nom_incident, état_incident, degré_gravité et date_clôture. En outre, il faut associer aux concepts identifiés, des définitions précises et non ambiguës. Bien que la restriction à un domaine de connaissance permette généralement d éviter les homonymies de concepts, l usage de définitions explicites favorise le partage sémantique. Ces définitions peuvent être formelles ou non. Dans le cadre d une manipulation de l ontologie par des humains comme c est le cas d OntoIncident, il est nécessaire que les définitions soient en langage naturel. Le but des définitions dans une ontologie est différent de celui de la définition du dictionnaire. Les définitions dans une ontologie ont un rôle normatif et indiquent comment un ensemble réduit de termes peut être utilisé par rapport à un autre (Uschold et Gruninger, 1996). Chaque définition véhicule un sens précis tout en impliquant les autres concepts de l ontologie de la façon suivante : Incident : est un Evènement qui survient au cours d un Processus d Activité donné et qui affecte le déroulement normal de ce Processus ou des Tâches qui le composent. Tâche : est la plus petite division du travail à réaliser au cours d'un Délai donné, dont l exécution peut être confiée à un Employé. Délai : est une durée de temps déterminée pour la Réalisation d une Tâche 149

5.3.2.2.2 Élaboration des relations entre les concepts La relation de base d une ontologie est la relation de subsumption qui aboutit à l élaboration d une taxonomie, c'est-à-dire une classification des concepts basée sur leurs similitudes. En effet, les premiers liens à établir entre les concepts qui constituent l ontologie sont des liens hiérarchiques de type est-un ou fils-de. Les concepts sont ainsi organisés en une hiérarchie allant du niveau supérieur très général au niveau inférieur spécifique. De même que dans Enterprise Ontology (Uschold, 1996), nous avons créé pour chaque concept de base, les concepts génériques et les concepts les plus spécifiques qui lui sont rattachés. Après avoir désigné un concept donné comme étant un concept de base, par exemple le concept Incident, nous avons défini ensuite les concepts les plus spécifiques (Panne de serveur, Indisponibilité d application et Panne de serveur) et le concept le plus général (Évènement). Le schéma de la figure 5.4 présente à travers l exemple du concept Incident l organisation hiérarchique de ces concepts. Événement Incident Panne de Serveur Indisponibilité Application Problème de Sauvegarde Figure 5.4 : La taxonomie du concept Incident Les primitives conceptuelles ont été ensuite reliées entre elles, soit par des relations qui permettent d exprimer la sémantique particulière qui associe les connaissances du domaine, soit par des relations fondées sur les liens logiques existants entre certains concepts. En effet, si l identification de certaines relations dépend strictement du contexte particulier du domaine des connaissances modélisé, d autres relations ne sont pas particulières à ce domaine. 150

Par exemple la relation entre les concepts Processus et Tâche, n est pas spécifique au domaine des incidents informatiques car, quelque soit le domaine de connaissances, un Processus inclut en général plusieurs Tâches. Il est donc logique que la relation à établir soit la relation suivante : Processus ---- composé_de ---- Tâche. En revanche, pour créer des relations correctes entre les concepts Employé et Incident, il est nécessaire de se référer au domaine de connaissances, sinon il serait difficile de suggérer des relations pertinentes. Notons à cette occasion que nous avons constaté qu il peut y avoir plus d une relation entre deux mêmes concepts. Citons comme exemple les relations qui existent entre les concepts Employé est Incident. Pour ces deux concepts, nous avons identifié les trois relations suivantes : Employé ---- traite ---- Incident Employé ---- identifie ---- Incident Employé ---- signale ---- Incident Les relations peuvent être spécifiées par des propriétés dont une liste non exhaustive est donnée ci-après. Ces propriétés des relations complètent la sémantique de l ontologie, au sens où elles contribuent à préciser les liens et différences entre les primitives cognitives du domaine de connaissance. Les propriétés intrinsèques d une relation sont : les propriétés algébriques : symétrie, réflexivité, transitivité, antisymétrie, anti-réflexivité ; les cardinalités : il s agit du nombre possible de relations de ce type pouvant exister entre les mêmes concepts (ou instances de concept). Les relations portant une cardinalité représentent souvent des attributs. Par exemple, une Panne de serveur concerne au moins une Application, un Incident affecte entre zéro et n Processus. Les propriétés liant deux relations sont principalement : l incompatibilité : deux relations sont incompatibles si elles ne peuvent lier les mêmes instances de concepts. Par exemple, les relations fils-de et père-de sont incompatibles ; l inverse : deux relations binaires sont inverses l une de l autre si, quand l une lie deux instances I1 et I2, l autre lie I2 et I1. Par exemple, les relations fils-de et père-de sont inverses l une de l autre ; 151

l exclusivité : deux relations sont exclusives si, quand l une lie des instances de concepts, l autre ne lient pas ces instances, et vice-versa. L exclusivité entraîne l incompatibilité. Par exemple, l appartenance et la non-appartenance sont exclusives. Le processus de conceptualisation a aboutit à la construction d un modèle conceptuel qui décrit, au travers des éléments terminologiques et sémantiques évoqués ci-dessus les connaissances du domaine. Ce modèle conceptuel est semi-formel car, il combine langage naturel et propriétés formelles. En effet, pour faciliter la lecture et par conséquent le travail de validation de la version semi-formelle de l ontologie OntoIncident par les employés du CIRTIL, nous avons représenté le modèle conceptuel en un diagramme de classes UML dont un extrait est présenté par la figure 5.5. Cette présentation intermédiaire entre le langage naturel et le langage formel facilite la représentation et la compréhension des concepts grâce à sa notation graphique. L'aspect formel de la notation UML limite les ambiguïtés et les incompréhensions. La puissance et l'intérêt d'uml, c'est qu'il normalise la sémantique des concepts. De plus, cette présentation a pour avantage de compléter l ontologie en y ajoutant les attributs des concepts et quelques instances. UML «représente un juste milieu entre langage mathématique et langage naturel, pas trop complexe mais suffisamment rigoureux, car basé sur un méta-modèle» (Lopez, 1998). En effet, cette présentation par UML nous a permis de décrire de manière très précise tous les éléments de modélisation (les concepts véhiculés et manipulés par le langage) et la sémantique de ces éléments (leur définition et le sens de leur utilisation). Les concepts et relations sont représentés par leur forme canonique de base : singulier pour les noms (Employé, Application); verbes conjugués au présent à la troisième personne pour les relations (traite, identifie). Les notions composées faisant référence à un même concept sont encodées par une succession de mots individuels, reliés par underscore (Organisme_de_Sécurité_Sociales, Cause_Incident). Notons toutefois que préalablement à cette présentation des connaissances sous forme de diagramme de classes UML, l ontologie semiformelle a été soumise aux spécialistes du domaine sous forme de graphe conceptuel. L objectif de cette présentation est de mettre en évidence les concepts et les relations. 152

Après quelques réunions de validation dont la question principale était de savoir quels sont les concepts et relations à conserver parmi un ensemble de synonymes, certaines modifications ont été apportées à la version semi-formelle de l ontologie OntoIncident. L objectif de ces réunions était d obtenir un consensus ontologique minimal permettant de valider l ontologie. Le consensus ontologique a permis de vérifier la cohérence du modèle conceptuel (cohérence syntaxique, logique et sémantique) par les spécialistes du domaine. Le résultat final est une ontologie constituée de 136 concepts et 54 relations présentée en annexe 1. Figure 5.5: Représentation des concepts et relations par UML 5.3.3 Structuration sémantique des connaissances du domaine L explicitation des relations au cours du processus de la conceptualisation, a permis d exprimer une richesse sémantique indispensable au domaine de connaissances modélisé, car «une notion se définit par les différences et les liens qu elle entretient avec les autres notions» (Dechilly et al., 1999). 153

Nous pensons que cette richesse dépend de la diversité des types de liens qui existent entre les connaissances, car ce sont les types des liens qui permettent l organisation ontologique des connaissances et leur intérprétation sémiotique. 5.3.3.1 Le besoin d organisation des connaissances selon les types de liens Les types de liens offrent des précisions sémantiques intéressantes notamment pour la restitution des connaissances. Dans la représentation illustrée par la figure 5.6, nous constatons que la sémantique exprimée par les relations entre les concepts varie selon les relations, mais surtout selon les types des liens qui associent ces concepts. Ainsi, grâce au lien de subsumption (i.e. spécialisation/généralisation) entre les concepts Employé et ses sous-concepts : Chef de Projet, Technicien d exploitation et Développeur, il a été possible de représenter les relations sémantiques du domaine qui existent entre les concepts Développeur et Application et entre Technicien d exploitation et Application comme suit: Développeur ---- développe ---- Application Technicien d exploitation ---- surveille ---- Application Dans cet exemple, l apport du lien de subsumption réside dans la possibilité de créer des relations directes et précises entre les sous-cocnepts Développeur et Application et Technicien d exploitation et Application. En l absence de ce type de lien, la modélisation manquerait de précision sémantique car la relation serait établie: - soit directement entre les concepts Employé et Application, car il n existerait pas de concepts fils du concept Employé. Cette modélisation non représentative de la réalité, peut poser le problème de bruit lors de de l interrogation du système; - soit directement entre les concepts Développeur et Application et entre les concepts Technicien d exploitation et Application car, on n aurrait pas représenté la relation entre les concepts Développeur et Technicien d exploitation avec leur ancêtre Employé. Le problème qui peut se poser lors de l interrogation du système, est le problème du silence notamment dans le cas où la requête s intersse à tous les employés ayant travaillés sur une Application donnée. 154

Employé nom-employé mail poste-occupé date-embauche est-un est-un est-un ChefDeProjet domaine-projet TechnicienExploitation application-développée Développeur langage-développement-maîtrisé développe survielle Application date-mise-oeuvre version Figure 5.6 : Enrichissement sémantique apporté par les types de liens Par ailleurs, l intérêt du lien sémantique du domaine entre certains concepts apparaît notamment lorsque deux même concepts sont reliés par deux relations différentes. Par exemple, du point de vue linguistique, l interprétation sémantique du triplet : Employé ---- traite---- Incident est tout à fait différente de celle exprimée par le triplet Employé ---- identifie -- -- Incident (cf. figure 5.7). Dans un système de recherche d information classique utilisant des équations booléennes par exemple, l utilisation des deux concepts Employé et Incident dans une même requête peut être ambiguë. En plus de la problématique du bruit et du silence 23, il est difficile pour le système de cerner la sémantique souhaitée par l utilisateur. Que cherche l utilisateur : l employé qui a traité l incident ou l employé qui a identifié l incident? 23 Du bruit, dans le cas où le système affiche tous les documents indexés à la fois par les concepts Incident ET Employé ; du silence dans le cas où le système fournit seulement les documents indexés par Incident OU Employé. 155

traite Employé Incident Lorsque deux mêmes concepts sont reliés par deux relations distinctes, ils produisent des significations sémantiques différentes. identifie Employé Incident Figure 5.7 : L apport du lien sémantique du domaine Une modélisation qui tient compte des types de liens existants entre les connaissances, permettrait une description sémantique représentative de la réalité. Ceci a pour principal avantage de répondre aux requêtes avec une certaine précision sémantique car, comme le souligne Hernadez, ne pas considérer les types de liens revient à ignorer une partie de la sémantique contenue dans l ontologie (Hernadez et al., 2004). 5.3.3.2 Description du modèle sémantique S3 Nous avons proposé dans (Bahloul et al., 2003) et (Bahloul et al., 2004a) un modèle qui vise une exploitation des connaissances préalablement modélisées selon les différents types de liens exprimés par les relations entre les concepts. Ce modèle appelé le modèle S 3 permet d organiser les concepts de l ontologie selon trois vues différentes: une vue hiérarchique, une vue structurelle et une vue sémantique du domaine, où chaque vue repose sur un type de lien. La définition d un type de lien se fait à partir des caractéristiques et propriétés des relations. Les relations sont des composantes de l ontologie qui représentent un type d interaction entre les concepts du domaine. Leur représentation formelle peut être vue comme un sousensemble d un produit de n ensembles, R:C1xC2x xcn. Ainsi, nous définissons une relation comme étant une association d un triplet de deux nœuds par un arc orienté dénoté comme suit: Cs Cd, où : Cs est le concept source et, Cd est le concept destinataire. 156

Nous appelons lien l arc orienté qui associe deux nœuds. La notion de lien entre connaissances est abordée ici du point de vue ontologique, où le rôle d un lien est de définir avec précision le rapport sémantique entre les concepts. Dans la représentation de la figure V.8, nous considérons des relations les triplets : «Application_bureautique ---- est-une ---- Application»; «Application ---- composé-de ---- Module»; et «Technicien_ d exploitation ---- surveille ---- Application». où : est-une, composé-de et surveille sont des liens. Figure 5.8 : Représentation des relations selon les types de liens Les différences sémantiques exprimées par chacun de ces liens correspondent au types de liens qui spécifient un ensemble de relations ayant les mêmes caractéristiques et auxquelles on peut appliquer les mêmes opérations. Parmi les caractéristiques et propriétés facilitant la définition d un type de lien, citons la dépendance et le sens de la relation (unilatéral, bilatéral). Ainsi, nous pouvons considérer que tous les liens qui représentent à la fois une relation de dépendance et un sens unilatéral se dérigeant du concept source (Cs) vers le concept destinataire (Cd) appartiennent au même type de lien. Trois types de liens ont été distingués: le lien de subsumption, le lien de composition et le lien sémantique du domaine. 157

5.3.3.2.1 Le lien de subsumption Le lien de subsumption est une association de spécialisation entre un concept et ses sous-concepts. Ce lien est créé entre deux concepts A et B si l'ensemble des instances de B est un sous-ensemble de l'ensemble des instances du concept A, B est alors appelé un sous-concept de A. Ceci est dénoté comme suit: Cs-sub Cd. Le lien de subsumption permet donc de regrouper les caractéristiques communes à différents concepts. Il permet également, d'ajouter facilement un nouveau concept, en créant à nouveau un concept existant. Ce lien est transitif, i.e. Cs-sub Cd., Cs -sub Cs Cs -sub Cd. Il peut être exprimé par l un des termes suivants: est-un, fils-de ou sorte-de. L inverse du lien de subsumption est souvent nommé père-de. Un exemple de concepts reliés par le lien de subsumprion dans l ontologie OntoIncident est le concept Employé et ses sous-concepts Technicien, Développeur et Chef de Projet. Chaque sous-concept se définit à travers les attribus qui caractérisent le concept père Employé (nom_employé, mail, poste-occupé et date_d embauche) et les autres attributs qui lui sont particuliers. 5.3.3.2.2 Le lien de composition Ce type de lien constitue un type d association qui exprime une dépendance réciproque entre l ensemble et ses parties. Une instance du concept source Cs est composée de plusieurs objets représentés par les concepts destinataires Cd. Ce lien est une association particulière dont la sémantique est de type composé-composant. L'idée principale est que toute modification de l'élément de connaissances composé aura un impact sur les éléments de connaissances qui le composent. Le lien de composition est dénoté comme suit : Cs-dep Cd où Cd appartient à Cs. Il est souvent nommé par composé-de ou à l inverse partie-de. Ce type de lien peut être récursif quand Csi {1..n} Cs où Cs-dep Cd. Un exemple de concepts reliés par le lien de composition dans l ontologie OntoIncident est observé à travers la relation : Application ---- composé-de ---- Module. Pour faciliter l identification et la création de liens de composition, nous nous basons sur les liens d aggréagtion dans l approche 158

orientée objet (Lopez, 1998). Nous avons fixé quelques critères qui facilitent la création de ce type de lien. Ces critères sont les suivants : - le lien doit exprimer une sémantique proche de est composé de ou à l inverse est partie de ; - il doit y avoir une différence de granularité entre le concept source (qui est le concept composé) et les autres concepts destinataires qui sont les composants; - la modification d'une propriété dans un concept composé concerne obligatoirement les propriétés des concepts composants; - la définition d'une règle pour un concept composé repose sur les règles des autres concepts composants. 5.3.3.2.3 Le lien sémantique du domaine Comme son nom l indique, ce type de lien regroupe toutes les relations qui permettent d exprimer une sémantique spécifique au contexte particulier du domaine de connaissances modélisé. Nous avons identifié dans la littérature que cette catégorie de liens inclue, entre autre, le lien temporel, le lien procédural et le lien causal (Zhuge, 2003). Ce dernier définit les liens de type cause-effet entre Cs et Cd, où Cd est le résultat de la cause Cs. Il est dénoté comme suit : Cs-csl Cd. Nous avons noté que dans ce type de lien, les propriétés des concepts Cs et Cd doivent être distinctes. La nomination des liens n est pas normalisée; le plus souvent, on emploie des verbes appropriés permettant d exprimer avec clarté et sans ambiguïté la relation entre les concepts. Des exemples de ces liens dans OntoIncidents sont les liens: traite, identifie, surveille, nécessite et concerne. Les liens sémantiques du domaine sont généralement bidirectionnels et transitifs. Un exemple de concepts reliés par le lien de composition dans l ontologie OntoIncident est observé à travers la relation «Technicien_ d exploitation ---- surveille ---- Application». 5.3.3.3 L avantage de la structuration des connaissances selon le modèle S3 En plus d une modélisation suffisamment représentative du domaine des connaissnaces, la structuration des connaissances selon le modèle S 3 offre à l utilisateur le moyen de préciser sa requête assez rapidement. Grâce à cette organisation, la mémoire d entreprise peut être accesible via trois Vues. Selon la requête, l utilisateur peut choisir : 159

- La vue de subsumption si l objectif de la requête est par exemple, de connaître toutes les catégories des employés du CIRTIL, ou tous les types de produits que ropose le CIRTIL à ses clients; - La vue de composition, si l objectif visé par la requête est la recherche des composantes d une machine, ou d une application par exemple; - La vue sémantique du domaine, notamment dans la cas où l utilisatuer possède une parfaite connaissance du domaine. En principe, les connaissances sont organisées en un réseau sémantique dépendant du domaine modélisé. Cette organisation peut se traduire par une interface de recherche dans laquelle seraient exploités non pas des mots-clés, mais des concepts reliés entre eux par des relations. Cette interface devrait permettre à l'utilisateur de restituer une liste de documents pertinents, car ces documents auraient un certain lien sémantique les uns avec les autres. Pour valider ces hypothèses, nous avons développé un prototype permettant l implémentation du modèle S 3. Celui-ci est présenté dans le chapitre suivant. 5.4 La réutilisation des connaissances Les besoins en matière d exploitation des connaissances diffèrent selon l utilisateur considéré et la tâche qu il doit accomplir. Par exemple, un agent de la cellule ASUR peut avoir besoin d un ensemble d informations très détaillé sur les manifestations potentielles d un dysfonctionnement ; en revanche, un technicien d exploitation confronté à une anomalie de comportement d une machine voudra disposer, le plus vite possible, d une liste d investigations complémentaires pertinentes pour prendre les bonnes décisions. La satisfaction de ces besoins correspond à différentes manières d exploiter les connaissances. Dans notre approche, le principe d exploitation des connaissances capitalisées repose sur l ontologie OntoIncident car, c est de la méthode de modélisation des connaissances que dépend l approche de leur réutilisation. Ainsi, l ontologie que nous avons élaborée pour la modélisation des connaissances, est également destinée à faciliter leur exploitation. Les éléments pris en compte pour la réutilisation des connaissances dans le cadre de cette approche sont : 160

- le mode de recherche et d accès aux savoirs et savoir-faire : navigation dans une arborescence, interrogation du système par les concepts, interrogation incluant l inférence ; - le support ou la façon dont ces connaissances doivent être restituées : documents dans leur format natif ou en formats standards de documents tels que HTML ou XML ; - les interfaces de recherche et leurs caractéristiques. Le processus de restitutions des connaissances que nous suggérons doit coupler la recherche par concepts avec l inférence tout en incluant le mode d interrogation simultanée de plusieurs sources. 5.4.1 La recherche par les concepts et le raisonnement sur les connaissances La recherche des connaissances par les concepts n est intéressante pour les employés du CIRTIL que si, ces concepts sont utilisés comme des motsclés. La navigation conceptuelle qui favorise la découverte et l exploration de l arbre de connaissances, n est pas requise en raison notamment du contexte de travail des employés. Le mode de recherche dans l arborescence n est pas adéquat avec la nature des activités du CIRTIL, ni la manière de recherche d information habituellement pratiquée par les employés. La restitution des connaissances doit alors s effectuer comme dans une approche base de données grâce à l exploration des concepts et instances de l ontologie en utilisant par exemple des langages de requêtes de la forme SQL. Ces langages offrent des fonctionnalités algébriques pour interroger les instances de la base de données. Un exemple de cette application est le système MADS (MAD), (Spaccapietra, 1999). Cette recherche par concept doit être enrichie par l application du raisonnement sur les connaissances grâce au mécanisme du raisonnement. La notion de l inférence est fondamentale dans le cadre de la gestion des connaissances, car une connaissance ne peut être simplement «appliquée» à un contexte donné. Son usage nécessite de recourir à un effort d interprétation et de traduction humaine (Tsoukas, 1996). Tel que nous l'avons défini, le mécanisme d'inférence a pour but la déduction de nouvelles connaissances. Dotée de mécanismes d inférence, le système d interrogation permet de confronter une nouvelle connaissance à un ensemble de connaissances connues pour déduire des informations liées à cette nouvelle connaissance. 161

En plus de l héritage, nous suggérons de créer des règles qui doivent préciser d'une part les conditions d'application de la règle, et d'autre par les conséquences pour les instances qui remplissent les conditions. Un exemple de règles peut être le suivant : «Si un incident affecte une tâche et si cette tâche est composante d'un processus, alors, on peut en déduire que l'incident affecte le processus.» 5.4.2 L interrogation simultanée de plusieurs sources L étude de l existant a montré le besoin d interroger simultanément plusieurs sources de connaissances. Ce besoin est dû aux caractéristiques des connaissances qui sont d une part reliées entre elles sémantiquement et d autre part, elles sont localisées dans des sources hétérogènes. Une solution est de proposer une approche de médiation sémantique exploitant l ontologie du domaine. Cette approche (Wiederhold, 1992) consiste à définir une interface entre l agent (humain ou logiciel) qui pose une requête et l ensemble des sources de l entreprise potentiellement pertinentes pour répondre. L objectif est de donner l impression d interroger un système centralisé et homogène alors que les sources interrogées sont réparties, autonomes et hétérogènes. Dans cette approche, les données semi-structurées et nonstructurées peuvent être prises en charge par des modèles d échanges adaptés. Deux types de solutions apparaissent en fonction de la gestion des requêtes et de l utilisation de la sémantique dans le processus de médiation : la médiation de schéma et médiation de contexte. La médiation repose sur deux composants essentiels : le médiateur et le wrapper. Le médiateur identifie, localise, transforme et intègre les informations pertinentes vis-à-vis du contexte associé à une requête ; le wrapper permet à un (ou plusieurs) médiateur (s) d accéder au contenu d une source d informations (Jouanot, 2001). Dans une approche à base de médiation, il y a des modules logiciels qui exploitent des connaissances codifiées, des fournisseurs de méthodes d accès et d intégration de données provenant de bases de données différentes et des facilitateurs d interopérabilité et d échange d information provenant de sources disparates. Cette approche permet la résolution des conflits sémantiques grâce à la spécification explicite des concepts et de leurs relations qui faciliter l échange et la réutilisation des connaissances. Une architecture médiateur / wrapper est présentée dans la 162

figure 5.9 ; c est une architecture à trois niveaux : le premier niveau concerne les sources de connaissances de l entreprise, le deuxième niveau englobe tous les outils et les connaissances nécessaires à l interopération des sources (ontologie, médiateur, wrapper, ) et le troisième niveau est dédié aux applications. Figure 5.9 : Interrogation simultanée de plusieurs sources à base de médiation. 163

5.5 Outillage de la démarche 5.5.1 La conception d une mémoire d entreprise «métier» La matérialisation de notre démarche de gestion des connaissances s est concrétisée par la conception d une mémoire d entreprise. C est à travers cette mémoire collective, que nous tentons de rendre opérationnels les processus de gestion des connaissances décrits ci-dessus. La mémoire d entreprise à concevoir est une mémoire «métier» dédiée à la capitalisation des connaissances relatives aux incidents informatiques qui affectent les applications logicielles utilisées par les clients du CIRTIL. Cela signifie que les connaissances considérées concernent l ensemble de documents, référentiels, outils et méthodes habituellement employés dans le contexte de la gestion des incidents informatiques : description et traitement des incidents, résolution, orientation des clients, etc. Ainsi, la mémoire métier inclut non seulement les connaissances techniques, mais aussi, les connaissances opérationnelles utilisées par tous les collaborateurs pour réaliser leur travail. Par ailleurs, cette mémoire peut être vue comme un environnement technique avec des outils et des modèles qui fournissent de l aide aux collaborateurs dans leur tâche de capitalisation et d exploitation des connaissances. Ces collaborateurs sont les informaticiens, les techniciens, les responsables de Pôles et les agents d assistance aux clients. L ensemble des tâches d un collaborateur relatives à la capitalisation et à l utilisation des connaissances peut être découpé de la manière suivante: - capture d informations et d éléments de connaissances ; - formalisation et structuration des ces informations pour pouvoir les rechercher ultérieurement ; - analyse et interprétation dans un cas concret ; - partage et diffusion auprès des personnes qui peuvent être intéressées. La coordination de ces tâches suppose l implication directe du collaborateur pour assurer le mode de gestion illustré en figure 5.10. Dans cette configuration, les collaborateurs sont amenés à coordonner et structurer toutes les connaissances de façon à pouvoir les préserver pour des fins d exploitation et de réutilisation. 164

Ces connaissances proviennent de deux principales sources : le SIE et les individus. Les ressources du SIE regroupent la documentation spécialisée, les bases de données, les pages web, etc. Les connaissances des individus sont les savoir-faire et les expériences acquises à partir des tâches quotidiennes effectuées par les collaborateurs. Partant de l hypothèse que chaque employé possède la faculté d intégrer de nouvelles connaissances dans la mémoire d entreprise, le processus de capitalisation est alors assuré par les collaborateurs euxmêmes. Ces derniers, formalisent, explicitent et structurent les connaissances selon des modèles prédéfinis basés sur l ontologie du domaine préalablement développée et mise à la disposition des collaborateurs. Le collaborateur peut être ainsi guidé dans son travail de formalisation et de structuration des connaissances. Il peut décrire de nouvelles connaissances selon des modèles types. Ces derniers vont assurer la structuration des connaissances d une façon plus au moins homogène. Cette structuration doit tenir compte notamment des structures : physique et logique des documents. Pour cela, nous utilisons XML comme un langage pivot capable de décrire la structure logique des documents à l aide des balises. Figure 5.10 : Environnement dédié à la capitalisation des connaissances par les employés 165

Le format XML est très utile pour l enregistrement des éléments de connaissances. Par exemple, les balises permettent de marquer les éléments composant la structure et les relations entre ces éléments. L apport d XML comme support de formalisation et d explicitation des connaissances réside dans le balisage. «Le balisage consiste à admettre que tout document textuel est construit selon une structure, qui est reconnue par les lecteurs humains grâce à des marques typographiques, des conventions de mise en page, et/ou diverses connaissances pragmatiques, culturelles, relatives aux informations génériques qu est susceptible de contenir, ou que doit contenir, tout document particulier appartenant à une certaine catégorie de documents» (Michard, 2001). XML permet la description de la structure de tous les documents d un même type à l aide d une DTD (Définition Type de Document) ou de schémas (XMLSchema). Ainsi, chaque information ou éléments de connaissances saisis ou consultés doivent se conformer au modèle de DTD afin de mieux contrôler les données saisies dans les documents. L élaboration de DTD contribue, dans le contexte de notre application, à faciliter le processus d intégration des connaissances dans la mémoire métier. Par exemple, nous avons élaboré une DTD générale permettant de déclarer les spécifications de toutes les connaissances nécessaires à la gestion des incidents informatiques. La définition de cette DTD est le résultat de la fusion de plusieurs ressources de connaissances (voir annexe 2). Plus concrètement, le moyen de formalisation et d explicitation mis à disposition des employés est un formulaire html basé sur cette DTD. Ce formulaire facilite l intégration dans la mémoire collective, de nouvelles connaissances produites et/ou acquises au cours des processus métiers effectués par les collaborateurs. Les éléments de connaissances introduits dans le système sont ensuite générés automatiquement en format XML. Les connaissances ainsi formalisées et explicitées sous forme de documents exploitables, sont ensuite indexées par les concepts qui constituent l ontologie. Nous avons choisis d utiliser l ontologie comme vocabulaire normalisé pour indexer les ressources électroniques et ce en raison de la fonction de représentation sémantique fournie par les ontologies. Des projets tels que SHOE (Heflin et Hendler, 2000) et Ontobroker (Benjamins et al., 1998) utilisent déjà les ontologies pour annoter des pages Web 24. De plus, les travaux de (Dechilly et al., 1999) montrent que les ontologies permettent la description sémantique notamment du contenu audiovisuel. 24 Nous retrouvons le principe de l indexation par les ontologies dans la notion d annotation dont l utilisation est très répondue au sein de la communauté du Web sémantique. 166

Nous avons montré ci-dessus que les ontologies fournissent un vocabulaire spécifique du domaine selon une conceptualisation explicitement définie. Ainsi, une ontologie peut être employée comme ressource d'indexation au même titre qu un thésaurus. Ainsi, le vocabulaire contrôlé est remplacé par l ontologie. Celle-ci, peut être exploitée pour représenter le contenu d une ressource de connaissances par des concepts. L indexation par l ontologie a pour objectif d'ajouter la sémantique aux ressources de connaissances afin d améliorer le processus de leur exploitation. Pour être fiable, cette opération intellectuelle est strictement réalisée par les spécialistes du domaine par le moyen d un outil informatique d aide à l'indexation. Cet outil doit simplifier le processus d indexation pour les collaborateurs grâce à l association des concepts de l ontologie au contenu des ressources de connaissances déjà formalisées. Ainsi, la méthode d indexation adoptée repose sur une approche semiautomatique. 5.5.2 Proposition d une architecture de la mémoire d entreprise Pour répondre aux caractéristiques exprimées ci-dessus, nous présentons dans ce qui suit l architecture de la mémoire d entreprise du CIRTIL. Cette architecture vise à fournir l infrastructure nécessaire à l élaboration d un système de gestion des connaissances qui s interface avec le SIE tout en s appuyant sur les techniques du Web sémantique et les standards des NTIC. Au sein de cette architecture, trois niveaux sont distingués : - le niveau exploration de la mémoire d entreprise qui fournit des services directement destinés aux différentes catégories d utilisateurs de la mémoire en s appuyant sur l infrastructure de gestion ; - le niveau gestion de la mémoire d entreprise qui est doté d un ensemble de modules et de composants qui fournissent les fonctionnalités élémentaires de la gestion de la mémoire d entreprise ; - le niveau sources d information de l entreprise au sein duquel sont localisées les ressources de connaissances. Dans cette architecture illustrée par la figure 5.11, nous nous sommes intéressés aux fonctionnalités des modules et composants de la couche gestion du système. Ces modules et composants sont décrits avec les spécifications qu'ils doivent satisfaire. 167

Figure 5.11: L architecture de la mémoire d entreprise du CIRTIL. 5.5.2.1 Le serveur de connaissances réutilisables Le serveur de connaissances réutilisables est chargé de mettre à la disposition des utilisateurs, en particulier les experts du domaine, des fonctionnalités nécessaires à l intégration de nouvelles connaissances dans le système. Grâce à ces fonctionnalités l expert doit pouvoir saisir les connaissances implicites selon le formalisme de l ontologie préalablement prédéfini et transformer ainsi les savoir-faire en une matière utilisable. Une solution est de générer les éléments de connaissances introduits par l expert, en documents XML selon des structures prédéfinies par les DTDs par exemple. Les principales fonctionnalités de ce serveur concernent : - l intégration et la validation des connaissances sous forme de ressources documentaires générées en format XML ; - l association de métadonnées aux ressources documentaires; - l enregistrement et la pérennité des connaissances nouvellement intégrées dans le serveur ; - la recherche des ressources documentaires selon des métadonnées. 168

Ce composant doit se doter d un mécanisme d identification et d adressage des éléments de connaissances afin d offrir la possibilité d établir des relations entre les fragments de documents et les connaissances référencées au sein de la base de connaissances. Pour se faire, le serveur doit se connecter automatiquement à chaque démarrage, au système de référencement des ressources de connaissances. Plusieurs interfaces doivent donc être utilisées afin réaliser des croisements entre les déclarations des services rendus par le serveur et leur implémentation au sein du composant. Pour que ce serveur assure l organisation des connaissances de façon à les préparer pour une exploitation éventuelle, nous suggérons son implémentation conformément aux standards actuels reconnus par la communauté de l ingénierie documentaire à savoir : - le standard XML pour l echange et l encodage des documents ; - le DOM (Document Object Model) pour la manipulation et le traitement des ressources documentaires ; - XPath et XSL/XSLT pour l adressage et la transformation structurelle des documents XML. 5.5.2.2 La base de connaissances La base de connaissances est le noyau de la mémoire d entreprise car, elle contient les connaissances sémantiques et conceptuelles modélisant le domaine de connaissances. En effet, cette base contient l ontologie formelle écrite en OWL avec l ensemble des raisonnements permis par ce formalisme basé sur les logiques de description. Ainsi, la base de connaissances doit offrir l ensemble des services fondamentaux nécessaires à la gestion de l ontologie: ajout, suppression, modification, recherche, maintien de l intégrité de la base, gestion de la consistance, etc. Au sein de cette base, les connaissances sont représentées en deux parties principales qui sont la T-Box et la A-Box (voir section 2.2.1.1). La TBox contient les concepts qui constituent l ontologie OntoIncident : Incident, Application, Employé, Résolution, etc., tandis que la A-Box contient les déclarations sur les instances en utilisant les termes déclarés dans le vocabulaire ; les individus sont déclarés en leur donnant des noms, et en leur associant des assertions. 169

La notation utilisée dans la base de connaissances peut être une notation réduite avec les lettres A et B pour les concepts atomiques, la lettre R pour les rôles atomiques, et les lettres C et R pour les descriptions des concepts. La syntaxe basique est la suivante : C, D A (Concept Atomique) T (Concept Universel) (Concept Bottom) A (Concept Négation) C П D (Intersection) R, C (Restriction de valeur) R, T (Qualification existentielle limitée) En outre, la base de connaissances est un composant qui permet, grâce au raisonneur, l'inférence de nouvelles connaissances à partir des assertions faites par le concepteur de l'ontologie. Les raisonneurs sont des outils qui utilisent en entrée les connaissances de l'ontologie, et y appliquent des mécanismes de raisonnements. Pour cela, la base de connaissances doit intégrer un raisonneur qui implémente des techniques de raisonnement très expressive avec par exemple, des restrictions sur les nombres, des hiérarchies de rôles, des inversions de rôles et des rôles transitives. En plus de la classification qui est le mécanisme de raisonnement le plus souvent utilisé, il serait intéressant d intégrer d autres mécanismes, tels que le mécanisme des règles par exemple. 5.5.2.3 Le système de référencement Ce système est le moyen qui assure la connexion entre le serveur de connaissances réutilisables et la base de connaissances. Cette connexion est caractérisée par une collection de liens rassemblée en une base de données relationnelle. Ainsi, le système de référencement peut être vu comme un gestionnaire de liens qui a pour rôle essentiel de gérer les relations définies entre les éléments de connaissances contenus dans la base de connaissances et les fragments de documents enregistrés dans le serveur de connaissances réutilisables. 5.5.2.4 Le module d indexation Ce module est responsable d associer automatiquement une liste des concepts de l ontologie à un document ou une partie de document. Son rôle consiste à construire automatiquement l'index des termes en s appuyant sur un algorithme d indexation. 170

Cet index est constitué d'un index principal qui contient les références des documents intégrés dans le système et d un fichier inverse qui contient les termes représentatifs du contenu des documents extraits de l ontologie et des métadonnées décrivant ces documents. De plus quelques balises métadonnées de Dublin Core sont utilisées pour décrire les informations bibliographiques des documents : créateur, date, description, sujet et mots-clés, etc. L'indexation étant l'étape préparatoire pour la recherche dans la mémoire d entreprise, le module d indexation doit se connecter systématiquement à la base de connaissance via le module de traitement de requêtes. 5.5.2.5 Le module de traitement des requêtes Le module de traitement des requêtes est responsable de fournir les résultats pertinents aux requêtes des utilisateurs de la mémoire d entreprise. Il est chargé d analyser et de traiter les requêtes exprimées par l utilisateur afin de construire des requêtes précises. Ces traitements reposent sur la base de connaissances, où le module permet l interrogation du schéma de l ontologie à la fois pour l explorer et pour s assurer de sa cohérence. L interrogation de l ontologie se caractérise donc par deux aspects importants : - la possibilité d interroger ou explorer le schéma aussi bien que le contenu de l ontologie, et ; - le raisonnement sur les concepts et les instances de l ontologie. L exploration du schéma doit permettre d obtenir des informations sur tous les éléments de l ontologie : les concepts, les relations ainsi que les propriétés des relations (symétrique, transitive, inverse). Dans ce contexte, le système Racer (Haarslev et al., 2001) dispose de requêtes prédéfinies comme describe-concept, describe-role, reflexive?, symmetric?, transitive?, feature?, role-domain, role-range, etc. L exploration des instances quand à elle, peut s appuyer sur des langages de requête de type SQL ou RDQL qui offrent plusieurs fonctionnalités pour interroger les instances. Notons aussi que les systèmes issus des logiques de description disposent de fonctionnalités prédéfinies pour interroger les instances décrites dans les ABox. Par exemple, Racer dispose de fonctionnalités telles que retreive-concepts-instances, retreiveindividual-fillers, etc. 171

Certaines requêtes aussi bien sur le schéma que sur les instances peuvent nécessiter la mise en œuvre de mécanismes de raisonnement comme par exemple la classification d un concept dans une hiérarchie, connaître les concepts qui subsument un concept et vice et versa. L exploration et l extraction des données de l ontologie nécessitent des services de type API. 5.5.2.6 L agent de gestion de bases Notes Cet agent peut être vu comme un médiateur entre les bases Lotus Notes et les autres composants du système (base de connaissances, système de référencement, etc.) Plus précisément, il s agit d une base intermédiaire développée sous Lotus Notes dans l objectif de définir les structures de toutes les bases Notes interrogeables par le système. Le rôle de cet agent est de permettre l interrogation simultanée des bases documentaires développées sous Lotus Notes, parce que celles-ci n obéissent à aucune structure standardisée ; il peut y avoir autant de structures de bases documentaires que de bases Notes. 5.6 Synthèse Nous avons voulu montré à travers ce chapitre, qu une méthodologie et un outillage sont indispensables pour soutenir la mise en place d un projet de gestion des connaissances. Dans le contexte de notre étude de cas, l effort de création et de capitalisation des connaissances s est traduit par la définition d une approche de gestion des connaissances appropriée au cas du CIRTIL. Cette approche adaptée à une application industrielle, s appuie principalement sur une ontologie du domaine. Dans cette démarche, il s agit de commencer par l identification des connaissances cruciales et de construire ensuite, une ontologie du domaine relative à ces connaissances cruciales. L ontologie que nous avons élaborée a pour objectif de modéliser et de représenter formellement les connaissances du domaine, mais aussi d indexer et de rechercher d une façon intelligente les connaissances capitalisées. Enfin et pour rendre opérationnelle notre approche, nous avons proposé de matérialiser la démarche de gestion des connaissances par une mémoire collective métier et avons proposé une architecture permettant l intégration de cette mémoire dans l environnement technique de l entreprise. Le point fort de notre proposition réside dans sa dimension pragmatique axée sur les aspects méthodologique et technique. 172

Ces deux aspects n'entraînent pas de modifications majeures de l'entreprise et permettent d avoir des résultats concrets. Aussi, l approche proposée est une approche hybride qui s appuie sur les techniques et méthodes déjà éprouvées et qui vise la gestion simultanée des connaissances tacites et explicites afin de garantir leur pérennité et d en faciliter l accessibilité. Cependant, l inconvénient de cette approche réside dans les difficultés et le coût de l élaboration d une nouvelle ontologie. En effet, la construction d ontologie s effectue selon un processus long et coûteux exigeant l implication effective de la communauté d utilisateurs. Or, dans une entreprise informatique telle que le CIRTIL, il est difficile de faire adhérer les employés au processus de construction de l ontologie. De plus, la construction d une mémoire d entreprise sollicite des avancées scientifiques et technologiques qui permettent de capturer et de capitaliser les connaissances cruciales. 173

6 Prototypage et évaluation Ce chapitre est consacré à la description du prototype que nous avons développé afin de mettre en pratique les idées et les formalismes étudiés dans cette thèse. Ce prototype, implémente l ontologie du domaine «OntoIncident» et l outil de consultation de la mémoire d entreprise «MemConsult». Celui-ci permet d établir la connexion entre l ontologie OntoIncident et les ressources de connaissances de l entreprise. Il est destiné à permettre aux utilisateurs de manipuler et de restituer les connaissances préalablement capitalisées. 6.1 Implémentation de l ontologie OntoIncident L ingénierie ontologique étant un domaine récent, l opérationnalisation d une nouvelle ontologie nécessite l expérimentation de plusieurs outils de construction et de mise en œuvre d ontologies. Cette démarche s avère fondamentale notamment dans le contexte d une application industrielle où le choix des outils dépend fortement des contraintes de l environnement technologique de la firme. De plus, cette phase permet la validation et la vérification de la cohérence de l ontologie formalisée. Dans le cadre de notre projet, l implémentation de l ontologie OntoIncident s est faite avec Protégé, Racer et Sesame que nous présentons dans les sections ( 6.1.3.3) et ( 6.1.3.4). 6.1.1 Le choix du formalisme OWL L objectif de la formalisation d une ontologie est double. La formalisation garantit, d une part, une spécification des connaissances par axiomatisation complète et rigoureuse, et elle facilite l implémentation de l ontologie pour la rendre opérationnelle au sein d un système informatique d autre part. La formalisation consiste en la réécriture de l ontologie informelle avec un langage de haut niveau (Ontolingua, F-Logic ou OWL). Le formalisme que nous avons choisi pour spécifier les connaissances ontologiques et convertir OntoIncident en une ontologie formelle, est le langage OWL. Le choix de ce formalisme s est fait selon les critères énoncés dans la section ( 2.1.3.2.3). Parmi de nombreux formalismes, OWL est un bon candidat en raison notamment de son mécanisme de raisonnement basé sur la logique de description et sa syntaxe supportée par XML. En effet, OWL a ses 174

fondements théoriques dans la logique de description (Baader et al., 2003). Comparé avec d autres formalismes tels que les frames (Natalya et al., 2000 ), la description logique a deux principaux avantages. Le premier avantage concerne sa capacité d exploiter le raisonnement automatique. En se focalisant sur la sémantique, ce formalisme, fournit à des utilisateurs des définitions intentionnelles pour les concepts qui peuvent être exploités par des classificateurs. La description logique ajoute automatiquement une nouvelle classe dans le bon endroit de la taxonomie tout en détectant les héritages et en empêchant la contradiction dans la définition de classes. Le deuxième atout de l utilisation d un formalisme basé sur la logique de description consiste en les références sémantiques communes qui peuvent être partagées et réutilisées dans divers contextes (Knublauch et al., 2003). Par ailleurs, la syntaxe OWL est une extension du vocabulaire de RDF (Resource Description Framework) qui est basé sur XML. Ce dernier étant le standard vers lequel évoluent les applications des entreprises aujourd hui, il nous a semblé judicieux de préférer OWL aux autres langages comme Ontolingua et F-Logic, qui sont peu connus dans le milieu industriel et plus particulièrement en France. 6.1.2 La représentation des connaissances ontologiques avec OWL Une ontologie OWL peut être vue comme un réseau de classes, de propriétés et d individus pour formaliser respectivement les concepts, relations et instances : - les Classes définissent les noms des concepts et leur caractéristiques logiques ; - les Propriétés définissent à la fois les attributs des classes et les relations entre classes. Elles permettent d attribuer des valeurs primitives aux instances. - les Individus sont les instances de classes avec des valeurs déterminées des attributs. L écriture d une ontologie avec OWL est basée sur l utilisation de constructeurs. Des exemples de constructeurs sont rdfs:subclassof, owl:objectproperty. Le premier constructeur permet de relier une classe spécifique à une classe plus générale afin de créer des hiérarchies de classes au moyen d une ou plusieurs déclarations selon lesquelles une classe est une sous classe d une autre. Le deuxième constructeur permet de déclarer des relations entre des classes et par conséquent entre les instances des classes. Grâce à ce constructeur, nous pouvons représenter les liens sémantiques du domaine tel que concerne, déclenche et traite (voir 4.3.3.2.3). 175

6.1.2.1 Les constructeurs de classes et sous-classes La racine de notre ontologie est le nœud «CONCEPT» qui est désigné comme la superclasse de toutes les classes de l ontologie. Le constructeur de déclaration d une classe est : owl:class suivi du nom de la classe : <owl:class rdf:id="nom_de_la_classe">. Ainsi, pour définir la classe CONCEPT, on doit écrire la déclaration suivante : <owl:class rdf:id="concept">. Ensuite, toutes les autres classes de l ontologie sont déclarées comme sous-classes de la classe CONCEPT. Précisons qu avant de déclarer qu une classe est sous-classe d une autre classe, il faut d abord la définir en tant que classe. Dans l exemple suivant nous définissons chacune des classes Processus et Evènement en utilisant le constructeur owl:class, ensuite nous les déclarons comme sousclasses de la classe CONCEPT grâce au constructeur subclassof. <owl:class rdf:id="processus"> <rdfs:subclassof rdf:resource="#concept"/> </owl:class> <owl:class rdf:id="evènement"> <rdfs:subclassof rdf:resource="#concept"/> </owl:class> Le constructeur subclassof a pour rôle de définir la relation de subsumption entre les classes. Il est également considéré comme un axiome sur les classes. En utilisant cet axiome, une classe peut être définie comme une extension d'une autre. Ainsi, pour représenter la taxonomie de la classe Réunion en indiquant ses sous-classes et superclasses, nous avons écrit la déclaration suivante : 176

<owl:class rdf:id="evènement"> <rdfs:subclassof rdf:resource="#concept"/> </owl:class> <owl:class rdf:id="réunion"> <rdfs:subclassof rdf:resource="#evènement"/> </owl:class> <owl:class rdf:id="réunionexterne"> <rdfs:subclassof> <owl:class rdf:about="#réunion"/> </rdfs:subclassof> </owl:class> <owl:class rdf:id="réunioninterne"> <rdfs:subclassof> <owl:class rdf:about="#réunion"/> </rdfs:subclassof> </owl:class> <owl:class rdf:id="réuniontechnique"> <rdfs:subclassof> <owl:class rdf:about="#réunioninterne"/> </rdfs:subclassof> </owl:class> <owl:class rdf:id="réuniondecadres"> <rdfs:subclassof> <owl:class rdf:about="#réunioninterne"/> </rdfs:subclassof> </owl:class> Si la majorité des classes possède des instances, certaines classes sont abstraites, c'est-à-dire qu elles n ont pas d instances directes. Ce type de classes est particulièrement créé pour organiser les autres classes. Ainsi, la classe Evènement est un exemple de classe abstraite, dont l existence est important pour structurer les classes Incident et Réunion. Ces deux classes ne pouvaient être mieux représentées sans la création d une classe qui les rassemble. La déclaration d une classe abstraite se fait de la même manière que les autres classes et, les classes qui lui sont rattachées sont généralement ses sous-classes. Ainsi, la déclaration suivante définit la classe Evènement comme superclasse des classes Incident et Réunion. 177

<owl:class rdf:id="evènement"> <rdfs:subclassof rdf:resource="#concept"/> </owl:class> <owl:class rdf:id="incident"> <rdfs:subclassof> <owl:class rdf:about="#evènement"/> </rdfs:subclassof> </owl:class> <owl:class rdf:id="réunion"> <rdfs:subclassof rdf:resource="#evènement"/> </owl:class> 6.1.2.2 Les constructeurs de propriétés Les propriétés dans OWL désignent aussi bien les attributs des concepts que les relations entre concepts. Pour différencier ces deux types de propriétés, deux constructeurs sont proposés : le constructeur owl :DataProperty est utilisé pour déclarer les attributs d une classe donnée et le constructeur owl:objectproperty pour déclarer une relation entre deux classes. Ainsi, pour déclarer les attributs : Nom_Incident, Etat_Incident, Degré_Gravité et Date_Clôture du concept Incident, il faut écrire la déclaration suivante : <owl:datatypeproperty rdf:id="nom_incident"> <rdfs:domain rdf:resource="#incident"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#string"/> </owl:datatypeproperty> <owl:datatypeproperty rdf:id="etat_incident"> <rdfs:domain rdf:resource="#incident"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#string"/> </owl:datatypeproperty> <owl:datatypeproperty rdf:id="degré_gravité"> <rdfs:domain rdf:resource="#incident"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#string"/> </owl:datatypeproperty> <owl:datatypeproperty rdf:id="date_clôture"> <rdfs:domain rdf:resource="#incident"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#date"/> </owl:datatypeproperty> 178

Remarquons que les types d attributs : chaîne de caractère, entier, date et cardinalités, doivent être définis à ce niveau de la déclaration. En revanche, la représentation formelle des relations d une classe avec d autres classes nécessite l utilisation du constructeur owl:objectproperty. Celui-ci permet de définir toutes les relations de l ontologie dont le type de lien est soit sémantique soit structurel. Pour se faire, il faut d abord annoncer pour chaque relation, le nom de la relation. Ensuite, il faut préciser les propriétés et contraintes de la relation avant d indiquer enfin les classes à relier. Par exemple, pour déclarer que la relation concerne relie la classe Incident à la classe Application on doit écrire : Remarquons que les types d attributs : chaîne de caractère, entier, date et cardinalités, doivent être définis à ce niveau de la déclaration. En revanche, la représentation formelle des relations d une classe avec d autres classes nécessite l utilisation du constructeur owl:objectproperty. Celui-ci permet de définir toutes les relations de l ontologie dont le type de lien est soit sémantique soit structurel. Pour se faire, il faut d abord annoncer pour chaque relation, le nom qui la désigne, ensuite il faut préciser les propriétés et contraintes de la relation avant d indiquer enfin les classes à relier. Par exemple, pour déclarer que la relation concerne relie la classe Incident à la classe Application on doit écrire : <owl:objectproperty rdf:id="concerne"> <rdfs:domain rdf:resource="#incident"/> <rdfs:range rdf:resource="#application"/> </owl:objectproperty> Cette procédure de déclaration est identique pour les relations de type structurel dont un exemple de la représentation d une relation de composition entre les classes Application et Module peut s exprimer comme suit : <owl:objectproperty rdf:id="composé_de"> <rdfs:range rdf:resource="#module"/> <rdfs:domain rdf:resource="#application"/> </owl:objectproperty> 179

La différence apparaît particulièrement au niveau des restrictions et contraintes sur les propriétés (voir 4.1.2.3). Aussi, on reconnaît une relation structurelle à son libellé qui exprime une connotation de composition telle que: composé de, composant de, regroupe, contient, rassemble et fait partie de. A ce titre, notons que nous avons conservé dans la version formelle d OntoIncident les mêmes appellations préalablement attribuées à ce type de relations dans la version informelle. Enfin, et comme il a été noté plus haut, pour définir les relations de subsumption avec OWL, nous n avons pas besoin d un constructeur de propriété. Le lien de subsumption est un lien qui exprime la hiérarchie entre les classes par des relations de type : est-un, sorte de, type de et fils de. De fait, ces relations sont déclarées par le biais du constructeur de classe subclassf. 6.1.2.3 Contraintes logiques et axiomes Rappelons que l une de nos motivations du choix du formalisme OWL est sa puissance d expression basée sur la logique de description. Des contraintes sur les classes et propriétés peuvent être appliquées en utilisant les fonctionnalités offertes notamment par le langage OWL-DL via ses constructeurs qui traduisent des opérateurs et expressions de la logique de description. Par ailleurs, OWL est doté de constructeurs qui permettent d utiliser les structures de restrictions. L application des restrictions permet de poser des contraintes qui s utilisent dans le contexte d un objet : owl:restriction. 6.1.2.3.1 Déclaration de classes complexes Il est possible de créer des classes complexes en utilisant les primitives supportées par OWL-DL. Ces primitives équivalentes aux connecteurs AND, OR, et NOT sont assurées grâce aux restrictions suivantes: intersectionof, unionof et complementof utilisées notamment pour la déclaration de certaines classes complexes. La restriction intersectionof est utilisée pour définir une classe comme un ensemble d'individus qui remplissent toutes les spécifications déclarées comme composantes de l'intersection. Dans l exemple suivant extrait d OntoIncident la définition de la classe Application Bureautique se base sur ce paradigme. 180

<owl:class rdf:id="applicationbureautique"> <owl:intersectionof rdf:parsetype="collection"> <owl:class rdf:about="#application" /> <owl:restriction> <owl:dataproperty rdf:resource="#objectifdutilisation" /> <owl:hasvalue rdf:resource="#traitementbureautique" /> </owl:restriction> </owl:intersectionof> </owl:class> L utilisation de la primitive unionof permet de définir un ensemble d'individus qui remplissent toutes les spécifications déclarées par les composantes de l'union. Ainsi, la meilleure manière pour déclarer que la classe Procédure de Résolution contient à la fois l'extension de classe Procédure Qualité et l'extension de classe Procédure Technique, est d utiliser le constructeur unionof. <owl:class rdf:id="procédurederésolution"> <owl:unionof rdf:parsetype="collection"> <owl:class rdf:about="#procédurequalité"/> <owl:class rdf:about="#procéduretechnique"/> </owl:unionof> </owl:class> 6.1.2.3.2 Axiomes sur les classes Il est également possible d utiliser des axiomes sur les classes. En plus de l opérateur subclassof, permettant de déclarer qu une classe est une extension d une autre classe, deux autres axiomes sont proposés : equivalentclass et disjointwith. L axiome equivalentclass permet de déclarer que la description d'une classe a la même extension que la description d'une autre classe. Deux classes A et B sont équivalentes, si toutes les déclarations qui définissent A définissent aussi B. Alors tous les membres de A sont aussi des membres de la classe B. A l inverse l axiome disjointwith permet de déclarer que deux classes n'ont pas de membres en commun. 181

Pour déclarer qu une propriété entre deux classes est transitive ou symétrique, nous avons utilisé respectivement les constructeurs : TransitiveProperty et SymmetricProperty. Ainsi, la représentation de la relation de transitivité entre les classes Incident et Application est déclarée formellement comme suit : <owl:objectproperty rdf:id="concerne"> <rdf:type rdf:resource="&owl;transitiveproperty"/> <rdfs:domain rdf:resource="#incident"/> <rdfs:range rdf:resource="#application"/> </owl:objectproperty> De la même façon, nous déclarons une relation qui possède une propriété symétrique en utilisant le constructeur SymmetricProperty. <owl:objectproperty rdf:id="déclenche"> <rdf:type rdf:resource="&owl;symmetricproperty"/> <rdfs:range rdf:resource="#causeincident"/> <rdfs:domain rdf:resource="#incident"/> </owl:objectproperty> 6.1.2.3.3 Contraintes sur les valeurs Les quantificateurs logiques,, sont représentés en OWL par les restrictions allvaluesfrom, somevaluesfrom et hasvalues. La première restriction AllValuesFrom, définit un ensemble d'individus, pour lesquels toutes les valeurs de la propriété concernée, sont des instances d'une même classe. Dans l exemple suivant, la restriction allvaluesfrom déclare que pour tous les développements informatiques de la classe DéveloppementInformatique, s ils ont pour propriété effectuepar, les valeurs de cette propriété sont les instances de la classe Développeur. Cela revient à restreindre toutes les valeurs de la propriété effectuepar à être des instances de la même classe. 182

<owl:class rdf:id=" DéveloppementInformatique "> <rdfs:subclassof rdf:resource="#processus"/> <rdfs:subclassof> <owl:restriction> <owl:onproperty> <owl:objectproperty rdf:about="#effectuepar"/> </owl:onproperty> <owl:allvaluesfrom rdf:resource="#développeur"/> </owl:restriction> </rdfs:subclassof> </owl:class> Dans le cas où il s agit de définir un ensemble d'individus qui ont au moins une relation avec une instance d'une classe, il faut employer la restriction somevaluesfrom. Enfin la restriction hasvalues est appliquée aux propriétés. Elle permet de définir un ensemble d'individus pour lesquels la valeur de la propriété concernée est égale à une instance. 6.1.2.3.4 Contraintes sur les cardinalités Il est possible de définir des contraintes sur les cardinalités avec OWL grâce aux trois constructeurs suivants : maxcadinality, mincadinality et cadinality. - Le constructeur maxcadinality définit un ensemble d'individus qui ont au plus N valeurs distinctes de la propriété concernée. En logique de description, elle est représentée par ( nr). Exemple : A-Occurence 2 (au plus une seule valeur). - Le constructeur mincadinality définit un ensemble d'individus qui ont au moins N valeurs distinctes de la propriété concernée. En logique de description, elle est représentée par ( nr) Exemple : A-Occurence 1 (au moins une seule valeur). - Le constructeur cadinality définit un ensemble d'individus qui ont exactement N valeurs distinctes de la propriété concernée. En logique de description, elle est représentée par (=nr) Exemple : A-Occurence = 1 (exactement une seule valeur). 183

6.1.2.4 La déclaration des instances La déclaration des instances avec OWL consiste à créer des individus en instanciant les classes précédemment définies. Il s agit alors de donner des valeurs aux attributs des classes. Ainsi, en attribuant des valeurs aux attributs de la classe Anomalie d Exploitation qui est une sous-classe de la classe Incident nous obtenons l individu suivant : <owl:class rdf:id=" AnomalieDurantExploitation" j.1:directtype="incident" j.0:etat_incident="clôturé, le 07/03/2003 16:50" j.0:concerne="true" j.0:application rdf:id="bcc" j.0:nom_application="application Bureautique BCC : Bureautique Convergente Cirso/cirtil" j.0:version_application="premièreversion" j.0:nom_incident="caractères accentués des titres de la BCC dans Docubase" j.0:degré_de_gravité="nécessite urgence de traitement" j.0:date_de_clôture="05/03/2003 14:04" <owl:class> L attribution des valeurs aux attributs des classes est basée sur le corpus documentaire à partir duquel le contenu de l ontologie a été élaboré. L instanciation de nombreux concepts d OntoIncident est réalisée par Protégé2000 (voir 4.1.3.3). Celui-ci est un éditeur qui permet de saisir les éléments d'une ontologie (concepts, propriétés et instances) dans le langage OWL. Son utilisation a facilité la saisie des connaissances d une façon structurée. Néanmoins, il est souhaitable d avoir un outil permettant l acquisition automatique des instances. 6.1.3 Opérationnalisation de l ontologie OntoIncident L opérationnalisation de l ontologie OntoIncident doit tenir compte de la vérification de la cohérence des connaissances, du stockage de l'ontologie sur un serveur permettant son utilisation et de l'interfaçage de l'ontologie avec les applications existantes. Nous présentons dans ce qui suit, quelques outils dédiés à l implémentation d ontologies et nous mettons l accent sur ceux utilisés pour l implémentation de notre ontologie. Nous décrivons ensuite les principales étapes ayant conduit à l opérationnalisation de l ontologie OntoIncident. 184

6.1.3.1 Quelques outils pour l implémentation d ontologies De nombreux outils de construction d ontologies utilisant des formalismes variés et offrant différentes fonctionnalités ont été développés. Si certains de ces outils sont des éditeurs d aide à la formalisation, d autres sont des serveurs destinés au stockage et à la gestion des ontologies. Par exemple, OntoEdit (Maedche et al., 2000), (OntoEdit) est un environnement de construction d ontologies indépendant de tout formalisme. Il permet l édition des hiérarchies de concepts et de relations, l expression d axiomes algébriques portant sur les relations. Des outils graphiques dédiés à la visualisation d ontologies sont inclus dans cet environnement. OntoEdit intègre un serveur destiné à l édition d une ontologie par plusieurs utilisateurs. Un contrôle de la cohérence de l ontologie est assuré à travers la gestion des ordres d édition. Le problème avec OntoEdit est que la version d évaluation est limitée à un nombre restreint de concepts et relations. Pareillement, Protégé-2000 (Noy, 2000), (Protégé-2000) est un éditeur qui permet de construire une ontologie pour un domaine donné, de définir des formulaires d entrée de données, et d acquérir des données à l aide de ces formulaires sous forme d instances de cette ontologie. Protégé-2000 offre également une librairie Java qui peut être étendue pour créer de véritables applications à base de connaissances en utilisant un moteur d inférence pour raisonner et déduire de nouveaux faits par application de règles d inférence aux instances de l ontologie et à l ontologie elle même (méta-raisonnement). Dans le contexte du web sémantique des «plugin» pour les langages RDF, DAML+OIL et OWL ont été développés pour Protégé-2000. Ces «plugin» permettent d utiliser Protégé comme éditeur d ontologies pour ces différents langages, de créer des instances et les sauver dans les formats respectifs. Il est également possible de raisonner sur les ontologies en utilisant un outil d inférence spécifique basé sur des logiques de description tel que Racer 25 (Haarslev et al., 2001). Celui-ci est un outil qui s intègre facilement à Protégé. 25 http://www.sts.tu-harburg.de/~r.f.moeller/racer/download.html. 185

Contrairement aux deux outils précédemment cités, Ontolingua (Farquhar et al., 2000) est un serveur d édition d ontologies au niveau symbolique 26. Avec cet outil, une ontologie est directement exprimée dans un formalisme également nommé Ontolingua, qui constitue en fait une extension du langage KIF (Knowledge Interchange Format) (KIF, 2002). Le langage Ontolingua utilise des classes, des relations, des fonctions, des objets (instances) et des axiomes pour décrire une ontologie. Une relation (ou une classe) peut contenir des propriétés nécessaires (contraintes) ou nécessaires et suffisantes qui définissent la relation (ou la classe). Ontolingua ne peut être utilisé dans le contexte de notre application comme serveur pour la gestion d OntoIncident compte tenu de la divergence des formalismes Ontolingua et OWL. 6.1.3.2 Choix techniques L implémentation d une ontologie pour une entreprise nécessite le choix d outils adaptés à l environnement technologique de cette entreprise. Pour cela, les critères de choix que nous nous sommes imposés pour le développement d OntoIncident sont relativement liés au contexte particulier du CIRTIL : caractéristiques techniques du SIE, langages de développement maîtrisés par les informaticiens de l entreprise, l aptitude et les compétences des employés par rapport au standard XML, etc. En effet, XML (extensible Markup Language) est l'une des plus grandes avancées de la représentation d information notamment en raison de sa portabilité et sa souplesse. Son utilisation permet de mieux traiter et convertir les informations vers divers formats. Nous avons alors, choisi les outils qui nous permettent d implémenter le contenu de l'ontologie en utilisant la syntaxe XML. Par ailleurs, nous avons privilégié l utilisation d outils universitaires tels que : Protégé-2000, Racer et Sesame. Ce dernier est un outil de gestion d ontologies au format RDF/RDFS, doté d un système d'évaluation de requêtes au format RDQL. La plateforme Eclipse est utilisée pour réaliser tous les développements complémentaires en Java. 26 http://www.ksl.stanford.edu/software/ontolingua/ 186

6.1.3.2.1 L utilisation de Protégé-2000 et du serveur Racer L utilisation de la version 2.0.1 de l éditeur Protégé-2000 avec son nouveau plug-in, a pour objectif de générer un fichier OWL tout en assurant le contrôle de consistance via Racer. Le modèle de connaissances sous-jacent à Protégé-2000 est issu du modèle des frames et contient des classes (concepts), des slots (propriétés) et des facets (valeurs des propriétés et contraintes), ainsi que des instances des classes et des propriétés. La figure 6.1 montre l exemple d instanciation du concept ChefdeProjet. Ce concept est une sous-classe du concept Employé (voir la taxonomie à gauche de la copie d écran). La visualisation des instances de ce concept, permet d afficher à droite de l écran toutes les propriétés du concept avec les valeurs associées. Ces propriétés concernent aussi bien les attributs du concept que ses relations avec les instances d autres concepts. Le fichier OWL généré contient alors les concepts, relations et instances de l ontologie OntoIncident. Figure 6.1 : Edition d OntoIncident avec Protégé-2000 187

Le serveur Racer est utilisé pour la richesse des méthodes de sa bibliothèque (JRacer). C est un fichier exécutable disponible pour Linux et Windows. Il est doté d un moteur d inférence sémantique d enchaînement pour la conception et la gestion des ontologies. Il peut être lancé directement par un invité de commande ou par l icône de programme, et est basé sur une connexion TCP ou http. Un client peut se connecter au serveur Racer via une connexion distante. Pour que Racer puisse effectuer le contrôle de cohérence, il est recommandé de le lancer avant d ouvrir le fichier de l ontologie en format OWL (voir figure 6.2). L exécutable de Racer L exécutable de Protégé Figure 6.2 : Lancement de Racer suivi de Protégé-2000 L avantage de l utilisation de Protégé en lui intégrant Racer est d obtenir une ontologie cohérente. Néanmoins, l utilisation effective de Racer comme serveur de gestion d ontologies s est révélée complexe pour notre étude de cas, d où la nécessité de choisir un autre outil. 188

Nous avons alors choisi Sesame 27 que nous présentons ci-après. Les travaux relatifs au projet On-To-Knowledge (Kiryakov et al., 2002) montrent que Sesame peut permettre d interroger les ressources de connaissances dans le cadre de l exploitation d une mémoire d entreprise. Cela revient à considérer que l intégration de cet outil dans l environnement de développement d OntoIncident, permettrait de présenter aux utilisateurs les connaissances représentées par l ontologie sous forme exploitables et facilement accessibles. 6.1.3.2.2 L outil Sesame Sesame est un outil permettant de stocker des ontologies au format RDFS ainsi que des fichiers d'instances des ontologies au format RDF. Constitué de fichiers JSP (Java Server Page) et de servlets, Sesame nécessite pour fonctionner l'installation de différents outils tels qu'un serveur d'applications, un Système de Gestion de Bases de Données (MySQL) et un driver JDBC permettant à Sesame de dialoguer avec la base de données. Concernant le serveur d applications nous avons opté pour Tomcat, un serveur web open source qui agit comme un conteneur de servlet J2EE. Tomcat implémente les spécifications des servlets et des JSP. C'est le compilateur Jasper qui compile les pages JSP pour en faire des servlet. Le moteur de servlet Tomcat agit souvent en combinaison avec un serveur web Apache ou d'autres serveurs web. Tomcat nécessite pour pouvoir fonctionner, la présence d'une machine virtuelle Java et plus précisément du SDK (Sun Developpment Kit). De fait, Tomcat est totalement portable et peut être mis en œuvre sur différents systèmes (Unix, Linux ou Windows). L outil Sesame permet d interroger une ontologie. Toutefois il est indispensable de pouvoir réaliser ces interrogations d une façon transparente pour l utilisateur. Dans cet objectif nous avons étudié la façon dont était structuré le programme Sesame afin de pouvoir l utiliser dans notre prototype. Une API Client pour Sesame est prévue pour faciliter le développement d applications interagissant et communiquant avec Sesame (package sesame-client.jar ). Cette API permet entre autres d interroger une ontologie grâce à des requêtes RDQL, d ajouter des données dans l ontologie, ou encore de supprimer un répertoire utilisateur. 27 Sesame est téléchargeable sur le site http://sesame.administration.nl. 189

Par ailleurs, pour compléter et améliorer les librairies Java intégrées dans Sesame, nous avons utilisé la plateforme Eclipse développée par Sun system. 6.1.3.3 Les étapes de la mise en œuvre d OntoIncident La mise en place effective de l ontologie OntoIncident s est déroulée selon trois grandes étapes qui sont : le stockage de l ontologie dans l entrepôt de Sesame ; l élaboration des requêtes en RDQL; et la présentation des résultats sous forme exploitable par les utilisateurs. Ainsi, OWL, RDF et RDQL sont utilisés comme des briques complémentaires qui fournissent le support technique qui permettra l opérationnalisation de notre ontologie. Pour ce faire, nous avons utilisé l architecture de Sesame (Broekstra et al., 2002), en particulier les modules fonctionnels : Export Module et Query Module. Pour effectuer des raisonnements, nous recommandons l intégration du raisonneur BOR (Simov et Jordanov, 2002) qui a été intégré à Sesame dans le cadre du projet On-To-Knowledge, afin d effectuer des raisonnements plus poussés. Le raisonneur BOR implémente la sémantique du langage DAML+OIL, et il est donc proche de ce qui pourra être obtenu avec les moteurs d inférence OWL. 6.1.3.3.1 Stockage et validation de l ontologie en format RDF/RDFS Rappelons que la syntaxe d une ontologie OWL est une extension de RDF. Néanmoins, pour stocker OntoIncident dans Sesame, il a fallu l exporter du format OWL vers RDF/RDFS, car ce dernier est le format de stockage admis par Sesame. De plus, bien que l ontologie OWL est un fichier RDF valide, elle ne permet pas de faire les requêtes RDQL probablement parce que l ontologie importée garde des noms de propriétés en OWL et non en RDF tel que owl:class au lieu de rdfs:class. Le processus de stockage d OntoIncident s est fait selon deux phases successives : l exportation suivie de l importation de l ontologie. L exportation est effectuée à partir de Protégé-2000 qui nous permet d'enregistrer l'ontologie au format RDF/XML. Nous avons alors enregistré OntoIncident en deux fichiers séparés avec l extension rdf-xml. Le premier fichier contient le schéma RDF : ontoincident-rdfs-.rdfs et le second contient les instances : ontoincident-rdfs-instances.rdf dont un exemple est illustré par la figure 6.3. 190

Ensuite, nous avons importé l ontologie en format RDF grâce au module Export de Sesame. Le module Export offre les principales fonctionnalités permettant à la fois l exportation et l importation des fichiers RDF/RDFS. En effet, c est la fonctionnalité d importation et d intégration de nouveaux fichiers dans l entrepôt de Sesame qui nous intéresse. Les fichiers à importer sont intégrés via la fonctionnalité Add file, qui permet aussitôt l enregistrement du contenu de l ontologie sur le serveur local de Sesame. <rdf:rdf xmlns:rdf="&rdf;" xmlns:rdf_="&rdf_;" xmlns:rdfs="&rdfs;"> <rdf_:application rdf:about="&rdf_;application_bcc" rdf_:nom_application="bcc" rdf_:version="version1.0" rdf_:date_de_mise_en_exploitation="mai 2004" rdf_:composé_de="module Saisie de Données" rdf_:composé_de="module Edition de Notices" rdfs:label="application_bcc"/> <rdf_:application rdf:about="&rdf_;application_due" rdf_:nom_application="due" rdf_:version="version1.2" rdf_:date_de_mise_en_exploitation="janvier 1998" rdf_:composé_de="module Statistiques" rdf_:composé_de="module Recherche d'informations" rdfs:label="application_due"/> Figure 6.3 : Représentation des instances avec RDF Ensuite, il est possible de vérifier la validité de l ontologie, c'està-dire, vérifier si l ontologie a été correctement importée, grâce à l utilisation de la fonctionnalité Explore. Cette fonctionnalité permet d interroger l entrepôt Sesame soit en saisissant une URI, soit en navigant dans les classes et propriétés de l ontologie. L affichage des données se présente toujours sous forme de tableaux dont l exploration se fait d une façon structurée par des hyperliens. Ainsi, lorsqu on choisi d explorer un élément de connaissances donné, le système affiche d abord la description relative à cet élément en indiquant s il s agit d une classe, une sous-classe, un attribut ou une relation, avant d afficher les autres éléments de connaissances associés. 191

Par exemple, dans le cas où le résultat de la requête est une classe, le système affiche les propriétés de cette classe ainsi que ses sous-classes si elles existent. En revanche, si le résultat de la requête est une relation, le système affiche toutes les instances reliées par cette relation. La requête peut également concerner un attribut d une classe, dans ce cas, le système affiche les valeurs relatives à cet attribut. Dans l exemple présenté par la figure 6.4, nous avons choisi la classe Employé pour explorer l ontologie. Le résultat obtenu indique la superclasse de cette classe, mais aussi ses sous-classes. Ainsi, on peut lire que la classe Employé est une sous-classe de la classe Concept, et que les classes : ResponsabledePole, Developpeur, Assistant et TechniciendExploitation sont les sous-classes de la classe Employé. Aussi, toutes les propriétés de cette classe, qu elles soient des attributs ou des relations (assite-au, effectue, nom_employé, poste_occupé, date_embauche et mail) s affichent. 192

Explore repository Showing statements for: http://a.com/ontology#employé Use resource labels in overview predicate object http://www.w3.org/2002/07/owl#cl ass http://a.com/ontology#concept subject http://a.com/ontology#responsabledepole http://a.com/ontology#developpeur http://a.com/ontology#chefdeprojet http://a.com/ontology#assistant http://www.w3.org/1999/02/22-rdf-syntaxns#type http://www.w3.org/2000/01/rdfschema#subclassof predicate http://www.w3.org/2000/01/rdfschema#subclassof http://www.w3.org/2000/01/rdfschema#subclassof http://www.w3.org/2000/01/rdfschema#subclassof http://www.w3.org/2000/01/rdfschema#subclassof http://a.com/ontology#techniciendexploitation http://www.w3.org/2000/01/rdfschema#subclassof http://a.com/ontology#assiste_au http://www.w3.org/2000/01/rdfschema#domain http://a.com/ontology#effectue http://www.w3.org/2000/01/rdfschema#domain http://a.com/ontology#poste_occupé http://www.w3.org/2000/01/rdfschema#domain http://a.com/ontology#nom_employé http://www.w3.org/2000/01/rdfschema#domain http://a.com/ontology#date_embauche http://www.w3.org/2000/01/rdfschema#domain http://a.com/ontology#mail http://www.w3.org/2000/01/rdfschema#domain Figure 5.4: Exemple d affichage des résultats dans Sesame. L exploration de chaque propriété aboutit à l affichage des valeurs associées. Ainsi, un simple clique sur la propriété effectue donne le résultat suivant : 193

Showing statements for: http://a.com/ontology#effectue Use resource labels in overview Predicate Object http://www.w3.org/1999/02/22-rdf-syntaxns#type ctproperty http://www.w3.org/2002/07/owl#obje http://www.w3.org/2000/01/rdfschema#domain http://a.com/ontology#employé http://www.w3.org/2000/01/rdfschema#range http://a.com/ontology#tâche subject http://a.com/ontology#gregorie_brauge http://a.com/ontology#thierry_berger http://a.com/ontology#nicolas_sabatier http://a.com/ontology#noemie_dacosta Object http://a.com/ontology#pilotageduproje t http://a.com/ontology#traitementincid ent http://a.com/ontology#traitementincid ent http://a.com/ontology#suividucourrie r Figure 6.5 : Affichage des résultats de la propriété «effectue». Constatons que le système propose d abord une description de l élément effectue qui est déclaré comme ObjectProperty, c'est-à-dire une relation entre les classes Employé et Tâche, où Employé est la classe source (domain) et Tâche est la classe destinataire (range) (cf. figure 6.5). Ensuite, le système affiche toutes les instances reliées par cette relation. Ainsi, nous pouvons concelure que l instance Gregorie_Brauge de la classe Employé effectue le PilotageDuProjet qui est une instance de la classe Tâche, et que Thierry_Berger effectue la tâche TraitementIncident et ainsi de suite. Pour explorer une instance, il suffit d activer le lien afin de visualiser les connaissances relatives à cette instance. Ainsi, en cliquant sur l instance Gregorie_Brauge, nous obtenons l ensemble des propriétés et des valeurs relatives à cette insatnce (cf. figure 6.6). 194

Predicate http://www.w3.org/1999/02/22-rdfsyntax-ns#type http://a.com/ontology#effectue Object http://a.com/ontology#chefdeprojet http://a.com/ontology#pilotageduprojet http://a.com/ontology#date_embauche "12/09/1998" http://a.com/ontology#assiste_au http://a.com/ontology#assiste_au http://a.com/ontology#mail http://a.com/ontology#poste_occupé http://a.com/ontology#gere http://a.com/ontology#nom_employé http://a.com/ontology#reuniondequipe http://a.com/ontology#reunionducomit esnp "gregorie.brauge@urssaf.fr" "Développeur d applications" http://a.com/ontology#ces "Grégorie BRAUGE" Figure 6.6 : Affichage des résultats de l exploration de l instance «Gregorie_Brauge» 6.1.3.3.2 L élaboration des requêtes en RDQL Une fois l ontologie enregistrée sur le serveur local en format RDF/RDFS, Sesame nous donne la possibilité de lui soumettre des requêtes en RDQL (RDF Data Query Language) 28. Celui-ci est un langage d interrogation pour RDF qui certes ne fournit aucune inférence, mais donne des réponses selon les données présentes dans l ontologie. L objectif de l utilisation d un langage de requêtes pour l interrogation de l ontologie est d offrir aux utilisateurs le moyen de faire des recherches en introduisant des mots-clés. La navigation et l exploration conceptuelles ne peuvent être les seuls modes de manipulation des connaissances enregistrées dans une mémoire d entreprise. De plus, les habitudes de recherche d information les plus pratiquées par les employés du CIRTIL sont celles qui consistent à saisir quelques mots en langage naturel via un moteur de recherche. Il est donc nécessaire de créer au préalable des requêtes qui tiennent compte des différentes formulations cognitives que pourrait formuler l utilisateur final. 28 http://www.w3.org/submission/2004/subm-rdql-20040109/ 195

Avec Sesame, il est possible de créer des requêtes RDQL qui proposent des fonctions basiques, à savoir un SELECT suivant un ensemble de conditions et il est également possible d'utiliser FROM pour interroger un ensemble de sources RDF. Ainsi, une requête RDQL peut être formulée comme suit : SELECT?x WHERE (?x,<#nom_application>, «BCC») Ce langage de type SQL permet d effectuer des recherches selon différents modes. Par exemple, on peut rédiger des requêtes simples visant la recherche des attributs ou des instances d un concept donné. On peut également rédiger des requêtes plus complexes qui consistent à rechercher un ensemble de concepts reliés entre eux. Pour cela, RDQL fonctionne en comparant le modèle de la requête à chacun des triplets dans l ontologie RDF/RDFS (subject, predicate, object) ce qui correspond à : ressource, propriété, valeur. Pour identifier les incidents ayant affecté l application «BCC», il faut écrire la requête RDQL suivante : SELECT?Nom_Incident,?Etat_Incident,?Degré_de_Gravité,?Date _de_clôture,?nom_application,?date_de_mise_en_exploitation,?ve rsion WHERE (?x,<http://www.w3.org/1999/02/22-rdf-syntaxns#type>,<http:cirtil/ontoincidentrdfrdfs.rdfs#application>,(?x, <http: cirtil/ ontoincident-rdfs.rdfs#bcc>, (?x,<http://cirtil/ontoincident-rdfs.rdfs#concerne>,? Incident)(?x,incident,<http://cirtil/ontoincidentrdfs.rdfs#Nom_Incident>,? Nom_Incident)(?x,incident,<http://cirtil/ontoincident -rdfs.rdfs#etat_incident>,? Etat_Incident) (?x,incident,<http://cirtil/ontoincidentrdfs.rdfs#degré_de_gravité>,? Degré_de_Gravité)(?x,incident,<http://cirtil/ontoincide nt-rdfs.rdfs#date_de_clôture>,? Date_de_Clôture) (?x,application,http://cirtil/ontoincidentrdfs.rdfs#nom_application>,? Nom_application) (?x,application,<http://cirtil/ontoincidentrdfs.rdfs#date_de_mise>,?date_de_mise_en_exploitation) (?x,application,<http://cirtil/ontoincidentrdfs.rdfs#version>,? Version) Figure 6.7 : Exemple d une requête RDQL. 196

Les résultats obtenus sont rassemblés grâce à des variables de la forme?nom_de_variable. Chaque variable peut jouer le rôle de ressource, propriété ou valeur selon son emplacement dans l'énoncé modèle. Ces résultats s affichent en une liste de tuples correspondant aux critères de requêtes, qui sont des éléments du graphe RDF d'origine. La figure 6.8 présente un exemple d affichage des résultats de la requête formulée cidessus. Query results: Nom_Incident Etat_ Incident Degré_ Gravité Date_ Clôture Nom_ Application Date_ Exploitation Version Anomalie dans le code Clôturé Moyen 11/09/04 BCC Mai 2004 1.0 Problème de génération de notices Clôturé Faible 17/09/04 BCC Mai 2004 1.0 Figure 6.8 : Exemple d affichage des résultats d une requête RDQL Notons aussi que Sesame offre le moyen de vérifier si la requête est correctement écrite et ce grâce à la fonction d évaluation de requêtes. Ceci passe par des appels à des servlets prédéfinies. Ainsi, dans le cas où la requête est syntaxiquement mal formulée, un message d erreur s affiche en bas de l écran pour signaler que la requête est incorrecte. 6.1.3.3.3 La recherche dans Sesame via un formulaire HTML La recherche dans Sesame peut s effectuer via un formulaire HTML. L objectif est de présenter à l utilisateur final un moyen simple permettant la saisie de requêtes et leur envoi vers le serveur de l ontologie, sans recourir à la syntaxe RDQL. Pour se faire, il est possible de créer une page web basée sur JSP (Java Server Pages) qui reprend les mêmes requêtes précédentes et les exécute automatiquement. En effet, une page JSP permet d écrire des pages hybrides HTML/Java (comme PHP). Les pages JSP doivent être placées dans un module web correctement construit afin d'être exécutable directement depuis l'outil Sesame. 197

Lors de sa première invocation, une page JSP est interprétée et traduite en servlet. Le résultat (servlet source et classe) est placée dans un répertoire du système et après chaque mise à jour d un fichier *.jsp, la classe servlet est recompilée. Pour traiter les requêtes, les pages JSP peuvent utiliser les fonctionnalités de la classe javax.servlet. On a à disposition certains objets sous forme de variables, par exemple : request, de la classe javax.servlet.http.httpservletrequest out, de la classe javax.servlet.servletoutputstream response, de la classe javax.servlet.http.httpservletresponse A titre d expérimentation, nous avons créé un formulaire simple basé sur JSP ontoincident.jsp que l utilisateur pourrait consulter via un navigateur Web. Ce formulaire permet à un utilisateur lambda, tel qu un employé du CIRTIL, d introduire quelques mots libres afin d effectuer une recherche sur le serveur local de Sesame. Les résultats s affichent alors sous forme d un contenu XML généré dynamiquement grâce à l'exécution du fichier ontoincident.jsp. L amélioration de cette interface ainsi que la visualisation des résultats des requêtes selon des feuilles de style de type XSLT, nécessitent des développements importants qui tiennent compte de l ergonomie du système à mettre en place ainsi que les attentes des utilisateurs ; des aspects que nous abordons dans la section suivante. 6.2 L outil MemConsult Pour utiliser d une façon effective l ontologie formelle décrite précédemment, nous avons développé un outil permettant la manipulation des connaissances capitalisées 29. Cet outil appelé «MemConsult» peut être vu comme une interface établie entre l utilisateur final, l ontologie du domaine et les documents supports de connaissances. Sur le plan conceptuel, le développement de cet outil repose sur le modèle S 3 décrit dans la section ( 4.3.3.2). Sur le plan technique, nous avons opté pour les outils utilisés habituellement au CIRTIL tels que MySQL, PHP et Apache. 29 Il s agit d un outil prototype réalisé avec S.Verschelde dans le cadre de son PFE, en juillet 2004 au LIRIS. 198

6.2.1 La conception des interfaces utilisateurs L implémentation de l outil MemConsult se focalise sur la conception d une interface de consultation des connaissances qui sont formalisées sous forme de documents. La conception de cette interface repose sur notre hypothèse de recherche (Bahloul et al., 2003). Celle-ci stipule qu une interface où seraient exploités des concepts reliés entre eux par plusieurs types de liens fournit davantage de réponses pertinentes aux requêtes de l'utilisateur. L objectif est de proposer aux futurs utilisateurs de la mémoire métier, une interface offrant l accès aux ressources de connaissances selon trois points de vue différents : une vue hiérarchique, une vue structurelle et une vue sémantique. Ainsi, la création de cette interface est basée sur le principe de structuration des connaissances selon les types de liens qui constituent le modèle S 3. Par exemple, si l utilisateur souhaite connaître les causes d un incident donné, il est intéressant que l interface utilisateur lui permette de s orienter instantanément vers les ressources recherchées. La modélisation que nous proposons offre en effet grâce à la vue sémantique, le moyen de récupérer efficacement les connaissances pour ce type de requêtes. Cette façon de restitution des connaissances est plus avantageuse pour les employés du CIRTIL qu une arborescence de concepts avec différents niveaux de profondeur. La conception de l interface de consultation des documents est réalisée en respectant certaines contraintes. Ainsi, bien que l interface à concevoir correspond au modèle théorique énoncé plus-haut, elle doit se présenter à l'utilisateur final d une façon relativement simple. Pour cela, cette interface doit être réalisée sous forme de pages dynamiques visualisables dans un navigateur Web. Par ailleurs, le prototype doit prendre en compte la diversité des types de documents et permettre l accès aux fragments de documents. Cette contrainte exige la migration des documents vers le format XML, car dans la configuration actuelle, seuls les documents en format HTML permettent d'accéder directement à une section précise du document. La troisième contrainte consiste, à assurer une indépendance de la structure interne du prototype vis-à-vis du domaine d'application. L objectif visé est de pouvoir utiliser ce prototype dans des domaines autres que la gestion des documents relatifs aux incidents informatiques. 199

En termes de fonctionnalités permises par cette interface, nous avons prévu d offrir aux utilisateurs habilités, l opportunité d effectuer d autres tâches que l exploration du contenu de la mémoire d entreprise. Ces tâches s articulent autour de l indexation et de l intégration de nouvelles connaissances. Dans (Bahloul, 2005) nous proposons que la méthode d indexation soit semi-automatique ; c'est-à-dire effectuée par un humain (le spécialiste du domaine) qui utilise un outil capable de lui proposer les concepts pertinents. Cet outil, devrait grâce à l algorithme d indexation proposé, permettre l association des concepts de l ontologie aux documents (ou fragments de documents). Cependant, dans le cadre de ce prototype nous avons commencé par la fonctionnalité «recherche de documents» basée sur les concepts en considérant la proximité sémantique entre les documents. Cette proximité sémantique rappelons-le, repose sur la structuration des connaissances selon les types de liens. 6.2.2 Le schéma de la base de connaissances La base de connaissance utilisée dans le cadre de ce prototype regroupe les concepts, les relations, les instances et les références vers les documents et les fragments de documents selon le schéma présenté en annexe 3. Ces connaissances sont enregistrées dans des tables, car la base de connaissnaces est une base relationnelle. En effet, pour des raisons pragmatiques qui visent la rapidité de mise en œuvre et la validation de l outil, nous avons stocké les connaissances dans une base MySQL. Les tables "concept" et "relation_cc" contiennent la liste des concepts de l'ontologie, et leurs relations. Les tables "instance" et "relation_ii" contiennent les instances, leurs attributs, et leurs relations. Dans les tables "document" et "fragment", nous enregistrons les noms et chemins des documents ou fragments de documents dont le contenu est indexé par les concepts de l ontologie. La table "résultats" est une table au contenu temporaire, utilisée uniquement à des fins de tri des résultats dans la recherche de documents. Elle est vidée à chaque ouverture ou rafraîchissement de la page d'affichage de la liste des documents et remplie aussitôt à nouveau (voir 4.2.3). Enfin, nous avons intégré des tables qui contiennent des informations pour l application de quelques règles d inférence tel que l héritage. Nous présentons le contenu de chacune de ces tables ci-après : 200

- La table "concept": c'est dans cette table que sont enregistrés les concepts de l'ontologie, ainsi que les relations de composition et d'héritage. - La table "relation_cc": le nom de cette table signifie relation entre un concept source et un concept destinataire (par opposition à "relation_ii", qui indique les relations entre les instances). Dans cette table sont stockées les relations sémantiques entre concepts. Elles sont de la forme "ConceptA en_relation_avec ConceptB". Les relations sont à sens unique, c'est pourquoi pour pouvoir parcourir les relations dans les deux sens, il est nécessaire d'ajouter la relation "ConceptB en_relation_reciproque_avec ConceptA". Par exemple, si l on définit la relation "Pôle" emploie "Employé", il faut aussi définir une relation "Employé" est_employé_par "Pôle". L insertion de relations sémantiques réciproques se fait par le biais du champ id_reciproque. Exemple: INSERT INTO relation_cc VALUES (10, 8, 6, 'emploie', 9); INSERT INTO relation_cc VALUES (9, 6, 8, 'employe_par', 10); - La table "document", contient les noms, chemins et types des documents. Parmi les champs de cette table; citons le champ type qui est affiché à l'utilisateur lors de la présentation de la liste des documents obtenus: PDF, HTML, WORD, XML. Signalons que le type est important notamment pour les documents HTML, pour lesquels les fragments sont gérés. Exemple : INSERT INTO document VALUES (100, 'Procédure ACTIONS CORRECTIVES ET PREVENT', 'docs/procedure/pr_cer69_qua_4-14_a-01.htm', 'HTML'); - La table "fragment" contient les noms et position des parties de documents. Dans l'idéal, les documents seraient tous dans un format structuré tel que XML par exemple. Ainsi, si la position d'un fragment est "fragment1" et l'url du document auquel il appartient "docs/documentx.html", l'url du fragment sera "docs/documentx.html#fragment1". - Les tables "lien_cd", "lien_cf", "lien_id" et "lien_if" permettent l'indexation des documents et fragments de documents par les concepts et les instances. Ainsi, la table "lien_cd" permet d identifier un lien d'indexation entre un concept et un document, la table 201

"lien_cf" permet de faire le lien d'indexation entre un concept et un fragment de document, la table "lien_id" permet de faire un lien d'indexation entre une instance et un document et enfin la table "lien_if" sert à identifier le lien d'indexation entre une instance et un fragment de document. 6.2.3 L exploration selon les types de liens Le mode d exploration de la mémoire métier proposé aux employés du CIRTIL, est la navigation conceptuelle. Cette navigation est basée sur les types de liens accessibles par des vues. Dans cette présentation, l utilisateur accède alors par l une des trois vues qui lui sont proposées dans le menu à gauche de l interface. Le choix d une vue plutôt qu une autre dépend de la requête de l utilisateur. Par exemple, si l objectif visé par la requête est de connaître les éléments qui constituent une machine, l utilisateur choisira la vue structurelle, car c est cette vue qui offre l accès aux connaissances reliées par le lien de composition. Lorsque l utilisateur sélectionne une vue, le système affiche à droite de l écran l ensemble des concepts de l ontologie tout en mettant en évidence le type de lien qui correspond à la vue sélectionnée. Cette distinction est volontairement exprimée par des couleurs différentes (cf. figure 6.9 et figure 6.10). L exploration de la mémoire métier se fait en trois étapes qui sont : - la sélection du concept de la requête ; - la sélection de l'instance de ce concept ; - la visualisation des relations et l affichage de la liste des documents. 202

Figure 6.9 : Exploration des connaissances via le vue structurelle MemConsult Figure 6.10 : Exploration des connaissances via le vue sémantique 203

Au cours de la première étape, la sélection du concept de la requête se fait à partir du fichier concepts.php et du répertoire pageconcepts. Le fichier concepts.php correspond à la page appelée automatiquement lorsque l utilisateur ouvre la page d'accueil index.php. Ce fichier ne fait qu'inclure les fichiers qui lui sont nécessaires, depuis le répertoire pageconcepts. Il appelle aussitôt le fichier concepts2.php, lequel affiche la structure de la page, les menus (Vues et Admin), et appelle ensuite l'un des trois fichiers suivants, pour l'affichage de la liste des concepts et de leurs relations, selon la vue sélectionnée : vue_semantique.php, vue_structurelle.php, vue_subsomption.php. La liste des concepts, organisée selon leurs relations, est présentée à l'utilisateur, lequel doit sélectionner le concept par lequel il veut démarrer sa recherche. Lors d'un clic sur un concept, le relais est passé au fichier instances.php. La sélection de l'instance se fait alors dans le fichier instances.php et le répertoire pageinstances.php. Le fichier instances.php appelle instantanément le fichier instances2.php, lequel affiche la structure de la page, les menus (concept sélectionné et sélection). Il appelle ensuite filtres.php pour l'affichage des filtres et la construction de la requête de sélection et result_sel_instance.php pour l'affichage et la gestion du tableau contenant la liste des instances remplissant les conditions des filtres de sélection. La liste des instances du concept sélectionné est présentée à l'utilisateur, lequel peut trier la liste selon l'attribut de son choix, et appliquer des filtres sur les attributs des instances : tel attribut (de type 'string') contient telle et telle chaîne de caractère, tel attribut (de type 'date') est antérieur au 20 juillet 2003, etc.) Il doit ensuite sélectionner l'instance de son choix, telle que «erreur save gdp2». Un exemple de la page qui s affiche pour l utilisateur est présentée en figure 6.11 à travers la copie d écran de l outil MemConsult. 204

Figure 6.11 : Page de filtrage et d affichage des instances Dans le cas où le concept sélectionné n'a aucune instance, le fichier noinstance.php est donc appelé à la place des deux fichiers : filtres.php et result_sel_instance.php. Lorsqu'une instance est sélectionnée, le relais est passé à documents.php. C est alors, que les documents indexés par le concept de la requête sont affichés dans leurs formats natifs (cf. figure 6.12). 205

MemConsult Figure 6.12 : Affichage des documents et visualisation des relations 6.2.4 Les règles d'inférence Le mécanisme d'inférence que nous avons défini, a pour but la déduction de nouvelles relations entre les instances. Pour commencer, des règles doivent être créées, précisant d'une part les conditions d'application de la règle, et d'autre par les conséquences pour les instances qui remplissent les conditions. Un exemple de règle d inférence, peut être de déduire une relation sémantique entre deux concepts A et B, à condition que A et C soient reliés par une relation sémantique et que C soit un composant de B. La relation sémantique à établir entre A et B doit être la même que celle qui existe entre A et C. Ainsi, l application de cette règle aux trois concepts : Incident, Tâche et Activité peut se traduire comme suit : «Si un Incident affecte une Tâche, et que cette Tâche est une composante d'une Activité, alors, il le système peut en déduire que Incident affecte Activité.» 206

Ensuite, l'activation d'une règle ne peut se faire qu'à une seule occasion : lorsqu'une instance est sélectionnée, et ce, dans le but de voir les documents qui lui sont associés. Les règles candidates susceptibles d'avoir des conséquences sur l'instance sont alors sélectionnées. Selon l exemple ci-dessus, dans le cas où l'instance sélectionnée est une instance du concept Incident ou du concept Activité, la règle citée ci-dessus est une règle candidate. Puis, pour chacune des règles candidates, le système vérifie si l'on peut trouver un jeu d'instance qui remplisse les conditions, sachant que l'on connaît déjà l'une des instances ainsi que son rôle dans les conditions (il s agit de l'instance déjà sélectionnée). Ainsi, pour une instance du concept Incident, on sait déjà que cette instance doit être en relation «affecte» avec une instance du concept Tâche. Le système commence donc par chercher les instances du concept Tâche qui remplissent cette condition. Puis, pour chacune de ces instances, on cherchera si elles sont en relation «est composant de» avec une instance du concept Activité. Toujours selon cet exemple (où l'instance sélectionnée est une instance du concept Incident), pour tous les triplets d'instances des concepts Incident, Tâche et Activité que l'on aura ainsi obtenus, une relation entre l'instance du concept Incident et l'instance du concept Activité sera créée en mémoire. Lors de l'affichage des documents liés à l'instance sélectionnée, ces nouvelles relations seront parcourues, et les documents liés aux instances concernées par ces nouvelles relations seront affichés. 207

Conclusion générale Les propositions préconisées dans cette thèse, sont essentiellement issues des travaux relatifs à la capitalisation des connaissances et leur représentation par les ontologies. Elles répondent à la problématique complexe de gestion des connaissances constatée au sein de l entreprise d accueil, le CIRTIL dont l objet a été exposé dans le chapitre 3. L idée principale que nous avons défendue à travers notre proposition, incite à l utilisation des ontologies comme modèle central pour la gestion des connaissances de l entreprise. Nos arguments pour cette approche se sont basés sur le rôle même des ontologies et leur capacité de prendre en compte de nombreuses opérations constituant le processus de gestion des connaissances, telle que la représentation formelle des savoirs, l explicitation des savoir-faire, le raisonnement et déduction de nouvelles connaissances, l indexation, la recherche sémantique et le partage des connaissances. Ainsi, nous avons suggéré de bâtir une mémoire d entreprise métier autour d une ontologie du domaine modélisant les incidents informatiques. Comparée aux méthodes de modélisation des connaissances existantes (REX, CommonKADS, MASK,...), une ontologie du domaine fournit un système de concepts fondamentaux qui constituent les connaissances d arrière-plan d une base de connaissances. Comme nous l avons démontré dans le chapitre 2, l ontologie offre en effet, une conceptualisation du domaine permettant de construire une base de connaissances partageable et utilisable fondée sur un vocabulaire consensuel nécessaire à la représentation des connaissances du domaine selon différents points de vue. Notre proposition est confortée par certains travaux concluants ayant exploité les ontologies dans la gestion des connaissances. Nous avons précisé dans la première partie de cette thèse que la gestion des connaissances basée sur les ontologies a déjà fait l objet de quelques applications dont O Comma (Comma, 2000) et Ontobroker (Fensel et al., 1998) sont un bon exemple. Ces travaux ont fortement consolidé nos réflexions concernant l usage de l approche ontologique pour la gestion des connaissances de l entreprise. 208

Néanmoins, étant donné l importance que nous accordons à la question du repérage des connaissances cruciales, nous avons enrichi notre proposition en adoptant la méthode «Gameth» décrite dans (Grundstein, 2002). Cette méthode a fourni un cadre facilitant l identification des connaissances cruciales du CIRTIL notamment en amont de la conception de la mémoire d entreprise. Par ailleurs, pour compléter notre approche, nous avons suggéré l utilisation des techniques et méthodes issues de l ingénierie documentaire pour la gestion des connaissances. En effet, le paradigme documentaire propose d enrichir les connaissances grâce notamment aux balises formelles de description du contenu (Bachimont, 2004). Les réalisations concrètes que nous avons effectuées pour le CIRTIL sont décrites dans la deuxième partie de ce travail. Rappelons que nous avons : - identifié les connaissances cruciales du CIRTIL, ce qui ne semblait pas être une préoccupation majeure pour l entreprise. Grâce à ce repérage, les connaissances cruciales qu il est nécessaire de capitaliser sont aujourd hui connues, notamment par les dirigeants du CIRTIL ; - modélisé ces connaissances et créé une ontologie formelle permettant la représentation des incidents informatiques ; - proposé un modèle de structuration des connaissances de l ontologie selon trois vues sémantiques complémentaires. La validation de ce modèle s est accomplie à travers deux publications (Bahloul et al., 2003) et (Bahloul et al., 2004a) ; - proposé de concrétiser la gestion des connaissances par la conception d une mémoire d entreprise autour d une ontologie du domaine, et avons défini l architecture fonctionnelle de cette mémoire d entreprise ; - développé un outil prototype implémentant l ontologie du domaine et le modèle sémantique de structuration des connaissances. Le test de cet outil auprès des utilisateurs a permis une expérimentation de l utilisation de l ontologie pour l exploitation de la mémoire d entreprise. 209

Sur le plan opérationnel, bien que ce travail soit destiné à pallier la problématique particulière d une entreprise informatique notamment, en termes d application des résultats, la démarche de traitement de cette problématique peut être généralisée. Nous pensons par exemple que les recommandations énoncées dans le chapitre 4 peuvent être appliquées à d autres projets de gestion des connaissances. Nous tenons à préciser à cet effet, que l étude du cas du CIRTIL, fournit un bon exemple à la recherche et permet ainsi de mieux appréhender la problématique de gestion des connaissances dans le milieu industriel. En dépit de l intérêt que pourrait avoir notre approche, nous sommes conscients de ses limites : - Dans ce travail, nous avons axé nos recherches sur les aspects de modélisation et de représentation des connaissances. Nous avons pour projet de continuer à étudier plus amplement les aspects d exploitation et de réutilisation des connaissances et à travailler la partie restitution des connaissances et interfaces utilisateurs. Aussi, nous pensons qu il serait intéressant d intégrer d autres mécanismes de raisonnement, tels que le mécanisme des règles par exemple. En effet, le raisonnement à base de règles offre un cadre déclaratif pour exprimer des connaissances procédurales en permettant de voir clairement les conditions dans lesquelles une règle est applicable. De plus, le fait que la connaissance soit exprimée de façon uniforme par des règles et des faits ; ces règles et faits étant indépendants, la base est modulaire et facilement modifiable (Marino-Drews, 1992). - Nous avons défini dans le chapitre 5 la méthode d indexation et mis l accent sur le rôle de l indexeur. Nous avons également, insisté sur l utilisation d un outil d aide à l indexation des ressources de connaissances par l ontologie, capable de lui proposer les concepts de l indexation et de relier ces concepts aux documents. Nous envisageons d approfondir l étude sur les caractéristiques de cet outil et d améliorer l algorithme d indexation. Par ailleurs, nous envisageons d étudier les moyens d inciter les employés à utiliser cet outil. - La méthode de repérage des connaissances cruciales que nous avons employée est utile notamment au lancement du projet de capitalisation des connaissances, mais nous pensons qu il serait intéressant de mettre en place un dispositif qui permettrait l intégration des connaissances 210

cruciales par les employés eux-mêmes d une façon systématique. Nos premières réflexions à ce sujet s orientent vers l élaboration d un modèle de signalement des connaissances réutilisables. La notion de connaissances réutilisables signifie que certaines connaissances possèdent une importance particulière pour une tâche donnée par exemple, et que par conséquent, ces connaissances sont susceptibles d être réutilisées. Ce modèle devrait intégrer la notion de contexte afin de représenter par exemple les aspects primordiaux du contexte d'un repérage des connaissances tels que les tâches professionnelles et les thèmes choisis par l'utilisateur. Dans le contexte du CIRTIL un thème peut être : une méthode de conception, un langage de programmation, etc. Le modèle devrait permettre la description du nouveau contexte d utilisation ainsi que les conditions dans lesquelles seront exploitées les connaissances repérées. Aussi, il est souhaitable que l expression formelle de ce modèle soit compatible avec l ontologie du domaine. 211

Bibliographie (Abecker et al., 1998) Abecker A., Bernardi A., Hinkelmann K., Kuhn O., et Sintek M., Toward a technology for organizational memories. IEEE Intelligent Systems, May/June 1998. (Accart et Réthy, 1999) Accart J.P., Réthy, M. Le Métier de documentaliste. Paris : Éd. du Cercle de la librairie, 1999. 382 p. ISBN 2-7654-0744-4 (Aciege, 2003) (Actes, 1999) (Afnor, 1985) (Afnor, 1993) Aciege. Thésaurus du management : Liste des champs sémantiques et schéma fléchés (tome 1). Jouy-en-Josas : Association des responsables des centres d information des écoles de gestion, 2003. ISBN : 2-9512305-7-5 Actes du Colloque. Terminologie et intelligence artificielle (actes du colloque de Nantes, 10-11 mai 1999). In : Rint, Réseau international de néologie et de terminologie, N 19, 1999. Disponible en ligne : http://www.cfwb.be/franca/termin/charger/rint19.pdf (consulté le 04/11/2006) Association Française de la Normalisation. «Vocabulaire de la documentation» Les dossiers de la normalisation. Paris : AF- NOR, 1985. Association Française de la NORmalisation. Information et documentation ; Principes généraux pour l indexation des documents. NF Z 47-102. Paris : AFNOR, 1993. 212

(Alavi et Leidner, 2001) (Amous et al., 2003) (Amous et al., 2004) Alavi, M. et D. E. Leidner (2001). "Review : knowledge management and knowledge management systems : conceptual foundation and research issues." MIS Quarterly, Vol. 25, N 1, pp. 107-136. Amous I., Jedidi A., et Sedes F. Documents semi-structurés et métadonnées. Contribution à la réingénierie de collections de documents. Ingénierie des Systèmes d'information, décembre 2003, Vol. 8, N 5-6, p. 153-172. Amous I., Jedidi A., et Sedes F. Contribution à la modélisation et à l'interrogation de documents multimédia par les métadonnées In actes d Inforsid, Biarritz, France, pp 407-422. (Aussenac-Gilles et al., 2000) (Authier et Lévy, 1992) (Azouazou et al., 2003) (Baader et al., 2003) (Bachimont, 2000) Aussenac-Gilles N., Biébow B et Szulman S. Revisiting Ontology Design: a Method based on Corpus Analysis. In Proceedings of the conference EKAW 2000, LNCS, 2000, volume 1937, pages 172 188. Authier M., Lévy P. Les arbres de connaissances. Paris : Editions La découverte, 1992, 169 p. (Les cahiers libres) Azouaou F., Desmoulins C., Mille D., Formalisme pour une mémoire de formation à base d annotations : articuler sémantique implicite et explicite, Actes de la conférence Environnements Informatiques pour l'apprentissage Humain EIAH, Strasbourg, 15-17 avril 2003, Paris, INRP, p. 43-54. http://archiveseiah.univ-lemans.fr/eiah2003/pdf/n008-137.pdf Baader, F., Calvanese, D., McGuineness, D., Nardi,D., Patel- Schneider, P. The Description Logic Handbook. Cambridge : Cambridge University Press, 2003, 555 p. Bachimont B. Engagement sémantique et engagement ontologique : conception et réalisation d ontologies en ingénierie des connaissances. In Ingénierie des connaissances : évolutions récentes et nouveaux défis. Paris : Eyrolles, 2000, pages 305 323. 213

(Bachimont, 2001) (Bachimont, 2004) (Bahloul et al., 2003) (Bahloul et al., 2004a) (Bahloul et al., 2004b) (Bahloul, 2005) (Barr, 1981) (Barry et al., 2001) Bachimont B. Modélisation linguistique et modélisation logique des ontologies : l apport de l ontologie formelle. In Actes des journées francophones d Ingénierie des Connaissances (IC 2001). Grenoble : Presse Universitaire Grenobloise, 2001. Bachimont B. Pourquoi n'y a-t-il pas d'expérience en ingénierie des connaissances? In N. Matta (ed). Actes de la conférence «Ingénierie des connaissances (IC2004)», 5-6-7 mai 2004, Lyon. Grenoble : Presses Universitaires de Grenoble. Bahloul. D, Amghar.Y, Maret. P. Semantic Browsing through Incident Reports: the S3 Model. In Proceedings of the International Business Information Management Conference, Cairo, Egypt, December 2003. p. 68-73 Bahloul. D, Amghar.Y, Maret. P. Ontology-based Framework for Document Indexing. In Proceeding of the 6th International Conference on Enterprise Information Systems, Porto, Portugal, April, 2004. p.269-274 Bahloul D., Amghar Y. Maret P. Building a corporate memory : methodology and processes. International Conference on Intellectual Capital, Knowledge Management and Organisational Learning, 29-30 October, 2004, Toronto. pp 11-20. Bahloul D. Vers une approche de réorganisation des documents numériques au sein de l entreprise.. Revue maghrébine de documentation et d information, N spéciaux 13, 14, 15: «L information numérique et les enjeux de la société de l information». Avril, 2005, Tunis, Tunisie,. pp.119-140. Barr A., Feigenbaum. The Handbook of Artificial Intelligence, vol. 1, chapitre 3. Los Altos, Ca : William Kaufmann Inc CA, 1981. Barry, C., Cormier, C., Kassel,G., Nobécourt, J. Évaluation de langages opérationnels de représentation d ontologies. In Actes des Journées francophones d'ingénierie des Connaissances : IC'2001 juin 2001, Grenoble. 214

(Barthelme-Trapp, 2001) (Barthès, 1997) (Bartlett, 1932) (Bataille et al., 2002) (Benjamins et al., 1998) (Bernus, et al., 1996) (Biébow et al., 1999) (Biébow, 2004) (Blamisse, 2004) Barthelme-Trapp F. Analyse comparée de méthodes de gestion des connaissances pour une approche managériale. Actes de la 10ième Conférence de l Association Internationale de Management Stratégique 13-14-15 juin 2001, Canada. Barthès J-P. Capitalisation des connaissances et intelligence artificielle. In Journées Franco-Finlandaises de Tampere, Compiègne, 1997. Bartlett, F. Remembering. Cambridge : Cambridge University Press, 1932, 317 p. Bataille E, Oussalah M, Tchounikine P. Vers le concept de document sémantique. In Document numérique, 2002, vol. 6, n 1-2, p.99-114 Benjamins, R., Fensel, D., Gomez Perez A. Knowledge Management through Ontologies. In Proceedings of the Second International Conference on Practical Aspects of Knowledge Management. 29-30 October, 1998, Basel, Suisse. Bernus, P.; Nemes, L.et Williams, T. J. Architectures for Enterprise Integration. London: Chapman and Hall, 1996. Biébow B et Szulman S. TERMINAE: A Linguistic-Based Tool to Build of a Domain Ontology. In Proceedings of the 11th European Knowledge Acquisition Workshop (EKAW 99), LNAI, 1999, volume 1621, pages 49 66. Biébow B. De Dasert à TERMINAE : voyage au pays de la modélisation des connaissances à partir de textes. Mémoire d habilitation à diriger des recherches. Paris : Laboratoire d'informatique de Paris-nord LIPN, Université Paris Nord, 2004. Blamisse G. Outils du KM : panorama, choix et mise en œuvre. Livre blanc de KnowledgeConsult. Paris : Knowledge- Consult, octobre, 2004. 56 pages. 215

(Blazquez et al., 1998) (Bologna, 1996) (Bourrouilhou, 1999) (Bozsak et al., 2002) Blazquez, M., Fernandez-lopez, M., Garcia-Pinar, J.M. & Gomez-Pérez, A. Building Ontologies at the Knowledge Level using the Ontology Design Environment. In Proceedings of the Workshop on Knowledge Acquisition, Modelling and Management: KAW 98, Banff, Canada. Bologna G. La mise en oeuvre des systèmes d'information dans les organisations: cas de l'intelligence Economique et de la Mémoire d'entreprise. Phd thesis. Marseille : Université Aix-Marseille 3, 1996. Bourrouilhou L. Automatisation de la conduite des ateliers de cimenterie. In : Colloque Applications de la commande avancée. Paris, France, 1999. pp 59-77. Bozsak E., Ehrig M., Handschuh S., Hotho A., Maedche A., Motik B., Oberle D., Schmitz C., Staab S., Stojanovic L., Stojanovic N., Studer R., Stumme G., Sure Y., Tane J., Volz R., Zacharias V. KAON - Towards a Large Scale Semantic Web, EC-Web 2002, Aix-en-Provence, France, September 2-6, 2002, pp 304-313. (Brachman et Schmolze, 1985) (Brachman, 1990) (Brachman,, 1977) (Brignay et al., 2004) Brachman R, Schmolze J.G. An overview of the Kl-One knowledge representation system. Cognitive Science, 1985, vol. 9, n 2, pp 171-216. Brachman R.J., The Future of Knowledge Representation (extended abstract), invited talk, 8th. AAAI, Boston, MA., USA, 1990. Brachman R. A Structural Paradigm for Representing Knwoledge. Ph.D. thesis. USA : Harvard University, USA, 1977. 189 p. S. Bringay, S. Barry, J. Charlet. Les documents et les annotations du dossier patient hospitalier, I3 Information Interaction Intelligence, 2004, Vol. 4, N 1. 216

(Broekstra et al., 2002) Broekstra J., Kampman A.,Van Harmelen F. Sesame: A Generic Architecture for Storying and Querying RDF and RDF Schema, Lecture Notes In Computer Science; 2002, vol. 2342, p.54-68. (Carpineto et Romano., 1996) Carpineto C., Romano G., A lattice Conceptual Clustering System and its Application to Browsing Retrieval. Machine Learning, 1996. pp. 95-122. (Caussanel et Chouraqui, 1999) Caussanel J., Chouraqui E. ``Information et Connaissances : quelles implications pour les projets de Capitalisation des Connaissances", in: Revue Document numérique - Gestion des documents et Gestion des connaissances, 1999, vol. 3-4, Numéro spécial, pp. 101-119. (Charlet, 2000) (Charlet, 2002) (Chein, 1992) Charlet J. Ingénierie documentaire pour la gestion des connaissances médicales, chapitre3. In Jacques Le Maître, Jean Charlet, and Catherine Garbay, rédacteurs, Le document multimédia en sciences du traitement de l'information. Toulouse : Cepadues, 2000, pages 43-69. Charlet, J. L ingénierie des connaissances : développement, résultats et perspectives pour la gestion des connaissances médicales. Mémoire HDR. Paris : Université Pierre et Marie Curie, 2002. 142p. Chein, M., Mugnier, M-L.. Conceptual Graphs: Fundamental Notions. In Revue d'intelligence Artificielle, 1992, Vol. 6-4. p 365-406. (Chen et Mizoguchi, 1999) Chen, W., Mizoguchi. R. Communication Content Ontology for Learner Model Agent in Multi-agent Architecture. In Cumming, G., Okamoto, T. Gomez, L. (Eds.), Advanced Research in Computers and Communications in Education, Proc. ICCE, 1999. pp. 95-102. 217

(Comma, 2000) CoMMA Consortium. Corporate Memory Management through Agents. In E-Work and E-Business conference, Madrid, October 2000. (Corcho et al., 2001) (Crié, 2003) (Dechilly et al., 1999) (Denoue, 2000) Corcho O., Fernández-López M., Gómez Pérez A. OntoWeb: Ontology-based Information Exchange for Knowledge Management and Electronic Commerce. Technical Roadmap v1.0. IST Project IST-2000-29243 OntoWeb. 2001. Crié D. De l'extraction des connaissances au Knowledge Management. Revue française de gestion, septembre/octobre 2003, Vol. 29, N 146, pp. 59-79. Dechilly, T., Auffret, G., Brunie, V., Bachimont, B. Représentation et structuration des connaissances pour les bibliothèques audiovisuelles. In Document Numérique, 1999, Vol 3, N 3-4. p. 195-214. Denoue, L. De la création à la capitalisation des annotations dans un espace personnel d informations. PhD thesis. Chambéry : Univ. De Savoie, 2000, 154 p. (Desmontils et Jacquin, 2001) Desmontils E., Jacquin C. Des ontologies pour indexer un site Web. Journées francophones d'ingénierie des connaissances IC'2001), Coord. Jean Charlet, Presses Universitaires de Grenoble (PUG), Grenoble, 25-28 juin 2001, pp. 131-146 (Desmontils et Jacquin, 2002) (Dieng et al, 2000) Desmontils E., Jacquin C. Indexing a Web Site with a Terminology Oriented Ontology, In The Emerging Semantic Web. Amsterdam : IOS Press, 2002, p. 181-197. Dieng R., Corby O., Giboin A., Golebioska J., Matta N., Ribière M. Méthodes et outils pour la gestion des connaissances. Paris : Dunod, 2000. (Collection Informatiques) 218

(Dieng et al., 1998) (Dieng et al., 1999) (Dieng et al., 2001) (Dieng, 1990) Dieng R., Giboin A., Amergé C., Corby O., Després S., Alpay L., Labidi S., Lapalut S., Building of a Corporate Memory for Traffic Accident Analysis.In AI Magazine, 1998, Vol. 19, n.4, p. 80-100. Dieng R., Corby O., Giboin A., Ribière M. Methods and Tools for Corporate Knowledge Management. S. Decker and F. Maurer eds, International Journal of Human-Computer Studies, 1999, vol. 51, special issue on knowledge Management, pp. 567-598. Dieng-Kuntz R., Corby O., Gandon F., Giboin A., Golebiowska J., Matta N., Ribière M. Méthodes et Outils pour la gestion des connaissances: une approche pluridisciplinaire du Knowledge Management (2nd Edition). Paris : Dunod Edition, 372 p. (Informatique Série Systèmes d'information) ISBN 2-10- 006300-6 Dieng R. Méthodes et outils d'acquisition des connaissances. Technical report from INRIA n 1319. Sophia Antipolis : IN- RIA, Novembre 1990, 36 p. (Ducourneau et al., 1998) Ducourneau, Euzenat, Masini, Napoli. Langages et modèles à objets : état des recherches et perspectives. Le Chesnay : IN- RIA, 1998, 527 p. (Collection Didactique) ISSN 0299-0733; ISBN 2-7261-1131-9 (Eichenbaum ettamisier, 1997) Eichenbaum C., Tamisier S. «Gestion des connaissances sur les réacteurs avec le système ACCORE». Document Numérique, 1997, Vol 1 n 2, pp 189-204. (Ermine, 1996) (Ermine, 1998) 1996. Ermine J.-L. Les systèmes de connaissance. Paris : Hermès, Ermine J. L., Capter et créer le capital savoir. Annales des Mines, Novembre 1998, p.82-86. 219

(Ermine, 1999) Ermine J.-L. La gestion des connaissances, un levier de l'intelligence économique. Revue d'intelligence Economique, avril 1999, n 4, pp 98-111. (Ermine, 2000) Ermine. J-L., Les Systèmes de connaissances. 2 éd. Paris : Hermès sciences publication, 2000, 256 p. ISBN 2-7462- 0159-3 (Farquhar et al., 2000) (Fensel et al., 1998) (Fernandez et al., 1997) (Ferret et al., 2001) (Fikes et Kehler, 1985) (Fillion et al., 1995) Frquhar A., Fikes R., Rice J., Ontolingua server : A tool for colaborative ontology construction, International journal of Human-Computer studies, 2000, vol. 46, pages 707-727. Fensel D., Decker S., Erdmann M. and Studer R. Ontobroker: Or How to Enable Intelligent Access to the WWW. In B. Gaines, M. Musen eds, Proc of the 11th Workshop on Knowledge Acquisition, Modeling and Management (KAW'98), Banff, Canada, April 18-23, 1998. Disponible en ligne : http://ksi.cpsc.ucalgary.ca/kaw/kaw98/kaw98proc.html (consulté le 4/11/2006) Fernandez M., Gomez-Perez A., Juristo N. METHONTOL- OGY: From Ontological Arts Towards Ontological Engineering. In Proceedings of the AAAI97 Spring Symposium Series on Ontological Engineering, Stanford, USA, March 1997, pages 33-40. Ferret O., Grau B et Jardino M. A cross-comparison of two clustering methods. In Proceedings of the ACL Workshop on Evaluation for Language and Dialogue Systems, Toulouse, France, July 6-7, 2001. Fikes R., Kehler T. The Role of Frame-Based Representation in Reasoning. Communications of the ACM, 1985, vol. 28, n 9, pp.904-920. Fillion, F.; Menzel, C.; Blinn, T.; and Mayer, R. An Ontology- Based Environment for Enterprise Model Integration. Paper presented at the IJCAI Workshop on Basic Ontological Issues in Knowledge Sharing, 19 20 August, Montreal, Quebec, Canada. 1995. 220

(Fox et Gruninger, 1993) (Furst, 2004) (Gandon, 2002) Fox, M.S., Gruninger, M. Enterprise Modeling. In AI Magazine, Fall 1998, vol. 19, n 3, pp. 109-121. Fürst F. Contribution à l'ingénierie des ontologies : une méthode et un outil d'opérationnalisation. Thèse de doctorat Informatique. Nantes : Université de Nantes, 2004, 171 p. Gandon F. Intelligence artificielle distribuée et gestion des connaissances : ontologies et systèmes mult-agents pour un web sémantique organisationnel. Thèse. Nice : INRIA, Université de Nice - Sophia-Antipolis, 2002, 483 p. (Genesereth et Fikes, 1992) (Gruber, 1991) (Gruber, 1993) Genesereth, M.R., et Fikes, R.E., Knowledge Interchange Format, Version 3.0 Reference Manual. TR Logic-92-1. Stanford, CA : Computer Science Department, Logic Group, Stanford University, 1992. Gruber, T. R. The Role of Common Ontology in Achieving Sharable, Reusable Knowledge Bases. In J. A. Allen, R. Fikes, & E. Sandewall (Eds.), Principles of Knowledge Representation and Reasoning: Proceedings of the Second International Conference, Cambridge, MA. San Mateo, Calif. : Morgan Kaufmann, 1991, pages 601-602. Gruber. T.-R. Translation Approach to portable Ontology Specifications. In : Knowledge Acquisition, 1993, vol.5, N 2, pp199-220. (Gruez, 2002) Gruez J.-F. Manuel qualité ISO 9001. Disponible en ligne : http://perso.orange.fr/zeurg/qualite_iso_9001/manuel_qualite. htm (consulté le 22/11/2006) (Grundstein et al., 1988) Grundstein M., De Bonnières P. et Para S. Les Systèmes à Base de Connaissances, Systèmes Experts pour l'entreprise. Paris, La Défense : AFNOR, 1988. (AFNOR gestion) 221

(Grundstein et Barthès, 1996) Grunstein, M. and Barthès J.-P. An Industrial View of the Process of Capitalizing Knowledge. In J. F. Schreinemakers ed, Knowledge Management: Organization, Competence and Methodology, Proc. of ISMICK'96, Rotterdam, the Netherlands, October 21-22, 1996. Wurzburg :Ergon Verlag, p. 258-264. (Advances in Knowledge Management, vol. 1) (Grundstein et Rosenthal-Sabroux, 2004) (Grundstein, 1994) (Grundstein, 1995) (Grundstein, 1996) (Grundstein, 2000) Grundstein M., Rosenthal-Sabroux C. Une aide à la décision pour le repérage des connaissances potentiellement cruciales dans un projet de conception : application du cadre directeur GAMETH. Chapitre 4.In Eynard B., Lombard M., Matta N., Renaud J. (Eds), Gestion dynamique des connaissances industrielles. Paris: Hermès-Lavoisier, 2004. pp.81-106. Grundstein M. Développer un système à base de connaissances : un effort de coopération pour construire en commun un objet inconnu. Actes de la journée "Innovation pour le travail en groupe", Cercle pour les Projets Innovants en Informatique (CP2I), Paris, Novembre 1994. Grundstein, M. La capitalisation des connaissances de l'entreprise, Système de Production des Connaissances, Actes du Colloque de l'entreprise Apprenante et les Sciences de la Complexité, Aix-en-Provence, mai 1995. Grundstein, M. La capitalisation des connaissances de l entreprise, une problématique de management. Actes des 5èmes rencontres du programme MCX, Complexité : la stratégie de la relance, Aix-en-Provence, 4-5 juillet 1996. Grundstein,M. GAMETH: un cadre directeur pour repérer les connaissances cruciales pour l entreprise. Rapport de recherche N 9 présenté au 10ème Congrès International de l Association Française pour l Analyse de la Valeur, Paris, 7-8 novembre 2000. 222

(Grundstein, 2002a) (Grundstein, 2002b) (Grüninger et Fox, 1995) (Guarino et al., 1999) (Haarslev et al., 2001) (Haton et al., 1991) (Heflin et al, 1999) (Heflin et Hendler 2000) (Hernadez et al., 2004) Grundstein M. De la capitalisation des connaissances au renforcement des compétences dans l'entreprise étendue. Conférence invitée au 1er colloque du groupe de travail "Gestion des Compétences et des Connaissances en Génie Industriel", Nantes, 12-13 décembre 2002. Grundstein M. GAMETH: un cadre directeur pour repérer les connaissances cruciales pour l'entreprise. Rapport de recherche. Nogent-sur-Marne : MG Conseil, février 2002, 18 p. Grüninger M., Fox M.S. Methodology for the Design and Evaluation of Ontologies. Ontological Issues in Knowledge Sharing, IJCAI-95 Workshop on Basic Ontological Issues in Knowledge Sharing, Montreal, 1995. Guarino N., Masolo C., Vetere G. Ontoseek : Content-Based Access to the Web. IEEE Intelligent Systems, 1999, vol. 14, n 3, pp 70-80. Haarslev V., Möller R. et Turhan A.-Y., 2001. RACER user's guide and reference manual. Hamburg : Université de Hambourg, Computer Science Department, 2001. Haton J.P., Bouzid N., Charpillet F., Haton M-C., Laasri H., Marquis P., Mondot T., Napolia A., Le raisonnement en intelligence artificielle. Paris : InterEditions, 1991, 480 p. Heflin J., Hendler J., Luke S. SHOE: a Knowledge Representation Language for Internet Applications. Technical Report CS-TR-4078 (UMIACS TR-99-71). College Park : Dept. of Computer Science, University of Maryland, 1999, 30 p. Heflin J. et Hendler J. Searching the web with SHOE. In Artificial Intelligence for Web Search. Papers from the AAAI Workshop. Menlo Park, CA : AAAI Press, 2000, pages 35-40. Hernandez N, Aussenac-Gilles N. OntoExplo : Ontologies pour l'aide à une activité de veille ou d'exploration d'un domaine, VIème Journées de l'innovation, Foix, 28-29 Janvier, 2004. 223

(Himsolt, 1996) (Hudon, 2002) (IMS LIP, 2001) (Jouanot, 2001) (Kassel, 2002) (Kayser, 1997) (KIF, 2002) (Kiryakov et al., 2002) (Knublauch et al., 2003) Himsolt M. The graphlet system, Graph Drawing, of Lecture. Notes in Copmputer Science, 1996, vol. 1190 pp 233-240. Hudon M. Évaluation du système d indexation en descripteurs de la bibliothèque de l Université du Québec à Montréal (UQAM). UQAM, Service des bibliothèques. Montréal, Québec, Canada, 18 juin 2002. IMS LIP, IMS Learner Information Package [en ligne]. November, 22, 2001, from http://www.imsproject.org/aboutims.html (Consulté le 7/11/2006) Jouanot F., DILEMMA : vers une coopération de systèmes d'informations basée sur la médiation sémantique et la fusion d'objets. Thèse. Dijon : Université de Bourgogne, 2001, 202 p. Kassel G. Ontospec : une méthode de spécification semiinformelle d ontologies. In Actes des journées francophones d Ingénierie des Connaissances (IC 2002), Rouen, May 2002, pages 75 87. Kayser D. La représentation des connaissances. Paris : Hermès, 1997, 308 p. ISBN 2-86601-647-5, KIF, Knowledge Interchange Format Home Page [en ligne]. 2002. http://logic.stanford.edu/kif/dpans.html, (consulté le 7/11/2006) Kiryakov A., Simov K., Ognyanov D. On-To-Knowledge: Content-driven Knowledge management Tools through Evolving Ontologies. IST Project IST-1999-10132. On-To- Knowledge, 2002. Holger Knublauch, Mark A. Musen, Natasha F. Noy, Tutorial : Creating Semantic Web (OWL) Ontologies with Protégé. 2nd International Semantic Web Conference (ISWC2003), Sanibel Island, Florida, USA, October 20-23th, 2003. Disponible en ligne : http://protege.stanford.edu/plugins/owl/download/protege- OWL-Tutorial-ISWC03.pdf (consulté le 22/11/2006) 224

(Kühn et Abecker, 1997) (Le Maitre et al., 2004) (Lopez, 1998) (MacGregor, 1991) (Maedche et al., 2000) (Maedche, 2002) (Maret et Pinon, 1997) (Marino-Drews, 1992) (Martin et Alpay, 1996) (Masini et al., 1989) Kuhn, O. and Abecker, A. Corporate Memories for Knowledge Management in Industrial Practice: Prospects and Challenges. Journal of Universal Computer Science, 1997, Vol. 3, no.8, pp.929-954. Le Maitre J., Murisasco E. et Bruno E. Recherche d'informations dans des documents XML, In: M. Ihadjadene. Méthodes avancées pour les systèmes de recherche d'informations. Paris : Hermès, 2004, pp. 35-44. (Traité STI, 2) Lopez, N, Migueis, J et Pichon, E. Intégrer UML dans vos projets. Paris: Eyrolles, 1998, 243p. ISBN 2-212-08952-X MacGregor R. Inside the LOOM Description Classifier. SI- GART Bulletin, 1991, vol 2, n 3, p 88 92. Maedche A., Schnurr H.-P., Staab S., Studer R R., Representation Language-Neutral Modeling of Ontologies, Proceedings of the German Workshop Modellierung, Koblenz, Germany, April, 5-7, 2000. Maedche A. Ontology Learning for the Semantic Web. Boston: Kluwer Academic Publishers, 2002, 272 p. Maret P., Pinon J.-M. Ingénierie des savoirs-faire : compétences individuelles et mémoire collective. Paris : Ed Hermès, 1997, 186 p. Marino-Drews O., Raisonnement classificatoire dans une représentation à objets multipoints de vue. Thèse. Grenoble : Université Joseph Fourier, 1992, 232 p. Martin P. Alpay L. ``Conceptual Structures and Structured Document'', in: P.W. Eklund, G. Ellis, et G. Mann. Conceptual Structures: Knowledge Representation as Interlingua, ICCS'96, Sydney, N.S.W, Australia, 19-22 august 1996. Berlin : Springer-Verlag, 1996, LNAI, vol. 1115, p. 145-159. Masini G., Napoli A., Colnet D., Leonrad D., Tombre K., Les Langages à objets. Paris : Intereditions, 1989, 584 p. 225

(Mayère, 1990) (Meingan, 2002) Mayère A Pour une économie de l'information. Paris : Editions du CNRS, 1990. 317 p. ISBN 2-222-04476-6. Meingan D., «Les communautés de pratiques ou le partage des savoirs», L Expansion Management Review, Septembre 2002, p. 46-52. (Messai et al., 2005) Messai N., Devignes M.D., Smail-Tabbonel M., Napoli A. Treillis de concepts et ontologies pour l'interrogation d'un annuaire de sources de données biologiques (BioRegistry). Inforsid, Juin 2005, Grenoble- France. (Michard, 2001) (Mihoubi, 2000) (Miller, 1990) (Minsky, 1975) (Moreno et al., 2001) Michard A. XML : langage et applications. Paris : Eyrolles, 2001, 499 pages. ISBN 0-212-09206-7. Mihoubi, H. Une Approche déclarative de traduction d ontologies. Thèse. Grenoble : Université Stendhal Grenoble 3, 2000. Miller, G. A. Nouns in WordNet: a lexical inheritance system. In International Journal of Lexicography, 1990, Vol. 3, N 4. p 245-264. Minsky, M. A Framework for Representing Knowledge. In Edited by P. Winston. The Psychology of Computer Vision. New-York : Mc-Graw-Hill, 1975, p 211-281. Moreno, L. Aquilar, R.M., Pineiro, J.D., Estevez, J.I., Sigut, J.F., et Gonzalez, C. Using KADS methodology in a simulation assisted knowledge based system: application to hospital management. Expert Systems with Applications, 2001, vol. 20, pp 235-249. (Nagendra Prasad et Plaza, 1996) Nagendra Prasad M.V. N., Plaza E. - Corporate Memories as Distributed Case Libraries. In B. Gaines, M. Musen eds, Proceedings of the 10th Banff Knowledge Acquisition for Knowledge-Based Systems Workshop (KAW'96), Banff, Alberta, Canada, 9-14 novembre 1996, p. 40-1 40-19. 226

(Natalya et al., 2000 ) (Nonaka et Takeuchi, 1995) Nonaka I, Takeuchi H. The Knowledge-Creating Company : How Japanese Companies Create the Dynamics of Innovation. New York : Oxford University Press, 1995, 304 p. (Nonaka, 1991) (Noy et al., 2000) (O Leary, 1998) Nonaka I., The knowledge-creating company. Harvard Business Review. Novembre-Décembre 1991, pp. 96-104. Noy N., Fergerson R. W., Musen M. A., The knowledge model of Protégé2000 : combining interoperability and flexibility, in Proceedings of the International Conference on Knowledge Engineering and Knowledge Management (EKAW 00), Juan-les-Pins, France, 2000. O Leary D. Enterprise Knowledge Management. Computer, March 1998, Vol. 31, No. 3, pp. 54 61. (Comma, 2000) CoMMA Consortium. Corporate Memory Management through Agents. In E-Work and E-Business conference, Madrid, October 2000. (ODE, 2002) (Olson et Olson, 1997) (OWL, 2004) ODE, Ontology Design Environment. 2002. Disponible en ligne : http://www.swi.psy.uva.nl/wondertools/html/ode.html (consulté le 7/11/2006) Olson, G.M., et Olson, J.S.. Research on computer-supported cooperative work. In M.G. Helander, T.K. Landauer & P.V. Prabhu Eds. Handbook of human-computer interaction (2nd. Ed.). New York : Elsevier, 1997, pp 1433-1456. OWL Web Ontology Language Overview. 3WC Recommendation 10 February 2004. Disponible en ligne : http://www.w3.org/tr/owl-features/ (consulté le 7/11/2006) 227

(Parent et Boulet, 1998) (Poitou, 1995) (Polyani, 1966) (Pomian et Roche, 2002) (Pomian, 1996) (Prax, 2000) (Priss, 2000) (Protégé-2000) (Quillian, 1968) Parent R. et Boulet N. Rôle des professionnels et l ingénierie documentaire. Rapport issu de la journée de réflexion portant sur les rôles professionnels et l ingénierie documentaire, Québec, 1998. Disponible en ligne : www.services.gouv.qc.ca/fr/publications/enligne/administratio n/ingenierie/role_prof.pdf (consulté le 7/11/2006) Poitou J.P., Documentation is Knowledge: An Anthropological Approach to Corporate Knowledge Management. In J. P. Barthès ed, Proceedings of the Third International Symposium on the Management of Industrial and Corporate Knowledge (ISMICK'95), Compiègne, octobre 1995, pp. 91-103. Polanyi M. The Tacit Dimension. London: Routledge & Kegan Paul, 1966, 108 p. Pomian J. et Roche C. Connaissance capitale : management des connaissances et organisation du travail. [Gentilly] : Éd. Sapientia, 2002, 633 p. Pomian J. Mémoire d'entreprise techniques et outils de la gestion du savoir. Paris : Ed. Sapientia, 1996, 233 p. ISBN 2911761006 Prax J.-Y. Le guide du Knowledge Management : concepts et pratiques du management de la connaissance. Paris : Dunod, 2000, 266 pages. Priss U. Lattice-based Information Retrieval. Knowledge Organization, 2000, Vol. 27, 3, p.132-142. Protégé Project. The Protégé Ontology Editor and Knowledge Acquisition System. Retrieved. Disponible en ligne : http://protege.stanford.edu/ (consulté le 7/11/2006) Quillian, M.R.. Semantic Memory. In Edited by M. Minsky. Semantic Information Processing. Cambridge: MIT Press, 1968. p. 227-270. 228

(Raynaud, 2000) (Razmerita, 2003) Raynaud C. Ontologies et recherche d informations. Séminaire dans le cadre de la journée d'aristote "Métadonnées et organisation des données en XML", du 19 octobre 2000, Collège de Polytechnique, Palaiseau. Razmerita L., "Modèle Utilisateur et Modélisation Utilisateur dans les Systèmes de Gestion des connaissances: une approche fondée sur les ontologies". Thèse doctorat en Informatique. Toulouse : Université Toulouse 3, 2003, 247 p. (Saadani et Bertrand- Gastaldy, 2000) Saadani.L, Bertrand-Gastaldy.S. Conceptual Maps and Thesauri: A Comparison of Two Models of Representation from Different Disciplinary Traditions CAIS 2000. Canadian Association for Information Science Proceedings of the 28th Annual Conference, 28-30 mai 2000, Université d'alberta, Edmonton (Alberta), Canada. (Safar et al., 2004) (Sanchez, 2000) (Scheer, 1989) Safar B., Kefi H., Reynaud C., OntoRefiner, a user query refinement interface usable for Semantic Web Portals, Application of Semantic Web Technologies to Web Communities Workshop, August 23rd, 16th European Conference on Artificial Intelligence, August 22-27, 2004, Valencia, Spain. Sanchez R.The New Strategic Management: Organization, Competition, and Competence. New York, N.Y. : Wiley, 2004, 309 p. Scheer, A-W. Enterprise-Wide Data Modelling: Information Systems in Industry. New York: Springer-Verlag, 1989. (Schmolze et Lipkis, 1983) (Schreiber et al., 1999) Schmolze J.G., Lipkis T.A, Classification in the KL-ONE Knowledge Representation System, in Proceedings of the 8th. IJCAI, 1983, Karlsruhe, Germany. Schreiber G., Akkermans H., Anjewierden A., de Hoog R., Shadbolt N., Vand de Velde W., Wielinga B. Knowledge En- 229

gineering and Management: The CommonKADS Methodology. Cambridge : MIT Press, 1999, 455 pages. (Schreiber, 1999) Schreiber Knowledge Engineering and Management. Cambridge, Mass. The MIT press, 1999, 455 p. (Sfez, 1993) Sfez L., Dictionnaire critique de la communication Tome 2 : Les grands domaines d application, communication et société. Paris : PUF, 1993. 1780 p. ISBN : 2-13-044101-7 (Simon, 1996) (Sowa, 1984) (Spaccapietra, 1999) (Staab et al., 2001) (Stillings et al., 1989) (Sure et al., 2002) Simon, G. (1996). Knowledge Acquisition and Modeling for Corporate Memory: Lessons learnt from Experience. In B. Gaines, M. Musen eds, Proc. of KAW'96, November 1999, Banff, Canada, pp.41-1 41-18. Sowa, J. Conceptual Structures: information processing in mind and machine. Reading: Addison Wesley publishing Company, 1984. 481 pages. (The System Programming Series) Spaccapietra S., Parent C., Zimanyi E., «Spatio-Temporal Conceptual Models: Data Structures + Space + Time», 7th ACM Symposium on Advances in Geographic Information Systems (ACM GIS 99), November 5-6, 1999, Kansas City, Kansas, p. 26-33. Staab, S., H.-P. Schnurr, R. Studer, Y. Sure: Knowledge Processes and Ontologies. IEEE Intelligent Systems, January/February 2001, vol. 16, n 1 Special Issue on Knowledge Management., pp 26-34 Stillings N.A., Feinstein M.H., Garfield J.L. et al., Cognitive Science : Cambridge, MA : MIT Press, 1989, 533 p. Sure Y., Erdmann M., Angele J., Staab S., Studer R., Wenke D. OntoEdit: Colllaborative Ontology Development for the Semantic Web. In Proceedings of the International Semantic Web Conference, LNCS, 2002, vol. 2342, pages 221 235. 230

(Tarondeau, 1998) (Troncy et Issac, 2002) (Tsoukas, 1996) (Uschold et al., 1997) (Uschold et al., 1998) Tarondeau J.-C. Le management des savoirs. Paris : PUF édition, 1998, 128 p. Troncy R., Issac A. DOE : une mise en œuvre d une méthode de structuration différentielle pour les ontologies. In Actes des journées francophones d Ingénierie des Connaissances (IC 2002), 28-30 mai 2002, Rouen. Grenoble : Presses Universitaires de Grenoble, 2002.pages 63 74. Tsoukas, H. The Firm as a Distributed Knowledge System: A Constructionist Approach, Strategic Management Journal, 1996, vol. 17, Winter Special Issue, pp. 11-25. Uschold. M, King. M, Moralee. S, Zorgios. Y.- The Enterprise Ontology.- Technical Report AIAI-TR-191. Edinburgh : Artificial Intelligence Applications Institute, University of Edinburgh, 1997 Uschold M, King M., Moralee S., Zorgios Y. "The Enterprise Ontology " The Knowledge Engineering Review, 1998, Vol. 13, Special Issue on Putting Ontologies to Use. (Uschold et Gruninger, 1996) Uschold. M, Gruninger M.- Ontologies : Principles, Methods and applications. Knowledge engineering Review, 1996, Vol. 11 N 2, pp 93-136. (Uschold et King, 1995) (Uschold, 1996) Uschold M et King M. Towards a Methodology for Building Ontologies. In Proceedings of the Workshop on Basic Ontological Issues in Knowledge Sharing at the International Joint Conference on Artificial Intelligence (IJCAI 1995), August 1995, Montreal, Canada. Ushold M.. Building Ontologies: towards an Unified Methodology. In Proceedings of the 16th conference of the British Computer Society Specialist Group on Expert Systems, 16-18 December 1996, Cambridge UK. 231

(Van Heijst, 1996) (Van Slype, 1987) Van Heijst G, Van der Spek R. et Kruizinga E. Organizing Corporate Memories. In B. Gaines, M. Musen eds, Proceedings of the 10th Banff Knowledge Acquisition for Knowledge- Based Systems Workshop (KAW'96), novembre 1996, Banff, Canada, pp. 42-1 42-17. Disponible en ligne : http://ksi.cpsc.ucalgary.ca/kaw/kaw96/kaw96proc.html (consulté le 7/11/2006) Van Slype G. Les langages d indexation : conception, construction et utilisation dans les systèmes documentaires, Paris : Les Editions d organisation, 1987, pp.168-169 (Vargas-Vera et al., 2001) (Wiederhold, 1992) (Wielinga et al., 1993) (Wielinga et al., 2001) (Wille, 1982) Vargas-Vera M., Motta E., Domingue J., Buckingham Shum S., Lanzoni M. Knowledge Extraction by using an Ontologybased Annotation Tool, In proceedings of the Workshop Knowledge Markup and Semantic Annotation, K-CAP 2001, October 2001, Victoria Canada. Wiederhold G. Mediators in the architecture of future information systems, Computer, 1992, Vol. 25, n 3. p.38-49. Wielinga, B. J., Akkermans, J. M., & Schreiber, A. T. Validation and verification of knowledge models. In Cardenosa, J., Meseguer, P., (Eds.), EUROVAV'93: Proceedings of the European Symposium on the Validation and Verification of Knowledge Based Systems, 1993, Palma de Mallorca, Spain. Universidad Politecnica de Madrid, pp. 29-50. Wielinga B.J., Schreiber A.Th., Wielemaker J., Sandberg J.A.C. From thesaurus to Ontology. In Proceeding of the International Conference on Knowledge Capture K-CAP, october, 2001, New York, NY, USA, 2001. Wille R. Restructuring lattice theory:an approachbased on hierarchies of concepts, Orderd sets, 1982, vol.23, p. 445-470. 232

(Zacklad et al., 2003) Zacklad M.,. Lewkowicz M., Boujut J.F., Darses F. et Detienne F. Forme et gestion des annotations numériques collectives en ingénierie collaborative. Actes de IC Ingénierie des connaissances, 2003, Laval (France), pp207-225. (Zaklad et Grundstein, 2001) Zacklad M., Grundstein M. Management des connaissances : modèles d entreprises et applications. Paris : Hermès, 2001, 245 p. ISBN 2-7462-0235-2 (Zhuge, 2003) Zhuge A. Active e-document framework ADF: model and tool. Information and Management, October 2003, vol.41, pp 87-97. 233

Annexes

Annexe 1 Extrait de l ontologie OntoIncident instanciée <rdf:rdf xmlns:rss="http://purl.org/rss/1.0/" xmlns="http://a.com/ontology#" xmlns:jms="http://jena.hpl.hp.com/2003/08/jms#" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:vcard="http://www.w3.org/2001/vcard-rdf/3.0#" xmlns:daml="http://www.daml.org/2001/03/daml+oil#" xmlns:dc="http://purl.org/dc/elements/1.1/" > <rdf:description rdf:about="#concept"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#employé"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#concept"/> </rdf:description> <rdf:description rdf:about="#nom_employé"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#datatypeproperty"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#string"/> <rdfs:domain rdf:resource="#employé"/> </rdf:description> <rdf:description rdf:about="#evenement"> <rdfs:subclassof rdf:resource="#concept"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#application"> <rdfs:subclassof rdf:resource="#produit"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:nodeid="a4"> <rdf:first rdf:resource="#produit"/> <rdf:rest rdf:nodeid="a5"/> </rdf:description> <rdf:description rdf:about="#bug"> <rdfs:subclassof rdf:resource="#incident"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#problèmedetransfertdedonnées"> <rdfs:subclassof rdf:resource="#problèmedutransfert"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#arrêtdusystème"> <rdfs:subclassof rdf:resource="#incident"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#etudeetdéveloppement"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/>

<rdfs:subclassof rdf:resource="#processus"/> </rdf:description> <rdf:description rdf:about="#reunionducomitesnp"> <rdf:type rdf:resource="#reunionexterne"/> </rdf:description> <rdf:description rdf:about="#gregorie_brauge"> <effectue rdf:resource="#pilotageduprojet"/> <assiste_au rdf:resource="#reuniondequipe"/> <date_embauche>12/09/1998</date_embauche> <assiste_au rdf:resource="#reunionducomitesnp"/> <rdf:type rdf:resource="#chefdeprojet"/> <mail>gregorie.brauge@urssaf.fr</mail> <poste_occupé>développeur d'applications</poste_occupé> <gere rdf:resource="#ces"/> <nom_employé>grégorie BRAUGE</nom_employé> </rdf:description> <rdf:description rdf:about="#normal"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#etatdetraitementdesincidents"/> </rdf:description> <rdf:description rdf:nodeid="a0"> <rdf:first rdf:resource="#tâche"/> <rdf:rest rdf:nodeid="a1"/> </rdf:description> <rdf:description rdf:about="#acoss"> <rdfs:subclassof rdf:resource="#organismesdesecuritesociale"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#conditionprovoquantdesincident"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#causeincident"/> </rdf:description> <rdf:description rdf:about="#teledep"> <rdf:type rdf:resource="#application"/> </rdf:description> <rdf:description rdf:about="#v2"> <rdf:type rdf:resource="#application"/> </rdf:description> <rdf:description rdf:about="#problèmedutransfert"> <rdfs:subclassof rdf:resource="#incident"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#applicationdueindisponible"> <rdf:type rdf:resource="#indisponibilitédapplication"/> </rdf:description> <rdf:description rdf:about="#module"> <rdfs:subclassof rdf:resource="#concept"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:nodeid="a2"> <rdf:rest rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#nil"/> <rdf:first rdf:resource="#tâche"/> </rdf:description> <rdf:description rdf:about="#opérationdemaintenance"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#résolutionincident"/> </rdf:description> <rdf:description rdf:about="#responsablepole"> <rdfs:subclassof rdf:resource="#employé"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/>

</rdf:description> <rdf:description rdf:about="#developpeur"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#employé"/> </rdf:description> <rdf:description rdf:about="#thierry_berger"> <surveille rdf:resource="#teledep"/> <surveille rdf:resource="#due"/> <effectue rdf:resource="#traitementincident"/> <assiste_au rdf:resource="#reuniondequipe"/> <assiste_au rdf:resource="#reuniontechnique"/> <surveille rdf:resource="#v2"/> <rdf:type rdf:resource="#technicienexploitation"/> </rdf:description> <rdf:description rdf:nodeid="a3"> <owl:unionof rdf:nodeid="a4"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#traitementincident"> <rdf:type rdf:resource="#tâche"/> </rdf:description> <rdf:description rdf:about="#faible"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#etatdetraitementdesincidents"/> </rdf:description> <rdf:description rdf:about="#due"> <rdf:type rdf:resource="#application"/> </rdf:description> <rdf:description rdf:about="#reunionacoss"> <rdf:type rdf:resource="#reunionexterne"/> </rdf:description> <rdf:description rdf:about="#anomaliedanslecode"> <concerne rdf:resource="#bcc"/> <typeincident>description de l'anomalie</typeincident> <rdf:type rdf:resource="#bug"/> </rdf:description> <rdf:description rdf:about="#nom_incident"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> </rdf:description> <rdf:description rdf:about="#reuniondequipe"> <rdf:type rdf:resource="#reunioninterne"/> </rdf:description> <rdf:description rdf:about="#certi"> <rdfs:subclassof rdf:resource="#organismesdesecuritesociale"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:nodeid="a5"> <rdf:first rdf:resource="#résolutionincident"/> <rdf:rest rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#nil"/> </rdf:description> <rdf:description rdf:about="#incident"> <rdfs:subclassof rdf:resource="#evenement"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#surveille"> <rdfs:domain rdf:resource="#technicienexploitation"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> <rdfs:range rdf:resource="#application"/> </rdf:description> <rdf:description rdf:about="#reunionduconseildedirection">

<rdf:type rdf:resource="#reunioninterne"/> </rdf:description> <rdf:description rdf:about="#arretforcedutransactionnel"> <rdf:type rdf:resource="#arrêtdusystème"/> <concerne rdf:resource="#v2"/> <concerne rdf:resource="#bcc"/> <typeincident>incident recurrent</typeincident> </rdf:description> <rdf:description rdf:about="#kamar_amine"> <rdf:type rdf:resource="#developpeur"/> </rdf:description> <rdf:description rdf:about="#indisponibilitédapplication"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#incident"/> </rdf:description> <rdf:description rdf:about="#organismesdesecuritesociale"> <rdfs:subclassof rdf:resource="#concept"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#chefdeprojet"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#employé"/> </rdf:description> <rdf:description rdf:about="#alain_gazeux"> <rdf:type rdf:resource="#responsablepole"/> </rdf:description> <rdf:description rdf:about="#bcc"> <rdf:type rdf:resource="#application"/> </rdf:description> <rdf:description rdf:about="#reuniondecadres"> <rdf:type rdf:resource="#reunioninterne"/> </rdf:description> <rdf:description rdf:about="#developpe"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> <rdfs:domain rdf:resource="#developpeur"/> <rdfs:range rdf:resource="#application"/> </rdf:description> <rdf:description rdf:nodeid="a1"> <rdf:first rdf:resource="#module"/> <rdf:rest rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#nil"/> </rdf:description> <rdf:description rdf:about="#modedesignalementdesincidents"> <rdfs:subclassof rdf:resource="#concept"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#mail"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#datatypeproperty"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#string"/> <rdfs:domain rdf:resource="#employé"/> </rdf:description> <rdf:description rdf:about="#exploite"> <rdfs:range rdf:resource="#application"/> <rdfs:domain rdf:resource="#organismesdesecuritesociale"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> </rdf:description> <rdf:description rdf:about="#projetrégional"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#projet"/> </rdf:description> <rdf:description rdf:about="#composé_de">

<rdfs:domain rdf:resource="#application"/> <rdfs:range rdf:resource="#module"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> </rdf:description> <rdf:description rdf:about="#etatdetraitementdesincidents"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#concept"/> </rdf:description> <rdf:description rdf:nodeid="a6"> <rdf:first rdf:resource="#processus"/> <rdf:rest rdf:nodeid="a2"/> </rdf:description> <rdf:description rdf:about="#reunioninterne"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#reunion"/> </rdf:description> <rdf:description rdf:about="#certificationqualite"> <rdf:type rdf:resource="#projetinterne"/> </rdf:description> <rdf:description rdf:about="#actionsmenées"> <rdfs:subclassof rdf:resource="#résolutionincident"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#tâche"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#concept"/> </rdf:description> <rdf:description rdf:about="#processus"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#concept"/> </rdf:description> <rdf:description rdf:about="#incidentsignaléparoutildesurveillance"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#modedesignalementdesincidents"/> </rdf:description> <rdf:description rdf:about="#nicolas_sabatier"> <effectue rdf:resource="#traitementincident"/> <assiste_au rdf:resource="#reuniondequipe"/> <surveille rdf:resource="#v2"/> <surveille rdf:resource="#due"/> <rdf:type rdf:resource="#technicienexploitation"/> </rdf:description> <rdf:description rdf:about="#poste_occupé"> <rdfs:domain rdf:resource="#employé"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#datatypeproperty"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#string"/> </rdf:description> <rdf:description rdf:about="#urgent"> <rdfs:subclassof rdf:resource="#etatdetraitementdesincidents"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#assiste_au"> <rdfs:domain rdf:resource="#employé"/> <rdfs:range rdf:resource="#reunion"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> </rdf:description> <rdf:description rdf:about="#date_embauche"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#datatypeproperty"/> <rdfs:domain rdf:resource="#employé"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#date"/>

</rdf:description> <rdf:description rdf:about="#aboutit"> <rdfs:range rdf:nodeid="a3"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> <rdfs:domain rdf:resource="#projet"/> </rdf:description> <rdf:description rdf:nodeid="a7"> <rdf:rest rdf:nodeid="a8"/> <rdf:first rdf:resource="http://www.w3.org/2002/07/owl#thing"/> </rdf:description> <rdf:description rdf:nodeid="a8"> <rdf:first rdf:resource="#application"/> <rdf:rest rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#nil"/> </rdf:description> <rdf:description rdf:about="#gere"> <rdfs:domain rdf:resource="#chefdeprojet"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> <rdfs:range rdf:resource="#projet"/> </rdf:description> <rdf:description rdf:about="#retarddelivraison"> <rdfs:subclassof rdf:resource="#incident"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#incidentsignaléparclient"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#modedesignalementdesincidents"/> </rdf:description> <rdf:description rdf:about="#reunionexterne"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#reunion"/> </rdf:description> <rdf:description rdf:about="#gestiondesconnaissances"> <rdf:type rdf:resource="#projetinterne"/> </rdf:description> <rdf:description rdf:about=""> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#ontology"/> </rdf:description> <rdf:description rdf:about="#produit"> <rdfs:subclassof rdf:resource="#concept"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#état_incident"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> </rdf:description> <rdf:description rdf:about="#coupure_electrique"> <rdf:type rdf:resource="#causedirecte"/> </rdf:description> <rdf:description rdf:about="#anomaliedexploitation"> <rdfs:subclassof rdf:resource="#incident"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#ces"> <rdf:type rdf:resource="#projetnational"/> </rdf:description> <rdf:description rdf:about="#cdrom"> <rdfs:subclassof rdf:resource="#produit"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#causeincident"> <rdfs:subclassof rdf:resource="#concept"/>

<rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#projetinterne"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#projet"/> </rdf:description> <rdf:description rdf:about="#espace_disque_insuffisant"> <rdf:type rdf:resource="#causedirecte"/> </rdf:description> <rdf:description rdf:about="#suividucourrier"> <rdf:type rdf:resource="#tâche"/> </rdf:description> <rdf:description rdf:about="#nom_causedirecte"> <rdfs:domain rdf:resource="#causedirecte"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> </rdf:description> <rdf:description rdf:about="#résolutionincident"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#concept"/> </rdf:description> <rdf:description rdf:about="#production"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#processus"/> </rdf:description> <rdf:description rdf:about="#causedirecte"> <rdfs:subclassof rdf:resource="#causeincident"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#concerne"> <rdfs:domain rdf:resource="#incident"/> <rdfs:range rdf:resource="#application"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> </rdf:description> <rdf:description rdf:about="#pilotageduprojet"> <rdf:type rdf:resource="#tâche"/> </rdf:description> <rdf:description rdf:about="#projetnational"> <rdfs:subclassof rdf:resource="#projet"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#problèmedetransfertdefichiers"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#problèmedutransfert"/> </rdf:description> <rdf:description rdf:about="#reuniontechnique"> <rdf:type rdf:resource="#reunioninterne"/> </rdf:description> <rdf:description rdf:about="#pannematérielle"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#incident"/> </rdf:description> <rdf:description rdf:about="#projet"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#concept"/> </rdf:description> <rdf:description rdf:about="#urssaf"> <rdfs:subclassof rdf:resource="#organismesdesecuritesociale"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> </rdf:description> <rdf:description rdf:about="#notice">

<rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#produit"/> </rdf:description> <rdf:description rdf:about="#incidentdétectéparemployé"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#modedesignalementdesincidents"/> </rdf:description> <rdf:description rdf:about="#ameliorationdintranet"> <rdf:type rdf:resource="#projetinterne"/> </rdf:description> <rdf:description rdf:about="#paje"> <rdf:type rdf:resource="#projetnational"/> </rdf:description> <rdf:description rdf:about="#reunion"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#evenement"/> </rdf:description> <rdf:description rdf:about="#assistant"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#employé"/> </rdf:description> <rdf:type rdf:resource="#projetnational"/> </rdf:description> <rdf:description rdf:about="#typeincident"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#datatypeproperty"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlschema#string"/> <rdfs:domain rdf:resource="#incident"/> </rdf:description> <rdf:description rdf:about="#technicienexploitation"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#employé"/> </rdf:description> <rdf:description rdf:about="#assistance"> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#class"/> <rdfs:subclassof rdf:resource="#processus"/> </rdf:description> <rdf:description rdf:about="#effectue"> <rdfs:domain rdf:resource="#employé"/> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#objectproperty"/> <rdfs:range rdf:resource="#tâche"/> </rdf:description> <rdf:description rdf:about="#noemie_dacosta"> <rdf:type rdf:resource="#assistant"/> <effectue rdf:resource="#suividucourrier"/> <assiste_au rdf:resource="#reuniontechnique"/> </rdf:description> </rdf:rdf>  9

Annexe 2 Modélisation des ressources de connaissances relatives aux incidents informatiques ProcedureProcessusActivite reference nomprocessus objectifprocessus etapesprocessus ressource URL DocumentationResolution reference titredocument objetdocument descriptionproduit ensembleoperation contient fait-référence EtapeTraitementIncident n OrdreEtape déclenche ProcedureMaîtriseIncident etapetraitementinc. criterenonconformite intervenant FicheIncident descriptionincident descriptioncause solutionproposee validationsolution actionmenee intervenant validationsolutionproposee() fait-référence fait-référence reutilise-info-de fait-référence DocumentEnregistrement URL typedocument est-une FicheSuiviIncident descriptionincident analysecause resultatattendu solutionproposee actioncorrectiveretenue fait-référence RecapetulatifIncident déclenche ProcedureActionCorrective etapesactionsmenees est-une DocUtilisation DocInstallation Astuces fait-référence DemandeClient n demande nomclient produitconcerne descriptionincident PVDefinitifResolution reference destinataire analysecause solutionproposee URL

Annexe 3 Structure de la base de connaissances

FOLIO ADMINISTRATIF THESE SOUTENUE DEVANT L'INSTITUT NATIONAL DES SCIENCES APPLIQUEES DE LYON NOM : BAHLOUL DATE de SOUTENANCE : 15 décembre 2006 (avec précision du nom de jeune fille, le cas échéant) Prénoms : Djida TITRE : Une approche hybride de gestion des connaissances basée sur les ontologies : application aux incidents informatique NATURE : Doctorat Numéro d ordre : 2006-ISAL-00110 Ecole doctorale : Informatique et Information pour la société Spécialité : Informatique Code CLASSE : RESUME : Le travail développé dans cette thèse concerne la problématique de gestion des connaissances au sein des organisations. Le but est de proposer des aides méthodologiques et des outils facilitant la capitalisation et la réutilisation des connaissances produites et/ou utilisées par les acteurs d une entreprise. Nous avons proposé une approche hybride basée sur une ontologie du domaine. La mise en œuvre de cette approche privilégie l utilisation des techniques du web sémantique tels que XML et OWL. Dans ce contexte, nous avons conçu une mémoire d entreprise pouvant s interfacer avec le système d information de l entreprise. En nous plaçant dans le contexte d applications logicielles produites et/ ou mises en production par le CIRTIL, organisme attaché à la sécurité sociale, pour le compte de ses clients qui sont les URSSAF, nous avons élaboré une ontologie du domaine des incidents informatiques. Cette ontologie est considérée comme un modèle qui permet, en plus des représentations formelles et consensuelles des connaissances du domaine, un accès unique aux ressources de connaissances via une terminologie partageable et non ambiguë tout en offrant des mécanismes de raisonnement sur les connaissances modélisées. MOTS CLES : gestion des connaissances, ontologies, mémoire d entreprise, approche hybride, système de gestion des connaissances, XML, OWL. Laboratoire(s) de recherches : Laboratoire d'informatique en Images et Systèmes d'information (LIRIS) Directeur de thèse : Youssef Amghar Président du jury : B. Bachimont Composition du jury : B. Bachimont HDR (UTC) - Directeur Scientifique (INA) Examinateur L. Bouzidi Professeur (Université Jean Moulin Lyon3) Examinateur T. Faivre Responsable Technique du CIRTIL P. Maret Maître de conférences (INSA de Lyon) Co-directeur E. Murisasco HDR (Université du Sud Toulon-Var) Rapporteur F. Sèdes Professeur (Université Paul Sabatier Toulouse3) Rapporteur