Le Web Sémantique pour la Gestion des Connaissances Rose DIENG-KUNTZ Projet ACACIA INRIA, Sophia-Antipolis http://www.inria.fr/acacia 1
Knowledge Management Organisation = personnes interagissant pour des objectifs communs, dans une structure donnée, dans un environnement interne et avec un environnement externe. KM = Management des ressources de connaissances d une organisation pour faciliter : l accès, partage, réutilisation de ces connaissances (explicites ou tacites, individuelles ou collectives) objectif patrimonial de capitalisation la création de nouvelles connaissances objectif d innovation 2
Le projet Acacia Objectifs: Offrir une aide méthodologique et logicielle (i.e. modèles, méthodes et outils) pour la construction, la gestion, la diffusion, l évaluation et l évolution d une mémoire d entreprise. Individu + Organisation + Technologie 3
Plan Approche Web sémantique d entreprise Moteur de recherche sémantique CORESE Mémoire de projet : SAMOVAR Mémoire d expériences : MEAT Travail collaboratif : Ligne de Vie Cartographie des compétences : KMP Conclusions 4
Web Sémantique "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001 Approche : annoter sémantiquement les ressources du Web grâce à des ontologies. 5
Web Sémantique d Entreprise Ontologies Détenteur de conn. DB Documents Logiciel ou Service Base d Annotations sémantiques Outil d Ontologie Outil d Annotation Système de Gestion des Conn. Requête, Navigation Moteur de recherche Push User (collective task) User (Individual task) 6
Etat des lieux Utilisateurs visés & application visée Choix du Scénario d Application Sources d Information Contenu et granularité de l ontologie Constitution, Organisation & Validation des Ressources Nouvelles ressources créées Ressources légataires adaptées (transformées, réorganisées) Construction des Ontologies A partir de Sources Humaines A partir de Corpus Textuel A partir de BDs Structurées Vérification Consistance d un pt de vue système Validation des Ontologies Validation par les experts Evaluation par utilisateurs Annotation des Ressources Annotation Manuelle Annotation Automatique Annotation Semi-automatique Validation des Annotations et du Web Sémantique d entreprise Système Experts Utilisateurs Maintenance & Evolution Dynamique du Web Sémantique d entreprise Ontologies 15èmes journées de l'observatoire, Ressources Genève, 11 novembre 2005 Annotations 7
Plan Approche Web sémantique d entreprise Moteur de recherche sémantique CORESE Mémoire de projet : SAMOVAR Mémoire d expériences : MEAT Travail collaboratif : Ligne de Vie Cartographie des compétences : KMP Conclusions 8
Le moteur de recherche sémantique CORESE Ontologies Documents <accident> <date> 19 Mai 2000 </date> <description> <facteur>le facteur </description> </accident> XML Légataires Utilisateurs <rdfs:class rdf:id="thing"/> <rdfs:class rdf:id="person"> <rdfs:subclassof rdf:resource="#thing"/> </rdfs:class> Schémas RDFS <ns:article rdf:about="http://intranet/articles/ecai.doc"> <ns:title>searching Semantic Web with CORESE</ns:title> <ns:author> <ns:person rdf:about="http://intranet/employee/id109" /> </ns:author> </ns:article> Annotations RDF requête réponse suggestion CORESE RDFS RDF Règles Requête Support GC Base GC INFERENCES Règles GC Requête GC PROJECTION Résultat GC RDF/S XML XSLT XHTML XML JSP SVG JavaScript SEWESE Crédit : Fabien Gandon 9
Recherche d infos guidée par une ontologie Entity Pathology Document Cancer Diabetes MedicalDocument AdminDoc Stomach Cancer Melanoma SurgeryReport BestPractice Guide IDCard 10
Recherche approchée Rechercher la meilleure approximation en fonction de l ontologie. Exemple: Requête Rapport Technique sur Java écrit par un ingénieur? Réponse approchée : Rapport Technique Support de cours Ingénieur Equipe 11
Distance ontologique Objet Acteur Document Personne Équipe Rapport Cours Ingénieur Chercheur R. Recherche R. Technique Support C. 12
CORESE : Conclusions Recherche approchée basée sur des espaces métriques & distances ontologiques définies sur les hiérarchies de types ontologiques Extensions pour traiter certains énoncés de OWL Lite Plate-forme d expérimentation utilisée dans 12 applications Excellents résultats lors du benchmark Knowledge Web sur les outils RDF(S). 13
Plan Approche Web sémantique d entreprise Moteur de recherche sémantique CORESE Mémoire de projet : SAMOVAR Mémoire d expériences : MEAT Travail collaboratif : Ligne de Vie Cartographie des compétences : KMP Conclusions 14
Mémoire de projet véhicule (RENAULT) Objectif : Capitaliser les connaissances sur les problèmes d un projet véhicule. Approche SAMOVAR : Exploiter un outil de traitement linguistique sur les champs textuels du Système de Gestion de Pbs Construire une ontologie (Problème, Pièce...) Annoter les descriptions de pb avec cette ontologie Exploiter le moteur de recherche CORESE pour la rech. d infos 15
Ex. : Construction de l Ontologie SAMOVAR Champs textuels de la base SGP Extraction Nomino Ontologie Pièce Problèmes Candidats à insérer dans l onto Problème Syntagmes Candidats nom., syntagmes termes verb.,... Enrichiss. ontologie Validation Interviews Initialisation ontologie Bootstrap de l ontologie Problème Base règles heuristiques Ontologie Problème 16
Organisation de SAMOVAR Je cherche Ontologie RDFS Moteur de recherche CORESE I H M toutes les pièces sur lesquelles des problèmes de claquement ont été observées Base annotée RDF SAMOVAR 17
SAMOVAR : Conclusions Ontologie dans une véritable application industrielle Méthode de construction d une ontologie à partir de textes : Exploitation d outils de TALN + validation humaine Méthode de construction d une mémoire de projet 18
Plan Approche Web sémantique d entreprise Moteur de recherche sémantique CORESE Mémoire de projet : SAMOVAR Mémoire d expériences : MEAT Travail collaboratif : Ligne de Vie Cartographie des compétences : KMP Conclusions 19
Mémoire d expériences sur les biopuces Biologiste Cahiers d expériences BD d expériences BD sur les gènes Articles scientifiques, Documents Ontologies du domaine (e.g. Gene Ontology, UMLS ) Crédit : Khaled Khelif 20
Notre approche Utiliser des annotations sémantiques sur les documents pour faciliter la tâche de recherche d info pour aider à la validation et à l interprétation des résultats des expériences sur les biopuces Formaliser les annotations en reposant sur une ontologie médicale : UMLS Utiliser des outils linguistiques pour extraire les connaissances à partir des textes pour générer ces annotations Système semi-automatique pour la génération d annotations sémantiques basées sur des ontologies 21
Crédit : Khaled Khelif Documents In vitro assays demonstrated that only p38alpha and p38beta are inhibited by csaids. Linguistic analysis Relation detection grammars MeatAnnot UMLS KS Annotations <m:pharmacologic_substance rdf:about='csaids#'> <m:inhibits> <m:gene_or_genome rdf:about='p38alpha#'/> </m:inhibits > <m:inhibits > <m:gene_or_genome rdf:about='p38beta#'/> </m:inhibits > </m:pharmacologic_substance> 22
MEAT : Conclusions Mémoire d expériences pour une communauté scientifique (biologistes) Réutilisation d une ontologie existante UMLS Génération semi-automatique d annotations sémantiques grâce à des outils linguistiques Poss. enrichir l ontologie UMLS 23
Plan Approche Web sémantique d entreprise Moteur de recherche sémantique CORESE Mémoire de projet : SAMOVAR Mémoire d expériences : MEAT Travail collaboratif : Ligne de Vie Cartographie des compétences : KMP Conclusions 24
Réseau de soin mucoviscidose Gastro-enterologue Pneumologue Pediatre Kine Medecin traitant Dossier patient electronique Psychologue Assistant social Infirmier Famille du Patient 25
Projet Ligne de Vie Assister collaboration médicale dans un réseau de soin, pour la prévention, le diagnostic, la thérapie, le suivi des patients et l éducation. INRIA, Nautilus, SPIM Crédit : Marek Ruzicka 26
Web sémantique médical Ontologie Annotations Sémantiques Documents (Dossier patient, Guide bonnes pratiques ) Traducteur Ligne de vie <dossierpatient> <date> 19 Mai 2000 </date> <donneesadministratives> <Patient><nom>Dupont</nom> <prenom> Michel </prenom> </Patient> </donneesadministratives> Moteur de rech. sem. Staff virtuel BD Nautilus 27
Crédit : Marek Ruzicka Architecture 28
Exemple de Graphe QOC 29
Ligne de Vie : Conclusions Construction d une ontologie à partir de sources hétérogènes : BD structurée + corpus textuel + classification existante. Intérêt ontologie pour guider le staff virtuel (travail collaboratif) Prototype implémenté avec Corese et en Java. Validation par l industriel. 30
Plan Approche Web sémantique d entreprise Moteur de recherche sémantique CORESE Mémoire de projet : SAMOVAR Mémoire d expériences : MEAT Travail collaboratif : Ligne de Vie Cartographie des compétences : KMP Conclusions 31
Crédit : Nicolas Gronnier Projet RNRT KmP Knowledge Management Platform: Serveur Web Sémantique comme portail de gestion des compétences pour partenariats sur Sophia Rodige, INRIA, Latapses, Telecom Valley, GET 32
KmP: Value Chain Crédit : Nicolas Gronnier 33
Clusters of competencies Crédit : Fabien Gandon 34
KmP: Conclusions Serveur Web Sémantique basé sur CORESE Co-conception et co-évaluation des interfaces utilisateurs, guidées par des scénarios Ontologies pour la gestion des connaissances collectives Algorithme de regroupement sémantique basé sur une distance ontologique pour le calcul de: pôles de compétences similaires clusters de compétences complémentaires Succès extensions planifiées à d autres domaines 35
Conclusions Approche «Web Sémantique d Entreprise» : resources + ontologies + annotations sémantiques Exploite les résultats des recherches sur le Web Sémantique dans le cadre de la Gestion des Connaissances, avec de nombreux scénarios d application poss. Mais aussi Gestion des Connaissances pour le Web sémantique : Besoin de capitalisation et partage de toutes les connaissances sur le Web sémantique, créées par de multiples communautés de recherche hétérogènes Mémoire de multiples communautés scientifiques constituant une organisation virtuelle 36
Grand Merci à Toute l équipe Acacia pour notre travail commun sur les mémoires d entreprise et les webs sémantiques d entreprise 37
Bibliographie R. Dieng-Kuntz, O. Corby, F. Gandon, A. Giboin, J. Golebiowska, N. Matta, M. Ribière. Knowledge Management : Méthodes et outils pour la gestion des connaissances, 3ème éd. Dunod, novembre 2005 38