ViaSema : qui sommes-nous? Raison d être : transformer l «infobésité» en connaissance accessible Start-up créée en 2010 Jeune Entreprise Innovante Cap Digital 3 brevets 3 publications 1
Web sémantique : donner l accès à la Connaissance Définition Potentiels Moyens à mettre en œuvre 2
Le Web sémantique : idées reçues Le «Web Sémantique» 1. ne correspond pas au retour de l IA même s il s inspire de tous les progrès effectués dans ce domaine 2. n est pas le successeur du Web 2.0 (web social) 3. n est pas le remplaçant des bases de données relationnelles, des bases de données orientés objets ou des bases XML 4. n est pas redondant avec les schémas ou DTD XML 5. n est pas une solution «miraculeuse» porteuse d une «intelligence» intrinsèque (ne remplace ni les outils de textmining, ni l être humain) 3
Le Web sémantique : des vraies bonnes idées 1. est un cadre formel et ouvert de représentation de la «connaissance» 2. offre des mécanismes maitrisés d inférence/de raisonnement 3. s appuie sur un ensemble de standards W3C http://www.w3.org/rdf/, http://www.w3.org/2001/sw/wiki/owl http://www.w3.org/2001/sw/wiki/sparql http://www.w3.org/2004/02/skos/ 4. correspond à des technologies matures et soutenues par des acteurs majeurs du Web et de la gestion de données (Oracle, Google, Talend, Lucene/SolR ) 4
Le Web sémantique : pour quoi faire? 1. créer de la valeur pour des contenus non structurés/non normalisés 2. décloisonner les silos de données qu elles soient structurées/non structurées ou internes/externes à l entreprise (interopérabilité) 3. améliorer la valeur d usage de ses données et s adapter aux besoins des utilisateurs (flexibilité, adaptabilité, ouverture) 4. partager et construire un véritable écosystème autour de données publiées (Linked Data) 5
Construire un écosystème Publier ses données sous forme de «Linked Data» : Ne pas confondre Linked Data avec Open Data Tim Berners-Lee : http://www.w3.org/designissues/linkeddata.html Use URIs as names for things Use HTTP URIs so that people can look up those names. When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) Include links to other URIs. so that they can discover more things. et «s enrichir» mutuellement des données partagées par les autres acteurs de l écosystème. 6
Linked Data 2007 Source : Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Linked Data 2009 Source : Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
L écosystème Linked Data (2007-2010) Source : Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ 9
Moyens à mettre en oeuvre Gestion du contenu Gestion du langage Gestion des connaissances Langage métier 10
Contenu vs. Connaissances Acquisition Structuration Annotation contenus de la «source» nettoyé et «monitoré» ressources terminologiques et ontologiques contenus structurés + métadonnées base de connaissance du domaine contenus structurés + métadonnées + enrichissements taxonomies de publication Publication/Adaptation base de connaissance publiée Lecture : «Improving Legal Publishing at LexisNexis in France with Ontology Driven Processes» J.Rezzouk & J.Delahousse - Semtech 2007 services de recherche et navigation 11
Les conditions du succès d un projet «Web sémantique» Un travail collaboratif s appuyant sur des expertises complémentaires mais toutes indispensables : ViaSema : expertise en ingénierie documentaire et gestion de données expertise en traitement automatique du langage (TAL, linguistique) expertise en ingénierie de la connaissance (modélisation et gestion des connaissances métier) Le client : expertise métier 12