Introduction au Web Sémantique Bernard ESPINASSE Professeur à l'université d'aix-marseille

Documents pareils
Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Programmation Internet Cours 4

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Glossaire. ( themanualpage.org) soumises à la licence GNU FDL.

XML et travail collaboratif : vers un Web sémantique

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Petite définition : Présentation :

Autour du web. Une introduction technique Première partie : HTML. Georges-André SILBER Centre de recherche en informatique MINES ParisTech

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Catalogue des formations Edition 2015

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Module BD et sites WEB

Programmation Web. Introduction

SII Stage d informatique pour l ingénieur

WEB & DÉVELOPPEMENT LES BASES DU WEB LE LANGAGE HTML FEUILLES DE STYLES CSS HISTORIQUE D INTERNET ET DU WEB LES DIFFÉRENTS LANGAGES

Sommaire. -1-Computer en bref. Web en bref. Le web 3.0,...la mobilité. Evolution du Web web1.0, web2.0, web2.b, web3.0...

les techniques d'extraction, les formulaires et intégration dans un site WEB

Les outils de création de sites web

4. SERVICES WEB REST 46

Formation Site Web. Menu du jour. Le web comment ça marche? Créer un site web Une solution proposée pour débuter La suite?

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Bigdata et Web sémantique. les données + l intelligence= la solution

INTERNET, C'EST QUOI?

webmestre : conception de sites et administration de serveurs web 42 crédits Certificat professionnel CP09

Architectures web/bases de données

18 TCP Les protocoles de domaines d applications

Internet. DNS World Wide Web. Divers. Mécanismes de base Exécution d'applications sur le web. Proxy, fire-wall

Les sites Internet dynamiques. contact : Patrick VINCENT pvincent@erasme.org

Caruso33 : une association à votre service

Installation d un serveur HTTP (Hypertext Transfer Protocol) sous Débian 6

INFORMATIQUE & WEB. PARCOURS CERTIFICAT PROFESSIONNEL Programmation de sites Web. 1 an 7 MODULES. Code du diplôme : CP09

Web sémantique et pratiques documentaires

Thierry BOULANGER. par la pratique. Bases indispensables Concepts et cas pratiques XML. 3 ième édition. Nouvelle édition

Les services usuels de l Internet

Formation Webmaster : Création de site Web Initiation + Approfondissement

Services sur réseaux. Trois services à la loupe. Dominique PRESENT Dépt S.R.C. - I.U.T. de Marne la Vallée

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

Le réseau Internet.

Dans nos locaux au 98 Route de Sauve NÎMES. Un ordinateur PC par stagiaire, scanner, imprimante/copieur laser couleur

Hervé Couturier EVP, SAP Technology Development

1 ère Université WEB. Courbevoie Samedi 21 octobre Votre site interactif sur internet.

RDF Schema pour les ontologies légères

Gestion collaborative de documents

BES WEBDEVELOPER ACTIVITÉ RÔLE

Web Sémantique. Examen

JDev Atelier Datalift

Qu est ce qu Internet. Qu est-ce qu un réseau? Internet : à quoi ça sert? présentation des services. Exemple de configuration. Rôles des éléments

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

SECTION 5 BANQUE DE PROJETS

Développement des Systèmes d Information

Ecole Nationale Supérieure de Mécanique et d Aérotechnique Laboratoire d Informatique et d Automatique pour les Systèmes THESE

PHP 5.4 Développez un site web dynamique et interactif

Echosgraphik. Ce document sert uniquement à vous donner une vision sur ma manière de travailler et d appréhender un projet

Introduction aux «Services Web»

Les grandes facettes du développement Web Nicolas Thouvenin - Stéphane Gully

Introduction à la conception de systèmes d information

Programmation Web Avancée Introduction aux services Web

Métadonnées, ontologies et documents numériques

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x

10. Base de données et Web. OlivierCuré

Vues d ensembles de documents RDF

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

TIC. Réseau informatique. Historique - 1. Historique - 2. TC - IUT Montpellier Internet et le Web

Architecture JEE. Objectifs attendus. Serveurs d applications JEE. Architectures JEE Normes JEE. Systèmes distribués

Présentation Internet

Bases de données Cours 1 : Généralités sur les bases de données

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

Manuel d'utilisation du navigateur WAP Palm

Petit guide à l'usage des profs pour la rédaction de pages pour le site Drupal du département

PROSOP : un système de gestion de bases de données prosopographiques

Les Architectures Orientées Services (SOA)

Les nouvelles architectures des SI : Etat de l Art

Faculté de Génie Chaire industrielle en infrastructures de communication. La technologie XML. Wajdi Elleuch

Catalogue des Formations Techniques

Hébergement de site web Damien Nouvel

République Algérienne Démocratique et Populaire Université Abou Bakr Belkaid Tlemcen Faculté des Sciences Département d Informatique

Créer et animer une boutique en ligne avec Wordpress (environnement PC et MAC)

C r é a t i o n D e S i t e s. P o l C R O V A T T O

Initiation à la recherche documentaire LA RECHERCHE SUR INTERNET

Cours CCNA 1. Exercices

Diplôme d'etudes Approfondies Réseaux de télécommunications

Systèmes d'informations historique et mutations

MEMOIRE DE STAGE. Amélioration de l'outillage support à une méthodologie de "Cartographie Sémantique"

Refonte front-office / back-office - Architecture & Conception -

CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN ING

LAB-Multimedia CMS. Guide d'auto-formation. Copyright by LAB-Multimedia 1/22

Introduction aux Technologies de l Internet

Brève introduction à la recherche d!information sur le Web à base d!agents logiciels

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Gestion Électronique de Documents et XML. Master 2 TSM

Cours Master Recherche RI 7 Extraction et Intégration d'information du Web «Services Web»

20 techniques et bonnes pratiques d un positionnement visible gratuit et durable sur Internet

UE 8 Systèmes d information de gestion Le programme

Transcription:

Introduction au Web Sémantique Bernard ESPINASSE Professeur à l'université d'aix-marseille 2010 Du Web au Web Sémantique : Le Web Sémantique : Architecture du Web Sémantique Langages du Web Sémantique Niveaux Nommage et adressage : URI, URL Niveau syntaxique : XML Niveaux Sémantique : Ontologies, OWL Références Livres :! T. B. Passin, «Explorer!s guide to the Semantic Web», Manning Ed., 2008.! E. Luczak, «A Guide to the Semantic Web», Leading Edge Forum Technology Grant, 2004.! G. Antoniou, F. van Harmelen, «A Semantic Web Primer», The MIT Press, Cambridge, Massachusetts, London, England, 1999.! Cours :! Cours de M. Gagnon, Ecole Polytechnique de Montréal, 2007.! Cours de D. Genest, Université d!angers, 2008.! Cours de S. Garlatti, ENST, Paris, 2006.! Introduction au Web Sémantique - Bernard ESPINASSE - 1 Introduction au Web Sémantique - Bernard ESPINASSE - 2 Plan Du Web au Web Sémantique :! Bref historique! Forces et faiblesses du Web Le Web Sémantique :! Architecture du Web Sémantique! Langages du Web Sémantique Niveaux Nommage et adressage : URI, URL Niveau syntaxique : XML Niveaux Sémantique :! RDF et RDFS! Ontologies Bref historique du Web 1989 : Tim Berners-Lee (CERN, Genève) commence le développement d!un système hypertexte. 1990 : Premières définitions pour HTTP, HTML, URL. 1992 : Premier annuaire de sites Web. 26 sites. 1994 : Netscape Navigator 1.0 ; Fondation du W3C. 1995 : Microsoft ne croit pas au Web, puis change d!avis. 1998 : Plus de 2 millions de sites ; Création de Google. 2000 : XHTML 1.0. 2004 : Firefox 1.0. 2005 : Plus de 60 millions de sites!!!!! Ontology Web Langage, OWL Introduction au Web Sémantique - Bernard ESPINASSE - 3 Introduction au Web Sémantique - Bernard ESPINASSE - 4

Succès d!internet, le Web actuel de plus en plus de sites => nécessité d!avoir des outils pour rechercher des informations = moteurs de recherches, méta-moteurs, Informations disponibles non-structurée, hétérogène et distribuée : texte, images, données issues de bases, documents techniques, etc Certains types de données se prêtent mal à la recherche par les moteurs de recherche traditionnels : Comparaison de documents, recherches «type SGBD», raisonnement sur les connaissances disponibles, Organisation des informations côté serveur :! Web statique (HTML pur)! Web dynamique (CGI, PHP, SGBD, JSP, Java, Services web) ; le Web ne contient pas uniquement des pages mais aussi des «services» Succès d!internet, le Web actuel L importance d Internet est dû :! Aux services qu!il nous fournit : IRC, ICQ, Chat, email, News groups, FTP, WWW, E-commerce, B2B, B2C, Succès du WWW fondé sur sa simplicité, MAIS!! Développé pour des lecteurs humains! Les données actuelles sont principalement organisées et structurées pour être simple à transmettre et être présentées à des humains! HTML et PDF sont principalement des langages de présentation de données <H2> Triple X </H2> : ne dit rien sur le titre sauf pour des humains! Internet est de plus en plus utilisé par des machines (search engines, robots, ) Introduction au Web Sémantique - Bernard ESPINASSE - 5 Introduction au Web Sémantique - Bernard ESPINASSE - 6 Problèmes avec Internet, le Web actuel (1) (d!après S. Garlatti) Accéder, traiter l information, extraire et interpréter l information : La majorité des données sur le Web est sous une forme qui ne permet pas de l utiliser à grande échelle. Pas de système global de publication de données permettant aux machines et aux humains de les traiter :! Évènements sportifs, météo, guides TV, guides cinéma,... sont présentés par de nombreux sites Web, mais presque tous au format HTML (structure logique + présentation) Problèmes avec Internet, le Web actuel (2) (d!après S. Garlatti) Le Web actuel entrave la recherche, l extraction, la maintenance et la génération d information Actuellement, pas d accès réel au contenu des documents :! Contenu et Information pas accessible ni interprétable par des machines! Pas possible de composer dynamiquement des documents cohérents et adaptés aux utilisateurs! Alors, comment trouver et extraire l information pertinente pour différents services? Introduction au Web Sémantique - Bernard ESPINASSE - 7 Introduction au Web Sémantique - Bernard ESPINASSE - 8

Problèmes avec le Web actuel : information cachées Les informations sont «cachées» dans le code HTML (1) : Ex: Horaires de trains & Horaires d!avion = 2 documents HTML avec tables :! Comment croiser les 2 documents pour un trajet train puis avion?! Les documents HTML ne peuvent être utilisés (sauf ad-hoc) car les documents HTML sont une présentation des données! Pourtant, à la base, les données sont souvent stockées de façon structurée dans des bases de données (BD)! Mais le schéma de la BD des trains est sans doute très différent de celui de la BD des avions! Solution :! Il faudrait une représentation «commune», utilisant un langage standard pour pouvoir croiser (automatiquement) les données. Introduction au Web Sémantique - Bernard ESPINASSE - 9 Problèmes avec le Web actuel : informations cachées Les informations sont «cachées» dans le code HTML (2) : code HTML contient l!expression dans une langue naturelle (LN) des informations, ou dans des images, des fichiers sonores, des vidéos, les moteurs de recherche, pour des raisons de performance et de taille du Web, ne font aucun traitement sophistiqué (TALN) sur les textes :! ils font une recherche de mots, ce qui est très différent d!une recherche d!informations! Solution : Pour une véritable recherche d!information, il faudrait représenter (indexer) les informations dans un langage standard, en utilisant un vocabulaire standard (ou mieux une ontologie) permettant :! des comparaisons de documents,! des raisonnements pour résoudre une requête,! la prise en compte de documents multimédias,! des réponses formées de plusieurs documents ou de parties de documents. Introduction au Web Sémantique - Bernard ESPINASSE - 10 Problèmes avec le Web actuel : services cachés Le service est «caché» dans le code HTML : Comment connaître ce que propose un service? Comment utiliser conjointement plusieurs services? Ex: Achat de billets de trains, validateur html, Web mail,! Solutions : Meta-données : «données sur les données», association de données, exploitables par ordinateur, à tout ce qui peut être accessible sur le Web (ou pas). Problèmes avec le Web actuel : mélange présentation & contenu! Solutions : Séparer la présentation du contenu : SGBD + Présentation (PHP,... ) : le SGBD n!est pas visible. HTML + CSS : mise en page «à part», mais toujours pas de description (utilisable par une machine) de ce que «contient le document» XHTML : Évite le fouillis d!html, mais il s!agit toujours de documents XML + XSLT! (X)HTML : Mieux, mais :! XML n!est pas toujours visible! XML n!est pas un langage (mais un métalangage) : comment comparer 2 documents XML écrits avec des DTD différentes? Introduction au Web Sémantique - Bernard ESPINASSE - 11 Introduction au Web Sémantique - Bernard ESPINASSE - 12

Solutions apportées par le Web Sémantique Chaque ressource (document, personne, objet, etc.) est identifiée par un identificateur (URI) Utilisation d!un langage commun (RDF) pour exprimer des informations sur des ressources Expression d!assertions simples sous la forme de triplets (sujet, prédicat, objet) :! Le sujet est une ressource (URI),! l!objet est une ressource ou un littéral,! le prédicat est une relation entre les deux. Ex : «La vie, l!univers et le reste» a pour «auteur» «Douglas Adams» : il ne s!agit pas de 3 chaînes de caractères, mais de l!identification (désambiguisation) du titre, de la relation, de l!auteur. Le Web Sémantique Le Web Sémantique est une extension du Web classique : facilitant l!automatisation du traitement des connaissances disponibles ne remet pas en cause le Web classique (HTML, HTTP,...) Les connaissances ne sont pas représentées dans une langue naturelle (LN) mais formalisées à l!aide de langages pouvant être interprétés par des machines :! Agrégation de connaissances venant de plusieurs sources, comparaisons! Publication de données sémantiques sous différentes formes! Génération de nouvelles connaissances (inférences)! Pas uniquement utile pour le Web-internet. L!initiative Web sémantique est soutenue par le W3C. Introduction au Web Sémantique - Bernard ESPINASSE - 13 Introduction au Web Sémantique - Bernard ESPINASSE - 14 Le Web Sémantique Le Web Sémantique = Web de demain : «L'information et les services sur le Web sont aujourd'hui peu exploitables par des machines et de moins en moins exploitables sans l'aide des machines» «Le WS sera un vaste espace d'échanges de ressources entre machines permettant l'exploitation de grands volumes d'informations et de services variés, aidant les utilisateurs en les libérant d'une (bonne) partie de leur travail de recherche, et de combinaison de ces ressources» «The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation» «Le Web sémantique est une extension du Web actuel dans lequel l'information est munie d'une signification bien définie permettant aux ordinateurs et aux personnes de mieux travailler en coopération» (T. Berners-Lee, J. Hendler et O.Lassila, Scientific American 2001) Introduction au Web Sémantique - Bernard ESPINASSE - 15 Le Web sémantique : une histoire de générations Les données doivent être encodées de tel sorte que les contenus (sens et sémantique) du Web soient plus «compréhensibles» pour les machines (des algorithmes) : 1ère Génération WWW (Début 1990) :! Séparation de la présentation de la localisation! Fondée sur HTML, PDF,... 2ème Génération WWW (Fin 1990) :! Séparation de la structure de la présentation! Fondée sur XML, XSL,.. 3ème Génération WWW : Web Sémantique (WS)! Séparation de la sémantique et la structure! Fondée sur RDF, RDFS, Ontologies, Logique,... Introduction au Web Sémantique - Bernard ESPINASSE - 16

Première vision du Web Sémantique [Tim Berners- Lee] Accès automatique à l information basé sur une sémantique explicite des données :! interprétable par l ordinateur! associée à des théories sur des domaines (ontologies),! qui permettra l accès à de nouveaux services sur Internet Automatisation ou semi-automatisation de :! Recherche d informations pertinentes : Rappel et Précision! Recherche d information précise : Réutilisation, partage, échange et composition possible des informations retrouvées capacité à concevoir certaines «opérations» automatiquement Architecture du Web Sémantique Le Web Sémantique (WS) nécessite : Une architecture partagée par tous pour échanger des ressources sur Internet Des standards pour :! Les ontologies et mécanismes d inférence associés! La sémantique explicite des ressources ou méta-données sémantiques liées à des ontologies! Le format des ressources ou documents! L adressage des ressources ou documents Introduction au Web Sémantique - Bernard ESPINASSE - 17 Introduction au Web Sémantique - Bernard ESPINASSE - 18 Web Actuel versus Web Sémantique Architecture du Web Sémantique (W3C) Web actuel Web Sémantique (WS)! Ensemble de documents! Ensemble de connaissances! Basé essentiellement sur HTML! Basé essentiellement sur XML et RDF(S)! Recherche par mots-clés! Recherche par concepts (ontologie)! Utilisable par l!être humain! Utilisable par la machine Confiance Preuve Logique Ontologies RDF Schemas RDF XML + names spaces URI & URL Niveaux sémantiques Niveau syntaxique Niveau nommage et adressage Introduction au Web Sémantique - Bernard ESPINASSE - 19 Introduction au Web Sémantique - Bernard ESPINASSE - 20

Les langages du Web Sémantique (W3C) OWL : langage de représentation d'ontologies complexes RDFS : langage de classes, simple, pour la représentation de structures et d'ontologies simples avec description hiérarchique des concepts et des propriétés RDF : réseau sémantique de base, méta-données,... Les langages du W3C Complexité pour le producteur de ressources Simplicité Interprétation par les machines Interprétation par les humains XML : couche de transport syntaxique Quel niveau de complexité est nécessaire?! complexité algorithmique des mécanismes d'inférences! complexité technique pour les constructeurs d'outils! complexité conceptuelle pour l'utilisateur moyen Introduction au Web Sémantique - Bernard ESPINASSE - 21 Introduction au Web Sémantique - Bernard ESPINASSE - 22 Niveau Nommage et Adressage: URI et URL une URI (Uniform Resource Identifier) = chaîne de caractère identifiant de façon unique une ressource ou un concept sur le Web :! Chacun peut en créer un URI! Ressource avec une URI! être sur le Web Ex : RFC 3986 : http://www.gbiv.com/protocols/uri/rfc/rfc3986.html! URN = URI persistante les URL (Uniform Resource Locator) = URI permettant en plus de localiser (d!accéder) à la ressource : ftp, mailto, gopher Ex : http://www.lsis.org! URL: ftp, gopher, http, internet mail, etc. (normalisée) : 1 Protocole, 1 machine, 1 chemin Niveau Syntaxique: le langage XML XML = extensible Markup Language : langage de balises (sous-ensemble de SGML simple à implanter, mais extensible) : chacun défini ses propres balises permet la séparation de la présentation et du contenu a été conçu pour :! décrire des données en se concentrant sur leur structure! assurer l interopérabilité XML utilise un Document Type Definition (DTD) or an XML Schéma pour un «modèle» des données XML et HTML complémentaires :! XML ne remplace pas HTML (HTML pour l!affichage des données, leur présentation (taille, couleur,...))! XSL / XSLT transforme XML en HTML Introduction au Web Sémantique - Bernard ESPINASSE - 23 Introduction au Web Sémantique - Bernard ESPINASSE - 24

Niveau Syntaxique : exemple XML <?xml version="1.0" encoding="iso-8859-1"?> <!-- Edited with XML Spy v4.2 --> <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</title> <ARTIST>Bonnie Tyler</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> </CATALOG> Niveau Syntaxique : propriétés de XML Propriétés de XML : Indépendant des logiciels et matériels Infrastructure des échanges de données structurées Interopérabilité : conçu pour décrire des données, les stocker, les transporter, les échanger et les partager :! XML DTD : DTD définissant les éléments constitutifs d un documents, sa structure syntaxique (un arbre) d un document type à l aide d une grammaire! permet ainsi à toute application : de vérifier la conformité d un document à la DTD de le manipuler et le transformer s il est conforme à cette DTD. XML peut être utilisé pour créer de nouveaux langages : WAP et WML (Wireless Markup Language), MATHML, etc. Introduction au Web Sémantique - Bernard ESPINASSE - 25 Introduction au Web Sémantique - Bernard ESPINASSE - 26 Niveau Syntaxique : limites de XML <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> XML ne contient aucune sémantique formelle pour l ordinateur Ce sont les humains qui donnent un sens, une sémantique, aux balises et leur contenu pas les machines : Ex : la balise «CD» ne référence rien pour une machine, la référence est uniquement faite dans l esprit des lecteurs humains " D où un autre langage, RDF pour traiter la sémantique Niveau sémantique : langage RDF RDF (Resource Description Framework) = langage permettant de représenter des informations sur des ressources Une déclaration RDF = triplet : «Objet, Attribut, Valeur» dont chaque élément peut être un littéral ou une ressource Web Le modèle de données RDF est formellement défini par:! Un ensemble appelé Ressources.! Un ensemble appelé Littéraux! Un sous-ensemble de Ressources appelées Propriétés.! Un ensemble appelé Déclarations, dont chaque élément est un triplet (prédicat, sujet, objet) dans lequel : «prédicat» = propriété (membre de Propriétés), «sujet» = ressource (membre de Ressources) «objet» = soit une ressource, soit un littéral (membre de littéraux) Des déclarations RDF peuvent être représentées par un Graphe orienté Introduction au Web Sémantique - Bernard ESPINASSE - 27 Introduction au Web Sémantique - Bernard ESPINASSE - 28

Niveau sémantique : langage RDF issus de communautés diverses :! standardisation du Web,! bibliothèques, documents structurés,! représentation de connaissances (IA),! programmation orientée objets et langages de modélisation, Langage assurant l interopérabilité " au niveau sémantique - entre applications pour l échange, le partage et la réutilisation d informations non interprétable pour la machine Langages Interprétables par une machine :! ils possèdent pour cela une sémantique formelle! le sens repose sur une théorie des modèles associant une valeur de vérité à chaque formule bien formée : logique formelle Niveau sémantique : sémantique RDF/RDFS Logique :! Théorie axiomatique! Un langage et des formules bien formées! Des axiomes, des règles d inférences! A, (A! B)!-- B! Des théorèmes: formules bien formées déduites des axiomes et règles d inférences Théorie des modèles :! Interprétation, Formules vraies/fausses! Formules valides Théorème " Formule valide Un démonstrateur automatique de théorèmes est un algorithme qui «respecte les axiomes et règles d inférences» Les opérations de la machine «respecte la sémantique formelle» Introduction au Web Sémantique - Bernard ESPINASSE - 29 Introduction au Web Sémantique - Bernard ESPINASSE - 30 Niveau sémantique : exemple RDF (1) RDF est basé sur XML permettant de représenter des déclarations RDF Exemple de déclarations RDF : <?xml version="1.0"?> <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:exvoc="http://www.exemple.org/voc#"> <rdf:description rdf:about="http://www.exemple.org/annuaire#tbl"> <exvoc:nom>tim Berners-Lee</exvoc:nom> <exvoc:email rdf:resource="mailto:tbl@exemple.org"/> <exvoc:fonction rdf:resource="http://www.exemple.org/voc#chef"/> </rdf:description> </rdf:rdf> Niveau sémantique : exemple RDF (2) Une déclaration est formée :! d!un sujet qui est une URI(ref ) ;! d!un prédicat qui est une URI(ref ) ;! d!un objet qui est une URI(ref ) ou un littéral Graphe RDF associé : http://www.exemple.org/annuaire#tbl (URI de la personne, sujet) a pour http://www.exemple.org/voc#nom (URI du prédicat) Tim Berners-Lee (objet)! Ellipse = URI (sujet ou objet)! Rectangle = Littéral (objet)! Arc = Prédicat Introduction au Web Sémantique - Bernard ESPINASSE - 31 Introduction au Web Sémantique - Bernard ESPINASSE - 32

Niveau sémantique: RDFS (RDF Schema) RDF permet déclarer des propriétés sur des ressources RDF ne permet pas n!exprimer des connaissances sur les propriétés ou sur les types de ressources :! Quelles sont les propriétés autorisées sur un type de ressources?! Quelles sont les valeurs autorisées pour une propriété?! Quels sont les liens entre les types de ressources (généralisation / spécialisation)? Pour cela il faut définir le vocabulaire, exemple : Un Livre est une sorte de Publication, et un Magazine aussi. Toute Publication a un titre, un Livre a un ou plusieurs auteur,... RDF Schema (RDF S) = extension de RDF :! permet de décrire des classes et des propriétés,! mais ne fournit pas un vocabulaire (Publication, auteur... ), il permet de définir un vocabulaire. Niveau sémantique: RDFS RDF-Schema = «système de typage» pour RDF similaire à l!approche orientée objet :! Classes (types) et instances (ressources)! Relation hiérarchique (héritage)! Propriétés (attributs)! Mais : pas de méthodes : description uniquement. Pas de structure fixée : d!autres propriétés peuvent être ajoutées. Une description de vocabulaire est appelée schema et est représentée en RDF sous la forme de triplets toute application qui gère le RDF peut gérer le RDF-Schema, mais une application doit être étendue pour prendre en compte le «sens» du schema. Introduction au Web Sémantique - Bernard ESPINASSE - 33 Introduction au Web Sémantique - Bernard ESPINASSE - 34 Niveau sémantique: Exemple RDFS (1) Une classe :! est un type (ou une catégorie) regroupant plusieurs instances (ressources) partageant des caractéristiques communes.! est identifiée par une URI. Pour préciser qu!une URI est une classe, il faut écrire que cette ressource a pour rdf:type rdfs:class. exvoc:vehicule rdf:type rdfs:class. Pour préciser qu!une URI est une instance d!une classe, il faut écrire que cette ressource a pour rdf:type la classe. exvoit:v1234ab49 rdf:type exvoc:vehicule. Convention : Un nom de classe commence par une majuscule, une instance par une minuscule. Niveau sémantique: Exemple RDFS (2) Généralisation/spécialisation de classes : Une classe peut être sous-classe (spécialisation) d!une ou plusieurs classes : exvoc:voiture rdf:type rdfs:class. exvoc:voiture rdfs:subclassof exvoc:vehicule. exvoc:camion rdf:type rdfs:class. exvoc:camion rdfs:subclassof exvoc:vehicule. exvoc:voiturealouer rdf:type rdfs:class. exvoc:voiturealouer rdfs:subclassof exvoc:voiture, exvoc:peutetreloue. Toute instance de la sous-classe (VoitureALouer) est instance de toutes les super-classes (Voiture, PeutEtreLoue, Vehicule) : Exemple (Syntaxe standard) : <rdf:description rdf:id="voiture"> <rdf:type rdf:resource= "http://www.w3.org/2000/01/rdf-schema#class"/> <rdfs:subclassof rdf:resource="#vehicule"/> </rdf:description> Introduction au Web Sémantique - Bernard ESPINASSE - 35 Introduction au Web Sémantique - Bernard ESPINASSE - 36

Niveau sémantique: Exemple RDFS (3) Propriété : Une propriété est identifiée par une URI. Pour préciser qu!une URI est une propriété, il faut écrire que cette ressource a pour rdf:type rdf:property. Convention : un nom de propriété commence par une minuscule. exvoc:vitessemax rdf:type rdf:property. exvoc:apourmarque rdf:type rdf:property. Le co-domaine d!une propriété définit le type des objets autorisés pour la propriété : exvoc:vitessemax rdfs:range xsd:integer. exvoc:apourmarque rdfs:range exvoc:marquevehicule. exvoc:apourmarque rdfs:range exvoc:marqueeuropeenne. Les objets de apourmarque doivent être des instances de MarqueVehicule et de MarqueEuropeenne Introduction au Web Sémantique - Bernard ESPINASSE - 37 Niveau sémantique : les Ontologies Définition [Gruber 1993]: An ontology is a formal, explicit specification of a shared conceptualization of a domain of interest. Conceptualisation : représenter les objets, les concepts et autres entités qui sont supposés exister dans un domaine particulier et les relations qu ils entretiennent entre eux. Rôle des ontologies dans le SW :! Définir de manière déclarative un vocabulaire commun résultat d un consensus social dans un domaine donné :! Chaque élément de vocabulaire possède une interprétation unique partagée par tous les membres du domaine! Décrire la sémantique des termes et leurs relations :! L interprétation de chaque terme est unique er résulte d!une sémantique formelle.! L ensemble des termes et leurs relations fournissent un cadre interprétatif dépourvu d ambiguïté pour chaque terme.! Fournir des mécanismes d inférence qui respectent la sémantique formelle. Introduction au Web Sémantique - Bernard ESPINASSE - 38 Niveau sémantique : un langage pour les ontologies Si l'on veut définir un langage pour la description d'ontologies qui soit une extension de RDF :! en RDF, une classe peut être une instance d'une autre classe: toto:c1 rdf:type rdfs:class. toto:c2 rdf:type rdfs:class. toto:c1 rdf:type rdfs:c2.! la logique descriptive est souvent trop puissante pour nos besoins, ce qui entraîne une complexité de calcul plus grande que nécessaire.! En fait on souhaiterait un peu plus d'expressivité que RDF, mais pas autant que la logique descriptive Ontology Web Langage : OWL! Issu de DAML (Darpa-US) + OIL (Europe)! Conçu pour des applications qui traitent le contenu, pas uniquement la présentation des informations! Une extension de RDFS, muni d une sémantique formelle! Constitué de 3 langages :! OWL Lite : Classification hiérarchie + contraintes simples! OWL DL : Pouvoir d expression supérieur, avec complétude (toutes les conclusions sont calculables) et décidabilite# C est une logique de description (DL)! OWL Full : Expressivité maximale, pas de garantie sur les résultats de calculs On a :! Toute ontologie OWL Lite valide est une ontologie OWL DL valide! Toute ontologie OWL DL valide est une ontologie OWL Full valide! Toute conclusion valide de OWL Lite est une conclusion valide de OWL DL! Toute conclusion valide de OWL DL est une conclusion valide de OWL Full Exemples : http://www.schemaweb.info/schema/browseschema.aspx http://www.daml.org/ontologies/category.html Introduction au Web Sémantique - Bernard ESPINASSE - 39 Introduction au Web Sémantique - Bernard ESPINASSE - 40

Ontology Web Langage : OWL! définition de classes simple : Exemple OWL (1) (d!après M. Gagnon) syntaxe RDF/XML <owl:class rdf:id="professor"> <rdfs:subclassof> <owl:class rdf:about="#staffmember"/> </rdfs:subclassof> </owl:class>! Remarque : on n'utilise pas les classes de RDF. Introduction au Web Sémantique - Bernard ESPINASSE - 41 Introduction au Web Sémantique - Bernard ESPINASSE - 42 Exemple OWL (2) Syntaxe RDF/XML : <?xml version="1.0"?> <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#"> <owl:ontology rdf:about="www.dgi.polymtl.ca/staff"/> <owl:class rdf:id= Professor"/> <rdfs:subclassof> <owl:class rdf:id="staffmember"/> </rdfs:subclassof> <owl:class rdf:id="staffmember"/> <owl:class rdf:id="workplace"/> <owl:objectproperty rdf:id="worksat"> <rdfs:range rdf:resource="#workplace"/> <rdfs:domain rdf:resource="#staffmember"/> <rdfs:subpropertyof> <owl:objectproperty rdf:id="hasactivity"/> </rdfs:subpropertyof> </owl:objectproperty> </rdf:rdf> Introduction au Web Sémantique - Bernard ESPINASSE - 43