Le WEB. Gérard Florin. Laboratoire Cedric Conservatoire National des Arts et Métiers



Documents pareils
18 TCP Les protocoles de domaines d applications

Internet et Programmation!

Fonctionnement d Internet

Serveurs de noms Protocoles HTTP et FTP

Plan Général Prévisionnel (1/2) Internet et Outils L1/IO François Armand. Plan Général Prévisionnel (2/2) Unix, Réseau: Plan

Introduction aux Technologies de l Internet

Gilles.Roussel univ-mlv.fr HTTP/1.1 RFC 2068

II/ Le modèle OSI II.1/ Présentation du modèle OSI(Open Systems Interconnection)

Le réseau Internet.

Plan. Le système de transfert de fichiers d'internet. Introduction aux systèmes de transfert de fichiers Le protocole FTP.

Mr. B. Benaissa. Centre universitaire Nâama LOGO

Protocoles Applicatifs

Plan. Programmation Internet Cours 3. Organismes de standardisation

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Programmation Internet Cours 4

Cours CCNA 1. Exercices

Installation d un serveur HTTP (Hypertext Transfer Protocol) sous Débian 6

GENERALITES. COURS TCP/IP Niveau 1

Glossaire. ( themanualpage.org) soumises à la licence GNU FDL.

Présentation du modèle OSI(Open Systems Interconnection)

Les services usuels de l Internet

Culture numérique. Histoire et structure de l'internet. Enseignement commun Université de Caen

Outils de l Internet

Adresses universelles (URL, Uniform Resource Locators)

Les commandes relatives aux réseaux

Présentation Internet

Internet. DNS World Wide Web. Divers. Mécanismes de base Exécution d'applications sur le web. Proxy, fire-wall

Services sur réseaux. Trois services à la loupe. Dominique PRESENT Dépt S.R.C. - I.U.T. de Marne la Vallée

Couche application. La couche application est la plus élevée du modèle de référence.

Algorithmique et langages du Web

Chapitre : Les Protocoles

Utiliser Améliorer Prêcher. Introduction à LDAP

Formation Site Web. Menu du jour. Le web comment ça marche? Créer un site web Une solution proposée pour débuter La suite?

Réseaux. DNS (Domaine Name System) Master Miage 1 Université de Nice - Sophia Antipolis. (second semestre )

L3 informatique Réseaux : Configuration d une interface réseau

Installation et configuration de Vulture Lundi 2 février 2009

1 Résolution de nom Introduction à la résolution de noms Le système DNS Les types de requêtes DNS...

TIC. Réseau informatique. Historique - 1. Historique - 2. TC - IUT Montpellier Internet et le Web

Nommage et adressage dans Internet

Le service de nom : DNS

Introduction aux «Services Web»

Informatique Générale Les réseaux

Culture informatique. Cours n 9 : Les réseaux informatiques (suite)

M Architecture des réseaux

Packet Tracer : configuration des listes de contrôle d'accès étendues, scénario 1

Introduction à l'internet et ces Protocoles

Culture numérique Nommage et gouvernance de l'internet

ASRb/Unix Avancé II. Chapitre 2. Utilitaires réseaux. Arnaud Clérentin, IUT d Amiens, département Informatique

Protocoles DHCP et DNS

Cours de sécurité. Pare-feux ( Firewalls ) Gérard Florin -CNAM - - Laboratoire CEDRIC -

A. À propos des annuaires

RTE Technologies. RTE Geoloc. Configuration avec Proxy ou Firewall

Le service FTP. M.BOUABID, Page 1 sur 5

1 ère Université WEB. Courbevoie Samedi 21 octobre Votre site interactif sur internet.

Réseaux IUP2 / 2005 DNS Système de Noms de Domaine

Services Réseaux - Couche Application. TODARO Cédric

Introduction. Adresses

Exemple d application: l annuaire DNS Claude Chaudet

Caruso33 : une association à votre service

Internet. Première génération de services. William El Kaim. Première génération de services,v1.

VoIP et "NAT" VoIP et "NAT" 1/ La Traduction d'adresse réseau. 1/ La traduction d'adresse réseau. 1/ La traduction d'adresse réseau

FTPS AVEC UNE APPLIANCE FAST360 EN COUPURE. Table des matières

S28 - La mise en œuvre de SSO (Single Sign On) avec EIM (Enterprise Identity Mapping)

HTTP HTTP. IUT1 dpt SRC L Isle d Abeau Jean-françois Berdjugin. Introduction et architecture Messages Authentification Conclusion

Quelques protocoles et outils réseaux

1.Introduction - Modèle en couches - OSI TCP/IP

SIP. Plan. Introduction Architecture SIP Messages SIP Exemples d établissement de session Enregistrement

Les outils de création de sites web

Configurer le Serveur avec une adresse IP Statique (INTERFACE :FastEthernet) : et un masque

Le Client/Serveur avec Enterprise Miner version 4

Comment surfer tranquille au bureau

Cours Master Recherche RI 7 Extraction et Intégration d'information du Web «Services Web»

Architecture JEE. Objectifs attendus. Serveurs d applications JEE. Architectures JEE Normes JEE. Systèmes distribués

FORMATION PcVue. Mise en œuvre de WEBVUE. Journées de formation au logiciel de supervision PcVue 8.1. Lieu : Lycée Pablo Neruda Saint Martin d hères

Internets. Informatique de l Internet: le(s) Internet(s) Composantes de l internet R3LR RENATER

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

1. Présentation du TP

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

BTS SIO SISR3 TP 1-I Le service Web [1] Le service Web [1]

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

Application Web et J2EE

Live box et Nas Synology

Types MIME (2) Typage des ressources Internet. Les URI. Syntaxe dans les URI. Possibilité de spécifier un paramètre du sous-type

Protocole SSH-2.0. Tuan-Tu, TRAN. Janvier 2009

FTP / WebDeploy /WebDAV. Manuel

L annuaire et le Service DNS

Administration Système & Réseau. Domain Name System Historique & Concepts Fonctionnalités & Hiérarchie Requêtes & Base de donnée DNS

Les serveurs. UE 103b. Guillaume Burel.

Règlement d'exécution de la Loi sur l'utilisation des emblèmes d'état, pour l'utilisation de.ad comme nom de domaine

FORMATION CN01a CITRIX NETSCALER

Les Content Delivery Network (CDN)

Annexe C : Numéros de port couramment utilisés

Services Réseau SSH. Michaël Hauspie. Licence Professionnelle Réseaux et Télécommunications

Capture, Filtrage et Analyse de trames ETHERNET avec le logiciel Wireshark. Etape 1 : Lancement des machines virtuelles VMWARE et de Wireshark

1 LE L S S ERV R EURS Si 5

Développement des Systèmes d Information

Serveur Appliance IPAM et Services Réseaux

SIP A. Aoun - La Visioconférence SIP - 1

Transfert de fichiers (ftp) avec dreamweaver cs5 hébergement et nom de domaine. MC Benveniste

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Transcription:

Le WEB Gérard Florin Laboratoire Cedric Conservatoire National des Arts et Métiers 1

Désignation et liaison dans le WEB I Les localisateurs URL 'Uniform Resource Locators' II Les noms URN 'Uniform Resource Names' III Les informations de niveau méta URC 'Uniform Resource Characteristics' IV Les identificateurs URI 'Uniform Resource Identifiers' 2

I Désignation de base dans le WEB: les localisateurs URL Uniform Resource Locators RFC 1738 Décembre 1994 - La désignation avec les URL est placée dans le cadre d'un ensemble de schémas associés à des applications Internet: ftp http gopher mailto news nntp telnet wais file. File Transfer protocol Hypertext Transfer Protocol Gopher protocol Adresse de courrier électronique USENET news USENET news avec NNTP Référence session interactive Wide Area Information Servers Noms de fichiers spécifiques D autres schéma sont proposés. - Un schéma définit une construction et une interprétation des noms ou adresses. 3

Syntaxe commune aux schémas Forme générale des URLs <nom_schema>: <partie-spécifique-schéma> Forme générale des URL Internet - Pour Internet la partie spécifique du schéma commence par // (en fait pas d'autre architecture de réseau utilisée) - En Internet on définit un accès à distance en TCP/IP en tant qu'usager d'un OS. //<user>:<password>@<host>:<port>/ <url-path> 4

Signification des champs d une URL Internet User : Un nom d'usager optionnel. Password : Un mot de passe optionnel. Host : Le nom DNS d'un hôte (FQDN fully qualified domain name) ou une adresse IP Port : Un numéro de port TCP (optionnel les protocoles ont un port par défaut). url-path: Le reste du nom est spécifique du schéma de désignation. Il s agit d un chemin d accès à la ressource. Remarque Le "/" entre host (ou port) et url-path ne fait pas partie de l'url-path. 5

Le schéma d'adressage HTTP Schéma très tourné vers la localisation Protocole Numéro de port Internet http : // www.cnam.fr : 8080 / cours.htm Adresse hôte DNS ou IP Délimiteurs Chemin d accès à une ressource Aspects spécifiques HTTP de la partie définition du chemin d'accès url-path = <path>?<search-part> <path> : un chemin d'accès absolu à la ressource demandée sur le site serveur. <search-part> : une chaîne de caractère qui complète le nom par des paramètres complémentaires définissant une question. 6

Complément : Accès interne aux documents - Complément d'adressage à l intérieur d un document. - Non défini dans la RFC 1738 URL mais dans le cadre des URI. url-path = <path>#<fragment>?<search-part> <fragment> : le nom d'une ancre locale d'un document permettant un accès interne. - Balise A présente dans le document HTML pour définir une ancre locale : <A NAME="etiquette_fragment"></A> - Localisateur du fragment http://<host>/<path>#etiquette_fragment 7

Exemples d URL - Une URL pour une question posée à un moteur de recherche (partie question de la forme symbole=valeur). http://www.google.com/search?q=url+syntax - Une URL avec question et accès interne dans un document. http://home.netscape.com/assist/ extensions.html#topic1?x=7&y=2 Remarques complémentaires - La chaîne question contient des couples (nom de variable, valeur) séparés par des 'esperluettes' (ampersand &). - Si des caractères réservés dans la création des URL (";""/""?"":""@""&""=""+""$" ",")doivent figurer dans les données une procédure d'échappement est définie: escape = "%" HEX HEX 8

Réalisation de la liaison avec les URLs Mise en œuvre dans le protocole HTTP - L'analyse syntaxique de l'url permet de délimiter les éléments de la référence. - La liaison est très facile car les éléments sont presque tous des adresses =>directement utilisables pour la liaison. Détermination de l'adresse IP du serveur - Soit elle est en clair. - Soit la partie nom de domaine DNS est soumise au serveur d'annuaire DNS qui retourne l'adresse IP de l'hôte distant Ouverture de connexion TCP sur le serveur - Au moyen de l'adresse IP et du numéro de port (ou du port par défaut 80). Utilisation par le serveur de la partie chemin d'accès de l'url - Chemin d'accès absolu dans le système de fichier du site distant. 9

Conclusion: Avantages Inconvénients du schéma d'adressage de base URL HTTP - Les URL HTTP définissent un adressage absolu pratique pour la localisation des ressources mais uniquement pour cela. Limitations - Manque d'outils d'adressage relatif (pour définir une ressource relativement à une autre et éviter des problèmes de relocation des liens lors du déplacement d'une page HTML). - Les URL comportent essentiellement des informations d adresses ( codées en dur ). Protocole, Adresse DNS, No Port Accès en échec (destruction/migration de ressource). Seul mécanisme possible de migration: les liens de poursuite. - Les URL n'offrent pas de description du contenu (informations méta). 10

II Désignation WEB : Les noms symboliques URN Uniform Resource Names - Les URN ont été définis au départ pour résoudre le problème de persistance des noms que ne possèdent pas les URLs. - Les noms choisis doivent donc être indépendants de la localisation des ressources: les URN sont en fait les noms symboliques du WEB. - La résolution doit faire appel à des services d'annuaires qui font correspondre noms symboliques et adresses. - Si on ajoute aux noms symboliques des meta-informations (des attributs comme "titre'', "auteur'' or "sujet'') on relie le problème des URN à celui de la recherche documentaire (voir URC). - Plusieurs structurations ont été proposées. 11

II.1 URN selon la RFC 2141 Mai 1997 - Définition d'un ensemble de noms symboliques, uniques, persistants. - Forme générale retenue similaire aux URL: Schéma_d'adressage: Chaîne opaque - Un nouveau schéma d'adressage est introduit pour les noms symboliques. - Il est baptisé 'urn' (insensible à la casse). - La structure générale d'un urn est <URN> ::= "urn:" <NID> ":" <NSS> <NID> 'Namespace IDentifier' ou autorité. Le NID détermine la structure syntaxique de la partie NSS 'Namespace Specific String'. Partie autorité responsable de la sructuration d'un espace de noms. <NSS> 'Namespace Specific String'. La partie NSS définit un objet proprement dit. 12

Identification de l'autorité de nommage NID 'Namespace Identifier' - Symboles de 32 caractères au plus (alphanumériques avec _). Exemple: urn:cnam_fr - La possibilité d'utiliser. + semble en débat. Exemple: urn:cnam.fr:coursinfos - L'unicité des noms repose principalement sur une autorité de contrôle des NID. Ici on trouve un nom de domaine DNS. Identification locale de l'objet NSS 'Namespace Specific String' - Symboles alphanumériques avec les caractères spéciaux "(" ")" "+" "," "-" "." ":" "=" "@" ";" "$" "_" "!" "*" "'" - Une procédure de transparence est définie au moyen du caractère %. Les URN RFC 2141 sont pour l'instant encore peu utilisés. Ils devraient prendre de l'extension avec les services d'annuaires. 13

2 Les URN selon l'approche des PURL: URL persistantes - Une PURL a la forme d'une URL mais son interprétation sémantique est différente. - Elle comporte trois parties: (1) Une définition de protocole (de schéma d'adressage) Exemple: http (2) une adresse de serveur d'annuaire, Exemple: //purlserv.cnam.fr (3) un nom symbolique que le résolveur transforme en une URL effective par consultation d'annuaire. Exemple: /chemin/symbole http://purlserv.cnam.fr/chemin/ symbole 14

Bibliographie sur les URN RFC 2141, May 1997 - URN Syntax RFC 2288 February 1998 - R.Moats 'Using Existing Bibliographic Identifiers as Uniform Resource Names' RFC 1737, December 1994 - K. Sollins, L. Masinter - C. Lynch, R. Daniel 'Functional Requirements for Uniform Resource Names' RFC2611, June 1999 - L.Daigle, D.van Gulik, R. Iannella, P. Falstrom 'A URN Namespace for IETF Documents' RFC 2483, January 1999 - M. Mealling URI 'Resolution Services Necessary for URN Resolution' RFC2168 June 1997 - 'R. Daniel, M. Mealling Resolution of Uniform Resource Identifiers using the Domain Name System' RFC 2276, January 1998 - K.Sollins 'Architectural Principles of Uniform Resource Name Resolution' 15

III Désignation dans le WEB: les informations de niveau méta URC Uniform Resource Characteristics Objectif: Rajouter aux ressources WEB des descriptions de caractéristiques (contenu, date, auteur,.). - Les URC codent les informations de niveau meta concernant les ressources. - Actuellement le plus souvent sous la forme d'attributs (nom, valeur). - Différentes expériences ont fonctionné sur l'internet. IAFA Internet Anonymous FTP Archives formats,. WHOIS++ templates,. SOIF 'Summary Object Interchange Format' HARVEST - Le groupe de travail W3C sur le thème: RDF 'Resource Description Framework' a produit un modèle et une syntaxe de description XML. 16

IV Désignation WEB: Les identificateurs URI Uniform Resource Identifier RFC 2396 Août 1998 Une formulation de la désignation WEB destinée à définir dans le même cadre toutes les améliorations des mécanismes d'adressage proposés dans des RFCs. URI URL URN - URI: la norme actuellement en vigueur dans le WEB de nommage et d adressage au moyen de chaînes ASCII. 17

Les trois aspects de l'adressage WEB URL Uniform Resource Locators. L ensemble des schémas de désignation comportant un moyen explicite d accès à une ressource pour un protocole donné. URN Uniform Resource Names. 1. Un URI tel que la ressource est garantie disponible, persistante (un URN peut prendre la forme d un URL ex les PURL). 2. Un schéma particulier de désignation spécifié par la RFC2141 pour des noms symboliques (identificateurs de ressources persistants, indépendants de la localisation). URI Uniform Resource Identifiers. La réunion des deux systèmes de nommage précédents et d'un nommage des ressources relatif. 18

Syntaxe des URI - Les URIs HTTP peuvent être définis selon deux approches: absolue ou relative. URI = ( absoluteuri relativeuri ) [ "#" fragment ] - Les URI absolus sont indépendants du contexte dans lequel ils sont utilisés. - Ils commencent toujours comme les URLS par un nom de schéma d'adressage. absoluteuri = scheme ":" *( uchar reserved ) - Les URI relatives commencent par la partie chemin d'accès réseau ou par un chemin d'accès fichier absolu ou relatif. relativeuri= net_path abs_path rel_path net_path = "//" net_loc [ abs_path ] abs_path = "/" rel_path rel_path = [ path ] [ ";" params ] [ "?" query ] Remarques: a) Adresse absolue/relative au niveau des fichiers. b) [ ";" params ] paramètres complétant l'adresse (auth=mandatory). 19

URI d'adressage relatif - La notion d'uri d'adressage "relatif" implique qu'il existe une base de départ pour déterminer un URI absolu de base. - Quatre propositions pour définir la base:.----------------------------------------------------------..----------------------------------------------------..----------------------------------------------..----------------------------------------..----------------------------------. <relative_reference> `----------------------------------' (1) Base URI embedded in the document's content `----------------------------------------' (2) Base URI of the encapsulating entity (message, document, or none). `----------------------------------------------' (3) URI used to retrieve the entity `----------------------------------------------------' (4) Default Base URI is application-dependent `----------------------------------------------------------' - Des mécanismes d'adressage relatif doivent être définis: ils sont très similaires aux mécanismes de désignation des systèmes de fichier UNIX. le répertoire courant,.. le père etc 20

Exemples d'uri relatives - Pour l'uri absolue de base http://a/b/c/d;p?q les URIs relatives = donnent le résultat: g:h = g:h g = http://a/b/c/g./g = http://a/b/c/g g/ = http://a/b/c/g/ /g = http://a/g //g = http://g?y = http://a/b/c/?y g?y = http://a/b/c/g?y #s = (current document)#s g#s = http://a/b/c/g#s g?y#s = http://a/b/c/g?y#s ;x = http://a/b/c/;x g;x = http://a/b/c/g;x g;x?y#s = http://a/b/c/g;x?y#s. = http://a/b/c/./ = http://a/b/c/.. = http://a/b/../ = http://a/b/../g = http://a/b/g../.. = http://a/ 21

Conclusion adressage WEB - De très loin le système d'adressage en univers réparti le plus utilisé. - Reste marqué par les motivations d'origine de désignation de documents. Mais des évolutions successives lui ont apporté des caractéristiques plus générales d'un système de désignation. Les limitations - Certaines caractéristiques récemment introduites demandent à être réellement implantées et utilisées (noms symboliques, informations méta, ) - Le système de désignation WEB est corienté point à point: pas de notions de relation 1 vers N (groupes). => Avec XML: Xlink - Tous les éléments d'un document ne sont pas adressables => Avec XML: Xpath 22

Bibliographie: Désignation WEB RFC 1630 Universal Resource Identifiers in WWW RFC 1736 Functional Recommendations for Internet Resource Locators RFC 1737 Functional Requirements for URNs. RFC 1738 Uniform Resource Locators (URL) RFC 1808 Relative URLs RFC 1959 An LDAP URL Format RFC 2016 Uniform Resource Agents (URAs) RFC 2056 URL for Z39.50 RFC 2111 Content-ID and Message-ID URL RFC 2122 VEMMI URL Specification RFC 2141 URN Syntax RFC 2168 Resolution of Uniform Resource Identifiers using the Domain Name System RFC 2276 Architectural Principles of Uniform Resource Name Resolution 23