HTML/XHTML/XML. Olivier Aubert 1/26



Documents pareils
SII Stage d informatique pour l ingénieur

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Autour du web. Une introduction technique Première partie : HTML. Georges-André SILBER Centre de recherche en informatique MINES ParisTech

Thierry BOULANGER. par la pratique. Bases indispensables Concepts et cas pratiques XML. 3 ième édition. Nouvelle édition

Les outils de création de sites web

Programmation Internet Cours 4

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

HMTL. Exemple de fichier HTML. Structure d un document HTML. Exemple de fichier HTML. Balises HTML. IFT1147 Programmation Serveur Web avec PHP

Programmation Web. Madalina Croitoru IUT Montpellier

Les services usuels de l Internet

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Manuel d intégration API FTP SMS ALLMYSMS.COM

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Internet. DNS World Wide Web. Divers. Mécanismes de base Exécution d'applications sur le web. Proxy, fire-wall

Petite définition : Présentation :

Gestion documentaire (Extraits du CCI version 1.2)

Installation d un serveur HTTP (Hypertext Transfer Protocol) sous Débian 6

CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN ING

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

TIC. Réseau informatique. Historique - 1. Historique - 2. TC - IUT Montpellier Internet et le Web

FileMaker Server 11. Publication Web personnalisée avec XML et XSLT

4. SERVICES WEB REST 46

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

Introduction à Microsoft InfoPath 2010

NFA016 : Introduction. Pour naviguer sur le Web, il faut : Naviguer: dialoguer avec un serveur web

Glossaire. ( themanualpage.org) soumises à la licence GNU FDL.

Gestion Électronique de Documents et XML. Master 2 TSM

Support pour les langues s écrivant de droite à gauche

Théorie : internet, comment ça marche?

Sommaire : Pourquoi créer un site web? Qu est-ce qu un site Web? Les différents types de sites. Quelles solutions peuvent être employées?

FileMaker Server 12. publication Web personnalisée avec XML

Introduction aux concepts d ez Publish

Sana Sellami. Licence Professionnelle SIL

XML et travail collaboratif : vers un Web sémantique

XML : documents et outils

Services sur réseaux. Trois services à la loupe. Dominique PRESENT Dépt S.R.C. - I.U.T. de Marne la Vallée

Faculté de Génie Chaire industrielle en infrastructures de communication. La technologie XML. Wajdi Elleuch

XML et DOM. Matériel de cours. mars 1999 version 0.3 dernière modification: 24/3/99

BES WEBDEVELOPER ACTIVITÉ RÔLE

les techniques d'extraction, les formulaires et intégration dans un site WEB

Livre Blanc WebSphere Transcoding Publisher

LE CONCEPT DU CMS CHAPITRE 1

WEB & DÉVELOPPEMENT LES BASES DU WEB LE LANGAGE HTML FEUILLES DE STYLES CSS HISTORIQUE D INTERNET ET DU WEB LES DIFFÉRENTS LANGAGES

Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines)

HTML. Notions générales

Le réseau Internet.

26 Centre de Sécurité et de

Guide de réalisation d une campagne marketing

Publication dans le Back Office

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

HTML, CSS, JS et CGI. Elanore Elessar Dimar

XML et Bases de données. Les bases de données XML natives.

INFORMATIQUE & WEB. PARCOURS CERTIFICAT PROFESSIONNEL Programmation de sites Web. 1 an 7 MODULES. Code du diplôme : CP09

Echosgraphik. Ce document sert uniquement à vous donner une vision sur ma manière de travailler et d appréhender un projet

Module BDWEB. Maîtrise d informatique Cours 9 - Xquery. Anne Doucet. anne.doucet@lip6.fr

Optimiser les s marketing Les points essentiels

< Atelier 1 /> Démarrer une application web

Formation Site Web. Menu du jour. Le web comment ça marche? Créer un site web Une solution proposée pour débuter La suite?

Master Technologies numériques appliquées à l'histoire Deuxième année

Webmaster / Webdesigner / Wordpress

Modules du DUT Informatique proposés pour des DCCE en 2014/2015

Module BD et sites WEB

Notes pour l utilisation d Expression Web

Introduction. PHP = Personal Home Pages ou PHP Hypertext Preprocessor. Langage de script interprété (non compilé)

LAB-Multimedia CMS. Guide d'auto-formation. Copyright by LAB-Multimedia 1/22

En proposant une formation souvent moins onéreuse et plus

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x

Demain, encore plus de tifinaghes sur Internet

S7 Le top 10 des raisons d utiliser PHP pour moderniser votre existant IBM i

PHP CLÉS EN MAIN. 76 scripts efficaces pour enrichir vos sites web. par William Steinmetz et Brian Ward

Introduction : présentation de la Business Intelligence

WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

Base de Connaissances SiteAudit. Utiliser les Rapports Planifiés. Sommaire des Fonctionnalités. Les Nouveautés

Programmation des Applications Réparties. Parsers XML DOM et SAX

creer votre site internet en html/css

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

SOUTENANCE ORALE RAPPORT DE PROJET D INFORMATIQUE

Architecture JEE. Objectifs attendus. Serveurs d applications JEE. Architectures JEE Normes JEE. Systèmes distribués

Programmation Internet

WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

Dans nos locaux au 98 Route de Sauve NÎMES. Un ordinateur PC par stagiaire, scanner, imprimante/copieur laser couleur

Un site web collaboratif avec Drupal. Judith Hannoun - Journées INSHS 16 Octobre 2012

RESPONSIVE WEB DESIGN

Diffuser un contenu sur Internet : notions de base... 13

La balise object incorporer du contenu en HTML valide strict

UE 8 Systèmes d information de gestion Le programme

Module http MMS AllMySMS.com Manuel d intégration

Cours Bases de données

Formation Word/Excel. Présentateur: Christian Desrochers Baccalauréat en informatique Clé Informatique, 15 février 2007

Système de gestion de contenu

Formation HTML / CSS. ar dionoea

PROSOP : un système de gestion de bases de données prosopographiques

Utiliser un tableau de données

SPIP 1.9. Créer son site avec des outils libres. Michel-Marie Maudet Anne-Laure Quatravaux Dominique Quatravaux. Avec la contribution de Perline

Les types de fichiers

Transcription:

HTML/XHTML/XML Olivier Aubert 1/26

Liens http://www.brics.dk/~amoeller/xml/overview.html http://www.w3.org/tr/xhtml1/#guidelines : annexe C, compatibility guidelines http://www710.univ-lyon1.fr/~exco/cours/cours/htm 2/26

Qu est-ce que HTML? HyperText Markup Language Qu est ce que l hypertexte? un document qui contient des liens vers d autres documents (texte, sons, images, etc) les liens peuvent être activés automatiquement ou à la demande Qu est-ce qu un langage de markup? une notation pour écrire du texte avec des balises (tags) les balises indiquent la structure du texte les balises ont des noms et des attributs les balises peuvent contenir une partie de texte 3/26

Motivation originale de HTML Échanger des données sur Internet Les données sont publiées par des serveurs Les données sont présentées par les clients (navigateurs) HTML a été créé par Tim Berners-Lee et Robert Caillau au CERN en 1991 Objectif : diffuser les résultats des expériences menées HTML décrit la structure des documents Les navigateurs peuvent interpréter les balises de différentes manières Le document reste compréhensible même si certaines balises sont ignorées HTML a combiné plusieurs idées Le concept d hypertexte est connu depuis 1945 (Vannevar Bush) Le concept de langage à balises depuis 1970 (SGML) 4/26

Un format compact et lisible La plupart des formats de documents sont gourmands en taille l auteur contrôle précisément la mise en page tous les détails, y compris les descriptions des caractères, sont inclus En comparaison, HTML est économe l auteur sacrifie le contrôle pour la taille on ne représente que le contenu et la structure logique Conséquences : économies de stockage, économie de coût de transfert Les documents HTML peuvent être édités et modifiés par n importe quel éditeur texte 5/26

Structure logique vs physique À l origine, HTML ne décrivait que la structure h2 : ceci est un titre de niveau 2 em : ce texte doit être mis en évidence ul : ceci est une liste non ordonnées d éléments Rapidement, les utilisateurs (surtout non-scientifiques) ont voulu plus de contrôle Le titre doit être centré et écrit en Times-Roman en 28pt Le texte doit être mis en italique Ceci a conduit à l intégration de balises décrivant la structure physique du document 6/26

Feuilles de style Cascading Style Sheets (CSS) spécifient les propriétés physiques des balises HTML sont généralement stockées dans un fichier séparé peuvent être utilisées par plusieurs documents Avantages Les propriétés logiques et physiques sont séparées Des groupes de documents peuvent partager une apparence commune L apparence des documents peut facilement être modifiée 7/26

Feuilles de style (II) Principes Permet de définir plus de 50 propriétés pour chaque balise Les définitions pour une balise peuvent varier suivant son contexte Les propriétés non définies sont héritées des balises qui contiennent la balise courante Les feuilles de style permettent de conserver le caractère logique des balises. Cependant, seules des propriétés superficielles sont définissables 8/26

Exemple Feuille de style : ensemble de sélecteurs et de propriétés B {color:red;} B B {color:blue;} B.foo {color:green;} B B.foo {color:yellow;} B.bar {color:maroon;} Définition de sélecteurs spécifiques dans HTML <b class=foo>hey!</b> <b>wow!! <b>amazing!!!</b> <b class=foo>impressive!!!!</b <b class=bar>k00l!!!!!</b> <i>fantastic!!!!!!</i> </b> 9/26

Les versions de HTML 1992 : Première définition de HTML 1993 : HTML+ (quelques éléments physiques, formulaires, tableaux) 1994 : HTML2.0 (standard pour les éléments principaux) HTML3.0 (extension de HTML+ soumise en tant que draft) 1995 : balises non-standard spécifiques à Netscape 1996 : guerre des navigateurs Netscape/Internet Explorer HTML3.2 : standard basé sur les pratiques existantes 1997 : HTML4.0 (séparation de la structure et de la présentation avec les feuilles de style) 1999 : HTML4.01 (modifications mineures) 2000 : XHTML1.0 (version XML de HTML4.01) 10/26

Syntaxe et validation HTML4.01 définit une syntaxe précise et formelle. Tout document HTML devrait respecter cette syntaxe Elle peut être validée automatiquement Dans les faits, la plupart des documents HTML ne sont pas valides Les auteurs ne font pas attention La seule validation des documents est leur test dans un navigateur Le HTML généré par les éditeurs automatiques est souvent invalide 11/26

Syntaxe et validation (II) Le résultat est toutefois acceptable pour les utilisateurs Les navigateurs font de leur mieux pour tolérer les erreurs Les erreurs de syntaxe ne sont jamais signalées Problèmes Promotion du HTML incorrect Différences de rendu entre différents navigateurs Il est difficile d exploiter les documents de manière automatique 12/26

Problèmes de HTML Le langage est conçu pour représenter de l hypertexte (ensemble limité de balises pas forcément adaptées) La syntaxe et la sémantique sont confondues La structuration des données impose une certaine représentation Les feuilles de style ne présentent qu une solution limitée Des vues différentes ne sont pas supportées Les standards ne sont pas respectés La plupart des documents HTML sont invalides Les navigateurs ont défini leurs propres extensions non-standard 13/26

XML XML = extensible Markup Language XML est un framework permettant de définir des langages à balises Pas d ensemble fixé de balises, elles sont adaptées au type d information à représenter Chaque langage XML est destiné à une utilisation particulière, mais tous les langages partagent de nombreuses fonctionnalités Un seul ensemble d outils génériques pour traiter les documents XML n est pas un remplacement de HTML HTML (XHTML) n est qu un langage défini dans la syntaxe XML XHTML est un langage XML (très populaire) dédié aux documents hypertexte 14/26

Objectifs d XML XML est conçu pour Séparer la syntaxe de la sémantique, afin de proposer un cadre unique de structuration de l information (le rendu est défini par des feuilles de style) Permettre de spécifier des balises spécifiques pour tout domaine d application Permettre l internationalisation des documents (Unicode) Être indépendant des plate-formes utilisées 15/26

Outils associés XML Schema XSLT permet de transformer un document XML en XHTML (ou HTML), avec éventuellement construction automatiques d un sommaire, d un index,... XLink, XPointer et XPath permettent de définir des références croisées XQuery permet d exprimer des requêtes 16/26

Vue conceptuelle de XML Un document XML est un arbre ordonné et labellisé Les feuilles de l arbre (données) contiennent les données effectives (chaînes de caractères). Les nœuds de données doivent être non-vides et non-adjacents à d autres nœuds de données. Les nœuds éléments sont nommés par un nom (souvent appelé type) un ensemble d attributs (couples nom/valeur) Il peuvent avoir des nœuds fils Un arbre XML peut contenir d autres types de feuilles Des instructions de traitement (spécifiques à certains outils ou formats) Des commentaires Des déclarations de type de document 17/26

Vue concrète de XML Document XML = texte Unicode avec des balises et d autres méta-informations Format des balises (sensibles à la casse) :...<foo attr="val"...>...</foo>...<foo attr="val".../> (raccourci pour les lmen Un document XML doit être conforme (well-formed) Les balises de début et de fin doivent correspondre Les éléments doivent être convenablement imbriqués Les valeurs des attributs doivent être entre guillemets Autres méta-informations <?target data...?> Instruction de traitement spécifique à un outil.target identifie l outil concerné. <!-- commentaire --> Commentaire ignoré par les outils de traitement <!DOCTYPE...> Déclaration du type du document 18/26

De SGML à XML SGML (Standard Generalized Markup Language) Standard ISO (1985) De nombreuses applications d archivage dans les domaines gouvernementaux, industriels, militaires, académiques... Une application connue : HTML XML (extensible Markup Language) Recommandation du W3C (1998) Un sous-ensemble de SGML, orienté vers les applications Web Canonical XML Recommandation du W3C (2001) Simplification des documents XML généraux (pas de la norme XML) Représentation canonique des documents Supprime les déclarations de type, impose un ordre sur les attributs, etc 19/26

Fonctionnalités Mécanismes d extensions communes au noyau de la spécification XML : espaces de nommage, inclusion de documents, etc Schémas : grammaires définissant des classes de documents Liens entre documents : généralisation du système d ancres et de liens de HTML Adressage de parties de documents existants : pointeurs robustes et flexibles permettant de spécifier des emplacements Transformations : Conversion d un format de document vers un autre Interrogation : extraction d information, généralisation des bases de données relationnelles 20/26

Technologies associées XML Information Set : définition d une terminologie commune aux concepts de XML XML Signature : signature numérique des ressources XML Encryption : chiffrement des ressources XML Fragment Interchange : manipulation de fragments de documents XML XML Protocol, SOAP (Simple Object Access Protocol) : protocoles d échange d informations XForms : un sous-langage commun pour les formulaires (les formulaires XHTML en sont un cas particulier) RDF Resource Description Framework : un cadre de description des métadonnées (définition de propriétés et de leurs relations) 21/26

Compatibilité HTML Quelques règles de base pour écrire du XHTML qui sera lisible par les anciens navigateurs HTML. Source : http://www.w3.org/tr/xhtml1/#guidelines 22/26

Compatibilité HTML (II) Instructions de traitement (<?target...?>). Elles peuvent être visualisées sur certains navigateurs. De plus, si la déclaration XML n est pas précisée dans le document, on ne peut utiliser que le jeu de caractères par défaut UTF-8 ou UTF-16 Éléments vides Inclure un espace avant le slash final : <hr />, <br />, <img src... />. Ne pas utiliser la syntaxe non minimisée (<br></br>). Minimisation des éléments vides. Si un élément dont le modèle n est pas EMPTY est vide, ne pas utiliser la forme minimisée : on utilisera <p> </p> et non <p />. Feuilles de style et scripts intégrés. Utilisez des feuilles de style ou des scripts externes s ils utilisent les caractères <, &, > ou --. Ne pas utiliser la méthode historique de cacher les feuilles de style ou les scripts à l intérieur de commentaires, qui peuvent être supprimés par les parsers XML. 23/26

Compatibilité HTML (III) Sauts de lignes dans les valeurs d attributs. Ne pas utiliser de saut de ligne ou d espaces multiples dans les valeurs des attributs. Tous les navigateurs ne les gèrent pas de la même façon. Attributs de langage. Utiliser à la fois les attributs lang et xml:lang pour spécifier le langage d un élément. La valeur de xml:lang est prise en compte en priorité. Identificateurs de fragments. En XML, les URI qui se terminent par des identificateurs tels que #foo ne se rapportent pas aux éléments dont l attribut name="foo", mais à ceux dont l attribut id="foo". Pour assurer la compatibilité, préciser les deux attributs. Encodage des caractères. Pour spécifier l encodage des caractères, utiliser les deux spécifications XML et HTML : <?xml version="1.0" encoding="euc-jp"?> <meta http-equiv="content-type" content= text/html; charset="euc-jp" /> 24/26

Compatibilité HTML (IV) Utilisation du et-commercial dans une valeur d attribut. Il faut l exprimer comme une entité & (par exemple un attribut href vers un script avec des arguments) 25/26

Accessibilité www.w3.org/wai Images et animations. Utilisez l attribut alt pour décrire la fonction de chaque graphique. Images cliquables. Utilisez l élément map et décrivez les zones actives. Multimédia. Fournissez légendes et transcriptions pour l audio, et des descriptions pour les vidéos. Liens hypertextes. Utilisez des énoncés pertinents hors contexte. Par exemple, évitez ńcliquer iciż. Organisation. Utilisez des têtes de sections, des listes et une structure cohérente. Utilisez CSS si possible. Figures et diagrammes. Décrivez-les dans la page ou avec l attribut longdesc. Scripts, applets et plug-ins. Fournissez une alternative quand le contenu actif est inaccessible ou non traité. Cadres. Utilisez l élément noframes et des intitulés utiles. Tableaux. Facilitez la lecture ligne par ligne. Résumez. Vérifiez votre travail. Validez, vérifiez 26/26