Maria Georgescul ETI, Université de Genève. Documents Structurés Multilingues (XML) XML = méta-langage. Plan du cours n 2.

Documents pareils
Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

SII Stage d informatique pour l ingénieur

Programmation Internet Cours 4

XML : documents et outils

creer votre site internet en html/css

Les outils de création de sites web

Autour du web. Une introduction technique Première partie : HTML. Georges-André SILBER Centre de recherche en informatique MINES ParisTech

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Learning Object Metadata

HMTL. Exemple de fichier HTML. Structure d un document HTML. Exemple de fichier HTML. Balises HTML. IFT1147 Programmation Serveur Web avec PHP

Modules Prestashop - ExportCatalogue / EXPORT IMPORT POUR MODIFICATIONS EN MASSE DANS PRESTASHOP VERSION Optim'Informatique

Le CMS Content Manager

Internet. DNS World Wide Web. Divers. Mécanismes de base Exécution d'applications sur le web. Proxy, fire-wall

WEB & DÉVELOPPEMENT LES BASES DU WEB LE LANGAGE HTML FEUILLES DE STYLES CSS HISTORIQUE D INTERNET ET DU WEB LES DIFFÉRENTS LANGAGES

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Petite définition : Présentation :

Bibliothèque numérique de l enssib

FICHE 17 : CREER UN SITE WEB

! Text Encoding Initiative

Les services usuels de l Internet

2 LES BASES DU HTML 19 Qu est-ce que le HTML? 20 De quand date le HTML? 20 Écrire son propre code HTML 22

Manuel d intégration API FTP SMS ALLMYSMS.COM

Instructions et spécifications pour la transmission en format XML de déclarations par lots. 30 mai 2015 MODULE 1

Faculté de Génie Chaire industrielle en infrastructures de communication. La technologie XML. Wajdi Elleuch

Comment récupérer un document OOo corrompu. Distribué par Le projet OpenOffice.org

Sage 100 CRM - Guide de la Fusion Avancée Version 8. Mise à jour : 2015 version 8

Le logiciel de création de site internet IZISPOT est un outil très puissant et qui est assez simple après quelques temps d utilisation.

Module : programmation site Web dynamique Naviguer entre les pages via site map

Styler un document sous OpenOffice 4.0

Introduction aux concepts d ez Publish

Production de documents avec XSLT. Production de documents p.1/??

7.0 Guide de la solution Portable sans fil

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

Exemple d application: l annuaire DNS Claude Chaudet

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

PROSOP : un système de gestion de bases de données prosopographiques

données en connaissance et en actions?

CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN ING

Voici les objectifs de la séance d'aujourd'hui :

LE CONCEPT DU CMS CHAPITRE 1

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

2 S I M 1 P H O N E G U I D E U T I L I S A T E U R. Guide d utilisation E-commerce / Prestashop

Systèmes d'informations historique et mutations

1 Comment faire un document Open Office /writer de façon intelligente?

Note de cours. Introduction à Excel 2007

armasuisse Office fédéral de topographie swisstopo Cours geocat.ch 28 avril 2014

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

TP 5 Les CMS, la forme et le fond Internet et Outils (IO2)

Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014

Sage CRM. Sage CRM 7.3 Guide du portable

L'essentiel de XML. Cours XML. Olivier Carton

Atelier de l Ecole doctorale : Latex, Lyx, and friends Chapitre 2 : Gestion de la bibliographie

SITE INTERNET BLOG SITE E-COMMERCE GRILLE D ANALYSE / AUDIT PREMIERE ANALYSE. Entreprises. o Public spécialisé o Etudiants o Enfants

XML et travail collaboratif : vers un Web sémantique

Google Actualités. Propriétés techniques. Structure des URL

Les sites Internet dynamiques. contact : Patrick VINCENT pvincent@erasme.org

Module BDWEB. Maîtrise d informatique Cours 9 - Xquery. Anne Doucet. anne.doucet@lip6.fr

Formation : WEbMaster

Optimiser le référencement de votre site

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Flex. Lire les données de manière contrôlée. Programmation Flex 4 Aurélien VANNIEUWENHUYZE

Installation de DocBook sur un système Linux

Bernard Lecomte. Débuter avec HTML

Gestion de références bibliographiques

HTML, CSS, JS et CGI. Elanore Elessar Dimar

ContactForm et ContactFormLight - Gestionnaires de formulaire pour Prestashop Edité par ARETMIC S.A.

WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

Infrastructure de Données Spatiales

Quelques formats de fichiers courants

Créer une application de livre interactif pour tablette avec Indesign CS6 et Adobe Digital Publishing Suite

FileMaker Server 11. Publication Web personnalisée avec XML et XSLT

REQUEA. v PD 20 mars Mouvements d arrivée / départ de personnels Description produit

Groupe Eyrolles, 2003, ISBN : X

< Atelier 1 /> Démarrer une application web

OASIS Date de publication

Foire aux questions. C est un programme d exploitation et de recherche sur le Web. Exemple : Internet Explorer, Firefox, Opera et Netscape.

Formation Site Web. Menu du jour. Le web comment ça marche? Créer un site web Une solution proposée pour débuter La suite?

LES GRANDES ETAPES DE CREATION D UN WEB DESIGN

4. SERVICES WEB REST 46

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Guide d'utilisation. Mendeley

Gestion Électronique de Documents et XML. Master 2 TSM

Livre Blanc WebSphere Transcoding Publisher

Etapes de création d une revue électronique

Optimiser pour les appareils mobiles

BUREAUTIQUE. 1 Journée. Maîtriser les fonctions de base du logiciel

Chapitre 2 Créer son site et ses pages avec Google Site

Sommaire : Pourquoi créer un site web? Qu est-ce qu un site Web? Les différents types de sites. Quelles solutions peuvent être employées?

INTRODUCTION AU CMS MODX

Formation Webmaster : Création de site Web Initiation + Approfondissement

Optimiser moteur recherche

Tapez le titre de la page «BASTIA ville méditerranéenne», puis allez deux fois à la ligne à l aide de la touche Entrée.

Déploiement d application Silverlight

Module http MMS AllMySMS.com Manuel d intégration

Qu est-ce que l analyse des données qualitatives? TAMS Analyzer n est: Projets collaboratifs. TAMS Analyzer permet:

Transcription:

Documents structurés multilingues () Création de documents bien formés Cours n 2 Rappel cours n 1 Plan du cours n 2 Structure et forme en concepts fondamentaux TIM, Comment créer un set de balises? La syntaxe (règles à suivre lors de la création de documents ) 2 Rappel = méta-langage ensemble de règles permettant la création de langages de balisage personnalisés pour une certaine application Langage = vocabulaire = application d ensemble de balises définies pour une certaine application Rappel: eléments d'un document En-tête: la déclaration : <?xml version="1.0"?> Des balises sans attributs Une balise définis le début et la fin d un ensemble de texte et de balises: <balise_ouvrante> un ensemble de texte et de balises </balise_fermante> Des balises avec des attributs : <balise_ouvrante nom_attribut="valeurattribut"> un ensemble de texte et de balises </balise_fermante> 3 4 Notions de base Structure et forme en (1/3) Structure vs. forme des documents deux dimensions différentes: structure (ou sens, contenu) forme (ou présentation, aspect graphique) On peut: varier la feuille de style pour le même document et/ou utiliser la même feuille de style pour plusieurs documents Document bien formé: respecte la syntaxe La vision hiérarchique des balises valide: respecte en plus les règles d une application particulière (définies par une DTD, c.-à-d Document Type Definition) La sémantique d' l ensemble des éléments qui existent dans un document, leurs relations et leur signification Nombreux "langages" tels que: XLIFF ( Localization Interchange File Format) XCES ( Corpus Encoding Standard) TMX (Translation Memory exchange) XLT ( representation of Lexicons and Terminologies) XHTML (the extensible HyperText Markup Language), etc. 5 6 1

Structure et forme en (2/3) Structure et forme en (3/3) Document bien formé: Feuille de style Document bien formé: Feuille de style + + Navigateur ou éditeur : Navigateur : 7 8 Comment créer un set de balises? Texte structuré par des balises Texte structuré par des tabulations : id title publisher year Savourel:2001 Yves Savourel and Localization Sams Publishing 2001 Ray:2001 Erik T. Ray Learning O'Reilly 2001 9 10 Vision hiérarchique d arbre La syntaxe Yves Savourel id = Savourel:2001 title & Localization bibliography publisher < Sams Publishing > id = Ray:2001 year 2001 Erik T. Ray La syntaxe est constituée de règles minimales à respecter afin de créer des documents bien formés : Les documents ont toujours en première ligne la déclaration Les documents ont toujours un et un seul élément racine Les éléments: peuvent avoir un contenu, ou être vides peuvent avoir des attributs, ou ne pas en avoir doivent toujours être fermés doivent toujours être emboîtés, à partir de la racine Les noms des éléments et des attributs sont sensibles à la casse ne peuvent pas contenir certains caractères La valeur d un attribut doit toujours être entre guillemets Il existe cinq caractères définies par défaut : <, >, &, ", et 11 12 2

Les documents ont toujours en première ligne la déclaration Les documents ont toujours un et un seul élément racine La déclaration débute par les cinq caractères <?xml, suivis d un certain nombre d attributs et se termine par le deux caractères?> Ex: <?xml version="1.0" encoding="utf-8"?> Bien formé Le numéro de la version : 1.0 ou 1.1 L alphabet qui sera utilisé [cours 3]: ISO-8859-1 UTF-8 US-ASCII N est pas bien formé 13 14 un seul élément racine id = Savourel:2001 Structure d arbre bibliography id = Ray:2001 Type d éléments: avec contenu: texte <réponse> Les éléments (1/2) est facile à utiliser. </réponse> balise ouvrante contenu balise fermante title publisher year avec contenu: texte et autres éléments Yves Savourel & Localization < Sams Publishing > 2001 <réponse> est facile à utiliser. </réponse> balise ouvrante contenu balise fermante Erik T. Ray 15 16 Les éléments (2/2) Les attributs Type d éléments: sans contenu, sans attributs la balise est ouverte et fermé à la fois <réponse/> ou balise ouvrante, balise fermante <réponse></réponse> sans contenu, avec des attributs avec contenu, avec des attributs <qr id = '2'> <question> Est-il facile de débuter en? </question> </qr> 17 Utilisation des attributs pour décrire plus clairement les détails d un élément Ex: un attribut peut servir à donner un identifiant unique à un élément décrire une propriété d un élément Guillemets autour de la valeur d un attribut simples ( ' ) ou doubles ( " ) sans formatage <graphique file_ref='smiley.jpg'/> NB: pas acceptés: ` Les attributs figurent uniquement dans les balises ouvrantes Conseil : évitez : <bibliography> < index="savourel:2001" ="Yves Savourel" title='' publisher="sams Publishing" year="2001"/> < index="ray:2001" ="Erik T. Ray" title="learning " publisher="o'reilly" year="2001"/> </bibliography> 18 3

Les éléments doivent toujours être fermés et correctement emboîtes Éléments et attributs: noms permis Éléments emboîtés correctement: <aaa> <bbb> contenu b </bbb> contenu a </aaa> Éléments chevauchés non-permis: <aaa> <bbb> incorrect </aaa> </bbb> Les noms d'éléments peuvent contenir des lettres de A à Z et de a à z, des entiers 0 à 9 des lettres accentuées des caractères _, -,., : Les noms d'éléments ne peuvent pas: contenir d autres signes de ponctuation contenir d'espace vide (blanc, tabulation, retour à la ligne) commencer par autre chose qu une lettre ou les caractères _, : NB: Les noms des éléments et des attributs sont sensibles à la casse <bbb> Incorrect </Bbb> 19 20 Cinq caractères sont définis par défaut : <, >, &, ", et ' Exemple Les caractères < et > sont réservés pour délimiter les noms d'éléments Les caractères " et ' sont utilisés pour délimiter la valeur d un attribut Le caractère & est utilisé pour délimiter l'affichage de certains caractères spéciaux appelés entités Entités prédéfinies en : & - pour afficher le caractère & < - pour afficher le caractère < > - pour afficher le caractère > &apos; - pour afficher le caractère ' " - pour afficher le caractère " 21 22 Insérer des commentaires Exemples d erreurs de bonne formation Mettre le texte entre <!-- et --> <!-- Ceci est un commentaire --> Exemple: Absence de déclaration Balises ouvertes pas bien fermées Emboîtement incorrect des éléments Caractères réservés mal utilisés Utilisation d'entités invalides Plusieurs éléments racine Mauvaise syntaxe des attributs 23 24 4

Outils pour vérifier la bonne formation Références Navigateurs web (Firefox, IE) si le document est bien formé affichage sinon première erreur trouvée Vérificateurs en ligne, par exemple: http://www.xml.com/pub/a/tools/ruwf/check.html Editeur Exchanger Editor Menu «Check well-formedness» ou F5 ou bouton marqué avec NB: Mode de visualisation «Viewer» possible seulement si le fichier est bien formé Sites définissant les normes et fournissant de l aide: www.w3.org http://www.w3schools.com http://www.xml.com/ La syntaxe : http://www.w3schools.com/xml/xml_syntax.asp 25 26 5