Qu est-ce que XML? XML ET LE TRAITEMENT INFORMATIQUE MULTILINGUE. Second exemple en XML. Premier exemple en XML. Explications (1) Explications (2)

Documents pareils
SII Stage d informatique pour l ingénieur

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Programmation Internet Cours 4

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Les outils de création de sites web

Gestion Électronique de Documents et XML. Master 2 TSM

Installation de DocBook sur un système Linux

PROSOP : un système de gestion de bases de données prosopographiques

Autour du web. Une introduction technique Première partie : HTML. Georges-André SILBER Centre de recherche en informatique MINES ParisTech

XML : documents et outils

< Atelier 1 /> Démarrer une application web

Faculté de Génie Chaire industrielle en infrastructures de communication. La technologie XML. Wajdi Elleuch

Les services usuels de l Internet

Thierry BOULANGER. par la pratique. Bases indispensables Concepts et cas pratiques XML. 3 ième édition. Nouvelle édition

Préparation à l examen EFA en Macro

Internet. DNS World Wide Web. Divers. Mécanismes de base Exécution d'applications sur le web. Proxy, fire-wall

les techniques d'extraction, les formulaires et intégration dans un site WEB

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

PIVOT. Pivot/Querier Documentation technique XML/XSD/XSLT

FileMaker Server 11. Publication Web personnalisée avec XML et XSLT

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

XML et travail collaboratif : vers un Web sémantique

Module BDWEB. Maîtrise d informatique Cours 9 - Xquery. Anne Doucet. anne.doucet@lip6.fr

L'essentiel de XML. Cours XML. Olivier Carton

Complaints Manager 4/06/2015 Page 1 Arpaweb 2015

HMTL. Exemple de fichier HTML. Structure d un document HTML. Exemple de fichier HTML. Balises HTML. IFT1147 Programmation Serveur Web avec PHP

CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN ING

Gestion documentaire (Extraits du CCI version 1.2)

Notes pour l utilisation d Expression Web

Programmation Web. Madalina Croitoru IUT Montpellier

Architecture JEE. Objectifs attendus. Serveurs d applications JEE. Architectures JEE Normes JEE. Systèmes distribués

Manuel d intégration API FTP SMS ALLMYSMS.COM

«Expertise de ressources «pour l édition de revues numériques

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Quelques formats de fichiers courants

Module BD et sites WEB

Formation : WEbMaster

4. SERVICES WEB REST 46

Formation HTML / CSS. ar dionoea

Optimiser moteur recherche

Utilisation de l éditeur.

Introduction à Microsoft InfoPath 2010

Instructions et spécifications pour la transmission en format XML de déclarations par lots. 30 mai 2015 MODULE 1

FileMaker Server 12. publication Web personnalisée avec XML

Le réseau Internet.

Systèmes d'informations historique et mutations

Optimiser les s marketing Les points essentiels

Dévéloppement de Sites Web

Sommaire. -1-Computer en bref. Web en bref. Le web 3.0,...la mobilité. Evolution du Web web1.0, web2.0, web2.b, web3.0...

Installation d un serveur HTTP (Hypertext Transfer Protocol) sous Débian 6

Application Web et J2EE

TP Codage numérique des caractères. Un ordinateur ne manipule que des 0 et des 1 : Comment alors code-t-il du texte?

Glossaire. ( themanualpage.org) soumises à la licence GNU FDL.

Bernard Lecomte. Débuter avec HTML

Faculté Polytechnique de Mons. Le processus d Extraction, Transformation et Load (ETL) dans des entrepôts de données XML

Services sur réseaux. Trois services à la loupe. Dominique PRESENT Dépt S.R.C. - I.U.T. de Marne la Vallée

Production de documents avec XSLT. Production de documents p.1/??

Zotero est une extension du navigateur Firefox. Il est possible de télécharger Firefox gratuitement sur le site:

Utilisation du gestionnaire de références Zotero pour FIREFOX 4.0 avec plugiciel de Word

Le référencement naturel

Dans nos locaux au 98 Route de Sauve NÎMES. Un ordinateur PC par stagiaire, scanner, imprimante/copieur laser couleur

La place de SAS dans l'informatique décisionnelle

Comment créer vos propres pages web?

DITA XML Olivier Carrère -

Olivier Deheurles Ingénieur conception et développement.net

DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient

UE 8 Systèmes d information de gestion Le programme

NFA016 : Introduction. Pour naviguer sur le Web, il faut : Naviguer: dialoguer avec un serveur web

Qu'est-ce que XML? XML : Extensible Markup Language. Exemple de document SGML SGML

XML et DOM. Matériel de cours. mars 1999 version 0.3 dernière modification: 24/3/99

Les types de fichiers

C2i Niveau 1 Enoncé Activité 1 UPJV

Petite définition : Présentation :

Le codage informatique

Manuel d utilisation du site web de l ONRN

Adobe Technical Communication Suite 5

DESS en Ingénierie Documentaire. Rapport de stage

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

<?xml version="1.0" encoding="iso " standalone="yes"?>

!" #$%&'(&)'*'+,--./&0'1&23,+2.)$4$%52'&%'6.%&2'

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Echosgraphik. Ce document sert uniquement à vous donner une vision sur ma manière de travailler et d appréhender un projet

Informatique : Création de site Web Master 2 ANI TP 1

Les conseils et les procédures pour utiliser divers programmes francophones avec de l'hébreu

Cours Bases de données

SYSTRAN 7 Guide de démarrage

XML et recherche d information

Introduction à Expression Web 2

Audit SEO. I / Les Tranquilles d Oléron

XML et Bases de données. Les bases de données XML natives.

Mode d emploi du Bureau Virtuel (BV) à destination des étudiants en Formation À Distance (FAD)

Master Technologies numériques appliquées à l'histoire Deuxième année

STID 2ème année : TP Web/PHP

HTML, CSS, JS et CGI. Elanore Elessar Dimar

Survol des nouveautés

Transcription:

Qu est-ce que XML? XML ET LE TRAITEMENT INFORMATIQUE MULTILINGUE Andrei Popescu-Belis TIM / ETI, Université de Genève Cours n 1 10.3.2005 «extended Markup Language» Langage de balises permettant de marquer les documents afin de les structurer Coder la structure ou le sens plutôt que la forme d un document Langage flexible, expressif, simple, répandu 2 Premier exemple en XML Entrée lexicale d un dictionnaire bilingue <?xml version="1.0" encoding="utf-8"?> <LETTRE VALEUR="x"> <ENTREE> <mot_cle>xerox</mot_cle> <trad pos="nf">photocopieuse</trad> <trad pos="nf">photocopie</trad> </ENTREE> </LETTRE> Second exemple en XML Fiche bibliographique pour un ouvrage <?xml version="1.0" encoding="iso-8859-1"?> <ouvrage> <index valeur="125"/> <titre>la légende des siècles</titre> <auteur> <nom>hugo</nom> <prénom>victor</prénom> </auteur> </ouvrage> 3 4 Explications (1) Explications (2) Première ligne : déclaration XML <?xml version="1.0" encoding="utf-8"?> la version est en général 1.0 il existe une version 1.1 (recommandation de 2004) seulement pour tenir compte de la mise à jour d Unicode l encodage des caractères est à préciser si l on veut Puis : une suite d éléments élément sans attributs <trad>photocopieuse</trad> ou bien, élément avec attributs <trad pos="nf" dom="tech">photocopieuse</trad> Elément : <AUTEUR> GOETHE </AUTEUR> balise ouvrante + contenu + balise fermante Règle de base Eléments emboîtés : OK <AA> <BB> contenu </BB> </AA> Eléments enchaînés : OK <AA> contenu1 </AA> <BB> contenu2 </BB> Eléments chevauchés : JAMAIS! <AA> contenu1 <BB> contenu2 </AA>... </BB> 5 6

Explications (3) Un fichier XML est donc: un fichier texte = suite de caractères lisibles sur tout ordinateur pas un fichier Word, PDF, ou autre format propriétaire Les noms des éléments (balises) sont à définir selon les besoins de chaque application Intérêt d XML Structurer l information Rendre explicite le contenu des documents Echanger de l information entre humains et/ou entre programmes informatiques Traiter l information structurée en XML grâce aux nombreux outils existants Applications (exemples): http://xml.coverpages.org/xml.html#applications 7 8 Intérêt du cours d XML (1) Introduction aux outils XML la syntaxe XML définir des balises XML personnalisées : DTD gérer/transformer des documents XML : XSLT Introduction aux applications d XML annotation de textes: XCES format d échange pour la localisation : XLIFF les ressources terminologiques : MARTIF, XLT, TMF, TBX les mémoires de traduction : TMX Intérêt du cours d XML (2) Pratique des langages de balises liens avec HTML, XHTML pour l avenir : XML base du "Semantic Web«Pratique de l'informatique et introduction à la programmation nombreux exercices utilisation d outils variés, souvent gratuits écriture d éléments de programmes, voire plus! 9 10 Organisation du cours Une heure de théorie, 10-11 : salle 6077 Une heure de pratique, 11-12 : salle 6289 Les questions et les discussions sont fortement encouragées Dates: 10/03, 17/03, 24/03, 31/03, 07/04, 14/04, 21/04, 28/04, 05/05, 12/05, 19/05, 26/05, 02/06, 09/06, 16/06 11 Evaluation : projet personnel Contenu du projet approfondir une fonctionnalité, une commande, un outil, etc. (vus ou non en cours) analyse théorique et illustration pratique écrire/utiliser quelques courts fichiers XML, une DTD, une feuille de style XSLT (selon besoins) Présentation courte description écrite, en 1-2 pages exposé + démo + discussion, en 20-30 minutes 12

La «galaxie XML» (1) Introduction à XML Le monde des outils XML Principes de base de la syntaxe Premiers exercices XML : la syntaxe de base des balises Espaces de noms : éviter les conflits entre noms de balises pour différentes applications XSL (extensible Stylesheet Language) XSLT : transformations d un document XML XSL-FO : formatage en vue de l affichage XPath : mécanisme pour se référer à une partie d un document XML 14 La «galaxie XML» (2) XLink, XPointer : connexions entre documents XML Query : langage de requêtes XForms : langage de définition des données pour des formulaires Les DTD et XML Schema définir la syntaxe des balises pour une application DTD : Document Type Definition (ex-sgml) XML Schema: plus riche, plus précise, écrite en XML 15 Bref historique (1) Ancêtre : SGML (Standard Generalized ) début des années 1980 1986 : standard ISO 8879 mêmes principes (structuration sémantique des fichiers), mais plus complexe que XML Application de SGML: HTML le langage des pages web seulement intéressé par l aspect graphique des documents hyper-texte 16 Bref historique (2) 1996: initiative visant à alléger SGML XML 1998: spécification XML 1.0, très appréciée 2004: XML 1.1 pour une mise à jour sur les caractères spéciaux en lien avec Unicode Organisme fédérateur: le W3C (www.w3.org) Spécifications ouvertes, format transparent Développement d outils et de fonctionnalités complémentaires Très nombreuses applications, i.e. particularisation des balises à un problème précis XML et le traitement multilingue Structuration de documents : XML Support des caractères spéciaux : XML Interfaçage avec Unicode : XML Format de localisation : XLIFF < XML Echange de mém. de trad. : TMX < XML Applications en terminologie : TMF < XML Gestion de sites web multilingues Systèmes d enseignement à distance http://tecfa.unige.ch/guides/xml/applications.html#section5 17 18

Qu est-ce que XML n est pas? Ce n est pas un langage de programmation tels Basic, C, Prolog, Perl, Java, etc. Ce n est pas un format propriétaire tel le format de Word, ou PDF Ce n est pas non plus une base de données mais en en un certain sens XML permet le stockage des informations structurées XML vs. HTML Quelques points communs mais des différences importantes Noms de balises XML : à définir selon les besoins HTML : fixés en vue de l affichage Syntaxe des balises XML : plutôt stricte HTML : assez tolérante, dépend du navigateur Nombreux outils associés à XML, applications XML possibles, etc. 19 20 Eléments de syntaxe XML En quoi consiste un document XML? Ligne de déclaration XML Eventuellement déclaration d un DOCTYPE Eléments emboîtés, à partir d une racine éléments avec ou sans contenu contenu : texte et/ou autres éléments commentaires balises avec ou sans attributs Commentaires Balises et attributs: noms permis Les noms XML peuvent contenir des lettres de tous les alphabets (Unicode) des chiffres, et: _ -. Les noms XML ne peuvent pas: contenir d autres ponctuations (sauf :) contenir des blancs, retours à la ligne, etc. commencer par autre chose qu une lettre ou _ Attention : majuscules minuscules 21 22 Encodage et caractères spéciaux Commentaires Déclaration de l encodage (1 ère ligne): US-ASCII, ISO-8859-1, UTF-8, etc. Caractères réservés à remplacer par des entités: < ( < ) & ( & ) > ( > ) " ( " ) &apos;( ' ) Commentaire standard (courant) Pour insérer du texte sans caractères réservés Mettre le texte entre <!-- et --> <!-- Ceci est un commentaire --> Entités définies par les codes des caractères selon Unicode : par exemple ou ɯ 23 24

«Bonne formation» Exemples d erreurs de bonne formation d'un document XML absence de déclaration XML mauvaise formation des noms XML mauvaise syntaxe des balises pas d élément racine caractères spéciaux mal utilisés Outils pour vérifier la bonne formation (1) Nombreuses possibilités! Un survol des outils: http://www.xml.com/pub/a/2001/06/27/cheapxml.html 1. Ouvrir le fichier dans Firefox, Internet Explorer (>5), ou Netscape (>6) : le système indiquera la première erreur trouvée, ou affichera le fichier si correct 2. Utiliser un vérificateur sur le web, par exemple http://www.xml.com/pub/a/tools/ruwf/check.html (saisir/coller le document XML dans le cadre) 25 26 Outils pour vérifier la bonne formation (2) Dans notre cours, utiliser l outil RXP (source : http://www.cogsci.ed.ac.uk/~richard/rxp.html) 3. Utiliser RXP dans une fenêtre de commandes DOS. Syntaxe: H:\prive\xml\> rxp x livrea.xml Le programme s arrête à la première erreur trouvée. Lire le mode d emploi pour les options: rxp-manuel.txt 4. Utiliser le raccourci fourni appliquer-rxp.bat : faire glisser- déplacer (drag-and-drop) avec le fichier XML sur ce raccourci. Une fenêtre s ouvre, et RXP s arrête à la première erreur trouvée (à la fin du document si correct) La documentation XML Recherche des principaux sites définissant les normes XML et fournissant de l aide: w3c.org xml.org ibiblio.org/xml xml.coverpages.org xml.apache.org java.sun.com/xml Regardez ces sites Retenez ces pointeurs Utilisez-les! 27 28 Premiers documents XML Exercices Application choisie: stocker des fiches bibliographiques (livres, articles, etc.) sous la forme de documents XML Comment procéder? créez un répertoire H:\prive\xml copiez dans ce répertoire (sans les ouvrir) les cinq fichiers disponibles à l adresse http://www.issco.unige.ch/staff/andrei/xml/1/ regardez avec Application WordPad (ou même Word) les fichiers livrea.xml et livreb.xml 30

Tâches de la séance Vérifiez la bonne formation des deux fichiers livrea.xml et livreb.xml à l aide de RXP L un d eux comporte des erreurs : lequel? Corrigez le fichier erroné Sur le même modèle, créez un court fichier décrivant votre livre préféré Vérifiez que votre fichier est bien formé Ecriture d une fiche bibliographique Utilisez les autres fiches comme modèle Commencez très simple, juste 2-3 balises! Enrichissez progressivement votre fiche: testez à chaque fois sa bonne formation Introduisez des erreurs dans votre fiche: sontelles bien détectées par les 4 méthodes? 31 32