Accueil>En pratique>XML
Page Accueil SourcesLiens utiles Concepteurs Plan du Site Glossaire
XML
Notions

XML est l’abréviation pour « Extensible Markup Language ». Ce langage a été mis au point par le XML Working Group sous l’égide du World Wide Web Consortium (W3C).

Depuis le 10 février 1998, les spécifications XML 1.0 on été reconnues comme recommandations par le W3C, ce qui en fait un langage reconnu. Ce consortium est plutôt connu sous le nom de W3C et il se charge de définir les normes du Web.

A l'origine, le besoin de XML apparaît pour la publication (gestion documentaire, bureautique, publication d'informations et de contenu sur le Web), ainsi que pour des référentiels d'information (bases de données, progiciels tels les ERP, systèmes d'information existants). Le besoin apparaît aussi pour la modélisation et les échanges de données (EDI, commerce électronique, outils logiciels, moteurs de recherche).

Il offre d’énormes avantages en terme de facilité d’échange et de production coopérative, d’indépendance par rapport à des logiciels particuliers, et de pérennité des documents sur le très long terme. En outre, ce langage ouvre des possibilités importantes en terme de traitement automatisé de documents. Grâce à cette séparation contenu-forme, XML pourra petre employé comme un formalisme puissant et commode pour l’échange de données entre les applications les plus diverses.

L’approche HTML s’exprime comme un tout à l’égard de la présentation, du contenu et de la structure. Par contre, l’approche XML aborde les composants séparément.

Ces règles syntaxiques générales permettent de vérifier si tous les documents XML sont syntaxiquement corrects. Si cela s’avère vérifiable, le document est bien formé (« well-formed ») et il peut être traité par le Navigateur ou un autre programme.

En réalité, les balises XML par elles-mêmes décrivent le contenu et la structure plutôt que la présentation, le comportement ou la signification (contrairement à HTML). En effet, XML est « syntax, not semantic » (The Role of XML in E-Business, p. A-4).

La signification des balises n’est pas prédéfinie. Elles suggèrent le sens des données qu’elles contiennent. XML laisse l’entière interprétation des données à l’application (le parser dont on reparlera plus tard) qui lit les définitions contenues dans la grammaire XML. Ainsi, XML permet de séparer le contenu de la présentation. Ce qui permet par exemple d’afficher un même document sur des applications ou des périphériques différents sans pour autant nécessiter de créer autant de versions du documents que l’on nécessite de représentations.

Un document XML correct au point de vue syntaxique et conforme aux règles énoncées dans cette grammaire est un document XML valide (« valid »). On doit insister sur les critères de « well-formed » et « valid » car le premier est une propriété propre au document et le second est propre à la relation entre un document et une grammaire.

La mise en page des données est assurée par un langage de mise en page tiers. A l'heure actuelle (fin de l'année 2000) il existe trois solutions pour mettre en forme un document XML :

CSS (Cascading StyleSheet), la solution la plus utilisée actuellement, étant donné qu'il s'agit d'un standard qui a déjà fait ses preuves avec HTML.

XSL (eXtensible StyleSheet Language), un langage de feuilles de style extensible développé spécialement pour XML. Toutefois, ce nouveau langage n'est pas reconnu pour l'instant comme un standard officiel .

XSLT (eXtensible StyleSheet Language Transformation). Il s'agit d'une recommandation W3C du 16 novembre 1999, permettant de transformer un document XML en document HTML accompagné de feuilles de style.

Objectifs


Le Consortium a fixé les objectifs officiels suivants :

1. XML devrait pouvoir être utilisé sans difficulté sur Internet ;

2. XML devrait soutenir une grande variété d'applications ;

3. XML devra être compatible avec SGML ;

4. Il devrait être facile d'écrire des programmes traitant les documents XML ;

5. Le nombre d'options dans XML doit être réduit au minimum, idéalement à aucune

6. Les documents XML devraient être lisibles par l'homme et raisonnablement clairs;

7. La conception de XML devrait être préparée rapidement ;

8. La conception de XML sera formelle et concise ;

9. Il devrait être facile de créer des documents XML ;

10. La concision dans le balisage de XML est de peu d'importance.

Fonctionnalités


XML apporte une réponse aux limites de l’HTML par de nouvelles fonctionnalités qui sont les suivantes :

• Un balisage spécifique et une indépendance de toute application.

• Une vue multiple des données.

Ce polymorphisme de la présentation est le résultat de la conversion de la représentation logique en celle appropriée en fonction du type de client.

Xml s’intéresse au contenu pur sans se soucier de la présentation ou des traitements futurs et permet donc de générer automatiquement de multiples présentations avec éventuellement des tris, des sélections, des réorganisations, des tables de matières, des index.

• Le caractère modulaire et la réutilisation possible des structures types de document peuvent être librement défini ; ainsi que la richesse de la structure des données qui peut être très complexe (représentation de tables ou de graphes).

Un langage extensible et autodescriptif

Définir librement des éléments préservant la sémantique des composants d’un document ouvre des possibilités quasi infinies en termes de traitement automatisé des documents et de réalisation physique. XML affecte un nom de ce choix à chaque élément. Mais la syntaxe reste stricte et elle confère aux documents XML une forme prévisible et facilite l’écriture des programmes.

Le traitement des données en local

• Les recherches plus faciles (par indexation des concepts).

• L’interopérabilité et les standards ouverts offrent le grand avantage d’avoir accès à des sources d’information hétérogène. XML propose un format d’échange de données normalisé, général, indépendant de toute plate-forme et de tout SGBD (Système de Gestion de Banques de Données), et suffisamment puissant pour représenter et manipuler la majorité des données. L’universalité et la portabilité le caractérisent.

La simplicité.

Etant un format basé sur des caractères et donc lisible par l’Homme. En outre, les messages XML peuvent facilement être lus, crées et modifiés en utilisant des outils standards comme des éditeurs de texte, assurant compréhension et analyse aisées.

Le contrôle de validité.

Cette dernière peut être lexicale à partir d’une liste finie (dictionnaire ou thésaurus), structurelle, syntaxique et sémantique.

• La gestion des caractères internationaux définie par la recommandation 1.0 d’XML, sur base du jeu de caractères Unicode.

La lisibilité

Aucune connaissance ne doit théoriquement être nécessaire pour comprendre un contenu d'un document XML.

• Une structure arborescente

Celle-ci permet de modéliser la majorité des problèmes informatiques.

• La déployabilité

Il peut être facilement distribué par n'importe quels protocoles à même de transporter du texte, comme HTTP.

• L’intégrabilité

Un document XML est utilisable par toute application pourvue d'un parser (c'est-à-dire un logiciel permettant d'analyser un code XML).

L’extensibilité

Un document XML doit pouvoir être utilisable dans tous les domaines d'applications

Haut de la page
Haut de la page
Haut de la page
Page Accueil SourcesLiens utiles Concepteurs Plan du Site Glossaire