Langage XML - L1

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 8

Ecrire un document xml bien

formé

Niveau 1

YAO JY Aristide

Objectifs pédagogiques :
• Définir les concepts du langage XML
• Expliquer l’interêt de l’usage de XML
• Identifier les données d’un texte
• Discuter la mise en œuvre d’un document XML
• Evaluer la qualité d’un document XML
Table des matières
I. Vue d’ensemble .................................................................................................................. 3
a. Definition ......................................................................................................................... 3
b. Caractéristique de XML .................................................................................................. 3
c. Cas d’utilisation de XML ................................................................................................ 3
II. Syntaxe XML ...................................................................................................................... 3
a. Structure d’un document XML ........................................................................................ 3
b. Règle d’écriture d’un prologue ....................................................................................... 4
c. Règle d’écriture d’un élément ou balise.......................................................................... 4
d. Imbrication de balise ou d’élément ................................................................................. 4
e. Element racine................................................................................................................. 5
f. Règles d’écriture d’un Attribut XML .............................................................................. 5
g. Références XML .............................................................................................................. 5
h. Commentaire XML .......................................................................................................... 6
III. Représentation d’un document XML .............................................................................. 6
a. Enoncé ............................................................................................................................. 6
b. Représentation simple d’une personne ........................................................................... 6
c. Représentation verbeuse d’une personne ........................................................................ 7
d. Représentation d’un répertoire ....................................................................................... 7
I. Vue d’ensemble
a. Definition

XML (eXtensible Markup Language) est un langage de balisage basé sur du texte, il est dérivé
de SGML (Standard Generalized Markup Language). Un document XML est, la plupart du
temps, stocké dans un fichier texte dont l’extension est ‘.xml’.
Les balises XML identifient les données et sont utilisées pour stocker et organiser les
données. A la différence du HTML, XML ne spécifie pas comment afficher les données

b. Caractéristique de XML

XML est un langage avec trois caractéristiques importantes :


• Extensible – vous permet de créer vos propres balises qui conviennent à votre
application
• Transporte les données, ne les présente pas – vous permet de stocker les données
quelle que soit la façon dont elles sont présentées
• Est un standard public – Vous permet de créer et d’échanger vos données avec
n’importe quelle autre application car il a été développé par une organisation W3C en
tant que standard ouvert

c. Cas d’utilisation de XML

XML peut être utilisée pour :


• Échanger des informations entre les organisations et les systèmes.
• Décharger (offloading) et Recharger (reloading) des bases de données.
• Stocker et Organiser les données ; ce qui peut personnaliser vos besoins en matière de
traitement de données.
• Fusionner le document XML avec les feuilles de style pour créer une sortie désirée
• Représenter pratiquement tous les types de données

Remarque : XML n’est pas un langage de programmation car il n’effectue aucun calcul ou
algorithme. Il est utilisé pour stocker les données dans un fichier texte ; ces données sont traitées
par un logiciel capable d’interpréter XML

II. Syntaxe XML


Dans ce chapitre, nous verrons les règles de syntaxe pour écrire un document XML

a. Structure d’un document XML

Le code suivant représente un document XML complet

<?xml version= ‘1.0’ encoding=’UTF-8’ standalone=’no’ ?>

<repertoire>
<contact>
<nom>Kouadio Brou</nom>
<phone>0101234567</phone>
</contact>
</repertoire>

Ici, nous avons 2 principales informations :


• Le prologue, qui est l’entête d’un fichier XML, il doit obligatoirement être la première
instruction du document. Il contient des déclarations facultatives.
• Le corps du document qui contient les éléments.

b. Règle d’écriture d’un prologue

La balise du prologue s’écrit de la manière suivante :


<?xml ?> où xml s’écrit en minuscule
A l’intérieur de la balise, on trouve les attributs suivant par ordre :
• Version, pour spécifier la version du standard XML à utiliser (e.g. ‘1.0’ ou ‘2.0’). Pour
l’heure, la version 1.0 est la plus utilisée.
• Encoding, Pour éviter les problèmes d'encodage de caractères, tous les fichiers XML
doivent être enregistrés en tant que fichiers Unicode UTF-8 qui est l’encodage par
defaut.
• Standalone, pour préciser si le fichier est autonome ; c’est-à-dire s’il existe des
déclarations externes qui affectent le document. Par défaut, il prend la valeur no.

Remarque : L’ordre d’écriture des attributs doit être respecté. Le prologue contient aussi les
détails qui préparent un parseur XML à analyser le document XML (nous aborderons la notion
de parseur dans les leçons suivantes).

c. Règle d’écriture d’un élément ou balise

Un fichier XML est structuré par plusieurs éléments XML, également appelés nœuds XML ou
balise XML. Les noms des éléments sont placés entre crochets triangulaires <>
Exemple : <element>
Chaque élément XML doit être fermé avec des éléments de début et de fin comme indiqué ci-
dessous :
<element> … </element>
Ou dans des cas simples :
<element />
Le texte qui apparaît entre les balises ouvrante et fermante s’appelle contenu (content). Un
élément qui n’a pas de contenu est dit vide et peut être écrit comme un élément simple (exemple
des balises <br /> et <hr /> en HTML).
Il est recommandé d’écrire le nom de l’élément sans accent.
Il ne faut pas mettre d’espace si le nom de l’élément est composé de plusieurs mots ; il faut
privilégier les symboles « -, _ » pour combler les espaces.
XML est sensible à la casse.

d. Imbrication de balise ou d’élément


Une balise peut contenir plusieurs éléments XML (nœud enfant) mais ces éléments ne doivent
pas se chevaucher. C’est-à-dire qu’une balise de fin d’un élément doit avoir le même nom que
celui de la balise de début la plus récente.
Exemple : ce qu’il ne faut pas faire
<?xml version = "1.0" ?>
<contact >
<nom>Kouadio
</contact >
</nom>
Remarque : il faudrait respecter la casse lors de l’écriture d’un élément

e. Element racine

Un document XML ne peut avoir qu’un seul élément racine. On n’écrira donc pas :
<contact> … </contact>
<contact> … </contact>
Mais plutôt :
<repertoire>
<contact> … </contact>
<contact> … </contact>
</repertoire>

f. Règles d’écriture d’un Attribut XML

Un attribut spécifie une seule propriété pour un élément, à l’aide d’une paire nom/valeur. Un
élément peut avoir un ou plusieurs attributs.
Exemple :
<contact type=’domicile’ modele=’fixe’>2723505093</contact>
Règle :
• Les noms d’attributs en XML sont sensibles à la casse contrairement au HTML.
• Le même attribut ne peut pas avoir deux valeurs distinctes ; c’est-à-dire qu’un attribut
ne peut pas se retrouver deux fois dans le même élément.
• Les noms d’attributs sont définis sans guillemets, tandis que les valeurs d’attributs
doivent toujours apparaître entre guillemets
• La valeur d’un attribut peut être une chaîne quelconque de caractères

g. Références XML

Les références vous permettent généralement d’ajouter ou d’inclure du texte ou un balisage


supplémentaire dans un document XML. Les références commencent toujours par le symbole
« & » et se termine par « ; ». Ces références sont utiles pour faire usage des caractères non
autorisés
h. Commentaire XML

Les commentaires XML sont similaires aux commentaires HTML. Ils sont ajoutés sous forme
de notes ou de lignes pour comprendre l’objectif d’un code XML et ne sont visibles que dans
le code source.
Syntaxe :
< !-- votre commentaire ici -->
Les règles suivantes doivent être suivies pour écrire un commentaire :
• Il ne peut pas apparaître avant le prologue
• Il peut apparaître n’importe où dans un document
• Il ne doit pas apparaître dans les valeurs d’attribut
• Il ne peut pas être imbriqué à l’intérieur d’un autre commentaire.

III. Représentation d’un document XML


Dans cette partie, nous montrerons comment créer un bon fichier xml complet qui permettra
une bonne identification des données.

a. Enoncé

Charles voudrait mettre en place un fichier XML qui permet de gérer un répertoire de personnes.
Chaque personne dans son répertoire possède les informations suivantes : nom, email,
téléphone et adresse. Pour les besoins de l’exercice, nous prendrons l’exemple d’une personne
qui possède les informations suivantes :
• Nom : KOUAME Marius
• Téléphone portable : 0102123456
• Téléphone fixe : 2722704321
• Email : [email protected]
• Adresse : Cocody Angré 8e tranche carrefour prière, villa 54
b. Représentation simple d’une personne

Pour représenter une personne, on pourrait être tenté d’écrire un fichier XML simple :
<personne>
<nom>KOUAME Marius</nom>
<portable>0102123456</portable>
<fixe>2722704321</fixe>
<email>[email protected]</email>
<adresse>Cocody Angré 8e tranche carrefour prière, villa 54</adresse>
</personne>

Cependant, cette représentation a un désavantage car on ne peut pas différencier le nom du


prénom et on ne peut pas retrouver précisément la commune dans l’adresse. Pour cela, il est
fortement recommandé d’écrire un document aussi verbeux que possible

c. Représentation verbeuse d’une personne

<personne>
<identite>
<nom>KOUAME</nom>
<prenom>Marius</prenom>
</identite>
<telephone>
<portable>0102123456</portable>
<fixe>2722704321</fixe>
</ telephone >

<email>
<identifiant>marius.kouadio </identifiant>
<serveur>uvci.edu.ci</serveur>
</email>
<adresse>
<commune>Cocody</commune>
<quartier>8e tranche</quartier>
<rue>carrefour prière</rue>
<appartement>Villa 54</appartement>
</adresse>
</personne>

Ce document prend beaucoup plus de place et est plus long à écrire mais l’avantage est qu’on
peut correctement identifier les informations. On pourrait alors faire un tri par nom, par prénom,
par serveur d’email, par commune, etc.
Pour la balise nom, on pourrait avoir plusieurs balises nom dans le document qui n’auront pas
forcement le même sens : nom d’un groupe de personne, nom d’une personne, nom du
répertoire, etc.

d. Représentation d’un répertoire

Répertoire étant la racine du document, on aura donc :


<?xml version=’1.0’ encoding=’UTF-8’ standalone=’no’ ?>

<repertoire>
<groupe>
<nom>Amis</nom>
<personne>...</personne>
<personne>...</personne>
</groupe>
<groupe>
<nom>Travail</nom>
<personne>...</personne>
<personne>...</personne>
</groupe>

<groupe>
<nom>Famille</nom>
<personne>...</personne>
<personne>...</personne>
</groupe>
</repertoire>

Dans ce document, les personnes ont été regroupées dans des groupes (cette instruction n’existe
pas dans l’énoncé, il est juste à titre illustratif). Ceci permet de rajouter une information
supplémentaire sur une personne car on sait à quel groupe de personne elle appartient.
L’élément <groupe> possédant obligatoirement un seul élément <nom>, on peut aussi l’écrire
de la forme <groupe nom=‘Amis’>… </groupe> mais il est préférable de l’écrire sous forme
d’élément.
Ce document est un document XML bien formé car il respecte d’abord les règles de syntaxe,
permet d’identifier chaque donnée et de faire des recherches précises sur chaque information.

Vous aimerez peut-être aussi