Créé le 28 avril 2004
Modifié le
Langages du Web > HTML

HTML

Qu'est-ce que le HTML?

HTML signifie Hyper Text Mark-up Language. Il s'agit d'un langage de description, dérivé de SGML, qui permet de définir des hypertextes, c'est-à-dire des documents liés entre eux. Pour passer d'une page à l'autre, il suffit de cliquer sur un lien.
Il s'agit historiquement du langage de base du Web, reposant sur un jeu de balises descriptives pour la présentation des documents (en-tête, corps du texte, niveaux de titres, tableaux, listes ...) et pour la définition des liens hypertextes.
Ces balises sont fixes et à fonctions prédéfinies. Cela signifie qu'on ne peut créer ses propres balises, comme en XML. HTML se définit donc comme un langage de présentation de l'information, et non pas comme une technologie de structuration des données.

Les principales balises

Au départ, le format HTML n'était prévu que pour afficher du texte. Le langage a fortement évolué depuis ses débuts et permet aujourd'hui d'intégrer des images, du son, des vidéos, des scripts d'applications. Les principales balises d'un document HTML restent les mêmes. En voici quelques exemples:

<HTML>
<HEAD>
<TITLE>
<BODY>
<H1><H2>...
<B><I>...
<A HREF="URL du lien">
<IMG SRC="URL de l'image">
Balise de début d'une page
Balise d'entête
Permet d'indiquer le titre du document
Définit la zone du corps du document
Balise de niveaux de titre allant de 1 à 7
Mise en forme : <B> pour gras, <I> pour italique
Balise d'insertion d'un lien hypertexte
Balise d'isertion d'une image

En principe, les balises ne peuvent pas se chevaucher et elles doivent être fermées (sauf quelques-unes qui ne nécessitent pas de balises de de fermeture, comme la balise <BR> pour le saut de ligne. Toutefois dans la pratique, ces règles ne sont pas toujours suivies. Il en résulte un code qui n'est pas toujours clair.

Les évolutions de HTML

Depuis ses débuts, HTML a beaucoup évolué. Beaucoup des changements apportés sont survenus suite aux nouveautés introduites par les constructeurs. Les organismes de normalisation du Web, notamment le W3C, ont eu beaucoup de mal à canaliser toutes ces innovations et à standardiser les balises pour permettre leur compatibilité entre les différents navigateurs Web.
Parmi les changements intervenus, on peut citer l'ajout de balises pour la prise en charge :

  • des tables
  • des images dynamiques (images cliquables par exemple)
  • des scripts (exemple <script language=javascript>code</script>)
  • d'éléments dans l'en-tête de page (<author>, <meta http-equiv>, ...)

Aujourd'hui, la version standardisée, acceptée par tous les constructeurs, est le HTML4. Il s'agit de l'ultime version avant le passage à XHTML. Cette version inclut de nombreuses balises référençant des objets externes au HTML (balises pour des applets Java, pour des contrôles ActiveX, pour des scripts tels Javascript, VBScript, PHP ou encore les ASP) et les structures composants une page Web (tableaux, images, formulaires ...), aujourd'hui incontournables.

Comment voir le code source d'une page HTML (format AVI)?

Inconvénients de HTML

HTML apparaît aujourd'hui comme une technologie dépassée, bien que toujours largement utilisée. De nouvelles spécifications sont déjà présentes sur le marché: le standard XHTML a pour but de permettre une transition "en douceur" vers le XML.
Les gros inconvénients de HTML sont:

  • une information mal structurée.
  • ce langage n'est pas prévu pour de l'édition compliquée.
    • A titre d'exemple, les tableaux sont souvent détournés de leur finalité première (c'est-à-dire d'ordonner des données tabulaires) pour créer des grilles de mise en page.
    • Les pages sont souvent mal comprises par les moteurs de recherche, car il n'y a pas de méta-données sur le contenu (problème résolu par XML). De plus, l'utilisation abusive de frames (cadres) cache aux moteurs le contenu des pages principales. En effet, dans le code source, n'apparaissent que les balises du frame de menu.
  • la rigueur d'écriture en HTML n'est pas obligatoire: on peut écrire indifféremment une balise en minuscules ou en majuscules, ne pas indiquer la balise de fermeture ou encore faire chevaucher des balises différentes.

Liens utiles

Il existe de très nombreuses ressources (exemples de code, tutoriaux, exemples commentés) sur Internet. Voici quelques références:

http://www.commentcamarche.net/html/htmlintro.php3

http://www.laltruiste.com/document.php?compteur=1&page=1&rep=1

http://www.allhtml.com/html/index.php

Haut de page