Créé le 28 avril 2004
Modifié le
Introduction au Web > Le Web

Le Web en général

Le Web

La technologie Web a été inventée au CERN en 1989 par Tim Berners-Lee. L'objectif primitif était la diffusion de l'information en physique nucléaire, principalement pour l'échange de documents scientifiques entre chercheurs. Les informations sont organisées sous forme d'un hypertexte, avec des ancres permettant de lier des documents entre eux et donc de naviguer d'une page à une autre par un simple clic de souris.

En plus de la navigation hypertextuelle, ce qui a grandement contribué à l'essor du Web comme vaste système d'information distribué à l'échelle mondiale (architecture en réseau) est le fait que le Web prend en charge des documents de types très différents et se présente donc comme un véritable outil "multimédia", c'est-à-dire intégrant des composants de type texte, graphique, sonore, vidéo, tabulaire, ou des scripts de programmation.

Le W3C

Le W3C est l'organisme officiel de normalisation du Web. Le World Wide Web Consortium propose et normalise les technologies, protocoles et les langages du Web. Parmi les très nombreuses réalisations et spécifications introduites par le W3C, on compte XML, HTML, le protocole HTTP, les feuilles de style CSS et XSL, etc.

Le plus souvent, ces directives ou orientations données au Web sont largement suivies et permettent une meilleure diffusion et une meilleure structuration de l'information. Toutefois, les spécifications du W3C peuvent rester lettres mortes si les sociétés informatiques ne les suivent pas. De plus, il est nécessaire que les navigateurs intègrent les nouvelles technologies introduites par le W3C.

Par exemple, l'intégration des feuilles de style commence à être de plus en plus d'applications, mais leur interprétation diffère d'un navigateur à l'autre (de Netscape à Internet Explorer par exemple), notamment en raison d'ajouts spécifiques de balises propriétaires à chaque navigateur.

Quelques concepts de base: URL, MIME, protocoles

Le Web se base sur quelques principes de base qu'il est bon de connaître avant de s'engager dans les technologies spécifiques de développement.

L'identifiant universel

Une page Web lue dans un navigateur comporte toujours une adresse. Par exemple, l'adresse de la page de présentation de la section Infodoc est:

http://www.ulb.ac.be/philo/infodoc/presinf.html

Le système d'adressage utilisé est celui de l'URL (Uniform Resource Locator) ou URI (Universal Resource Identifier). L'URL est un identifiant universel indiquant le protocole utilisé (HTTP, FTP ...), l'adresse du serveur (www.ulb.ac.be) et le chemin d'accès à la ressource particulière (/philo/infodoc/presinf.html).

Il faut donc comprendre l'URL ci-dessus comme désignant le fichier presinf.html, placé dans le dossier philo et sous-dossier infodoc, situé sur le serveur gérant le site web www.ulb.ac.be accessible via le protocole HTTP.

Une URI est un concept plus large permettant de désigner une ressource de manière non ambigüe en spécifiant le type d'objet désigné par l'adresse. Bien que non respectée, l'utilisation de l'URI plutôt que l'URL est conseillée par le W3C.

Le développement de pages Web faisant intervenir des applications externes (bases de données appelées par un programme) a amené l'introduction des URL longues, c'est-à-dire des URL ou URI étendues avec des paramètres destinées aux programmes appelées.

Un exemple:

http://www4.rtbf.be/rtbf_2000/bin/view_something.cgi?id=0087916_pagefiche

où: bin/view_something.cgi?id=0087916_pagefiche est destinée à l'appel d'un traitement par une passerelle CGI.

Format de transfert

Le Web ne diffuse heureusement pas que du texte. Une page Web peut contenir également des images, des vidéos, des séquences audio, du code de programmation (en Java, C, Perl ...), de l'hypertexte, des scripts, du XML, du HTML, ... Bref, de très nombreux formats différents.

Le codage MIME a été développé et standardisé pour permettre d'unifier ces différents formats en un seul. Il s'agit d'un ensemble de règles de codage (pour encoder et décoder) pour transférer vers les navigateurs clients des informations multimédia.

De la sorte, on peut utiliser de très nombreux objets différents sur son site, du moment qu'on puisse leur attribuer un codage MIME (qui contient en fait le format d'origine: le codage MIME est en quelque sorte une couche supplémentaire d'information, à l'intérieur de laquelle on a les différents formats des objets utilisés sur une page.). Le codage MIME a donc pour fonction de permettre un transfert uniforme des données d'un serveur vers un client. Le navigateur interprète ensuite ce format et affiche la page Web (et ses différents objets)

Un exemple basique pour mieux comprendre: imaginons qu'un webmaster ait placé sur une page une image au format .PSD, soit l'extension des images en format Photoshop brut. Lorsque votre navigateur appelle cette page, il reçoit l'information complète: il a dès lors connaissance de tous les objets présents sur la page. Mais si vous ne disposez pas de Photoshop ou de tout autre logiciel capable de décoder le format .PSD, vous ne pourrez pas interpréter et afficher l'image. Tout au plus, vous ne pouvez donc pas voir l'image, mais cela ne nuit pas à l'intégrité des autres données présentes sur la page.

Les protocoles

Internet est un ensemble de protocoles regroupés sous le terme de TCP-IP (Transmission Control Protocol/Internet Protocol). On peut définir un protocole comme étant une séquence d'étapes à suivre pour permettre une communication entre plusieurs ordinateurs, c'est-à-dire émettre et recevoir des données.

Le protocole le plus utilisé défini pour le Web est le protocole HTTP (HyperText Transfert Protocol), qui permet d'échanger des informations entre un poste client et un poste serveur. Le protocole HTTP est donc utilisé pour envoyer une requête vers un serveur et pour renvoyer la page demandée. Il utilise le codage MIME pour ce transfert, l'adressage par URL ou offre encore la possibilité d'invoquer des programmes d'applications tierces sur un serveur via des URL longues.

Il existe d'autres protocoles largement utilisés dans un contexte Web. Parmi les plus connus:

  • FTP (File Transfert Protocol) est utilisé pour le transfert de fichiers. Par exemple, lorsque vous créez un site Web, vous envoyez vos pages vers le serveur de stockage via FTP.
  • SMTP (Simple Mail Transfert Protocol) est un protocole utilisé pour l'envoi de mails.

Des pages statiques aux pages dynamiques

Qu'entend-on par pages statiques et pages dynamiques? A l'origine, toute page diffusée sur le Web était une page statique. Une page statique n'est finalement que du texte, des tableaux, des images ..., sur lesquels on applique une mise en forme, mais qui demeurent non interactifs.

Techniquement, un navigateur client envoie une requête HTTP vers un serveur qui lui retourne la page HTML correspondante. Un site statique ne contient donc que du HTML pur et est organisé en arbre ou en réseau. Pour modifier le site, il faut changer les pages qui le composent à l'aide d'un éditeur HTML On est ici dans une architecture à 2 niveaux. Ce type de sites convient pour la mise en ligne d'articles scientifiques, ou plus généralement de pages dont le contenu est figé et impersonnel.

Face aux limites des sites statiques, les développeurs Web ont conçu des technologies dynamiques permettant d'ajouter de nombreuses spécificités à un site Web. Ces technologies vont dans diverses directions: certaines enrichissent les fonctionnalités d'un navigateur (plugins, applets Java, scripts clients), d'autres s'appliquent aux serveurs de données et d'applications (servlets Java, PHP, ASP ...), d'autres encore interviennent directement dans le code HTML (DHTML, feuilles de style... ce sont des technologies de publication).

Une page Web dynamique comporte donc des fonctionnalités supplémentaires par rapport à une page statique. Par exemple, on peut intégrer des petits programmes, développé en Java, C, Perl ..., qui lors d'une action d'un utilisateur, vont permettre de réagir en conséquence, de personnaliser les résultats, de proposer un contenu beaucoup plus important (notamment via des bases de données).

Au départ, il faut donc savoir ce que l'on veut diffuser. Une page statique convient pour un site sans prétention, qui n'offre aucun service si ce n'est une information strictement figée: on obtient donc simplement un contenu dans lequel on navigue hypertextuellement. Ses avantages sont:

  • Un coût très faible
  • La facilité de réalisation

Par contre, si l'on veut proposer des applications particulières à ses visiteurs, les technologies dynamiques offrent un support indispensable pour:

  • La gestion de données évolutives, adaptées à chaque visiteur et interactives
  • Une maintenance rapide et efficace
  • La présentation homogène nécessaire au Web.