Cette
fiche contient des informations assez techniques. Son but n'est
pas de vous transformer en informaticien, ni de vous parler
de toutes les techniques utilisées sur Internet. Il s'agit
au contraire de faire comprendre en quoi la technique actuelle
influe sur le travail du webmestre.
Qu'est-ce
que l'Internet ?
L'Internet
est physiquement composé des millions d'ordinateurs qui
y sont connectés, des matériels d'interconnexion
et des câbles qui les relient.
Ces ordinateurs sont très différents les uns des
autres, aussi bien du point de vue matériel que logiciel.
Le matériel comporte de banals PC (micro-ordinateurs)
et d'énormes machines, comme celle qui héberge
le moteur de recherche AltaVista, dont le prix les met hors
de portée de toute association. Mais la différence
n'est que quantitative : tous bénéficient d'un
égal accès à l'Internet... Répétons-le
: il n'y a pas de différence qualitative entre les machines
serveuses et votre machine de bureau. Et, même du point
de vue quantitatif, le serveur web que vous consultez est probablement
hébergé sur une machine plus petite que votre
PC multimédia dernier cri.
La plus
grosse différence entre ces ordinateurs est logicielle
: ils fonctionnent avec des systèmes d'exploitation différents.
Le système d'exploitation est le logiciel de base de
l'ordinateur. C'est lui, bien plus que le matériel, qui
détermine le comportement de la machine. Le PC sur lequel
cette fiche a été écrite utilise le système
d'exploitation Debian. Cela a beau être un PC, un habitué
du système d'exploitation MS-Windows aurait sans doute
du mal à s'en servir. Le matériel, en fait, n'est
qu'une caisse et l'utilisateur interagit avec du logiciel. D'où
son importance. Ainsi, un Macintosh utilisant Debian ressemblera
beaucoup plus à un PC avec Debian qu'à un autre
Macintosh dont le système d'exploitation est le MacOS
d'Apple.
En plus
du système d'exploitation, logiciel de base utilisé
par la machine, tout ordinateur possède un grand nombre
de logiciels d'application, ceux qui vont servir au travail
quotidien : traitement de textes, éditeur de textes,
vérificateur de pages web, logiciel de dessin, etc. Il
existe une plus grande variété de logiciels que
de systèmes d'exploitation.
D'où
la première règle, imposée par cette variété
: vos correspondants sur Internet n'ont pas forcément
les mêmes logiciels que vous. On reçoit souvent
des documents par courrier électronique. Certaines personnes
envoient des documents spécifiques d'un logiciel particulier,
ou même d'une version particulière d'un logiciel.
Si vous voulez maximiser vos chances d'être lu, tenez-vous
en aux normes communes à toutes les machines de l'Internet
(1).
Ce n'est pas parce que vous avez MS-Word version 2000 que vos
correspondants auront fait le même choix d'équipement.
Les ordinateurs
ne sont pas tout : d'abord, outre votre machine de bureau, de
nombreux autres ordinateurs concourent à ce que l'Internet
soit en état de marche. Il y a le serveur web, sur lequel
vos fichiers sont hébergés (et les logiciels qui
tournent sur ces machines sont en général très
différents de ceux que vous avez sur votre micro-ordinateur),
les serveurs de noms de domaine, et des machines plus éloignées
encore de la vôtre comme les routeurs - les postes d'aiguillage
de l'Internet - soit les machines où se prend la décision
d'envoyer des données par une route plutôt que
par une autre. Quoique invisibles, ils sont indispensables,
et les performances de l'Internet dépendent beaucoup
d'eux. Car, ces machines si discrètes - et les câbles
qui les relient - forment l'infrastructure de l'Internet.
Comment
ça fonctionne ?
La plupart
(mais pas tous) des services de l'Internet fonctionnent en mode
client-serveur. Cela veut simplement dire qu'un des ordinateurs
possède les informations, celles-ci sont stockées
sur ses disques, et que l'autre va les lui demander. Le serveur
est celui qui possède les informations. Il attend des
clients et, comme ceux-ci peuvent arriver n'importe quand, le
serveur est typiquement une machine allumée 24 heures
sur 24. Le client est couramment votre machine de bureau : au
moment où vous le décidez, votre ordinateur va
aller chercher des informations sur le serveur.
Notez que, dans le cas du web, une même machine serveuse
peut héberger de très nombreux sites.
Pour que
le transfert d'informations du serveur au client se fasse bien,
il faut que le client connaisse l'adresse du serveur, pour savoir
où demander, parmi les milliers de machines connectées,
et que le serveur et le client parlent un langage commun, ce
que l'on nomme un protocole.
Les adresses
sont utilisées partout dans les réseaux (et pas
seulement dans les réseaux informatiques, un numéro
de téléphone est un exemple d'adresse). Dans l'Internet,
vous avez un type d'adresse par service utilisé. Par
exemple, pour le web, les adresses se nomment des URL (Universal
Resource Locator, ce qui veut dire, à peu près,
adresse universelle d'une ressource) et ressemblent à
: http://www.globenet.org/RLF
Vous n'êtes
pas obligé de comprendre cette adresse mais vous devez
la taper sans erreur en respectant notamment la différence
majuscules/minuscules. Si vous voulez la décoder, notez
simplement que le premier champ (les lettres avant le :) désigne
le protocole, c'est-à-dire le langage informatique à
utiliser entre les deux machines (il en existe d'autres que
HTTP), le deuxième champ (entre les // et le premier
/ isolé) est le nom de la machine serveuse et le reste
de l'adresse désigne un fichier ou dossier précis
sur un serveur qui peut en comporter beaucoup.
Ceci ne
concerne que le web : les adresses du courrier électronique
sont différentes. Il s'agit en effet d'un service très
différent, aussi bien dans ses concepts que dans son
utilisation. Elles ressemblent à : bortzmeyer@ras.eu.org
Le premier champ (à gauche du @) est en général
le nom du destinataire (cela peut être un pseudonyme ou
des initiales) et le deuxième champ (à droite
du @) est un domaine.
Les câbles
Tous ces
ordinateurs sont reliés par des câbles, eux aussi
très variés. Vous avez peut-être entendu
des affirmations du type "Pour surfer plus vite sur le
Net, il faudrait plus de fibres optiques". En réalité,
le problème du débit des tuyaux est bien plus
complexe que cela.
Pour l'utilisateur
de l'Internet, la performance dépend de la latence et
du débit. La première est le temps que mettent
les données à voyager. Le second est la quantité
de données qui peuvent passer en même temps. Pour
prendre une comparaison automobile, un scooter a certainement
une meilleure latence qu'un camion dans les rues de Paris (il
arrivera avant le camion) mais le camion a un meilleur débit
(un déménagement avec le camion prendra moins
de temps).
Le facteur
essentiel qui gouverne la latence est la longueur du "câble".
Une liaison satellite a en général une mauvaise
latence car la plupart des satellites de télécommunication
sont installés sur l'orbite géostationnaire, qui
est loin de la Terre. C'est pour cela que les liaisons transatlantiques
sont en général le fait de câbles sous-marins.
Pour un
serveur web, c'est en général le débit
qui est le plus important.
Le facteur
essentiel qui gouverne le débit est la rapidité
de modulation de l'émetteur, c'est-à-dire la capacité
de l'émetteur à émettre beaucoup de bits
en peu de temps. Cette capacité dépend assez peu
du câble (encore qu'un câble de qualité insuffisante
puisse empêcher de tirer parti d'un émetteur rapide).
C'est ainsi que les mêmes câbles du téléphone
peuvent faire passer les 14 kilobits par seconde d'un modem
bas de gamme ou le débit mille fois supérieur
de la technique ADSL (2).
On voit que la fibre optique n'est nullement nécessaire.
Le kilobits
par seconde, c'est l'unité de débit (l'unité
de latence étant la seconde). Plus ce chiffre est élevé,
plus vous faites passer d'informations par seconde. Une image
typique d'une page web fait entre 10 et 40 kilo-octets. Une
page web typique, sans les éventuelles images, fait entre
1 et 2 kilo-octets (3).
Une image
à qualité suffisante pour être imprimée
atteint facilement 1 méga-octet (1024 kilo-octets). L'intégralité
de la Bible, Ancien et Nouveau Testament, prend, après
compression, à peu près la même taille.
Cela veut dire qu'avec le modem à 14 kilobits par seconde
ci-dessus, on fera passer la Bible en 8000/14 = moins de dix
minutes. Si on télécharge la Bible, on est en
général prêt à patienter un peu.
Mais, quand on attend une page web, on supporte beaucoup moins
bien une attente, ne serait-ce que de sept ou huit secondes.
Dans le même temps, avec un modem identique, on peut faire
passer 14 kilo-octets, ce qui fait une page moyenne avec une
ou deux très petites images.
Enfin,
le son ou la vidéo consomment tellement de débit
qu'il s'agit d'un véritable gaspillage des ressources
du réseau. Dans ce domaine, la notion de développement
durable ne s'est pas encore imposée.
Donnons
quelques valeurs typiques de débit. Un modem courant
débite entre 25 et 30 kilobits par seconde, selon l'état
de la ligne téléphonique (il ne sert à
rien d'avoir un modem rapide sur une mauvaise ligne, un problème
que les Africains connaissent bien). Une ligne spécialisée
(donc permanente) Transfix va entre 256 kilobits par seconde
et 2 mégabits par seconde. Un réseau local à
technologie Ethernet, comme il y en a sans doute dans votre
entreprise ou votre université, va à 100 mégabits
par seconde. Les grands câbles transatlantiques ont un
débit de plusieurs dizaines de gigabits par seconde,
mais partagé entre beaucoup d'utilisateurs (4)
C'est là
en effet la plus grande escroquerie qui accompagne les discours
des fournisseurs d'accès ou d'hébergement sur
les performances : faire croire que le débit du dernier
lien, celui qui arrive sur le bureau de l'utilisateur, est le
plus important. En réalité, le goulet d'étranglement
est bien souvent ailleurs. Les grandes lignes entre opérateurs
de télécommunication ont effectivement un très
fort débit, mais elles sont aussi très sollicitées.
Imaginez un fournisseur d'accès ayant cent cinquante
abonnés connectés simultanément, grâce
à ses batteries de modems. S'il a un débit total
de 2 mégabits par seconde dans les lignes le connectant
à l'extérieur, chaque abonné ne disposera
que de la vitesse d'un médiocre modem (5),
puisqu'ils se partagent le débit. Vu le taux de partage
régulièrement pratiqué, on comprend qu'aucun
fournisseur d'accès n'annonce ces chiffres.
C'est encore
plus vrai si vous passez par les lignes internationales. Si
vous regardez un site web hébergé au Japon, le
débit pratique dont vous disposez, pour vous tout seul,
est très inférieur à celui du plus lent
modem. Croire que passer d'une technologie modem à une
technologie, disons, ADSL, accélérera vos consultations
est erroné. Croire que votre site est assez rapide s'il
peut être consulté avec un modem à 28 kilobits
par seconde, est dangereux : si vous avez des lecteurs lointains,
quelle que soit la sophistication de leur équipement,
ils ne pourront pas avoir un tel débit.
Ce partage
varie en outre dans le temps. Combien d'utilisateurs, convaincus
par le discours commercial d'un nouvel opérateur ("Chez
nous, cela va bien plus vite") ont pris un nouvel abonnement,
constaté effectivement que cela marchait mieux, pour
se retrouver, trois mois plus tard, aux mêmes débits
qu'avant, lorsque beaucoup d'autres ont été convaincus,
et utilisent les mêmes lignes qu'eux.
Résumons-nous
: le débit à prendre en compte est celui du plus
faible maillon de la chaîne. Rien ne sert de courir sur
une portion du trajet, s'il y a des obstacles sur une autre.
Stéphane
Bortzmeyer
1
- Enregistrez une version de votre document, à partir
de votre logiciel de traitement de texte, au format "Texte
seul", et envoyez cette version.
2
- Assymetric Digital Subscriber Line.
3
- La moitié étant facilement prise par les balises
HTML. Il existe des programmes qui permettent de mesurer facilement
la taille totale d'une page (en comptant les images, les "frames",
etc.), même si celle-ci est sur un serveur web distant.
Par exemple, le logiciel Delambre : http://delambre.sourceforge.net
4
- Rappel : un kilobit égale mille bits, un mégabit
égale un million de bits et un gigabit égale un
milliard de bits. Mais un kilo-octet égale 1024 octets.
5
- D'autant plus qu'aux clients par modem s'ajoutent souvent
d'autres clients par ligne plus rapide et les sites Web hébergés.