Annexe 1
Comment marche l'Internet
Cette annexe, rédigée par Stéphane
Bortzmeyer, contient des informations assez techniques. Son
but n'est pas de vous transformer en informaticien, ni de
vous parler de toutes les techniques utilisées sur
Internet. Il s'agit au contraire de faire comprendre en quoi
la technique actuelle influe sur le travail du webmestre. Si
un rédacteur en chef n'a pas besoin d'être
aussi imprimeur, il doit en revanche comprendre les
contraintes techniques de ce dernier, de façon
à ne pas lui demander des choses impossibles.
Cette annexe décrit l'Internet comme un
réseau d'ordinateurs. Elle se focalisera sur la
technique. L'annexe suivante décrira l'Internet comme
un ensemble d'organisations qui le gèrent.
1 - Qu'est-ce que l'Internet ?
L'Internet est physiquement composé des millions
d'ordinateurs qui y sont connectés, des
matériels d'interconnexion et des câbles qui
les relient.
Ces ordinateurs sont très différents les
uns des autres, aussi bien du point de vue matériel
que logiciel.
Le matériel comporte de banals PC
(micro-ordianteurs), comme celui sur lequel a
été tapé ce texte, et d'énormes
machines, comme celle qui héberge le moteur de
recherche AltaVista, dont le prix les met hors de
portée de toute association. Mais la
différence n'est que quantitative : tous ont un
égal accès à l'Internet et il n'y a pas
moyen de connaître le prix d'une machine à
distance... Répétons-le : il n'y a pas de
différence qualitative entre les machines serveuses
et votre machine de bureau. Et, même du point de vue
quantitatif, le serveur web que vous consultez est
probablement hébergé sur une machine plus
petite que votre PC multimédia dernier cri.
La plus grosse différence entre ces ordinateurs
est logicielle : ils fonctionnent avec des
systèmes d'exploitation différents. Le
système d'exploitation est le logiciel de base de
l'ordinateur. C'est lui, bien plus que le matériel,
qui détermine le comportement de la machine. Le PC
sur lequel cette annexe a été écrite
utilise le système d'exploitation Linux. Cela a beau
être un PC, un habitué du système
d'exploitation MS-Windows serait bien surpris et aurait sans
doute du mal à s'en servir. Le matériel, en
fait, n'est qu'une caisse et l'utilisateur interagit avec du
logiciel, ce qui est la chose importante.
Répétons le, un Macintosh utilisant Linux
ressemblera beaucoup plus à un PC avec Linux
qu'à un autre Macintosh dont le système
d'exploitation est le MacOS d'Apple.
En plus du système d'exploitation, logiciel de
base utilisé par la machine, tout ordinateur a un
grand nombre de logiciels d'application, ceux qui vont
servir au travail quotidien : traitement de textes,
éditeur de textes, vérificateur de pages web,
logiciel de dessin, etc. Il existe une encore plus grande
variété de ces logiciels que celle qui
règne en matière de systèmes
d'exploitation.
D'où la première règle,
imposée par cette variété : ne
considérez pas comme acquis que vos correspondants
sur Internet ont le même logiciel que vous. On
reçoit souvent des documents par courrier
électronique. Certaines personnes, semblables au
touriste états-unien qui s'étonne que tout le
monde ne parle pas anglais partout, envoient des documents
spécifiques d'un logiciel particulier, ou même
d'une version particulière d'un logiciel. Si vous
voulez maximiser vos chances d'être lu, ne faites pas
cela : tenez-vous en aux normes communes à
toutes les machines de l'Internet (1). Ce
n'est pas parce que vous avez MS-Word version 2000 que
vos correspondants auront fait le même choix
d'équipement.
Les ordinateurs ne sont pas tout : d'abord, outre
votre machine de bureau, la seule que vous voyiez, de
nombreux autres ordinateurs concourent à ce que
l'Internet marche. Il y a le serveur web, sur lequel vos
fichiers sont hébergés (et les logiciels qui
tournent sur ces machines sont en général
très différents de ceux que vous avez sur
votre micro-ordinateur), il y a les serveurs de noms de
domaine, et il y a des machines plus éloignées
encore de la vôtre comme les routeurs, qui sont les
postes d'aiguillage de l'Internet, les machines où se
prend la décision d'envoyer des données par
une route plutôt que par une autre. Quoique
invisibles, ils sont indispensables, et les performances de
l'Internet dépendent beaucoup d'eux.
Là encore, ces machines si discrètes que
vous n'avez pas conscience de leur présence, forment
l'infrastucture de l'Internet.
Les câbles qui les relient feront l'objet de la
section 3.

2 - Comment ça
fonctionne
La plupart (mais pas tous) des services de l'Internet
fonctionnent en mode client-serveur. Cela veut simplement
dire qu'un des ordinateurs possède les informations,
elles sont stockées sur ses disques, et que l'autre
va les lui demander. Le serveur est celui qui possède
les informations. Il attend des clients et, comme ceux-ci
peuvent arriver n'importe quand, le serveur est typiquement
une machine allumée 24 heures sur 24. Le
client est couramment votre machine de bureau : au
moment que vous décidez, votre ordinateur va aller
chercher des informations sur le serveur.
Notez que, dans le cas du web, une même machine
serveuse peut héberger de très nombreux
sites.
Pour que le transfert d'informations du serveur au client
se fasse bien, il faut deux choses : que le client
connaisse l'adresse du serveur, pour savoir où
demander, parmi les milliers de machines connectées,
et que le serveur et le client parlent un langage commun, ce
que l'on nomme un protocole.
Les adresses sont utilisées partout dans les
réseaux (et pas seulement dans les réseaux
informatiques, un numéro de téléphone
est un exemple d'adresse). Dans l'Internet, vous avez un
type d'adresse par service utilisé. Par exemple, pour
le web, les adresses se nomment des URL (Universal Resource
Locator, ce qui veut dire à peu près adresse
universelle d'une ressource) et ont l'allure suivante :
http://www.globenet.org/RLF/
Vous n'êtes pas obligé de comprendre cette
adresse. Comme un numéro de téléphone,
vous êtes juste obligé de la taper sans erreur,
notamment en respectant la différence
majuscules/minuscules. Mais, si vous voulez la
décoder, notez simplement que le premier champ (les
lettres avant le :) désigne le protocole,
c'est-à-dire le langage informatique à
utiliser entre les deux machines (il en existe d'autres que
HTTP), le deuxième champ (entre les // et le
premier / isolé) est le nom de la machine
serveuse et le reste de l'adresse désigne un fichier
ou dossier précis sur un serveur qui peut en
comporter beaucoup.
Ceci ne concernait que le web : les adresses du
courrier électronique sont différentes, ce qui
est normal puisqu'il s'agit d'un service très
différent, aussi bien dans ses concepts que dans son
utilisation. Elles ressemblent à :
bortzmeyer@ras.eu.org
où le premier champ (à gauche du @)
est en général le nom du destinataire (cela
peut être un pseudonyme ou des initiales) et le
deuxième champ (à droite du @) est un
domaine.

3 - Les câbles
Tous ces ordinateurs sont reliés par des
câbles, eux aussi très variés. Vous avez
peut-être entendu des affirmations de type yakafokon
comme "Pour surfer plus vite sur le Net, il faudrait plus de
fibres optiques". En réalité, le
problème du débit des tuyaux est bien plus
complexe que cela.
D'abord, éliminons quelques erreurs de
vocabulaire : je n'utiliserai pas le mot "vitesse" car
il est trop flou. Pour l'utilisateur de l'Internet, il y a
deux choses importantes quand on parle de
performances : la latence et le débit. La
première est le temps que mettent les données
à voyager. Le second est la quantité de
données qui peuvent passer en même temps. Pour
prendre une comparaison automobile, un scooter a
certainement une meilleure latence qu'un camion dans les
rues de Paris (il arrivera avant le camion) mais le camion a
un meilleur débit (un déménagement avec
le camion prendra moins de temps).
Le facteur essentiel qui gouverne la latence est la
longueur du "câble". Une liaison satellite a en
général une mauvaise latence car la plupart
des satellites de télécommunication sont
installés sur l'orbite géostationnaire, qui
est loin de la Terre. C'est pour cela que les liaisons
transatlantiques sont en général faites par
des câbles sous-marins.
Pour un serveur web, c'est en général le
débit qui est le plus important.
Le facteur essentiel qui gouverne le débit est la
rapidité de modulation de l'émetteur,
c'est-à-dire la capacité de l'émetteur
à émettre beaucoup de bits en peu de temps.
Cette capacité dépend assez peu du câble
(encore qu'un câble de qualité insuffisante
puisse empêcher de tirer parti d'un émetteur
rapide). C'est ainsi que les mêmes câbles du
téléphone peuvent faire passer les 14 kilobits
par seconde d'un modem bas de gamme ou le débit mille
fois supérieur de la technique ADSL (2).
On voit que la fibre optique n'est nullement
nécessaire.
Je viens de parler de kilobits par seconde. C'est
l'unité de débit (l'unité de latence
étant la seconde). Plus ce chiffre est
élevé, plus vous faites passer d'informations
par seconde. Une image typique d'une page web fait entre 10
et 40 kilo-octets (les informaticiens et les gens des
télécoms n'utilisent pas les mêmes
unités : un octet égal huit bits, donc
une image web pèse entre 80 et 320 kilobits
(3). Une page web typique, sans les
éventuelles images, fait entre 1 et 2 kilo-octets
(4).
Du côté des gros, une image à
qualité suffisante pour être imprimée
atteint facilement 1 méga-octet
(1024 kilo-octets). L'intégralité de la
Bible, Ancien et Nouveau Testaments, prend, après
compression, à peu près la même taille.
Cela veut dire qu'avec le modem à 14 kilobits
par seconde ci-dessus, on fera passer la Bible en
8000/14 = moins de dix minutes. Si on
télécharge la Bible, on est en
général prêt à patienter un peu.
Mais, quand on attend une page web, on supporte beaucoup
moins une attente, ne serait-ce que de sept ou huit secondes
(chronométrez, vous verrez à quel point huit
secondes sont longues devant son écran). Dans ce
temps, avec le même modem, on peut faire passer
14 kilo-octets, ce qui fait une page moyenne avec une
ou deux très petites images.
Enfin, le son ou la vidéo consomment tellement de
débit qu'il s'agit d'un véritable gaspillage
des ressources du réseau. Dans ce domaine, la notion
de développement durable ne s'est pas encore
imposée.
Donnons quelques valeurs typiques de débit. Un
modem courant débite entre 25 et 30 kilobits par
seconde, selon l'état de la ligne
téléphonique (il ne sert à rien d'avoir
un modem rapide sur une mauvaise ligne, un problème
que les Africains connaissent bien). Une ligne
spécialisée (donc permanente) Transfix va
entre 64 kilobits par seconde et 2 mégabits
par seconde. Un réseau local à technologie
Ethernet, comme il y a sans doute dans votre entreprise ou
votre université, va à 10 mégabits
par seconde, et à 100 dans ses versions
récentes. Les grands câbles transatlantiques
ont un débit de plusieurs gigabits par seconde, mais
partagé entre beaucoup d'utilisateurs (5)
C'est là en effet la plus grande escroquerie qui
accompagne les discours des fournisseurs d'accès ou
d'hébergement sur les performances : faire
croire que le débit du dernier lien, celui qui arrive
sur le bureau de l'utilisateur, est le plus important. En
réalité, le goulet d'étranglement est
bien souvent ailleurs. Les grandes lignes entre
opérateurs de télécommunication ont
effectivement un très fort débit, mais elles
sont aussi très sollicitées. Imaginez un
fournisseur d'accès ayant cent cinquante
abonnés connectés simultanément,
grâce à ses batteries de modems. S'il a un
débit total de 2 mégabits par seconde
dans les lignes le connectant à l'extérieur,
chaque abonné ne disposera que de la vitesse d'un
médiocre modem (6), puisqu'ils se
partagent le débit. Vu le taux de partage
régulièrement pratiqué, on comprend
qu'aucun fournisseur d'accès n'annonce ces
chiffres.
C'est encore plus vrai si vous passez par les lignes
internationales. Si vous regardez un site web
hébergé au Japon, le débit pratique
dont vous disposez, pour vous tout seul, est très
inférieur à celui du plus lent modem. Croire
que passer d'une technologie modem à une technologie,
disons, ADSL, accélérera vos consultations est
erroné. Croire que votre site est assez rapide, s'il
peut être consulté avec un modem à
28 kilobits par seconde, est dangereux : si vous
avez des lecteurs lointains, quelle que soit la
sophistication de leur équipement, ils ne pourront
pas avoir un tel débit.
Ce partage varie en outre dans le temps. Combien
d'utilisateurs, convaincus par le discours commercial d'un
nouvel opérateur ("Chez nous, cela va bien plus
vite") ont pris un nouvel abonnement, constaté
effectivement que cela marchait mieux, pour se retrouver,
trois mois plus tard, aux mêmes débits
qu'avant, lorsque beaucoup d'autres ont été
convaincus, qui vont utiliser les mêmes lignes
qu'eux.
Résumons cette section : le débit
à prendre en compte est celui du plus faible maillon
de la chaîne. Rien ne sert de courir sur une portion
du trajet, s'il y a des obstacles sur une autre.

4 - Coûts
Les coûts de toute cette infrastructure sont
supportés par les opérateurs, qui vous les
refacturent.
Lorsque vous prenez un abonnement simple, vous payez en
général votre ordinateur et votre modem
(l'équipement qui sert à connecter un
ordinateur au réseau téléphonique),
ainsi qu'un abonnement, en général
forfaitaire, à votre fournisseur d'accès
Internet. En outre, vous payez les communications
téléphoniques pour joindre ledit fournisseur.
Du point de vue du réseau téléphonique,
ce sont des communications ordinaires. Si votre fournisseur
est proche géographiquement, vous payez en
communication locale.
Il existe d'autres modes de facturation. Par exemple, les
abonnements au câble TV sont typiquement
entièrement forfaitaires, puisqu'il n'y a pas de
coût de communication téléphonique.
Si vous payez un fournisseur d'hébergement pour
votre site web, le système est en
général le même : un coût
d'installation, puis un coût mensuel, qui lui servent
à payer ses machines, ses câbles et son
personnel.

5 - Les services de l'Internet
Il est fréquent d'entendre mélanger le web
avec l'ensemble de l'Internet. Mais le web n'est qu'un des
nombreux services de l'Internet. C'est un des plus
récents mais, comme il est le plus spectaculaire, il
est le seul que l'on montre aux ministres lors des
démonstrations officielles. Les autres services se
prêtent en général moins bien au
spectacle.
Le web est le service de distribution de documents
depuis une source, le serveur, vers de nombreux clients. Il
est donc proche des médias traditionnels (une source
arrose de nombreux lecteurs passifs), ce qui le rend plus
familier.
Le courrier électronique est sans doute
l'application la plus utilisée avec le web. Ce
service permet à deux personnes de s'échanger
des informations, mais, contrairement au
téléphone, il a connu beaucoup d'extensions
pour aller au-delà de la simple communication
à deux.
Dans le courrier électronique, vous envoyez des
documents (presque toujours du texte seul, mais ce n'est pas
une obligation ; toutefois, cela simplifie beaucoup les
problèmes de compatibilité avec la machine de
votre correspondant) à une ou plusieurs adresses.
Derrière ces adresses, on trouve en
général une seule personne, mais on peut aussi
avoir plusieurs personnes, qui recevront toutes le
message.
Le courrier électronique, contrairement au
téléphone, ne nécessite pas de
présence simultanée. Il est donc moins
dérangeant et il est la seule solution
réaliste en cas de décalage horaire ou
simplement de présences décalées (ce
qui est fréquent dans le monde associatif, où
tout le monde n'est pas permanent de son association). En
outre, il permet d'envoyer des documents que chacun pourra
retravailler sur son ordinateur, permettant un vrai travail
en commun. C'est donc un outil de bureautique ordinaire,
comme le traitement de texte.
Le courrier permet également la création de
listes : une liste est une adresse
derrière laquelle se trouvent plusieurs personnes. Il
existe de nombreuses applications des listes. Pour une
association, cela permet par exemple d'annoncer à
l'extérieur une seule adresse officielle, alors que
le courrier qui y sera reçu sera transmis à
plusieurs personnes, facilitant la circulation de
l'information et augmentant les chances que quelqu'un puisse
répondre. Une autre application courante des listes
est la liste de discussion. L'abonnement à cette
liste est souvent fait par un logiciel : on lui envoie un
message par courrier et il vous inscrit automatiquement.
Ensuite, on recevra tous les messages destinés
à la liste. Il existe des listes sur d'innombrables
sujets, certaines de pure discussion
(cafeducommerce@fai.fr), d'autres de travail
(personnes impliquées dans le même projet, par
exemple l'organisation d'une manifestation internationale
(7).
Les listes (de diffusion, de discussion, de travail)
peuvent jouer un rôle important dans l'activité
d'une association. Ce rôle est souvent
sous-estimé car elles ne sont pas très
spectaculaires.
Pour faire héberger votre liste de diffusion,
trois solutions :
- si la liste est très petite (quelques dizaines
d'abonnés, deux ou trois messages par jour), vous
pouvez parfois l'héberger sur votre machine, avec
des techniques plus ou moins artisanales. Ne sous-estimez
pas le travail technique que cela représente :
beaucoup de choses peuvent aller mal pendant le
fonctionnement d'une liste ;
- vous pouvez faire héberger votre liste chez un
fournisseur payant. Les fournisseurs commerciaux
proposent très rarement ce service et souvent
à des prix exhorbitants. En revanche, vue
l'importance des listes pour le monde associatif, tous
les fournisseurs non-marchands ont cette offre à
leur catalogue ;
- vous pouvez vous faire héberger chez un
fournisseur commercial gratuit. Attention : vous
perdez pratiquement tout contrôle sur la liste.
Lisez bien le contrat : l'hébergeur peut
faire ce qu'il veut de la liste des abonnés, peut
rajouter de la pub quant ça lui chante, peut
parfois faire ce qu'il veut des messages
échangés, etc. En outre, de tels
fournisseurs sont souvent situés dans des pays qui
n'offrent aucune protection de type "Loi Informatique et
Libertés". A méditer avant de leur confier
vos fichiers !
L'Internet permet également le transfert de gros
fichiers (par le protocole FTP), comme la Bible dont j'ai
parlé plus haut. Il n'y a pas de distinction nette
entre ce service et le web. Cela peut permettre, par
exemple, de distribuer facilement de gros textes en cours de
relecture, ou bien des logiciels (la plupart des logiciels
libres sont surtout distribués ainsi).
Les News (appelées souvent du nom du
réseau virtuel Usenet) sont un service de
conférences électroniques. Elles ressemblent
aux listes de discussion, mais avec des techniques
différentes. En général, les News sont
plus ouvertes, moins orientées vers les tâches
concrètes. Dans les domaines techniques, les listes
et les News sont un très puissant outil de formation
permanente et de veille technologique.
Enfin, il existe d'innombrables autres services :
des plus techniques (synchronisation automatique des
horloges de différentes machines, pour qu'elles
affichent la même heure) aux plus animés (les
systèmes de conversation en direct comme l'IRC -
Internet Relay Chat) en passant par les plus ludiques
(les jeux vidéo en réseau où l'on
massacre les monstres à plusieurs).

Complétez cette section :
- Voyez l'annexe 2 pour les
explications sur, entre autre, les noms de domaine et les
opérateurs.
Notes
(1) Enregistrez une version de votre
document, à partir de votre logiciel de traitement de
textes, au format "Texte seul", et envoyez cette
version.
(2) Assymetric Digital Subscriber
Line, actuellement encore peu
déployée.
(3) Pour aggraver les choses, les
anglophones disent souvent "byte" pour un octet, ce que l'on
confond facilement avec "bit", surtout en notation
abrégée.
(4) La moitié étant
facilement prise par les balises HTML. Il existe des
programmes qui permettent de mesurer facilement la taille
totale d'une page (en comptant les images, les "frames",
etc.), même si celle-ci est sur un serveur web
distant. Par exemple, le logiciel Delambre :
http://delambre.sourceforge.net
(5) Rappel : un kilobit égale mille
bits, un mégabit égale un million de bits et
un gigabit égale un milliard de bits. Mais un
kilo-octect égale 1024 octets.
(6) D'autant plus qu'aux clients par modem
s'ajoutent souvent d'autres clients par lignes plus rapides
et les sites Web hébergés.
(7) C'est ainsi qu'ont été
organisées les Marches européennes contre le
chômage (qui eurent lieu au printemps 97), le budget
des associations de chômeurs excluant toute
coordination par téléphone ou même par
fax.

|