Dans cette partie de l'exposé, nous allons voir en détail ce que tout internaute gagnerait à savoir, concernant la façon dont les e-mails voyagent, Quel est leur contenu exact, comment les informations sont codées…
Cette partie est donc divisée en trois paragraphes :
Supposons un cas simple (et cependant courant).
POP3 est un protocole de relève de courrier. Sans entrer ici dans les détails, il en existe un autre appelé IMAP. D'ailleurs, tout ceci est étudié dans d'autres chapitres de ce site.
C'est le protocole applicatif qui permet de transporter les messages sur l'Internet. Il sait acheminer un message jusqu'à une boîte aux lettres, mais ne va pas plus loin.
Pour y arriver, il analyse dans un premier temps la partie de l'adresse située à droite du @ (à prononcer dans ce cas « at »), pour trouver le domaine du destinataire. Si ce domaine le concerne, il cherche alors la boîte aux lettres du destinataire en regardant la partie de l'adresse située à gauche du @. Si le domaine du destinataire ne le concerne pas, il va chercher le serveur SMTP qui gère ce domaine, au moyen des champs MX du DNS du domaine destinataire et transmet le message à ce serveur.
Ce protocole est exclusivement utilisé pour le dialogue entre le client de messagerie et la boîte aux lettres. Il ne fait pas de transport sur l'Internet, il permet juste à l'utilisateur de gérer son courrier. IMAP4 (Internet (ou Interactive ?) Mail (ou Message ?) Access Protocol version 4) en est une alternative.
Un peu de jargon :
Lorsque l'on rédige un courrier et qu'on le poste, on le fait avec le MUA qui le transmet au MTA qu'on lui a signalé dans la configuration (pour un abonné Free, c'est normalement smtp.free.fr). C'est l'étape 1 du petit schéma vu plus haut.
De MTA en MTA, le message voyage jusque sur le MTA qui a en charge la messagerie du domaine du destinataire (étape 2). Il le passe alors (avec tous les autres messages entrant pour ce domaine) au MDA qui distribue ce courrier entrant dans les boites aux lettres concernées (étape 3).
Les étapes 4, 5 et 6 concernent le serveur POP (ou IMAP).
D'abord, en français on ne dit pas « e-mail », ni « mail »; on dit « mèl » (je t'envoie un mèl, tu m'envoies un mèl, on s'envoie des mèls), on peut dire également « courriel ». Mais, pour la bonne compréhension du texte, je continuerai à écrire « e-mail ».
Lorsque vous recevez un e-mail, votre MUA (maintenant qu'on sait ce que c'est) vous montre:
Mais votre e-mail contient toute une partie « cachée » qui nous permet de savoir quel chemin cet e-mail a suivi pour arriver dans votre boîte aux lettres.
Cette partie, appelée l'en-tête, n'est pas « top secret », bien que non visible par défaut. Vous pouvez toujours la consulter avec votre MUA. Pour Thunderbird, menu « Affichage/code source du message ». Pour Outlook Express, il y a longtemps que j'ai oublié.
Return-Path: <christian.caleca@wxnxdoo.fr> Received: from alisier.wxnxdoo.fr (smtp-rt-9.wxnxdoo.fr [193.252.19.55]) by mail.monaco.net (Pro-8.9.3/Pro-8.9.3) with ESMTP id SAA07439 for <eme13@enprovence.com>; Thu, 11 May 2000 18:20:10 +0200 Received: from mahonia.wxnxdoo.fr (193.252.19.58) by alisier.wxnxdoo.fr; 11 May 2000 18:20:08 +0200 Received: from CHRIS (62.161.101.240) by mahonia.wxnxdoo.fr; 11 May 2000 18:19:51 +0200 Message-ID: <000501bfbb64$afc796c0$0a00a8c0@maison.mrs> From: "Christian CALECA" <christian.caleca@wxnxdoo.fr> To: <eme13@enprovence.com> Subject: test itineraire Date: Thu, 11 May 2000 18:19:24 +0200 MIME-Version: 1.0 Content-Type: text/plain; charset= "iso-8859-1" Content-Transfer-Encoding: 8bit X-Priority: 3 X-MSMail-Priority: Normal X-Mailer: Microsoft Outlook Express 5.00.2919.6600 X-MimeOLE: Produced By Microsoft MimeOLE V5.00.2919.6600 Status: Juste pour analyser l'en-tête
Toute la partie en gras constitue ce que l'on appelle l'en-tête, alors que la dernière ligne, le message lui-même, s'appelle le corps.
Note :
Pour éviter de faire la partie trop belle aux robots renifleurs d'adresses e-mails, certains noms de domaines ont été volontairement dégradés.
Tous les mots finis par « : » sont des champs qui ont une signification particulière, soit pour les MTA, soit pour les MUA. Nous allons détailler leur signification.
Return-Path: | C'est l'adresse qui sera utilisée: * Pour la réponse (la fonction répondre à l'expéditeur) * Le renvoi du message s'il ne peut arriver au destinataire. |
---|---|
Received: | Cette ligne est un peu particulière. Chaque MTA qui reçoit le message y incrit le nom du MTA qui le lui a envoyé, ainsi que le sien. Il est ainsi possible de retracer complètement la route qu'a suivi le message de l'expéditeur jusqu'au destinataire. |
Message-ID: | C'est un identifiant unique du message. Il est attribué par le premier MTA qui reçoit le message (Protocole ESMTP: Extended SMTP). |
From: | C'est l'adresse de l'expéditeur. Elle est par défaut recopiée dans le « return path », sauf configuration différente du MUA de l'expéditeur. |
To: | C'est l'adresse du (ou des) destinataire(s) |
Subject: | L'objet du message |
Date: | La date d'émission écrite par le MUA de l'émetteur |
MIME-Version: | Version du mode de codage des données. Cette information a tellement d'importance que nous allons y consacrer toute une page. |
Content-Type: | Type de codage utilisé. |
charset= | Jeu de caractères utilisé. |
Content-Transfer-Encoding: | Codage sur 7 ou 8 bits. |
X-… | Tous les champs commençant par X ne sont pas des champs « officiels ». CHaque MUA est libre d'en ajouter autant qu'il veut. Leur contenu n'est pas pris en compte par les MTA. Ainsi, il est illusoire de croire que le champ X-Priority ait une quelconque importance dans la vitesse de transport du message. |
Cette liste de champs n'est pas complète. Il y en aurait pour trois pages à les énoncer tous…
L'en-tête contient donc toutes les informations nécessaires pour:
Ce protocole a la vertu d'être particulièrement « solide », mais il est un peu ancien et il lui manque quelques fonctionnalités qui seraient bien utiles aujourd'hui :
Ces deux limites peuvent être contournées :
Nous allons tout de même faire deux où trois observations utiles, pour comprendre mieux comment il faut configurer son MUA pour être lu correctement.
Bien que le codage des données soit traité plus en détail ailleurs sur ce site, voyons tout de même rapidement quelques points importants.
Pour illustrer ceci, nous allons envoyer des messages avec Outlook Express et nous allons les lire avec un outil rustique sous Linux : l'outil « mail ». Cet outil fonctionne en mode texte. Plus rustique, vous n'aurez que Telnet.
Nota :
Les captures ne datent pas d'hier et elles utilisent Outlook Express qui n'est pas recommandable, mais qui permet de mener à bien la manip.
C'est-à-dire pas de codage particulier pour le texte. On envoie ce message :
Et l'on récupère ceci (à la condition que votre console utilise ISO-8859-1):
C'est correct. L'en-tête indique que le contenu est du texte de type « plain text » encodé sur 8 bits, avec un jeu de caractères « ISO-8859-1 ». Comme vous pouvez le constater, le texte est parfaitement lisible. Il y a cependant un problème potentiel en voie de disparition: La plupart des MTA utilisent un protocole ESMTP qui gère l'ASCII sur 8 bits, mais il peut encore exister çà et là des vieux MTA qui mettront systématiquement le bit7 à 0. Le problème devrait aujourd'hui être rarissime. Dans ce cas, la seule solution est d'utiliser des caractères du code ASCII US, sans aucune lettre accentuée.
Outlook express propose ce mode en « texte brut ». Essayons pour voir…
Ben c'est pas terrible; les lettres accentuées sont curieusement codées…
En fait, dans ce mode de codage, les caractères qui peuvent être codés sur 7 bits sont transmis normalement, ceux qui ne le peuvent pas (bit 7 à 1) sont remplacés par « = » et la valeur du code ASCII sur 8 bits exprimé en hexadécimal.
A ne pas utiliser donc, si le destinataire ne dispose pas d'outil sachant décoder du « quoted printable ». Aujourd'hui, (20 juin 2008) cette façon de faire semble être à la mode sur la configuration par défaut de nombreux MUA. J'avoue ne pas en connaitre ni en comprendre la raison.
Outlook Express propose également ce mode de codage, lorsque l'on choisit le « texte brut ». On essaye…
C'est catastrophique. Mail ne sait pas du tout décoder le message…
Aucun caractère n'est lisible.
Enfin, le meilleur pour la fin, le message en HTML.
Je ne voudrais pas ici déclencher une polémique inextinguible sur ce sujet brûlant… Mais rappelons les faits.
Le texte pur, c'est bien, mais c'est de la génération de « edit », « notepad » et autres « vi ». Autrement dit, aucun enrichissement possible du texte. Il peut pourtant être utile de rédiger ses messages avec quelques possibilités des traitements de texte, comme les notions de gras, italique, souligné, mise en sur brillance etc. D'où l'idée d'écrire ses messages en HTML qui sait faire tout cela.
Mais voyons le résultat :
Ici, pas de copie d'écran, tellement le résultat est long:
From christian.caleca@w-n-doo.fr Thu May 11 09:00:46 2000 Return-Path: <christian.caleca@w-n-doo.fr> Delivered-To: chris@gateway2.maison.mrs Received: from chris (chris.maison.mrs [192.168.0.10]) by gateway2.maison.mrs (Postfix) with SMTP id DB2D51BAAF for <chris@gateway2.maison.mrs>; Thu, 11 May 2000 09:00:46 +0200 (CEST) Message-ID: <003501bfbb16$8a226dd0$0a00a8c0@maison.mrs> From: "Christian CALECA" <christian.caleca@w-n-doo.fr> To: <chris@gateway2.maison.mrs> Subject: codage HTML Date: Thu, 11 May 2000 09:00:06 +0200 MIME-Version: 1.0 Content-Type: multipart/alternative; # L'extension MIME indique ici que le message va être codé en deux parties, # de manière différente pour les deux parties... boundary="----=_NextPart_000_0031_01BFBB27.4D9A74F0" # Avec une balise que l'on aura du mal à confondre # avec le texte du message, quel qu'il soit. X-Priority: 3 X-MSMail-Priority: Normal X-Mailer: Microsoft Outlook Express 5.00.2919.6600 X-MimeOLE: Produced By Microsoft MimeOLE V5.00.2919.6600 # C'est un message de format MIME en plusieurs parties. ------=_NextPart_000_0031_01BFBB27.4D9A74F0 # Première balise Content-Type: text/plain; charset= »iso-8859-1 » Content-Transfer-Encoding: 8bit Ici, c'est ce qu'on fait de mieux: éèàçùî # Cette première partie a été codée de façon basique, # celle qui, normalement, doit fonctioner avec n'importe quel MUA, nous l'avons vu. ------=_NextPart_000_0031_01BFBB27.4D9A74F0 # Deuxième balise Content-Type: text/html; charset="iso-8859-1" Content-Transfer-Encoding: quoted-printable # Mais "quoted-printable", ce n'est pas forcément un bon choix... # Le « plain text » peut être utilisé dans le codage HTML <!DOCTYPE HTML PUBLIC « -//W3C//DTD HTML 4.0 Transitional//EN »> <HTML><HEAD> <META content=3D »text/html; charset=3Diso-8859-1" = http-equiv=3DContent-Type> <META content=3D »MSHTML 5.00.2919.6307 » name=3DGENERATOR> <STYLE></STYLE> </HEAD> <BODY bgColor=3D#ffffff> <DIV><FONT face=3DArial size=3D2>Ici, c'est ce qu'on fait de = mieux:</FONT></DIV> <DIV><FONT face=3DArial size=3D2>=E9=E8=E0=E7=F9=EE</FONT></DIV> <DIV> </DIV></BODY></HTML> # Tout ceci est du jargon HTML. Simple ici, parce qu'il n'y a aucune fioriture ! # Ce paragraphe aurait été beaucoup plus long, si l'on avait mis des couleurs, # des tailles de polices différentes, et surtout un fond de papier. # Notez que la seule partie signifiante de tout ceci est ce qui est surligné en blanc ------=_NextPart_000_0031_01BFBB27.4D9A74F0-- # Dernière balise.
Notez qu'Outlook Express, malgré tout le mal que l'on peut en dire ici où là , a la politesse de créer un paragraphe en « plain text » qui sera lisible par tout MUA. D'autres MUA n'ont même pas cette politesse.
Alors, pourquoi le HTML est-il proscrit par la netiquette ?
Voilà. Vous ne pourrez plus dire maintenant que vous ne saviez pas pourquoi il fallait faire attention au codage de vos messages