Archive Liste Typographie
Message : Re: Le retour du fils de la vengeance de la FAQ typo (Re: Altern)

(Fabrice Bacchella) - Dimanche 13 Juin 1999
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: Le retour du fils de la vengeance de la FAQ typo (Re: Altern)
Date:    Sun, 13 Jun 1999 17:30:53 +0200
From:    Fabrice Bacchella <fbacchella@xxxxxxx>

Non, il y a confusion entre le codage (encoding en anglais) & le jeux de
caractère.
ISO Latin1 et ISO 8859-1 sont rigoureusement identique. Il s'agit du
jeux de caratère (c'est à dire l'association entre une valeur numérique
et un caratère). Il existe ensuite plusieurs façon de coder cette valeur
:
-7 bits, qui n'autorise que les valeurs de 0 à 127 ;
-quoted-printable, qui permet de coder les valeurs 128 à 255 sur un
canal 7 bits, 
 comme une communication SMTP par exemple ;
- 8 bits qui autorise les valeurs de 0 à 255 sur un canal adéquat, ESMPT
par
  exemple(supporté par les serveurs de courrier récents comme sendmail)
;
- UTF-7 qui permet de coder des valeurs de 0 à 65535 sur un canal 7 bits
;
- UTF-8 qui permet de coder des valeurs de 0 à 65535 sur un canal 8 bits
;

Les problèmes que vous rencontrez proviennet, non du changement de jeux
de caratère, mais du changement de codage. HTML, en plus de tous les
méthodes évoqués précédement, propose un autre codage, travaillant sur
un canal 7 bits. Il remplace un caractère par son nom, ansi è devient
"&egrave;". De même que À devient =C0 en quoted-printable

Olivier RANDIER wrote:
> Non, pour ce que j'en comprends, ISO-8859-x et ISO-Latin-x ne recouvre pas la même 
> réalité. Pour preuve, l'éditeur HTML que j'utilise pour la FAQ me propose la conversion
> de et vers ISO-Latin-1, d'une part, et de et vers ISO-8859-1, d'autre part. ISO-8859-1 
> établit la correspondance entre codes 8 bits (ASCII ?) et caractères, alors > qu'ISO-Latin-1 transcrit toutes les lettres sortant du 7 bits sous forme d'entités > (&...;). On peut donc considérer, je pense, qu'ISO-Latin est une version sécurisée > d'ISO-8859-1, qui permet de transmettre le texte de façon à peu près sure, même si le > destinataire ne comprends pas l'ISO-8859-1.
> 
> Si je convertis la phrase suivante (depuis le codage Mac) :
> Dès Noël, où un zéphyr haï me vêt de glaçons würmiens, je dîne d'exquis rôtis de boeuf au 

> en ISO-8859-1, j'obtiens ceci :
> DËs NoÎl, o? un zÈphyr haÔ me vÍt de glaÁons w¸rmiens, je dÓne d'exquis rÙtis de boeuf au 
> Alors qu'en ISO-Latin-1, j'obtiens ceci :
> D&egrave;s No&euml;l, o&ugrave; un z&eacute;phyr ha&iuml; me v&ecirc;t de gla&ccedil;ons 

Le comportement de votre outil est clairement fautif.

>
> >Quant à être la norme d'échange en courrier électronique, je ne suis pas
> >sûr. À moins qu'un RFC récent ait changé cela, si le courrier ne
> >contient aucune entête spéciale il est a priori en ASCII. Si on transmet
> >de l'ISO 8859-1, l'entête devra comprendre :
> > Mime-Version: 1.0
> > Content-Type: text/plain; charset=iso-8859-1
Définition du jeu de caratère (lié à la langue)

> > Content-Transfer-Encoding: 8bit
Définition du codage, lié aux possibilitées du canal utilisé.

> 
> Oui et non. Certes, le courrier est transmis en ASCII 7 bits (enfin, je crois). >ISO-8859-1 est actuellement la norme la plus efficace (sic) pour transmettre du 8 bits de >cette manière. Tout nos problèmes, si je comprends bien, viennent du fait qu'on utilise >des tuyaux de 7 bits pour transmettre du 8 bits. Quand ça marche, ça va. Quand ça ne >marche pas, on obtient le résultat du dernier postage de la charte ;-(

L'ASCII ne supporte que des valeurs de 0 à 127. Il est donc
automatiquement 7 bits.

De plus en plus de tuyau supporte le 8 bits. Dans le cas du courier,
pour le savoir, il suffit de se connecter sur le port 25 de son serveur
favoris et de taper la command "EHLO toto". Si la réponse commence par
250, c'est bon, le canal supporte le 8 bits. Sinon, appelez
l'administrateur système du serveur pour vous plaindre.