Archive Liste Typographie
Message : Re: R: point et legende

(Michel Houdé) - Mardi 02 Novembre 1999
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: R: point et legende
Date:    Tue, 2 Nov 1999 11:51:24 +0100
From:    Michel Houdé <michel.houde@xxxxxx>

[Philippe Jallon]
> Le 31/10/99, gualandi ftbcc écrivit :
> >J'ai essayé de corriger et insérer de nouvelles traductions. Je n'ai pas
> >fini, mais je vous envoie déjà le fichier que j'ai corrigé.
>
> Hélas, le fichier n'est utilisable que sous Windows ! :-(((
>
> Tous les signes diacritiques -- sans exception -- apparaissent
> tronqués ou modifiés. D'après le source du fichier, l'origine du
> problème est double :
> 1 - utilisation d'un jeu de caractères non standard, mais cher à
> Bilou l'Entarté (CP-1252) ;
> 2 - conversion défectueuse du fichier original avec la dernière
> version de Word (en essayant d'ouvrir le fichier avec Word 98,
> l'ordinateur m'indique que le fichier est endommagé ; bizarrement, le
> source fait apparaître un numérotage tronqué de la version de Word
> utilisée).

Les choses sont un peu plus compliquées que cela.

Il y a d'abord le fichier envoyé en pièce jointe (ou fichier attaché). Bien
que les logiciels de messagerie fassent tout pour le cacher, les fichiers
attachés font partie intégrale du message transmis, mais ils sont
obligatoirement trancodés en caractères à 7 bits.
Soit en Base64 pour les fichiers binaires (qui occupent de fait 1/3 de place
supplémentaire).
Soit en QuotedPrintable (je ne chercherai pas de traduction vaseuse pour ce
qui ne veut rien dire en anglais non plus) pour les fichiers de type texte.
On notera que ce codage est indépendant de celui appliqué au corps du
message qui pourra être en 8 bits, ou en QP.

Pour ce qui concerne notre ami italien, son message est en 8 bit
(iso-8859-1), tandis que la pièce jointe qui est un fichier HTML/XML, donc
de type texte, est en QP.

Se pose alors le problème du décodage par le logiciel de messagerie. Il va,
très normalement, le transcoder en caractères {iso-8859-1}. Comme il s'agit
d'un fichier HTML/XML, les navigateurs de dernière génération vont
l'afficher.

Malheureusement, Apple ayant fait en 1984 le choix d'un jeu de caractères
spécifique, les logiciels Mac ont besoin d'un niveau supplémentaire de
transcodage pour les fichiers textes. Il arrive qu'ils se prennent les pieds
dans le tapis, comme l'a signalé à diverses reprises dans le passé notre ami
Alain LaBonté.
Le fichier italien, une fois décodé de QP en ISO doit rester tel quel; c'est
le navigateur qui fera le reste.

Ça, c'était pour expliquer les caractères accentués défectueux sur le Mac.
On remarquera qu'il arrive fréquemment sur la liste que les citations
(reprises de messages auxquels on répond) soient mal transcodées par les
logiciels Mac.

Le fait que le fichier s'annonce en {windows-1252} qui est en fait
équivalent à {iso-8859-1}, à quelques caractères près, (la ligature oe,
l'apostrophe vraie, ...), n'a rien à voir. Cette mention est à l'intérieur
du fichier, le logiciel de messagerie ne le voit pas, ne peut pas le voir.
Par contre, les navigateurs non-windows peuvent renacler...

Maintenant le problème Word 9. Il ne s'agit pas d'une erreur. C'est le petit
nouveau Word 2000, qui succède à Word 8, appelé 97 sur PC et 98 sur Mac.
Particularité : enregistre ses fichiers, sur demande, au format binaire
classique, mais aussi au format HTML/XML, sans perte d'informations.

L'inconvénient, de taille (aux sens propre et figuré), c'est que les
fichiers HTML simples se retrouvent encombrés d'une foule d'instructions
inutiles, qui les alourdissent d'autant.
Il me semble qu'il y a une option de Wrd2k qui permet de remédier à cela (je
ne l'ai pas sous la main)...

Il faudra s'y faire, car XML est un langage public, ouvert, approuvé par le
W3C.
Il permet d'afficher des pages Web plus belles (typographiquement parlant,
bien sûr). Il a été choisi comme langage pour les livres éléctroniques.
Voilà pourquoi tout ce que je viens de raconter n'est pas hors charte, pas
plus que les discussions sur Quark ou Adobe.

Michel Houdé,
Compiègne

PS: Word 2000 n'est pas un très bon choix pour modifier un fichier HTML
simple, c'est clair.