Archive Liste Typographie
Message : Re: origine de ces nouveaux «é», è, à ...?

(Alain LaBonté ) - Lundi 02 Mars 1998
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: origine de ces nouveaux «é», è, à ...?
Date:    Mon, 02 Mar 1998 16:34:31 -0500
From:    Alain LaBonté  <alb@xxxxxxxxxxxxxx>

A 14:52 98-03-02 -0500, Royal Messier a écrit :
>RM: Dernièrement, je lisais un message de toi dont un extrait apparaît
>ci-dessous, de quelle origine sont ces nouveaux caractères de
remplacement? rm
>
>A 12:57 98-02-25 +0100, [xxx] a écrit :
>> [...] ©Ã la mise au point de cette version ça me ferait plaisir et >>
ça [...]

   [Alain] :
   Traduction au passage :
   « [...] à la mise au point de cette version ça me ferait plaisir et 
    ça »

   Je citais un de mes correspondants, car je n'utilise pas ce mode
personnellement. C'est de l'UTF-8... le repli sur 8 bits du jeu universel
de caractères codés (JUC). L'UTF-8, si l'on se limite à l'anglais, est de
l'ASCII à 7 bits (tu comprendras bien des choses en sachant cela!) Au-delà
de l'anglais, un caractère y est exprimé en 16, 24, 32 ou 40 bits (16 bits
pour les caractères accentués du français, 24 pour le polonais, jusqu'à 40
pour chaque caractère chinois). Ce mode permet d'exprimer la totalité des
jeux de caractères intersidéraux à venir, avec une capacité d'expression de
2 milliards de caractères distincts, grosso modo... 

   En français, le coût supplémentaire de l'UTF-8 en bande passante est de
3 % de plus que le mode actuel selon mes propres tests (j'étais au départ
réfractaire à ce mode, mais rationnellement, le seul inconvénient vraiment
considérable consiste en la variabilité de la taille en bits de chaque
caractère, ce qui augmentera la complexité de traitement), alors qu'en mode
UNICODE, le coût serait de 100 % de plus... Pour transformer le mode actuel
à 8 bits (ISO/CEI 8859) dans la version à 4 octets du JUC, le coût
supplémentaire en bande passante serait en revanche de 300 %. 

   Donc UTF-8 est un mode d'échange économique pour nous, si l'on accepte
de payer un coût (3 %) pour l'universalité des échanges... mais il pénalise
les Chinois (ça leur coûte 25 % de plus que le JUC version 4 octets, et 150
% de plus que pour sa version 2 octets). Les anglophones ne paient rien,
c'est le libre-échange universel pour eux...

Mais sans interface appropriée, ce n'est pas encore très beau à voir en
français. Avec Outlook ou avec Eudora Pro version 4 (je ne suis pas sûr
dans ce dernier cas, car j'attend la version française pour juin avant de
l'utiliser ; je ne suis jamais pressé d'utiliser des versions anglaises
boguées (; ), ce mode est optionnel.

Alain LaBonté
Québec