Archive Liste Typographie
Message : Le codage des glyphes ou des caractères

(Alain LaBonté ) - Lundi 23 Novembre 1998
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Le codage des glyphes ou des caractères
Date:    Mon, 23 Nov 1998 09:21:31 -0600
From:    Alain LaBonté  <alb@xxxxxxxxxxxxxx>

A 13:36 98-11-23 +0100, Thierry Bouche a écrit :
[Jacques] :
>» [...] plus on invente des normes internationales,
>» plus les commerciaux, les claviers, les systèmes foutent le b...
>» pour que ça ne marche pas !

[Thierry] :
>encore faudrait-il que les normes soient irréprochables... Qui peut
>montrer MS ou Apple du doigt parce qu'ils ont utilisé un codage non
>standard contenant le {oe} ?

  [Alain] :
  Personne ! C'est Bull qu'il faudrait pointer du doigt, pour ceux qui
connaissent l'histoire, mais ça ne donnerait pas grand chose ! Il faudra un
jour rectifier le tir (pas en changeant les données à tout prix mais en
ayant autrement un système de conversion qui fonctionne dans les deux sens
à l'aide de balises appropriées).

[Thierry] :
>Et puis les systèmes wysiwyg ont besoin d'un codage de glyphes, pas de
>caractère...

   [Alain] :
   Là, je diffère un peu d'opinion. Le codage compact des caractères est
une percée technologique par rapport au dessin (ce qui n'élimine pas la
nécessité absolue des techniques graphiques, qui sont aussi une percée
technologique) : le codage compact des caractères accélère le transfert
d'information et son traitement. Si vous recherchez un « a » par des moyens
informatisés, il vaut mieux faire une recherche sur un concept (représenté
par un caractère codé) que sur une myriade de formes de ce concept (les
innombrables glyphes qu'un humain peut reconnaître comme un « a »).

   Cela étant, on n'a pas encore fait la percée technologique qui
interprèterait de manière absolue la signification d'un caractère codé dont
le code n'est pas identifié (mais on peut envisager des moyens de s'en
sortir). Les meilleures méthodes à l'heure actuelle sont empiriques, donc
complexes : en courrier électronique, la provenance d'un message nous donne
une idée de la langue parlée (ce qui limite les codes à un certain nombre)
ou même du codage utilisé ; l'identification de la langue d'un texte (par
tout moyen) nous permet de faire des analyses rapides de fréquences de
lettres [ou la reconnaissance de mots fréquents] qui aident à deviner le
code utilisé. Il y a bien d'autres indices qu'un programmeur intelligent
pourrait utiliser... mais l'informatique universelle n'en est pas encore à
ce stade. Nous n'avons pas atteint la perfection de la gastronomie
française, nous en sommes plutôt à la découverte de la cuisson des
aliments, juste après la découverte du feu par l'homme des cavernes.

   Lorsque le code est explicitement identifié, encore faut-il aussi
traiter cette information correctement. Nous n'en sommes même pas encore
là, même en présence d'indices explicites [MIME, CDRA, xxML, etc.] !

Alain LaBonté
Québec