Archive Liste Typographie
Message : [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur

(Olivier RANDIER) - Mardi 22 Avril 1997
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur
Date:    Tue, 22 Apr 1997 00:41:08 +0200
From:    orandier@xxxxxxxxxxxxxxxxxxx (Olivier RANDIER)

Salut à tous !

Quelques jours d'absence, et le courrier en retard s'accumule...

Je suis fort marri de la confusion créée ici par la discussion sur Unicode
que j'ai initiée ;-(

J'avoue que les positions que j'ai prise sur Unicode était largement
excessives. Je pense donc qu'il m'appartient de ramener un peu de raison
dans ce débat, ainsi que d'expliquer un peu sa nature à ceux qui ont un peu
de mal à nous suivre.

Après réflexion, il m'apparaît que l'orientation « caractère, et non
glyphe » est très justifiée. Je m'explique :
à chaque étape de la création d'un texte, sous sa forme informatique,
interviennent des codifications destinées à gérer au mieux les différents
aspects pratiques nécessaires au traitement cohérent du texte.
Ces étapes sont, à mon avis, au nombre de quatre :
- saisie,
- traitement sémantique du texte,
- enrichissement typographique,
- rendu sur écran et impression.
Développons ce que cela donne (ici, sur Macintosh).

1/ Saisie
Chaque fois que nous tapons sur une touche (ou une combinaison de touches),
l'ordinateur reçoit un code, toujours le même. Ce code, en fonction des
ressources "système d'écriture" et "clavier" utilisée, est transcrit en une
autre codification (pour l'heure, ASCII étendu, dans sa version Macintosh).
En tout état de cause, nos claviers continueront à coder sur 1 octet, parce
qu'il paraît difficile de concevoir des claviers pratiques avec
65 000 touches ! C'est donc aux ressources "système d'écriture qu'il
appartient de transcoder vers une norme plus étendue - Unicode, par
exemple.
Les ressources "système d'écriture" sont intégrées de façon standard au
système, et ne devraient être modifiées qu'avec précautions. Les claviers,
par contre, doivent rester modifiables par l'utilisateur, afin qu'il puisse
les adapter à ses propres besoins.
2/ Traitement du texte
Une fois le texte établi sous sa forme codée, brute, il est alors possible
d'effectuer toutes sortes d'opérations dessus : tri alphabétique,
numérique, correction orthographique, voire grammaticale, traduction
automatique, etc. Ces opérations primordiales s'effectuent sur le code
texte brut, qu'il soit ASCII ou Unicode. Une partie des ressources "système
d'écriture" est utilisée à cet effet, pour déterminer les critères de tri,
le formatage des nombres, les dictionnaires de correction à utiliser, etc.
Il importe, à ce stade, que les outils ne soient pas perturbés par des
éléments non conformes, non signifiants.
3/ Enrichissement typographique
Sous cette forme brute, un texte doit pouvoir être lu et compris sans
difficulté. Mais, tel quel, il n'est pas vraiment lisible. L'expérience
prouve que la lecture de dizaines de pages écrites en Courier au kilomètre
est, au mieux, une épreuve pénible. De plus, un certain nombre
d'enrichissements typographiques, tels qu'ils sont définis dans les codes,
ajoutent du sens au texte : ainsi, par exemple, l'usage de l'italique ou
des petites caps, pour distinguer les divers éléments d'une bibliographie.
C'est au niveau de l'environnement graphique que s'effectuent la majorité
de ses enrichissements. Nous utilisons pour le moment QuickDraw qui
connait, en standard, les attributs suivants : bas-de-casse/capitale,
romain/italique/gras/gras + italique, non souligné/souligné/mot
souligné/barré, + ombre, + relief (outline), normal/exposant/indice.
Ces attributs étant notoirement insuffisants, les logiciels de mise en page
les plus évolués en ont implanté d'autres, en utilisant des "bidouilles"
internes. XPress, par exemple, propose en plus :
petites capitales (en fait des capitales réduites), supérieur (une variante
typographiquement plus correcte de l'exposant).
Même avec ce genre d'ajouts, c'est également insuffisant, et l'utilisateur
est souvent amené à utiliser des polices non conformes, utilisant, par
exemple, les codages expert ou alternate d'Adobe. Le problème, c'est que
les textes ainsi modifiés ne sont plus compréhensibles par les outils de
traitement du texte cités plus haut !
4/ Rendu à l'écran et impression.
Une fois tous les enrichissements typographiques effectués, le système se
charge d'utiliser les informations vectorielles ou bitmap contenues dans
les fontes pour afficher correctement le texte à l'écran tel qu'il sera
imprimé, par PostScript, ce qui est, généralement sa vocation finale. Ceci
devrait être en principe complètement transparent à l'utilisateur.
Je m'excuse de rappeler ainsi des choses qui sont sans doute des évidences
pour la majorité d'entre nous, mais je pense qu'il est important que tout
le monde puisse comprendre de quoi on parle.

À suivre...

Olivier Randier - Experluette