Archive Liste Typographie
Message : [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur (Olivier RANDIER) - Mardi 22 Avril 1997 |
Navigation par date [ Précédent Index Suivant ] Navigation par sujet [ Précédent Index Suivant ] |
Subject: | [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur |
Date: | Tue, 22 Apr 1997 00:41:08 +0200 |
From: | orandier@xxxxxxxxxxxxxxxxxxx (Olivier RANDIER) |
Salut à tous ! Quelques jours d'absence, et le courrier en retard s'accumule... Je suis fort marri de la confusion créée ici par la discussion sur Unicode que j'ai initiée ;-( J'avoue que les positions que j'ai prise sur Unicode était largement excessives. Je pense donc qu'il m'appartient de ramener un peu de raison dans ce débat, ainsi que d'expliquer un peu sa nature à ceux qui ont un peu de mal à nous suivre. Après réflexion, il m'apparaît que l'orientation « caractère, et non glyphe » est très justifiée. Je m'explique : à chaque étape de la création d'un texte, sous sa forme informatique, interviennent des codifications destinées à gérer au mieux les différents aspects pratiques nécessaires au traitement cohérent du texte. Ces étapes sont, à mon avis, au nombre de quatre : - saisie, - traitement sémantique du texte, - enrichissement typographique, - rendu sur écran et impression. Développons ce que cela donne (ici, sur Macintosh). 1/ Saisie Chaque fois que nous tapons sur une touche (ou une combinaison de touches), l'ordinateur reçoit un code, toujours le même. Ce code, en fonction des ressources "système d'écriture" et "clavier" utilisée, est transcrit en une autre codification (pour l'heure, ASCII étendu, dans sa version Macintosh). En tout état de cause, nos claviers continueront à coder sur 1 octet, parce qu'il paraît difficile de concevoir des claviers pratiques avec 65 000 touches ! C'est donc aux ressources "système d'écriture qu'il appartient de transcoder vers une norme plus étendue - Unicode, par exemple. Les ressources "système d'écriture" sont intégrées de façon standard au système, et ne devraient être modifiées qu'avec précautions. Les claviers, par contre, doivent rester modifiables par l'utilisateur, afin qu'il puisse les adapter à ses propres besoins. 2/ Traitement du texte Une fois le texte établi sous sa forme codée, brute, il est alors possible d'effectuer toutes sortes d'opérations dessus : tri alphabétique, numérique, correction orthographique, voire grammaticale, traduction automatique, etc. Ces opérations primordiales s'effectuent sur le code texte brut, qu'il soit ASCII ou Unicode. Une partie des ressources "système d'écriture" est utilisée à cet effet, pour déterminer les critères de tri, le formatage des nombres, les dictionnaires de correction à utiliser, etc. Il importe, à ce stade, que les outils ne soient pas perturbés par des éléments non conformes, non signifiants. 3/ Enrichissement typographique Sous cette forme brute, un texte doit pouvoir être lu et compris sans difficulté. Mais, tel quel, il n'est pas vraiment lisible. L'expérience prouve que la lecture de dizaines de pages écrites en Courier au kilomètre est, au mieux, une épreuve pénible. De plus, un certain nombre d'enrichissements typographiques, tels qu'ils sont définis dans les codes, ajoutent du sens au texte : ainsi, par exemple, l'usage de l'italique ou des petites caps, pour distinguer les divers éléments d'une bibliographie. C'est au niveau de l'environnement graphique que s'effectuent la majorité de ses enrichissements. Nous utilisons pour le moment QuickDraw qui connait, en standard, les attributs suivants : bas-de-casse/capitale, romain/italique/gras/gras + italique, non souligné/souligné/mot souligné/barré, + ombre, + relief (outline), normal/exposant/indice. Ces attributs étant notoirement insuffisants, les logiciels de mise en page les plus évolués en ont implanté d'autres, en utilisant des "bidouilles" internes. XPress, par exemple, propose en plus : petites capitales (en fait des capitales réduites), supérieur (une variante typographiquement plus correcte de l'exposant). Même avec ce genre d'ajouts, c'est également insuffisant, et l'utilisateur est souvent amené à utiliser des polices non conformes, utilisant, par exemple, les codages expert ou alternate d'Adobe. Le problème, c'est que les textes ainsi modifiés ne sont plus compréhensibles par les outils de traitement du texte cités plus haut ! 4/ Rendu à l'écran et impression. Une fois tous les enrichissements typographiques effectués, le système se charge d'utiliser les informations vectorielles ou bitmap contenues dans les fontes pour afficher correctement le texte à l'écran tel qu'il sera imprimé, par PostScript, ce qui est, généralement sa vocation finale. Ceci devrait être en principe complètement transparent à l'utilisateur. Je m'excuse de rappeler ainsi des choses qui sont sans doute des évidences pour la majorité d'entre nous, mais je pense qu'il est important que tout le monde puisse comprendre de quoi on parle. À suivre... Olivier Randier - Experluette
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Olivier RANDIER (22/04/1997)
- <Possible follow-ups>
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Olivier RANDIER <=
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Paul Pichaureau (22/04/1997)
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Paul Terray (22/04/1997)
- Re: [Unicode] Distinction, Emmanuel Curis (22/04/1997)
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Olivier RANDIER (22/04/1997)
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Jean-Pierre Lacroux (22/04/1997)
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Thierry Bouche (22/04/1997)