Archive Liste Typographie
Message : Re: Unicode 2.0

(Christian Wagner) - Mercredi 02 Avril 1997
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: Unicode 2.0
Date:    Wed, 2 Apr 1997 14:10:52 +0200 (MET DST)
From:    Christian Wagner <Christian.Wagner@xxxxxxxxxxx>

Bonjour.



[ as Olivier RANDIER wrote ]
>Pour les besoins de la base de données que je compte mettre en place avec
>votre aide, je suis allé télécharger la dernière version d'Unicode.
>
>http://www.unicode.org
>ftp://unicode.org/pub
>
>Sa consultation m'a laissé songeur, bien que je sois un chaud partisan
>d'une unification indispensable. C'est extrèmement riche, mais il y a des
>lacunes surprenantes et des choses qui paraîssent inutiles. On dirait que
>cela a été fait par des linguistes et/ou des informaticiens, mais
>certainement pas par des typographes. Qu'on en juge :
>
>On trouve un nombre impressionnant de caractères latins avec diacritiques,
>parmi lesquels certains dont auquels que je savais même pas qu'ils
>existaient...
>Mais aucune entrée n'est prévue pour les petites capitales :(
>Comme ligatures, il y a ae, oe, fl, fi... + ffl, ffi, s long-s, st (mais
>pas ct), point final...

Un complément d'information permettra peut-être de comprendre ce
résultat qu'est `Unicode 2.0'. Voici ce qu'on peut lire, sur le site
de unicode, concernant les principes de ce standard. L'URL de cette
page, atteinte en consultant celle consacrée à `Unicode 2.0' sur
`www.unicode.org', est :
`http://www.cm.spyglass.com/unicode/standard/principles.html'.

-------------------- Extrait de la page mentionnée --------------------

Characters and Glyphs

A principle notion embodied by Unicode is the distinction between
characters and glyphs. In loose terms, a glyph is a visual depiction
of a character. On the other hand, a character has no inherent
image. This distinction is in contrast to the common understanding
which equates these two concepts. For example, a font is often
described as being comprised of "characters." In contast, according to
the view adopted by Unicode, a font contains "glyphs," not
"characters."

An important consequence of this conceptual distinction is that a
character set should not encode glyphs, and, furthermore, that the
number of extant glyphs is much larger than the number of extant
characters which should be encoded.

In practice, the distinction between these two concepts is often
difficult to maintain, if, for no other reason, because such a
distinction has rarely been made in the past. The result of this
historical confusion between the two concepts is that many existing
character sets encode "glyphs," and, for reasons of backward
compatibility, these "glyphs" now appear in Unicode as "characters."
An example of such a glyph is the roman ligature glyphs 'ff' and 'fi'.

The conceptual problems raised by this distinction were recognized
both by the designers of Unicode and by ISO in its development of
ISO/IEC 10646 and other standards. In order to help clarify this area,
ISO asked the US National Body to develop a draft Character/Glyph
Operational Model[" draft Character/Glyph Operational Mode" est une
référence croisée].

-------------------- Fin de l'extrait ---------------------------------

Cela a, au moins, le mérite d'expliquer (je ne dis pas justifier)
certaines incohérences. Cela a surtout le mérite que l'objet premier
de Unicode est le codage de caractères (d'un point de vue abstrait,
j'imagine), et non les dessins de caractères.

On lit aussi plus loin :

-------------------- Extrait de la page mentionnée --------------------

Language Tagging

Unicode characters do not specify the language of the text they
represent; that is, they are completely language neutral. If the
language of a character or character string must be known to
accomplish a particular type of process (e.g. language sensitive
collation), then a higher-level protocol must be used to specify the
language.

-------------------- Fin de l'extrait ---------------------------------

Au rang desquels traitements spécifiques à une langue sont rangées les
règles et conventions typographiques (voir les références croisées,
sur la page, de ce paragraphe).

(...)
>
>Olivier Randier - Experluette
>

Comme c'est mon premier message sur cette liste (bien que j'en ai déjà
lus des dizaines)... je suis en charge de la gestion et du support à
l'utilisation du système TeX sur les machines du centre informatique
de l'université de Pau. C'est par ce biais que je me suis intéressé à
la typographie... où j'ai (presque) tout à apprendre.


Cordialement,

-- 
| Christian WAGNER
|
|   Christian.Wagner@xxxxxxxxxxx
|