Archive Liste Typographie
Message : [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur

(Olivier RANDIER) - Mardi 22 Avril 1997
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur
Date:    Tue, 22 Apr 1997 00:41:22 +0200
From:    orandier@xxxxxxxxxxxxxxxxxxx (Olivier RANDIER)

... fin du message précédent

Concrètement, Unicode comprend déjà les ligatures suivantes :
0132    LATIN CAPITAL LIGATURE IJ
0133    LATIN SMALL LIGATURE IJ
FB00    LATIN SMALL LIGATURE FF
FB01    LATIN SMALL LIGATURE FI
FB02    LATIN SMALL LIGATURE FL
FB03    LATIN SMALL LIGATURE FFI
FB04    LATIN SMALL LIGATURE FFL
FB05    LATIN SMALL LIGATURE LONG S T
FB06    LATIN SMALL LIGATURE ST

Les codages expert et alternate d'Adobe propose en outre :

ct -> LATIN SMALL LIGATURE C T
s long double -> LATIN SMALL LIGATURE LONG S DOUBLE
s long-h -> LATIN SMALL LIGATURE LONG S H
s long-i -> LATIN SMALL LIGATURE LONG S I
s long-l -> LATIN SMALL LIGATURE LONG S L
s long-s -> LATIN SMALL LIGATURE LONG S S (pour distinguer du eszet)
Rp -> LATIN LETTER LIGATURE CAPITAL R SMALL LETTER P (franchement, je ne me
rappelle pas à quoi sert celle-ci)
- les terminologies Unicode proposées sont de mon crû -
ainsi que des formes alternatives pour k, v, w (en italique) ou finales
pour a, e, n r, t, z (en romain) et des swash caps.

On a fait remarquer ici qu'il faudrait également prévoir des ligatures pour
les différents accents que peut prendre le i, par exemple ffî.

Par contre, on a parlé aussi de ligature fè, à cause de fontes mal conçues.
Là, je crois qu'il faut pas pousser : c'est aux fondeurs d'être vigilants
pour tenir compte des problèmes particuliers liés aux lettres accentuées.
L'adoption d'une norme favorisant les fontes multilingues devrait
contribuer à renforcer leur attention (enfin, j'espère...).

Certains ici ont fait remarquer que ae et oe n'était pas nommés ligatures
dans Unicode. Mais, même si, typographiquement, c'en sont (et Dalida ;) ),
sémantiquement ce sont des signes distincts et indivisibles. Unicode est
donc cohérent, là (si, là, regarde, là...), même si on aurait pu être un
peu plus explicite (ligaturème ? ;))) ). Il en est de même pour l'eszet,
l'experluette, l'arobace, entre autres.

Bref, à tout casser, ça fait moins d'une vingtaine de signes à ajouter à
Unicode pour être, à peu près, complet (du moins en ce qui concerne le
français, d'autres langues en exigent peut-être quelques autres (fff en
allemand, par exemple). Je doute qu'au total on excède la cinquantaine de
signes.

Une cinquantaine de signes, ça paraît raisonnable, ramené aux 65 000 signes
que peut contenir Unicode, non ?

Concernant les petites caps, il est à noter qu'Unicode contient déjà :
0299    LATIN LETTER SMALL CAPITAL B
0262    LATIN LETTER SMALL CAPITAL G
029C    LATIN LETTER SMALL CAPITAL H
026A    LATIN LETTER SMALL CAPITAL I
029F    LATIN LETTER SMALL CAPITAL L
0274    LATIN LETTER SMALL CAPITAL N
028F    LATIN LETTER SMALL CAPITAL Y
0280    LATIN LETTER SMALL CAPITAL R
0276    LATIN LETTER SMALL CAPITAL OE
0281    LATIN LETTER SMALL CAPITAL INVERTED R
029B    LATIN LETTER SMALL CAPITAL G WITH HOOK

Pourquoi celles-là, et pas les autres, mystère...
En tout état de cause, les caractères latins dans Unicode sont
approximativement au nombre de 700 environ (en comptant les variantes caps
et bas-de-casse). Ce qui veut dire qu'ajouter les versions petites caps
signifie environ 350 signes de plus. C'est déjà moins raisonnable... (mais
ça reste envisageable).
Il est, d'ailleurs, intéressant de noter la présence de "petite ponctuation" :
FE50    SMALL COMMA
FE51    SMALL IDEOGRAPHIC COMMA
FE52    SMALL FULL STOP
FE54    SMALL SEMICOLON
FE55    SMALL COLON
FE56    SMALL QUESTION MARK
FE57    SMALL EXCLAMATION MARK
FE58    SMALL EM DASH
FE59    SMALL LEFT PARENTHESIS
FE5A    SMALL RIGHT PARENTHESIS
FE5B    SMALL LEFT CURLY BRACKET
FE5C    SMALL RIGHT CURLY BRACKET
FE5D    SMALL LEFT TORTOISE SHELL BRACKET
FE5E    SMALL RIGHT TORTOISE SHELL BRACKET
FE5F    SMALL NUMBER SIGN
FE60    SMALL AMPERSAND
FE61    SMALL ASTERISK
FE62    SMALL PLUS SIGN
FE63    SMALL HYPHEN-MINUS
FE64    SMALL LESS-THAN SIGN
FE65    SMALL GREATER-THAN SIGN
FE66    SMALL EQUALS SIGN
FE68    SMALL REVERSE SOLIDUS
FE69    SMALL DOLLAR SIGN
FE6A    SMALL PERCENT SIGN
FE6B    SMALL COMMERCIAL AT
dont l'utilité ne peut qu'être liée aux petites caps et aux chiffres
petites caps (qui eux, sont présents).
À mon avis, il est plus logique de prévoir un attribut <SC> qui renvoie
directement à un descriptif de famille <SC> dans les fontes (comme cela se
passe pour l'italique). C'est simple, efficace, et ça fonctionne
parfaitement pour des substitutions glyphe à glyphe, qui sont beaucoup plus
simples que les ligatures.

Merci de votre attention.

Olivier Randier - Experluette