Archive Liste Typographie
Message : [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur (Olivier RANDIER) - Mardi 22 Avril 1997 |
Navigation par date [ Précédent Index Suivant ] Navigation par sujet [ Précédent Index Suivant ] |
Subject: | [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur |
Date: | Tue, 22 Apr 1997 00:41:22 +0200 |
From: | orandier@xxxxxxxxxxxxxxxxxxx (Olivier RANDIER) |
... fin du message précédent Concrètement, Unicode comprend déjà les ligatures suivantes : 0132 LATIN CAPITAL LIGATURE IJ 0133 LATIN SMALL LIGATURE IJ FB00 LATIN SMALL LIGATURE FF FB01 LATIN SMALL LIGATURE FI FB02 LATIN SMALL LIGATURE FL FB03 LATIN SMALL LIGATURE FFI FB04 LATIN SMALL LIGATURE FFL FB05 LATIN SMALL LIGATURE LONG S T FB06 LATIN SMALL LIGATURE ST Les codages expert et alternate d'Adobe propose en outre : ct -> LATIN SMALL LIGATURE C T s long double -> LATIN SMALL LIGATURE LONG S DOUBLE s long-h -> LATIN SMALL LIGATURE LONG S H s long-i -> LATIN SMALL LIGATURE LONG S I s long-l -> LATIN SMALL LIGATURE LONG S L s long-s -> LATIN SMALL LIGATURE LONG S S (pour distinguer du eszet) Rp -> LATIN LETTER LIGATURE CAPITAL R SMALL LETTER P (franchement, je ne me rappelle pas à quoi sert celle-ci) - les terminologies Unicode proposées sont de mon crû - ainsi que des formes alternatives pour k, v, w (en italique) ou finales pour a, e, n r, t, z (en romain) et des swash caps. On a fait remarquer ici qu'il faudrait également prévoir des ligatures pour les différents accents que peut prendre le i, par exemple ffî. Par contre, on a parlé aussi de ligature fè, à cause de fontes mal conçues. Là, je crois qu'il faut pas pousser : c'est aux fondeurs d'être vigilants pour tenir compte des problèmes particuliers liés aux lettres accentuées. L'adoption d'une norme favorisant les fontes multilingues devrait contribuer à renforcer leur attention (enfin, j'espère...). Certains ici ont fait remarquer que ae et oe n'était pas nommés ligatures dans Unicode. Mais, même si, typographiquement, c'en sont (et Dalida ;) ), sémantiquement ce sont des signes distincts et indivisibles. Unicode est donc cohérent, là (si, là, regarde, là...), même si on aurait pu être un peu plus explicite (ligaturème ? ;))) ). Il en est de même pour l'eszet, l'experluette, l'arobace, entre autres. Bref, à tout casser, ça fait moins d'une vingtaine de signes à ajouter à Unicode pour être, à peu près, complet (du moins en ce qui concerne le français, d'autres langues en exigent peut-être quelques autres (fff en allemand, par exemple). Je doute qu'au total on excède la cinquantaine de signes. Une cinquantaine de signes, ça paraît raisonnable, ramené aux 65 000 signes que peut contenir Unicode, non ? Concernant les petites caps, il est à noter qu'Unicode contient déjà : 0299 LATIN LETTER SMALL CAPITAL B 0262 LATIN LETTER SMALL CAPITAL G 029C LATIN LETTER SMALL CAPITAL H 026A LATIN LETTER SMALL CAPITAL I 029F LATIN LETTER SMALL CAPITAL L 0274 LATIN LETTER SMALL CAPITAL N 028F LATIN LETTER SMALL CAPITAL Y 0280 LATIN LETTER SMALL CAPITAL R 0276 LATIN LETTER SMALL CAPITAL OE 0281 LATIN LETTER SMALL CAPITAL INVERTED R 029B LATIN LETTER SMALL CAPITAL G WITH HOOK Pourquoi celles-là, et pas les autres, mystère... En tout état de cause, les caractères latins dans Unicode sont approximativement au nombre de 700 environ (en comptant les variantes caps et bas-de-casse). Ce qui veut dire qu'ajouter les versions petites caps signifie environ 350 signes de plus. C'est déjà moins raisonnable... (mais ça reste envisageable). Il est, d'ailleurs, intéressant de noter la présence de "petite ponctuation" : FE50 SMALL COMMA FE51 SMALL IDEOGRAPHIC COMMA FE52 SMALL FULL STOP FE54 SMALL SEMICOLON FE55 SMALL COLON FE56 SMALL QUESTION MARK FE57 SMALL EXCLAMATION MARK FE58 SMALL EM DASH FE59 SMALL LEFT PARENTHESIS FE5A SMALL RIGHT PARENTHESIS FE5B SMALL LEFT CURLY BRACKET FE5C SMALL RIGHT CURLY BRACKET FE5D SMALL LEFT TORTOISE SHELL BRACKET FE5E SMALL RIGHT TORTOISE SHELL BRACKET FE5F SMALL NUMBER SIGN FE60 SMALL AMPERSAND FE61 SMALL ASTERISK FE62 SMALL PLUS SIGN FE63 SMALL HYPHEN-MINUS FE64 SMALL LESS-THAN SIGN FE65 SMALL GREATER-THAN SIGN FE66 SMALL EQUALS SIGN FE68 SMALL REVERSE SOLIDUS FE69 SMALL DOLLAR SIGN FE6A SMALL PERCENT SIGN FE6B SMALL COMMERCIAL AT dont l'utilité ne peut qu'être liée aux petites caps et aux chiffres petites caps (qui eux, sont présents). À mon avis, il est plus logique de prévoir un attribut <SC> qui renvoie directement à un descriptif de famille <SC> dans les fontes (comme cela se passe pour l'italique). C'est simple, efficace, et ça fonctionne parfaitement pour des substitutions glyphe à glyphe, qui sont beaucoup plus simples que les ligatures. Merci de votre attention. Olivier Randier - Experluette
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, (continued)
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Paul Pichaureau (22/04/1997)
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Paul Terray (22/04/1997)
- Re: [Unicode] Distinction, Emmanuel Curis (22/04/1997)
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Olivier RANDIER <=
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Jean-Pierre Lacroux (22/04/1997)
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Thierry Bouche (22/04/1997)