Archive Liste Typographie
Message : Re: Unicode 2.0

(Thierry Bouche) - Mercredi 02 Avril 1997
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: Unicode 2.0
Date:    Wed, 2 Apr 1997 14:28:32 +0200 (MET DST)
From:    Thierry Bouche <Thierry.Bouche@xxxxxxxxxxxxxxx>

Concernant « Re: Unicode 2.0 », Paul Pichaureau écrit :
 > 
 > Olivier RANDIER wrote:
 > 
 > > On trouve un nombre impressionnant de caractères latins avec diacritiques,
 > > parmi lesquels certains dont auquels que je savais même pas qu'ils
 > > existaient...
 > 

faut savoir que par exemple, il existe un j ciconflexe pour
l'esperanto... Le principe est d'inclure dans la zone « linguistic
glyph » tous les caractères nécessaires pour une langue donnée. Le
problème est qu'on n'inclut du coup pas nécessairement tous les
glyphes permettant de générer de nouvelles combinaisons  (les accents
seuls auraient été rajoutés à la va-vite au nom d'un concept fumeux
(non spacing accent je crois) mais il n'y a pas de dotlessj (alors
qu'il y a un dotlessi)). 

Il y a aussi une « zone de compatibilité » qui contient des caractères
qui ont eu leur place dans des codages largement utilisés, bien qu'ils
devraient être logiquement écartés (exemple :fi/fl). De façon
générale, l'impression que ça donne, c'est que ça devait être une
vaste remise à plat et que c'est un peu n'importe quoi. Pourquoi par
exemple conserver dans les 8 premiers bits le fatras incohérent d'iso
latin (caractères de contrôle mélangés avec des lettres, de la
ponctuation et des signes divers comme ½© % et j'en passe. On aurait
pu tout aussi bien ouvrir des zones linguistiques, fonctionnelles de 8
ou 9 bits chacune, avec des cases vides laissant de la place pour les
révisions, alors que là {oe} n'est pas rangé dans le français normal,
etc.

J'ai aussi une question concernant les chiffres : y en a-t-il
plusieurs sortes ? (le fait qu'aucun système connu ne supprte l'idée
de chiffres capitales/bas-de-casse est très gênant ; et il faudrait
rajouter les chiffres à chasse égale pour les tableaux).

 > > Mais aucune entrée n'est prévue pour les petites capitales :(
 > 
 >   Pour ce qui est manquant (ligatures, etc.), je crois qu'il y a encore
 > de grands espaces vides. Mais je suis d'accord avec toi : il faudrait
 > inclure ces petites capitales...
 > 

on peut en discuter, les petites capitales sont-elles des glyphes
différents pour représenter un caractère  minuscule ? À la limite, si
unicode était cohérent, y a-t-il vraiment besoin de coder A et a ?
(c'est le même caractère, le glyphe est différent pour des raisons
contextuelles, traditionnelles, ce que vous voulez, mais c'est à un
programme de plus haut niveau d'en décider...)

 > 
 > > Il y a des entrées qui paraissent redondantes, comme "Summation" et "Greek
 > > capital letter sigma". 
 > 
 >   Non, ce n'est pas redondant, puisque l'espace autour du signe « sigma
 > majuscule » est traité différement suivant qu'il a la fonction d'un
 > signe somme ou d'un signe Sigma. 

Effectivement, c'est d'ailleurs à l'aide de ce raisonnement que les
glyphes de computer modern maths ont été inclus dans unicode. 
 > 
 > > Il y a là un parti-pris d'exhaustivité dans les symboles qui me paraît
 > > délirant et, de toute façon, illusoire. D'autant que ça prend une place qui
 > > serait bien plus utilement employée par des signes indispensables soit du
 > > point de vue linguistique, soit du point de vue typographique. 
 > 
 >   Je crois surtout qu'il y a (pour l'instant) largement la place de tout
 > mettre !
 > 

le point de vue typographique est hors-sujet, malheureusement ; ça veut
dire qu'on va encore longtemps  devoir vivre avec des codages
spécifiques propriétaires  pour tous les glyphes non attachés à des
caractères. Ça explique aussi la confusion quand on parle de « fonte
unicode », expression qui revient de plus en plus souvent. Ça peut
vouloir dire fonte 16 bits, avec la plupart des caractères codés comme
unicode, mais un certain nombre de caractères jugés inutliles remplacés
par des glyphes non codés. Je ne crois aps qu'il existe de vraie fonte
unicode  simplement parce que personne n'a jamais dessiné tous les
caractères ! Les fontes vendues unicode que j'ai vues couvrent une
petite partie (généralement les zones riches de la planète, allez
savoir pourquoi).

Dernière chose, j'ai entendu parler d'une « glyph registry » par le
consortium unicode, c'est peut-être ça le truc intéressant du point de
vue typo : s'il existe un standard pour donner un numéro et un nom
unique à tous les glyphes de la terre. 

   Thierry Bouche.       -----       thierry.bouche@xxxxxxxxxxxxxxx
          http://www-fourier.ujf-grenoble.fr/~bouche/