----- Message d'origine -----
Envoyé : 30 juillet, 2000
22:43
Objet : Re: Unicode [Maths] (suite)
À 02:00 2000-07-31 +0200, typographie-request@xxxxxxxx a
écrit:
[Olivier]
> Euh... Y a un truc qui m'échappe, là. 27 500 + 40
000, ça fait plus de
> 65 000, ce qui est le nombre de signes codables
sur les 2 octets
>d'Unicode, si ma mémoire est bonne. Où on va les
mettre ?
[Patrick]
1) Pour ISO/CEI 10646, il y a 4 octets de
disponibles (UCS-4 par rapport à
UCS-2). UCS-2 ne code que le plan
multilingue de base.
2) Pour Unicode, UTF-16 : sur d'autres plans
grâce à un mécanisme
d'indirection (2 "seizets" pointant vers 1024x1024
caractères potentiels),
on a également défini une autre forme UTF-32 qui
ressemble furieusement à 4
octets d'adressage.
[Alain] Si je ne m'abuse, UTF-32, c'est de l'UCS-4 qui assure
que l'on se limite au million de caractères maintenant « adressable » grâce au
patch que constitue UTF-16 et qui est nécessaire à Unicode pour aller au-delà
de 65536 caractères...
[PA] Patch ??? Rustine, Alain, Rustine
;-)
Oui c'est cela, sauf qu'Unicode précise que c'est
non seulement les caractères inférieurs à 0x10FFFF, mais
également l'application de la sémantique Unicode (fichiers de
correspondance, de décompositions canoniques ou d'équivalences, des
annotations, etc.).
[Alain]
Mais le consortium Uncode a aussi fait adopter une
résolution à l'ISO (dernière réunion du JTC1/SC2, tenue à Pékin en mars 2000)
limitant aussi le développement du JUC à un million de caractères, justement,
donc il y a bien des précautions prises pour empêcher que l'on dépasse cette
limite. Comme si l'on avait peur que l'on puisse dépasser cette limite... Je
me souviens qu'au début du développement d'Unicode (1989), on disait que
jamais, au grand jamais, les besoins commerciaux ne dépasseraient l'ordre de
grandeur de 100 000 caractères dans tout l'univers connu, y compris en tenant
compte des besoins les plus farfelus... Je ne me surprends donc plus de rien
avec ce consortium... Ils ont été présomptueux, et ils prétendent avoir le
droit de l'être encore... Je ne crois pas qu'ils soient plus devins que nous
tous, mais ils le croient, et ils ont la capacité de modifier l'histoire, y
compris l'histoire passée (ils ont sciemment commis des hérésies qui n'ont
jamais été permises à d'autres qu'à des Américains, comme changer le codage du
coréen dans le « plan multilingue de base »)...
[PA]
J'avoue que le consortium paraît souvent
arrogant, mais pour le coréen est-ce le consortium qui l'a fait changer ou la
Corée ?
Patrick