Archive Liste Typographie
Message : Re: Unicode [Maths] (suite)

(Patrick Andries) - Lundi 31 Juillet 2000
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: Unicode [Maths] (suite)
Date:    Sun, 30 Jul 2000 22:53:17 -0400
From:    "Patrick Andries" <pandries@xxxxxxxxx>

 
----- Message d'origine -----
Envoyé : 30 juillet, 2000 22:43
Objet : Re: Unicode [Maths] (suite)

À 02:00 2000-07-31 +0200, typographie-request@xxxxxxxx a écrit:
[Olivier]
> Euh... Y a un truc qui m'échappe, là. 27 500 + 40 000, ça fait plus de
> 65 000, ce qui est le nombre de signes codables sur les 2 octets
>d'Unicode, si ma mémoire est bonne. Où on va les mettre ?

[Patrick]
1) Pour ISO/CEI 10646, il y a 4 octets de disponibles (UCS-4 par rapport à
UCS-2). UCS-2 ne code que le plan multilingue de base.

2) Pour Unicode, UTF-16 : sur d'autres plans grâce à un mécanisme
d'indirection (2 "seizets" pointant vers 1024x1024 caractères potentiels),
on a également défini une autre forme UTF-32 qui ressemble furieusement à 4
octets d'adressage.

[Alain]  Si je ne m'abuse, UTF-32, c'est de l'UCS-4 qui assure que l'on se limite au million de caractères maintenant « adressable » grâce au patch que constitue UTF-16 et qui est nécessaire à Unicode pour aller au-delà de 65536 caractères...
[PA] Patch ??? Rustine, Alain, Rustine ;-)
 
Oui c'est cela, sauf qu'Unicode précise que c'est non seulement les caractères inférieurs à 0x10FFFF, mais également l'application de la sémantique Unicode (fichiers de correspondance, de décompositions canoniques ou d'équivalences, des annotations, etc.).
 
[Alain]

   Mais le consortium Uncode a aussi fait adopter une résolution à l'ISO (dernière réunion du JTC1/SC2, tenue à Pékin en mars 2000) limitant aussi le développement du JUC à un million de caractères, justement, donc il y a bien des précautions prises pour empêcher que l'on dépasse cette limite. Comme si l'on avait peur que l'on puisse dépasser cette limite... Je me souviens qu'au début du développement d'Unicode (1989), on disait que jamais, au grand jamais, les besoins commerciaux ne dépasseraient l'ordre de grandeur de 100 000 caractères dans tout l'univers connu, y compris en tenant compte des besoins les plus farfelus... Je ne me surprends donc plus de rien avec ce consortium... Ils ont été présomptueux, et ils prétendent avoir le droit de l'être encore... Je ne crois pas qu'ils soient plus devins que nous tous, mais ils le croient, et ils ont la capacité de modifier l'histoire, y compris l'histoire passée (ils ont sciemment commis des hérésies qui n'ont jamais été permises à d'autres qu'à des Américains, comme changer le codage du coréen dans le « plan multilingue de base »)...
[PA]
J'avoue que le consortium paraît souvent arrogant, mais pour le coréen est-ce le consortium qui l'a fait changer ou la Corée ?

Patrick