Archive Liste Typographie
Message : Accents libres

(Alain LaBonté ) - Vendredi 17 Avril 1998
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Accents libres
Date:    Thu, 16 Apr 1998 19:28:12 -0400
From:    Alain LaBonté  <alb@xxxxxxxxxxxxxx>

[Jean-Pierre Lacroux] :
>Toutefois, ce que vous [= Olivier Bettens] me proposez comme corollaire
>n'est pas dénué de fondement historique : de nombreux typographes du
>XVIIe et du XVIIIe siècle se sont évertués à contourner les contraintes
>matérielles en bricolant des accents au coup par coup ou en employant
>des fontes dans lesquelles les accents étaient placés sur le côté de la
>lettre : E´ (profitons-en, ces accents libres n'existent plus en
>ISO-Latin 9...).

   [Alain] :
   Non, mais ils reviennent en force dans l'ISO/CEI 10646 (jeu universel de
caractères codés sur plusieurs octets), et surtout dans Unicode, qui
insiste...

   Je vous cite un commentaire de l'ECMA, daté de ces jours-ci, sur le
soutien d'Unicode dans Java Script (en termes ISO, il s'agit du soutien de
l'ISO/CEI 10646, ou jeu universel de caractères, dans l'ISO/CEI 16262, ou
ECMA Script), et qui vous en dira long sur l'impact de ce double codage (ce
commentaire est techniquement important, beaucoup plus que vous pouvez le
penser, et il pourrait nous aider à faire des choix prudents contraires à
ce que préconise le consortium Unicode, surtout pour les langues utilisant
l'alphabet latin [pour les autres systèmes d'écriture, il n'y a pas en
général de double codage et il n'y a pas de problème]) :

___________________________________________________________________________
« ECMA comments ISO/IEC DIS 16262, ECMAScript under ballot until 1998-04-09

1)The second paragraph of clause 2 on conformance need to be improved.

    A proposal for such an improvement is the following:

    "A conforming implementation of this International standard shall
interpret characters in conformance with The Unicode Standard, Version 2.0,
and ISO/IEC 10646-1 with UCS-2 as the adopted encoding form, implementation
level 3. If the adopted ISO/IEC 10646-1 subset is not otherwise specified,
it is presumed to be the BMP subset, collection 300."

Background information

The above proposed text does talk about implementation level 3 as described
in 10646, but it does not mean that ECMAScript would have to process a
character and a combining sequence as yet another uniquely identified
character.  ECMAScript can treat a combining sequence as just another
16-bit value.  Combining sequences are encoded for use with some base
characters especially for Indic, Thai, Arabic and Hebrew scripts.
Platforms and application software decides how to process a base character
and a combining sequence. 
 Note that combining sequences can be used for Latin as well but the vast
majority of Latin script characters are already encoded in 10646.  
For conformance with The Unicode Standard it is important that combining
sequences are not damaged as they go through a process, such as ECMAScript.
 Unicode supports combining sequences and provides an equivalence algorithm
that facilitates comparing precomposed characters with a base character
followed by a combining sequence.  All that ECMAScript, and other
programming languages, need to do is to let a data stream of 16-bit values
pass through the process cleanly and with no damage to the data.
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
[Pour la traduction, faites un Copier/coller du texte anglais en utilisant 
http://babelfish.altavista.digital.com/cgi-bin/translate?
-- un exercice qui en vaut la peine -- vous rirez un peu, même si vous ne
comprenez pas plus -- comprendront ceux qui sont spécialisés de toute
manière (;]

   [Alain] :
   Comme vous le voyez, l'Histoire se répète, mais ses conséquences seront
répercutées de manière amplifiée par rapport au passé et les changements
seront plus difficiles à rectifier s'il y a problème (s'il n'y a pas de
bogue [pépin !], il n'y aura pas de problème, mais « tout programme non
trivial comporte au moins un bogue », c'est bien connu, c'est une loi que
tout informaticien connait, et tout élément de complexité supplémentaire
est une génératrice garantie de bogues à répétition)...

Alain LaBonté
Québec