Archive Liste Typographie
Message : Petite victoire internationale avec des conséquences perpétuelles

(Alain LaBonté ) - Lundi 19 Octobre 1998
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Petite victoire internationale avec des conséquences perpétuelles
Date:    Mon, 19 Oct 1998 01:08:57 +0200
From:    Alain LaBonté  <alb@xxxxxxxxxxxxxx>

   Après ma première journée de travail en Israël, je me suis payé trois
heures et demie de travail ce soir avec l'un des deux gourous techniques du
consortium Unicode et du langage Java en ce qui concerne le classement du
jeu universel de caractères (JUC).

   Ce travail avait pour but de scruter à la loupe ma dernière ébauche de
projet de norme internationale de classement pour limiter la discussion qui
aura lieu demain (en d'autres mots, si je m'entendais avec lui, il ne
resterait principalement sur place qu'un récalciltrant, un Suédois très
méticuleux, docteur en mathématiques [qui contribue très constructivement
aussi et à qui j'ai expliqué les raisons techniques des points sur lesquels
j'ai su en coulisses qu'il était encore en désaccord -- mais il est
maintenant préparé psychologiquement au compromis].

   Il était déjà acquis que Java implante la méthode que j'ai pondu en
1988, qui est aujourd'hui sur le site du Conseil du trésor, de l'APIIQ, et
sur deux autres sites en France (et qui est devenue une norme canadienne
implantée par IBM [ça aide !], et maintenant par Oracle, Sybase [le gourou
dont je parle ci-haut est de chez Sybase, il s'agit de Kenneth Whistler,
linguiste de formation, et notamment spécialiste des langues du
sous-continent indien], etc. mais dans les petits détails, pour le soutien
du français, il restait des différences (traitement secondaire des accents
implicitement légèrement différent [ce dernier cas  n'affecte que le tri
exact des dictionnaires, à l'insu des usagers de la langue qui ne s'en
rendent que rarement compte, la norme atteint de toute manière un haut
degré d'utilisation intuitive au départ -- cela est acquis], mais surtout,
traitement différent des digramme soudés <ae> et <oe> de manière
fondamentale -- là, ça affecte monsieur-tout-le monde).

   Bon... J'avais déjà commencé à faire du lobbying chez IBM et comme par
hasard j'en avais justement discuté à l'aéroport de Toronto vendredi soir
avec le dr Umamaheswaran, autre gourou du domaine et représentant d'IBM
auprès du consortium Unicode -- je ne sais pas si le hasard existe, mais il
partait pour l'Inde alors que je partais pour Tel Aviv, nous nous sommes
rencontrés dans cet immense aéroport comme deux amis vont prendre un café
pendant une pause sauf qu'il était 23 h vendredi soir !!!

   Toujours est-il que dans mes discussions de fin de soirée sur les
détails de la table (discussion à deux !!), j'ai obtenu que le digramme
soudé <oe> soit classé comme s'il s'écrivait en 2 lettres (ce que 98 % des
utilisateurs de langues à alphabet latin [1 milliard de personnes grosso
modo sur terre] s'attendent à voir dans une liste triée... car les tables
implicites de Java classaient *à dessein* (pour des raisons obscures que
seul un linguiste peut comprendre et expliquer à d'autres linguistes !!!)
ce caractère comme s'il était une lettre simple classée entre o et p
(conséquence : le mot « oeuf » se retrouve ainsi après « ovaire » !
conséquence petite si l'on ne considère que cet exemple, mais perpétuelle
s'il n'est pas corrigé, et perpétuée par un rouleau compresseur dont on
sait que sa force est si grande qu'il ne s'arrêtera jamais, et l'on serait
forcé de vivre longtemps avec cette erreur... des millions, des milliards,
des trllions d'erreurs en perspective au cours du prochain siècle, pour les
francophones, mais aussi pour la grande majorité des autres qui seront
exposés aux caractères latins.

   Par contre, Kenneth n'a jamais admis que æ devait se classer comme
« ae ». Raison : dans le processus d'équivalences canoniques entre
caractères précomposés d'Unicode et séquences combinatoires (i.e. le fait
qu'un « é » codé en 16 bits soit équivalent avec une séquence combinatoire
de 32 bits composée d'un « e » suivi d'un accent aigu), il existe un æ
accentué pour les langues scandinaves et cela perturbe la façon automatique
de déduire la table de classement implicite à partir des tables de
propriétés de caractères d'Unicode (ouf !).

   Cela étant, étant donné que dans les rares mots où il y a un « æ » en
français, il existe, sauf erreur, toujours une orthographe alternative et
même préférée (ne serait-ce que parce quil est plus facile de la saisir au
clavier -- ex. : « cæsium » est préférablement écrit « césium »), les
conséquences ne seront pas très graves (et compte tenu que la voyelle qui
vient après a est un e, et que « æ » ainsi traité se classera après « az »,
les æ devraient être classés près des « é » de toute manière [« cæsium »,
si on l'écrit hypothétiquement ainsi, sera classé après « case » mais
certainement avec « césium », logiquement]). Ce n'est pas l'idéal mais cela
illustre bien les compromis mafieux que l'on fait à l'ISO, en coulisses,
souvent à deux, et qui auront des conséquences quasi éternelles et
certainement dans ce cas universelles, en autant que mémoire d'homme est
concernée !

   Belle victoire quand même, sans fausse modestie, car les recommandations
d'Unicode sont et seront suivis par Java, par le consortium W3C, etc., et
par Sybase, Microsoft, IBM, les programmeurs Java, etc.

   Malheureusement, cela ne change pas le fait que Tel Aviv sera, de l'avis
d'un chauffeur de taxi, sans doute bombardée par un missile atomique un
jour par un leader arabe intégriste, ce qui détruirait Israël complètement
(70 % de la population juive d'Israël vit dans un rayon de 25 km du centre
de Tel Aviv où je me trouve, ce qui exclut même Jérusalem à moins de 60 km
!!!) Ce que nous faisons ici ne changera pas ce monde mais il améliorera le
confort culturel de centaines de millions de personnes, même si tout cela
se fait dans l'ombre... avec l'espoir que le monde soit un jour meilleur !
C'est avec de petites gouttes d'eau, voire des atomes, que l'on fait les
océans !

   Entre-temps, je n'oublie pas qu'ici même, il y a moins de 7 ans, l'on
vivait sous les bombardements de missiles Scud, à portée de canon de Bagdad
! Ce pays est un pays d'émotions profondes, de tous temps ! Il m'émeut
profondément, même si j'y travaille pour l'instant sans le voir (j'apprend
un autre petit massacre à Hébron par CNN, mais cela n'émeut plus personne
tellement c'est de la routine) ! Il suffit de ne pas se promener seul dans
les mauvais quartiers !

   J'espère que je n'en dis pas trop (c'est habituel chez moi, c'est un de
mes grands défauts -- je suis classé comme un clavio-moteur !)

   Tout cela deviendra apparent après de nombreux votes d'ici deux ans,
souhaitons-le. Mais l'on s'approche du succès, car les « grands » veulent
maintenant que cette norme internationale de classement sorte, après s'y
être opposés pendant plusieurs années, car, disent-il maintenant, c'était
trop tôt auparavant !

Alain LaBonté
Tel Aviv

P.-S. : En Israël, dimanche c'est lundi... mais lundi il est déjà de toute
manière pour moi aussi, car il y est 1 h 10 du matin, et je recommence une
2e journée de travail à 9 h, à l'autre bout de la ville !!!