Archive Liste Typographie
Message : Petite victoire internationale avec des conséquences perpétuelles (Alain LaBonté ) - Lundi 19 Octobre 1998 |
Navigation par date [ Précédent Index Suivant ] Navigation par sujet [ Précédent Index Suivant ] |
Subject: | Petite victoire internationale avec des conséquences perpétuelles |
Date: | Mon, 19 Oct 1998 01:08:57 +0200 |
From: | Alain LaBonté <alb@xxxxxxxxxxxxxx> |
Après ma première journée de travail en Israël, je me suis payé trois heures et demie de travail ce soir avec l'un des deux gourous techniques du consortium Unicode et du langage Java en ce qui concerne le classement du jeu universel de caractères (JUC). Ce travail avait pour but de scruter à la loupe ma dernière ébauche de projet de norme internationale de classement pour limiter la discussion qui aura lieu demain (en d'autres mots, si je m'entendais avec lui, il ne resterait principalement sur place qu'un récalciltrant, un Suédois très méticuleux, docteur en mathématiques [qui contribue très constructivement aussi et à qui j'ai expliqué les raisons techniques des points sur lesquels j'ai su en coulisses qu'il était encore en désaccord -- mais il est maintenant préparé psychologiquement au compromis]. Il était déjà acquis que Java implante la méthode que j'ai pondu en 1988, qui est aujourd'hui sur le site du Conseil du trésor, de l'APIIQ, et sur deux autres sites en France (et qui est devenue une norme canadienne implantée par IBM [ça aide !], et maintenant par Oracle, Sybase [le gourou dont je parle ci-haut est de chez Sybase, il s'agit de Kenneth Whistler, linguiste de formation, et notamment spécialiste des langues du sous-continent indien], etc. mais dans les petits détails, pour le soutien du français, il restait des différences (traitement secondaire des accents implicitement légèrement différent [ce dernier cas n'affecte que le tri exact des dictionnaires, à l'insu des usagers de la langue qui ne s'en rendent que rarement compte, la norme atteint de toute manière un haut degré d'utilisation intuitive au départ -- cela est acquis], mais surtout, traitement différent des digramme soudés <ae> et <oe> de manière fondamentale -- là, ça affecte monsieur-tout-le monde). Bon... J'avais déjà commencé à faire du lobbying chez IBM et comme par hasard j'en avais justement discuté à l'aéroport de Toronto vendredi soir avec le dr Umamaheswaran, autre gourou du domaine et représentant d'IBM auprès du consortium Unicode -- je ne sais pas si le hasard existe, mais il partait pour l'Inde alors que je partais pour Tel Aviv, nous nous sommes rencontrés dans cet immense aéroport comme deux amis vont prendre un café pendant une pause sauf qu'il était 23 h vendredi soir !!! Toujours est-il que dans mes discussions de fin de soirée sur les détails de la table (discussion à deux !!), j'ai obtenu que le digramme soudé <oe> soit classé comme s'il s'écrivait en 2 lettres (ce que 98 % des utilisateurs de langues à alphabet latin [1 milliard de personnes grosso modo sur terre] s'attendent à voir dans une liste triée... car les tables implicites de Java classaient *à dessein* (pour des raisons obscures que seul un linguiste peut comprendre et expliquer à d'autres linguistes !!!) ce caractère comme s'il était une lettre simple classée entre o et p (conséquence : le mot « oeuf » se retrouve ainsi après « ovaire » ! conséquence petite si l'on ne considère que cet exemple, mais perpétuelle s'il n'est pas corrigé, et perpétuée par un rouleau compresseur dont on sait que sa force est si grande qu'il ne s'arrêtera jamais, et l'on serait forcé de vivre longtemps avec cette erreur... des millions, des milliards, des trllions d'erreurs en perspective au cours du prochain siècle, pour les francophones, mais aussi pour la grande majorité des autres qui seront exposés aux caractères latins. Par contre, Kenneth n'a jamais admis que æ devait se classer comme « ae ». Raison : dans le processus d'équivalences canoniques entre caractères précomposés d'Unicode et séquences combinatoires (i.e. le fait qu'un « é » codé en 16 bits soit équivalent avec une séquence combinatoire de 32 bits composée d'un « e » suivi d'un accent aigu), il existe un æ accentué pour les langues scandinaves et cela perturbe la façon automatique de déduire la table de classement implicite à partir des tables de propriétés de caractères d'Unicode (ouf !). Cela étant, étant donné que dans les rares mots où il y a un « æ » en français, il existe, sauf erreur, toujours une orthographe alternative et même préférée (ne serait-ce que parce quil est plus facile de la saisir au clavier -- ex. : « cæsium » est préférablement écrit « césium »), les conséquences ne seront pas très graves (et compte tenu que la voyelle qui vient après a est un e, et que « æ » ainsi traité se classera après « az », les æ devraient être classés près des « é » de toute manière [« cæsium », si on l'écrit hypothétiquement ainsi, sera classé après « case » mais certainement avec « césium », logiquement]). Ce n'est pas l'idéal mais cela illustre bien les compromis mafieux que l'on fait à l'ISO, en coulisses, souvent à deux, et qui auront des conséquences quasi éternelles et certainement dans ce cas universelles, en autant que mémoire d'homme est concernée ! Belle victoire quand même, sans fausse modestie, car les recommandations d'Unicode sont et seront suivis par Java, par le consortium W3C, etc., et par Sybase, Microsoft, IBM, les programmeurs Java, etc. Malheureusement, cela ne change pas le fait que Tel Aviv sera, de l'avis d'un chauffeur de taxi, sans doute bombardée par un missile atomique un jour par un leader arabe intégriste, ce qui détruirait Israël complètement (70 % de la population juive d'Israël vit dans un rayon de 25 km du centre de Tel Aviv où je me trouve, ce qui exclut même Jérusalem à moins de 60 km !!!) Ce que nous faisons ici ne changera pas ce monde mais il améliorera le confort culturel de centaines de millions de personnes, même si tout cela se fait dans l'ombre... avec l'espoir que le monde soit un jour meilleur ! C'est avec de petites gouttes d'eau, voire des atomes, que l'on fait les océans ! Entre-temps, je n'oublie pas qu'ici même, il y a moins de 7 ans, l'on vivait sous les bombardements de missiles Scud, à portée de canon de Bagdad ! Ce pays est un pays d'émotions profondes, de tous temps ! Il m'émeut profondément, même si j'y travaille pour l'instant sans le voir (j'apprend un autre petit massacre à Hébron par CNN, mais cela n'émeut plus personne tellement c'est de la routine) ! Il suffit de ne pas se promener seul dans les mauvais quartiers ! J'espère que je n'en dis pas trop (c'est habituel chez moi, c'est un de mes grands défauts -- je suis classé comme un clavio-moteur !) Tout cela deviendra apparent après de nombreux votes d'ici deux ans, souhaitons-le. Mais l'on s'approche du succès, car les « grands » veulent maintenant que cette norme internationale de classement sorte, après s'y être opposés pendant plusieurs années, car, disent-il maintenant, c'était trop tôt auparavant ! Alain LaBonté Tel Aviv P.-S. : En Israël, dimanche c'est lundi... mais lundi il est déjà de toute manière pour moi aussi, car il y est 1 h 10 du matin, et je recommence une 2e journée de travail à 9 h, à l'autre bout de la ville !!!
- Petite victoire internationale avec des conséquences perpétuelles, Alain LaBonté <=