Archive Liste Typographie
Message : Accents libres (Alain LaBonté ) - Vendredi 17 Avril 1998 |
Navigation par date [ Précédent Index Suivant ] Navigation par sujet [ Précédent Index Suivant ] |
Subject: | Accents libres |
Date: | Thu, 16 Apr 1998 19:28:12 -0400 |
From: | Alain LaBonté <alb@xxxxxxxxxxxxxx> |
[Jean-Pierre Lacroux] : >Toutefois, ce que vous [= Olivier Bettens] me proposez comme corollaire >n'est pas dénué de fondement historique : de nombreux typographes du >XVIIe et du XVIIIe siècle se sont évertués à contourner les contraintes >matérielles en bricolant des accents au coup par coup ou en employant >des fontes dans lesquelles les accents étaient placés sur le côté de la >lettre : E´ (profitons-en, ces accents libres n'existent plus en >ISO-Latin 9...). [Alain] : Non, mais ils reviennent en force dans l'ISO/CEI 10646 (jeu universel de caractères codés sur plusieurs octets), et surtout dans Unicode, qui insiste... Je vous cite un commentaire de l'ECMA, daté de ces jours-ci, sur le soutien d'Unicode dans Java Script (en termes ISO, il s'agit du soutien de l'ISO/CEI 10646, ou jeu universel de caractères, dans l'ISO/CEI 16262, ou ECMA Script), et qui vous en dira long sur l'impact de ce double codage (ce commentaire est techniquement important, beaucoup plus que vous pouvez le penser, et il pourrait nous aider à faire des choix prudents contraires à ce que préconise le consortium Unicode, surtout pour les langues utilisant l'alphabet latin [pour les autres systèmes d'écriture, il n'y a pas en général de double codage et il n'y a pas de problème]) : ___________________________________________________________________________ « ECMA comments ISO/IEC DIS 16262, ECMAScript under ballot until 1998-04-09 1)The second paragraph of clause 2 on conformance need to be improved. A proposal for such an improvement is the following: "A conforming implementation of this International standard shall interpret characters in conformance with The Unicode Standard, Version 2.0, and ISO/IEC 10646-1 with UCS-2 as the adopted encoding form, implementation level 3. If the adopted ISO/IEC 10646-1 subset is not otherwise specified, it is presumed to be the BMP subset, collection 300." Background information The above proposed text does talk about implementation level 3 as described in 10646, but it does not mean that ECMAScript would have to process a character and a combining sequence as yet another uniquely identified character. ECMAScript can treat a combining sequence as just another 16-bit value. Combining sequences are encoded for use with some base characters especially for Indic, Thai, Arabic and Hebrew scripts. Platforms and application software decides how to process a base character and a combining sequence. Note that combining sequences can be used for Latin as well but the vast majority of Latin script characters are already encoded in 10646. For conformance with The Unicode Standard it is important that combining sequences are not damaged as they go through a process, such as ECMAScript. Unicode supports combining sequences and provides an equivalence algorithm that facilitates comparing precomposed characters with a base character followed by a combining sequence. All that ECMAScript, and other programming languages, need to do is to let a data stream of 16-bit values pass through the process cleanly and with no damage to the data. ¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯ [Pour la traduction, faites un Copier/coller du texte anglais en utilisant http://babelfish.altavista.digital.com/cgi-bin/translate? -- un exercice qui en vaut la peine -- vous rirez un peu, même si vous ne comprenez pas plus -- comprendront ceux qui sont spécialisés de toute manière (;] [Alain] : Comme vous le voyez, l'Histoire se répète, mais ses conséquences seront répercutées de manière amplifiée par rapport au passé et les changements seront plus difficiles à rectifier s'il y a problème (s'il n'y a pas de bogue [pépin !], il n'y aura pas de problème, mais « tout programme non trivial comporte au moins un bogue », c'est bien connu, c'est une loi que tout informaticien connait, et tout élément de complexité supplémentaire est une génératrice garantie de bogues à répétition)... Alain LaBonté Québec
- Accents libres, Alain LaBonté <=