Archive Liste Typographie
Message : Re: [typo] chinois utf8 et iso-8859

(Patrick Andries) - Mercredi 02 Février 2005
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: [typo] chinois utf8 et iso-8859
Date:    Wed, 02 Feb 2005 06:54:08 -0800
From:    Patrick Andries <patrick@xxxxxxxxxxx>

bwbk a écrit :

Patrick Andries a écrit :

Jean-François Roberts a écrit :

Euuuhh : que faut-il entendre par "le problème codage du chinois ou du turc
est idem" ?


Les turcs utilisent quoi comme écriture ?

Aujourd'hui le latin avec, par exemple, une particularité bien turque: le i sans point à distinguer du i à point qui existe aussi.

Dans les codes sur 8 bits, l'ISO-8859-3 et l'ISO-8859-9 sont prévus pour le turc :

http://alis.isoc.org/codage/iso8859/8859-3.htm et http://alis.isoc.org/codage/iso8859/8859-9.htm

Je pense qu'hier j'ai regardé TF1 et j'étais preparé pour acheter du soda, pas pour écrire correctement. Ma question est technique, si je dois juste encoder d'une manière propre à chaque langue, ou d'une manière universelle (simplifié ?).

Le plus simple est vraiment Unicode (les systèmes d'exploitation et la majorité des applications vont de toute façon convertir les différents codages utilisés en entrée vers Unicode avant de traiter le texte).


Pour en revenir à l'iso 8859-1 dans une page html, il m'affiche des &#28207 pour chaque signe.

Bizarre, cette entité numérique (appel de caractère numérique en jargon) décimale est plus grande que la plus grande valeur admise en Latin-1. À moins que votre document contienne autre chose que du Latin-1 (votre chinois), mais je ne comprends pas pourquoi tous les signes seraient les mêmes (on peut avoir une copie de la page ?). Ce numéro (en fait &28207; la virgule étant importante) correspond si votre texte essaie d'envoyer de l'Unicode à U+6E2F : IDÉOGRAMME UNIFIÉ CJC-6E2F (GANG3, HONG4).

Pour pouvoir s'y retrouver sans consulter trop de pages Unicode, télécharger BabelMap : http://hapax.qc.ca/BabelMap_fr.html. On retrouve alors facilement de quel caractère il s'agit. On coche le mode "ACN décimal" (en bas à gauche) on saisit dans la fenêtre juste au-dessus «&#28207;» on choisit le mode "caractère", le caractère CJC (chinois-japonais-coréen) apparaît, son nom officiel dans l'ISO 10646:2003, dans les propriétés on trouve sa prononciation mandarine, coréenne et vietnamienne.


Le php n'est pas vraiment mon langage d'écriture, c'est juste de la colle à bloc d'html dynamique, il en sort toujours du html.

Je vois, un peu comme les Servlets ou les JSP (bien qu'on puisse produire en théorie autre chose).

P. A.