Archive Liste Typographie
Message : Re: [typo] chinois utf8 et iso-8859 (Patrick Andries) - Mercredi 02 Février 2005 |
Navigation par date [ Précédent Index Suivant ] Navigation par sujet [ Précédent Index Suivant ] |
Subject: | Re: [typo] chinois utf8 et iso-8859 |
Date: | Wed, 02 Feb 2005 06:54:08 -0800 |
From: | Patrick Andries <patrick@xxxxxxxxxxx> |
bwbk a écrit :
Patrick Andries a écrit :Jean-François Roberts a écrit :Euuuhh : que faut-il entendre par "le problème codage du chinois ou du turcest idem" ?Les turcs utilisent quoi comme écriture ?
Aujourd'hui le latin avec, par exemple, une particularité bien turque: le i sans point à distinguer du i à point qui existe aussi.
Dans les codes sur 8 bits, l'ISO-8859-3 et l'ISO-8859-9 sont prévus pour le turc :
http://alis.isoc.org/codage/iso8859/8859-3.htm et http://alis.isoc.org/codage/iso8859/8859-9.htm
Je pense qu'hier j'ai regardé TF1 et j'étais preparé pour acheter du soda, pas pour écrire correctement. Ma question est technique, si je dois juste encoder d'une manière propre à chaque langue, ou d'une manière universelle (simplifié ?).
Le plus simple est vraiment Unicode (les systèmes d'exploitation et la majorité des applications vont de toute façon convertir les différents codages utilisés en entrée vers Unicode avant de traiter le texte).
Pour en revenir à l'iso 8859-1 dans une page html, il m'affiche des 港 pour chaque signe.
Bizarre, cette entité numérique (appel de caractère numérique en jargon) décimale est plus grande que la plus grande valeur admise en Latin-1. À moins que votre document contienne autre chose que du Latin-1 (votre chinois), mais je ne comprends pas pourquoi tous les signes seraient les mêmes (on peut avoir une copie de la page ?). Ce numéro (en fait &28207; la virgule étant importante) correspond si votre texte essaie d'envoyer de l'Unicode à U+6E2F : IDÉOGRAMME UNIFIÉ CJC-6E2F (GANG3, HONG4).
Pour pouvoir s'y retrouver sans consulter trop de pages Unicode, télécharger BabelMap : http://hapax.qc.ca/BabelMap_fr.html. On retrouve alors facilement de quel caractère il s'agit. On coche le mode "ACN décimal" (en bas à gauche) on saisit dans la fenêtre juste au-dessus «港» on choisit le mode "caractère", le caractère CJC (chinois-japonais-coréen) apparaît, son nom officiel dans l'ISO 10646:2003, dans les propriétés on trouve sa prononciation mandarine, coréenne et vietnamienne.
Le php n'est pas vraiment mon langage d'écriture, c'est juste de la colle à bloc d'html dynamique, il en sort toujours du html.
Je vois, un peu comme les Servlets ou les JSP (bien qu'on puisse produire en théorie autre chose).
P. A.
- Re: [typo] chinois utf8 et iso-8859, (continued)
- Re: [typo] chinois utf8 et iso-8859, Jean-François Roberts (02/02/2005)
- Re: [typo] chinois utf8 et iso-8859, Patrick Andries (02/02/2005)
- Re: [typo] chinois utf8 et iso-8859, bwbk (02/02/2005)
- Re: [typo] chinois utf8 et iso-8859, Patrick Andries <=
- Re: [typo] chinois utf8 et iso-8859, Jean-François Roberts (02/02/2005)
- Re: [typo] chinois utf8 et iso-8859, JM Destabeaux (02/02/2005)
- Re: [typo] chinois utf8 et iso-8859, Patrick Andries (02/02/2005)
- Re: [typo] chinois utf8 et iso-8859, Thomas Linard (02/02/2005)
Re: Re: [typo] chinois utf8 et iso-8859, fidelite (02/02/2005)
- Re: [typo] chinois utf8 et iso-8859, Patrick Andries (02/02/2005)
Re: [typo] chinois utf8 et iso-8859, philpask (02/02/2005)