Archive Liste Typographie
Message : Le codage des glyphes ou des caractères (Alain LaBonté ) - Lundi 23 Novembre 1998 |
Navigation par date [ Précédent Index Suivant ] Navigation par sujet [ Précédent Index Suivant ] |
Subject: | Le codage des glyphes ou des caractères |
Date: | Mon, 23 Nov 1998 09:21:31 -0600 |
From: | Alain LaBonté <alb@xxxxxxxxxxxxxx> |
A 13:36 98-11-23 +0100, Thierry Bouche a écrit : [Jacques] : >» [...] plus on invente des normes internationales, >» plus les commerciaux, les claviers, les systèmes foutent le b... >» pour que ça ne marche pas ! [Thierry] : >encore faudrait-il que les normes soient irréprochables... Qui peut >montrer MS ou Apple du doigt parce qu'ils ont utilisé un codage non >standard contenant le {oe} ? [Alain] : Personne ! C'est Bull qu'il faudrait pointer du doigt, pour ceux qui connaissent l'histoire, mais ça ne donnerait pas grand chose ! Il faudra un jour rectifier le tir (pas en changeant les données à tout prix mais en ayant autrement un système de conversion qui fonctionne dans les deux sens à l'aide de balises appropriées). [Thierry] : >Et puis les systèmes wysiwyg ont besoin d'un codage de glyphes, pas de >caractère... [Alain] : Là, je diffère un peu d'opinion. Le codage compact des caractères est une percée technologique par rapport au dessin (ce qui n'élimine pas la nécessité absolue des techniques graphiques, qui sont aussi une percée technologique) : le codage compact des caractères accélère le transfert d'information et son traitement. Si vous recherchez un « a » par des moyens informatisés, il vaut mieux faire une recherche sur un concept (représenté par un caractère codé) que sur une myriade de formes de ce concept (les innombrables glyphes qu'un humain peut reconnaître comme un « a »). Cela étant, on n'a pas encore fait la percée technologique qui interprèterait de manière absolue la signification d'un caractère codé dont le code n'est pas identifié (mais on peut envisager des moyens de s'en sortir). Les meilleures méthodes à l'heure actuelle sont empiriques, donc complexes : en courrier électronique, la provenance d'un message nous donne une idée de la langue parlée (ce qui limite les codes à un certain nombre) ou même du codage utilisé ; l'identification de la langue d'un texte (par tout moyen) nous permet de faire des analyses rapides de fréquences de lettres [ou la reconnaissance de mots fréquents] qui aident à deviner le code utilisé. Il y a bien d'autres indices qu'un programmeur intelligent pourrait utiliser... mais l'informatique universelle n'en est pas encore à ce stade. Nous n'avons pas atteint la perfection de la gastronomie française, nous en sommes plutôt à la découverte de la cuisson des aliments, juste après la découverte du feu par l'homme des cavernes. Lorsque le code est explicitement identifié, encore faut-il aussi traiter cette information correctement. Nous n'en sommes même pas encore là, même en présence d'indices explicites [MIME, CDRA, xxML, etc.] ! Alain LaBonté Québec
- Re: Deja vendredi..., (continued)
- Re: Deja vendredi..., Jacques Andre (23/11/1998)
- Re: Deja vendredi..., Thierry Bouche (23/11/1998)
- Re: Deja vendredi..., Jacques Andre (23/11/1998)
- Le codage des glyphes ou des caractères, Alain LaBonté <=
- Re: Le codage des glyphes ou des caractères, Thierry Bouche (24/11/1998)
- Fontes Mac, Unicode et ratons-laveurs, Alain Hurtig (23/11/1998)
- Polices homogenes (fut : Vendredi), Alain Hurtig (22/11/1998)
- Re: Polices homogenes (fut : Vendredi), Jean-Pierre Lacroux (22/11/1998)
- Re: Polices homogenes (fut : Vendredi), Alain LaBonté (22/11/1998)
- Re: Polices homogenes (fut : Vendredi), Alain LaBonté (22/11/1998)
- Re: Deja vendredi..., Jacques Andre (23/11/1998)