Archive Liste Typographie
Message : Re: Caracteres (etait Re: Le Dico de l'espace :-))

(Jacques Andre) - Mardi 02 Mars 1999
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: Caracteres (etait Re: Le Dico de l'espace :-))
Date:    Tue, 02 Mar 1999 17:23:18 +0100
From:    Jacques Andre <Jacques.Andre@xxxxxxxx>

Franck Pommereau wrote:
>
> 
> Heu... Me voici maintenant bien embêté : pourriez-vous me donner une
> definition pour les termes caractère, glyphe et type, si c´est bien
> comme ca qu´on appelle l´objet en alliage plomb dont se servaient nos
> ancêtres pour composer.  :-)
> 
>

Du temps du plomb on distinguait l'objet en plomb (type ou caractère) de
sa
trace imprimée (oeil). Ces types pouvaient correspondre à une lettre (f
ou i),
ou à des choses comme la ligature fi.
L'informatique a appelé caractère les deux. Or il faut parfois
distinguer les
choses, par exemple, typiquement la ligature fi qui peut être vue soit
comme
deux caractères (f suivi de i, et qu'un bon système de composition va
remplacer par
le caractère unique fi) soit comme le seul caractère fi. Par ailleurs,
il y a
des symboles comme A dont, hors contexte notamment, on ne sait s'il
s'agit de la
capitale romaine A  ou de la capitale grecque ALPHA.

Les normes traitant des caractères sont essentiellement des normes
d'échange
(comment les faire passer d'un ordinateur à un autre).
C'est surtout la norme UNICODE qui a fait la distinction suivante :

 - caractère c'est l'entité abstraite (lettre A majuscule, lettre f
minuscule, etc.)
 - glyphe c'est une représentation possible d'un caractère ou de
plusieurs (par exemple le A capitale latin peut avoir plein de glyphes
différents selon que l'on emploie du Times en corps 12, du COurier
italique corps 24, une police scripte, etc.).De même il peut y avoir
plusieurs glyphes pour la ligature fi correspondant
aux deux caractères f suivi de i.

Les normes d'échange comme Unicode associent un numéro à un nom de
caractère (par exemple le code 0026 (en base 16) au caractère appelé «
AMPERSAND » (ou en français, ESPSERLUETTE) et, a priori (ce n'est pas
vrai pour les ligatures arabes par exemple)
ne s'intéressent pas aux glyphes donc aux ligatures. Mais oe et OE
n'étant pas des
ligatures "graphiques" (ce sont plutôt des digrammes soudés), ces
caractères
sont dans Unicode (et le seront donc comme je le disais ce midi dans
Latin9).

En revanche les tables de codage (appelées sans raison tables
d'encodage) de certains
ordinateurs ou de langages de description de page (comme PostScript)
donnent
des glyphes (comme /oe ou /OE). Le problème est que les codes-pages de
Microsoft
et les tables d'(en)codages du Mac sont différentes, et différentes des
normes
d'échanges de caractères. Unix a choisi de travailler avec ces
dernières.Dernier point pour tout compliquer : des messageries (mail)
utilisent un protocole de 
transcodage à 7 bits appelé MIME que tout le monde n'utilise pas, alors
si vous êtes 
entre PC ou entre Mac ou entre Unix, ça se passe relativement bien, mais
si vous
mélangez les genres, ça peut donner des catastrophes.

C'est pour ça que parfois dans cette liste on voit des messages (surtout
dans les
parties recopiées) avec des caractères illisibles (typiquement avec des
notations
&isolatin1... ou =E7) : un message n'a pas été bien décodé chez un
listeur,
ou son système de mail ne dit pas comment il transcode, et après ça
devient illisible chez les autres. 

-- 
Jacques André
Irisa/Inria-Rennes,   Campus de Beaulieu,  F-35042 Rennes Cedex,  
France
Tél. : +33 2 99 84 73 50,  fax : +33 2 99 84 71 71, email :
jandre@xxxxxxxx