Archive Liste Typographie
Message : Re: "Grapheme cluster", "grapheme joiner"

(Patrick Andries) - Lundi 07 Janvier 2002
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: "Grapheme cluster", "grapheme joiner"
Date:    Sun, 06 Jan 2002 22:30:31 -0500
From:    Patrick Andries <pandries@xxxxxxxxx>



Olivier RANDIER a écrit :
Je cherche un mot pour traduire « grapheme cluster » dont la définition
suit. Je me permets cette longue introduction, car elle resservira par
la suite.


«G» + accent-aigu est ainsi un « grapheme cluster» car les utilisateurs
le considèrent comme un seul caractère, bien qu'il soit représenté par
deux caractères Unicode.

Mauvais exemple : Gacute est un caractère, le 01F4 (latin étendu B).
C'est une des manières de le représenter.
 Si
j'en crois tes commentaires, la formule diacritique + lettre est la
mauvaise façon de procéder.
Ça dépend de la forme de normalisation, mais habituellement la décomposition est plus puissante et préférée car il existe de nombreux caractères de base  munis de diacritiques qui ne correspondent à aucun caractère précomposé codé. Que la suite de caractère de base + diacritiques correspondent à un glyphe précomposé dans la police ou qu'elle soit composée à la volée par le moteur de rendu est une autre histoire (il s'agit d'un autre espace pour Unicode et Unicode est muet quant à son agencement).
Parmi les « grapheme clusters », on retrouve les suites de caractères
combinatoires (a + ^), les digraphes comme le « ch » slovaque ou les
lettres suivies d'un modificateur « k + w suscrit ».

Elle est là, ta solution, me semble-t-il : digramme et trigramme sont des
polygrammes (ou des polyglyphes ou des polygraphèmes, j'ai du mal à
comprendre la distinction entre glyphe et graphème).
Glyphe = oeil et donc variabilité de police, de style (plusieurs glyphes "c"  et plusieurs glyphes "h" en slovaque)
Graphème = unité de base du répertoire (pour nous, alphabet)  un seul graphème "ch" en slovaque peu importe son oeil.
 Multigramme si ça
chagrine la maison de disques...
C'est une piste intéressante.


+ suggestions de traduction (liste non limitative) pour « grapheme
cluster » : unité/tranche/groupe/atome d'édition ou de graphème(avec ou
sans s ?).

Polygramme insécable ? indissociable ?
Oui, l'insécable me plaît.

La notion importante, dans ce cas, n'est-elle pas plutôt la spécificité du
« grapheme
cluster » que son assemblage ? Tes formulations font penser à des
ligatures, alors que ce n'en sont pas (pas nécessairement, du moins).
Pourquoi pas polygramme spécifique ou local ?
Oui, il existe des « graphèmes complexes » (autre suggestion reçue) implicites (valables par défaut) et d'autres personalisés (le «ch» slovaque).

Pour former un « polygramme insécable » qui n'est pas implicite, on utilise un caractère spécial l'«assemble-graphème» (grapheme joiner) . C'est ce terme que je cherche.

 En passant, Unicode 3.2 introduit également un « word joiner » qui est en fait une espace insécable sans chasse, mais le mot est déjà pris (FEFF) pour désigner un caractère polysémique indicateur de l'ordre des octets (petits ou gros boutiens) ou espace insécable sans chasse. Je cherche également un terme pour ce « word joiner » (assemble-mot, colle-mot, etc.).

Merci pour toutes les suggestions

Patrick