Archive Liste Typographie
Message : Re: [langue-fr] Valeur à 8 bits ou sur 8 bits ?

(Alain LaBonté ) - Lundi 14 Août 2000
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: [langue-fr] Valeur à 8 bits ou sur 8 bits ?
Date:    Mon, 14 Aug 2000 12:57:41 -0400
From:    Alain LaBonté  <alb@xxxxxxxxxxxxxx>

À 11:58 2000-08-14 -0400, Patrick Andries a écrit:
L'ISO parle de caractères codés sur plusieurs octets.

Doit-on dire qu'une valeur est codée à 8 bits ou sur 8 bits ?

Doit-on dire : « Un texte brut Unicode consiste en une suite de codes de
caractère Unicode sur 16 bits » ou « Un texte brut Unicode consiste en une
suite de codes de caractère Unicode à 16 bits » ?

Aide grandement appréciée.

[Alain] Je suis formel si l'on parle de caractères : il faut dire « caractères codés sur 8 bits »... Si l'on utilisait la préposition « à », le sens serait légèrement différent, cela signifierait à mon avis que ce sont les caractères qui sont à 8 bits (ce qui n'est pas le cas). Les caractères, à l'ISO, sont définis de manière indépendante de leur codage (le caractère « é », par exemple, reste un « é », peu importe le nombre de bits ou d'octets avec lesquels il est codé). Les caractères codés le sont sur un nombre déterminé de bits ou d'octets.

Les valeurs elles-mêmes peuvent bien sûr être « à 8 bits », c'est une toute autre histoire, à mon humble avis. C'est une question de sens (et même de « bon sens »)... « Sur » et « à » permettent de nuancer en français, et ne peuvent toujours être employés indifféremment l'un pour l'autre... cela à mon humble avis, bien sûr, mais je suis ouvert à me laisser convaincre par des arguments logiques du contraire, comme toujours...

Pour répondre à la question finale, je dirais : « Un texte brut Unicode consiste en une suite de caractères Unicode codés sur 16 bits » ou peut-être, de manière un peu moins ambiguë, « Un texte brut Unicode consiste en une suite de codes de 16 bits représentant en général chacun un caractère Unicode » (j'écris « en général », car il y a des exceptions, il y a des codes Unicode qui ne sont pas des caractères -- et la question peut être compliquée à souhait davantage encore si l'on en débat en plus avec des typographes [et pour cause, la définition de caractères depuis l'arrivée d'Unicode a été dénaturée, et elle s'éloigne de la notion de caractère typographique, car une partie de caractère, un accent, par exemple, peut très bien être elle-même un caractère sous Unicode, ou non, selon la manière de coder le caractère typographique en vertu de ce standard] -- et un caractère Unicode peut lui aussi être composé de plus d'un code de 16 bits [dont aucun ne constitue en soi un caractère] sans même que le glyphe qu'il sous-tend soit même topologiquement séparable ; c'est un « patch » par rapport à l'intention d'origine à la base d'Unicode, mais le « patch » en question est devenu inévitable avec le temps).

Bon, j'ai encore eu le don de compliquer ma réponse... (; Mais Patrick, qui est tombé dedans quand il était grand, me comprendra... (il n'est pas nécessaire de tomber dans cette potion quand on est petit pour ne plus avoir à en gober pour comprendre, mais il faut quand même tomber dedans sinon la dose n'est jamais suffisante !!!)

   (:

Alain LaBonté
Québec

De retour de 9 jours de vacances, je croule sous 1002 messages en cours de traitement !!! ):