Archive Liste Typographie
Message : [typo] Apostrophe

(jandre) - Mardi 10 Janvier 2006
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    [typo] Apostrophe
Date:    Tue, 10 Jan 2006 09:05:42 +0100 (CET)
From:    jandre@xxxxxxxx

Selon Philippe Jalon :

> Ce qui me gêne, ce serait plutôt l'usage exclusif des apostrophes
> dactylo... ;-(


Cette histoire d'apostrophe est typique de la confusion glyphe/caractère,
mais aussi de la différence entre norme de codage  et codage propriétaire,
et enfin de mauvais choix faits par Unicode par l'absence à l'époque de
francophones de poids assez fort pour défendre le français...
Un peu d'histoire :
Le signe apostrophe a été introduit en français (probablement par Tory en
1529 et non par Sylvius en 1531) pour marquer l'élision notamment et
depuis ce signe existe, sous forme d'une virgule en position haute, dans
toutes les casses.

Deux remarques importantes (valables même avant l'invention de la machine
à écrire) :
1) le français est la seule langue (à part le créole)  qui utilise autant
d'apostrophes. Dans un même texte traduit en plusieurs langues, on
trouvera par exemple:
- 1200 apostrophes en français
- 250 en anglais
- 0 en italien, allemand et latin.

2) Le signe apostrophe ne servait qu'à ça en français. En anglais par
contre, cette même apostrophe servait, du temps du plomb, également à
marquer, en la doublant, les guillemets fermants (double quotes comme on
dit aujourd'hui) tandis que les guillemets ouvrants étaient composés à
l'aide de deux virgules retournées. Plus rarement ces "guillemets" étaient
composés à l'aide d'une seule virgule retournée et d'une seule apostrophe.
On ne trouvait pas de "doubles quotes" dans les casses anglaises.

Lorsque la machine à écrire est apparue, faut de place sur le clavier (le
premier avait déjà la configuration QWERTY mais n'utilisait que des
majuscules), on a ignoré les chiffres 0 et 1 (on utilisait alors les
lettres O et I ; ça a d'ailleurs perduré puisque ma première MAE achetée
neuve vers 1955 n'avait pas de 0 ni de 1) et on a "inventé" l'« apostrophe
dactylo » (apostrophe droite, chiure de mouche, etc.) qui remplaçait donc
3 caractères différents : l'apostrophe, la quote gauche et la quote
droite.
Cette forme d'apostrophe unique a existé sur beaucoup de machines. Mais ce
serait une grossière erreur de croire que c'était la règle... On trouve
beaucoup de textes dactylographiés, notamment en français (mais aussi en
anglais), avec une belle apostrophe courbe et oblique. Il en est de même
pour les premières machines à composer : la Linotype offrait l'apostrophe
penchée à gauche et la virgule inversée en position haute.

Les premiers codages de caractères normalisés internationalement (code
Baudot devenu Telex) ont proposé l'apostrophe sans préciser si elle était
droite. Et la mécanographie puis l'informatique ont également proposé une
apostrophe ambiguë. Mais encore : on trouve des cartes perforées avec des
apostrophes droites et des avec des courbes obliques.

Quand on a commencé à faire un peu le nettoyage dans tous les codes
propriétaires des fabricants d'informatique (dont le BCD d'IBM), d'où est
né l'ASCII (devenu ISO-624), il y a eu évidemment de nombreuses
discussions (publiées partiellement depuis dans une revue d'Honeywell) sur
le choix des caractères à entrer dans ce codage (et peu sur les glyphes
correspondants). Quoiqu'il en soit, l'ASCII a été défini avec l'apostrophe
(toujours sans dire si elle était droite ou non et on la voit d'une façopn
ou l'autre dans les divers documents de l'époque). Curieusement, il y
avait aussi l'accent  grave mais pas l'aigu. j'ai cru comprendre que
certains voyaient là la façon de faire des quotes simples symétriques en
utilisant l'accent grave (`) pour l'ouvrant et l'apostrophe pour la
fermante, en supposant bien sûr qu'elle était oblique (descendant vers la
gauche). C'était vers 1960, période où est né le langage APL (A
Programming Language) utilisant un très nombre de caractères (que l'on
retrouve pôuir beaucoup dans Symbol) mais pour lequel il existait une
version abrégée de codage utilisant énormément la "quote" (je me demande
d'ailleurs si ce n'est pas le début de l'utilisation de ce mot - en tout
cas il est devenu le symbole l'APL, dont le journal était "APL Quot
eQuad") et là elle était supposée explicitement être verticale. APL est
resté plutôt d'usage confidentiel mais il a un peu infuencé d'autres
langages de programmation qui ont utilisé l'apostrophe notamment comme
symbole de parenthèse unique. Tandisque d'autres utilisaient des
parenthésages ouvrant/fermant distincts.
On [notamment des Allemands qui n'utilisent donc ni l'apostrophe ni les
accents aigus ou grave mais qui - les ayant sur leurs claviers puisque
dans latin-1 - les ont détourné pour des usages spécifiques] a alors
commencé à réclamer une certaine symétrie des caractères, demandant
notamment une paire "quote ouvrante - quote fermante" qui ne soit pas
ridicule comme [disaient-ils en fonction de leur propre clavier]  comme
l'apostrophe (droite) et l'accent grave, allant jusqu'à spécifier qu'il
était anormal que ces deux caractères ne soient pas sur les claviers tout
deux soit en position haute, soit en basse [comme c'est sur les claviers
français]. Voir (plus récemment encore) :
http://www.cl.cam.ac.uk/~mgk25/ucs/apostrophe.html.

Cette polysémie ne s'est hélas pas arrangée avec les premiers satandards
de glyphes comme PostScript où il n'y a pas de glyphe de nom apostrophe,
mais où on trouve bien les trois "quotes" : quotesingle (pour l'apostrophe
droite), quoteleft (penchée à gauche) et quoteright (penchée à droite).
Les bons éditeurs de texte utilisaient dans un texte la quoteleft quand un
utilisateur tapait par exemple « l'apostrophe ». C'est à peu près la
période où on a défini Latin-1 & Co et où on a commencé à avoir besoin
d'encore plus de caractères et là on a inventé plein de codages
"propriétaires" comme les "Ascii 8 bits" (sic), "page code" et autres
codages d'IBM ou de Windows, Apple, etc.  Beaucoup d'ailleurs éaient
d'ailleurs des codages sur 8 bits, en gros absés sur latin-1 mais
utilisant les deux zones des caractères non imprimables de Latin-1 (en
gros 1-32, 128-160). C'est là qu'on trouve les caractères absents de
latin-1 comme oe, OE, Y tréma, mais aussi fi, les tirets demi-cadratins,
etc. Bien sûr chacun à une place différente d'un codage à l'autre.

C'est ainsi qu'on a commencé à utiliser de nouveaux codes interdits pour
l'apostrophe courbe, par exemple 146 (qu'on retrouve d'ailleurs dans
certains codages hérétiques d'HTML qui prône le code ’). C'est donc
la période où dans les mails, selon le codage choisi par Windows ou un
autre, on avait de temps en temps la bonne apostrophe, ou la chiure de
mouche. Voire parfois « ? » si le codage de votre bécanne lui n'avait pas
un caractère dans cette zone interdite.
N.B. On voit qu'HTML avec ses entités confond aussi caractère et glyphe
car il propose dans ces entités des glyphes comme ’ (apostrophe
oblique) ou des caractères comme ' (apostrophe de code Ascii).

Enfin vint Unicode. Qui a donc bien compris qu'il fallait distinguer la
sémantique des caractères (distinguer l'apostrophe linguistique des quotes
ouvrantes ou fermantes, et autres). Et sous la pression d'anglophones
(dont Everson, voir http://std.dkuug.dk/JTC1/SC2/WG2/docs/n2043.pdf) a
pris la décision de bien distinguer la véritable apostrophe courbe des
autres. ON aurait imaginé que le choix fût "l'apostrophe garde son code
0027, les usages frelatés sont à coder autrement"). Hélas, le choix
aberrant est le suivant :
- le caractère 0027 s'appelle apostrophe
- le glyphe recommandé est celui de l'apostrophe droit (d'APL)
- le caractère recommandé pour l'apostrophe est le caractère de code 2019
(qui ne tient pas sur 8 bits).

Et on a bien sûr ajouté des notes techniques sur la façon dont il fallait
modifier, grâce à PERL ou autre langage de script, les textes où on avait
déjà des apostrophes selon le cas. Ça ça marche le jour où on bascule,
mais aujourd'hui on est dans une période de transition où l'apostrophe a
toujours 36 codages selon les logiciels/matériels plus maintenant encore
un nouveau pour Unicode. Cette modification des textes est relativement
rare chez les Allemands qui n'utilisent donc pas l'apostrophe normale et
malgré tout assez peu les autres. Mais chez nous, en français...

Une fois de plus, il faut bien noter que les représentants français dans
les instances de normalisation ont fait preuve d'incompétence totale. Il
ne fallait pas laisser passer ce choix aberrant de modifier le code de
notre apostrophje. Et quand on lit que Unicode a Latin-1 comme vrai
sous-ensemble, ça me laisse rèveur.

En fait, mis à part que ça m'énerve de voir cette chiure de mouche quand
on peut avoir la bonne apostrophe, moi j'utilise TeX qui a toujours
compris la différence entre la saisie d'un caractère (') et ce qui est
imprimé (la bonne apostrophe). Sauf... lorsque je fais cu copier-coller
car là c'est encore une autre paire de manche : on "voit" sur écran telle
apostrophe et quand on la copie dans un éditeur, elle se transforme
parfois en "n'importe quoi" (idem pour les espaces, guillemets et autres
choses mal codés en HTML).

Pour terminer une remarque : La France est mal représentée dans les
instituts de normalisation, aucun « typographe » n'en faisant partie.
C'est pourquoi nous insistons, dans le collectif de défense de
l'Imprimerie nationale, qu'il soit créé un institut (un conservatoire au
sens de conservatoire de musique) qui forme les gens à ces subtilités
historiques et numériques de codage. Sinon on va à la perte de notre
culture. Voir http://www.garamonpatrimoine.org/projet_cite.pdf

Jacques André