Archive Liste Typographie
Message : Re: [ [typo] Comment écrire en diverses langues indiennes]

(Jean-François Roberts) - Mardi 27 Janvier 2004
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: [ [typo] Comment écrire en diverses langues indiennes]
Date:    Tue, 27 Jan 2004 07:25:30 +0100
From:    Jean-François Roberts <jean-francois.roberts@xxxxxxxxxx>


> De : Patrick Andries <hapax@xxxxxxxxxxx>
> Répondre à : typographie@xxxxxxxx
> Date : Mon, 26 Jan 2004 21:05:07 -0500
> À : "typographie@xxxxxxxx" <typographie@xxxxxxxx>
> Objet : [ [typo] Comment écrire en diverses langues indiennes]
> 
> 
> Jean-François Roberts a écrit :
> 
>> Si je comprends bien, vous cherchez non pas des polices, ni des
>> translittérations, mais des répertoires de termes géographiques (ou les
>> incluant) dans les langues d'origine.
>> 
>> Pour survoler le reste : pour les polices, voir le site indiqué par J.
>> André. Encore faut-il avoir les ressources système pour... manipuler
>> lesdites polices. Ce qui n'est pas toujours évident : le système Mac, par
>> exemple, ne traite que 4 des 10 principales écritures indiennes ;
>> 
> 
> [PA] Normalement, si ça marche pour 4 (je suppose que la dévanagari est
> dedans) ça devrait marcher pour les 6 autres pourvu qu'on ait les
> polices, ce sont les mêmes principes de rendu qui régissent toutes ces
> langues (dans le système ISCII, il suffisait parfois d'une simple
> changement de police pour que ce qui était du télougou apparaisse du
> kannara (les mêmes lettres des deux alphabets se trouvant aux mêmes
> positions).
> 

Non : il y a des différences sensibles entre langues indo-aryennes
(écritures devanagari, bengali, gurmukhi, par ecemple) et dravidiennes
(tamoule, kannada, par exemple). Le système Mac a fait l'impasse sur les
langues dravidiennes (sur les systèmes d'écriture correspondants, disons).
Il ne s'agit de toute manière pas d'une simple correspondance signe à signe
(là, pas de problème entre langues indiennes, en effet) mais de la
construction éventuellement différente des glyphes composites. Là, il faut
bien des ressources spécifiques pour chaque système d'écriture. Et ça
devient encore plus clair pour les langues dravidiennes, pour lesquelles on
peut parfaitement présenter un syllabaire standard de 200 à 300 caractères -
loin des dizaines de milliers de glyphes des écritures devanagari ou
bengali, par exemple. Quant à l'urdu ou au pachtoune, c'est de l'écriture
arabe (avec quelques lettres supplémentaires et des conventions d'écriture).

> Je n'ai pas essayé dans Windows récemment, mais avec de police adéquate
> pour chaque écriture, vous devriez être bon.
> 
> Pour comment ça marche en dedans voir :
> http://pages.infinit.net/hapax/pdf/Chapitre-10.pdf
> 
> Éric Muller qui lit cette liste a fait quelques essais  sur les langues
> brahmi : http://www.rawbw.com/~emuller/unicode/ (malheureusement le
> texte est en anglais)
> 
> Il pourra sans doute donner plus de détails.
> 
> 
>> pour le
>> reste - y compris le tibétain, par exemple, et les écritures du Sud-Est
>> asiatique, qui suivent le même principe -, faut se procurer des
>> ressources
>> supplémentaires (ça se trouve aussi). Attention : certaines langues du
>> sous-continent (sindhi, par exemple) existent actuellement en double
>> écriture : "indienne" et "arabe". Le choix de l'une ou de l'autre est...
>> éminemment politique, dirons-nous. (Se méfier de retours de bâton
>> inattendus. Historiquement, *toutes* les langues indiennes ont fait
>> l'objet
>> de transcriptions en écriture arabe, du fait de l'empire moghol. On
>> sait que
>> l'urdu, qui s'écrit en caractères arabes, est au hindi ce que le
>> croate est
>> au serbe...)
>> 
>> 
> Enfin, presque on dit qu'historiquement l'*o*urd*o*u (en français) et
> l'hindi forme l'hindoustani commun mais dans les faits il y a bien plus
> qu'une différence de graphie.
> 

"Ourdou" est une transcription, "urdu" une translittération (ou, si l'on
veut, ce sont deux transcriptions, également valables : le _Petit Larousse_
donne les deux). L'une n'est pas plus "française" que l'autre.

> Depuis la partition, les différences ont tendance à s'accuser, surtout
> au niveau de la création néologique. L'hindi tend de plus en plus à
> avoir recours au sanscrit pour former de nouveaux mots. D'un autre côté,
> l'ourdou aurait tendance à se "purifier" et emprunte largement au
> persan. Ce fond persan, lui-même largement bardé d'emprunts à l'arabe,
> est resté très longtemps productif en hindoustani sous la domination
> moghole et britannique. Aujourd'hui encore, il existe toute une kyrielle
> de doublets en hindi, un mot sera d'origine sanscrite et l'autre
> d'origine arabo-persane. En général, le hindi utilisera le terme
> sanscrit quand le registre de langue s'élève.
> 

Oui : j'ai voulu faire bref. Si vous faites votre marché, tant pour le
vocabulaire que pour la syntaxe, seule l'unité monétaire vous indiquera si
vous êtes à Delhi ou à Islamabad (et le fait que les mentions écrites, bien
sûr, seront en écriture devanagari ou arabe, selon le cas...). C'est pour
les termes "scientiques" (philosophie, théologie, sciences naturelles, etc.)
- là ou le français fera appel à des racines grecques ou latines (ontologie,
parèdre, phonogramme, etc.) - que le hindi fera appel au sanscrit, alors que
l'urdu puisera au fonds arabo-persan. (Depuis la séparation entre Serbie et
Croatie, on voit d'ailleurs - soit dit en passant - un particularisme
linguistique se développer, introduisant une différenciation entre serbe et
croate.)

> Pour prendre un exemple concret, le "livre" se dit soit /kitâb/ (origine
> arabe), soit /poustak/ (origine sanscrite). Le premier est beaucoup plus
> courant, mais on parlera toujours de la bibliothèque en disant
> /poustakâlaï/.* *
> 
> 
>> Le codage Unicode, soit dit en passant, ne répond que bien
>> imparfaitement au
>> problème : contrairement au grec classique ou à l'écriture arabe,
>> 
> 
> Les formes de présentations de l'arabe sont déconseillées (fruit d'un
> compromis typique de l'ISO, si je me souviens bien, pour faire plaisir à
> l'Égypte), toutes les formes de présentations grecques ne sont pas
> codées et à dessein (il existe des centaines de ligatures du Grec du Roy
> qui ne seront jamais codés).
> 

Soit : mais ces ligatures pour l'arabe ont l'immense avantage d'exister.
Elles sont d'ailleurs peut-être "déconseillées" (mais par qui, grands dieux
?) - mais elles n'en sont pas moins utilisées dans tout le Moyen-Orient, en
bonne typo : ainsi, pour les dictionnaires arabes (monolingues) publiés à
Beyrouth par la société Dar el-Machreq, homologues de notre _Petit
Larousse_. On n'a pas même commencé d'en faire autant (en Unicode) pour les
écritures du sous-continent indien et du Sud-Est asiatique. Quant au grec
classique, on a en effet fait l'impasse sur les ligatures : mais c'est que
la typo moderne pour le grec classique ne les utilise pas ! (C'est fascinant
de voir les Grecs du Roi, en effet : mais si leur codage est souhaitable -
mais pourquoi se restreindre aux seuls glyphes de cette police, qui est
elle-même un compromis... historique ? -, on n'a pas de problème immédiat en
typo du fait de leur absence.) Alors que les glyphes composites sont d'usage
courant en typo devanagari ou bengali actuelle (et ça fait du boulot : j'en
ai compté plus de 200 dans un manuel de devanagari - de niveau "grand
débutant universitaire", disons). Quant aux glyphes issus de combinaisons
"caractère simple-diacritique", on ne peut rien faire sans eux en écritures
indiennes (les voyelles ne sont pas optionnelles en typo indienne,
contrairement à la typo arabe ; d'ailleurs, certains diacritiques - en
devanagari, par exemple - indiquent des consonnes !).

>> en effet,
>> on n'a jamais ajouté les "formes de présentation" pour les écritures
>> indiennes (caractères composés avec diacritiques indiquant la
>> vocalisation
>> de la voyelle, ou la présence d'un "r" antérieur ou postérieur, etc. -
>> soit... quelques *dizaines de milliers* de combinaisons possibles pour
>> chaque écriture ! Et sans parler des "caractères composés" issus de la
>> combinaison de deux - voire trois - caractères, pour indiquer les
>> combinaisons consonantiques... plusieurs centaines à chaque fois, qui se
>> vocalisent à leur tour, etc. ad nauseam).  Les informatitiens indiens
>> peinent à se mettre d'accord sur les standards adéquats (on les
>> comprend !).
>> 
>> 
>> 
> [PA] Pour Unicode, c'est une question de polices (et de préférence
> personnelle pour savoir combien de conjointes combiner).
> À nouveau la lecture de
> http://pages.infinit.net/hapax/pdf/Chapitre-10.pdf s'impose.
> 
>> Pour les translittérations, il y a désormais une norme ISO (également
>> adoptée en France). Mais ça suppose d'avoir accès à des polices spéciales
>> pour les diacritiques.
>> 
>> 
> [PA] Les polices à diacritiques sont présentes sur quasi toutes les
> machines (Windows cf Arial Unicode MS, Sans Lucida Unicode), mais je
> ferais attention à ce que vous transcrivez de la sorte. Pour les noms de
> tous les jours (noms des langues, des grandes villes, des divinités)
> dans un texte en français, utiliser une norme ISO (il y en a tant ! et
> certaines contradictoires) pourrait paraître très pédant [en tout cas
> moi je ne supporte pas] et peu compréhensible. Utiliser aussi les formes
> traditionnelles françaises si vous vous adressez à des francophones.
> Bref, il vaut mieux  Pondichéry que Puduchcherry (et ici je laisse
> tomber lesdits diacritiques pour la seconde forme!)
> 

Vrai pour Windows. Faux pour Mac (pour les Unix, j'ignore). Si on fait un
travail "scientifique", on évitera les transcriptions franco-françaises,
pour leur préférer un système international. En bref, plutôt que de choisir
entre un système INALCO - par exemple - et les tables de "romanisation" de
la Library of Congress US (autre exemple), on penchera pour un système genre
norme ISO (pour les langues indiennes, il n'y en a pas beaucoup
d'autres...). Pour un article du _Parisien libéré, usez des graphies du
_Petit Larousse_. Vieux débat.

> P. A.
> 
>