Archive Liste Typographie
Message : [ [typo] Comment écrire en diverses langues indiennes]

(Patrick Andries) - Mardi 27 Janvier 2004
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    [ [typo] Comment écrire en diverses langues indiennes]
Date:    Mon, 26 Jan 2004 21:05:07 -0500
From:    Patrick Andries <hapax@xxxxxxxxxxx>


Jean-François Roberts a écrit :

Si je comprends bien, vous cherchez non pas des polices, ni des
translittérations, mais des répertoires de termes géographiques (ou les
incluant) dans les langues d'origine.

Pour survoler le reste : pour les polices, voir le site indiqué par J.
André. Encore faut-il avoir les ressources système pour... manipuler
lesdites polices. Ce qui n'est pas toujours évident : le système Mac, par
exemple, ne traite que 4 des 10 principales écritures indiennes ;


[PA] Normalement, si ça marche pour 4 (je suppose que la dévanagari est dedans) ça devrait marcher pour les 6 autres pourvu qu'on ait les polices, ce sont les mêmes principes de rendu qui régissent toutes ces langues (dans le système ISCII, il suffisait parfois d'une simple changement de police pour que ce qui était du télougou apparaisse du kannara (les mêmes lettres des deux alphabets se trouvant aux mêmes positions).

Je n'ai pas essayé dans Windows récemment, mais avec de police adéquate pour chaque écriture, vous devriez être bon.

Pour comment ça marche en dedans voir : http://pages.infinit.net/hapax/pdf/Chapitre-10.pdf

Éric Muller qui lit cette liste a fait quelques essais sur les langues brahmi : http://www.rawbw.com/~emuller/unicode/ (malheureusement le texte est en anglais)

Il pourra sans doute donner plus de détails.


pour le
reste - y compris le tibétain, par exemple, et les écritures du Sud-Est
asiatique, qui suivent le même principe -, faut se procurer des ressources
supplémentaires (ça se trouve aussi). Attention : certaines langues du
sous-continent (sindhi, par exemple) existent actuellement en double
écriture : "indienne" et "arabe". Le choix de l'une ou de l'autre est...
éminemment politique, dirons-nous. (Se méfier de retours de bâton
inattendus. Historiquement, *toutes* les langues indiennes ont fait l'objet de transcriptions en écriture arabe, du fait de l'empire moghol. On sait que l'urdu, qui s'écrit en caractères arabes, est au hindi ce que le croate est
au serbe...)
Enfin, presque on dit qu'historiquement l'*o*urd*o*u (en français) et l'hindi forme l'hindoustani commun mais dans les faits il y a bien plus qu'une différence de graphie.

Depuis la partition, les différences ont tendance à s'accuser, surtout au niveau de la création néologique. L'hindi tend de plus en plus à avoir recours au sanscrit pour former de nouveaux mots. D'un autre côté, l'ourdou aurait tendance à se "purifier" et emprunte largement au persan. Ce fond persan, lui-même largement bardé d'emprunts à l'arabe, est resté très longtemps productif en hindoustani sous la domination moghole et britannique. Aujourd'hui encore, il existe toute une kyrielle de doublets en hindi, un mot sera d'origine sanscrite et l'autre d'origine arabo-persane. En général, le hindi utilisera le terme sanscrit quand le registre de langue s'élève.

Pour prendre un exemple concret, le "livre" se dit soit /kitâb/ (origine arabe), soit /poustak/ (origine sanscrite). Le premier est beaucoup plus courant, mais on parlera toujours de la bibliothèque en disant /poustakâlaï/.* *


Le codage Unicode, soit dit en passant, ne répond que bien imparfaitement au
problème : contrairement au grec classique ou à l'écriture arabe,


Les formes de présentations de l'arabe sont déconseillées (fruit d'un compromis typique de l'ISO, si je me souviens bien, pour faire plaisir à l'Égypte), toutes les formes de présentations grecques ne sont pas codées et à dessein (il existe des centaines de ligatures du Grec du Roy qui ne seront jamais codés).

en effet,
on n'a jamais ajouté les "formes de présentation" pour les écritures
indiennes (caractères composés avec diacritiques indiquant la vocalisation
de la voyelle, ou la présence d'un "r" antérieur ou postérieur, etc. -
soit... quelques *dizaines de milliers* de combinaisons possibles pour
chaque écriture ! Et sans parler des "caractères composés" issus de la
combinaison de deux - voire trois - caractères, pour indiquer les
combinaisons consonantiques... plusieurs centaines à chaque fois, qui se
vocalisent à leur tour, etc. ad nauseam).  Les informatitiens indiens
peinent à se mettre d'accord sur les standards adéquats (on les comprend !).

[PA] Pour Unicode, c'est une question de polices (et de préférence personnelle pour savoir combien de conjointes combiner). À nouveau la lecture de http://pages.infinit.net/hapax/pdf/Chapitre-10.pdf s'impose.

Pour les translittérations, il y a désormais une norme ISO (également
adoptée en France). Mais ça suppose d'avoir accès à des polices spéciales
pour les diacritiques.
[PA] Les polices à diacritiques sont présentes sur quasi toutes les machines (Windows cf Arial Unicode MS, Sans Lucida Unicode), mais je ferais attention à ce que vous transcrivez de la sorte. Pour les noms de tous les jours (noms des langues, des grandes villes, des divinités) dans un texte en français, utiliser une norme ISO (il y en a tant ! et certaines contradictoires) pourrait paraître très pédant [en tout cas moi je ne supporte pas] et peu compréhensible. Utiliser aussi les formes traditionnelles françaises si vous vous adressez à des francophones. Bref, il vaut mieux Pondichéry que Puduchcherry (et ici je laisse tomber lesdits diacritiques pour la seconde forme!)

P. A.