Archive Liste Typographie
Message : Classement des noms (suite)

(Foucauld Perotin) - Mercredi 30 Mai 2001
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Classement des noms (suite)
Date:    Wed, 30 May 01 17:53:16 +0200
From:    Foucauld Perotin <fp.listes@xxxxxxxxxxx>

Bonjour,

Je reviens, une fois de plus, sur la question du classement des noms
de personnes.

Je voudrais me décider à programmer un système de tri conforme aux
normes canadienne ou ISO d'Alain LaBonté. Rappelons-en le principe,
en résumé :
- on ne tient pas compte, dans un premier temps, des accents ni des
  espaces, apostrophes, etc., mais seulement de l'alphabet ;
- les quasi-homographes sont classés entre eux selon des algorithmes
  précis.

Alain LaBonté précisait aussi, le 25 janvier 2000 :
>typiquement, dans un programme de tri digne de ce nom, le classement se
>fait par champs distincts dans des enregistrements structurés (nom à part,
>prénom à part, etc.), le tri s'effectuant sur chaque champ

En France, il faut trois champs pour traiter sérieusement des noms que
l'on veut pouvoir classer : nom, prénom et particule. On ne renseigne
le champ « particule » que quand celle-ci ne détermine pas le classement.

Par exemple,

       Nom : La Fontaine
    Prénom : Jean
 Particule : de

Et cet enregistrement sera classé à « lafontaine ».


Jusqu'ici, je ne me suis pas beaucoup cassé la tête : je classe
d'après les champs « nom » et « prénom », sans tenir compte des
accents ni des signes comme les espaces, apostrophes, etc. Ainsi mes
classements sont « assez corrects », en tout cas meilleurs que la
moyenne des classements informatiques, sauf pour les quasi-homographes,
dont je ne me suis jamais occupé sérieusement.

Mon prochain programme de tri devrait classer les quasi-homographes
correctement, grâce à la clé de tri décrite par Alain LaBonté, mais
je ne suis pas sûr de ce que je dois faire avec les particules.

Je crois que le bonne approche serait d'appliquer un tri qui prendrait
en compte les trois champs dans l'ordre suivant :

  nom (tri LaBonté) / particule / prénom (tri LaBonté)

Ce qui donnerait, par exemple :

  Machin (Albert)
  Machin (Bertrand)
  Machin (Albert de)
  Machin (Pierre de)
  Mâchin (Jules)
  Mâchin (Albert de)

Est-ce-que cet ordre vous paraît correct ? Sinon, quel autre ordre
serait le bon pour cette liste ?


Foucauld Pérotin