Archive Liste Typographie
Message : Re: procédé photomécanique

(Thierry Bouche) - Mardi 02 Octobre 2001
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: procédé photomécanique
Date:    Tue, 2 Oct 2001 18:48:18 +0200 (MET DST)
From:    Thierry Bouche <Thierry.Bouche@xxxxxxxxxxxxxxx>

Concernant « procédé  photomécanique », Jean-Louis Chaumeil écrit : «
» j'ai acheté un livre qui est pénible à lire on dirait une photocopie de
» mauvaise qualité d'un livre
» il est précisé à la fin du livre:  
» "ouvrage reproduit par procédé photomécanique
» impression Bussière camedan imprimeries"
» donc cela semble bien le scannage d'un livre et son impression tel quel
» (je comprends mieux le nom de la collection: tel)

je crois que c'est la raison de l'existence de ces « faux poches » que
sont les livres de L'imaginaire, Tel, les cahiers rouges, etc. : il
est devenu possible de reprendre un livre par photocopie pour un coût
moindre que celui d'une nouvelle édition (on réduit le format au prix
des marges, ou faible réduction des pages). Ce choix doit être un peu
daté (impression numérique pas très intéressante pour les tirages,
coûts de l'OCR/saisie à la baisse). D'ailleurs, même chez Tel, on voit
que la composition frappe de plus en plus souvent (avec les
conséquences funestes que cela peut avoir pour certains accents
d'italiques...). 

» n'y a-t-il pas des méthodes plus efficaces de reproduire un livre sans
» avoir à tout recomposer?

En fait, sur ce marché, il y a deux « technologies » qui
s'affrontent :  d'une part des OCR de plus en plus performants qui
reconnaissent la structure, jusqu'à la police utilisée et qui,
combinés avec un système interactif de validation, permettent
de tourner dans les 1/10 000 car. erroné max pour une intervention
humaine minimale. D'autre part la double (parfois triple !) saisie :
on fait ressaisir le texte par deux opérateurs de façon indépendante,
on les compare pour traiter les points de discordance. À la surprise
générale, le deux techniques ont un coût voisin : les coûts de
développement informatique s'équilibrant avec les salaires réduits de
la main d'oeuvre très souvent délocalisée...

C'est donc tout de même de la « recomposition », mais dont les coûts
sont tombés suffisament bas pour redevenir compétitifs...

» ou un programme qui reconnaitrait le tracé des lettres et les
» nettoierait pour éliminer les imperfections? 

il existe des recherches sur ce sujet, qui relève de la reconnaissance 
des formes plutôt que des caractères. D'une certaine façon, c'est le
paradigme d'un format comme DjVu, qu'il ne faudrait pas pousser
beaucoup pour en obtenir ce que vous dites : il crée en fait pour
chaque document une « police » dont les glyphes sont toutes les formes 
redondantes, et ne stocke que les variations par rapport à la forme de 
base. Je m'explique probablement mal (et puis DjVu est conçu pour la
compression et non pour la reconnaissance, mais...) : imaginons qu'on
ait un bouquin imprimé au plomb dans lequel chaque_e_aura donc une
forme similaire mais pas identique. DjVu va choisir le_e_le plus moyen 
(ou en synthétiser un, mais je ne crois pas qu'il fonctionne comme ça) 
et restituer fidèlement le document en imprimant à chaque_e_qu'il aura 
reconnu ce_e_(dont la forme n'est donc stockée qu'une seule fois dans
l'image) plus les quelques pixels noirs ou blancs qu'il faut pour
revenir à l'image d'origine. On voit évidemment l'intérêt pour
compresser, mais on pourrait aussi utiliser ça pour simplifier l'image 
de façon intelligente, en imprimant toujours le même e.

j'ai vu à Lyon la démo d'un programme de ce type qui a été développé
pour l'acquisition d'un fonds de livres du XVIe siècle. Dans ce cas,
les formes reconnues ne sont pas toujours des lettres (vus les aléas
d'encrage, un _a_ peut être reconnu comme une combinaison de plusieurs
formes de base, on est donc loin de l'ocr, mais l'image restituée est
fidèle) : on peut afficher uniquement les formes de base, sans les
corrections, on a alors quelque chose qui ressemble plus à une édition 
moderne, puisque toutes les formes similaires sont rendues
identiques. Néanmoins, sur l'exemple dont je parle, un _u_ pouvait
devenir un _n_, la correction étant finalement minime...

-- 
Thierry Bouche