Archive Liste Typographie
Message : [typo] pollution diurne

(Thierry Bouche) - Vendredi 07 Mars 2008
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    [typo] pollution diurne
Date:    Fri, 7 Mar 2008 17:16:59 +0100
From:    Thierry Bouche <thierry.bouche@xxxxxxxxxxxxxxx>

Bonjour,

Le vendredi 7 mars 2008, vers 15:41:24, Eric Angelini écrivit :


>> des gens peuvent polluer l'internet avec des documents
>> qui ne méritent pas ce nom.

E> ... il me semble que lesdits gens ont seulement placé des
E> documents sur une machine accessible à d'autres. 

hum, on est assez loin des thématiques de la liste, si ce n'est qu'on
est en plein dans les aléas de l'édition électronique (de la correction
Google, comme il y a les exposés Wikipédia dans les salles de classe, à
l'OCR sauvage sans oublier le référencement pour Googler la bougle).

Ces gens (Springer) numérisent en masse pour augmenter le poids de leur
offre commerciale en bouquet (big deal). Comme ils croient que la
littérature scientifique (leur métier) est aujourd'hui entièrement
anglophone (à moins qu'ils ne croient que seuls les articles en anglais
ont une valeur commerciale), ils passent un OCR réglé sur anglais sur
tous les articles, y compris assez anciens, y compris dans les
domaines qui ne sont toujours pas monolingues et ne l'étaient vraiment
pas naguère. Tout ce contenu devrait être invisible sur Google,
puisqu'il est payant (et très cher !), mais pour rabattre les clients,
on n'a rien de mieux aujourd'hui que la technique de référencement qui
consiste à passer le texte à Google et le vendre aux autres.

Il n'y a donc là personne qui a « placé des documents sur une machine
accessible » mais un gros appétit pour les sous, et un grand mépris
pour ceux qui sont sensés les fournir.

M'enfin, ce que je voulais juste montrer, c'est que le corpus
« étudié » lors d'une recherche Google n'est probablement pas ce que
l'on a envie d'interroger quand on se pose une question de langue.
Penser aussi aux pages dynamiques des sites marchands qui essaient
d'attraper toutes les requêtes des internautes, écriture texto et fôtes
comprises.

Comme le faisait remarquer Jean-Denis Rondinet il n'y a pas si
longtemps, le site officiel de l´administration Bush ne savait pas
lui-même comment s'épelle Condol(e)ez(z)a Rice : trois façons
différentes de l´écrire.

Vivement lundi !

Th.