Archive Liste Typographie
Message : Re: [typo] coordon(nateur)iteur

(Serge Bourdin) - Jeudi 06 Mars 2008
Navigation par date [ Précédent    Index    Suivant ]
Navigation par sujet [ Précédent    Index    Suivant ]

Subject:    Re: [typo] coordon(nateur)iteur
Date:    Thu, 6 Mar 2008 20:50:14 +0100
From:    Serge Bourdin <serge.bourdin@xxxxxxxxx>

On en parlait ici même il y a un peu plus d'un an. En fait, Google extrapole ses résultats à une masse de pages repertoriées mais non véritablement indexées.

Si l'on cherche à comparer des des quantités d'occurrences, il vaut mieux soit utiliser Yahoo, soit tromper Google avec un fausse requête booléenne (chapeau OR chapeau). Mais de toutes façons seules de grosses différences d'ordre de grandeur peuvent être significatives.

Jean Véronis a toute une série de billets là-dessus :

http://aixtal.blogspot.com/2005/02/web-le-mystre-des-pages-manquantes- de.html
http://aixtal.blogspot.com/2005/01/web-google-perd-la-boole.html
http://aixtal.blogspot.com/2005/01/web-comptes-bidons-chez-google.html

ou

http://aixtal.blogspot.com/2006/07/moteurs-folles-duplications-1.html
http://aixtal.blogspot.com/2005/08/yahoo-19-milliards-de-pages.html

Le 6 mars 08 à 16:07, Eric Angelini a écrit :


T>> Je n'accorde pas une si grande importance aux nombres d'occurrences
T>> sur google.

[TB]:
et vous faites bien : ils sont faux.

---

... Requête simple (sans guillemets) n°1 :

Résultats 1 - 10 sur un total d'environ 349.000
 pour melon chapeau (0,28 secondes)

... requête simple (sans guillemets) n°1 :

Résultats 1 - 10 sur un total d'environ 215.000
 pour chapeau melon (0,13 secondes)

... or Google est censé me renvoyer un nombre
d'occurrences identique... (puisque ce sont TOUS les
documents qui contiennent à la fois le mot chapeau ET
le mot melon, quel que soit leur ordre d'apparition
dans ledit document)
[ou alors j'ai rien compris]

à+
É.





-----Message d'origine-----
De : Thierry Bouche [mailto:thierry.bouche@xxxxxxxxxxxxxxx]
Envoyé : jeudi 6 mars 2008 15:07
À : typographie@xxxxxxxxxxxxxxx
Objet : Re: [typo] coordon(nateur)iteur

Bonjour,

Le mardi 26 février 2008, vers 18:22:44, Thibaud écrivit :

T> Jean-Luc BLARY a écrit:
Sur Google :
Coordonnateur : 820 000
Coordinateur : 1 180 000

Ce qui contredit le texte ci-dessous.

T> Je n'accorde pas une si grande importance aux nombres d'occurrences
T> sur google.

et vous faites bien : ils sont faux.

(pour les lecteurs à tendance algorithmique, ils sont obtenus à la
première ou deuxième itération d'un calcul approché, qui suffit en
général pour donner les mêmes résultats sur la première page de réponse
que la formule exacte : seul les 10-15 premiers résultats sont connus
avec une certaine sûreté au moment où ces informations globales
farfelues sont affichées. Pour s'en convaincre, il suffit de regarder
le nombre de fois où la première page de réponses annonce plusieurs
pages suivantes, qui fondent dès qu'on demande à les voir.)


D'autre part, quand bien même seraient-ils justes, il faudrait savoir
quel corpus ils décrivent. Combien de pages de blog, forums, listes
comme celle-ci sont indexées dans le lot ? Est-ce que l'on testerait
les usages soutenus ou relâchés ? (or, c'est précisément, me
semble-t-il, cette question que l'on se posait !)

Bye bye,
Th.