24 oct 2007

Modifié le:

Par eogez

3 commentaires »

Nombre de mots: 418

Catégorie: Moteurs de recherche

, , ,

Partager

EasyLinkr - Un moyen simple de partager des liens!

Liens

Adresse TinyUrl de l'article:

http://tinyurl.com/moqqhw

Url du trackback

Recherche

Similaires

  • Confiance aveugle et approximations des moteurs de recherche
  • Confiance aveugle et approximations des moteurs de recherche
  • Faites des recherches depuis votre messagerie instantanée
  • Confiance aveugle et approximations des moteurs de recherche

Confiance aveugle et approximations des moteurs de recherche

Ce post fait suite à celui que j’ai publié sur la progression de Live Search où je donnais les résultats obtenus pour « savoirs en réseau » par différents moteurs de recherche. Sur le moment, rien de choquant, quoiqu’un peu surprenant : Google renvoie énormément de résultats pour l’expression ! Jean-Michel (merci à lui) m’a justement fait remarquer que c’était un peu étrange. Et on y regardant de plus prêt, on réalise qu’il ne faut pas trop se fier au nombre de résultats annoncés. D’ailleurs, Google n’utilise t’il pas « environ » ? J’ai mené ma petite enquête et me suis rendue compte que je n’étais pas la première à faire ce genre de constatation (voir les liens mis plus bas), au contraire. Ce n’est pas grave d’ailleurs. Mieux vaut tard que jamais !

La conclusion c’est que le nombre de documents indiqués par les moteurs de recherche et répondant à une demande n’est qu’une approximation et qu’aujourd’hui, bon nombre de moteurs de recherche procèdent ainsi, certains étant plus fiables que d’autres. Les moteurs de recherche n’affichent en fait que le nombre maximal de résultats, et tant pis si le nombre global atteint plusieurs millions. En outre, on peut remarquer que le nombre de réponses varie d’une journée à l’autre. Aujourd’hui, sur Google, la requête « savoirs en réseau » donne 13 400 résultats (contre 14 200 hier). Le comportement de Google est également incompréhensible sur d’autres aspects. Il suffit de taper « carburants » puis carburants et vous obtiendrez un nombre de résultats différents : 2 900 000 contre 2 860 000. Même chose si votre mot commence ou non par une majuscule : pour « Carburants » on obtient 2 850 000 réponses alors qu’on en obtient 2 900 000 pour « carburants ».

Quelles raisons à cette variabilité et à ces approximations ? En voici quelques unes trouvées ici et là :
- raisons techniques : garder de la charge machine ou interrogation de différents centres de données, prise en compte des informations au moment de l’indexation (lecture ou non des méta-données), etc.
- raisons concurrentielles : il faut montrer qu’on peut faire mieux que les concurrents.

Du coup, on peut se demander : pourquoi afficher une donnée qui, au final, n’est pas exacte ? Pour terminer, j’emettrais la même crainte que Béatrice Foenix-Riou (NetSources) : une confiance aveugle dans les moteurs de recherche nous empêche d’en voir leurs limites et leur faillabilité. La preuve avec mon post d’hier.

Pour en savoir plus :

- Peut-on se fier à Google ? Enquête sur des résultats étranges (NetSources)
- Web: Comptes bidons chez Google ? (Technologies du langage, Jean Véronis)
- Abondance de pages nuit parfois… (Abondance)

Abonnez-vous !

Vous avez aimé cet article ?
Recevez les news par mail.

                                                  

Partagez cet article !

Partager sur Del.cio.usPartager sur TechnoratiPartager sur TwitterPartager sur Facebook
Le flux RSS des articles Le flux RSS des commentaires

3 commentaires pour cet article

0 Trackbacks pour cet article

Laisser un commentaire