Modification des « conseils aux webmasters » de Google pour une réduction du spamdexing ?
Le dimanche 11 mars 2007 à 02:34 :: Google :: #91
Matt Cutts dans son dernier billet nous apprend que la page des « conseils aux webmasters » (Webmasters Guidelines) de Google vient d’être légèrement modifiée.
Un ligne a été rajoutée (dans la version originale seulement pour le moment, la version française n’ayant pas encore été mise à jour) qui précise :
Use robots.txt to prevent crawling of search results pages or other auto-generated pages that don't add much value for users coming from search engines
Utilisez le fichier robots.txt pour empêcher l’indexation des résultats de recherche ou autres pages auto-générées qui n’apportent rien aux utilisateurs en provenance des moteurs de recherche.
Cette décision a été prise après que quelqu’un sur le Groupe d’aide aux webmasters de Google ait posé la question de la position officielle de Google sur le sujet et fait remarquer que les résultats de recherche de YouTube été indexés.
A cette question, Vanessa Fox a répondu :
Typically, web search results don’t add value to users, and since our core goal is to provide the best search results possible, we generally exclude search results from our web search index. (Not all URLs that contains things like “/results” or “/search” are search results, of course.)
I’ll take a look at the YouTube example. Thanks.
En général, les résultats de recherche n’apportent rien aux utilisateurs, et puisque notre but est de fournir les meilleurs résultats possible, nous excluons généralement les résultats de recherche de notre index. (Toutes les URLs contenant des termes commes « /results » ou « /search » ne sont bien sûr pas nécessairement des résultats de recherche)
Je vais jeter un œil au cas de YouTube. Merci.
Et donc, suite à cet échange, YouTube a modifié son fichier robots.txt en conséquence et la modification a été apportée aux consignes pour webmasters de Google.
Il est en effet courant de trouver dans les résultats de Google (et des autres moteurs) des pages de recherche indexées qui ne présentent aucun intérêt pour les internautes à la recherche d’informations.
Il été déjà précisé dans ces « conseils aux webmasters » :
Ne créez pas plusieurs pages, sous-domaines ou domaines présentant un contenu en grande partie identique.
et
Évitez les pages satellites ("doorway") créées exclusivement pour les moteurs de recherche ou d'autres solutions, [...] sans véritable contenu informatif.
Avec pour conséquences :
Si un site ne répond pas à nos conseils en matière de qualité, son inclusion dans notre index peut-ętre bloquée
Mais ces consignes visent expressément les pratiques douteuses, faites en connaissance de cause par les webmasters.
Certains sont en effet spécialistes des pages de recherches données à manger aux moteurs, avec plusieurs dizaines de milliers de pages indexées pour certains domaines.
Lorsque vous visitez ces pages, tout ce que l’on voit est une searchbox, un message du type : « pas de résultats pour cette recherche » et surtout des publicités AdSense (sinon cela n’a aucun intérêt).
Certains poussent le vice jusqu’à placer des liens générés à la volée vers la même recherche effectuée sur un autre de leur site…
Google se réserve donc déjà le droit de supprimer de l’index les sites utilisant ces techniques même si dans les faits, il ne semble pas très motivé.
Aujourd’hui, dans cette modification des consignes, il va plus loin, il ne demande plus simplement aux webmasters de ne pas pratiquer le spamdexing, il leur demande d’être pro actif dans l’amélioration de la qualité des résultats.
Google a déjà cette démarche pour ces propres sites, on ne trouve pas, en principe, de résultats de recherche effectuées sur Froogle ou sur d’autres sites lui appartenant.
Pour finir son billet, Matt Cutts se félicite de cette décision :
[...] but it’s still good to clarify that Google does reserve the right to take action to reduce search results [...] in our own search results.
[...] mais il est bon de clarifier le fait que Google se réserve le droit de prendre des mesures pour réduire les resultats de recherche [...] dans nos propres résultats.
Et plus loin :
it’s also good to make sure that site owners get clear guidance.
iIl est bon également de s’assurer que les propriétaires de sites aient des ‘instructions’ claires.
Bon, moi je veux bien, dans l’absolu il est certain que si tous les webmasters pouvaient appliquer ces directives, cela serait une bonne chose.
Mais j’imagine que beaucoup d’entre eux n’ont aucunement conscience du ‘problème’ que cela peut poser aux moteurs, et étant donné que Google semble déjà avoir du mal à pénaliser les sites pratiquant sciemment l’indexation de pages de recherche, je vois mal comment il pourrait « sévir » envers ceux qui se sont contenté d’installer un blog DotClear, ou un autre CMS, et qui ne savent peut être même pas qu’ils génèrent des pages qui ne devraient pas être indexées qu’ils peuvent (et désormais devraient) interdire via leur robots.txt.
Il me semblait qu’il y avait des mesures plus urgentes à prendre chez Google pour améliorer la qualité de leur index.
Mais si vous souhaitez néanmoins appliquer ces consignes, je vous renvoie sur mon billet consacré au fichier robots.txt qui pourra vous fournir quelques indications et liens utiles.
dimanche 11 mars 2007 | 02:34, Sergi
Blogmarks
Delicious
Scoopeo
Fuzz
Technorati
Mister Wong
English
Commentaires
Aucun commentaire pour le moment.
Ajouter un commentaire