Je lisais un article sur le blog d'Exalead, et je me suis rendu compte que pour le blog officiel d'un moteur de recherche, la balise META destinées aux robots est assez singulière :

meta name="robots" content="noindex,nofollow"

Autrement dit : interdiction aux robots d'indexer les pages et de suivre les liens.

Et il faut reconnaitre que cela fonctionne plutôt bien.

Sur Google, seuls les flux RSS et RDF sont indexés : http://www.google.com/search?q=site:blog.exalead.fr

Sur Yahoo!, la home uniquement : http://siteexplorer.search.yahoo.com/search?p=http://blog.exalead.fr

Exalead etant le meilleur élève : http://www.exalead.com/search/results?q=site:blog.exalead.fr

et ils respectent en cela leurs engagements : Le crawler d’Exalead respecte-t-il les règles d'écriture du fichier robots.txt ou celles des tags robots META ?

Maintenant, la question c'est pourquoi ? Peut-être y a t-il une bonne raison pour une telle mesure, mais j'avoue que je ne voie pas.

En tous cas, pour ceux voulant se positionner sur la requête "blog officiel exalead", la voie est libre chez Google, Ask et Exalead mais cela sera plus dur avec Yahoo! et Live

Je pensais le rajouter dans mon Blogroll, (un oubli de ma part) avec les autres blogs officiels des différent moteurs de recherche, mais là j'ai presque des scrupules, tiennent-ils vraiment à être découvert ?