Deux nouveautés dans Google Outils pour Webmasters
Le jeudi 19 avril 2007 à 03:39 :: Google :: #106
Elles ont été annoncées sur le blog officiel de Google Webmaster Tools, ici et là .
- Un outil de suppression de pages de l’index (ou de la version en cache)
- Une amélioration des informations fournies concernant les ancres des liens entrants
L’outil de suppression de pages est disponible dans l’onglet diagnostic des Outils Google pour Webmasters.
Google suit en cela l’initiative qu’avait prise Yahoo! il y a quelques semaines en proposant également un outil de suppression d’URLs.

Plusieurs possibilités existent selon les cas :
Suppression d’URLs individuelles.
Afin que la demande aboutisse, au moins une de ces conditions est nécessaire :
- Le code retourné par le serveur pour cet page est soit 404 (introuvable), soit 410 (supprimée) — liste des codes HTTP
- L’URL à supprimer est interdite par le fichier robots.txt
- L’URL à supprimer est interdite par le biais de la balise META robots
Il est possible de supprimer jusqu’à 100 URLs individuelles en une seule fois.
Suppression d’un répertoire.
Toutes les URLs contenues dans ce répertoire seront supprimées. Là encore, il suffit de saisir l’URL du répertoire à supprimer et le fichier robots.txt doit contenir une directive d’interdiction pour Googlebot du type :
User-agent: Googlebot Disallow: /dossier
Suppression d’un site entier de l’index
On procède de la même façon après avoir placé un fichier robots.txt interdisant l’accès au site.
Suppression des pages en cache
Deux options possibles :
Inclure la balise META robots NOARCHIVE
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
dans la page à supprimer avant que la demande de désindexation ne soit effectuée.
Si une page a été mise en cache, que la version cachée n’est pas la plus récente et que l’on souhaite voir cette version disparaître, il est alors possible de préciser une série de mots qui ne sont plus présents dans la page actuelle.
Si lors de son passage, le robot constate qu’effectivement, le contenu a été modifié, la page en cache sera supprimée.
Au bout de 6 mois, la nouvelle page, si elle ne contient pas la balise NOARCHIVE, verra son contenu de nouveau mis en cache automatiquement.
Après qu’une demande de suppression ait été faite, il est possible de demander une ré inclusion de ou des URLs. Il suffit de modifier soit les META soit le fichier robots.txt qui bloque l’indexation et de faire une demande de ré inclusion. (toujours via Google Webmasters Tools)
La suppression d’une URL de l’index a une durée par défaut de 6 mois.
Si à l’issue de cette période, la ou les pages ne sont pas bloquées par le fichier robots.txt ou par les balises META, alors le contenu sera de nouveau automatiquement soit indexé soit mis en cache.
Il est également possible de demander la suppression de contenu qui ne nous appartient pas. On peut demander à Google de supprimer de son index des pages présentes sur des sites qui ne sont pas les notres.
En fait cette possibilité a toujours existée, via ce formulaire : https://www.google.com/webmasters/tools/removals
Les raisons pouvant justifier ce type de demandes sont de 2 ordres :
Le site diffuse des informations qui vous sont personnelles :
- Votre numéro d'identifiant administratif ou de sécurité sociale
- Votre numéro de carte de paiement ou de compte bancaire
- Image de votre signature
- Contenu explicite non conforme aux consignes de Google et contenant vos informations personnelles
Ou des informations dont vous estimez qu’elles devraient être bloquées lors d’une recherche avec la fonction « safe search » activée (filtrage des résultats à contenu adulte)
Enfin, après une demande de suppression (pour les URLs de votre site uniquement), il est possible de connaître le statut de cette demande dans la console des outils pour webmasters, la demande étant soit « en attente », « refusée » ou « acceptée ».
La deuxième nouveauté se trouve dans l’onglet « statistiques », dans la rubrique « analyse des pages ».
Google fournissait déjà les phrases des ancres de liens pointant vers son site, cela a été amélioré de plusieurs façon :
- Le nombre de phrases affichées est désormais de 200
- Elles sont regroupés par variations, majuscules, lettres accentuées (voir capture)
- L’ancienne version de l’outil qui fournissait des mots individuels plutôt que des phrases complètes existe de nouveau
- Et le nombre de mots contenu dans la page et dans les ancres a été augmenté à 100.

jeudi 19 avril 2007 | 03:39, Sergi
Blogmarks
Delicious
Scoopeo
Fuzz
Technorati
Mister Wong
English
Commentaires
Aucun commentaire pour le moment.
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.