<link rel="canonical" href="http://www.example.com" /> pour spécifier l'URL canonique d'une page et ainsi lutter contre la duplication de contenu.

Une même page peut souvent être atteinte par plusieurs URL, la page d'une boutique permettant un tri par date, ou une adresse comprenant un marqueur pour analytics par exemple du type : ?utm_source= ou &utm_campaign . Et il existe autant de liens potentiels vers cette page qu'il y a de variantes d'URL.

Le but est donc de définir une URL canonique en indiquant la page qui devra être considérée comme la plus légitime, à crawler et à indexer, et de consolider tous ces liens différents vers elle.

En utilisant ce tag : <link rel="canonical" href="http://www.example.com" /> dans la balise HEAD d'une page, l'effet sera identique à une redirection 301. Google indique que toutes les propriétés additionnelles de l'URL redirigé, comme le PageRank et autres signaux seront transférés vers cet URL canonique (Yahoo! précise aussi un traitement identique à une 301 mais ne parle évidemment pas de PageRank).

Quelques détails techniques et considérations :

  • Le tag rel="canonical" n'est pas une directive, il sera considéré comme une suggestion "qui sera fortement suivit" mais il sera néanmoins évalué de manière algorithmique afin d'éviter de le prendre en compte en cas d'erreur d'implémentation : redirection vers une page inexistante, abus (redirection vers des pages considérées comme trop différentes de la page source)...
  • le lien inclut dans le tag peut-être absolu ou relatif
  • La redirection est limitée au domaine ou sous-domaine, mais le lien ne peut pointer vers un domaine extérieur
  • La redirection est transitive : Si l'URL A tag B comme canonique, et B tag C comme canonique, C sera considéré comme l'URL canonique de A et B
  • Le type de redirection s'apparente à une 301 dans la prise en compte des propriétés et facteurs associés à l'URL contenant le tag, ils sont transmis à l'URL défini comme canonique

Le but originel est d'aider à la limitation du contenu dupliqué, l'idée est donc de l'utiliser uniquement pour des pages au contenu très similaire, et pas de rediriger des pages qui n'ont que peu à voir les unes avec les autres.

L'usage de ce nouveau tag est donc a priori prévu pour les cas ou :

  • le contenu des pages est similaire ou très proche
  • l'URL défini comme canonique est plus courte (ou avec des paramètres plus facilement compréhensibles par les moteurs) que celle contenant le tag

Ce nouvel attribut n'a pas pour but de (et ne peut pas) remplacer une bonne structure et normalisation des URL d'un site, mais il peut s'avérer pratique dans certaines situations et ça rendra service.

C'est bon à prendre.