Une balise canonical (rajoutée au code HTML de la page) sert à indiquer à un moteur de recherche si une page web reprend le contenu d’un autre document. Il fait référence à une ressource standard – l’URL canonique – pour les sites Web avec le même contenu ou un contenu similaire. Si une URL canonique est correctement marquée, les moteurs de recherche indexeront uniquement cette source, ce qui signifie que les problèmes de contenu en double peuvent être évités. Le contenu dupliqué a un effet négatif sur le référencement, car il n’apporte pas de valeur ajoutée pour l’internaute. Un vérificateur de contenu en double peut être utilisé pour détecter le contenu en double.
Exemples d’URL canoniques
En général, lors de l’indication d’une URL canonique, Google recommande des URL absolues, c’est-à-dire l’URL entière, y compris le protocole. Les deux URL suivantes ont le même contenu.
https://www.rankwell.com/example.html
https://www.rankwell.com/examplepage/?session_id=xyz.html
Le premier est la ressource standard, et le second est une session couramment utilisée par les boutiques en ligne afin de pouvoir stocker des données relatives à l’utilisateur comme par exemple, des articles dans le panier. Comme la première URL est plus importante, cela devrait devenir la version canonique, et la balise canonique devrait être intégrée dans l’élément head de la deuxième page pour faire référence à la première page. Cela indiquera à Google et aux autres moteurs de recherche que la première URL est plus importante et qu’elle doit être explorée et indexée dans les SERPs.
La balise canonique est placée dans les métadonnées de la deuxième URL. Cela ressemble à ceci:
<link rel = « canonical » href = « https://www.rankwell.com/examplepage.html »> />