publié le 13 sept. 2021
Balise Canonical

Définition SEO de la Balise Canonical

La balise canonical ou tag canonique est un élément du code HTML qui permet de signaler aux moteurs de recherche qu'un document web propose du contenu dupliqué, repris d'une autre page. C'est l'une des principales balises que Google utilise pour évaluer la qualité des sites, afin d'améliorer leur référencement naturel SEO. Que comprendre exactement par balise canonical ? Comment fonctionne-t-elle ? Et pourquoi l'utiliser sur votre site internet ? C'est ce que nous vous proposons de découvrir à travers cet article.

Définition : Balise Canonical

Pour un débutant, le terme « balise canonical » peut ressembler à du chinois. Pourtant, derrière ce groupe de mots se cache un concept assez simple. Il s'agit en effet d'une balise HTML, au même titre que les balises title et meta description, que l'on utilise dans le header des fichiers sources d'un site.

Qu'est-ce que la Balise Canonical ?

Pour mieux comprendre le concept de la balise canonical, prenons un exemple. Imaginons que vous disposez de plusieurs documents similaires sur votre site web. Il s'agit peut-être de différentes versions d'un même produit dans votre boutique en ligne. Au moment d'indexer ces pages, les algorithmes des moteurs risquent de conclure qu'il s'agit d'auto-plagiat.

C'est là qu'intervient la balise canonical. Elle permet d'indiquer aux bots quelle est l'URL canonique, celle qui doit être prise en compte dans les résultats de recherche. C'est l'une des trois solutions les plus efficaces pour résoudre un problème de doublon de contenu.

Comment fonctionne la balise canonical ?

L'objectif de la balise canonique, c'est de permettre aux algorithmes des moteurs de déterminer quelle est la page référente, parmi un ensemble d'URLs proposant des informations similaires. Pour atteindre cet objectif, le tag canonique doit suivre une sémantique ou une syntaxe bien définie :

< link rel=“canonical” href=“https://www.votre-site.com/” >

Pour comprendre comment cette balise fonctionne, admettons que deux pages A et B de votre site proposent un contenu proche. Si le document B reprend le contenu de la page A, il faudra insérer la balise suivante dans la partie Head de son code source :

< link rel=“canonical” href=“https://www.votre-site.com/url-principale-de-la-page-A/” >

La même balise devra être introduite dans le fichier HTML de la page A, pour éviter les problèmes de DUST (duplicate URL, same text).

Ainsi, vous indiquez à l'algorithme de Google qu'il s'agit d'un duplicate content à partir du document A. Ce dernier considère donc la page A comme la plus importante, celle qu'il doit indexer pour son moteur de recherche.

Pourquoi utiliser la Balise Canonical en SEO ?

L'utilité du tag canonique dans le référencement naturel n'est plus à prouver. Cette séquence de code offre en effet plusieurs avantages. Elle permet notamment :

  • D'exclure les pages identiques du processus d'indexation
  • De diminuer les risques de pénalité liés aux duplicate contents

Exclure des pages web au contenu proche

L'objectif principal des moteurs de recherches, c'est de répondre aux besoins des internautes en proposant des résultats pertinents et qualitatifs à leurs requêtes. Pour cela, leurs robots explorent la toile pour fournir à chaque intention de recherche un résultat précis selon les mots-clés utilisés. Ainsi, lorsqu'ils détectent deux contenus identiques sur le même site, les crawlers ont généralement du mal à déterminer lequel présenter aux internautes. En plus de compliquer le travail d'indexation, cela risque de consumer inutilement votre budget de crawl.

Dans ce contexte, la solution la plus efficace est de créer un tag canonique pour exclure les contenus proches de l'URL principale. Cela permet aux spiders de distinguer facilement les contenus qu'il faut rajouter à leur index pour le référencement naturel.

Diminuer les risques de pénalité liés au contenu dupliqué

Avec la mise à jour « Panda » en 2011, l'unicité et la qualité du contenu sont devenues un critère officiel de positionnement sur Google. Depuis, le géant californien pénalise les plateformes proposant des contenus trompeurs ou dupliqués, en interne comme en externe. En effet, lorsqu'il retrouve le même contenu sur différentes URLs, Google Panda tente de déterminer les pages dupliquées afin de les reléguer dans les SERPs. Le site web concerné risque donc de perdre une partie de son trafic organique et de devenir de moins en moins visible.

La balise canonical est un moyen efficace pour éviter ces risques de sanction et leurs conséquences sur le référencement naturel. Lorsqu'elle est présente dans les fichiers sources de la page référente, elle fait comprendre aux algorithmes de Google qu'un autre document de votre site propose une version très similaire du même contenu. Ce qui permet de contourner le fameux filtre Panda.

Comment utiliser la Balise Canonical ?

Votre blog ou votre site vitrine contient des pages dupliquées ? Pour indiquer les liens canoniques aux moteurs de recherche, vous avez deux options :

  • Intégrer le tag canonique dans le fichier source
  • Insérer le lien canonique dans l'entête Http

Dans les deux cas, vous devez utiliser une syntaxe bien définie et suivre une procédure adaptée. Voici comment procéder.

Intégration dans le code source HTML

Cette méthode fonctionne uniquement avec les pages HTML. Pour l'utiliser, il suffit de placer le tag canonical dans la partie Head du fichier, comme dans l'exemple suivant :

< link rel=“canonical” href=“https://www.votre-site.com/url-de-la-page-référente” >

C'est la technique la plus commune et l'une des plus faciles à utiliser. Toutefois, elle possède l'inconvénient de ralentir le chargement des pages. Cela est dû à l'utilisation du tag « link » qui rajoute des métadonnées aux fichiers HTML de chaque page concernée. Ce qui alourdit les documents et empêche un affichage rapide.

Insérer la balise rel=canonical dans l'entête HTTP

Pour aider Google à déterminer quelle URL prendre en compte lors du crawl de votre site, vous pouvez également insérer le tag rel=canonical dans l'entête Http des pages canoniques. Il s'agit ici de mettre en place une directive dans le fichier htaccess du serveur en respectant le format suivant :

rel=“canonical”

Ainsi, l'adresse de votre page canonique devient :

< https://www.votre-site.com/url-de-la-page-référente/ >; rel=canonical

L'intérêt avec cette méthode, c'est qu'elle permet de configurer des liens canoniques pour des fichiers non HTML, un document PDF par exemple. De plus, elle n'exerce aucun impact sur le temps de chargement de votre site. Par ailleurs, elle offre la possibilité de lier un nombre illimité de documents. C'est pour cette raison qu'elle est souvent recommandée par les professionnels SEO.

Utiliser des URLs absolues

Que vous ayez opté pour une intégration du tag canonique dans le fichier HTML ou dans l'entête HTTP, veillez à toujours utiliser l'URL absolue plutôt que celle relative. L'idéal, c'est d'utiliser l'intégralité du lien profond (qui commence par « http:// » ou « https:// ») de la page, y compris les catégories s'il y en a.

Il faudra donc privilégier le format :

< link rel=“canonical” href=“https://www.votre-site.com/url-de-la-page-référente/” >

Et non pas :

< link rel=“canonical” href=“/url-de-la-page-référente/” >

Cela permet d'éviter que l'algorithme du moteur interprète mal l'adresse de la page canonique.

Insérer une balise canonical par page

Pour résoudre efficacement un problème de pages identiques, il est important de toujours préciser une seule URL canonique par page. Si vous utilisez plusieurs tags canoniques sur le même document, aucun d'entre eux ne sera pris en compte par les bots durant le crawl de votre site.

De plus, si vous souhaitez créer un sitemap pour optimiser l'exploration de votre site, veillez à ce que ce dernier n'indique que les pages taguées canonical. Dans le cas contraire, vous risquez de diriger les robots vers les contenus des pages dupliquées.

La Balise Canonical pour un site e-commerce

Les problèmes de doublons de pages sont très fréquents sur les plateformes e-commerce. En effet, il n'est pas rare d'avoir le même produit dans diverses catégories d'une boutique en ligne. C'est le cas par exemple avec la lampe solaire connectée qui, comme son nom l'indique, est un éclairage connecté fonctionnant à l'énergie solaire. Ce produit risque donc de se retrouver dans deux catégories de votre site e-commerce avec la même description : la rubrique « éclairage solaire » et la rubrique « éclairage connecté ». Et cela risque d'arriver pour plusieurs articles de votre e-boutique. Vous serez alors confronté à un problème d'auto-plagiat énorme.

Dans ce cas de figure, l'une des solutions les plus efficaces est de taguer les adresses référentes avec des balises canoniques. Pour cela, il suffit d'insérer le tag canonique dans la partie header de vos pages de produits, comme dans cet exemple :

< link rel=“canonical” href=“https://www.votre-site.com/url-principale-du-produit/” >

Cette ligne de code guidera les spiders lors du crawl de votre site en leur indiquant la présence « souhaitée » d'un ou plusieurs doublons.

En résumé, la balise canonique est un outil puissant qui permet non seulement d'éviter les problèmes liés aux doublons, mais aussi d'améliorer l'indexation et l'optimisation des sites. N'oubliez donc pas de l'utiliser sur votre site pour avoir toutes les chances de réussir sur la toile.