publié le 13 sept. 2021
Balises de pagination

Définition SEO de Balises de pagination

En SEO, les balises de pagination sont des balises HTML qui permettent de spécifier aux moteurs de recherche qu'un contenu web est paginé, c'est-à-dire scindé en de multiples sections accessibles via plusieurs clics. Lorsqu'elles sont présentes dans le code source d'un site, elles permettent aux robots de mieux indexer les documents paginés. Mais comment fonctionnent-elles exactement ? Et comment les utiliser pour signaler à Googlebot qu'une partie de votre site est paginé ?

Qu'est-ce que la pagination SEO ?

Dans le domaine du référencement naturel, le terme « pagination » renvoie à une technique qui consiste à scinder en plusieurs pages consécutives un article particulièrement long. Cette technique est principalement utilisée dans le cas des listes de produits sur les sites e-commerce. On la retrouve également sur certaines plateformes éditoriales.

Quelle est l'utilité de la pagination ?

La pagination est notamment utile pour découper l'affichage d'un listing afin d'avoir de petits morceaux plus courts, lisibles et compréhensibles. Elle est donc très utilisée sur les fichiers assez longs. C'est le cas par exemple pour les pages de produits comptant plusieurs centaines d'articles. Pour ce type de documents, la pagination permet de rendre la navigation optimale en créant plusieurs petites sections successives avec une URL distincte pour chaque partie. Le principe derrière ce concept est assez simple. Si vous avez une page contenant 100 produits distincts dans votre boutique en ligne, vous pouvez la paginer en 10 sections de 10 articles chacun.

Les avantages de la pagination

Le fait de fractionner un long article offre de nombreux avantages au propriétaire du site concerné. D'une part, cela permet de réduire le temps de chargement nécessaire pour afficher toutes les informations sur une seule page. La vitesse d'affichage s'en trouve donc améliorée, puisque les petites sections peuvent se charger en très peu de temps.

Par ailleurs, le fractionnement permet d'augmenter le nombre de pages vues. Par exemple, lorsqu'un internaute navigue entre la section 1 et la page 5 pour obtenir les informations qu'il recherche, cela équivaut à 5 vues de pages. Ce qui n'est pas le cas lorsque l'intégralité des informations est proposée sur le même document. De plus, la pagination permet d'optimiser la durée moyenne des visites. Avec cette solution, le visiteur passera plus de temps à naviguer entre les différentes sections afin d'obtenir des résultats satisfaisants. Cela influe directement sur le temps passé sur le site et augmente votre Dwell Time (temps d'arrêt sur une page avant de retourner sur la page des résultats de recherche) .

Les limites de la pagination

Si la technique de la pagination s'avère utile et avantageuse sur certains points, elle possède également des limites. Le fait de découper un article trop long peut parfois pénaliser le référencement naturel. Ceci arrive pour plusieurs raisons.

D'un côté, lorsque cette technique est utilisée sur un site, elle augmente systématiquement la profondeur des URLs. Et plus une page est éloigné de la page d'accueil, moins elle est performante en SEO. D'un autre côté, le fractionnement d'un contenu en plusieurs parties multiplie les URLs à crawler, sans pour autant varier les mots-clés, les Title et les Meta Description. Dans la plupart des cas, cela entraîne le gaspillage du budget de crawl. Les spiders peuvent perdre leur temps sur des contenus qui n'ont pratiquement pas d'importance pour votre stratégie digitale.

En dehors de ses limites en SEO, la pagination peut également s'avérer contreproductive du point de vue UX. En cliquant sur un lien paginé, l'internaute n'est pas sûr de trouver ce qu'il cherche sur la page, ou celle d'après, ou bien plus loin. Ainsi, lorsqu'il ouvre trois à quatre sections sans être satisfait, il peut décider de retourner sur la SERP et d'affiner sa requête pour trouver des informations qui répondent plus précisément à sa demande.

Quelle est l'importance de la pagination en référencement ?

L'objectif principal du fractionnement des page assez longues est de faciliter la navigation des utilisateurs. En effet, avec une page trop longue, l'internaute risque d'être submergé par la quantité d'informations proposées. Dans le cas d'une boutique en ligne par exemple, le prospect aura du mal à trouver le produit dont il a besoin. Ce qui est contreproductif en termes d'expérience utilisateur, une métrique très importante en SEO. C'est pour éviter cela qu'il est important de paginer les pages assez longues. La mise en œuvre de cette technique permet de présenter le même fichier en plusieurs parties (chacune avec son URL) avec des boutons permettant :

  • De retourner à la section précédente
  • D'aller à la section suivante
  • De retourner à la page initiale
  • D'aller à la dernière page

Cela permet de faciliter la navigation à travers les différentes sections du document.

Les différents types de pagination

Pour atteindre son objectif, la technique de la pagination peut être utilisée de différentes manières. Il existe en effet différentes méthodes à suivre pour paginer un document jugé trop long. Il s'agit notamment de la technique classique et celle utilisant le Scroll Infini.

La pagination classique SEO, rel=prev/next

Ce système de pagination consiste dans un premier temps à scinder une grande liste en plusieurs pages. La suite de l'opération consiste à indiquer l'enchaînement des URLs paginées aux bots, en utilisant les attributs rel=next/prev. Concrètement, cela se résume à :

  • Mentionner sur la page 1 l'URL de la section suivante (la 2)
  • Intégrer sur la deuxième page l'URL de la section suivante (la 3) ainsi que celle du document précédent (le 1)
  • Insérer sur la troisième page l'adresse du document numéro 4 et celle du fichier situé à la deuxième page (et ainsi de suite, jusqu'à la dernière page)

Pour cela, vous devez respecter une syntaxe bien définie à chaque niveau.

L'Infinite Scroll

Cette solution est en quelque sorte une pagination classique complétée par une surcouche en JavaScript. Pour l'utiliser, vous devez découper votre listing en plusieurs sections, chacune avec sa propre adresse. Vous devez également utiliser des attributs rel=next/prev pour spécifier l'enchaînement des URLs aux crawlers. Ensuite, il faudra ajouter une surcouche replaceState/pushState. Il s'agit d'une librairie JS qui permet de charger systématiquement les pages et d'afficher leur contenu au fur et à mesure que l'utilisateur scrolle le fichier. Ainsi, lorsque l'internaute atteint une nouvelle page, l'URL de cette dernière s'affiche systématiquement dans la barre du navigateur, sans qu'il soit redirigé (comme c'est le cas avec la méthode classique).

Les impacts d'une mauvaise pagination sur votre référencement

Avec ses multiples fonctions et avantages, la pagination est sans doute très utile lorsque l'on souhaite offrir une meilleure expérience de navigation. Cependant, lorsqu'elle n'est pas bien utilisée, les conséquences sur le référencement naturel peuvent être très négatives. Dans certains cas, cela peut entraîner :

  • Une mauvaise exploration par les spiders
  • La création de duplicate contents
  • Une réduction de la qualité du Link Juice

Mauvaise indexation des robots d'exploration

Au moment de crawler les plateformes en ligne, Googlebot explore chaque page publiée en suivant les liens qu'elle contient. Durant ce travail, le robot accorde une importance capitale à la profondeur des URLs. Si vous avez une énorme série de documents paginés, cela peut transformer votre site en un véritable labyrinthe pour le robot de Google. En effet, avec une pagination trop importante, le spider est susceptible d'abandonner les contenus les plus éloignés de la page d'accueil. En conséquence, une partie importante de votre site ne sera pas indexée, ce qui peut réduire vos chances d'avoir un bon positionnement sur le moteur de recherche.

Création de contenu dupliqué

Lorsqu'elle est mal configurée, la pagination peut également aboutir à du duplicate content. Cela arrive notamment dans le cas des boutiques en ligne. Pour ce type de plateformes, il est possible d'avoir des descriptions similaires pour les produits d'une même catégorie, avec un ou deux éléments de différence (la couleur et le motif par exemple). Cette similitude peut également affecter les zones chaudes de certaines pages. Dans ce cas précis, lorsque vous utilisez une mauvaise pagination, Googlebot peut conclure qu'il s'agit de duplicate content. Ce qui peut impacter négativement votre stratégie de marketing digital.

Affaiblissement de la distribution de jus SEO via les liens externes

Lorsqu'une page tierce crée un backlink vers votre site, cela transmet du jus SEO vers votre site et augmente votre autorité de domaine. En cas de pagination mal effectuée, cette autorité transmise vers votre site sera distribuée sur plusieurs pages à la fois. Sa qualité et son efficace seront par conséquent « diluées ».

Qu'est-ce qu'une Balise de pagination ?

Listes de produits, longs articles, forums, longue liste d'avis… Les contenus paginés ne sont pas rares, que ce soit sur Google ou sur les moteurs de recherche concurrents (Bing, Yahoo!, Qwant…). C'est pour signaler la présence de ce type de contenu sur un site que le webmaster utilise les balises de pagination.

Définition de Balises de pagination

Introduites par Google en septembre 2011, les balises de pagination sont des commandes HTML qui permettent aux spiders de comprendre qu'un document est proposé en plusieurs sections. Elles servent à fractionner un fichier web en plusieurs parties accessibles à partir de différentes adresses. Lorsqu'elles sont utilisées sur un site, elles se matérialisent par la présence de petits boutons numérotés (« 1 », « 2 », « 3 », « 4 »…) portant chacun un hyperlien vers la page qu'il représente. Google utilise une fonction similaire en bas de sa SERP pour permettre aux internautes de naviguer entre la première page de résultats et les pages suivantes (2, 3, 4, 5…), comme dans l'image qui suit :

Les balises rel=“next” et rel=“prev”

Pour attendre son objectif, la balise de pagination peut prendre deux structures différentes en fonction de la valeur de l'attribut « rel ». Lorsque la valeur « next » est utilisée, elle renseigne l'adresse de la page suivante aux bots. Cette syntaxe est généralement utilisée toute seule au niveau de la première section pour indiquer l'URL de la page 2. L'utilisation de la valeur « prev » permet de spécifier l'adresse de la section précédente. Cette structure est employée toute seule dans le dernier fichier paginé pour spécifier l'URL de l'avant-dernière page.

Cependant, pour les pages intermédiaires (de la deuxième à l'avant-dernière) les deux syntaxes doivent être utilisées pour définir l'enchaînement de la pagination.

La balise canonical

La balise canonical est une instruction qui permet de spécifier aux crawlers quel document prendre en compte parmi un groupe de pages similaires, lorsqu'il s'agit d'indexer un site. Cette commande est très utile pour éviter les risques de duplicate content. Elle permet de spécifier aux bots l'URL principale qu'ils doivent indexer parmi les différentes sections paginées. Pour l'utiliser, il suffit d'introduire l'instruction « rel=“canonical” » dans l'entête du fichier source de chaque section de votre pagination.

Comment Google gère la pagination des sites web ?

Dans une mise à jour récente, la firme de Mountain View a officiellement annoncé des changements sur la façon dont elle gère les documents paginés dans son index. Pour utiliser efficacement cette fonction sur votre plateforme en ligne, il est donc important de savoir comment le géant californien utilise actuellement la pagination.

Avec l'utilisation des balises rel=“next” / rel=“prev”

Depuis leur introduction en 2011, les commandes rel=next/prev ont longtemps été utiles à Google et ses algorithmes. Elles permettaient au moteur de recherche de mieux crawler les pages proposées en plusieurs parties. Cependant, l'algorithme de Google dédié à l'identification des contenus paginés s'est fortement amélioré depuis. Sur ce point, les instructions rel=next/prev sont devenues inutiles. Toutefois, le géant du web continue de les utiliser pour la partie « crawl/exploration » des sections de pagination.

Sans l'utilisation des balises rel=“next” / rel=“prev”

Comme l'indiquait John Mueller dans un Google Webmaster Hangout en mars 2019, tous les éléments de la pagination sont traités comme des pages normales. Cela revient à dire que les contenus paginés (avec ou sans les balises) sont désormais traités comme n'importe quelle autre page. En d'autres termes, les éléments de la pagination ne sont plus considérés comme une série de documents formant un seul contenu. Chaque section paginée est plutôt considérée comme une page unique et individuelle. Ainsi, que votre document soit scindé en plusieurs parties avec des instructions rel=next/prev ou non, Googlebot considère que ce sont des pages qu'il faut traiter individuellement et pas comme un ensemble.

Les bonnes pratiques pour une pagination efficace

Vous souhaitez fractionner une longue page de votre site pour la rendre plus accessible pour vos visiteurs ? Pour réussir à créer une pagination efficace, vous devez prendre en compte certains points importants. Il s'agit entre autres de :

  • Créer des URLs uniques pour chaque composant paginé
  • Désoptimiser les pages les moins importantes
  • Bien gérer la structure de votre site
  • Réduire la profondeur des éléments paginés par rapport à l'accueil

Mettre en place des URLs uniques pour chaque page paginée

Le premier point pour réussir la mise en place d'une pagination efficace, c'est de créer une adresse web unique pour chaque composant paginé. Avec des URLs natives générées dans un CMS, la probabilité que Googlebot découvre les différentes sections de votre pagination est assez faible. Pensez donc à réécrire les URLs des sections paginées afin de les rendre lisibles et compréhensibles pour les bots. L'idée, c'est de transformer les adresses exotiques en des URLs uniques, propres, simplifiées et intelligibles.

Désoptimiser les pages au-delà de la page 1

En plus de créer des adresses uniques pour chaque section, vous devez vous assurer que la page la plus importante soit plus optimisée que les autres. Conformément à la mise à jour récente de Google au sujet de la pagination, chaque section paginée constitue désormais une page autonome. Les composants paginés étant généralement très similaires, une mauvaise optimisation peut créer de la confusion, puisque Googlebot aura du mal à déterminer quelle page positionner pour quelle requête. L'idéal est donc de positionner une ou deux pages maximum au sein d'une pagination. L'objectif est de concentrer votre stratégie digitale sur la page principale, pour qu'elle se positionne au-dessus des pages tierces dans la SERP.

Gérer la structure de votre site internet

Le but de cette étape est de veiller à ce que votre site soit bien structuré. En effet, une mauvaise architecture de site peut réduire considérablement votre performance SEO. Pour éviter cela, vous devez vous assurer que les catégories et sous-catégories obtenues après la pagination sont correctement décomposées. Cela vous aidera à simplifier la structure de votre site afin de le rendre plus facile à crawler pour les bots. Une telle architecture de site vous aidera également à offrir une meilleure expérience de navigation aux internautes.

Autoriser l'indexation des pages paginées

Pour rendre votre pagination efficace, il est également important d'autoriser l'exploration de ses composants. Cette étape est particulièrement importante même après la configuration des signaux de canonisation. Cela permet notamment de rendre les pages les plus importantes visibles pour les spiders et pour les internautes. Assurez-vous donc que les documents présents dans votre pagination ne sont pas bloqués avec des fichiers robots.txt ou dans l'entête HTTP.

Réduire le nombre de clics de la Home Page vers les autres pages

L'un des plus grands inconvénients de la pagination, c'est la profondeur des URLs. Après le fractionnement, certaines pages peuvent se retrouver à plusieurs dizaines de clics de la page d'accueil, en fonction de la longueur du contenu. Pour permettre à Googlebot et ses concurrents d'accéder à ces documents, il est indispensable de réduire le nombre de clics vers leur contenu. Cela est indispensable pour améliorer leur performance SEO. L'idéal c'est de respecter une limite de 3 clics maximum vers les pages les plus profondes.

Disposer de liens d'exploration sur vos pages paginées

S'il est important de créer des URLs uniques pour chaque composant paginé, cela ne suffit pas pour que la pagination soit efficace du point de vue SEO. Pour que les crawlers puissent découvrir, explorer et indexer les différentes parties de votre page scindée, celles-ci doivent être reliées entre elles avec des liens explorables. Pensez donc à utiliser des liens d'ancrage au sein de ces pages, pour les rendre plus accessibles à Googlebot et ses concurrents.