publié le 13 sept. 2021
Soft 404

Définition SEO de Soft 404

Une Soft 404 est une page qui répond avec un code 200 (OK) au niveau de son en-tête HTTP, mais qui se comporte aux yeux du robot de Google comme une page en erreur 404. Elle renvoie l'internaute vers une page neutre sur le même site web ou vers un contenu qui n'a aucun rapport avec l'URL demandée. Ce phénomène peut affecter la performance d'un site dans les pages de résultats du moteur de recherche.

Qu'est-ce qu'une Soft 404 ?

Une Soft 404 correspond à une page web qui se comporte de façon étrange avec les navigateurs et les moteurs. Comment se manifeste ce phénomène et quelles sont ses implications en matière de SEO ?

Le fonctionnement des requêtes utilisateurs

Pour mieux comprendre ce qu'est une erreur de type Soft 404, rappelons brièvement le fonctionnement des requêtes utilisateurs sur internet. Lorsqu'un internaute tente d'accéder à une page web, le navigateur (ou le robot du moteur) envoie instantanément une requête au serveur qui héberge le site demandé afin d'obtenir certaines informations concernant l'URL. Lorsque le serveur distant reçoit cette requête, il répond en envoyant un en-tête HTTP qui contient plusieurs données donc un code d'état.

En fonction de la valeur de ce dernier, le navigateur saura s'il est possible d'afficher la page, s'il faut rediriger l'internaute vers une autre adresse, ou plutôt si la ressource demandée n'est pas disponible. Ce n'est qu'après cet échange de données (non visible pour l'internaute) qu'une suite peut être donnée à la demande.

Les différents Codes d'États

Un serveur distant peut renvoyer l'une des réponses suivantes via l'en-tête HTTP : 200, 301, 302, 401, 403, 404, 500, 503 et 504.

Code 200

Le code 200 signifie OK. Son envoi veut dire que tout va bien et que les contenus demandés sont bien présents à l'URL indiquée. Pour l'internaute, cela signifie que la page peut être affichée sans problème.

Codes 301/302

Le 301 et le 302 sont des réponses de redirection. Le premier indique au client web que la ressource demandée a définitivement changé d'adresse. Le second indique un changement d'adresse temporaire. Dans les deux cas, l'internaute est automatiquement redirigé vers la nouvelle adresse.

Code 401

Le 401 veut dire Unauthorized (non autorisé). Il est renvoyé lorsque le système n'a pas obtenu de la part du client web les informations d'authentification nécessaires pour consulter la ressource demandée.

Code 403

Le 403 Forbidden indique un refus d'exécuter la requête. L'internaute ne peut donc pas accéder à la page, même en cas de réauthentification.

Code 404

Le 404 est un code d'erreur très courant qui est renvoyé lorsqu'aucune ressource n'est disponible à l'URL indiquée. Il s'affiche généralement lorsque la page demandée a déjà été supprimée (sans être redirigé) ou lorsqu'il y a une erreur de syntaxe dans l'URL saisie par l'internaute. Le phénomène Soft 404 est lié à ce code de réponse.

Codes 500/503

Le 500 et le 503 sont liés à des erreurs internes de serveur. Le premier est généré lorsqu'un dysfonctionnement empêche la ressource demandée d'être délivrée au client web. Le second indique que l'ordinateur distant ne peut pas prendre en compte la requête à cet instant T, le plus souvent parce qu'il est surchargé.

Code 504

Il est envoyé lorsque deux serveurs sont impliqués dans le traitement d'une demande et que le premier (agissant comme passerelle) n'a pas pu recevoir une réponse dans les délais. Le message d'erreur : Gateway timeout est alors affiché pour l'internaute.

Définition de Soft 404

Une erreur soft se produit lorsque le code d'état reçu par Google via l'en-tête HTTP indique que tout va bien (OK) alors que la page concernée se comporte en réalité comme une page en erreur 404. Autrement dit, le Soft 404 intervient lorsqu'aucune ressource ne semble être disponible à l'URL demandée, mais que le serveur n'envoie pas un 404 au client.

Soft 404 vs Page 404

Deux points fondamentaux permettent de faire la distinction entre une erreur soft 404 et une erreur 404 simple. Premièrement, dans le cas d'une erreur 404 due à des liens cassés ou à d'autres problèmes techniques, l'inexistence du contenu demandé est bien signalée dans l'en-tête HTTP. Or, pour un soft 404, le système n'indique pas formellement que la ressource demandée est introuvable bien que cela soit effectivement le cas (il indique plutôt que tout va bien).

Deuxièmement, le comportement des robots d'exploration des moteurs n'est pas le même dans les deux cas. Les pages qui sont en erreur 404 ne sont pas indexées par Google alors que celles qui présentent une erreur soft 404 sont bien explorées et indexées. Elles apparaissent également dans les pages de résultats.

Quelles sont les causes d'une Soft 404 ?

L'apparition d'une Soft 404 peut être liée à :

  • une page vide ou quasi vide,
  • une page avec des produits en rupture de stock,
  • une erreur 404 personnalisée mal paramétrée,
  • un mauvais usage de la redirection 301.

Une page vide ou n'ayant pas assez de contenu

Lorsqu'un site a des pages qui n'ont presque pas de contenu, à part quelques phrases inutiles, cela peut donner lieu à des erreurs de type Soft 404. Malgré le statut 200, Google considérera le plus souvent ces pages comme des ressources introuvables.

Une page avec des produits en rupture de stock

Parfois, sur les sites e-commerce, certaines pages affichent un message du type « ce produit n'est plus en stock » pour indiquer aux internautes que les articles qu'ils cherchent ne sont pas disponibles. Le problème avec ces pages est qu'elles sont quasi vides, et par conséquent elles donnent l'impression d'être des ressources introuvables.

Une page 404 personnalisée mal paramétrée

Il est possible de personnaliser une page d'erreur 404 pour améliorer l'expérience de navigation des internautes. Cependant, lorsque le paramétrage n'est pas bien fait, cela peut donner lieu à une Soft 404. C'est le cas par exemple lorsque la ligne de commande ajoutée dans le fichier .htaccess est erronée.

Une grosse quantité de redirections 301

Les redirections massives vers une page dont le contenu n'a rien à voir avec celui des URL supprimées ne sont pas conseillées. Google peut en effet les considérer comme des actions inappropriées et déclarer plusieurs Soft 404, même si vous avez pris le soin de faire des redirections 301.

Quelles sont les conséquences d'une Soft 404 ?

La présence de plusieurs erreurs soft 404 sur un site peut impacter négativement son référencement naturel. Elles favoriseront notamment le gaspillage de son budget d'exploration et la détérioration de l'expérience utilisateur.

Gaspillage de votre budget de crawl

Lorsqu'il y a des erreurs soft 404 sur un site, le serveur indique aux robots des moteurs que les pages concernées sont bien disponibles avec des contenus à afficher alors qu'elles ne le sont pas en réalité. Par conséquent, les URL en soft 404 seront explorées et indexées inutilement, dilapidant ainsi une partie de votre budget de crawl.

Pour rappel, cet indicateur fait référence à la quantité maximale de pages que les spiders de Google vont explorer sur votre site sur un intervalle de temps donné. Puisqu'il est limité, son gaspillage est un véritable handicap pour votre référencement naturel, car certains de vos contenus importants pourraient passer à la trappe.

Détérioration de l'expérience utilisateur (UX)

Avoir beaucoup de pages qui n'ont pas de contenus (ou presque), mais qui sont accessibles dans les résultats de Google n'est d'aucune utilité en termes d'UX. Au contraire, cela peut augmenter votre taux de rebond et vous faire perdre des visiteurs. L'algorithme de Google recevra en retour des signaux négatifs et vos performances dans la SERP risquent d'être mises à mal.

Comment détecter des Soft 404 ?

Pour détecter les erreurs Soft 404 qui sont sur votre site, vous pouvez utiliser certains outils de la Search Console, anciennement connu sous le nom de Google webmaster tools.

Consulter le "Rapport de couverture" dans votre Search Console

Pour trouver une erreur de type Soft 404 dans votre Search Console, connectez-vous à l'outil et cliquez sur Couverture > Exclues. Dans la liste des erreurs, vérifiez s'il y a « Soft 404 » et cliquez dessus. Vous obtiendrez une liste complète ainsi que des exemples d'URL.

Consulter l'outil "Inspection d'URL" dans votre Search Console

Cette méthode vous permet d'analyser des pages spécifiques pour vérifier si elles génèrent des erreurs de type Soft 404. Pour l'utiliser, il suffit d'ouvrir l'outil et d'indiquer l'adresse complète à inspecter. Cliquez sur Voir la Page Arrivée puis sur Plus d'Informations pour faire afficher l'erreur.