publié le 5 juil. 2022
Deep web

Définition SEO de deep web

Ce n'est un secret pour personne : internet est immense. Et par immense, on veut dire gigantesque. Avec plus de 1,8 milliard de sites web, il est difficile de savoir par où commencer !

C'est pourquoi aujourd'hui, nous allons parler du deep web, hidden web, web caché, web invisible, cette face cachée d'internet à laquelle nous n'avons pas accès… faute d'indexation Google !

Le deep web, en opposition au web de surface

Ah bon ? Il existe deux types de web ? Oui et non. Il s'agit toujours de sites internet, à la seule différence que certains seront visibles dans les résultats de recherche… d'autres non !

Surface web : les sites bien référencés

Commençons par le web de surface. Il regroupe tous les sites qui sont détectés et indexés par les moteurs de recherche, comme Google ou Yahoo.

Ces sites web sont hébergés sur des serveurs dédiés ou mutualisés, et sont accessibles en tapant l'URL (exemple : www.commentcamarche.net) dans la barre d'adresse du navigateur, ou en faisant une recherche ciblée par mots clés.

Le web profond : ces sites en mal de SEO

Le web profond décrit une partie d'internet qui n'est pas accessible par les moteurs de recherche. Ce terme, qui n'a rien à voir avec le dark web (accessible sur le darknet), fait référence à un contenu en ligne qui n'est pas indexé par les moteurs de recherche ou qui est plus difficile à trouver que les pages web classiques.

La compréhension de ces termes et de la manière d'accéder à ce contenu peut être utile aux experts en référencement qui cherchent à optimiser les sites web de leurs clients.

Une face cachée du web

Deep web ("web profond", « web caché » ou en encore "hidden web") : ce terme désigne l'ensemble des pages dynamiques accessibles sur internet qui ne sont pas indexées par la plupart des moteurs de recherche classiques, comme Google. On y accède uniquement en connaissant directement l'URL, ou en passant par un lien hypertexte sur un site du surface web.

Le terme désigne également tout ce qui n'est pas indexé : les sites privés, les bases de données, les réseaux privés virtuels (VPN), etc.

Quelle différence avec le dark web ?

Beaucoup de gens confondent le dark web et le deep web, bien qu'ils ne correspondent pas à la même chose. Certes, leurs pages ne seront pas affichées par un moteur de recherche classique, tel que Google.

Toutefois, un site internet qui fait partie du deep web peut tout à fait un jour, sous réserve d'un bon référencement, apparaître dans les résultats des recherches Google. Son contenu n'est pas prohibé par les moteurs de recherche classiques, ni volontairement dissimulé, ils sont juste en mal de référencement.

Le dark web ne passe pas par les moteurs de recherche du surface web…

… Et il n'y sera jamais indexé ! Par ailleurs, l'anonymat y est de mise, contrairement au deepweb. Le dark web est une zone sombre du net, volontairement cachée. Ses pages sont donc volontairement montées pour éviter les guidelines des moteurs de recherche surfaciques.

Comment accéder au dark web ?

Pour naviguer dans le dark web, il faut utiliser des navigateurs web spécialement conçus à cet effet, comme le navigateur Tor.

Celui-ci a été mis au point par une organisation à but non lucratif visant à améliorer la confidentialité en ligne, la vie privée et l'anonymat de chaque utilisateur.

Il abrite notamment les sites en .onion (The onion router). Si vous accédez à un site en .onion, cela signifie que vous êtes sur le dark web !

Dans le deep web, pas de contenu illégal ?

Le deep web est plutôt légal en général, son souci étant une bonne indexation par les moteurs de recherche. Même si on ne trouve pas que du contenu illégal sur le darkweb, force est de constater que la majorité des sites internet qui s'y trouvent ne montrent pas tous patte blanche, à l'inverse du deep web.

Pourquoi certains sites se retrouvent-ils dans le deep web ?

Il y a plusieurs raisons pour lesquelles certains sites se retrouvent dans le web profond.

Un site web trop lourd

L'une d'elles est que le site peut contenir trop d'informations pour que les moteurs de recherche puissent les indexer. C'est souvent le cas des grandes bases de données, comme celle de la NASA.

Un accès bloqué au site

Une autre raison est que le site peut nécessiter un mot de passe ou une autre forme d'authentification pour accéder à son contenu. Ce contenu n'est pas accessible au public et ne peut donc pas être indexé par les moteurs de recherche.

Un manque certain de SEO est bien sûr une autre cause de la présence d'un site internet dans le deep web. Vous pouvez avoir écrit de bons textes, si aucun backlink n'est fait vers vos pages, Google ne pourra pas les indexer correctement !

Enfin, certains sites peuvent délibérément choisir de ne pas être indexés par les moteurs de recherche. Cette décision peut avoir diverses raisons selon vos projets, par exemple préserver la confidentialité des contenus ou éviter toute attention indésirable. C'est ainsi qu'un site atterrit dans le dark web.

Contenu dupliqué

Un site internet peut également faire partie du deep web s'il publie beaucoup de contenu dupliqué. On ne le dira jamais assez : Google déteste le duplicate content et le pénalise fortement ! Vous ne pourrez pas lui mentir sur ce point.

Si vous souhaitez que vos pages plaisent à Google, elles doivent être uniques, en plus de respecter les bonnes pratiques de la rédaction web SEO.

Manque de qualité du contenu

Si vous constatez que votre site web fait partie du deep web, c'est aussi peut-être par manque de contenu qualitatif ou adapté aux robots de Google. Chaque titre et description doit être bien rédigé et respecter certaines règles pour apparaître dans les résultats.

Le contenu de vos pages doit être pertinent, bien structuré et facile à lire pour les internautes, grâce au balisage Hn. Vous devez également recevoir des backlinks de qualité vers votre site, à savoir des liens provenant de sites connus et reconnus par Google.

Si vous voulez que votre site web sorte des profondeurs d'internet et soit visible par tous, il vous faudra travailler son référencement ! Pour ce faire, vous pouvez confier cette tâche à une agence web ou à un spécialiste en référencement.

Quelles sont les répercussions d'un contenu deep sur un site internet ?

Si votre but est un bon référencement, la présence de vos pages dans le deep web (au lieu du surface web) est un mauvais signe.

Le principal problème des sites qui se trouvent dans le web profond, c'est leur absence de visibilité sur les moteurs de recherche. Votre stratégie de référencement a de toute évidence pris un mauvais tournant !

Si vous n'êtes pas sur la première page web de Google, il sera également difficile pour votre public cible de vous trouver sur la toile. Votre objectif est donc d'attirer l'attention de Google par le biais des bonnes pratiques SEO, pour qu'il juge utile de sortir votre site du deep web et qu'il le fasse apparaître dans les pages du web de surface.

L'intérêt de bien référencer son site web : le travail SEO

Le référencement est une technique qui permet aux moteurs de recherche de détecter et indexer les pages web d'un site.

Plusieurs facteurs entrent en compte dans le classement des sites par les moteurs de recherche :

  • la qualité du contenu,
  • la pertinence du site par rapport aux requêtes des internautes,
  • le nombre de backlinks (liens d'autres sites vers le vôtre),
  • la vitesse de chargement des pages,
  • la structure du site, etc.

Ce sont autant de points qu'il vous faudra travailler pour apparaître dans les pages bien référencées du célèbre moteur de recherche !

 

Comment accéder au deep web ? Les moteurs de recherche à connaître

Si on ne peut pas trouver les sites du web profond, c'est parce que Google ne les indexe pas. Mais Google n'est pas le seul moteur de recherche au monde, et certains, grâce à leur fonctionnement différent, peuvent vous aider à trouver des solutions.

The internet Archive

Internet est une ressource incroyable pour toutes sortes de contenus. Des vidéos et des fichiers audio aux livres numérisés, en passant par les jeux copiés ou les logiciels qui n'existent plus sur terre, il héberge tout !

Et ces contenus, même s'ils ne sont pas indexés par Google, vous pouvez les retrouver en quelques clics en passant par des moteurs de recherche comme The internet Archive.

Startpage

Startpage.com est un moteur de recherche qui offre le même niveau de confidentialité que Google, mais sans la bulle de filtre.

Starpage offre également une bonne sécurité, tout en vous donnant accès à des pages non indexées par Google.

WorldCat

WorldCat vous aide à trouver des livres et d'autres ressources qui ne sont pas disponibles sur l'internet ordinaire. Vous pouvez ainsi l'utiliser pour trouver des choses qui sont cachées dans le web profond.

Son avantage, c'est qu'il est très convivial, de sorte que même si vous n'êtes pas familier avec le web profond, vous devriez être en mesure de trouver ce que vous cherchez.

World Wide Science

On ne parle plus ici de World Wide Web, mais de World Wide Science, qui vous permet de trouver des informations scientifiques. Il permet de trouver des ressources de nombreux pays et donc dans de nombreuses langues.

Ces contenus, non prévus pour être absolument référencés, ne sont souvent pas accessibles sur Google, bien cachés dans le hidden web. Grâce à ce moteur de recherche, beaucoup de monde intéressé par le milieu de la science s'y retrouve pour y dénicher de nombreux documents scientifiques.

Yippy

Yippy était auparavant connu sous le nom de Clusty. Il s'agit d'un métamoteur de recherche qui s'appuie sur le clustering, ce qui permet de diriger facilement les utilisateurs vers les ressources et informations qu'ils souhaitent : des images ou des téléchargements à partir de leur appareil par exemple.

Des vidéos peuvent également être trouvées en effectuant une recherche dans la vaste bibliothèque de Yippy !

DuckDuckGo

DuckDuckGo est la meilleure alternative à Google, car il possède de meilleures fonctionnalités de confidentialité et vous fait également disparaître de son radar. C'est d'ailleurs le navigateur par défaut de TOR (The Onion Router), avec une adresse IP intraçable.

Bien sûr, le navigateur Tor Browser permet également d'accéder à des pages du web profond. Eh oui ! Tor ne permet pas uniquement d'accéder au dark web...

En résumé

Le deep web est un endroit vaste et complexe, qui abrite toutes sortes de pages cachées qui ne sont pas indexées par Google. Si le dark web reste souvent associé à des activités criminelles et se fait "oublier" volontairement, le deep web est une partie d'internet qui se trouve ignorée contre son gré.

Comprendre les lacunes de vos sites web vous permettra de les sortir du hidden web, en améliorant le SEO des sites et donc en leur rendant cette visibilité tant recherchée !

Nous espérons que cette définition du deep web vous aura aidé à comprendre que le web profond est une zone différente du dark web. Vous aurez sûrement compris que leurs applications sont différentes, et espérons que votre point de vue aura évolué sur ces notions trop souvent confondues.