Les bons tuyaux SEO

Indexifembedded : Google lance un nouvel attribut meta "robots"

Article publié le 31 janv. 2022
Indexifembedded : Google lance un nouvel attribut meta \

Fin janvier 2022, Google annonce une modification de la balise meta destinée à ses robots d'indexation : « Indexifembedded ». Derrière ce nom se cache une fonction bien pratique pour le SEO. Jusqu'ici, le contenu web embedded (inclus, intégré) dans une iframe ou autre portant l'attribut « noindex » n'était pas indexé par le moteur de recherche. Cela posait cependant quelques soucis pour le référencement Google du contenu intégré dans cette même page. SEMJuice vous explique comment utiliser ce tag pour le SEO.

Indexifembedded : l'annonce de Google

Annoncé en début d'année sur le Twitter du moteur de recherche Google, cet attribut HTML s'utilise en combinaison avec le tag « noindex » de la balise meta « robots », offrant davantage de contrôle aux webmasters sur le contenu qu'ils souhaitent ou non voir indexer. La firme californienne précise que cette exception au « noindex » est une réponse à un problème « courant » chez les éditeurs de contenu web multimédia, pour qui travailler le SEO sur Google tout en offrant une bonne expérience utilisateur est rapidement compliqué. Il s'agit de diriger plus précisément les robots de crawl de Google, via la balise meta « robots », pour modifier leur comportement par défaut.

Pour plus d'informations, la balise meta « robots » et le tag Indexifembedded disposent de leurs propres pages sur le blog de Google, le Google Search Central. Seuls les robots du moteur de recherche Google sont capables d'interpréter ce tag pour le moment.

Quelle est l'utilité d'Indexifembedded pour Google ?

Cette nouveauté concerne le socle technique d'un site web (un des piliers du SEO) et ne concerne pas tant l'annonce d'une nouvelle balise meta que d'un nouveau composant, les « tags » ou attributs qui viennent donner des instructions aux robots d'indexation.

Comme le précise Google, cet attribut destiné aux robots vient résoudre un problème rencontré par les éditeurs multimédias, notamment ceux qui diffusent des podcasts, des PDF, une vidéo, ou qui revendent leur contenu à des sites tiers. Tous ces médias sont en effet intégrés dans une page, qui sert de « conteneur » virtuel (une iframe, par exemple). Cette page mère est souvent dupliquée, c'est pourquoi la plupart du temps le webmaster lui ajoutera « noindex » afin de ne pas nuire à son SEO. Il évite aussi aux robots de Google de référencer des pages sans intérêt.

Quand « noindex » est ajouté à la balise meta destinée aux robots, ce n'est pas seulement la page conteneur qui n'est pas indexée, mais l'ensemble de son contenu, y compris les médias intégrés. Comment faire en SEO lorsque l'on veut bien référencer le contenu qui est « embedded », mais pas la page média qui le contient ? C'est là que l'attribut Indexifembedded intervient !

Quand utiliser le tag Indexifembedded ?

Ce tag ne fonctionne qu'avec l'attribut « noindex » et ne s'adresse qu'aux robots Google, pas aux visiteurs humains (pour qui la balise est invisible). Le but est de préciser un comportement dans la balise meta « robot » HTML, qui sert à guider les robots d'indexation de Google. Il s'ajoute à la liste existante des tags comme « noindex » et « data-nosnippet » (qui permet depuis 2019 au webmaster de choisir ce qu'il veut voir s'afficher ou non dans un rich snippet de Google). Cela est très utile pour l'optimisation SEO et le marketing.

En SEO, jouer sur la balise meta « robot » alloue un certain contrôle sur ce que l'on veut ou ne veut pas voir indexé. En redirigeant les robots d'indexation de Google, il est possible d'optimiser son budget de crawl et de concentrer le jus de lien. On vient donner plus de puissance à certaines pages web, tout en ignorant les pages inutiles pour le SEO (abondance de liens ne nuit pas, mais le budget de crawl n'est pas illimité !). Cette modification de la balise meta « robots » vient donner de la souplesse au « noindex » en lui ajoutant une exception. On pourrait la traduire ainsi : « Google bots : no index, but index if embedded » : chers robots de Google, ne pas indexer cette page, mais en référencer le contenu intégré !

Comment intégrer Indexifembedded pour diriger les robots de Google ?

Dans le header d'une page HTML, on intègre ce tag dans la balise meta « robots », en combinaison avec « noindex » de la manière suivante :

name= " googlebot » content=" noindex » / > name=" googlebot » content=" indexifembedded » / > ou à la suite : name=" googlebot » content=" noindex, indexifembedded » / >

Cela peut directement se faire dans l'en-tête HTTP destiné aux robots de Google :

X- Robots-Tag : googlebot:noindex
X- Robots-Tag : googlebot:indexifembedded

ou plus simplement :

X- Robots-Tag : googlebot:noindex,indexifembedded

Sans être révolutionnaire, ce nouveau tag pour la balise meta « robots » de Google permet aux éditeurs multimédias d'indexer leurs contenus embedded sans référencer la page conteneur. Une subtilité que les webmasters soucieux du SEO trouveront pratique pour optimiser leur budget de crawl, et surtout bénéficier d'une meilleure visibilité sur les objets embedded comme les fichiers PDF, les vidéos, etc. Si Google apporte une prochaine nouvelle au cœur de l'actualité, SEMJuice vous en tiendra informé.