L’étude Semrush sur 42 000 articles de blog a fait du bruit : le contenu humain occuperait massivement le haut des résultats Google. Avant de tirer des conclusions sur votre stratégie éditoriale, il y a une question à poser et elle change tout : comment ont-ils distingué le contenu humain du contenu IA ?
Ce que dit l’étude et pourquoi elle a retenu l’attention
Publiée début avril 2026, l’étude Semrush « Does AI content rank well in search ? » repose sur deux volets :
- Un sondage auprès de 224 professionnels SEO
- Une analyse de 42 000 articles de blog classés sur 20 000 mots-clés
L’étude se fonde sur un détecteur de contenus IA (GPTZero) qui propose des probabilités, ce n’est pas une identification formelle.

(Dans un souci d’esprit analytique, nous allons grandement insister sur le titre de ce graphique : “probability” !)
Le chiffre qui a circulé partout : 80,5 % des pages en position 1 seraient « human-written », contre seulement 9,5 % classées comme générées par IA.
Conclusion implicite largement reprise : le contenu humain performe mieux. L’IA serait donc à tenir à distance si vous visez le top des SERP.
C’est séduisant. C’est aussi un peu rapide, et surtout contradictoire :
Quand on demande aux professionnels comment ils créent leurs contenus, ils nous répondent tout de même que c’est majoritairement généré avec de l’IA “assistée” (le fameux “mixed” dans l’infographie précédente).

(Donc plus de la moitié des contenus seraient “mixed” et ne rankeraient donc pas, si on suit les chiffres que tout le monde met en avant sur les réseaux ?)
À ce stade, nous pourrions dire que la plupart des professionnels utilisent l’IA, mais que ça ne serait pas très efficace, si on suit les “probabilités” évoquées plus tôt.

(Cumulés, 44% estiment que ça s’est amélioré)
Nous nous trouvons donc face à une dissonance au sein même de cette étude : les chiffres de ranking SERP contredisent la réalité professionnelle. Comment l’expliquer ? Rigueur et sens critique entrent en jeu !
Le problème : tout repose sur GPTZero
Pour classifier 42 000 articles, Semrush a utilisé GPTZero, un détecteur de contenu IA. C’est là que les choses se compliquent.
GPTZero fonctionne en analysant des patterns stylistiques et statistiques dans un texte : régularité syntaxique, densité lexicale, fluidité de structure. Il attribue une probabilité (pas une certitude) à chaque contenu.
Le problème, c’est que ces mêmes caractéristiques se retrouvent dans, du bon contenu, humain et bien structuré. Notamment les articles SEO, qui sont précisément conçus pour être clairs, organisés et lisibles.
Les faux positifs : un problème documenté, pas marginal
GPTZero revendique un taux de faux positifs de 1 % dans ses propres benchmarks (gptzero.me). Mais ces chiffres sont auto-déclarés, en conditions contrôlées.
En conditions réelles, les études indépendantes racontent autre chose :
- ryne.ai a analysé plus de 100 000 textes et conclut que GPTZero classe incorrectement 18 % des textes humains comme générés par IA, et jusqu’à 61 % des essais rédigés par des non-anglophones natifs (ryne.ai, mars 2026)
- Une étude publiée sur PubMed Central (août 2025) note un taux de faux positifs particulièrement élevé sur les textes dont le score IA est compris entre 1 et 20 %, précisément la zone grise du contenu hybride (pmc.ncbi.nlm.nih.gov)
- Stanford HAI a mis en évidence dès 2023 un biais systématique : les détecteurs de type GPT classent les essais de non-anglophones natifs comme générés par IA dans plus de 60 % des cas, contre quasi 0 % pour les anglophones natifs (hai.stanford.edu)
Shakespeare était-il un robot ? Les tests qui font réfléchir
Le cas le plus parlant, et le plus révélateur, reste celui des textes littéraires classiques soumis aux détecteurs IA.
Les résultats sont édifiants :
- Roméo et Juliette de Shakespeare flaggué comme « probablement généré par IA » (Instagram, mars 2026)
- Hemingway détecté comme IA par plusieurs outils (Playful Brains, mars 2026)
- Frankenstein de Mary Shelley (1818) classé à 100 % IA-generated par un outil se revendiquant à 99 % de précision (YouTube Shorts, mars 2026)
- Des textes anciens régulièrement mal interprétés comme du contenu machine (Economic Times, février 2026)
La raison est simple : les détecteurs repèrent des régularités formelles, pas une « intention humaine ». Un texte très structuré, cohérent et fluide, qu’il date de 1797 ou de 2025, peut déclencher les mêmes alertes qu’un contenu généré par ChatGPT.
Ce que ça change pour l’interprétation de l’étude Semrush
Pourquoi la méthode est contestable :
Cette critique est bien soutenue par Stanford HAI et par plusieurs publications académiques récentes.
- un détecteur IA mesure des indices statistiques, pas l’intention de l’auteur ;
- ces outils génèrent des faux positifs ;
- ils biaisent particulièrement les textes écrits par des non-anglophones ;
- ils distinguent mal les contenus hybrides.
Si GPTZero surclasse le contenu humain structuré comme « IA », alors une partie non négligeable des articles rangés dans la catégorie « AI-generated » dans l’étude Semrush sont en réalité des contenus humains bien rédigés.
Autrement dit : la catégorie « human-written » est probablement gonflée par des faux positifs inversés, et la catégorie « AI-generated » contient vraisemblablement une part de contenus hybrides ou humains mal classés.
Le chiffre « 80,5 % des pages en position 1 sont human-written » ne mesure pas ce qu’il prétend mesurer. Il mesure ce que GPTZero a estimé être du contenu humain, avec toutes les limites que cela implique.
Alors, qu’est-ce que Google récompense vraiment ?
C’est la bonne question, et l’étude Semrush ne peut pas y répondre avec cet outillage.
Ce que les mises à jour Google de ces deux dernières années indiquent de façon cohérente, c’est que le moteur cherche à identifier des signaux de valeur différenciante : expertise incarnée, point de vue original, données propriétaires, profondeur de traitement. Ce que Google appelle E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness).
Ces signaux peuvent être produits par un humain seul, par un humain assisté par IA, ou dans certains cas, par un processus IA très bien encadré. Ce qui compte, c’est le résultat, pas le process.
Aucun détecteur IA ne peut mesurer ça. Et c’est précisément pourquoi l’étude, aussi bien intentionnée soit-elle, ne peut pas trancher le débat qu’elle prétend clore.
Ce que ça implique concrètement pour votre stratégie de contenu
Quelques repères plus solides que « faites du contenu humain » :
En clair : entourez-vous des bonnes équipes de stratégie SEO/GEO et surtout d’une excellente team de rédacteurs augmentés par l’IA


