Les contenus générés par ChatGPT et l'IA sont-ils dangereux pour le référencement ?
Les contenus générés par des logiciels d’IA sont-ils détectés et pénalisent-ils votre référencement naturel ? De nombreux référenceurs utilisent depuis longtemps la technologie derrière ChatGPT et nous commençons à avoir un peu de recul.
Vous allez rire : la réponse est « Ca dépend »
Le contexte
Google n’est pas opposé aux textes générés par l’IA ou par une collaboration IA+humain du moment que les textes soient de qualité
La notion de qualité au sens de Google est très « technique » n’est pas celle de la qualité perçue par les humains : par ex, un texte bien plagié ou un texte sans intérêt mais qui retient l’attention des visiteurs peuvent être considérés comme des textes de qualité
Il faut donc passer par une démarche empirique pour déterminer si des textes générés par l’IA peuvent pénaliser ou faire progresser votre référencement.
Voici ce qui ressort de notre expérience sur des cas types
1/ Contenu verbieux créé à 100% via par le Playground d’Open AI ou de ChatGPT
Caractéristiques : vocabulaire pauvre, peu de termes spécifiques, répétitions
Risque : élevé
2/ Contenu créé par des services reposant sur l’API de GPT/Open AI
Caractéristiques : textes générés par des services tel Copy.ai, Copysmith, Writesonic, Headlime et les milliers d’autres sites qui proposent en réalité, presque tous sur l’API de GPT/Open AI.
Risque : faible à élevé. Ces services utilisent exactement la même technologie (GPT 3.5 actuellement) que celle de ChatGPT/GPT. Ils sous-traitent donc, tous, en quelques sortes, la génération de texte à OpenAI/GPT, mais affinent votre demande initiale afin, en théorie, d’obtenir de meilleurs textes. Mais dans la pratique, la qualité, nature, structure, longueur des textes générés varient du tout au tout.
3/ Contenu simple et intéressant créé à 100% par le GPT d’Open AI
Caractéristiques : texte au vocabulaire varié et spécifique et avec un niveau d’intérêt au moins moyen
Risque : faible
4/ Contenus simples créer IA, corrigé/enrichi par un humain
Caractéristiques : textes de taille moyenne (500 mots) générés par l’IA, mais enrichit pas l’humain (introduction, correction des erreurs, ajout d’idées…)
Risque : peu élevé
5/ Contenus générés massivement via une API
Caractéristiques : génération de milliers de fiches produits via l’API du Playground de GPT/OpenAI avec des prompts standards, sans retouche humaine de chaque texte.
Risque : moyen à élevé
6/ Contenus complexes générés par 95% par GPT/ChatGPT ou des services reposant sur l’API d’OpenAI
Caractéristiques : textes générés à part d’une séquence de prompts
Risque : peu élevé
7/ Contenu paraphrasé par l’IA à partir de textes riches
Caractéristiques : texte source reformulé par une techno de type GPT
Risque : peu élevé
8/ Contenu traduit par l’IA à partir de textes riches et adaptés
Caractéristiques : texte intéressant traduit par une techno de type Deepl et corrigé par un humain
Risque : peu élevé