SEO: Ce qu'il faut savoir sur le LLM Optimization et Google SGE
Une nouvelle technique de webmarketing est apparue: se faire référencer dans les chatbots et moteurs de recherche qui carbure à l'IA.
Les chatbots sont devenus une source de trafic des sites web
Savez-vous que ChatGPT, Gemini ou Perplexity constituent maintenant une source de trafic pour votre site et, donc, un canal de communication ? Où se trouve ce trafic dans Google Analytics et Matomo ? Quelles pages sont citées par les chatbots ?
En investiguant le trafic issu des sites référents du site d'un client qui nous paraissait anormalement important, nous sommes tombés sur une liste de chatbots qui renvoyaient du trafic et avons décidé d'analyser cette source de trafic pour un échantillon des sites que nous gérons et de ceux de nos clients.
Voici les premiers enseignements:
- Les chatbots renvoient régulièrement du trafic,
- Ce trafic est, pour le moment, mineur (environ 1% de tout le trafic SEO, donc moins de 1% du trafic total),
- Mais, ce trafic est en progression constante,
- Les visites issues du trafic des chatbots semblent de qualité moyenne si l'on s'en réfère à des KPI comme la durée des visites et le taux de rebond
- En revanche, de notre côté, pas d'enseignement sur des indicateurs plus importants comme le taux de conversion ou le CA,
- Les pages affichant des définitions, des guides ou des tutoriels sont, sur l'échantillon de sites observés, les pages qui sont le plus souvent citées par les chatbots,
- Certaines fiches de présentation de services sont citées et génèrent du trafic,
- Nous n'avons pas trouvé de fiches produits de sites d'ecommerce qui soient citées par les chatbots et qui aient généré du trafic.
Dans le jeu de slides de ce post, je vous indique comme isoler ce trafic dans Google Analytics.
Il est possible de faire la même chose dans Matomo et même isoler plus facilement les pages qui ont été citées par les chatbots.
On comprend, ainsi, mieux, non seulement ce qui intéresse les chatbots sur un site, mais aussi les questions qui ont pu être posées ainsi que la raison qui a poussé les internautes à visiter le site.
Comprendre les bases du LLMO en SEO
Si vous êtes maintenant convaincu qu'il va falloir vous intéresser à votre référencement dans les chatbots comme ChatGPT ou Perplexity.
Voici les points clés que nous avons abordés dans notre première formation au LLM Optimization ou à l'art d'optimiser votre visiblité dans les chatbots.
Préalable
LLM Optimization ou LLMO fait référence à 2 concepts totalement différents.
Pour les développeurs, le LLMO est l'art d'optimiser l'utilisation d'un LLM dans une application développée pour une entreprise hashtag#FineTuning, hashtag#RAG, hashtag#PromptEngineering
Pour les référenceurs, c'est l'art d'apparaître plus souvent dans les requêtes des chatbots publics dans le but de capter des clients.
Vous l'avez compris, cet article traite bien du LLMO des référenceurs.
Les deux dimensions essentielles
- Apparaître et drainer du trafic issu des chatbots tels que ChatGPT
- Maintenir ses positions dans les moteurs de recherche tels que Google dans un contexte où les moteurs de recherche intègrent désormais des réponses de Chatbot directement dans la page de résultats qui repousseront votre site en référencement naturel, qui perdra, donc, du trafic.
1. Visibilité dans les chatbots
Une société peut apparaître de trois façons dans les réponses des chatbots:
- soit parce que le chatbot a trouvé l'information sur le site de cette société, - soit parce que la société a été citée dans un site de confiance qui faisait partie du jeu de données d'entrainement,
- soit parce que le chatbot réalise une recherche en temps réel sur le web, via une techno de RAG et que la société est citée dans les résultats qu'il vient de parser.
Il y a, donc, deux cas de figure qui n'existent pas en SEO classique.
a) la société est citée dans la réponse et bénéficie uniquement de visibilité
b) la société est citée, un lien vers son site est intégré dans la réponse et le chatbot peut devenir un pourvoyeur de prospects/clients.
Pour pénétrer ces résultats, il faut réfléchir en trois dimensions.
a) Intégrer votre site dans les jeux de données d'entraînement qui seront utilisés pour ré-entrainer le coeur du LLM du chatbot. Il faut alors attendre plusieurs mois/années pour en voir les résultats comme au début de Google en 1998 et savoir si l'opération a fonctionné parce que le coeur des modèles n'est pas ré-entrainé tous les jours (cas de ChatGPT 3.5)
b) Intégrer le moteur de recherche que le chatbot interroge lorsqu'il recherche des informations en temps réel (dans le cas de Perplexity ou de ChatGPT4)
c) Intégrer des sources que le moteur de recherche que le chatbot interroge lorsqu'il recherche des infos en temps réel. Cela peut être des guides, des annuaires d'entreprises, des réseaux sociaux comme Youtube, des media ou même des sites de Saas comme Hubspot qui publient énormément de contenu et sont considérés comme des sources fiables.
Maintenir ses positions dans Google qui affiche désormais des réponses de chatbots avant les pubs et avant les résultats naturels...
Lorsque Google SGE arrivera en France, vous aurez un défi: maintenir vos positions dans un contexte où les moteurs de recherche intègrera des réponses de Chatbot dans la page de résultats qui repousseront votre site en référencement naturel, qui perdra, donc, du trafic.
Il y a un an, un Google expérimental a commencé à intégrer des réponses de son chatbot dans les pages de résultats qui se composent, alors, de 3 blocs:
- Publicité
- Réponses du Chatbot
- Résultats naturels normaux (texte, images, vidéo...)
Les 10 résultats naturels sont, donc, repoussés au 2eme ou 3eme écran sous la ligne de flottaison.
Quand on sait qu'en l’absence de pub, le 1er site en SEO capte environ 35% des clics, le 2eme 20% et le 3eme 12%, on comprend que les réponses du chatbot, qui occupent plus ou moins 3 positions sont susceptibles de faire perdre énormément de trafic aux 3 sites qui apparaissent en tête des résultats actuellement.
Ce n'est pas pour tout de suite car seuls 2 types d'internautes voient ces nouvelles pages de résultats enrichis.
- Ceux qui ont opté pour voir ce Google expérimental (Google SGE pour Search Generative Expérience) sur https:// labs .google. com, qui surfent avec Chrome et qui sont, en dehors de l'UE, dans l'un des 120 pays où Google SGE est proposé
- Une petite proportion des internaute US "normaux", qui n'ont pas opté Google SGE, mais qui ont été choisis par Google comme cobayes.
Et surtout, trois questions essentielles restent ouvertes.
- Est-ce une bonne idée d'intégrer des résultats de chatbots dans une page de résultats de moteurs de recherche ? Rien n'indique que les internautes aiment voir du Google classique et du ChatGPT sur une seule page.
- Quelle est la bonne forme pour les présenter: réponses longues ? courtes ? Pour toutes les recherches ou une partie ? A droite ou en haut ? Affichage progressif ou immédiat ? (Google a déjà changé 2 ou 3 fois la présentation de ces résultats, Bing ou Brave les présentent de façon totalement de Google)
- Comment intégrer la publicité pour maintenir les revenus des moteurs de recherche ?
Quelle chute de trafic SEO imaginer si Google SGE est totalement déployé ?
On n'en sait rien car:
- Tout dépendra du mode d'intégration des réponses "Chatbot"
- Mais, surtout, la chute de trafic du SEO classique sera, en partie, compensée par le fait que les réponses Chatbot de Google sont accompagnées de liens vers les sources: ce sont, en quelques sortes, les nouvelles 1eres positions de Google (jusqu'à 4 liens, je crois, mais pas tous visibles sans "swiper")
Plusieurs webmarketeurs se sont hasardés à estimer la chute de trafic qui découlerait: entre -18% et - 65%.
Détails importants.
- Les liens des sources citées par le chatbot correspondent rarement aux 10 résultats du SEO classiques qui apparaissent ensuite.
- Selon les audits que nous avons réalisés, tous les sites riches en contenu "sérieux" ne sont pas cités comme source des réponses du chatbot.
Identifier les questions posées dans les chatbots: le défi des défis
Un certain nombre de référenceurs se retrouvent un peu perdus et ne savent pas dans quelle direction avancer car ils sont habitués à caler leur stratégie de SEO sur la liste des mots-clés demandés par leur cible potentielle. Cette donnée est fournie tant par Google Ads que par les centaines de services d'assistance au référencement comme Semrush ou Ahrefs.
Mais, dans le cas des chatbots, non seulement aucune statistiques sur les questions posées aux chatbots n'est disponible, mais, de plus, même les outils d'analytics ne peuvent indiquer les questions posées par les visiteurs renvoyés par les chatbots.
Il faut, donc, adopter une approche totalement différentes.
1/ Déterminer si les visites isues sont intéressées ou si elles rebondissent lors de l'audit initial de trafic généré par les chatbots.
Cela permet au moins de déterminer si ces visites sont cohérentes avec le contenu de la page visitées. On peut, en déduire que la question posée concernait soit le sujet général de la page, soit une partie du contenu de la page, les Chatbots citant des sources soit parce qu'elles sont globalement liées à la question posée, soit parce qu'une partie de leur contenu uniquement est liée à la question posée;
Les KPI de ces visites issues des chatbots sont moyens, ni meilleurs, ni pires que ceux des visites issus d'autres sources. C'est déjà une info. Les internautes en provenance des chatbots viennent pour une bonne raison.
2/Essayer de deviner indirectement l'intention de recherche à partir de deux indices
Identifier les mots clés qui selon Google Search Console génèrent du trafic vers la page et qui correspondent, la plupart du temps, au sujet général, de la page (cerné par Google par le vecteur de la page et les vecteurs de ses sections).
La limite de cette approche est que les LLM, "purs" (c'est à dire s'appuyant uniquement sur les "connaissances" acquises durant l'entraînement du modèle) ou augmentés par du RAG (c'est à dire ayant été cherché des données en relation avec la question de l'internaute dans un moteur de recherche web tel que Bing) isolent de façon plus beaucoup spécifique que Google le contenu des pages en les découpant en chunks, eux-même traduits en vecteurs. Le LLM qui renvoie l'internaute, a donc, pu n'utiliser qu'une petite partie de la page qu'il a citée en source (celle de votre site) pour répondre à la question de l'internaute dont l'intention de recherche ne correspond pas au sujet principal de la page, mais à l'une des informations spécifiques contenues dans la page.