Formation à GPT3 et ChatGPT
Musclez le contenu + SEO
Tutoriels GPT - ChatGPT - Open AI

Ce que GPT (ChatGPT, GPT3, GPT4...) va réellement changer avec la génération automatique de texte

La version 2022 de l'algorithme de génération de texte d'Open AI (et notamment GPT-3 Davinci et ChatGPT) a fait coulé beaucoup d'encre et suscité de nombreux fantasmes. Décodons

Les annonces autour de l'intelligence artificielle prédisent révolution sur révolution.

Beaucoup d 'annonce, beaucoup de communications, mais peu de réalisations et dans la pratique, des annonces peu souvent suivis de faits.

Dans le cas de GPT3, c'est différent.

GPT tient ses promesses.

GPT est une série de modèles d'intelligence artificielle mis au point par la société Open AI, qui sont essentiellement connus pour permettre à n'importe qui de créer des textes automatiquement à partir d'un brief.

Qu'est-ce que GPT ?

GPT est un coeur de technologie recourant à l'intelligence artificielle pour générer différents types de texte

  • Résumés d'articles, de textes, de posts de blogs
  • Reformulation d'article, de textes, de posts

Mais, GPT impressionne surtout sur certains types d'usage

  • Rédaction d'article ex nihilo
  • Rédaction d'articles
  • Assistante à la rédaction de texte long
  • Production de foire aux questions avec uniquement les questions
  • Rédaction de tutoriels
  • Analyse de sentiments: c'est à dire détection la tonalité d'un texte (positif, négatif, nuancé...)

Quelle différence entre ChatGTP et GPT 3 ?

GPT possède une version Chatbot qui est capable de répondre à des questions et même de discuter, c'est ChatGPT

GPT3 et la troisième version de la technologie qui permet de générer des textes, dont ChatGPT n'est qu'un des avatars.

Une 4eme itération/version de GPT est prévue pour 2024: GPT4.

Les reproches adressés à GTP3 ?

On lui reproche, en général

  • ses faux sens: certaines phrases qu'il produit sont régulièrement erronées, mais des textes que nous avons réalisé, ces erreurs concernent moins de 1% des phrases produites
  • ses fautes d'orthographes: de façon étonnante, alors qu'il rédige des textes qui contiennent beaucoup moins de fautes d'orthographes qu'un diplômé moyen de l'enseignement supérieur français, parfois GPT3 se dérègle de façon aussi inopinée qu'inexpliquée: tout à coup un paragraphe contient une faute d'orthographe inexcusable sur chaque ligne. Cela se corrige en relançant GPT3 après avoir corrigé les mots contenant des erreurs.
  • la concurrence qu'il constitue pour les rédacteurs humains
  • la faible qualité des textes qu'il produit: ces critiques émanent, en général, de personnes qui ont une faible culture du NLP (Natural Language Processing encore applée Traitement Automatique des Langues en français) et de l'intelligence artificielle générative en particulier. Ceux-là ne réalisent pas la rupture que représente GPT3 qui, bien qu'imparfait est le premier algorithme capable rédiger des textes supérieur au niveau moyen des textes rédigés par des êtres humains et publiés sur internet.

Les reproches adressés à ChatGPT

ChatGPT est en quelques sortes la version grand public de GPT. Pour faire produire des textes de type "articles" à GPT, il faut s'inscrire et entrer dans des interfaces un peu techniques des "prompts", c'est à dire une description circonstanciée du texte que GPT doit produire, ainsi que des paramètres (version exacte de GPT-davinci, curie...-, temperature, pénalité de fréquence...).

Pour ChatGPT, poser une question suffit pour obtenir une réponse au format texte.

ChatGPT, est donc plus accessible au grand public, mais moins précisément paramétrable et ne rend pas compte de toute la puissance de la technologie GPT.

ChatGTP encouragerait le plagiat ?

Le monde universitaire reproche à ChatGTP de permettre aux étudiants de pouvoir rendre des devoirs rédigés par GPT (et non par eux-mêmes) et de ne plus permettre aux professeurs de détecter les productions originales des étudiants de celles de GPT. En réalité, l'usage de ChatGPT dans ces articles concerne GPT et non seulement le chatbot dérivé de cette techno, ChatGTP. Autrement dit lorsque vous prenez connaissance d'un nouveau reproche adressé à "ChatGPT", il l'est à toute la technologie GPT.

Mais sur le fonds, je ne suis pas certain que le principal problème soit la détection de la GTP-fraude: il y a 20 ans, on n'imaginait pas que les étudiants plagieraient des textes copiés sur internet et qu'apparaitraient ensuite des logiciels qui parcourraient les milliards de documents du web pour détecter un éventuel plagiat dans un devoir d'étudiant.

Or, aujourd'hui, il me semble possibles d'apprendre à ces logiciels de détection de plagiat, avec les mêmes algo de ML/DL, le style (vocabulaire utilisé, structure des phrases, articulation des idées, usage de la ponctuation) de chaque étudiant et de le comparer au nouveau texte qu'il rend afin de déterminer si ce dernier se situe dans le prolongement de ce que l'étudiant déjà produit.

GTP va surtout faire baisser la diversité des contenus

Le véritable enjeu est ailleurs. La diffusion de GTP3 (puis GPT4, la prochaine itération de GPT en 2023) au sein de l'écosystème digital, va probablement avoir pour conséquence faire baisser la diversité des contenus diffusés. GPT se contente de réarticuler des concepts/idées/raisonnements majoritaires sur internet: GPT-3 "n'aime" pas les signaux faibles et idées réellement neuves et minoritaires car il n'arrive à comprendre un concept que s'il peut l'étudier sous toutes les coutures parce qu'il l'a vu traité et retraité dans des centaines voire des milliers de pages web.

On peut donc s'attendre à ce que GTP-3 répète d'une certaine manière les mêmes choses aux mêmes questions et à ce que ses utilisateurs (rédacteurs, créateurs, producteurs de contenu, pigistes, journalistes, etc...) relaient le conscensus mou, les idées déjà établies qui seraient alors relayées l'infini par les utilisateurs.

Or, c'est déjà une tendance que l'on observe sur internet depuis que tout le monde et n'importe qui s'est improvisé éditeur.

Cela a déjà conduit à une explosion du volume de contenus disponibles sur internet, mais qui sont très souvent des contenus dupliqués ou paraphrasés sans aucune analyse et traitement original.

Tout ce petit monde de producteur de textes au kilomètre fait, donc, déjà la course au volume, ce qui cette tribu, à reprendre des infos sans esprit critique. A titre d'exemple,  des milliers de media, parmi lesquels BBC, Ouest France, France Info, Letemps.ch, Lefigaro.fr... ont, par exemple, reprennent une fake news suivante au milieu de l'année en 2022: un éditeur de jeu vidéo chinois aurait nommé Mme Tang Yu, une "IA",  PDG de la société éditrice. Or, c'est une pure opération de communication. Il suffit de réaliser deux heures de recherche pour découvrir l'arnaque.

Avec GPT, qui n'exige même plus que de véritables rédacteurs paraphrase la dépêche de l'AFP, ce phénomène sera doublement amplifié.

GTP va encourage la diffusion du conscensus mou

D'abord, parce que GPT a augmenter encore la pression sur le volume de contenus à produire. Quoique l'on puisse lire ici et là, les algorithmes qui sélectionnent les contenus qui sont diffusés sur internet favorise la quantité et non la qualité/l'originalité/l'unicité. Cela vaut à la fois pour les algorithmes de Google pour les contenus sélectionnés sur les pages de résultat du moteur ou les moteurs de recommandations des fil d'actualités des réseaux sociaux). Donc, si l'on souhaite "faire de l'audience" sur internet, il faut produire en volume. Si l'on fait uniquement de la qualité, dans 95% des cas, on sera, en moyenne moins diffusé. GTP ne va faire qu'accentuer cette tendance.

Ensuite, la course à la diffusion du consensus mou va être amplifié par GTP, parce que les mêmes créateurs de contenu qui font déjà du contenu au kilomètre, sans analyse, vont pouvoir en produire 5 fois, 10 fois. Leur capacité à relayer des idées molles, du conscensus mou s'en trouvera encore amplifiée.

Si l'on va plus loin et que l'on adhère à la thèse selon laquelle ChatGPT pourrait devenir un concurrent de Google, dans la mesure où il est quasiment capable de donner les informations que les internautes recherchent, ChatGPT deviendrait aussi diffuseur direct du conscensus mou, ce qui contribuerait encore à applanir les idées et à appauvrir la diversité des idées/contenus du web pour les raisons précédemment exposés.

GTP va contraindre les marques à accélérer leur production de contenu

Enfin, de façon plus prosaïque et sur un plan commercial, GTP va accentuer la pression sur les entreprises qui produisent des contenus dans le cadre d'une stratégie de content marketing.

On a déjà observé aux cours de la décennie 2010-2020, une diminution de la rentabilité des contenus diffusés (le volume de contenus diffusés augmentant plus vite que la demande pour les mêmes contenus). En moyenne, un article publié aujourd'hui est beaucoup moins vu qu'il ne l'était il y a 15 ans.

Le recours à GTP débouchant sur une progression du volume des contenus diffusés, le nombre de vues en moyenne d'un article diminuera encore.

Traduction, de nombreuses entreprises vont être conduites à revoir leurs méthodes et stratégies de production de contenu, à ré-organiser leur "content factory". Mais nous traiterons ce sujet dans un autre article.

 GTP va tuer les rédacteurs

Il est probable que les rédacteurs qui rédigent des textes reprenant les idées des autres en apportant peu de valeur, soient une espèce en voie de disparition. Pour survivre, ils devront travailler avec GPT pour produire plus et pour moins cher. C'est aussi valable pour les journalistes dont la majorité se contentent de reproduire des infos transmises par les agences de presse ou détectées sur Twitter. La minorité des journalistes qui effectue un travail de journaliste, ne sera que très indirectement impactée.

En effet, GPT ne va pas remplacer avant 5 ans au moins, ceux qui réalisent un véritable travail éditorial ou qui ont des idées originales. Au delà de cette échéance de 5 ans, il est difficile de prévoir quoique ce soit.

 Un nouveau GAFAM va probablement émerger.

On va probablement devoir ajouter le O de OpenAI, à GAFAM car avec GTP et Dall-e cette société qui prévoit déjà 1 milliards de dollars de CA pour 2024 (donc demain) a un potentiel de plusieurs dizaines de milliards de dollars et deviendrait donc un nouveau géant du numérique avec 4 services facturables (génération de texte avec GPT, génératio d'images avec Dall-e, location de chabtbot pour les entreprises et moteur de recherche avec ChatGPT). Notons que ce ne sont pas les études des grands cabinets comme Gartner qui annoncent cela (cela tombe bien car 75% de leurs prévisions sont totalement fausses ).

J'adhère, par exemple, à la thèse qui veut que ChatGPT pourrait devenir un concurrent de Google puisqu'il fournit des réponses à des questions.

Google va devoir compter avec un nouveau concurrent, pour la première fois en 20 ans

ChatGPT, dont la version Beta raconte encore beaucoup de bétise, a le potentiel pour fournir des réponses justes et précises à des millions de questions.

Cette technologie pourrait être exploitée en direct par OpenAI ou par Microsoft, partenaire qui a financé Open AI à hauteur de $1 milliard pour développer une AGI (un algorithme qui aurait réponse à tout... un peu comme ChatbotGPT).

 

Contenus liés

Search