Demain, l'intelligence artificielle et les chatbots seront Open Source
Nous entrons apparemment dans l'ère du Chatbot et de l'IA OpenSource, grâce aux avancées incroyables de LLMs OpenSource sur les 10 dernières semaines. Source: une fuite de chez Google.
Les entreprises devraient s'y intéresser même si cela parait quelque peu technique.
Cela a aussi des conséquences sur la souveraineté, l'éthique et l'empreinte écologique de l'IA.
En résumé
OpenAI va probablement conserver le lead marketing et technologique
Mais, les entreprises vont, enfin, avoir le choix car la création de chatbots aussi performants que ChatGPT va devenir possible avec des logiciels OpenSource, mais pas grâce à Google qui est dépassé.
J'ai, à maintes reprises, évoqué ces sujets et nous avons confirmation de certaines de mes intuitions, grâce à un document qui a fuité de chez Google (c'est l'avis d'un seul employé de Google, mais il est très étayé). Ce document remonte à mi-avril (une éternité...)
Mais, il va donc mon sens, donc je le trouve pertinent 😉
J'ai traduit et commenté ce document pour le rendre (presque) lisible sur 24pm.
Voici l'analyse et les prévisions issues des recoupements de ce doc, de mes travaux de recherche et des échanges que j'ai eu avec le petit groupe qui travaille sur notre chatgpt français Opensource.
Google ne parvient pas, comme je le pensais, à sortir des produits aussi performants que ChatGPT ou les API d'OpenAI.
Pire, il se fait dépasser par le haut par OpenAI et par le bas, par l'Open Source qui met au point des modèles peu coûteux et plus faciles à entraîner, moins gourmands en puissance de calcul quand on les mets en production: Llama, Alpaca, Vicuna, GPT4all, Koala, Pythia12B, Dolly, StableLM...
Bloom est dans une catégorie à part, car il est gourmand.
On peut quasiment imaginer que demain, vous puissiez installer un logiciel faisant tourner un chatbot aussi performant que ChatGPT sur votre site, comme vous installez Wordpress: gratuit car OpenSource, et personnalisable.
Donc, souverain.
Donc, sécurisé (car aucun transfert de données sur des serveurs tiers)
Donc, respectueux du RGPD (car pas transfert de données vers les US, soumis à FISA et au Cloud Act).
Et, cerise sur le gâteau: écolo.
Eh, oui, car si les LLMs actuels, comme GPT, consomment de l'énergie, c'est parce qu'ils ont besoin de machines effectuant des calculs complexes pour nous répondre. Les LLMS Open Source sont de moins en moins gourmands et de plus en plus capables de tourner sur des machines normales (certains sur des Macbooks, d'autres sur des Rapsberries, d'autres sur des smartphones) sans se connecter à des serveurs externes comme ceux d'OpenAI.
Il est possible que je me trompe, mais 5 mois après le lancement de ChatGPT, nous entrons dans une nouvelle ère: celle du chatbot OpenSource.
Et pas que du chatbot, mais aussi de toutes les applications professionnelles qui reposent sur les LLMs comme GPT.