Un large language model (LLM) en intelligence artificielle est un type de modèle de traitement du langage naturel qui utilise des réseaux de neurones profonds pour apprendre à prédire des séquences de mots dans un texte. Ces modèles peuvent être entraînés sur de vastes quantités de données textuelles pour apprendre à générer du texte cohérent et réaliste, répondre à des questions, traduire des langues et effectuer d'autres tâches de traitement du langage naturel.
Les plus célèbres des LLM sont sans doute GPT-3 (Generative Pre-trained Transformer 3), développé par OpenAI, Bloom, un modèle Open Source développé sur la plateforme Hugging Face, Llama de Facebook/Meta qui font partie des modèles les plus avancés en matière de traitement du langage naturel. Les LLM sont utilisés dans de nombreuses applications d'IA, notamment dans les assistants virtuels, la génération de contenu et la traduction automatique.
35 Formations
Intelligence Artificielle
Marketing Digital
Ecommerce
Forfait illimité: à partir de 166€/mois
Accès 100 collaborateurs