Traduction francaise officielle de 50 mots de l'intelligence artificielle en 2025
Le ministère de la culture a publié la traduction officielle du vocabulaire de l'intelligence artificielle. Les voici sur une seule page.
1. Agent (programme) (anglais: agent
Logiciel envoyé sur un réseau pour effectuer une tâche à la place de l’utilisateur et sans son intervention.
→ On utilise, par exemple, les agents pour le filtrage d’informations et la recherche sur l’internet.
→ Un agent est dit « intelligent » lorsqu’il utilise les techniques de l’intelligence artificielle.
Journal officiel du 1er septembre 2000
2. Apprentissage antagoniste (anglais: adversarial machine learning, AML)
Apprentissage automatique qui consiste à entraîner un modèle à partir d’un jeu de données comprenant des données trompeuses ou ambiguës, de manière qu’il apprenne à discerner de telles données.
→ Les données trompeuses ou ambiguës sont souvent produites par un autre modèle.
→ L’apprentissage antagoniste sert par exemple à améliorer la reconnaissance d’infox vidéo, ou d’images et de textes falsifiés.
Journal officiel du 6 septembre 2024
3. Infox (anglais: fakenews)
Information mensongère ou délibérément biaisée.
→ Une infox peut servir, par exemple, à favoriser un parti politique au détriment d’un autre, à entacher la réputation d’une personnalité ou d’une entreprise, ou à contredire une vérité scientifique.
Journal officiel du 23 mai 2020
4. Infox vidéo , vidéotox (anglais: deep fake)
Infox qui se présente sous la forme d’une vidéo falsifiée grâce aux techniques de l’intelligence artificielle, en particulier à celles de l’apprentissage profond.
→ La production d’infox vidéo fait notamment appel à l’analyse de l’expression faciale, à la synthèse vocale et à la synchronisation labiale.
Journal officiel du 23 mai 2020
5. Apprentissage automatique, apprentissage machine (machine learning)
Processus par lequel un algorithme évalue et améliore ses performances sans l’intervention d’un programmeur, en répétant son exécution sur des jeux de données jusqu’à obtenir, de manière régulière, des résultats pertinents.
→ Un algorithme d’apprentissage automatique comporte un modèle dont il modifie les paramètres, de valeur initiale en général aléatoire, en fonction du résultat constaté.
→ L’apprentissage automatique est fréquemment utilisé pour le traitement du langage naturel et la vision par ordinateur, ou pour effectuer des diagnostics et des prévisions.
Journal officiel du 9 décembre 2018
6. Apprentissage autosupervisé (anglais: self supervised learning, SSL)
Apprentissage automatique réalisé sur un jeu de données d’entraînement non annoté, qui consiste à découper automatiquement chacune des données de ce jeu en fragments, à retirer un de ces fragments qu’on considère comme une annotation à reconstituer à partir des données restantes par un apprentissage ainsi supervisé, puis à réitérer l’opération pour chacun des fragments.
→ L’apprentissage autosupervisé, par exemple appliqué à une tâche de classification, détecte de façon autonome les classes de données.
→ L’apprentissage autosupervisé est systématiquement utilisé dans les grands modèles de langage.
En cours de publication au Journal officiel
7. Apprentissage non supervisé (anglais: data clustering, unsupervised learning, unsupervised training )
Apprentissage automatique dans lequel l’algorithme utilise un jeu de données brutes et obtient un résultat en se fondant sur la détection de similarités entre certaines de ces données.
→ L’apprentissage non supervisé est utilisé, par exemple, pour l’identification de comportements et la recommandation d’achats.
Journal officiel du 9 décembre 2018
8. Apprentissage par renforcement (anglais: reinforcement learning )
Apprentissage automatique dans lequel un programme extérieur évalue positivement ou négativement les résultats successifs de l’algorithme, l’accumulation des résultats permettant à l’algorithme d’améliorer ses performances jusqu’à ce qu’il atteigne un objectif préalablement fixé.
→ L’apprentissage par renforcement est fréquemment utilisé dans la robotique.
→ L’efficacité de l’apprentissage par renforcement a été attestée dans certains jeux stratégiques comme le jeu de go.
Journal officiel du 9 décembre 2018
9. Apprentissage par transfert (anglais: transfer learning )
Apprentissage automatique qui consiste à soumettre un modèle préentraîné à une nouvelle phase d’entraînement sur un volume réduit de données relatives à un domaine cible afin que le modèle ainsi obtenu génère des réponses pertinentes pour ce domaine.
→ L’apprentissage par transfert réduit la durée et le coût de l’apprentissage automatique dans un domaine cible, notamment lorsque le volume de données disponibles dans ce domaine est faible.
Journal officiel du 6 septembre 2024
10. Apprentissage profond (anglais: deep learning, deep structured learning, hierarchical learning)
Apprentissage automatique qui utilise un réseau de neurones artificiels composé d’un grand nombre de couches dont chacune correspond à un niveau croissant de complexité dans le traitement et l’interprétation des données.
→ L’apprentissage profond est notamment utilisé dans la détection automatique d’objets au sein d’images et dans la traduction automatique.
Journal officiel du 9 décembre 2018
11. Apprentissage supervisé (anglais: supervised learning, supervised training)
Apprentissage automatique dans lequel l’algorithme s’entraîne à une tâche déterminée en utilisant un jeu de données assorties chacune d’une annotation indiquant le résultat attendu.
→ L’apprentissage supervisé recourt le plus souvent aux réseaux de neurones artificiels.
→ L’apprentissage supervisé est utilisé, par exemple, pour la reconnaissance d’images et la traduction automatique.
Journal officiel du 9 décembre 2018
12. Calcul intensif (anglais: supercomputing)
Ensemble des techniques et des moyens destinés à traiter des applications complexes en faisant appel à des ordinateurs spécialisés dans le traitement rapide de gros volumes de données numériques.
Journal officiel du 10 octobre 1998
13. Centre de données (anglais: data center )
Site physique où sont regroupées des infrastructures informatiques et de télécommunication destinées à stocker, à traiter ou à distribuer des données de façon sécurisée.
→ Une organisation peut posséder son ou ses propres centres de données ou recourir à ceux d’un prestataire de services.
→ L’informatique en nuage recourt aux centres de données.
Journal officiel du 16 novembre 2019
14. Dialogueur, agent de dialogue (anglais: chatbot, conversational agent)
Logiciel spécialisé dans le dialogue en langage naturel avec un humain, qui est capable notamment de répondre à des questions ou de déclencher l’exécution de tâches.
→ Un dialogueur peut être intégré à un terminal ou à un objet connecté.
→ Les dialogueurs sont utilisés, par exemple, dans les techniques de vente, les moteurs de recherche et la domotique.
→ On trouve aussi le terme « agent conversationnel », qui est déconseillé.
Journal officiel du 9 décembre 2018
15. Données FAIR (anglais: FAIR data, findable accessible
interoperable reusable data)
Données dont l’identification, la description normalisée, les conditions d’accès techniques ou juridiques et le type de licence facilitent leur mise à disposition et leur exploitation par les personnes intéressées.
→ Les données FAIR sont principalement utilisées dans les domaines scientifiques.
→ Les données FAIR sont généralement des données liées ou des données ouvertes.
Journal officiel du 9 mars 2021
16. Données liées (anglais: linked data )
Données dont la description est normalisée, ce qui permet de les lier, via leur identifiant universel de ressource, avec des données provenant d’autres sources et décrites de la même façon.
Journal officiel du 9 mars 2021
17. Données ouvertes (anglais: open data)
Données qu’un organisme met à la disposition de tous sous forme de fichiers numériques afin de permettre leur réutilisation.
→ Les données ouvertes n’ont généralement pas de caractère personnel.
→ Elles sont accessibles dans un format favorisant leur réutilisation.
→ La réutilisation des données ouvertes peut être soumise à conditions.
Journal officiel du 3 mai 2014
18. Entrepôt de données (anglais: data warehouse)
Infrastructure logicielle qui collecte, structure et stocke des données d’une organisation afin d’en permettre l’exploitation par des outils d’aide à la décision ; par extension, ces données elles-mêmes.
→ L’entrepôt de données est généralement hébergé dans un centre de données.
Journal officiel du 24 mars 2023
19. Expert en mégadonnées (anglais: data scientist )
Spécialiste de l’extraction et de l’exploitation d’informations pertinentes à partir de mégadonnées, qu’il organise, traite et interprète à l’aide d’outils statistiques, mathématiques et informatiques.
Journal officiel du 26 septembre 2017
20. Exploration de données (anglais: data mining, datamining)
Processus de recherche dans un ensemble de données destiné à détecter des corrélations cachées ou des informations nouvelles.
Journal officiel du 27 février 2003
21. Explorateur de modèle (anglais: model-checker )
Dispositif permettant l’exploration d’un modèle.
Journal officiel du 1er janvier 2013
22. Exploration de modèle (anglais: model-checking )
Méthode de vérification algorithmique, qui permet de déterminer avec efficacité si un système représenté par un modèle satisfait à un ensemble de spécifications formelles et qui, si une des spécifications n’est pas vérifiée, fournit des contre-exemples servant à identifier la source des erreurs.
→ L’exploration de modèle trouve de nombreuses applications dans les industries du logiciel et du matériel, la vérification de puces, les protocoles de communication, les logiciels pilotes de périphériques, les systèmes critiques embarqués et les algorithmes de sécurité.
Journal officiel du 1er janvier 2013
23. Génération automatique d’audio (anglais: AI audio generation, audio generative AI)
Opération qui consiste à produire ou à modifier des contenus audio, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.
→ La génération automatique d’audio est notamment employée pour composer des œuvres musicales en imitant un style donné ou pour produire un énoncé oral en imitant une voix particulière.
Journal officiel du 6 septembre 2024
24. Génération automatique de texte (anglais: AI text generation, automatic text generation, text generation)
Opération par laquelle un grand modèle de langage, en réponse à une instruction générative, produit, modifie ou complète automatiquement des textes.
→ La génération automatique de texte en langue naturelle peut être employée, par exemple, pour répondre à une simple question, produire un résumé, un rapport, une traduction, voire une œuvre littéraire.
→ La génération automatique de texte en langage de programmation est notamment employée à des fins d’écriture ou de correction de codes sources.
Journal officiel du 6 septembre 2024
25. Génération automatique d’image (anglais: AI image generation, automatic image generation, image2image, image-to-image, text2image, text-to-image )
Opération qui consiste à produire ou à modifier des images, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.
→ La génération automatique d’image peut être appliquée aux images animées. On parle alors de génération automatique de vidéo.
Journal officiel du 6 septembre 2024
26. Grand modèle de langage, GML (anglais: large language model, LLM )
Modèle génératif qui, à partir de grands volumes de données textuelles, calcule des probabilités des enchaînements de jetons textuels en vue de la génération automatique de texte ou de code informatique.
→ Les données textuelles du jeu d’entraînement d’un grand modèle de langage sont généralement moissonnées au préalable sur la toile et traitées par des transformeurs.
→ Les grands modèles de langage sont notamment employés dans les dialogueurs, la transcription automatique de la parole et la synthèse vocale.
Journal officiel du 6 septembre 2024
27. Informatique en périphérie (anglais: edge computing, edge processing)
Traitement des données qui s’effectue en périphérie d’un réseau de télécommunication, au moyen d’un dispositif proche de la source de ces données ou intégré à celle-ci.
→ La source des données est généralement un objet connecté.
→ L’informatique en périphérie permet notamment d’améliorer le temps de réponse d’un objet connecté et de réduire le volume des données qui transitent par le réseau.
→ Elle offre également une meilleure sécurité des données en évitant un traitement centralisé et en limitant le transfert de données sensibles.
Journal officiel du 30 juillet 2021
28. Instruction générative (anglais: prompt)
Consigne donnée par un utilisateur à un modèle génératif, généralement formulée en langue naturelle, qui décrit la tâche à accomplir.
→ L’instruction générative peut prendre la forme d’un texte à compléter, d’une question, d’une consigne à respecter dans la production de la réponse, voire d’un ou de plusieurs exemples de résultats attendus.
→ On trouve aussi le terme « invite », qui est déconseillé dans ce sens.
Journal officiel du 6 septembre 2024
29. Intelligence artificielle (anglais: artificial intelligence )
Champ interdisciplinaire théorique et pratique qui a pour objet la compréhension de mécanismes de la cognition et de la réflexion, et leur imitation par un dispositif matériel et logiciel, à des fins d’assistance ou de substitution à des activités humaines.
Journal officiel du 9 décembre 2018
30. Intelligence artificielle embarquée (anglais: artificial intelligence of things, AIoT, edge AI, edge artificial intelligence)
Dispositif d’intelligence artificielle intégré dans un objet connecté, qui lui permet de traiter en temps réel les données qu’il collecte pour déclencher la prise automatique de décisions.
→ L’intelligence artificielle embarquée utilise l’informatique en périphérie.
Journal officiel du 30 juillet 2021
31. Intelligence artificielle générative (anglais: GenAI, generative AI, generative artificial intelligence
Branche de l’intelligence artificielle mettant en œuvre des modèles génératifs, qui vise à produire des contenus textuels, graphiques ou audiovisuels.
Journal officiel du 6 septembre 2024
32. Jeton textuel (anglais: text token, token)
Donnée élémentaire d’un grand modèle de langage, qui est constituée d’une suite de caractères obtenue par la segmentation automatique d’un texte.
→ La segmentation en jetons textuels est utilisée aussi bien dans la phase d’apprentissage automatique que dans la phase de traitement d’une instruction générative.
→ Le nombre de jetons textuels sert à mesurer la taille d’un grand modèle de langage ; il permet aussi d’estimer et de facturer le coût de fonctionnement des grands modèles de langage commerciaux.
Journal officiel du 6 septembre 2024
33. Lac de données (anglais: data lake )
Infrastructure logicielle qui collecte des mégadonnées dans leur format d’origine, généralement en continu, et les associe automatiquement à des métadonnées qui permettent d’en préparer l’exploitation ; par extension, ces mégadonnées elles-mêmes.
Journal officiel du 24 mars 2023
34. Marécage de données (anglais: data swamp )
Lac de données qui est devenu inexploitable.
→ Un marécage de données est le plus souvent le résultat d’une insuffisance des moyens consacrés à la gestion d’un lac de données.
Journal officiel du 24 mars 2023
35. Mégadonnées (anglais: big data )
Données structurées ou non dont le très grand volume requiert des outils d’analyse adaptés.
→ On trouve aussi le terme « données massives ».
Journal officiel du 22 août 2014
36. Métadonnée (anglais: meta data )
Donnée qui exprime une propriété commune à un ensemble de données de façon à en permettre l’exploitation.
→ Une métadonnée peut être un nom, une date, un lieu ou toute autre propriété utile à l’exploitation des données.
→ Les métadonnées peuvent être créées a priori, comme dans la conception d’une base de données, ou a posteriori, à partir d’un ensemble de données collectées, comme dans les applications de traitement automatique des langues naturelles.
Journal officiel du 24 mars 2023
37. Modèle à bruit statistique (anglais: diffusion model, diffusion probabilistic model, latent diffusion model,
LDM, score-based generative model)
Modèle génératif obtenu par un apprentissage automatique, au cours duquel est éliminé le bruit statistique préalablement ajouté aux données du jeu d’entraînement, et qui produit des contenus graphiques ou audio nouveaux.
→ L’instruction générative donnée à un modèle à bruit statistique peut être une image assortie d’un texte spécifiant par exemple l’application d’un style ou l’ajout d’un élément dans la composition du contenu à produire.
Journal officiel du 6 septembre 2024
38. Modèle génératif (anglais: deep generative model, foundation model, generative model)
Résultat d’un apprentissage automatique destiné à être appliqué à une tâche de génération de données comparables à celles de son jeu de données d’entraînement.
→ Un modèle génératif est généralement obtenu par l’application d’un apprentissage supervisé à un modèle préentraîné.
→ Un modèle génératif est notamment utilisé dans la génération automatique de texte, d’image et d’audio.
→ On trouve aussi, dans le langage professionnel, le terme « modèle de fondation », qui est déconseillé.
Journal officiel du 6 septembre 2024
39. Modèle préentraîné (anglais: pretrained model)
Résultat d’un apprentissage automatique généraliste réalisé sur un grand volume de données, qui est destiné à être réutilisé dans une grande variété de tâches, généralement à l’issue d’un apprentissage par transfert.
→ Un modèle préentraîné est accompagné d’une notice.
Journal officiel du 6 septembre 2024
40. Moissonnage de données (anglais: web harvesting, web scraping)
Extraction automatisée de contenus de sites de la toile, pratiquée en vue d’un traitement spécifique.
→ Le moissonnage de données est utilisé, par exemple, dans le domaine commercial pour établir des comparaisons de prix ou évaluer la réputation d’une marque.
Journal officiel du 30 avril 2022
41. Neurone artificiel, neurone formel (anglais: artificial neuron, artificial neurone, formal neuron, formal neurone )
Dispositif à plusieurs entrées et une sortie, qui simule certaines propriétés du neurone biologique.
→ La valeur de sortie du neurone artificiel est une fonction non linéaire, généralement à seuil, d’une combinaison de valeurs d’entrée dont les paramètres sont ajustables.
Journal officiel du 9 décembre 2018
42. Notice de modèle préentraîné (anglais: model card)
Ensemble des informations qui accompagnent un modèle préentraîné et qui définissent les caractéristiques de son jeu de données d’entraînement, son paramétrage et le cadre de son utilisation.
Journal officiel du 6 septembre 2024
43. Objet connecté (anglais: connected device)
Objet qui est capable, outre sa fonction principale, d’envoyer ou de recevoir des informations par l’intermédiaire d’un réseau de télécommunication.
→ La capacité à envoyer ou à recevoir des informations permet, dans certains cas, d’étendre ou de diversifier les fonctions de l’objet.
→ Les objets connectés relèvent, par exemple, des domaines du transport (véhicule connecté), de la santé (automesure connectée), de l’industrie (outillage connecté), de la domotique (compteur électrique interactif) ou encore de la vie quotidienne (montre connectée).
Journal officiel du 11 janvier 2018
44. Plateforme de données (anglais: data hub )
Infrastructure logicielle qui regroupe des données, en général structurées, liées à un domaine d’activité et qui les rend disponibles pour l’exploitation par les parties prenantes.
→ Les données sont hébergées dans un ou plusieurs centres de données.
→ Les plateformes de données permettent de regrouper, par exemple, des données relatives à la santé ou à l’éducation.
Journal officiel du 24 mars 2023
45. Réseau de neurones artificiels, réseau de neurones, réseau de neurones formels (anglais: artificial neural network, neural network )
Ensemble de neurones artificiels interconnectés qui constitue une architecture de calcul.
Journal officiel du 9 décembre 2018
46. Science des données (anglais: )
Discipline qui fait appel à des méthodes statistiques, mathématiques et informatiques pour analyser des données, en particulier des mégadonnées, afin d’en extraire toute information utile.
Journal officiel du 9 mars 2021
47. Synthèse vocale de texte SVT, synthèse vocale (anglais: text-to-speech, TTS)
Conversion automatique d’un texte en un énoncé oral, qui recourt notamment aux techniques de traitement automatique des langues naturelles et de production de la parole.
→ La synthèse vocale de texte facilite, par exemple, l’accès des personnes malvoyantes aux outils informatiques.
Journal officiel du 16 novembre 2019
48. Transcription automatique de la parole (anglais: speech-to-text, STT, voice typing)
Conversion automatique d’un énoncé oral en texte, qui recourt notamment aux techniques de traitement du signal et de traitement automatique des langues naturelles.
Journal officiel du 16 novembre 2019
49. Transformeur (anglais: transformer )
Réseau de neurones artificiels qui réalise un traitement parallèle des données d’entraînement d’un apprentissage autosupervisé afin de développer un modèle génératif.
→ Le traitement parallèle permet d’accélérer l’apprentissage et ainsi d’exploiter à faible coût des jeux de données hétérogènes, peu ou pas structurées.
→ Le transformeur est notamment utilisé dans la génération automatique de texte, d’image et d’audio.
Journal officiel du 6 septembre 2024
50. Triturage de données (anglais: data crunching)
Traitement automatisé de mégadonnées brutes qui consiste à les mettre en forme pour permettre leur analyse grâce aux méthodes de la science des données.
→ Le triturage de données peut inclure des changements de format, des corrections d’erreurs et des filtrages des données.
Journal officiel du 30 avril 2022