Transfert learning
Le transfert learning est une technique de deep learning qui permet de ré-exploiter des modèles généraux déjà entraînés (à reconnaitre des photos, par exemple) afin d’accélérer l’élaboration de modèle répondant aux besoins précis d’une entreprise.
Le transfert learning évite à une entreprise de repartir de zéro lorsqu’elle cherche à créer un modèle d’intelligence artificielle. Le transfert learning s’est largement développée car il permet de réduire le volume de données nécessaires à l’entraînement des modèles, mais aussi de réduire le temps de calcul. Il permet de réaliser des économies de temps et d’argent (location de la puissance de calcul).
Comment fonctionne le transfert learning ?
Le chef de projet identifie un modèle existant qui assure des fonctions similaires à celle qu’il souhaite voir réaliser par le modèle qu’il cherche à construire. Par exemple, s’il cherche à construire un modèle qui reconnaissance les chats sur une photo, il peut exploiter un modèle de deep learning qui reconnait les chiens. Il ne retient du modèle initial que les couches inférieures (celles qui reconnaissent les choses avec une tête, quatre pattes et deux oreilles) et entraîne le modèle à reconnaître spécifiquement les chats en lui fournissant des photos de chats.
Comment intégrer le transfert learning dans un système d’intelligence artificielle ?
GRDF a eu recours au transfert learning afin de mettre en place un système de maintenance prédictive de son réseau de régulateurs de gaz. Les 5 millions de régulateurs de gaz, installés chez les particuliers comme chez les professionnels permettent de s’assurer du bon fonctionnement de l’installation de distribution du gaz. Vérifier en permanence ces 5 millions de régulateurs couteraît une fortune à GRDF. Pour détecter ceux qui nécessitent une opération de contrôle ou de maintenance, GRDF possède une base patrimoniale précieuse. Les agents de GRDF qui relèvent les compteurs de gaz, prennent systématiquement deux à trois photos de l’installation qui inclut notamment le régulateur (qui se situe à côté du compteur).
C’est cette base de clichés qui est utilisée par GRDF pour optimiser la maintenance des régulateurs. Cette opération ne vise pas à détecter des régulateurs déffectueux, mais simplement à affiner les bases patrimoniales de GRDF qui n’indiquent pas le modèle de régulateur installé chez un client donné. En cas de campagne de contrôle d’un modèle de régulateur donné, GRDF, de façon étonnante, n’a pas la liste des clients chez qui ce type de régulateur est installé.
Pour entraîner le modèle à reconnaître les régulateurs, GRDF a créé trois modèles de deep learning.
Le premier modèle permet de récupérer Pour identifier les photos exploitables, parmi les différents clichés pris par l’agent qui a effectué le relevé.
Ce premier modèle a été construit sur base d’un modèle pré-existant (RESNET) qui a été affiné via du transfert learning en lui fournissant ensuite des photos permettant de terminer son entraînement.
Un deuxième modèle permet de reconnaître la famille de régulateurs. Il s’agit donc d’un modèle multiclasse.
Ce deuxième modèle a été construit sur base du modèle pré-existant Xception, puis a été affiné via du transfert learning, là encore, en lui fournissant de nouveaux clichés. Le modèle final affiche un taux de fiabilité de 65%
Enfin, une troisième série de 10 modèles binaires (également construit avec du transfert learning) a été créé afin d’augmenter le taux de fiabilité : une fois que le deuxième algorithme a fourni la famille du régulateur, le cliché est soumis à un algorithme spécialisé dans la famille de régulateur identifié par le 2eme modèle, qui vérifie (oui/non) que le régulateur appartient bien à la famille de régulateur identifié précédemment.