13 plateformes de Machine Learning no code / AutoML pour démarrer en Intelligence Artificielle sans connaissances techniques
Faire de l’intelligence artificielle sans savoir coder, semble être à la portée de tout un chacun grâce aux plateformes d’AutoML. Voici 13 plateformes d’autoML qui intéressent autant les non codeurs que les codeurs qui souhaitent gagner du temps.
Qu'est-ce que l'Automated Machine Learning ?
L’Auto ML ou Automated Machine Learning, correspond à des services en ligne permettant d’entraîner des « modèles » sans avoir besoin de connaissances avancées en codage et de recourir aux suites logicielles (frameworks) traditionnellement utilisées par les data scientists et autres spécialistes de l’IA comme Tensor Flow, Microsoft CNTK ou Theano, entre autres qui nécessitent un niveau technique relativement élevé.N
L'Automated Machine learning ou (Auto ML) est une catégorie de logiciels/services très proche d'une autre catégorie: l'Intelligence Artificielle "No Code"
L'intelligence artificielle "No code" correspond à des services avec des interfaces visuels qui permettent d'entrainer des modèles sans recourir à quelques lignes de code que ce soit et cible en priorité les professionnels des "métiers" (marketing, finance, CRM...)
L'Automated Machine learning correspondrait à des services avec parfois des interfaces graphiques qui permettent aussi d'entraîner des modèles, mais ciblant plutôt les data scientists que les gens des métiers. Les plateformes d'AutoML peuvent donc être un peu plus complexes.
Mais, la frontière entre les deux catégories de services n'est pas étanche et nombre de plateformes d'AutoML tentent de s'intégrer dans la mouvance AI No Code.
A l'inverse, certains services d'AutoML sont des options au sein de plateformes d'IA complexes.
A quoi servent les plateformes d'Automated Machine Learning ?
Les plateformes d’Auto ML permettent, par exemple, à des professionnels du marketing, de créer des modèles permettant de prédire l’évolution des ventes ou la probabilité qu’un abonné se désabonne à un service ou encore de classifier des éléments (par exemple, d’identifier les objets présents dans des images).
On comprend donc qu’il s’agit de rendre plus accessible la création de modèles correspondant à des usages courant de d’une branche l’intelligence artificielle (le machine learning/le deep learning) qui reposent sur l’analyse de série de données (historique de ventes, exemples d’images…) et vise à dégager des schémas type permettant de prévoir les ventes, par exemple.
Traditionnellement, il faut collecter des données, formater ces données de façon à ce qu’elles deviennent exploitables par les plateformes d’intelligence artificielle, choisir la famille d’algorithmes de Machine Learning (Random Forest, SVM, Decision Tree…) obtenant les meilleures performances relativement à la tâche que l’IA doit accomplir, puis d’affiner en façon intuive le paramétrage de l’algorithme afin d’améliorer la précision du modèle qu’il produira, mettre en production ce modèle, puis le faire évoluer.
Ce travail suppose de maitriser à la fois la manipulation de données, la connaissance des familles d’algorithmes, des plateformes d’intelligence artificielle et des techniques de réglages des algorithmes, puis de mise en production.
Tout cela rend l’élaboration de modèles, inaccessibles à la majorité des professionnels du marketing, de l’ecommerce ou du CRM, sans l’appui de data engineers/statisticiens.
Avec l’Auto ML, une partie de ces obstacles sont levés.
Le responsable marketing, ayant acquis un socle de formation au Machine learning collecte les données (il peut s’agir d’un tableur Excel avec un historique de vente), les téléchargent sur la plateforme d’Auto ML et sélectionne la fonction que le modèle doit réaliser (prévision des ventes, identification d’images, etc…). Le service met alors en concurrence différentes familles d’algorithme (Random Forest, SVM, Decision Trees…) puis tests différents jeux de paramètres, afin d’identifier le modèle le plus précis et le plus fiable (ie, celui qui réalisera les prévisions de ventes les plus précises par exemple). Cela suppose que le système réalise un très grand nombre de simulations consommant des quantités très importantes de ressources informatiques, sensiblement plus que lorsqu’un spécialiste humain de l’élaboration de modèles d’IA crée « manuellement » le modèle, en testant sur base de son expérience et de son expertise, uniquement les familles d’algorithmes les plus adaptés à l’objectif et en identifiant plus vite les réglages les plus efficaces.
En revanche, attendu que les performances des modèles finaux (leur capacité à prédire avec précision les ventes ou à ne pas commettre d’erreurs dans l’identification de objets présents sur les photos, par exemple) dépendent de la richesse, de qualité et de la diversité des données et que les plateformes d’AutoML qui ne peuvent analyser la qualité des données et encore moins imaginer s’il manque des données indispensables pour fiabiliser les prévisions des ventes, les plateformes d’auto ML ne peuvent automatiser 100% du process de mise au point des modèles d’IA.
Autrement dit, les services d’Auto ML permettent à des gens des métiers qui comprennent l’intelligence artificielle, mais qui ne maitrisent pas les langages comme Python utilisés dans l’intelligence artificielle ou les frameworks comme TensorFlow, de créer des modèles correspondant à des applications communes et peu complexes.
Ces plateformes d’AutoML peuvent sont utilisées par les professionnels de la donnée et statisticiens (data analysts) qui ne connaissent pas encore les languages tels que Python ou les frameworks.
Autre cas d’usage de l’auto ML : les spécialistes de l’IA qui souhaitent réduire le temps de développement des modèles en confiant le test des différentes familles d’algorithmes à des robots afin de dégager du temps pour d’autres tâches (la préparation de données le déploiement des modèles…).
Principales plateforme d’AutoML
Voici les principales plateformes d’AutoML généralistes.
Notez que certaines sont liés à des « studio » d’intelligence artificielle, c’est-à-dire des environnements souvent visuels de gestion de projets qui facilitent l’intégration des différentes et, le cas échéant, leur déploiement/mise en production et leur évolution dans le temps.
Plateforme | Editeur | Cas d’usage | Préparation / Ingénierie des données | Mise en production | Outils liés |
Sagemaker Canvas | Amazon | Prévision des ventes, prévision des démissions, identification des fraudes, optimisation des stocks | Oui | Oui | Sagemaker Studio |
Sagemaker Autopilot | Amazon | Prévision des ventes, prévision des désabonnements, évaluation des risques | Oui | Oui | Sagemaker Studio |
Azure ML (option AutoML à activer) | Microsoft | Oui | |||
Google AutoML | Oui | Oui | Google Cloud | ||
H2O.ia / Studio | H2O.ia | Oui | |||
Datarobot /Studio | Datarobot | ||||
C3.ai | C3.ai | ||||
Dataiku (option) | Dataiku | Oui | |||
Alteryx /Studio | Alteryx | ||||
Rapidminer /Studio | Rapidminer | ||||
Nanonets | Oui | ||||
Clarify.ai | Clarify | Oui | Traitement du langage | ||
Akkio | Akkio | Marketing, vente, finance | |||
Levity | Levity | ||||
Lobe | Lobe | ||||
Open Source | |||||
AutoSklearn | Scikitlearn | ||||
TPOT | |||||
Knime /Studio | Knime | Oui |
L’autoML permet, en théorie d’ouvrir le monde du machine learning aux non codeurs/non data scientists. Voici 10 plateformes d’Auto ML destinés aux « gens des métiers ».