Machine à vecteurs support
Les machines à vecteurs support (ou support vector machine -SVM- ou les réseaux de vecteurs support ) sont des modèles d’apprentissage supervisés avec des algorithmes d' apprentissage associés qui analysent les données utilisées pour la classification et l'analyse de régression.
Étant donné un ensemble d'exemples de formation, chacun marqué comme appartenant à l’une ou l'autre des deux catégories, un algorithme de formation de SVM construit un modèle qui attribue de nouveaux exemples à une catégorie ou t - il d’autres, ce qui en fait un non probabiliste binaire classificateur linéaire (bien que Des méthodes telles que la mise à l’échelle de Platt existent pour utiliser SVM dans un contexte de classification probabiliste). Un modèle SVM est une représentation des exemples sous forme de points dans l’espace, mappés de telle sorte que les exemples de catégories distinctes soient divisés par un écart clair et aussi large que possible. De nouveaux exemples sont ensuite cartographiés dans ce même espace et prédits à appartenir à une catégorie basée sur le côté de l’espace sur lequel ils se situent.
En plus de réaliser de la classification linéaire, un machine à vecteurs support peut efficacement effectuer une classification non-linéaire en utilisant ce qu'on appelle le tour du noyau, mappant implicitement leurs entrées dans des espaces caractéristiques de haut niveau.
Lorsque les données ne sont pas supprimées, l’apprentissage supervisé n’est pas possible et une approche d’apprentissage non supervisée est nécessaire pour tenter de regrouper naturellement les données en groupes, puis d’appliquer de nouvelles données à ces groupes formés. L’algorithme support-vector clustering , créé par Hava Siegelmann et Vladimir Vapnik, applique la statistique des vecteurs support, développée dans l'algorithme de support aux machines à vecteurs support, pour catégoriser les données non étiquetées. Il s'agit de l'un des algorithmes de clustering les plus largement utilisés applications industrielles.