Apprentissage non supervisé
L'apprentissage non supervisé est un système de machine learning qui apprend et crée des modèles à partir de jeu de données d’entraînement non étiquettées (contrairement au supervised learning).
Il s’agit d’un type d’apprentissage hebbien auto-organisé qui aide à trouver des modèles auparavant inconnus dans un ensemble de données sans étiquettes préexistantes. Il est également connu sous le nom d’auto-organisation et permet de modéliser les densités de probabilité d'entrées données. Il est l’une des trois principales catégories du machine learning avec l’apprentissage supervisé et l’apprentissage par renforcement. L'apprentissage semi-supervisé a également été décrit. Il s'agit d'une hybridation de techniques supervisées et non supervisées.
Deux des principales méthodes utilisées dans l’apprentissage non supervisé sont l’analyse en composantes principales et en grappes. Cluster analys est utilisé dans l'apprentissage non supervisé pour regrouper ou segmenter des ensembles de données avec des attributs partagés afin d'extrapoler des relations algorithmiques. L'analyse en grappes est une branche de l'apprentissage automatique qui regroupe les données qui n'ont pas été étiquetées, classées ou catégorisées. Au lieu de répondre aux commentaires, l'analyse par groupe identifie les points communs dans les données et réagit en fonction de la présence ou de l'absence de tels points communs dans chaque nouvel élément de données. Cette approche permet de détecter des points de données anormaux qui ne correspondent à aucun des groupes.
Une application centrale de l’apprentissage non supervisé est dans le domaine de l’estimation de la densité dans les statistiques, mais englobe de nombreux autres domaines d’apprentissage sans supervision impliquant la synthèse et expliquer les caractéristiques de données. On pourrait opposer l'apprentissage supervisé à celui-ci en affirmant que l'apprentissage supervisé vise à inférer une distribution de probabilité conditionnelle
p X (x | y) {\ textstyle p_ {X} (x \, | \, y)}
conditionnée sur l'étiquette
y {\ textstyle y}
des données d'entrée;
L’apprentissage non supervisé vise à déduire une distribution de probabilité a priori
p X (x) {\ style de texte p_ {X} (x)}.
Les réseaux antagonistes génératifs peuvent également être utilisés avec un apprentissage non supervisé, bien qu'ils puissent également être appliqués aux techniques supervisées et de renforcement.