Extraction des caractéristiques
L’extraction des caractéristiques commence à partir d’un ensemble initial de données mesurées et construit des valeurs dérivées (caractéristiques) destinées à être informatives et non redondantes, facilitant ainsi les étapes ultérieures d’apprentissage et de généralisation et, dans certains cas, pour améliorer les interprétations humaines.
L'extraction de caractéristiques est liée à la réduction de la dimensionnalité.
Lorsque les données d'entrée dans un algorithme sont trop volumineuses pour être traitées et qu'il est soupçonné d'être redondant (par exemple, la même mesure en pieds et en mètres, ou la répétitivité des images présentées en pixels), elle peut être transformée en un ensemble réduit de fonctionnalités (également appelé un vecteur de fonctionnalité).
Déterminer un sous-ensemble des fonctionnalités initiales est appelé sélection de fonctionnalités. Les entités sélectionnées devraient contenir les informations pertinentes issues des données d'entrée, de sorte que la tâche souhaitée puisse être effectuée en utilisant cette représentation réduite au lieu des données initiales complètes.