Réseau neuronal à capsule
Un réseau neuronal à capsule (CapsNet) est un système de machine learning de la famille des réseaux neuronaux artificiels (RNA) pouvant être utilisé pour mieux modéliser des relations hiérarchiques. Cette approche est une tentative de reproduire plus fidèlement une organisation neuronale biologique.
L'idée est d'ajouter des structures appelées «capsules» à un réseau de neurones à convolution (CNN) et de réutiliser les sorties de plusieurs de ces capsules pour former des représentations plus stables (par rapport à diverses perturbations) de capsules d'ordre supérieur. La sortie est un vecteur consistant en la probabilité d'une observation et une pose pour cette observation . Ce vecteur est similaire à ce qui est fait par exemple lors de la classification avec localisation dans CNN.
Parmi les autres avantages, les capsnets répondent au "problème de Picasso" dans la reconnaissance d’image: les images qui ont toutes les parties droites mais qui ne sont pas dans la relation spatiale correcte (par exemple, dans un "visage", les positions de la bouche et de l’œil sont commuté). Pour la reconnaissance d’image, les capsnets exploitent le fait que, bien que les changements de point de vue aient des effets non linéaires au niveau des pixels, ils ont des effets linéaires au niveau de la pièce / de l’objet. Cela peut être comparé à l’inversion du rendu d’un objet à plusieurs parties.