Apprentissage d'ontologies
L’apprentissage d'ontologies (extraction de l’ontologie, la production d'ontologie, ou l’acquisition de l’ontologie) est la création automatique ou semi-automatique de ontologies, y compris l’extraction des termes correspondant du domaine et les relations entre les concepts que ces termes représentent d'un corpus de texte en langage naturel, et les encoder avec un langage ontologique pour une récupération facile. Construire des ontologies manuellement est une tâche extrêmement laborieuse et longue, il y a donc une grande motivation à automatiser le processus.
En règle générale, le processus commence par extraire des termes et des concepts ou des phrases nominales à partir de texte brut à l'aide de processeurs linguistiques tels que le balisage partiel de la parole et la segmentation de phrases. Puis statistique ou symbolique techniques sont utilisées pour extraire des signatures de relation, souvent basé sur des techniques d'extraction hypernym basée sur des modèle ou des définitions.