Machine listening
Le Machine listening (ou Computer audition ou CA ou audition sur ordinateur) est la discipline qui consiste à enregistrer, décoder et interpréter des sons (voix, musique, bruits…)
Scientifiquement, le machine listening un domaine d’étude général des algorithmes et des systèmes de compréhension audio par machine. Etant donné que la notion d ’« écoute »par une machine est très large et quelque peu vague, l’audition sur ordinateur tente de réunir plusieurs disciplines abordant à l’origine des problèmes spécifiques ou ayant une application concrète à l’esprit. L'ingénieur Paris Smaragdis, interviewé dans Technology Review, parle de ces systèmes - "un logiciel qui utilise le son pour localiser les personnes se déplaçant dans les salles, surveiller les machines pour les pannes imminentes ou activer les caméras de circulation pour enregistrer les accidents " .
Inspiré des modèles d’audition humaine, le machine listening traite des questions de représentation, de transduction, de regroupement, d’utilisation des connaissances musicales et de la sémantique générale du son dans le but d’effectuer des opérations intelligentes sur des signaux audio et musicaux par ordinateur. Techniquement, cela nécessite une combinaison de méthodes dans les domaines du traitement du signal, de la modélisation auditive, de la perception et de la cognition de la musique, de la reconnaissance de formes et de l'apprentissage automatique, ainsi que des méthodes plus traditionnelles d’intelligence artificielle pour la représentation des connaissances musicales.