Reconnaissance vocale
La reconnaissance vocale est un sous-domaine interdisciplinaire de la linguistique informatique qui développe des méthodologies et des technologies permettant la reconnaissance et la traduction du langage parlé en texte par des ordinateurs.
Elle est également connu comme la reconnaissance automatique de la parole (ASR), la reconnaissance vocale ou speech-to-text (STT). Il intègre des connaissances et des recherches dans les domaines de la linguistique, de l’informatique et du génie électrique.
Certains systèmes de reconnaissance vocale nécessitent une "formation" (également appelée "inscription") dans laquelle un locuteur individuel lit un texte ou un vocabulaire isolé dans le système. Le système analyse la voix spécifique de la personne et l'utilise pour affiner la reconnaissance de son discours, ce qui accroît la précision. Les systèmes qui n'utilisent pas de formation sont appelés systèmes de « haut - parleur indépendant » . Les systèmes qui utilisent la formation sont appelés "dépendants du locuteur".
Les applications de reconnaissance vocale comprennent des interfaces utilisateur vocales telles que la numérotation vocale (par exemple, "appel homonyme "), le routage des appels (par exemple, "je souhaite effectuer un appel à frais virés"), le contrôle d'appareils domotiques, la recherche (par exemple, la recherche d'un podcast contenant vocale), la saisie de données simple (par exemple, entrer un numéro de carte de crédit), la préparation de documents structurés (par exemple un rapport de radiologie), la détermination des caractéristiques du locuteur, le traitement de la parole par le texte (par exemple, le traitement de texte ou les courriels), et les aéronefs (généralement appelés entrée vocale directe).
Du point de vue de la technologie, la reconnaissance vocale a une longue histoire avec plusieurs vagues d’innovations majeures. Plus récemment, le secteur a bénéficié des progrès de l’apprentissage en profondeur et du Big Data. Les progrès sont illustrés non seulement par la multiplication des publications universitaires publiées sur le terrain, mais surtout par l'adoption dans le monde entier d'une variété de méthodes d'apprentissage approfondi pour la conception et le déploiement de systèmes de reconnaissance vocale.