Fouille audio

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La fouille audio est l'analyse informatique d'un fichier audio ou d'un ensemble de ressources sonores. Cette technique est utilisée principalement dans le domaine de la reconnaissance vocale, dans laquelle l'objectif est l'identification des mots.

Les deux principales techniques de fouille audio sont : l'indexation fondée sur texte, l'indexation fondée sur phonème. La première connue en anglais sous le nom de « large-vocabulary continuous speech recognition » (LVCSR) convertit la parole en texte puis recherche les mots dans un large dictionnaire. La deuxième technique utilise les sons et les convertit en phonèmes que le système compare à un dictionnaire de phonèmes[1]. Le but est de trouver des informations au sujet des mots, des concepts, des orateurs, ...

Logiciels[modifier | modifier le code]

  • Dragon AudioMining®[2]
  • Aurix[3]

Références[modifier | modifier le code]

  1. Hasnai Nali, Blog
  2. Dragon AudioMining, Site officiel
  3. Aurix, Site officiel

Articles connexes[modifier | modifier le code]