Aller au contenu

Fouille audio

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 10 août 2015 à 14:52 et modifiée en dernier par BTH (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

La fouille audio est l'analyse informatique d'un fichier audio ou d'un ensemble de ressources sonores. Cette technique est utilisée principalement dans le domaine de la reconnaissance vocale, dans laquelle l'objectif est l'identification des mots.

Les deux principales techniques de fouille audio sont : l'indexation fondée sur texte, l'indexation fondée sur phonème. La première connue en anglais sous le nom de « large-vocabulary continuous speech recognition » (LVCSR) convertit la parole en texte puis recherche les mots dans un large dictionnaire. La deuxième technique utilise les sons et les convertit en phonèmes que le système compare à un dictionnaire de phonèmes[1]. Le but est de trouver des informations au sujet des mots, des concepts, des orateurs, ...

Logiciels

  • Dragon AudioMining®[2]
  • Aurix[3]

Notes et références

Notes

Références

  1. Hasnai Nali, Blog
  2. Dragon AudioMining, Site officiel
  3. Aurix, Site officiel

Articles connexes