Aller au contenu

Taux d'erreur de mots

Un article de Wikipédia, l'encyclopédie libre.
Ceci est la version actuelle de cette page, en date du 20 août 2018 à 17:54 et modifiée en dernier par Simon de l'Ouest (discuter | contributions). L'URL présente est un lien permanent vers cette version.
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance de la parole.

Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Plus le taux est faible (minimum 0.0) plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions.

Après avoir aligné de manière optimale la référence avec le texte reconnu grâce à un algorithme de programmation dynamique, le taux d'erreur de mots est donné par :

où :

  • est le nombre de mots de référence,
  • est le nombre de substitutions (mots incorrectement reconnus),
  • est le nombre de suppressions (mots omis),
  • est le nombre d'insertions (mots ajoutés),
  • est le nombre de mots correctement reconnus.

Le taux de reconnaissance de mots, ou word accuracy (WAcc) en anglais, est défini ainsi :

Ce taux de reconnaissance peut être négatif.

Références

[modifier | modifier le code]