Common Voice

Un article de Wikipédia, l'encyclopédie libre.

Common Voice
Logo de Common Voice

Aperçu de la page d’accueilde Common Voice en avril 2021
Aperçu de la page d’accueil
de Common Voice en avril 2021

Adresse commonvoice.mozilla.org
Description Projet de myriadisation d'une base de données vocales libre, destinée aux concepteurs d'outils de traitement automatique des langues
Commercial Non Non
Publicité Non Non
Type de site Plateforme d'enregistrement et de réécoute de phrases, de présentation du projet et de téléchargement des jeux de données
Langue Multilingue (liste des langues)
Inscription facultative facultative
Propriétaire Mozilla Foundation
Créé par Mozilla Foundation et la communauté Mozilla
Lancement Voir et modifier les données sur Wikidata
État actuel En activité En activité

Common Voice est un projet de myriadisation initié par Mozilla dans le but de produire une base de données libre pour la reconnaissance automatique de la parole. Il est soutenu par des volontaires qui enregistrent des phrases avec un microphone et vérifient les enregistrements d'autres utilisateurs. Les audios et leur transcription sont ensuite réunis dans une base de données du domaine public, sous la licence CC0. Cette licence permet aux développeurs d'utiliser la base de données vocales pour leurs applications de reconnaissance vocale (en anglais Speech-to-text, STT) sans coûts ni restrictions.

Le projet utilise Amazon Web Services et Google Fonts[réf. nécessaire][pertinence contestée].

Objectif[modifier | modifier le code]

L'objectif de Common Voice est de récolter des échantillons de voix variés. Selon Katharina Borchert, responsable en chef de l'innovation chez Mozilla, de nombreux projets de reconnaissance vocale existants ont récupéré leurs données depuis des radios publiques, et les jeux de données traditionnels ont tendance à sous-représenter les femmes ainsi que les personnes ayant un accent minoritaire.[1]

Statistiques[modifier | modifier le code]

La base de données Common Voice en anglais est la deuxième plus grande base librement accessible pour cette langue, après LibriSpeech. Lorsque les premières données furent publiées, le 29 novembre 2017, plus de 20 000 utilisateurs autour du monde avaient enregistré et validé 400 000 phrases, pour une durée cumulée de 500 heures d'enregistrements audio.[2]

En février 2019, un premier lot de langues fut ouvert à la réutilisation. Il comprenait 18 langues, dont l'anglais, le français, l'allemand et le chinois mandarin, mais également des langues moins répandues telles que gallois et le kabyle. Au total, près de 1 400 heures de voix avaient déjà été enregistrées par plus de 42 000 contributeurs.[3] En juillet 2020, le projet avait récolté 7 226 heures d'enregistrements vocaux dans 54 langues, dont 5 591 heures vérifiées par des contributeurs.[4] En avril 2021, plus de 65 langues sont représentées sur la plateforme.[5] Le projet dispose de plus de 680 heures d'enregistrements audio en français, dont plus de 600 heures vérifiées par des contributeurs[6]

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. (en) « Why do we gender AI? Voice tech firms move to be more inclusive », sur TheGuardian.com, (consulté le 19 avril 2020)
  2. (en) « Announcing the Initial Release of Mozilla’s Open Source Speech Recognition Model and Voice Dataset », sur Blog de mozilla.org, (consulté le 7 avril 2021)
  3. (en) « Mozilla updates Common Voice dataset with 1,400 hours of speech across 18 languages », sur VentureBeat,
  4. (en) « Mozilla Common Voice updates will help train the ‘Hey Firefox’ wakeword for voice-based web browsing » [archive du ], sur VentureBeat, (consulté le 1er avril 2021)
  5. « Page "Langues" de Common Voice », sur Common Voice (consulté le 7 avril 2021)
  6. « Page "Jeux de données" de Common Voice », sur Common Voice (consulté le 7 avril 2021)