Formant

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

On désigne par formant (acoustique) d'un son de parole l'un des maxima d'énergie du spectre sonore de ce son de parole. Il y a plusieurs définitions du mot "formant" (résonances du conduit vocal, pôles, etc.).

Le spectre sonore représente la distribution en fréquences de l'énergie du signal de parole, dans une bande de fréquences allant de 0 Hz à 4 000 Hz si on s'intéresse à la bande passante téléphonique (largement suffisante pour assurer l'intelligibilité du son). Le spectre sonore se mesure par analyse fréquentielle d'un segment très court (aussi appelé fenêtre d'analyse dans le vocabulaire du traitement du signal), de 10 à 40 millisecondes, du signal de parole. C'est une information variable au cours du temps, dépendant du type son de parole, c'est-à-dire en première approximation, du phonème prononcé, mais plus complètement, de la manière particulière dont il a été prononcé et de son contexte phonétique.

Comme le spectre sonore, dont ils représentent l'un des aspects, les formants sont mesurés sur des segments de parole très courts, et ils sont donc variables au cours du temps, dépendant du phonème prononcé, du contexte phonétique et de la manière dont il est prononcé. On numérote les formants (qui sont donc les maxima du spectre sonore) en allant des basses fréquences vers les hautes fréquences. La présence d'anti-formants dans les voyelles nasalisées rend leur calcul difficile. On les désigne par la notation physique F_i (mesurée en hertz) en partant du premier formant F_1 dans les fréquences basses. La notation F_0 est réservée à la fréquence fondamentale, dont les variations au cours du temps constituent l'intonation de la parole.

Les deux premiers formants F_1 et F_2 ne sont pas des caractéristiques suffisantes pour la description des voyelles, si la langue contraste, par exemple, entre voyelles antérieures étirées et arrondies (comme en français, par exemple). Les voyelles qui ne sont pas des diphtongues sont des sons plus ou moins stationnaires de la parole. Chaque voyelle se caractérise ainsi par son timbre spécifique, déterminé en première approximation par F_1 et F_2. La discipline phonétique a permis d'établir une corrélation entre les valeurs mesurées en hertz de F_1 et F_2 et le troisième formant et les articulations de l'appareil phonétique nécessaires à la réalisation des voyelles (lèvres comprises). Ainsi F_1 est corrélé avec l’aperture (ouverture de la bouche) et le F_2 avec la position antérieure (valeur élevée de F_2), postérieure (valeur basse de F_2) de la langue, mais aussi avec la configuration des lèvres. Le troisième formant F_3 est également une caractéristique intéressante, corrélée avec la configuration des lèvres pour les voyelles antérieures.

K. Stevens a donné une interprétation simple de la corrélation entre l'articulation de l'appareil phonatoire et les formants acoustiques, à partir d'un modèle simplifié à deux cavités acoustiques de l'appareil phonatoire. Dans ce modèle, F_1 et F_2 s'interprètent comme les fréquences de résonance de chaque cavité acoustique. Voir aussi G. Fant (dont les nomogrammes incluent la configuration des lèvres).

On présente dans la table ci-dessous les valeurs typiques des formants F_1 et F_2 pour les voyelles du français. Si on reporte ces valeurs dans un graphique représentant F_1 et F_2 en abscisse et en ordonnée, on obtient le fameux triangle vocalique de la discipline phonétique.

Fréquences typiques des formants [réf. nécessaire]
Voyelle (API) F_1 (Hz) F_2 (Hz)
[u] 320 800
[o] 500 1000
[ɑ] 700 1150
[a] 1000 1400
[ø] 500 1500
[y] 320 1650
[ɛ] 700 1800
[e] 500 2300
[i] 320 2500

Ces questions sont déployés chez “Gérad Genette, dans Mimologiques, (Mimophonies restreintes) ; Seuil”.