Formant

Un article de Wikipédia, l'encyclopédie libre.

On désigne par formant (acoustique) d'un son de parole l'un des maxima d'énergie du spectre sonore de ce son de parole. Il y a plusieurs définitions du mot « formant » (résonances du conduit vocal, pôles, etc.).

Le spectre sonore représente la distribution en fréquences de l'énergie du signal de parole, dans une bande de fréquences allant de 0 Hz à 4 000 Hz si on s'intéresse à la bande passante téléphonique (largement suffisante pour assurer l'intelligibilité du son).

Le spectre sonore se mesure par analyse fréquentielle d'un segment très court (aussi appelé fenêtre d'analyse dans le vocabulaire du traitement du signal), de 10 à 40 millisecondes, du signal de parole. C'est une information variable au cours du temps, dépendant du type son de parole, c'est-à-dire en première approximation, du phonème prononcé, mais plus complètement, de la manière particulière dont il a été prononcé et de son contexte phonétique.

Comme le spectre sonore, dont ils représentent l'un des aspects, les formants sont mesurés sur des segments de parole très courts, et ils sont donc variables au cours du temps, dépendant du phonème prononcé, du contexte phonétique et de la manière dont il est prononcé. On numérote les formants (qui sont donc les maxima du spectre sonore) en allant des basses fréquences vers les hautes fréquences. La présence d'anti-formants dans les voyelles nasalisées rend leur calcul difficile. On les désigne par la notation physique (mesurée en hertz) en partant du premier formant dans les fréquences basses. La notation est réservée à la fréquence fondamentale, dont les variations au cours du temps constituent l'intonation de la parole.

Les deux premiers formants et ne sont pas des caractéristiques suffisantes pour la description des voyelles, si la langue contraste, par exemple, entre voyelles antérieures étirées et arrondies (comme en français, par exemple). En conséquence de quoi, le tableau donné ci-dessous avec seulement les valeurs des deux premiers formants n'est pas valable. C'est le formant F3 qui distingue essentiellement /i/ et /y/. F2 peut être identique pour /i/ et /y/. Les voyelles qui ne sont pas des diphtongues sont des sons plus ou moins stationnaires de la parole. Chaque voyelle se caractérise ainsi par son timbre spécifique, déterminé en première approximation par et . Dans certaines langues, le ton est nécessaire, dans d'autres langues, la qualité de voix. La discipline phonétique a permis d'établir une corrélation entre les valeurs mesurées en hertz de et et le troisième formant et les articulations de l'appareil phonétique nécessaires à la réalisation des voyelles (lèvres comprises). Ainsi est corrélé avec l’aperture (ouverture de la bouche) et le avec la position antérieure (valeur élevée de ), postérieure (valeur basse de ) de la langue, mais aussi avec la configuration des lèvres. Le troisième formant est également une caractéristique intéressante, corrélée avec la configuration des lèvres pour les voyelles antérieures.

K. Stevens a donné une interprétation simple de la corrélation entre l'articulation de l'appareil phonatoire et les formants acoustiques, à partir d'un modèle simplifié à deux cavités acoustiques de l'appareil phonatoire, sans prendre en compte la configuration des lèvres. Dans ce modèle, et s'interprètent comme les fréquences de résonance de chaque cavité acoustique. Voir aussi G. Fant (dont les nomogrammes incluent la configuration des lèvres).


Récemment en 2020, Régis Petit a publié un article général sur les formants incluant les différents types de formants : cri animal, instruments de musique et langage parlé. Voir Musique - Lexique - Sonagramme, sur le site en référence.


Fréquences des formants en prononciation française :

Le tableau ci-dessous (cf [CHIR]) donne en prononciation française les fréquences moyennes en Hz des trois premiers formants des voyelles et des consonnes sonantes pour une voix d'homme. Pour une voix de femme, les fréquences sont sensiblement supérieures. Pour une voix d'enfant, encore plus. Attention : ces valeurs peuvent varier grandement en fonction de l'individu et au sein même du discours.

Phonèmes en français Ecriture

phonologique (API)

Ecriture

orthographique

Mot-clef Formant F1 (Hz) Formant F2 (Hz) Formant F3 (Hz) Bruit additionnel
Phonèmes à Formants :
Voyelles orales antérieures
/i/ "i" lit 250 2250 3000
/e/ "é" télé 400 2050 2650
/ε/ "è" règle 600 1750 2600
/a/ "a" sac 750 1450 2600
Voyelles orales centrales
/y/ "u" lune 250 1750 2150
/∂/ "e" ce 550 1550 2550
/ø/ "eu" feu 350 1350 2250
/œ/ "oe" fleur 500 1350 2350
Voyelles orales postérieures
/u/ "ou" poule 300 750 2300
/o/ "au" vélo 350 750 2550
/o ouvert à gauche/ "o" pomme 500 1050 2550
/α/ "â" pâte 700 1250 2700
Voyelles nasales
/œ tildé/ "un" un 600 1350 2400
/ε tildé/ "in" pain 700 1500 2650
/α tildé/ "an" gant 750 1250 2400
/o ouvert à gauche et tildé/ "on" ballon 500 1250 2550
Semi-voyelles ou Semi-consonnes
/j/ "y" fille 250 2250 3000
/u avec jambage à droite/ "u+" huit 250 1750 2150
/w/ "w" poisson 300 750 2300
Consonnes occlusives nasales
/m/ "m" mur 300 1300 2300 Explosion du "p" ou "b"
/n/ "n" noeud 350 1050 2300 Explosion du "t" ou "d"
/n avec jambage à gauche/ "gn" ligne 350 1000 2400 Explosion du "t" ou "d"
/η/ "nk/ng" parking 350 1050 2000 Explosion du "k"/"g"
Consonnes fricatives liquides
/l/ "l" lampe 350 1700 2500 Friction très faible
/R renversé/ "r" roue 550 1300 2300 Friction très faible
/R/ "rrr" terre 550 1300 2300 Friction très faible
Phonèmes sans Formants :
Consonnes occlusives orales
/p/ "p" pile Explosion moyenne, registre grave
/b/ "b" bol Explosion moyenne, registre grave
/t/ "t" table Explosion faible, registre aigu
/d/ "d" dé Explosion faible, registre aigu
/k/ "k" cadeau Explosion forte, registre medium
/g/ "g" gâteau Explosion forte, registre medium
Consonnes fricatives non liquides
/f/ "f" flûte Friction faible
/v/ "v" valise Friction faible
/s/ "s" citron Friction forte
/z/ "z" maison Friction forte
/∫/ "ch" chat Friction forte
/3/ "j" jupe Friction forte
/h/ "h aspiré" hop Friction forte
/x/ "J" Juan Carlos Friction forte


Pour les deux premiers formants, si on reporte ces valeurs dans un graphique représentant et en abscisse et en ordonnée, on obtient le fameux triangle vocalique de la discipline phonétique comme dans la figure ci-dessous. Dans ce triangle, augmente avec l'ouverture des voyelles (de /i/ et /u/ vers /a/) et diminue avec leur profondeur (augmente donc de /u/ vers /i/). Pour une même profondeur, est plus élevé pour une voyelle non-arrondie (comme /i/) que pour une voyelle arrondie (comme /y/) de même antériorité.

Triangle des voyelles avec les axes F1 et F2

Ces questions sont discutées par Gérard Genette dans Mimologiques (« mimophonies restreintes »), paru chez Seuil.

Notes et références[modifier | modifier le code]

Phonèmes en français (voir Lexique - Phonème)

Formants des phonèmes en français (voir Lexique - Sonagramme)

[CHIR] https://www.chireux.fr/mp/TIPE/ADS/Reconnaissance%20vocale.pdf CHIREUX, Reconnaissance de phonèmes par analyse formantique dans le cas de transitions voyelle-consonne

Voir aussi[modifier | modifier le code]