Ambisonie

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'ambisonie, Ambisonics (en), est une technique de capture, synthèse et reproduction d'environnement sonore. L'immersion de l'auditeur dans cet environnement virtuel se fait grâce à un nombre de haut-parleurs variant de trois à quelques dizaines. La méthode ambisonique existe en version 2D (les haut-parleurs sont tous situés dans le plan horizontal contenant la tête de l'utilisateur) et 3D (les haut-parleurs sont alors souvent disposés sur une sphère centrée sur la tête de l'utilisateur).

Un système ambisonique est potentiellement beaucoup plus performant qu'un système 5.1 (home-cinéma) sur le plan de la restitution, mais il peut être aussi beaucoup plus coûteux en ressources en ce qui concerne le nombre de canaux utilisés. Si la spatialisation ambisonique se fait en temps réel, elle nécessite alors un ordinateur dédié afin d'exécuter les algorithmes de spatialisation.

L'ambisonie est une alternative à l'holophonie, autre méthode nécessitant beaucoup plus de haut-parleurs.

Où trouver un système ambisonique ?[modifier | modifier le code]

Actuellement, seuls quelques laboratoires disposent d'un système ambisonique expérimental. Le plus souvent, les laboratoires ne sont dotés que de la variante 2D du système. Il est actuellement malheureusement illusoire de chercher un cinéma disposant d'un tel système. Toutefois, certaines cartes son permettent d'adresser un grand nombre de haut-parleurs et proposent quelques algorithmes simples de restitution ambisonique.

Laboratoire d'étude en France[modifier | modifier le code]

  • France Télécom étudie l'ambisonie pour la spatialisation des conférences en 2D (Lannion).
  • Le CSTB étudie l'ambisonie pour les salles de réalité augmentée en 3D (Grenoble).
  • L'IRCAM a rénové récemment son espace de projection (Espro) à volume/acoustique variables, y ajoutant près de 350 haut-parleurs et l'architecture nécessaire à un rendu mixte Ambisonique + WFS (Paris).

Principe et équations sales de base[modifier | modifier le code]

Considérons un système de N\; haut-parleurs répartis sur une sphère de rayon R\; et orientés vers la tête de l'utilisateur. Pour fixer les idées, R\; est souvent compris entre 2m et 10m. On appelle  O\; le centre du système, c’est-à-dire que le point O\; coïncide avec la tête de l'utilisateur.

Dans un premier temps, il est raisonnable de considérer que les haut-parleurs rayonnent un champ sonore assimilable à une onde plane. On note

p_i(M,t) \;

la pression rayonnée en  M \; par le haut-parleur i\; à l'instant t\;.

La pression rayonnée en O\; est alors

p(O,t) = \sum_{i=1}^{N} p_i(O,t)

On souhaite restituer le champ que créerait une source virtuelle. On note  \tilde p(M,t) ce champ virtuel.

Il se trouve que tout champ acoustique vérifie l'équation de Helmholtz, et peut à ce titre être décomposé sur la base des harmoniques cylindriques dans le cas 2D ou sphérique dans le cas 3D. La propriété de vérifier l'équation de Helmholtz n'est pas une nécessité pour le développement qui suit, mais elle reste vraie.

Par exemple on peut écrire en 3D et pour le champ créé par le haut-parleur i\;

p_i(\vec{r},t) =  G_ip_0~e^{j (\omega t - k\vec{u}_i.\vec{r})} = \sum\limits_{m \in \mathbb{N}} \sum\limits_{n=-m}^m G_ip_0 Y_m^n(\varphi_i,\delta_i) Y_m^n(\varphi,\delta) j^m j_m(kr) e^{j\omega t}

Y_m^n(\varphi,\delta) est une fonction de direction appelée n\;ième harmonique sphérique d'ordre m\; et j_m\; est la fonction de Bessel sphérique d'ordre m\;. \vec{r} \, est bien sûr repéré par (r,\varphi,\delta) dans l'équation précédente. G_i est le gain associé au haut-parleur i.

De même le champ virtuel rayonné par la source virtuelle est donné par:

\tilde{p}(\vec{r},t) =  p_0~e^{j (\omega t - k\vec{u}_s.\vec{r})} = \sum\limits_{m \in \mathbb{N}} \sum\limits_{n=-m}^m p_0 Y_m^n(\varphi_s,\delta_s) Y_m^n(\varphi,\delta) j^m j_m(kr) e^{j\omega t}

(r_s,\varphi_s,\delta_s) repère la position de la source virtuelle.

On note maintenant

C_{ij}=Y_m^n(\varphi_i,\delta_i)

et

B_j=Y_m^n(\varphi_s,\delta_s)

On montre effectivement qu'en triant astucieusement les indices (m,n)\, on peut les repérer par un unique entier \,j.

Fort de cette notation, le champ créé par l'ensemble des \, N haut-parleurs est donné par

p(\vec{r},t)=\sum_{i=1}^N\sum_{j=1}^\infty C_{ij}G_i

et le champ à restituer est

\tilde{p}(\vec{r},t)=\sum_{j=1}^\infty B_j

On tronque maintenant la décomposition infinie en s'arrêtant à l'indice M. On obtient

p(\vec{r},t)=\sum_{i=1}^N\sum_{j=1}^M C_{ij}G_i
\tilde{p}(\vec{r},t)=\sum_{j=1}^M B_j

On égalise les deux termes, ce qui donne en écriture matricielle

CG=B \,

C \, est une matrice N \times M \,. On sait calculer sa pseudo-inverse D \,. On calcule alors les gains G_i associés aux haut-parleurs par

G=DB \,

Modèle de champ proche[modifier | modifier le code]

La courbure réelle du champ sonore rayonné par les haut parleurs n'est pas prise en compte dans ce premier modèle linéaire. On corrige ceci en filtrant le signal avant de l'envoyer sur les haut-parleurs.

Erreur commise[modifier | modifier le code]

Liens externes[modifier | modifier le code]

(fr) PhD thesis of Jerôme Daniel - Mémoire de thèse sur l'ambisonie.