Modulation d'impulsion codée

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir PCM.

La modulation d'impulsion codée ou MIC, (en anglais Pulse Code Modulation, généralement abrégé en PCM[1]) est une représentation numérique non compressée d'un signal analogique via une technique d'échantillonnage. Cette technique est utilisée pour la voix en télécommunications (RTC ou VoIP) et pour le son notamment dans les disques compacts audio, pour l'enregistrement sur bandes DAT et Minidisc, les disques optiques à haute capacité (Blu-ray et HD DVD), ainsi que pour les fichiers WAV, AIFF et BWF standards.

Histoire du PCM[modifier | modifier le code]

La première transmission de parole par PCM a été réalisée avec l'équipement de codage de voix SIGSALY utilisé pour les communications alliées de haut niveau pendant la Seconde Guerre mondiale.

Technologie[modifier | modifier le code]

Échantillonnage et quantification d'un signal analogique (en rouge) par un PCM sur 4 bits

Il s'agit d'une représentation numérique d'un signal analogique où la hauteur du signal est prélevée régulièrement à intervalles uniformes de durée T. Chaque échantillon est quantifié sur une série de symboles dans un code numérique, qui est habituellement un code binaire. Le Théorème d'échantillonnage de Nyquist-Shannon stipule que les fréquences plus hautes que la moitié de la fréquence fs d'échantillonnage (fs = 1/T) ne peuvent pas être reconstruites.

Le PCM est utilisé dans des systèmes de téléphonie numérique. C'est également le format standard des sons numériques dans les ordinateurs et dans divers formats de disque compact.

Plusieurs flux PCM peuvent être multiplexés dans un flux de données global plus grand, grâce à une technique appelée Time-Division Multiplexing ou TDM. Initialement inventée par l'industrie téléphonique, la technologie TDM est aujourd'hui largement utilisée dans les stations de travail audionumériques comme Pro Tools.


Numérisation en tant qu'élément du traitement PCM[modifier | modifier le code]

Dans le PCM conventionnel, le signal analogique peut être traité (par exemple par compression d'amplitude) avant d'être numérisé, mais une fois numérisé, il n'est plus soumis à des transformations ultérieures (par exemple la compression audionumérique).

Quelques formes de PCM combinent un traitement du signal avec le codage. Des versions plus anciennes de ces systèmes effectuaient le traitement dans le domaine analogique pendant la conversion ANALOGIQUE-NUMÉRIQUE ; de nouvelles implémentations le font dans le domaine numérique. Ces techniques simples ont toutefois été en grande partie supplantées par les techniques modernes de compression de signal :

  • La modulation différentielle (ou delta) d'impulsion-code (DPCM), à l'inverse de la modulation linéaire LPCM, code les valeurs PCM comme différences entre la valeur courante et la valeur précédente. Pour l'audio, ce type de codage réduit le nombre de bits exigé de 25 % environ par rapport au PCM.
  • Le DPCM adaptatif (ADPCM) est une variante du DPCM qui change la taille du pas de quantification, ce qui permet une réduction de la largeur de bande nécessaire pour un rapport signal/bruit donné.

Le codage par défaut sur un DS0 est du 8 bits logarithmique à 8 kHz, soit du μ-law PCM (Amérique du Nord, Japon) ou du a-law PCM (Europe et la majeure partie du reste du monde). Ces systèmes compressent le signal selon une courbe logarithmique, chaque échantillonnage PCM sur 13 ou 14 bits étant calé dans une valeur sur 8 bits. On effectue l'opération inverse lors de la conversion numérique-analogique (ou bien le traitement est effectué de façon analogique à l'aide d'un compresseur/expanseur). Ce système est décrit par la norme internationale G.711, qui est encore aujourd'hui la norme la plus utilisée en téléphonie.

Lorsque le coût des circuits est important et qu'une diminution de la qualité du son est envisageable, il peut s'avérer utile de comprimer le signal de parole de manière plus importante. On utilise alors un algorithme d'ADPCM pour placer une série de 14 bits PCM linéaire (ou 8 bits en loi µ ou A) dans 4 bits ADPCM. De cette façon, on double la capacité de la ligne. Le standard G.726 décrit les détails du procédé.

Plus tard, quand on a constaté qu'on pouvait encore augmenter les taux de compression, des normes supplémentaires ont été publiées.

Certaines de ces normes internationales décrivent des systèmes et des idées qui sont protégés par des brevets, et l'utilisation ainsi que l'accès à ces normes exigent un paiement aux titulaires du brevet.

Certaines des techniques ADPCM sont utilisées dans des communications de voix sur réseau IP (VoIP).

Codage des données comme signal[modifier | modifier le code]

La modulation d'impulsion peut utiliser le codage RZ (retour à zéro) ou le codage NRZ (non retour à zéro). Pour qu'un système NRZ soit synchronisé, en utilisant seulement l'information émise, il ne doit pas y avoir de longues séquences de symboles identiques, comme par exemple de longues séquences de 1 ou de 0. Pour les systèmes binaires PCM, la densité de 1 est un critère important (ones-density en anglais).

On contrôle souvent cette densité à l'aide de techniques de pré-codage telles que le codage RLL (Run Length Limited). Le code PCM est étendu en un code légèrement plus long garantissant une limitation du nombre de 1 avant la modulation du signal et son envoi dans le canal de transmission. Dans d'autres cas, on ajoute des bits supplémentaires (de synchronisation) dans le flux, ce qui garantit d'avoir au moins quelques transitions entre les symboles.

Une autre technique employée pour contrôler la densité de 1 est l'utilisation d'un polynôme embrouilleur. Cela a tendance à transformer les données brutes en un flux pseudo-aléatoire. Cependant le flux de départ peut être totalement récupéré en inversant l'effet du polynôme. Quand on utilise cette technique, de longues séries de 1 ou de 0 peuvent encore exister, mais sont considérées assez peu probables pour pouvoir être négligées ou à tout le moins tolérées.

Il peut arriver que la composante continue du signal modulé (courant continu, ou courant moyen) ne soit pas nulle. Puisque cette composante continue risque de polariser les circuits d'un détecteur hors de sa plage de fonctionnement, on prend des mesures spéciales de compensation en temps réel et l'on modifie au besoin les codes émis pour faire tendre la tension moyenne vers zéro si nécessaire.

Plusieurs de ces codes sont des codes bipolaires, où les impulsions peuvent être positives, négatives ou nulles. Typiquement, les impulsions différentes de zéro alternent entre des tensions positives et négatives. On peut toutefois transgresser ces règles afin de produire des symboles spéciaux utilisés pour la synchronisation ou d'autres buts particuliers.

Le DxD[modifier | modifier le code]

Le PCM, dans son histoire, a été échantillonné pour des usages commerciaux à hauteur de 1 fs (44,1 kHz,Compact Disc), 48 kHz, et 2 fs (2 × 44.1 kHz, donc 88.2 kHz), 96 kHz et 192 kHz (DVD, DVD Audio et Blu-ray). Il se doit désormais de concurrencer de façon crédible le format audio DSD à très haut taux d'échantillonnage (64 fs, soit 64 × 44 100 Hz = 2 822 400 Hz), utilisé pour le format audio multicanal de pointe Super Audio CD.

Pour cette raison est apparu en 2007 le PCM DxD, acronyme de Digital eXtreme Definition : il consiste en un codage PCM standard, mais échantillonné à 352,8 kHz (soit 8 fs, donc huit fois la qualité CD), quantifié sur 24 bits dans la majorité des cas et même quantifiable sur 32 bits en virgule flottante si le matériel utilisé pour sa manipulation en est capable.

Il n'existe toutefois aucun matériel commercial utilisant une telle définition à l'heure actuelle, et la majorité des processeurs prenant en charge le DxD sont à usage professionnel (studios d'enregistrement, de mixage, de mastering et de remasterisation).

Il convient également de noter que le DxD, censé concurrencer le DSD, est finalement utilisé la plupart du temps comme outil de transition palliatif pour pouvoir indirectement traiter ce dernier, car le matériel d'enregistrement direct en DSD est encore très rare. Le traitement d'un signal numérique quantifié sur 1 bit unique étant impossible, les ingénieurs du son passent donc par le DxD, qui est le signal PCM le plus abouti existant aujourd'hui, afin d'approcher le plus possible la définition DSD pendant le traitement sonore avant conversion[2].

Notes et références[modifier | modifier le code]

  1. Defense Applied Part 2 Télécommunications and Computer Dictionary English/French, Jean-Claude Laloire, 2008
  2. Magazine KR home-studio (site internet [1] keyboardsrecording.fr), numéro 248 S (janvier 2010), page 21

Voir aussi[modifier | modifier le code]