Modulation d'impulsion codée

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir PCM.

La modulation par impulsion et codage ou MIC, (en anglais Pulse Code Modulation), généralement abrégé en PCM est une représentation numérique d'un signal électrique résultant d'un processus de numérisation. Le signal est d'abord échantillonné, puis chaque échantillon est quantifié indépendamment des autres échantillons, et chacune des valeurs quantifiées est convertie en un code numérique[1].

La modulation par impulsion et codage est toujours la première phase de la numérisation d'un signal électrique analogique. Le traitement indépendant de chaque échantillon implique qu'il n'y a ni chiffrement, ni compression de données.

On trouve des fichiers ou des flux de données MIC (PCM) bruts notamment dans les applications audio, en particulier en télécommunications (RTC ou VoIP). Dans les systèmes stéréophoniques ou multicanaux, les flux en modulation par impulsion et codage sont multiplexés. Dans les fichiers WAV, AIFF et BWF standards, les données audio sont le plus souvent des bouts (chunks) en modulation par impulsion et codage multiplexés échantillon par échantillon, bien que l'en-tête de ces formats laisse la possibilité de codes sans multiplexage ou avec compression des données.

Technologie[modifier | modifier le code]

Échantillonnage et quantification d'un signal analogique (en rouge) par un PCM sur 4 bits

Échantillonnage[modifier | modifier le code]

Il s'agit d'une représentation numérique d'un signal analogique où la hauteur du signal est prélevée régulièrement à intervalles uniformes de durée T. Le Théorème d'échantillonnage de Nyquist-Shannon stipule que les fréquences plus hautes que la moitié de la fréquence fs d'échantillonnage (fs = 1/T) ne peuvent pas être reconstruites. Chaque échantillon est quantifié, c'est-à-dire rattaché à un nombre fini de valeurs possibles, et à chacune de ces valeurs correspond un signe dans un code qui est habituellement un code binaire.

Quantification[modifier | modifier le code]

Dans les applications musicales, et quand le signal numérique doit être traité, la quantification est linéaire. En téléphonie, on utilise généralement des échelles logarithmiques, afin de réduire la quantité de données à transmettre.

Le codage par défaut sur un DS0 est du 8 bits logarithmique à 8 kHz, soit du μ-law PCM (Amérique du Nord, Japon) ou du a-law PCM (Europe et la majeure partie du reste du monde). Ces systèmes quantifient le signal selon une courbe logarithmique, chaque échantillon linéaire sur 13 ou 14 bits étant assimilé à une valeur sur 8 bits. Ce système est décrit par la norme internationale G.711, qui est encore aujourd'hui la norme la plus utilisée en téléphonie fixe.

Compression des données[modifier | modifier le code]

Lorsque le coût des circuits est important et qu'une diminution de la qualité du son est envisageable, il peut s'avérer utile de comprimer le signal de parole de manière plus importante. On utilise alors des méthodes basées sur la détection des corrélations entre les échantillons. Les procédés les plus anciens, utilisés en téléphonie, examinent uniquement le niveau du signal.

Si le codage considère plus d'un échantillon, il ne s'agit plus de Modulation d'Impulsion Codée (PCM).

Modulation delta

La modulation différentielle (ou delta) d'impulsion-code (DPCM), à l'inverse de la modulation linéaire LPCM, code les valeurs PCM comme différences entre la valeur courante et la valeur précédente[2]. Pour l'audio, ce type de codage réduit le nombre de bits exigé de 25 % environ par rapport au PCM[réf. souhaitée].

Adaptive Differential Pulse Code Modulation

Pour plus de réduction, au prix de plus de traitement, on utilise un algorithme d'ADPCM pour placer une série de 14 bits PCM linéaire (ou 8 bits en loi µ ou A) dans 4 bits ADPCM. Chaque section de signal PCM est transmise avec un en-tête qui indique la table de correspondance à utiliser. De cette façon, on double presque la capacité de la ligne. Le standard G.726 décrit les détails du procédé. Plus tard, quand on a constaté qu'on pouvait encore augmenter les taux de compression, des normes supplémentaires ont été publiées.

Certaines des techniques ADPCM sont utilisées dans des communications de voix sur réseau IP (VoIP)[réf. souhaitée].

Adaptative Multi Rate
Articles détaillés : Adaptive Multi Rate et G.722.2.

En téléphonie mobile, on utilise des codecs avec compression (AMR ou AMR-WB). Il n'y a pas de flux MIC/PCM entre les appareils.

Codage des données[modifier | modifier le code]

La modulation d'impulsion peut utiliser le codage RZ (retour à zéro) ou le codage NRZ (non retour à zéro). Pour qu'un système NRZ soit synchronisé, en utilisant seulement l'information émise, il ne doit pas y avoir de longues séquences de symboles identiques, comme de longues séquences de 1 ou de 0. Pour les systèmes binaires PCM, la densité des 1 est un critère important (ones-density en anglais).

On contrôle souvent cette densité à l'aide de techniques de pré-codage telles que le codage RLL (Run Length Limited). Le code PCM est étendu en un code légèrement plus long garantissant une limitation du nombre de 1 avant la modulation du signal et son envoi dans le canal de transmission. Dans d'autres cas, on ajoute des bits supplémentaires (de synchronisation) dans le flux, ce qui garantit d'avoir au moins quelques transitions entre les symboles.

Une autre technique employée pour contrôler la densité de 1 est l'utilisation d'un polynôme embrouilleur. Cela a tendance à transformer les données brutes en un flux pseudo-aléatoire. Cependant le flux de départ peut être totalement récupéré en inversant l'effet du polynôme. Quand on utilise cette technique, de longues séries de 1 ou de 0 peuvent encore exister, mais sont considérées assez peu probables pour pouvoir être négligées ou à tout le moins tolérées.

Il peut arriver que la composante continue du signal modulé (courant continu, ou courant moyen) ne soit pas nulle. Puisque cette composante continue risque de polariser les circuits d'un détecteur hors de sa plage de fonctionnement, on prend des mesures spéciales de compensation en temps réel et l'on modifie au besoin les codes émis pour faire tendre la tension moyenne vers zéro si nécessaire.

Plusieurs de ces codes sont des codes bipolaires, où les impulsions peuvent être positives, négatives ou nulles. Typiquement, les impulsions différentes de zéro alternent entre des tensions positives et négatives. On peut toutefois transgresser ces règles afin de produire des symboles spéciaux utilisés pour la synchronisation ou d'autres buts particuliers.

Histoire[modifier | modifier le code]

Le brevet de cette technologie a été déposé en 1937[réf. souhaitée]. La première transmission de parole par MIC a été réalisée avec l'équipement de codage de voix SIGSALY utilisé pour les communications alliées de haut niveau pendant la Seconde Guerre mondiale.

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • (en) John Watkinson, The MPEG Handbook, Focal Press,‎ , 2e éd., 435 p. (ISBN 9780-240-80578-8), p. 38-67.

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Notes et références[modifier | modifier le code]