Direct Stream Digital

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Logo du format DSD.

Direct Stream Digital (DSD) est un procédé de stockage de signaux audio sur un média sonore numérique Super Audio CD créé par Sony et Phillips à la fin des années 1990 et lancé en 1999.

Il est en concurrence directe avec le PCM (codage sonore utilisé pour les Compact Discs) haute définition présent sur les DVD audio, lancés commercialement peu après le Super Audio CD.

Histoire[modifier | modifier le code]

Lorsque le processus de conversion Sigma-Delta a été décrit pour la première fois dans le précis 2,927,962 de C. C. Cutler en 1954 (mais il ne fut nommé ainsi que dans l'article de H. Inose, Y. Yasuda, et J. Murakami en 1962), la décimation n'existait pas et l'intention était de transférer telles quelles des données sur-échantillonnées.

C'est en 1969 que D.J. Goodman propose dans son article "The Application of Delta Modulation of Analog-to-PCM encoding", pour la toute première fois dans l'histoire du son, de décimer des données Sigma-Delta sur-échantillonnées pour ensuite les convertir en Modulation d'Impulsion Codée (en Anglais PCM, acronyme de "Pulse Code Modulation")[1].

Tout juste trente ans plus tard, en 1999, Sony et Philips réutilisent ce principe de décimation pour leur nouveau type de données audio, le Direct Stream Digital, destiné au format Super Audio CD, dont l'objectif est de succéder au Compact Disc et, si succès commercial, le supplanter.

Description[modifier | modifier le code]

Comparaison entre l'encodage LPCM et DSD.

Le DSD est une méthode de stockage de signal Sigma-Delta avant application d'un décimateur qui le convertit en PCM.

Sa technologie consiste en un codage de son à très haute fréquence d’échantillonnage, 64 fois supérieure à l'échantillonnage PCM du Compact Disc, soit 64 fs (1 fs = 44100 Hz, donc 44100 Hz × 64 = 64 fs = 2,8224 MHz). Il est quantifié sur bit unique, autorisant une bande passante allant jusqu’à 80 kHz voire 100 kHz et une dynamique de 120 dB ; elle est donc bien supérieure à celle recommandée par le théorème d’échantillonnage de Nyquist-Shannon. Ce procédé, associé au filtre decimateur, assure une haute cohérence de la phase.

Les conversions analogique-numérique et numérique-analogique sont également simplifiées, assurant une qualité de conversion du signal accrue pour un coût de production moindre. Il permet par ailleurs une spatialisation multicanale en plus de la stéréophonie utilisée jusqu’ici.

Pour accroître la capacité d’enregistrement du Super Audio CD, le flux audio-numérique subit une compression sans perte appelé DST ((en)Direct Stream Transfer) autorisant jusqu’à 80 minutes d’enregistrement de pistes DSD stéréo et multicanales combinées[2].

Les techniques mises en jeu à cet effet emploient le Noise Shaping, ou mise en forme du bruit de quantification, par lesquelles ce bruit est repoussé dans les gammes de fréquences situées en dehors de la zone utile. Ces fréquences sont inaudibles à l'oreille humaine, mais souvent atténuées par les lecteurs au moyen d'un filtre coupe-haut du fait qu'elles risquent en contre-partie d'endommager (parfois fatalement) les tweeters qui ne sont pas super-tweeters, c'est-à-dire non conçus pour reproduire les ultrasons.

La modulation 1 bit (tout ou rien) n’est pas nouvelle : elle s’apparente à la modulation de largeur d'impulsion (Pulse Width Modulation utilisée dans les onduleurs, les amplificateurs de classe D, les dispositifs à valve de lumière : micro-miroirs DMD, etc.) pour laquelle le rapport cyclique varie en fonction de l’amplitude du signal à transcrire (voir schéma comparatif à droite). Le flux numérique 1 bit (DSD) doit cependant suivre un rythme d’horloge imposé (qui correspond à la fréquence sur-échantillonnée) on parle alors de PDM (Pulse Density Modulation) ou modulation de densité d’impulsions. Toutes les platines CD-A et DVD-A bénéficient d’un modulateur « un bit » permettant de retrouver, à partir d’un flux PCM (16, 20 ou 24 bits), un flux de type DSD (1 bit) qui est très simple à convertir en analogique (filtrage passe-bas d’ordre peu élevé). Il n'est donc pas nécessaire de recourir à un convertisseur Sigma Delta lors de la lecture du flux DSD du Super Audio CD.

Évolutions apportées pour succéder au PCM 44.1 kHz / 16 bits du Compact Disc[modifier | modifier le code]

Le CD avec sa fréquence d’échantillonnage de 44,1 kilohertz, très proche de la limite haute de la plage de fréquences Hi-Fi (20 kilohertz), oblige à disposer d'un filtre à fréquence de coupure brutale dans les hautes fréquences (20 db/octave). Un tel filtrage détruit une grande partie de la richesse et la finesse de certains enregistrements (pas seulement dans les aigus) : ce problème fut très tôt identifié et les premières générations de lecteurs CD furent équipés de circuits d'interpolation afin de suréchantilloner le signal numérique, et ainsi limiter la destruction des harmoniques et hautes fréquences.

Afin de pallier cette lacune, le DSD fut fixé à un haut taux d'échantillonnage (voir plus haut) et son principe de modulation permet avec un simple filtre du premier ordre (6 db/octave) de ne pas « écraser » les harmoniques[2]. Compte tenu de sa fréquence d'échantillonnage et son mode de fonctionnement, le CD est par exemple incapable de reproduire correctement un signal rectangulaire (riche en harmoniques) de 10 kilohertz, le résultat étant plus proche d'une sinusoïde (les harmoniques de rang supérieur à 2 sont éliminés)[2], malgré le suréchantillonnage. Le traitement du signal opéré avec le SA-CD permet de conserver les harmoniques et d'obtenir un signal respectant la source et donc une grande finesse de détails[2].

L'échantillonnage retenu à l'origine pour le CD reposait sur des critères technologiques, la qualité de reproduction des harmoniques n'ayant pas été jugée primordiale devant les impératifs de l'époque. La fréquence d’échantillonnage de 44,1 kHz était héritée d'une méthode de conversion numérique d'un signal audio en signal vidéo pour un enregistrement sur cassette vidéo.

CD SACD
Format 16 bit PCM 1 bit DSD
Fréquence d'échantillonnage 44 100 Hz 2 822 400 Hz[3]
Plage dynamique 96 dB 120 dB sur toute la plage de fréquences[3]
Gamme de fréquence[4] 20 Hz20 kHz 20 Hz50 kHz en général[3], jusqu'à 100 kHz avec certains lecteurs[5]
Capacité du disque 700 MB 7,95 GB
Stéreo Oui Oui
Son multicanal Non Oui

Technologie de compression sans pertes : le DST[modifier | modifier le code]

Afin de réduire l'espace de stockage et la bande passante requises, une méthode de compression sans pertes appelée Direct Stream Transfer (DST) est utilisée. Elle est obligatoire pour le programme multicanal, mais seulement optionnelle pour le programme stéréophonique. Le facteur de compression se situe entre deux et trois, ce qui permet, comme vu plus haut, de combiner 80 minutes d'un même programme en stéréo et en multicanal[6].

Le Direct Stream Transfer est notamment devenu un des points techniques du standard MPEG-4 Audio (également appelé MP4) (ISO/IEC 14496-3:2001/Amd 6:2005 - Lossless coding of oversampled audio) en 2005[7],[8]. Celui-ci comporte les définitions du DSD et du DST telles que décrites dans les spécifications du Super Audio CD.

Le MPEG-4 DST fournit un codage sans pertes des signaux audio sur-échantillonés[9],[10]. Une implantation référentielle du MPEG-4 DST fut publiée en tant que ISO/IEC 14496-5:2001/Amd.10:2007 en 2007.

Sécurité du code[modifier | modifier le code]

Le DSD, pour les besoins du Super Audio CD, comprend plusieurs mesures de protection des données qui rendent ce format impossible à copier de façon directe, au même titre que la couche CD conventionnelle 700 mégaoctets des disques hybrides. Cela inclut un cryptage des données audio sur 80 bits à l'aide d'une clé codée dans une région spéciale du disque qui n'est lisible que par un lecteur Super Audio CD sous licence. La couche haute définition d'un SA-CD ne peut être lue par un lecteur CD/DVD d'ordinateur, tout comme il est impossible de créer un Super Audio CD autrement qu'aux deux sites de fabrication spécifiquement agréés, qui se trouvent à Shizuoka et Salzburg[11].

Le Pit Signal Processing[modifier | modifier le code]

Outre les mesures de sécurité du Super Audio CD susvisées, on trouve principalement le PSP ou Pit Signal Processing (pit signifiant "fosse" ou "fossé" en français, dans le contexte d'un disque numérique il se traduit par "encoche"), une empreinte physique qui consiste en une modulation de profondeur des encoches du disque (les données, elles, sont stockées dans la longueur des encoches comme sur un Compact Disc). Le capteur optique doit être doté un circuit spécial afin de la détecter et l'interpréter, puis est comparée avec les informations sur le disque afin de s'assurer de sa validité (il s'agit donc d'un chiffrement à double clé). Bien que la majorité des lecteurs DVD, DVD Audio et DVD-Rom puissent théoriquement lire les données d'un Super Audio CD (même galette, même densité de gravure et laser de lecture), ils ne peuvent les interpréter puisqu'ils ne sont pas équipés du circuit de décodage nécessaire, et ne les reconnaissent donc pas[12].

En ce qui concerne les Super Audio CD hybrides, le Pit Signal Processing s'applique uniquement à la couche SA-CD haute densité, et non à la couche CD.

Les contournements qui sont apparus[modifier | modifier le code]

Un certain nombre de nouveaux lecteurs de Super Audio CD sont équipés de sorties numériques IEEE 1394 (également appelées FireWire ou i.Link) ou HDMI transportant des données DSD (dont certains modèles de la première ère de la PS3 de Sony font partie), d'où il serait possible d'obtenir le flux DSD en brut. Le mécanisme de protection utilisé est le DTCP (Digital Transmission Content Protection) et peut être sollicité dans les modes "Copier une fois" ou "Ne jamais copier".

Une compagnie installée en Suisse, DVD Upgrades, a proposé à la fin années 2000 un circuit imprimé de sortie modifié qui prélève le signal numérique dans le flux de données juste avant l'étape de conversion numérique/analogique, ainsi qu'un port S/PDIF permettant de recueillir le flux DSD converti préalablement en PCM[13]. Cela permettait d'obtenir un signal numérique non DRM aussi bien d'un Super Audio CD que d'un DVD Audio.

Après l'arrivée début des années 2010 des téléchargements de fichiers DSD lisibles sur ordinateurs et transmissibles via S/PDIF ou cable Toslink vers un convertisseur, les tentatives de contournements des sécurités du disque deviennent inutiles aux yeux des pirates. Ces téléchargements offrent effectivement l'alternative de simples copies de fichiers, ce qui détourne toutes les protections du disque SA-CD.

Concurrence avec le PCM[modifier | modifier le code]

Article détaillé : Concurrence entre le DSD et le PCM.

Compromis avec le PCM : le DSD-CD[modifier | modifier le code]

Article détaillé : le DSD-CD.

L'avenir[modifier | modifier le code]

Aspects commerciaux[modifier | modifier le code]

En raison de l'échec commercial à grande échelle du Super Audio CD, celui-ci n'étant guère plus édité qu'à des fins audiophiles, mais à rythme régulier, le DSD ne semble pas voué à devenir un futur format majeur, sinon à demeurer dans l'audio haut de gamme et inconnu du grand public.

Notons que Sony va commercialiser fin janvier 2014, un enregistreur numérique de poche, le PCM-D100, compatible avec le format DSD (2,8 MHz/1 bit).

Le DSD double taux et au-dessus[modifier | modifier le code]

Le Korg MR-1000 est un enregistreur numérique 1-bit calibré sur un échantillonage de 5 644 800 bits par seconde (communément simplifié en 5.6 MHz), soit le double de l'échantillonnage DSD existant actuellement. Il est également appelé DSD128 puisque le taux normal étant de 64 fs (1 fs = échantillonnage CD = 44,1 kHz), il est ici doublé à 128 fs. Il est prévu que le DSD à double taux soit exploité par d'autres marques et soit prochainement utilisé, mais dans une moindre mesure que le DSD classique (voir section précédente).

Depuis fin 2010, les studios d'enregistrement s'équipent de plus en plus de convertisseurs et stations MAO capables du DSD double taux, et l'exploit a été réussi en mai 2013 d'accomplir un enregistrement symphonique cadencé à 11 289 600 bits par seconde (communément simplifié en 11.2 MHz ou 256 fs)[14].

Références[modifier | modifier le code]

  1. Data Converter Architectures Chapter 3 page 3.136 Consulté le 10 juin 2009
  2. a, b, c et d « Connaître le SACD » (ArchiveWikiwixArchive.isGoogleQue faire ?). Consulté le 2013-04-13
  3. a, b et c (en) Surround Sound – The High-End: SACD and DVD-Audio – Super Audio CD (SACD), sur le site extremetech.com.
  4. Généralement donnée pour un signal simplement sinusoïdal.
  5. (en) www.SA-CD.net, site référençant les Super Audio CD
  6. practical-home-theater-guide.com Direct Stream Digital Technology Retrieved June 3, 2009
  7. ISO/IEC, « ISO/IEC 14496-3:2001/Amd 6:2005 - Lossless coding of oversampled audio », ISO,‎ 14 mars 2006 (consulté le 9 octobre 2009)
  8. ISO/IEC, « ISO/IEC 14496-4:2004/Amd 15:2007 - Lossless coding of oversampled audio », ISO,‎ 6 août 2007 (consulté le 9 octobre 2009)
  9. ISO/IEC JTC 1/SC 29/WG 11 N7465, « Description Lossless coding of oversampled audio », chiariglione.org,‎ 2005-07 (consulté le 9 octobre 2009)
  10. ISO/IEC JTC 1/SC 29/WG 11 N7465, « Description Lossless coding of oversampled audio », archive.org,‎ 2005-07 (consulté le 28 décembre 2009)
  11. « Sony Starts Hybrid Super Audio CD Production Facilities in Europe », SA-CD.net,‎ 22 janvier 2003 (consulté le 12 juillet 2007)
  12. « Details of DVD-Audio and SACD », DVDdemystified.com (consulté le 12 juillet 2007)
  13. dvdupgrades.ch
  14. « Taking DSD from 2.8 MHz to 11.2 MHz doesn't just step it up to the next level, it catapults it ! », sur le site [1], consulté le vendredi 10/05/2013.