Format de fichier audio

Un article de Wikipédia, l'encyclopédie libre.
Aller à : Navigation, rechercher

Un format de fichier audio est un format de données utilisé en informatique pour stocker des sons, (de la musique, des voix, etc.) sous forme numérique. L'industrie a produit de nombreux formats destinés à une application principale ou exclusive, soit à la production, soit à la conservation, soit à la diffusion.

L'élément de programme qui transforme le signal en fichier et le fichier en signal s'appelle un codec, abréviation de COder-DECoder (codeur-décodeur).

Il faut distinguer le format de fichier et le codec. Beaucoup de fichiers annoncent leur format dans un en-tête qui occupe les quatre premiers octets (RIFF). Certains systèmes, et les utilisateurs humains, peuvent utiliser l'extension du nom de fichier de données qui désigne conventionnellement le format de fichier. Mais cette indication, la plupart du temps, indique une liste d'encodages possibles, et non l'encodage lui-même.

Actuellement, le codec le plus utilisé est de loin le mp3, suivi du wma, et de l'AAC[réf. nécessaire].

Sommaire

Caractéristiques des codages audio [modifier]

  • Nombre de canaux sonores encodés : mono, stéréo, multicanaux.
  • Fréquence d'échantillonnage : nombre d'échantillons par seconde utilisés pour décrire numériquement, le signal qui représente l'onde sonore pour chaque canal. La bande passante dépend étroitement de cette caractéristique.
  • Résolution de chaque échantillon en bits. Le rapport signal sur bruit dépend étroitement de cette caractéristique.
  • Débit numérique : taille du fichier par rapport à la durée du son.
  • compression de données ou réduction de débit
    • avec reconstitution de la forme d'onde initiale (codage de l'entropie), ou
    • avec reconstitution (plus ou moins précise) de l'impression sonore (codage psychoacoustique).
  • Puissance de calcul nécessaire à l'encodage.
  • Puissance de calcul nécessaire au décodage.
  • Structure permettant ou non
    • de commencer à jouer le fichier alors qu'on en connaît pas encore la fin,
    • de jouer un fichier à partir du milieu sans connaître le début,
    • de sauter sur un emplacement déterminé,
    • d'enregistrer des données ancillaires et auxiliaires (Métadonnées),
    • de gérer les droits de reproduction numérique (DRM),
    • d'adapter automatiquement le niveau au local d'écoute.

Selon l'usage auquel le fichier est destiné, certaines caractéristiques ont plus d'importance par rapport à d'autres.

Un format destiné aux baladeurs  :
  • Deux canaux suffisent.
  • Le débit doit être réduit pour enregistrer des temps suffisamment longs dans les mémoires des baladeurs.
  • La puissance de calcul nécessaire au décodage doit être faible pour permettre une bonne autonomie des lecteurs.
  • La bande passante doit être bonne pour écouter de la musique.
  • Le rapport signal sur bruit n'a pas besoin d'être très bon, parce que la consommation ne se fait pas dans des locaux silencieux et destinés à l'écoute.
  • La gestion des droits de reproduction intéresse les producteurs.
  • La possibilité d'adaptation automatique au local d'écoute (relever le niveau des passages faibles quand l'ambiance est bruyante grâce à des données auxiliaires) est un avantage.
  • La reconstitution de la forme d'onde est inutile.
  • La puissance de calcul nécessaire à l'encodage peut être importante.
Un format destiné à la production cinéma  :
  • Il faut deux à huit canaux.
  • La bande passante doit être excellente, elle ne pourra que se dégrader par la suite.
  • Le rapport signal sur bruit doit être excellent et la reconstitution de la forme d'onde est indispensable
    1. les signaux sont appelés à être retouchés, mélangés, traités
    2. la consommation finale se fait dans des locaux silencieux et destinés à l'écoute.

Comme c'est une activité industrielle :

  • Le débit et la puissance de calcul nécessaire tant à l'encodage qu'au décodage sont à peu près indifférents.
  • La gestion des droits de reproduction, et l'adaptation automatique au local d'écoute n'ont pas d'intérêt à ce stade.

Dans un format donné, les fichiers peuvent être déclinés en plusieurs échelles de quantification (8, 16 ou 24 bits) avec différentes fréquences d'échantillonnage (par exemple 22,05 kHz, 44,1 kHz, 48 kHz, 88,2 kHz ; 96 kHz, 176,4 kHz, 192 kilohertz,) appliqués à un certain nombre de voies (monophonique, stéréophonique, 5.1 surround, etc). Les formats qui utilisent la réduction de débit par encodage psychoacoustique proposent diverses qualités d'encodage, correspondant à plus ou moins de réduction de débit.

Le nombre de canaux sonores peuvent être réels et séparés, ou mélangés discrètement aux signaux principaux ; ils seront décodés et restitués par la suite à l'aide d'algorithmes spécifiques (Surround). Quand il y a réduction de débit, celle-ci peut utiliser ou non la redondance entre les canaux.

Utilisation des formats [modifier]

Un format est dit :

  • De production quand le signal peut être restitué après décodage identique à ce qu'il était avant l'encodage en dehors des métadonnées encapsulées (embedded).
  • De diffusion quand l'encodage vise à restituer l'impression sonore, sans garantir la restitution du signal à l'identique, en général au bénéfice d'une réduction du débit des données, ce qui rend incertaine la qualité d'un traitement ultérieur.

La question de la qualité [modifier]

Pour un format de fichier sans réduction de débit, la qualité de reproduction peut assez bien s'évaluer par le débit numérique, qui est le produit de la fréquence d'échantillonnage par le nombre de bits. Le CD, à 44,1 kHz et 16 bits, est une espèce de pivot dans cette évaluation. Quand on réduit le débit, la qualité se dégrade rapidement ; quand on l'augmente, elle s'améliore, mais de moins en moins au fur et à mesure qu'on s'éloigne. Pour l'enregistrement en direct, où, contrairement au CD terminé, on ne peut contrôler et anticiper le niveau, une résolution supérieure est appréciable, d'autant plus qu'on ne souhaite pas, à ce stade, comprimer la dynamique sonore.

Aidé par les nouveaux supports informatiques, le son peut être numérisé en 24 bits. On atteint ainsi un rapport signal sur bruit supérieur à celui du matériel de prise de son. Pour le mélange et le traitement du signal, il est préférable d'utiliser une plus grande résolution, pour éviter que l'accumulation des arrondis dans les très nombreux calculs que nécessitent les filtres et les mélanges ne s'accumulent. Les machines rapides permettent d'aller jusqu'à 64 bits (IEEE 754 double précision) ; c'est sans doute un excès de précaution, et beaucoup de matériels calculent 32 bits (IEEE 754 simple précision).

De la même façon, il est intéressant d'augmenter la fréquence d'échantillonnage à la prise de son. Cela permet d'utiliser des filtres anti-repliement moins brutaux. Quand les filtres doivent passer de « passe » à « coupe » sur 10 % d'augmentation de fréquence, comme dans le CD, ils transmettent un peu irrégulièrement la partie du signal qui doit passer, et ne peuvent couper complètement la partie qui doit disparaître. Les meilleurs filtres demandent beaucoup de calcul et ils imposent un délai important au signal. Il est préférable de laisser cette opération pour la phase finale de la production (masterisation en musique). Les appareils modernes offrent des fréquences d'échantillonnage de doubles et quadruples du CD, 88,2 kHz et 176,4 kHz et de celle de la télévision (48 kHz) soit 96 kHz et 192 kHz.

L'utilisation de formats de qualité supérieure s'impose durant les phases d'enregistrement et de production. La précision supplémentaire ainsi obtenue autorise des calculs plus fins lors de traitements numériques dans les logiciels audio. Ceci permet une amélioration subtile de la qualité lors de l'application d'effets tels que la réverbération. Et le coût se répartit entre les dizaine de milliers de consommateurs du produit fini.

Le format du CD obéit à d'autres critères. Chaque auditeur doit acquérir le matériel pour l'écoute. Celui-ci ne doit pas être trop coûteux. L'enregistrement n'est pas destiné à être modifié: le niveau peut exploiter la totalité de la dynamique du média, et le traitement du signal peut dissimuler les défauts de quantification (dither avec noise shaping). Le CD, avec une dynamique effective d'environ 92 dB est adéquat pour une dynamique sonore de 70 dB, correspondant à un mixage de musique classique. Pour les autres genres musicaux, il est largement suffisant, si l'on en juge par l'évolution des mixages (voir Guerre du volume). Il correspond aussi à l'état de l'art dans les années 1980, progressivement amélioré par les progrès sur les filtres numériques et sur le dither.

Des offres promettant un son de qualité supérieure au CD existent : pour les disques physiques, le DVD-Audio ou le SuperAudio CD de Sony, qui a l'avantage d'exister en version hybride : il est lisible à la fois selon la norme CD Audio classique, sur tous les lecteurs, et en SACD sur un lecteur dédié. D'une part, ces revendications ont été contestées[1], alors que parallèlement, le son du CD était amélioré, sans en changer le format, et d'autre part, le public audiophile visé par les arguments semble avoir été trop restreint : pour entendre une éventuelle différence, il faut en tous cas une assez grosse installation. Mais l'existence de cette différence n'est pas universellement reconnue. Par exemple, les salles de cinéma offrent un son de haute qualité, multicanal, avec une forte dynamique, en utilisant un encodage seulement un peu supérieur à celui du CD, 48 kHz et 16 bits.

La majorité du public non seulement se contente de la qualité CD, mais se tourne vers les formats de compression, perdant de la qualité pour gagner en portabilité.

Pour un format compressé par une méthode psychoacoustique, l'évaluation de la qualité sonore est plus compliquée. Ces codecs tentent de reconstituer l'impression sonore, et tirent parti des particularités de l'audition humaine, comme la propriété qu'ont les sons forts de masquer les sons faibles qui se trouvent à une fréquence peu différente, pour réduire la quantité d'information transmises. On peut comparer la différence entre l'original et l'encodage, mais l'évaluation devrait être subjective. En théorie, un fichier compressé avec une taille inférieure à celle d'un codage pour CD pourrait avoir une qualité subjective supérieure, par exemple s'il était encodé à partir d'une source enregistrée avec une fréquence d'échantillonnage supérieure. En pratique, d'une part on choisit souvent des compressions privilégiant trop la diminution de la taille pour que ce soit le cas, d'autre part souvent la source avant compression est un fichier CD.

Formats audio [modifier]

RIFF [modifier]

Plusieurs formats audio étant basés sur la norme RIFF (Resource Interchange File Format), format d'échange de fichiers resources, il convient de le décrire en premier, bien qu'il s'agisse d'une norme d'usage général.

Le principe est de définir des conteneurs et des bouts, les uns et les autres identifiés par leurs quatre premiers octets, qui sont, généralement, des caractères ASCII, de façon à pouvoir être lus par les techniciens qui ouvrent le fichier avec un éditeur hexadécimal, suivi par quatre octets qui indiquent où se trouve la fin du conteneur (ce nombre d'octets limite la taille d'un fichier RIFF à 4 Gio).

Un fichier RIFF commence par « RIFF » et la longueur totale; puis on trouve l'identifiant du premier sous-conteneur, par exemple « INFO » suivi de la longueur de ce bout, à la fin duquel commence le suivant, par exemple « WAVE » suivi de la longueur de ce bout.

WAV [modifier]

Article détaillé : WAVEform audio format.

Le format WAV (ou WAVE),(WAVEform audio format) est un conteneur basé sur le format de fichier RIFF, dans lequel son identifiant est « WAVE ». Il peut contenir des encodages audio avec réduction de débit ou non, mono ou stéréo, il a été mis au point par Microsoft et IBM. Les informations nécessaires au décodage se trouvent au début du fichier. Le WAV permet de stocker des métadonnées dans le fichier.

Le plus souvent, il contient de l'audio sans réduction de données, avec des fréquences d'échantillonnage et des résolutions variées.

Le suffixe des fichiers créés est .wav

BWF [modifier]

Le BWF (Broadcast Wave Format) est un format audio standard créé par l'European Broadcasting Union comme une amélioration du WAV à l'usage des professionnels. Les Fichiers BWF incluent une référence standardisée Timestamp qui permet et facilite la synchronisation avec un élément d'image distinct[2]. C'est le format d'enregistrement usuel de nombreuses stations de travail audio professionnelles de la télévision et du cinéma.

Stand-alone, basé sur des fichiers, multi-enregistreurs de Sound Devices[3], Zaxcom[4], HHB USA[5], (en) en:Fostex, et Aaton[6] tous utilisent BWF comme leur format préféré.

Ogg [modifier]

Le format Ogg Vorbis est un format libre, fruit de la fondation Xiph.org. Ogg est un conteneur qui peut contenir des pistes sonores audio sans perte (FLAC), encodées avec le codec psychoacoustique Vorbis, audio parlées (Speex) et vidéo (Theora). Un 'fichier Ogg' peut donc contenir l'un ou l'autre (ou une combinaison) de pistes.

AIFF [modifier]

L'AIFF est un format de stockage de sons sur les ordinateurs de Apple. C'est l'équivalent du format WAV dans le monde Windows.

Les résolutions 8, 16, 20, 24 et 32 bits (à virgule flottante) sont acceptées.

Le suffixe des fichiers créés est .aif

Une variante l'AIFF-C permet de compresser la taille jusqu'à 6x.

CAF [modifier]

Le CAF (Core audio format) a été développé par Apple pour s'affranchir des limitations de conteneur audio plus ancien comme le AIFF ou le WAV.

Il est compatible avec le système Mac OS X d'Apple depuis la version 10.3 et est lisible par Quicktime 7.

Codecs audio sans compression [modifier]

PCM et RAW [modifier]

Le format PCM n'est autre que la suite de données audio non compressées, qui est généralement stocké sous forme de .WAV sur Windows ou sous .Aiff sur Mac OS. WAV et AIFF sont des formats de fichiers flexibles conçus pour stocker plus ou moins n'importe quelle combinaison de taux d'échantillonnage ou de bitrates (bit rate). Ce sont les formats de fichier appropriés pour le stockage et la réalisation d'enregistrements originaux.

RAW (Real Audio Wrapper) est un format audio utilisé pour représenter les données de son en modulation d'impulsion codée sans en-tête ni métadonnées. Le fichier RAW est inexploitable sans les informations sur l'encodage, qui doivent être transmises par ailleurs.

CDA [modifier]

Article détaillé : Compact Disc Audio track.

Le CDA (Compact Disc Audio), est un format Microsoft spécifique à Windows, des pistes des CD audio, telles qu'elles apparaissent lorsqu'elles sont insérées dans le lecteur CD-ROM. Les CD audio du commerce répondent à la norme professionnelle "Red Book". La technique d'échantillonnage du son utilisée pour les disques compacts est la modulation d'impulsion codée (en anglais PCM, pour Pulse Coded Modulation).

Le suffixe des fichiers créés est .cda

Codecs audio avec compression sans perte [modifier]

La compression audio sans perte se basent, comme pour n'importe quel autre fichier informatique, sur le repérage de redondances dans les fichiers audio. En référence à la théorie de l'information de Claude Shannon, on la décrit comme codage de l'entropie.

La compression sans perte (lossless) signifie qu'on utilise un algorithme tel qu'on puisse toujours retrouver les données d'origine. Dans l'absolu, il existe toujours un fichier d'origine tel que l'algorithme ne ferait pas gagner d'espace disque. Ce fichier ne contiendrait vraisemblablement aucune information utile : ni fréquence discernable, ni variation de niveau, ni rythme ; tous ces éléments qui font la différence entre le signal et le bruit sont basés sur la répétition.

Typiquement, la compression sans perte permet de diviser la taille des fichiers par deux ou trois. Elle est relativement peu utilisée, car ce gain est très faible en comparaison de ceux permis par la compression avec perte (ce qui est un gros handicap pour les échanges de fichiers), et assez gourmande en temps de calcul à l'encodage. Aucun standard n'a donc suffisamment convaincu pour devenir universellement lisible.

FLAC [modifier]

Le format FLAC (Free Lossless Audio Codec), est un format libre de compression audio sans perte. Maintenu par la fondation Xiph.org, il est apprécié pour conserver la qualité des fichiers sonores originaux en alternative aux formats de compression avec perte type MP3.

ALAC [modifier]

L'ALAC (Apple Lossless Audio Codec), est un format d'encodage sans perte (lossless) créé en 2004 par Apple.

Codecs audio avec encodage psychoacoustique [modifier]

La compression audio avec perte d'informations (lossy) se base sur des algorithmes spécialisés pour déterminer quelles transformations simplifient la représentation du son tout en restituant au mieux l'impression sonore. Elle diminue la taille du fichier en éliminant les nuances non perçues ou moins essentielles au contenu. L'élimination est définitive, créer un fichier dans un format de haute qualité à partir d'un fichier compressé avec pertes ne sert strictement à rien.

Le format le plus connu est le MPEG-1/2 Audio Layer 3, dont le suffixe est .mp3. Ce format propose une qualité sonore très correcte pour un débit de 128 kbit/s. C'est ce format qui a été massivement utilisé pour transférer les musiques via internet dès la fin des années 1990. Rapidement, des baladeurs avec une mémoire réenregistrable et capables de lire directement ce format sont apparus.

Dans la décennie 2000, de nouveaux formats ont été proposés. Vu les progrès des algorithmes, ils surpassent largement le MP3 en termes de qualité à débit égal, et peuvent atteindre des qualités supérieures. De plus, certains sont moins contraignants que le MP3 quant aux droits d'utilisation (le Ogg est un format libre). Mais le MP3 reste le plus utilisé, car l'arrivée en continu de nouveaux formats, apportant un avantage assez faible par rapport aux précédents, ne permet pas de mettre en place un standard meilleur que le MP3 et lisible par tous les baladeurs.

Pour un même format de compression, il n'y a pas de manière unique de coder, car chaque algorithme cherche la meilleure manière de représenter le son d'origine suivant le langage de compression. En particulier, les codecs de MP3 ont réalisé des progrès très importants depuis le début de l'utilisation de ce format.

Elle permet typiquement un gain d'un facteur 10 de taille du fichier. Cela a rendu possible non seulement le stockage d'un temps d'écoute formidable sur les supports informatiques, mais aussi leur échange par internet, souvent illégalement.

AC3 [modifier]

Officialisée en 1992, la compression AC3 permet d’utiliser jusqu’à 6 canaux sonores indépendants avec un taux d’échantillonnage de 32, 44,1 ou 48 kHz et avec un taux de transfert allant de 32 à 640 kbit/s. Le Dolby Digital utilise ce principe de codage, c'est pourquoi on le désigne souvent sous ce nom. Format très courant dans les DVD.

MP3 [modifier]

MP3 est l'abréviation de MPEG-1/2 Audio Layer 3. Cet algorithme de compression prend naissance en 1987. L'ISO en fera un standard dans les années 92-93. La couche (Layer) III est la couche la plus complexe. Elle est dédiée à des applications nécessitant des débits faibles (128 kbit/s) d'où une adhésion très rapide du monde Internet à ce format de compression. Les taux de compression (ratio) sont d'ordinaire de 1 pour 10 (1:10) (1:4 à 1:12). Très rapide à l'encodage. Des royalties importantes sont à payer pour exploiter la licence MP3. Utiliser l'encodeur MP3 LAME dernière version, encodé à 130 kbit/s (V5) permet d'obtenir une qualité comparable au AAC (Advanced Audio Coding) encodé à 48 kbit/s[7].

Le suffixe des fichiers créés est .mp3

Type de compression : constant ou variable (VBR).

mp3PRO [modifier]

Le format mp3PRO, fruit de la collaboration entre Thomson Multimédia et l'Institut Fraunhofer, combine l'algorithme MP3 et un système améliorant la qualité des fichiers comprimés appelé (en)SBR pour Spectral Bandwidth Replication.

Ce format a été publié à la fin de 2001 ; un fichier MP3pro 64 kbit/s a une qualité équivalente à celle d'un MP3 à 128 kbit/s.

Le suffixe des fichiers créés est .mp3

Ogg Vorbis [modifier]

Vorbis se différencie des MP3, WMA et autre AAC par son algorithme. Il segmente les sources audio en paquets successifs, l'algorithme de compression agissant dans un premier temps sur chaque paquet indépendamment des autres. Cela lui permet d'avoir très peu de faiblesses sur certaines fréquences et de conserver la même qualité quel que soit le type de musique.

Le suffixe des fichiers créés est .ogg ou parfois .oga.

Par abus de langage, on appelle 'fichier Ogg' des fichiers musicaux compressés par l'algorithme Vorbis. Nous devrions parler de fichier Ogg Vorbis lorsque nous mentionnons un fichier . ogg qui ne contient qu'une piste sonore au format Vorbis.

VQF ou TwinVQ [modifier]

Le format TwinVQ (Transform-domain Weighted Interleave Vector Quantization), a été développé par NTT Cyber Space Laboratories et soutenu par Yamaha. Dans le même esprit que le MP3, il comprime encore plus et avec une meilleure qualité. On regrettera une durée d'encodage un peu trop longue, près de 10 fois plus lente que le MP3. De plus, arrivé bien plus tard, et distribué sous une licence très restrictive, il a eu peu d'adeptes et est plus ou moins abandonné.

Le suffixe des fichiers créés est .vqf, .vql ou .vqe

WMA [modifier]

Le format WMA (Windows Media Audio), créé par Microsoft à partir des recommandations MPEG-4 en 1999, est utilisé par le logiciel Windows Media Player. Ce format est lié à une gestion pointue des droits d'auteurs (Gestion numérique des droits, en anglais Digital Right Management ou DRM) qui permet de définir par exemple une durée de vie limitée pour les fichiers ou d'interdire les possibilités de gravure.

Il existe plusieurs versions du codec (wma7.1, wma9, wma pro).

Le suffixe des fichiers créés est .wma

AU [modifier]

Le format AU est assez bien répandu grâce à Unix et Linux. La fréquence d'échantillonnage est comprise entre 1 kHz et 200 kHz. Mais les applications de rendu audio ne lisent principalement que trois fréquences d'échantillonnage : 8012.821 (codec entré), 22050 et 44100 hertz.

Le suffixe des fichiers créés est .au

Les résolutions 8, 16, 20, 24 et 32 bits (flottant) sont acceptées.

ASF [modifier]

ASF Advanced Streaming Format, est un format conteneur de Microsoft servant au streaming audio et vidéo.

AA [modifier]

(en)AA Audible, est un format utilisé par Apple pour les audio-books.

AAC ou MPEG-2 AAC [modifier]

L'AAC (Advanced Audio Coding), est une extension du MPEG-2 et a été amélioré en MPEG-4, MPEG-4 Version 2 et MPEG-4 Version 3. Il a été reconnu fin avril 1997.

Le suffixe des fichiers créés est .aac, .mp4, .m4a

Apple et l'AAC

Apple a choisi l'AAC comme codec privilégié, on le retrouve dans son iPod et son logiciel iTunes. Pour la vente musicale en ligne iTunes Music Store, la norme AAC ne proposant pas de système de gestion des droits numériques (DRMs), Apple a développé son propre système, appelé FairPlay. Il est lisible sur Mac OS et Windows, uniquement avec le logiciel iTunes.

Le fait que l'AAC soit le seul format de compression à pertes plus performant que le MP3 qui soit supporté par les iPod a fortement contribué à sa popularité. Insuffisamment cependant pour qu'il s'impose comme successeur du MP3, d'autres formats cités faisant largement jeu égal en performances.

ATRAC [modifier]

L'ATRAC (Adaptive Transform Acoustic Coding) est une technique de compression audio psychoacoustique (il existe une option sans pertes) développée par Sony en 1992 pour son MiniDisc. Ce format a subi plusieurs évolutions : ATRAC3, ATRAC3plus (familièrement écrit ATRAC3+) et ATRAC Advanced Lossless se sont succédé respectivement en 1999, 2002 et 2006.

Formats multipistes [modifier]

Les formats multipistes sont une innovation récente. Ils consistent à encapsuler dans un fichier différentes pistes sonores, qui peuvent alors être combinées par l'utilisateur dans les proportions qui lui conviennent. L'idée est de proposer, pour un morceau de musique, la piste correspondant à chaque instrument (et la voix) de manière séparée. L'utilisateur peut alors créer sa propre version.

Le U-MYX avait été utilisé pour inclure des parties bonus dans les albums.

Ces formats ont l'inconvénient de nécessiter un ordinateur pour être utilisés. Cependant l'apparition de smartphones faisant office de baladeurs et capables d'exécuter des applications indépendantes permet à ces formats de devenir transportables, y compris pour la lecture avec mixage[8].

iKlax [modifier]

Le format iKlax est un format numérique d'écoute active développé par la société iKlax Media et le LaBRI. Ce format de fichier de type conteneur permet d'organiser la musique en différents groupes et de leur appliquer des contraintes.

Le format a bénéficié d'une parution scientifique lors de l'ICMC 2008 (Internation Computer Music Conference) à Belfast.

U-MYX [modifier]

Le U-MYX est un format multipiste lisible avec une application dédiée, éditée par la même entreprise qui a développé le format. Ce format a été utilisé pour fournir des morceaux en version multipiste à titre de bonus dans les albums, l'application étant fournie en même temps que les morceaux, le tout sur une session de CD visible uniquement si on lisait le disque sur un ordinateur.

Malgré ces exemples d'utilisation, le futur de U-MYX est incertain, car l'entreprise qui le produit est assez floue sur ses projets futurs.

MXP4 [modifier]

Le MXP4 est un format multipiste dans lequel les pistes encapsulées sont au format Ogg[9]. Produit par une société française, le format a bénéficié d'une forte médiatisation dans la presse française, présenté comme un « successeur du MP3 ». Une expression qui peut sembler exagérée, les formats multipistes jouant tout simplement un rôle différent[10].

Les formats propriétaires [modifier]

Certains de ces formats sont devenus obsolètes, comme le SDII de Digidesign

Les formats audiovisuels [modifier]

Ces formats contiennent, à la fois des fichiers image et des fichiers audio, ainsi que du Timecode ou un pseudo-timecode (flag).

Par exemple:Quicktime est multi-plateformes et utilise de nombreux standards de l'industrie gratuits, certains autres, très orientés, sont payants. Polyvalents et de structure de données polymorphes, certains d'entre eux sont aussi utilisés pour le streaming[11].

Calcul du débit et du poids d'un fichier audio [modifier]

Calcul du débit :

débit (kbit/s) = fréquence d'échantillonnage (kHz) x quantification (bit) x nombre de piste

exemple avec un CD audio : débit = 44.1 kHz x 16 bits x 2 = 1411 kbit/s

Calcul du poids :

Pour un format à débit constant :

taille (ko) = temps (s) x débit (kbit/s) / 8

Exemple : pour un fichier MP3 encodé à 192 kbit/s d'une durée de 3 minutes

taille = 3 x 60 x 192 / 8 = 4 320 Ko

Pour un format à débit variable :

taille moyenne(ko) = temps (s) x débit moyen(kbit/s) / 8

taille maximale(ko) = temps (s) x débit maximum(kbit/s) / 8


Les Métadonnées augmentent la taille des fichiers audio, leur taille est négligeable, cependant elles peuvent avoir pour conséquence de ralentir la lecture du fichier en temps réel.


Notes et références [modifier]

  1. Voir (en) Stanley P. Lipschitz et John Vanderkooy, « Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea », Audio Engineering Society Preprint, 2000 [texte intégral (page consultée le 5 mai 2012)]  ; (en) Stanley P. Lipschitz et John Vanderkooy, « Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Application », Audio Engineering Society Convention Paper, 2001 [texte intégral (page consultée le 5 mai 2012)] .
  2. Voir European Broadcasting Union : Spécification du Broadcast Wave Format (EBU Technical document 3285, juillet 1997)
  3. Sound Devices, fabriquant de produits professionnels portatifs
  4. Zaxcom.
  5. uk / HHB / usa / HHB USA | Outils essentiels pour les professionnels audio
  6. http://aaton.com
  7. (en) Gabriel Bouvigne for MP3'Tech - www.mp3-tech.org, « 48 kbit/s AAC public test », June 2007
  8. (en) http://www.wired.com/epicenter/2009/08/mxp4s-interactive-music-format-coming-to-iphone/
  9. http://www.lemondenumerique.com/?p=3869
  10. http://www.timrubber.com/le-mxp4-ne-va-pas-remplacer-le-mp3/
  11. Selon le lexique de l'AFNIC, voir http://www.afnic.fr/doc/lexique/d#diffusioncontinue

Voir aussi [modifier]

Articles connexes [modifier]

  • Formats de données
  • MOS : abréviation de Mean Opinion Score, ou Note d'opinion moyenne. Il s'agit d'une note donnée à un codec audio pour caractériser la qualité de la restitution sonore. La note peut varier entre 0 (très mauvais) et 5 (excellent, comparable à la version d'origine).
  • A2DP : Advanced Audio Distribution Profile est un profil Bluetooth.
  • SBC : Low Complexity Subband Codec est un codec de compression audio et vidéo spécialement conçu pour les applications audio et vidéo de Bluetooth
  • Encodage : ou codage, il consiste à transformer une source vidéo ou audio en un format informatique déterminé, à l'aide de codecs. Le terme de codage est un terme plus général, mais l'usage veut qu’encodage désigne plus particulièrement les données multimédias.
  • Transcodage pour changer l'encodage d'un média.
  • Compression audio : a pour but de réduire la taille d'un fichier audio.
  • G.711 : est une norme de compression audio utilisée pour la visioconférence en H.323 et H.320.
  • G.723 : il faisait autrefois référence à une norme de codec audio de type ADPCM… G.723.1 désigne une autre norme de codec audio de type vocodeur.
  • G.726 : encore un codec pour le téléphone
  • G.729 : utilisé pour le codage de la partie audio d'une visioconférence
  • SHN : diminutif de shorten (« court » en anglais), c'est un format audio sans perte de qualité.
  • VBR : Variable bit rate, terme anglais que l'on peut traduire en français par : « taux d'échantillonnage variable »
  • CBR : Constant bit rate, terme anglais que l'on peut traduire en français par : « taux d'échantillonnage fixe »
  • ALAC : Apple Lossless Audio Codec est un format d'encodage sans perte (lossless)
  • Voix sur réseau IP : parfois appelée téléphonie IP ou téléphonie sur Internet, souvent abrégée en « VoIP » (abrégé de l'anglais Voice over IP)
  • Traitement de la parole : notion sur le son et son traitement dans la communication par le téléphone
  • MIDI
  • Module
  • Lecteur audio