MPEG-1/2 Audio Layer 3

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir MP3.
Un lecteur de MP3 portable.

Le MPEG-1/2 Audio Layer 3, plus connu sous son abréviation de MP3, est la spécification sonore du standard MPEG-1/MPEG-2, du Moving Picture Experts Group (MPEG).
C'est un algorithme de compression audio (voir aussi codec) capable de réduire drastiquement la quantité de données nécessaire pour restituer de l'audio, mais qui, pour l'auditeur, ressemble à une reproduction du son original non compressé : avec une bonne compression la différence de qualité devenant difficilement perceptible.

L'extension de nom de fichier est .mp3 et le type MIME est audio/mpeg[1], audio/MPA, audio/mpa-robust[2], ou audio/mp3 (dans les navigateurs Chrome/Chromium). Ce type de fichier est appelé « fichier MP3 ».

Un fichier MP3 n'est soumis à aucune mesure technique de protection.

Histoire[modifier | modifier le code]

Développement[modifier | modifier le code]

Le codage MPEG-1/2 Layer 2 est né avec le projet Digital Audio Broadcasting (radio numérique DAB) qui fut lancé par le Deutsche Luft und Raumfahrt. Ce projet a été financé par l'Union européenne, et faisait partie du programme de recherche EUREKA, plus connu sous le nom de EU-147.

Le projet EU-147 exista de 1987 à 1994. En 1991, deux formats étaient disponibles :

  • MUSICAM (Masking pattern adapted Universal Subband Coding And Multiplexing), basé sur un pur codage psycho-acoustique et un banc de filtres adaptés aux sons de type percussifs ;
  • ASPEC (Adaptive Spectral Perceptual Entropy Coding), qui introduisait la technologie de codage entropique.

Le format Musicam conçu par le CCETT, Philips et l'IRT fut choisi par l'ISO MPEG Audio dirigé par Hans-Georg Mussman en raison de sa structuration modulaire en plusieurs couches de codage [Layers], sa simplicité de mise en œuvre côté décodeur et sa grande tolérance aux erreurs de transmission.

Le format MP3 (Layer III ou couche III) a été créé par un groupe de travail réuni à la demande de Hans-Georg Mussman, et regroupant Leon Van de Kerkhof (Philips), Yves-Francois Dehery (TDF-CCETT), Karlheinz Brandenburg (Fraunhofer-Gesellschaft). Ce groupe reprenant des idées de Musicam et d'ASPEC, ajouta de nouveaux outils technologiques et créa le format MP3 conçu pour être de même qualité à 128 kbit/s que le Musicam à 192 kbit/s. C'est une qualité ressentie, profitant des lacunes de l'audition humaine, car le format est destructif.

La norme ISO MPEG Audio avec ses trois couches de codage Layer I, Layer II (Musicam), Layer III (.MP3) fut achevée officiellement en 1992 et constitua la troisième partie de MPEG-1, le premier travail du groupe MPEG, groupe à l'origine de la norme internationale ISO/CEI 11172-3[3], publiée en 1993. Le travail sur l'audio MPEG se termina en 1994 et constitua la troisième partie de MPEG-2, la norme internationale ISO/CEI 13818-3, publiée pour la première fois en 1995.

Les équipes de normalisation procédèrent à de nombreux tests subjectifs en double aveugle sur de nombreux matériaux sonores pour déterminer le niveau de compression approprié pour les diverses couches de l'algorithme. On a notamment utilisé Tom's Diner, la chanson de Suzanne Vega comme séquence de test pour l'algorithme de compression du MP3. Cette chanson a été choisie à cause de sa finesse et de sa simplicité, qui facilite la détection des imperfections du codec.

Usages[modifier | modifier le code]

Dès le début des années 2000, des réseaux d'échange sur Internet via des logiciels de partage de fichiers tels que Napster, ont beaucoup contribué à l'adoption de ce format par les consommateurs aux dépens des formats concurrents MPEG-4 Audio/TwinVQ et OGG Vorbis. Dans le même temps, les films encodés en DivX (pour la vidéo) et MP3 (pour le son) ont fait leur apparition. C'est pourquoi des constructeurs d'appareils électroniques ont commencé à commercialiser des platines lecteurs DVD-CD-DivX, des baladeurs CD Audio et des platines CD Audio capables de lire un CD de données contenant des fichiers audio MP3. Par la suite, le CD MP3 fut moins répandu avec l'apparition de baladeurs MP3 tel que l'iPod, ce qui n'améliora pas la situation du Super Audio CD et du DVD-Audio.

Aujourd'hui (2013) le format MP3 a été adopté par la majorité des sites de vente de musique en ligne tel qu'Amazon, Bandcamp[4] ou la Fnac. Seul l'iTunes Store vend de la musique au format MPEG-2/4 Audio/AAC. Le MP3 a aussi trouvé sa place pour les flux audio des radios en ligne et autres sites d'écoute de musique ainsi que dans les flux vidéos diffusés au format Flash (FLV encodé en VP6). La majorité des jeux PC l'utilisent. Le MP3 s'est largement imposé face à ses concurrents directs que sont les formats de compression mp3PRO, WMA, OGG Vorbis et AAC

Utilisation[modifier | modifier le code]

Sur les CD vierges il est indiqué « 80 minutes » pour 737 Mo (702 Mio). Pour l'audio le débit est de 2 (canaux audio) * 44 100 Hz (fréquence d'échantillonnage) * 16 (Nb de bits par échantillon) soit 1411.2 kbits/s . Le format populaire de compression audio permet une réduction de 4,11 (320 kbit/s) à 176 (8 kbit/s). Un fichier audio occupe souvent ainsi 4,11 à 22 (64 kbit/s) fois moins d'espace une fois compressé au format MP3. La réduction de taille facilite le transfert et le stockage de données musicales sur un support numérique, tel qu'un disque dur ou une mémoire flash.

Il a également été largement mis en œuvre en diffusion numérique dans les récepteurs T-DMB Radio dont la spécification a été adoptée par l'ETSI en 2005 et qui est largement répandue en Corée du Sud. En effet, le MP3 appartient à la même famille de norme MPEG Audio que le MP2 MUSICAM utilisé en radiodiffusion numérique (TNT pour la télévision numérique de terre et T-DMB Radio). Un simple transcodage binaire du format "MP2 audio diffusé" en format "MP3 enregistré" peut ainsi être réalisé dans les terminaux T-DMB, autorisant donc la mise sur le marché de baladeurs/récepteurs audionumériques qui cumulent les fonctions de décodage audio MP2 (MUSICAM) et MP3.

Technique de codage[modifier | modifier le code]

Le taux de compression peut être augmenté en choisissant un débit binaire (en anglais bitrate) plus faible. On considère en général qu'il faut au moins 128 ou 192 kilobits par seconde (kbit/s) pour bénéficier d'une qualité audio acceptable pour un morceau de musique. À 8 kbit/s, le son devient fortement altéré (bruits parasites, spectre « sourd »…).

  • Ce format de données utilise un système de compression partiellement destructif. Il ne retransmet pas intégralement le spectre des fréquences audio. En revanche il tente d'annuler d'abord les sons les moins perçus de façon à ce que les dégradations se fassent le moins remarquer possible. Ce n'est pas une compression à proprement parler, mais plutôt une suppression d'informations.
  • Compresser un fichier musical provenant d'un CD audio au format MP3 réduit la qualité. Il suffit de faire plusieurs essais à différents taux de compression pour constater une baisse progressive de la qualité. (Plus la compression est forte, plus le son est dégradé.) Une compression correspondant à 64 kbit/s donne un son « enroué » et à 32 kbit/s, un son médiocre de qualité « grandes ondes ».
  • Les termes commerciaux de « qualité CD » ou « qualité numérique » ne veulent rien dire. D'abord parce que le MP3 réduit la qualité (de façon plus ou moins perceptible) par principe même. Ensuite, parce que « numérique » n'est pas un critère de qualité (en numérique comme en analogique il existe différentes techniques de qualités très différentes).
  • La compression au format MP3 exploite un modèle psychoacoustique de l'effet dit de « masque » : si deux fréquences d'intensités différentes sont présentes en même temps, l'une peut être moins perçue que l'autre selon que ces deux fréquences sont proches ou non. La modélisation de notre audition selon ce principe est au départ empirique, mais assez efficace. Elle exploite en outre les caractéristiques psycho-acoustiques de masquage temporel du filtre en sous-bande hérité du MUSICAM dans la mesure où les sons percussifs (piano, triangle, batterie...) n'engendrent aucun artefact perceptible de type pré-écho.
  • Toutefois, si le taux de compression est trop important, on peut être amené à faire ressortir certaines harmoniques de façon non attendue. Cela donne alors l'impression de bruits parasites et désagréables au milieu du son.
  • On peut améliorer la qualité à débit moyen égal en utilisant un débit binaire variable (VBR ou Variable Bit Rate par opposition à un débit constant Constant bit rate, CBR). Dans ce cas, les instants peu complexes (contenant peu de fréquences), comme les silences par exemple, seront codés avec un débit d'information plus faible. Par exemple 64 kbit/s au lieu de 128, réduisant ainsi la taille totale du fichier tout en gardant une très bonne qualité lors des passages riches en harmoniques. L'amélioration apportée est variable selon le morceau codé. Le codage en VBR peut néanmoins poser des problèmes de compatibilité avec certains lecteurs.

Bitrate de compression : - Le CBR (Constant BitRate) : le débit des données est constant pour chaque seconde au sein du fichier, mais la qualité d’un segment à l’autre varie, surtout à bas bitrate

- Le VBR (Variable BitRate) : le débit varie plusieurs fois par seconde en vue de maintenir une qualité d’écoute théoriquement constante au sein de la musique

- L’ABR (Average BitRate) : l’encodeur se sert d’un débit moyen et tolère des variations pas trop importantes autour dudit débit (± 10 %). C’est le compromis entre le CBR et le VBR (qualité variable, mais pas trop, débit variable, mais pas trop)

explication détaillé ici : http://wmaimperator.afrikblog.com/archives/2012/03/14/23760644.html

Taux de compression[modifier | modifier le code]

L'efficacité de la compression des codeurs avec perte est habituellement définie par le débit binaire, puisque le taux de compression dépend de la taille de l'échantillon et de la fréquence d'échantillonnage du signal d'origine. Toutefois, les paramètres du disque compact sont souvent utilisés comme référence (44,1 kHz, 2×16 bits). Et aussi parfois, ceux du DAT SP (48 kHz, 2×16 bits). Le taux de compression pour cette référence est plus élevé, ce qui montre la complexité de la définition du terme « taux de compression » pour les codeurs avec perte.

Fraunhofer-Gesellschaft publie sur son site web officiel les taux de compression et les débits de données pour le MPEG-1 Layer I, II et III :

  • Layer I : 384 kbit/s, compression de 3,6 ;
  • Layer II : 160 à 256 kbit/s, compression de 8,8 à 5,5 ;
  • Layer III : 112 à 128 kbit/s, compression 12,6 à 11,0.

Ces valeurs ne disent pas grand-chose sur la qualité du résultat obtenu, puisque la qualité ne dépend pas seulement du format de codage du fichier, mais également de la qualité de l'algorithme psycho-acoustique utilisé par le codeur. Typiquement, les codeurs layer I utilisent un algorithme très simple, d'où un résultat nécessitant un débit supérieur pour un codage transparent.

En considérant de bons codeurs, on obtient :

  • Layer I codé à 384 kbit/s, même avec ses algorithmes psycho-acoustiques simples, est meilleur que Layer 2 de 192 à 256 kbit/s ;
  • Layer II codé à 160 à 192 kbit/s ;
  • Layer III codé de 112 à 128  kbit/s est équivalent au Layer II de 192 à 256 kbit/s.

Les débits présentés ne sont donc pas équivalents en termes de qualité, et les qualités ne sont pas forcément optimales. De plus, la qualité du codeur est un facteur très important. Ainsi, avec les premiers codeurs, il était généralement admis que 128 kbit/s avec le Layer III n'avait pas un son excellent, mais tout juste raisonnable. La génération de codeurs actuels permet d'obtenir un son tout à fait correct à 128 kbit/s avec le Layer III.

Si l'on est soucieux de la qualité et pas seulement du débit, on utilisera plutôt les valeurs suivantes :

  • Layer I : excellent à 384 kbit/s ;
  • Layer II : excellent de 256 à 384 kbit/s, très bon de 224 à 256 kbit/s, bon de 160 à 224 kbit/s ;
  • Layer III : excellent de 224 à 320 kbit/s, très bon de 192 à 224 kbit/s, bon de 128 à 192 kbit/s.

La stéréophonie a un débit exactement deux fois supérieur à la monophonie si la qualité est identique pour ces deux modes d'écoute. Le mode stéréo joint diffère de la stéréo simple car il ne code pas séparément les deux canaux gauche et droit si les informations sonores sont identiques, permettant un gain de qualité par rapport à la stéréo classique avec une même valeur de compression. Le procédé de la stéréophonie est un codage dit différentiel de même type que celui utilisé pour la radiodiffusion en FM stéréo.

Taux de compression et qualité du codage mp3Pro[modifier | modifier le code]

Article détaillé : mp3PRO.

Balises[modifier | modifier le code]

Outre le fait de stocker la musique de façon très compacte tout en conservant une qualité acceptable, le MP3 apporte une fonctionnalité rarement présente sur les formats audio qui l'ont précédé : les métadonnées, « metadata » en anglais (données sur les données). En clair, le fichier MP3 ne contient pas seulement la musique mais peut également apporter des informations sur celles-ci (telles que l'interprète, le titre, le nom de l'album, la pochette, les paroles de karaoké). Ces informations sont stockées sous forme de 'balises' (tag en anglais) dont il existe plusieurs versions.

Le format MP3 initial ne permettait pas de stocker des balises, tout au plus, il permettait de préciser certains paramètres binaires comme le fait que le morceau soit protégé ou non par copyright ou le fait qu'il s'agisse d'un original ou d'une copie.

Le format ID3 a été conçu pour le stockage des métadonnées dans un fichier MP3 tout en assurant le compatibilité du fichier avec les logiciels de lecture existant.

Le format RIFF Waveform permet aussi d'inclure des métadonnées mais ce type de fichier est rarement utilisé. Les données compressées en MP3 sont placées dans un conteneur RIFF de la même manière que le sont les données non compressées en PCM dans un fichier Wave standard.

Licence[modifier | modifier le code]

Bien que le MP3 soit souvent perçu par l'utilisateur final comme une technologie gratuite (parce qu'il peut en effet coder ou décoder sa musique de manière tout à fait légale pour peu que l'enregistrement original soit libre d'être copié ou lui appartienne, ou qu'il soit une copie à usage privé), cette technologie fait l'objet de brevets et d'une licence commerciale.

L'algorithme « MPEG-1 Layer 3 » décrit dans les standards fran ISO/CEI IS 11172-3 et ISO/CEI IS 13818-3 est soumis à des redevances (droits commerciaux), en France à Philips (entreprise néerlandaise), TDF (entreprise française), France Télécom (entreprise française), IRT (entreprise allemande), Fraunhofer IIS (entreprise allemande) et Technicolor pour toute utilisation ou implantation physique (notamment sur les baladeurs MP3).

Il convient de noter qu'aucune royalty n'est prélevée par ces ayants droit sur un fichier au format MP3 contrairement à une pratique courante dans le monde de la propriété intellectuelle.

Il existe de nombreux brevets revendiqués par de nombreuses organisations ou sociétés qui s'appliquent au MP3, certains ayant une validité juridique incertaine. Tunequest en liste 20[5], expirant entre 2007 et décembre 2017 aux États-Unis, date à laquelle le format tombera dans le domaine public et sera alors totalement libre de droits. Dans la mesure ou les brevets logiciels ne s'appliquent pas dans de nombreux pays, la situation juridique est encore compliquée, et doit donc être analysée pays par pays.

Les logiciels implémentant le format MP3 peuvent eux-mêmes être écrit sous une licence libre ou non-libre, le statut du format étant indépendant de celui du logiciel.

Qualité du son[modifier | modifier le code]

De nombreux audiophiles et techniciens du son ayant souvent une oreille sachant décrire des éléments sonores à l'image de Neil Young dénigrent ce format qui dénature sensiblement le son[6] à un tel point qu'ils ne l'utilisent jamais[7]. Mais pour la majorité des utilisations, cette perte de qualité est masquée par la moindre qualité des équipements audio : baladeurs mp3 avec oreillettes ( incluant également les téléphones portables, iPod, iPad ) ainsi que les haut-parleurs très médiocres des ordinateurs portables…

Une des causes des a priori négatifs vis-à-vis du MP3 vient du fait qu'à son début de l'utilisation par le grand public (fin des années 1990), les utilisateurs encodaient leurs CD audio en MP3 le plus souvent avec un taux de 128 Kps (à ce propos, dans Windows XP l'encodeur MP3 de Microsoft était limité à 128 kb/s maximum). De nos jours (2011) il est considéré que pour des fichiers de qualité acceptable, on peut choisir de les compresser selon un taux de 192 kbit/s voire 320 kbits/s [8]

Dans tous les cas, il faut noter que la qualité sonore d'un fichier MP3 varie de manière importante selon l'encodage employé (type d'algorithme, taux de compression, etc.). Alors que les fortes compressions (fichier à 64 ou 128 kb/s par exemple) dénaturent radicalement le signal audio, une oreille non initiée ne saurait faire une distinction entre un élément audio non compressé et le même élément compressé en MP3 à 320 kb/s[réf. nécessaire]. Certains sites proposent des tests "à l'aveugle" qui démontrent dans certains cas l'impossibilité de faire la différence[9].

Le format MP3 a enfin l'inconvénient de ne pas être adapté à l'encodage de morceaux enchaînés, par exemple les enregistrements en concert ou bien de musique classique. À la lecture, le passage d'un fichier MP3 au suivant provoque obligatoirement une coupure du son de quelques dixièmes de secondes. Cela est dû au données vides (padding) situées à la fin du fichier. La seule façon de réellement supprimer ce silence est de modifier la balise LAME "MusicLength" qui indique la durée exacte du morceau en excluant les balises ID3 en fin de fichier.

Logiciels permettant de créer des MP3[modifier | modifier le code]

Sous Windows[modifier | modifier le code]

Sous Windows lorsqu'on dispose d'un CD audio et d'un lecteur CD sur un ordinateur, il suffit d'insérer le CD et de le lire avec le Lecteur Windows Media intégré au système d'exploitation et de cliquer sur l'onglet « Extraire » pour transformer les fichiers audio du CD. Néanmoins, jusqu'à la version 9, le lecteur Windows Media était réglé par défaut pour encoder les fichiers au format WMA, il fallait alors modifier les options de codage dans Outils/Options, onglet Extraire la musique, et passer outre le message d'avertissement sur les défauts du codage MP3. À partir de la version 10, Windows Media Player encode par défaut en MP3.
Le codeur MP3 du Lecteur Windows Media est présent depuis la version pour Windows XP, auparavant il fallait installer un logiciel encodeur externe.

Il existe des logiciels plus spécialisés offrant plus d'options et une meilleure qualité d'encodage (principalement grâce au logiciel encodeur LAME) tels que CDex, WinLame, EAC et d'autres.

Sous OS X[modifier | modifier le code]

Lorsqu'on dispose d'un CD audio et d'un lecteur CD sur un ordinateur sous OS X ou Mac OS 9, il suffit d'insérer le CD et de le lire avec le lecteur QuickTime intégré au système. Le contenu du CD est visible et les fichiers peuvent très facilement être extraits par un glisser-déposer avec la souris. Le fichier obtenu est au format AIFF et peut être lu avec QuickTime et codé avec n'importe quel codeur MP3. Le logiciel iTunes offre des possibilités de conversion d'un format à un autre, mais ne prend pas en charge les formats ouverts les plus connus.

Pour un encodage LAME on pourra par exemple utiliser XLD[10] ou, en interaction avec iTunes, l'application iTunes-LAME[11].

Sous UNIX (GNULinux, *BSD, etc.)[modifier | modifier le code]

Logiciels adaptés à la lecture du MP3[modifier | modifier le code]

Matériels adaptés à sa lecture[modifier | modifier le code]

  • Les ordinateurs : via des logiciels (voir plus haut).
  • Les baladeurs numériques : ils permettent d'écouter partout des fichiers MP3 stockés en mémoire.
  • Les lecteurs de CD MP3 : portables ou non, ils permettent d'écouter des fichiers MP3 stockés sur des CD.
  • Les disques durs multimédia : la plupart disposent de cette fonctionnalité; les autres ne le supportent pas pour ne pas payer la licence.
  • Des lecteurs de DVD ou DVD / DivX : portables ou non, ils peuvent souvent lire des fichiers MP3 sur des CD ou DVD.
  • Des récepteurs de radio ou de télévision, analogiques récents et numérique DAB: ils peuvent parfois lire (et même de plus en plus souvent enregistrer) des fichiers MP3 sur des cartes mémoires flash et/ou périphériques de stockage USB.
  • Des consoles de jeux récentes : comme la PSP, PS3 ou la Xbox 360.
  • Des téléphones portables récents; seuls ceux se voulant très « simples » ne le font pas à l'heure actuelle.
  • Des appareils de technologies des musiques amplifiées récentes. Comme les chaînes HiFi et tous ses dérivés via une platines CD ou DVD et/ou des cartes mémoires flash et/ou périphériques USB et/ou un réseau.

Autres solutions[modifier | modifier le code]

La popularité du format MP3 a rapidement conquis de nombreux utilisateurs à partir de la seconde moitié des années 1990 tant par sa facilité d'utilisation que par le fait que pour la première fois, elle permettait de transmettre de l'information multimédia par Internet.

Toutefois, le format MP3 accuse de l'âge, et des formats plus récents sont désormais proposés, offrant un rapport qualité sonore/poids du fichier plus intéressant, grâce à un algorithme plus efficace que celui du format MP3. Parmi ceux-ci, citons le format AAC, son successeur direct, et l'OGG Vorbis qui est un format ouvert, dégagé de tout brevet. En plus d'un algorithme plus efficace, les deux formats précités offrent la possibilité d'une compression à taux d'échantillonnage variable (VBR), ce qui permet d'allouer plus d'informations pour les passages plus difficiles à compresser, et moins pour les passages moins exigeants (tels que les silences), offrant au final une qualité supérieure.

Notes et références[modifier | modifier le code]

  1. Voir RFC 3003 The audio/mpeg Media Type : [1]
  2. Voir RFC 5219 A More Loss-Tolerant RTP Payload Format for MP3 Audio : [2]
  3. (en) Information technology — Generic coding of moving pictures and associated audio information - Part 3: Audio [3]
  4. (en) Formats disponibles au téléchargements sur Bandcamp, consulté le 11 mars 2014
  5. « A Big List of MP3 Patents (and supposed expiration dates) », par tunequest, 26 février 2007, consulté le 1er mai 2010.
  6. Document PDF sur la compression audio numérique [4]
  7. http://www.tomsguide.fr/actualite/Neil-Young-Pono-Audio,18629.html
  8. www.musiciens.biz Quels formats audio ? avec ou sans compression ? http://www.musiciens.biz/Quels-formats-audio-avec-ou-sans-compression_a2151.html
  9. http://voyard.free.fr/textes_audio/test_mp3_ogg_wav.htm
  10. (en) « X Lossless Decoder: Lossless audio decoder for Mac OS X »
  11. (en) « iTunes-LAME encoder »

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]