
- Hintergrund Unhörbare Musik
- Der Weg zum MP3-Format
Musik steckt voller Signale, die wir gar nicht wahrnehmen, und genau diesen Umstand macht sich das MP3-Format bei der Datenreduktion zunutze. Wir zeigen Ihnen die Tricks der Ingenieure und ab welcher Bitrate MP3 vom Original nicht zu unterscheiden ist.

Ein MP3-Player-Prototyp (1994) des Fraunhofer-Instituts. Das Gerät ist so groß wie eine Zigarettenschachtel und verfügt über ein Megabyte Speicherplatz
Bild: Frauenhofer Institut
In den 1970er Jahren keimte die Idee auf, Musik in hoher Qualität über eine Telefonleitung zu übertragen. Akustische Signale konnten und können aufgrund der geringen Bandbreite von ISDN jedoch nur mit einem sehr beschnittenen Frequenzspektrum übertragen werden. Der sogenannte Hauptsprachbereich umfasst Frequenzen von 250 Hertz bis fünf Kilohertz und garantiert eine optimale Sprachverständlichkeit, ist von Hi-Fi-Qualität aber weit entfernt. Eine Erweiterung des Frequenzbereiches vergrößert den Datenstrom, eine Komprimierung der Signale ist also notwendig.
Damit war der Grundstein für das MP3-Format gelegt. Die Erfolgsgeschichte begann bereits 1987 an der Universität Erlangen-Nürnberg, seinen charakteristischen Namen erlangte der Standard indes 1995. Die Forscher berücksichtigten in ihrem Ansatz die Grundlagen der Datenkompression und untersuchten Musik in Bezug auf redundante und irrelevante Anteile. Wenn etwas kleiner werden soll, muss schließlich etwas entfernt werden – in diesem Fall natürlich ohne Qualitätsverlust. Das MP3-Format erfüllt dieses Versprechen und setzt dabei auf die Eigenschaften des menschlichen Gehörs.

- Das sind die Köpfe hinter dem MP3-Standard. Das Audioteam formte sich 1987 an der Universität Erlangen-Nürnberg und wollte Musik in hoher Qualität über das Telefon übertragenBild: Frauenhofer Institut

Heute gelten sie als Legenden der Datenreduktion
Bild: Frauenhofer Institut
Ohrenbetrug
Musik steckt voller Töne, die wir gar nicht hören. Das liegt daran, dass die Wahrnehmung von Frequenzen in unserem Innenohr über Wanderwellen erfolgt und je nach Frequenz fallen diese kürzer respektive länger aus. Zudem verlangen tiefere Töne zur Wahrnehmung einen kräftigeren Schalldruck als hohe. Diese Vorgänge benötigen natürlich Zeit und es kommt zu Verdeckungseffekten (Maskierung), die einen Grundpfeiler bei der Datenreduktion des MP3-Formats bilden. Dabei werden Töne von anderen überlagert und sind somit irrelevant. Beispielsweise verdeckt ein lauter, dominanter Trompeteneinsatz ein filigranes Flötenspiel. Dessen Töne sind selbstverständlich noch vorhanden, werden aber aufgrund der Beschaffenheit unserer Ohren nicht mehr wahrgenommen. In der Praxis offenbaren sich Simultan-, Nach- und Vorverdeckung. Letzteres klingt nach einem Paradoxon, ist allerdings durchaus real und der Signalverarbeitung in unserem Gehirn zuzuschreiben.
Das MP3-Codierungsverfahren bildet also gut hörbare Teile der Musik sehr genau ab, andere Teile wiederum weniger genau und unhörbare Informationen werden schlicht ignoriert. Diese flexible Darstellung spart Bandbreite und fügt gleichzeitig eine Abweichung in Form eines Rauschens in das Musiksignal ein; im Idealfall wird dieses aber maskiert und ist nicht hörbar. Das ist abhängig von der Bitrate, denn ist diese zu niedrig gewählt, wird das Codiergeräusch wahrnehmbar.
Ein weiterer Grundpfeiler für die Codierung ist die Erkenntnis, dass wir in Frequenzbändern hören. In Abhängigkeit von den in der Gruppe enthaltenen Tönen wird die Zahl der Quantisierungsstufen dynamisch gewählt. Je höher ein Ton wird, desto breiter wird die Gruppe. Das ist auch der Grund für die höher empfundene Lautstärke bei hohen Tönen; außerdem werden mehr Bits für die Quantisierung benötigt. Im Gegenzug fallen nur wenig Bits an, wenn ein Ton einen großen Teil des Frequenzspektrums verdeckt und so das Quantisierungsrauschen maskiert. Die jeweils erforderliche Zahl von Quantisierungsstufen und damit der zulässige Grenzstörabstand lassen sich für jedes Teilband eindeutig berechnen. Für eine noch effizientere Codierung können zudem Teilbänder ohne Nutzsignal unterdrückt werden.

Wir hören in Frequenzbändern. Dies macht sich der Codec zunutze und teilt den Abschnitten dynamisch die Bits zur Quantisierung zu. Ist die Bitrate (96 KBit/s) jedoch auch zu gering gewählt, wird das Codiergeräusch hörbar (rot) und die Qualität leidet
Bild: Auerbach Verlag

1990 war es dann möglich, Audiosignale in hoher Qualität mit nur 64 kBit/s über eine ISDN-Telefonleitung zu übertragen
Bild: Frauenhofer Institut
Hörtest
Die Codierung ist also ein Zusammenspiel der quantisierten Frequenzbänder, Verdeckungseffekte und der gewählten Bitrate. Am effizientesten arbeitet hier der variable Ansatz, bei dem die Datenrate flexibel angepasst wird. Natürlich spielt daneben die Musikart eine große Rolle, so lässt sich etwa ein Popsong effizienter codieren als ein filigranes Jazzensemble.
Die Datenrate eines unkomprimierten Musikstücks auf einer Audio-CD beträgt rund 1,4 Megabit pro Sekunde, während das MP3-Format CD-Qualität bei einer Datenrate von lediglich 128 Kilobit pro Sekunde (kBit/s) verspricht. Aber selbst ungeschulte Hörer können hier das Quantisierungsrauschen wahrnehmen, insbesondere bei hohen Tönen. Bei noch niedrigeren Datenraten klingt die Musik zunehmend dumpfer und blecherner. Die Datenrate sollte 192 kBit/s nicht unterschreiten. Die Wahrnehmung ist allerdings auch stark von der Qualität der Wiedergabekette abhängig und auf professionellem Studio-equipment wird die verlustbehaftete Codierung schneller enttarnt. Im handelsüblichen MP3-Player macht das Format jedoch eine hervorragende Figur.

Der gelbe Ton verfügt über mehr Schalldruck, erklingt über ein gewisses Frequenzspektrum und verdeckt aufgrund dessen den roten Ton
Bild: Auerbach Verlag
Die Informationen in diesem Artikel basieren auf sorgfältiger Recherche und geben den Sachstand zum Zeitpunkt der Erstveröffentlichung wieder. Spätere Entwicklungen oder Updates sind aus diesem Grund unter Umständen nicht berücksichtigt. Für Hinweise auf möglicherweise überholte Informationen sind wir dankbar.















