Thomas Sandmann
Interview mit Thomas Sandmann über
24 Bit und 96 kHz in der Praxis
Hochauflösende Audioformate
Wenn es in Europa um digitale Audioformate und insbesondere um Themen wie doppelte Abtastraten und höhere Wortbreiten geht, stößt man immer wieder auf den gleichen Namen: Thomas Sandmann, weltbekannter Toningenieur, erfolgreicher Musikproduzent (u.a. „König von Mallorca“, derzeit Platz 1 in den deutschen Party-Charts) und mit seinem ths master mix Studio Vorreiter im Digital-Audio-Sektor, gilt förmlich als Schlüsselfigur dieser Themen. So stehen seine Vorträge auch zur Ausbildung von Toningenieuren, beispielsweise beim Schweizer Rundfunk, auf dem Programm.
Amazona-Autorin Karin Preuß sprach mit dem Herrn der Bits und Bytes über die Bedeutung doppelter Wortbreiten und Samplingfrequenzen in der Praxis, denn nachdem immer mehr handelsübliche Digitalgeräte und Recording-Programme wie Cubase VST die hochauflösenden Formate unterstützen, stellt sich die Frage, wann diese eingesetzt werden sollten und wann nicht. Schließlich unterstützt die CD, auf der die Musik letztlich landet, noch immer nur 16 Bit. Werden daher beim Aufnehmen überhaupt mehr benötigt? Daß diese Frage den Amazona-Lesern förmlich unter den Nägeln brennt, ist auch an den vielen eMail-Anfragen zum Thema zu erkennen. Unser Beitrag bringt nun endgültig Licht ins Dunkel der Digitaltechnik.
Alle reden immer von Aufnahmen mit 16, 20 oder 24 Bit. Warum sind 16 Bit schlechter als 24 Bit?
Thomas Sandmann:
Bei der Digitalisierung wird ein analoges Signal in bestimmten Zeitabständen abgetastet. Zu jedem dieser Zeitpunkte wird der Pegel des Signals gemessen und als Zahlenwert dargestellt. Für diesen Zahlenwert stehen beim 16-Bit-Format 2 hoch 16, also 65536 unterschiedliche, diskrete Zahlenwerte zur Verfügung.
Da es nur ganze Zahlen gibt, entsteht ein Fehler in den Bereichen, in denen das ursprüngliche Analogsignal zwischen den darstellbaren Zahlenwerten lag. Dieser Fehler ist bei jedem Abtastwert unterschiedlich. Die Differenz zum Originalwert scheint dem Signal überlagert zu sein und ist als Quantisierungsrauschen oder als rauher Klang wahrnehmbar.
Bei einer Auflösung von 16 Bit befindet sich das Quantisierungsrauschen theoretisch 96 dB unterhalb der Vollaussteuerung. Da mit 24 Bit bereits 2 hoch 24, also 16,7 Millionen Schritte darstellbar sind, liegt das Quantisierungsrauschen eines 24-Bit Wandlers theoretisch bei -144 dB. Dynamikbereich und Rauschabstand sind also wesentlich größer.
Thomas Sandmann:
Selbstverständlich gilt die Theorie auch in der Praxis, nur darf man dort den Wandlerchip nicht isoliert betrachten. Ein Quantisierungsrauschen bei -144 dB ist deutlich weniger als das thermische Rauschen eines einzigen, an den Eingang angeschlossenen Widerstands.
Hier wird klar, daß neben der Qualität des Wandlerchips ganz besonders die Qualität des Analogteils des A/D-Wandlers zählt, und hier trennt sich auch in der Praxis die Spreu vom Weizen der angebotenen Geräte. Sehr gut ausgelegte 24-Bit-Wandler wie beispielsweise der zweikanalige AN/DI Pro von Mind Print oder der achtkanalige ADI8 von RME kommen auf Rauschabstands-Werte von typischerweise 116 dB, und mit einem speziellen Verfahren, das Gain Staging genannt wird, erreicht der 2496DSP von SEK’D sogar 132 dB.
Aber bereits das Rauschen der 16-Bit-Technik bei -96 dB ist doch kleiner als die meisten anderen Störsignale der zu digitalisierenden Aufnahme. Ist eine Erhöhung der Auflösung daher wirklich nötig?
Thomas Sandmann: Der Wert von 96 dB gilt nur, wenn die 16 Bit auch voll ausgenutzt werden. Das ist bei Aufnahmen aber nicht wirklich der Fall, denn bei der A/D-Wandlung darf im Gegensatz zur analogen Aufnahme keinerlei noch so kurze Übersteuerung erfolgen.
A/D-Wandler müssen also sehr vorsichtig ausgesteuert werden, man muß Reserven lassen, den sogenannten Headroom. Dadurch wird der darstellbare Zahlenbereich aber nicht voll ausgenutzt, von den 16 Bit werden also vielleicht nur 14 verwendet. Folglich bietet sich für die Digitalisierung ein 24-Bit-Wandler an, bei dem zwar ebenfalls ein Headroom nötig ist, aber von dessen 24 Bit dann trotzdem mehr als 20 übrig bleiben. Das Signal kann anschließend mit verschiedenen Algorithmen wie beispielsweise Dithering und Noise Shaping auf 16 Bit heruntergerechnet werden, die dann aber bis auf das letzte Bit ausgereizt sind.
Thomas Sandmann: Bei der Bearbeitung eines digitalen Signals wird mit den Zahlenwerten, aus denen das Signal besteht, gerechnet. Bei jedem Rechenvorgang entstehen Nachkommastellen, die im 16-Bit-Format jedoch nicht dargestellt werden können. Also müssen die Werte auf ganze Zahlen gebracht werden, wodurch ein Fehler entsteht, der sich durch Quantisierungsrauschen oder einen rauhen Klang bemerkbar macht. Mit jedem Rechenvorgang entsteht ein neuer Fehler, und alle entstehenden Fehler addieren sich. Die entstehenden Nachkommastellen bedeuten im digitalen Bereich eine Erhöhung der Wortbreite. Wenn diese nun nicht sofort wieder auf 16 Bit reduziert, sondern mitgeführt wird, entsteht auch kein Fehler. Allerdings ist auch eine größere Wortbreite irgendwann ausgereizt. Bei 24 Bit ist der Fehler aber so klein, daß er nicht mehr hörbar ist, denn das niederwertigste Bit eines 24-Bit-Signals liegt bei minus 144 dB. Aus diesem Grund sollte man nicht nur die Aufnahme möglichst in 24 Bit vornehmen, sondern auch alle Zwischenschritte einer digitalen Bearbeitung in diesem Format speichern. Das bedeutet beim Editieren im Computer auch, daß die Übertragung in den Rechner mit 24 Bit erfolgen muß. Erst, wenn der gesamte Bearbeitungsprozeß abgeschlossen ist, sollte auf die für die CD benötigten 16 Bit heruntergerechnet werden. Nur auf diese Weise wird das CD-Format wirklich ausgenutzt, was mit 16-Bit-Technik am Beginn der Signalkette nicht möglich wäre.
Endlich verstanden. Danke!
Toll endlich mehr Durchblick. Aber Ditherung ist sicher nicht sinnvoll, die Mics und die Preamps geben genug davon ab. Extremes Noiseshaping wie beim SACD Verfahren, mit den mikroskopisch wenigen echten Bits Auflösung ist nicht so toll.
No Oversamplung, Noiseshaping, Dithering etc, bei AD und DA uns es wird einfach analoger klingen. Aber die Raumlichkeit klappt halt immer noch zusammen im Vergleich zu Analogen High End Aufzeichnungen.