ANZEIGE
ANZEIGE
ANZEIGE

Interview: Thomas Sandmann/Hochauflösende Audioformate

(ID: 3758)



Thomas Sandmann:
Eben nicht! Sicher braucht man für die Aufnahme einer verzerrten Gitarre mit laut rauschendem Amp keine 24 Bit, aber ein Großteil solch dynamikarmer Produktionen entsteht durch Kompression. Durch die Absenkung der lauteren Signalanteile wird eine anschließende Pegelanhebung möglich, um die Vollaussteuerung wieder zu erreichen und dabei die unverändert vorliegenden leiseren Bereiche mit anzuheben – eine Erhöhung der Lautheit, also der wahrgenommenen Lautstärke bei gleichem Pegel, ist die Folge. Zusätzlich werden Dynamikspitzen und kurze Transienten mit einem Limiter abgefangen, wobei der gewonnene Headroom ebenfalls zur Pegelanhebung genutzt werden kann. Bei diesem Vorgehen gelangen Informationen der unteren acht Bit des 24-Bit-Signals in den nutzbaren Dynamikbereich der 16 Bit einer CD.
Läge hingegen als Ausgangsmaterial nur eine 16-Bit-Aufnahme vor, würde statt dessen das Quantisierungsrauschen deutlicher in den Vordergrund treten. Da Kompression aus heutigen Produktionen nicht mehr wegzudenken ist, ergibt sich schon allein deshalb die Notwendigkeit einer Aufzeichnung mit 24 Bit, wenn man das CD-Format wirklich optimal ausnutzen will.


Thomas Sandmann:
Im Prinzip stimmt das, jedoch sind diese Signalanteile extrem leiser und in Pop- oder Rockmusik meist wirklich vernachlässigbar. In kritischen Fällen, besonders bei dynamikreicher klassischer Musik, wird aber in der Tat eine weitere Erhöhung der Wortbreite innerhalb des Dynamikprozessors sinnvoll. Aus diesem Grund arbeiten einige Geräte intern mit einer Präzision von beispielsweise 48 Bit.


Thomas Sandmann:
Doch, gibt es. Schon länger arbeitet Samplitude von SEK’D mit dem sogenannten 24 Bit Floating Point Format, das neuerdings auch in Cubase VST/32 zum Einsatz kommt. Ein Samplewort eines 24-Bit-Float-Signals ist 32 Bit breit. Wie beim Taschenrechner mit Fließkomma-Funktion können hier Nachkommastellen dargestellt werden, wenn sich vor dem Komma weniger Stellen befinden. Das kommt unserem Hörempfinden stark entgegen, denn Quantisierungsrauschen wird bei hohen Pegeln vom Signal verdeckt, ist bei leisen Passagen aber umso stärker hörbar. Leise Passagen bedeuten aber kleine Zahlen und somit wenige Stellen vor dem Komma, so daß hier viele Nachkommastellen mitgeführt werden können. Die Folge ist eine fast unendlich große Dynamik während der Bearbeitung.

A

Thomas Sandmann:
Die einfachste Möglichkeit, ein 24-Bit-Signal in ein 16-Bit-Signal zu überführen, besteht darin, die überzähligen Bits einfach abzuschneiden. Durch dieses Abschneiden entsteht in jedem Samplewort ein Fehler, der der Differenz zwischen dem im 24-Bit-Signal tatsächlich dargestellten Zahlenwert und der aus dem als Truncation bezeichneten Abschneiden resultierenden 16-Bit-Zahl entspricht. Naturgemäß liegt der Fehler in der Größenordnung des niedrigstwertigen Bits (LSB, Least Significant Bit) und ist unabhängig von der Amplitude des Signals. Der relative Fehler bezogen auf die Signalamplitude steigt also mit kleiner werdendem Pegel an. Ein stetig fallender Signalpegel, wie er beispielsweise bei einem Fade Out oder einer Hallfahne vorkommt, führt dann zu einem gegen Ende rauher werdenden Klangbild und wird zudem bei Unterschreiten der Pegelgrenze von einem LSB einfach „ausgeschaltet“, reißt also abrupt ab.

ANZEIGE

Thomas Sandmann:
Unsere analoge Hörgewohnheit kann nachempfunden werden. Hier steigen Verzerrungen und Klirrfaktor mit zunehmender Amplitude, nicht mit fallender. Sehr leise Signale nähern sich dagegen immer mehr dem Grundrauschen und gehen bei weiter fallendem Pegel in diesem unter. Um dieses Verhalten auch in digitalen Systemen zu erreichen, fügt man dem Signal bei der Wortbreitenreduktion daher ein künstliches Rauschen zu, das sogenannte Dither-Rauschen. Dabei erhöht sich zwangsweise das Hintergrundrauschen, aber die Aufnahme klingt wesentlich natürlicher. Außerdem bewirkt Dithering, daß die Korrelation zwischen Stör- und Nutzsignal vermindert oder sogar ganz aufgehoben wird, was das menschliche Ohr deutlich angenehmer empfindet.

ANZEIGE


Thomas Sandmann:
Um das Rauschen auch noch zu vermeiden, haben sich findige Ingenieure eine interessante Möglichkeit ausgedacht. Durch das sogenannte Noiseshaping wird das Frequenzspektrum des Dither-Rauschens beeinflußt, indem ein möglichst großer Anteil der Rauschenergie in hohe Frequenzbereiche verlagert wird, in denen das menschliche Ohr weniger empfindlich ist. So bleibt die gesamte Rauschenergie zwar gleich, vom Ohr wird das Rauschen aber subjektiv wesentlich leiser wahrgenommen. Noiseshaping-Algorithmen bieten verschiedene Einstellungen von moderater Formung des Rauschens bis zu dem Versuch, durch radikale Pegelerhöhung im Bereich kurz vor der halben Abtastfrequenz fast die gesamte Rauschenergie dort zu plazieren. Aber selbstverständlich hat eine solch drastische Bearbeitung nicht nur Vorteile.
Die Anhebung des Rauschpegels in den hohen Frequenzbereichen kann dazu beitragen, daß bei einer späteren Nachbearbeitung beispielsweise mit Equalizern hörbare Nebeneffekte entstehen. Daher ist es wichtig, Noiseshaping-Algorithmen tatsächlich erst als letzten Schritt der Produktion anzuwenden. Hier wird wieder einmal deutlich, daß ausgefeilte technische Verfahren nur dann zum gewünschten Ergebnis führen, wenn sie bewußt und mit dem nötigen Know-How eingesetzt werden.


Thomas Sandmann:
Wir wissen bereits, daß ein analoges Signal bei der Digitalisierung in bestimmten Zeitabständen abgetastet wird. Je häufiger diese Abtastung erfolgt, desto schneller können Änderungen der Amplitude registriert werden, was nichts anderes bedeutet, als daß höhere Frequenzen dargestellt werden können. Die höchste darstellbare Audio-Frequenz ergibt sich nach dem Shannon’schen Abtasttheorem als die Hälfte der Abtastfrequenz. Bei 44,1 kHz könnte das Audiosignal theoretisch bis 22,05 kHz reichen. Sofern höhere Frequenzen als die halbe Sampling-Frequenz (auch Nyquist-Frequenz genannt) im Audiosignal vorkommen, entstehen unangenehme, nichtlineare Verzerrungen, die als Aliasing (von „alias“, lat., der andere) bezeichnet werden. Daher ist sicherzustellen, daß vor der A/D-Wandlung tatsächlich keine solchen Frequenzen mehr im Spektrum vorhanden sind. Zu jedem A/D-Wandler gehört daher ein Anti-Aliasing-Filter, das aufgrund seiner endlichen Flankensteilheit aber bereits vor dem Wert von 22,05 kHz mit der Absenkung beginnen muß. Wenn man davon ausgeht, daß der hörbare Audiobereich bis 20 kHz reicht und gänzlich unbeeinflußt bleiben soll, ergibt sich die Forderung nach dem idealen Filter derart, daß die Flanke erst oberhalb von 20 kHz einsetzt und bis 22,05 kHz so weit gefallen ist, daß Pegel im darüber liegenden Frequenzbereich vernachlässigbar klein sind. Ein solches Filter ist mit herkömmlicher Technik aber kaum zufriedenstellend zu konstruieren, daher ist ein Kompromiß zu schließen: Entweder legt man das Filter sehr steilflankig aus, so daß die Absenkung erst oberhalb von 20 kHz beginnt, oder aber man wählt eine flachere Flanke und beginnt schon deutlich unterhalb von 20 kHz mit der Absenkung. Im ersten Fall wird das Filter durch eine hohe Welligkeit im hörbaren Bereich eine Verfälschung erzeugen, im zweiten Fall ergibt sich die Verfälschung durch die Filterflanke selbst. Erst die neueren Entwicklungen digitaler Filter zeigen Ergebnisse, bei denen die Forderungen nach weitem Durchlaßbereich und geringer Restwelligkeit gleichermaßen zufriedenstellend gelöst werden.

 

ANZEIGE
Forum
  1. Avatar
    AMAZONA Archiv

    Toll endlich mehr Durchblick. Aber Ditherung ist sicher nicht sinnvoll, die Mics und die Preamps geben genug davon ab. Extremes Noiseshaping wie beim SACD Verfahren, mit den mikroskopisch wenigen echten Bits Auflösung ist nicht so toll.

    No Oversamplung, Noiseshaping, Dithering etc, bei AD und DA uns es wird einfach analoger klingen. Aber die Raumlichkeit klappt halt immer noch zusammen im Vergleich zu Analogen High End Aufzeichnungen.

Kommentar erstellen

Die AMAZONA.de-Kommentarfunktion ist Ihr Forum, um sich persönlich zu den Inhalten der Artikel auszutauschen. Sich daraus ergebende Diskussionen sollten höflich und sachlich geführt werden. Politische Inhalte und Statements werden durch die Redaktion gelöscht.

Haben Sie eigene Erfahrungen mit einem Produkt gemacht, stellen Sie diese bitte über die Funktion Leser-Story erstellen ein. Für persönliche Nachrichten verwenden Sie bitte die Nachrichtenfunktion im Profil.

ANZEIGE
ANZEIGE
ANZEIGE
ANZEIGE
X
ANZEIGE X