ANZEIGE
ANZEIGE

Workshop: 32 Bit Float Audio im Überblick

32 Bit: Was es kann, was es bringt

1. April 2024
Floating Audio workshop

Workshop: 32 Bit Float Audio im Überblick

32 Bit Float Audio (eigentlich: 32 Bit Floating Point Audio) sorgt für viel Verwirrung und noch mehr Fragen. Dieser Artikel befasst sich mit den wichtigsten Eigenschaften und Nutzen für Musiker und Musikproduzenten (Tonmeister wissen das eh alles schon). Also, 32 Bit Float Audio:

ANZEIGE

Braucht man es? Nein.
Macht es das Leben leichter? Unter Umständen schon.
Hat 24 Bit nun ausgedient? Noch lange nicht.

Für alle, die wissen wollen, warum die obigen Antworten so lauten, für die ist der folgende Überblick.

Was bedeutet Digitalisierung von Audiodaten?

Die analogen (kontinuierlichen) Audiosignale werden von einem Analog-Digital-Konverter (ADC) in eine eindeutige, zeitliche Abfolge von numerischen ganzzahligen Beträgen (Samples) verwandelt. Die Häufigkeit, mit der Samples pro Sekunde erfasst werden, heißt deshalb auch Abtastrate oder Sample-Rate und bestimmt die maximale Frequenz, die erfasst werden kann. Auf der mathematischen Grundlage des Shannon/Nyquist-Theorems muss die Abtastrate doppelt so hoch sein, wie die höchste Frequenz, die erfasst werden soll, um sie wieder sauber reproduzieren zu können, also zurück in kontinuierliche Signale zu verwandeln. Demnach können mit einer Werteerfassungsrate von 48.000 Mal pro Sekunde Frequenzen bis 24.000 Hz erfasst werden. Frequenzen darüber werden von der eingebauten Bandlimitierung ausgefiltert.

ADC – Signaldigitalisierung und Quantisierungsrauschen (Rundungsfehler bei der Umwandlung von reellen Zahlen (Analog) in ganzzahlige Bit-Werte (Digital). Bildquelle Xiph.org

Bei der Digital-Analog-Wandlung generiert das Rekonstruktionsfilter im DA-Wandler aus diesen zeitlich separierten Werten wieder eine Spannungskurve (und keine Treppen!) und damit ein Audiosignal. Das Treppendiagramm, wie es allzu oft zur Darstellung von Digitalisierung falsch zitiert wird, ist eine spezifische „Ingenieursschreibweise“, um sich das Leben leichter zu machen. Es ist also nicht grundlegend falsch, führt aber unkommentiert zu Fehlinterpretationen bei digitaler Audioqualität. Es existieren keine „Treppen“, nur eine zeitliche Abfolge von Einzelwerten, aus denen eine Verlaufskurve gebildet wird.

Zero-hold-order: Die „Treppen“ enstehen dadurch, dass die horizontalen Linien die Zeitspanne zwischen den Einzelwerten repräsentieren. Das ist aber nur eine Darstellungsform und sagt nur bedingt etwas über die digitale „Audioqualität“ im Vergleich zur analogen aus. Bildquelle: Xiph.org

 

Bei der DAC-Wandlung wird aus den Datenpunkten eine kontinuierliche – analoge – Spannungskurve erzeugt – deren Verfolgungsexaktheit hingegen sehr wohl etwas über die Audioqualität aussagt.  Bildquelle Xiph.org

Das alles hat rein gar nichts mit 16, 24 oder 32 Bit Audio zu tun, denn die Anzahl der erfassten Samples pro Sekunde und deren individuellen Beträge sind zwei voneinander unabhängige Größen. Die als Wortbreite, Sampletiefe oder Bittiefe bezeichneten Beträge bestimmen den Dynamikumfang eines ADC/DAC.

Fix-Point-Audioformat

Die gebräuchlichsten Audiodaten sind 16 Bit (CD-Audio), 24 Bit und 32 Bit „Fixed Point“, Festkommaarithmetik. Das bedeutet, die Samples haben eindeutige, ganzzahlige Werte. Da 1 Bit (Binärwert) zwei Zustände haben kann, nämlich „0“ und „1“, lassen sich mit einer Anzahl von Bitzuständen diverse Werte darstellen. Die Maximalwerte liegen (PWR = Power of = math. Exponent)

  • bei 8 Bit = 2 PWR 8 = 2*2*2*2*2*2*2*2 = 256 Zustände, = Dezimal 0 … 255
  • bei 16 Bit („CD-Format“) = 2 PWR 16 = 65.536 Zustände = Dezimal 0 … 65.535
  • bei 24 Bit = 2 PWR 24=16 777.216 Zustände = Dezimal 0 …16.777.215
  • bei 32 Bit = 2 PWR 32 = 4.294.967.296 Zustände = Dezimal 0 … 4.294.967.295

Wobei die höchste darstellbare Zahl hier jeweils die 0 dBFS-Linie (Dezibel Full Scale/digitaler Vollauschlag) markiert. Lauter können digitale Fixed-Point-Signale nicht werden!

ANZEIGE

Da Audiosignale aber physikalisch Schwingungen mit positiver und negativer Amplitude sind, wird das erste 1 Bit als Vorzeichen benutzt. Bei 24 Bit sind das dann dezimal +/-8.388.608. Vom Betrag ist diese Darstellungen aber dasselbe. Das +/- macht man, um die Schwingungsförmigkeit von Audiosignalen besser abbilden zu können.

Da jedes zusätzliche Bit die Anzahl der darstellbaren Zustände/Werte verdoppelt, ist das linear der Gegebenheit in der physikalischen Welt zuzuordnen, dass sich die Lautstärke eines Audiosignals ca. alle 6 dB (Dezibel) ebenfalls verdoppelt (auch wenn die Mathematik dahinter nicht ganz so trivial ist).

Dementsprechend gilt folgende Zuordnung (die Zahlen sind gerundet, da es nicht genau 6 dB sind):

  • 16 (Bit) * 6 dB entsprechen 96 dB Dynamikumfang
  • 24 (Bit) * 6 dB entsprechen 144 dB Dynamikumfang
  • 32 (Bit) * 6 dB entsprechen 192 dB Dynamikumfang

In der digitalen Audiobearbeitung geht man dabei vom maximalen Wert „FS“ (Full Scale) aus und rechnet dann rückwärts auf Null runter. Bei 0 dBFS sind alle darstellbaren Bitzustände ausgereizt. Praktisch bedeutet das, je mehr Bits zur Verfügung stehen, desto leiser kann ein digitales Signal sein, bevor es im formatinhärenten Grundrauschen untergeht. Außerdem gehen noch ca. 3 dB für das wandlerinterne Dithering (Einfügen von Rauschen zum Gegenwirken von Quantisierungsrauschen und harmonischen Verzerrungen) verloren.

Fun Fact: bis ca. 65 dB empfindet das menschliche Gehör ein Geräusch als „normal laut“, ab 85 dB geht man im Allgemeinen von gesundheitlichen Beeinträchtigung aus, ab 130 dB wird das Gehör unweigerlich geschädigt und ab 170 dB wird die Gewalt der Luftdruckwellen so groß, dass sie tödliche Wirkung haben.

32 Bit Audiowandlung

32 Bit ADC/DAC Fixed Point-Konvertierung gibt es schon länger und wird durch die Reihenschaltung von zwei 24 Bit Konvertern pro Kanal erreicht, bei dem einer die leisere Regionen (die unteren 24 Bit von 32) und einer die lauten Regionen (die oberen 24 Bit von 32) aufzeichnet und beide Signale anschließend kombiniert werden. Wobei diese Verschaltungsart den Gesamtpegel des Grundrauschen etwas anhebt. Diese 4-Chip-Konfiguration findet sich z. B. auch im neuen Apogee Groove Anniversary DAC und selbst ein kleines Steinberg UR22C kann so mit 32 Bit wandeln – auch wenn es nur 102 dB Rauschabstand am Eingang hat.

Diese Fixed-Point-Wandlung gilt auch für „32 Bit Floating“ Interfaces, die dann erst nach der Wandlung die Daten direkt im 32 Bit Fließkomma Audioformat abspeichern, wie z. B. beim Tascam Portacapture X8, der Zoom F-Serie oder der Sound Devices MixPre-Serie. Eine Hardware-Lösung für direkten 32 Bit Float ADC/DAC-Wandlung gibt es derzeit nicht.

Tascam Portacapture X8

Tascam Portacapture X8

32 Bit Float Audioformat

Die 32 Bit Float Audioverbarbeitung ist ebenso nicht neu. Die Konvention IEEE 754 legte die Vorgehensweise dafür schon 1985 fest. Vor den 2000er-Jahren hatte Software zur Audiobearbeitung wie z. B. Pro Tools LE eine Mixing-Engine mit dieser Auflösung und Cockos Reaper konnte ein paar Jahre später schon mit (wahlweise) 64 Bit Floating dienen. Aber während sich bei Fixed-Point-Audioformaten die Zuordnung von Bit-Wert zu Dezibel leicht nachvollziehbar verhält (siehe oben), ist das bei Audio im Fließkommaformat deutlich komplizierter. Anders als bei Fixed Point Audio stellt hier ein Sample einen Fließkommawert zwischen -1 und + 1 als , Werte die über diese 0 dBFS-Markierung hinaus gehen werden als „Headroom“ bezeichnet.

Jedes Fließkomma-Sample besteht dabei aus drei Komponenten: der Mantisse m (Nachkommastellen), dem Exponent und dem Vorzeichen. Bei Floating-Point-Audio, das sich aus 32 Bits zusammensetzt, wären dann das erste Bit das Vorzeichen (+/-), danach folgt der 8 Bit Exponent für die nachstehende 23 Bit-Mantisse (Nachkommastellen). Nicht-computerinformatisch gesprochen ist das ein:

+/- 1 Komma [23 Bit Wert] mit einen 8 Bit großen Exponenten.

Also maximal +/-1,8388608 PWR -126/+127

Da die Exponenten mit dem Bit-Wert „00000000“ (-127) ungültig ist und „11111111“ (128) für „unendlich“ (Periode) reserviert ist, bleiben also noch 254 Werte übrig, die als Bereich von -126 bis +127 defniert sind.

Die „1“ vor dem Komma wird als „Phantom-Bit“ oder „hidden bit“ bezeichnet, da es nicht dargestellt wird, weil es immer den Wert „1“ haben muss. Das ist so aufgrund der Festlegung durch IEEE 754, bei der die Mantisse „m“ im Bereich von 1 ≤ m < 2 normalisiert wird, um Darstellungungsvarianten von mathematisch identischen Zahlen zu unterbinden, also eindeutige Ergebnisse zu liefern.

Die weitere genaue Mathematik dahinter möchte ich uns hier ersparen und sie würde auch den Rahmen sprengen. Wichtig ist hier nur, dass mit 32 Bit Float Audio äquivalent ein Dynamikumfang von 1.528 dB dargestellt werden kann, der in -758 dBFS und +770 dBFS aufgeteilt wird. Allerdings kann bei Weitem nicht der ganze Bereich genutzt werden.

Der Haken ist hier nämlich der Exponent. Je größer dieser wird, desto ungenauer werden die Zahlen, da die Rundungsfehler immer größer werden, was sich dann in Rauschen manifestiert.

Kleine Anmerkung: Diese Rundungsfehler erinnern etwas an das Verhalten eines DSP (Digitaler Signalprozessor). DSPs sind darauf ausgelegt, zu einem zeitlich bestimmten Punkt ein Ergebnis zu liefern, das akzeptabel genau ist und da kann grob beschrieben „2 x 2“ auch schon mal irgendwo zwischen „3,5“ und „4,4“ liegen.
DSPs kommen in Geräten wie den UAD Audiointerfaces oder dem Eventide H3000 bis H8000, den Lexicon-, Bricasti- oder Quantec-Hallgeräten zum Einsatz, deren Besitzer auf den tollen „analogen“ oder zumindest „edlen“ Klang schwören. Ungenauigkeit muss also musikalisch nicht zwangsläufig etwas Schlechtes sein.

Wozu das alles aber, wenn diese Lautstärken niemals physikalisch dargestellt werden können?

32 Bit Float als Audioformat und bei der Effektbearbeitung

Beim Fixed-Point-Audioformat der Rauschabstand zum Signal kleiner wird, je leiser das Signal wird. Je kleiner der Rauschabstand, desto schlechter für die Musik, d. h. das Rauschen wird im Verhältnis zum Signal lauter.

Formatinhärent beträgt bei einem Signal von -80 dBFS der Rauschabstand bei Fixed-Point-Audio wenigstens

  • ca. 15 dB Rauschabstand bei 16 Bit
  • ca. 60 dB Rauschabstand bei 24 Bit
  • ca. 110 dB Rauschabstand bei 32 Bit

Der größtmögliche Rauschabstand ist der jeweilige, weiter oben angegebene Dynamikumfang.

Bei 32 Bit Float Audio dagegen schwankt der Rauschabstand aufgrund der Normalisierung der Mantisse immer zwischen -155 und -144 dBFS, egal bei welcher Lautstärke! Eine 24 Bit Audiodatei mit einem -80 dBFS Signal hat im Vergleich formatinhärent einen, um mindestens 84 dB kleineren Rauschabstand. Das ist doch was!

Es geht bei 32 Bit Float Audio im Musikbereich also letztendlich nicht darum, die lauten Signale besser aufnehmen zu können, sondern die leisen und damit mehr Feinheiten ohne zusätzliche Vorverstärkung, die zwangsläufig das Grundrauschen erhöht.

Überhaupt verhält sich das 32 Bit Float Audioformat beim Skalieren der Lautstärke durch Nachbearbeitung wesentlich robuster gegen eine einhergehende Anhebung des Grundrauschens gegenüber Fixed Point Audio.

Ein weiterer Vorteil ist der Headroom. Wo Fixed Point Audio bei 0 dBFS aufhört, bleiben bei 32 Bit Float Audioformat (per Definition) noch massig Werte übrig, um den Dynamikbereich über 0 dBFS computerintern darzustellen. Das bedeutet, solange auch die Bearbeitungsalgorithmen der Software – hier mit ganz besonderem Augenmerk auf Effekt-Plug-ins – in 32-Bit Floating ausgeführt sind, ist es nicht mehr möglich, ein musikalisch zu verwertendes Signal zu clippen („Abschneiden“ von Amplitudenspitzen, die über das Maximum von 0 dBFS hinausgehen).

Zoom F6

Zoom F6

Wenn ein Plug-in aber nur 24 Fixed Point Audiodaten verarbeiten kann, hat man bestenfalls auch nur sehr wenig von den 32 Bit Float Vorteilen und etliche Plug-ins erwarten oftmals auch noch einen Eingangspegel von unter -14 dBFS. Das schränkt dann die Nützlichkeit von 32 Bit Float Audio Formaten in der Bearbeitung doch ein. Hier gilt es also, Umsicht walten zu lassen.

Als Weitergabeformat z. B. zur Musikveröffentlichung und auch Zulieferung zur Verwendung in anderen Medien (Film, Computerspiele etc.) hat 32 Bit Float Audio keine Vorteile gegenüber 24 Bit Audioformaten, da der Dynamikbereich von 24 Bit absolut ausreichend für jede Form von Musikdarstellung bzw. Medienprodukt ist. Im technischen oder wissenschaftlichen Bereich mag das anders sein, aber das ist hier irrelevant.

32 Bit Floating Mix-Engine in der DAW

Die Sample-Tiefe einer DAW-Mix-Engine kann prinzipiell gar nicht groß genug sein. Mischt man zwei  Audiospuren, die zwar gleich laut aber ansonsten inhaltlich verschieden sind (z.B. Bass und Schalgzeug), dann geht dabei ein halbes Bit / 3 dB an Dynamikinformation verloren. Das ist so aufgrund der logarithmischen Mathematik von Dezibel. Die Schallleistungssumme errechnet sich hier aus x dB + x dB = x dB +3. Die 3 dB Zuwachs müssen dann wieder abgezogen werden.
Da wäre man bei einer Fixed 16 Bit Mix-Engine sehr schnell am Ende, denn bei bestenfalls 12 Spuren hat sich der Dynamikumfang schon auf 12 Bit Sampletiefe verschlechtert und weitere Abzüge durch das Grundrauschen und das Vermeiden von Clipping und der Schutzabstand gegen Inter-Sample-Peaks (wenn einzelne Sample-Werte zwar nicht über 0 dBFS liegen, die vom DAC erzeugte Spannungskurve aber über dessen maximale erzeugbare Spannung hinaus gehen würde, was er natürlich nicht mehr reräsentieren kann und dann Rechtecksignale erzeugt= Verzerrung) ist dabei noch gar nicht berücksichtigt. Jedenfalls wäre das Ergebnis alles andere als HiFi.

Auch eine Fixed 24 oder 32 Bit Mix-Engine wäre hier sehr schnell am Ende. Bei 32-Bit Float Audio hingegen ist die Obergrenze der mixbaren Tracks ohne hörbaren Qualitätsverlust für die Audiopraxis nicht mehr relevant und es gibt keine DAW mehr, die nicht mindestens 32 Bit Float Audio beherrscht.

Ob in der DAW bzw. beim Mixdown das oben zuvor erwähnte schwankende Grundrauschen und die Rundungsfehler von 32 Bit Float ein Problem sind, darüber streiten sich die Gemüter und ja, unter bestimmten Umständen fällt es auf und die allerletzte Antwort ist eine 32 Bit Floating-Point Mix-Engine auch nicht, denn sonst gäbe es keine Optionen für 64 Bit Float Audio. Auch schworen z. B. die alten Pro Tools TDM-Anwender darauf, dass ein Mixdown mit einer 48 Bit Fixed Point Mix-Engine besser klingt als einer mit 32 Bit Floating-Engine. Aber im Gesamten überwiegen die Vorteile einer 32 Bit Float Audio Mix-Engine die Nachteile schon sehr deutlich, aber es stellt auch das Minimum and Qualität dar. Falls verfügbar, sollte man DAW-Projekte also mit einer besseren Option abmischen. Die Bit-Tiefe und Sample-Rate der verwendeten Audiodaten ist dabei nicht von Belang.

avid pro tools

Avid Pro Tools

32 Bit Float Audio in der realen Welt

Da es keinen zwingenden physikalischen Zusammenhang gibt, wie „laut“ ein digitales Audiosignal in der physikalischen Welt zu sein hat, da es ja nur eine Zahl ist, könnte ein ADC/DAC-Konverter aus dieser Zahl praktisch jede beliebige elektrische Spannung erzeugen (D/A) bzw. eine elektrische Spannung in eine beliebige Zahl (A/D). Alles eine Frage der Eichung.

In der Audiobranche hat man sich daher international darauf geeinigt, dass ein elektrisch gemessener Lautstärkewert von 0 dBu („u“ = „unloaded“, d. h. die Impedanz wird nicht berücksichtigt) einer elektrischen Spannung von 0,775 Volt entspricht. Dies ist der Referenzwert, nach dem sich die Hersteller richten. Die Audiogeräte aller Art können so z. B. -10 dBu (0,244948974 V RMS) Ausgangsspannung für den „Heimgebrauch“ ausgeben, ab +4 dBu (1,227652988 V RMS) spricht man von professionellem Studiogerät. Zwar gibt es diverse multinationale Standards, welche die 100 % Pegelmarke unterschiedlich festlegen, aber die Messmethode ist davon unabhängig und damit sind technische Spezifikationen vergleichbar. Wenn man also ein analoges Signal von +20 dBu in ein Gerät schickt, das nur bis +15 dBu verträgt, dann wird Letzteres sehr deutlich übersteuern, verzerren oder clippen. Umgekehrt spricht man von Headroom und wenn das Zielgerät z. B ein Equalizer ist, dann kann man noch bis +5 dBu Verstärkung drauflegen, bevor er das Signal verzerrt.

DACs sind dann so geeicht, dass sie bei 0 dBFS ihre maximale elektrische dBu-Spannung ausgeben. Das ist aber immer noch unabhängig von der zusätzlichen elektrischen Verstärkung durch Endstufen und den durch Lautsprecher schließlich erzeugten Schalldruck, der an unsere Ohren gelangt. Dafür gibt es dann weitere Messrichtlinien, um Gesundheitsschädigungen zu vermeiden. Bei ADCs ist der maximale dBu-Eingangspegel bei der Wandlung auf 0 dBFS geeicht.

Beim Aufnehmen heißt das aber auch, man kann so viele Bits zu Analog-Digial-Wandlung benutzen, wie man will, die elektrischen Limiterungen der vorgeschalteten analogen Mikrofone, Preamps, Kompressoren, EQs, Hallgeräten etc. bleiben bestehen und können auch nicht umgangen werden. Wenn ein Mikrofon maximal 100 dB Schalldruck verträgt, kann man auch mit 32 Bit Float Audio keine 120 dB Signale aufnehmen. Wenn ein analoges Effektgerät, z.B. ein Grundrauschen von 10 dB und einen Dynamikumfang von 85 dB hat, dann ändert der bestenfalls 142 dB große Dynamikumfang (z. B. Sound Devices MixPre) des Analog-Digital-Wandlers auch nichts daran.

Aufnehmen in 32 Bit Audio bedeutet hier lediglich, dass man für den Audioeinsatz den vollen Dynamikumfang der Signalquelle ohne Verstärkung, also ohne das zusätzliche Einbringen von Rauschen oder Verlust von Dynamik durch Limiterung ausschöpfen kann.

In der Praxis kann z. B. so mit einem 32 Bit AD Wandler bei einer Orchesteraufnahme die Triangel und das gleich darauf folgende Crescendo mit der gleichen Pegeleinstellung aufgenommen werden, ohne dass Letzteres die Aufnahme übersteuert. Oder bei einem Gewitter die Regentropfen aufnehmen, ohne dass der Donner die Aufnahme ruiniert. Kurz, 32 Bit Aufnahmen sind immer dann sinnvoll, wenn mit einer unvorhersehbaren Abfolge von sehr leisen und sehr lauten Signalen zu rechnen ist – also praktisch bei allem, was live mit Mikrofonen aufgenommen wird. Natürlich immer vorausgesetzt, dass die physikalischen und elektrischen Spezifikationen der Mikrofone, Vorverstärker etc. nicht überschritten werden.

32 Bit Audio setzt auch nicht die Regeln der Akustik außer Kraft oder die Richtcharakteristik eines Mikrofons. Alles bleibt wie gehabt, nur das Einpegeln des Aufnahmelevels wird deutlich einfacher und man muss sich keinen Kopf mehr darum machen – wie damals bei 16 Bit Aufnahmen, was gelinde gesagt immer ein Pain-in-the-Ass war und es gibt keinen einzigen Grund mehr, sich das heute noch freiwillig anzutun, da es nur Nachteile bietet.

Bei 24 Bit dagegen kann man schon recht lax das lauteste Signal bei 60 % einpegeln und wird nur in Extremfällen Probleme mit Übersteuerung oder Grundrauschen bekommen. Im Studiobereich  sowwieso nicht. In diesem Fall wären 32 Bit dann angebracht.

ANZEIGE
Fazit

Man muss also nicht in Panik geraten aufgrund der fortschreitenden Verbreitung von 32 Bit Floating, auch wenn die Angebote verlockend sind. 24 Bit wird solange relevant bleiben, wie sich die Physiologie des Menschen nicht ändert und stellt quasi die optimale Schnittmenge aus Datenaufkommen und audiophilen Ansprüchen dar. Von daher, happy Sampling!

ANZEIGE
Forum
  1. Profilbild
    Basicnoise AHU

    Sehr informativ, vielen Dank!
    Als jemand, der gerne mal Atmos zB im Wald aufnimmt, kann ich das mit den besseren Aufnahmen von leisen Signalen bestätigen. Früher mit dem alten H1 hatte ich bei leiser Atmo recht viel Grundrauschen in der Aufnahme (auch bei 96kHz/24bit). Der neue H1 macht das mit 32bit viel besser. Nach den ersten Tests bin ich ziemlich happy. Endlich ein Hosentaschenrekorder, mit dem man eben mal schnell auch sehr leise Signale aufzeichnen kann. Und das ohne Pegeln zu müssen, was auch das mitführen eines Kopfhörers nicht mehr zwingend nötig macht.

  2. Profilbild
    TobyB RED

    , ich hab auf der letzten SB ein Interview mit Bernd Kistenmacher aufgenommen. Und hab den OTon sowohl mit 24 Bit und über die Røde Wireless Pro mit 32 Bit Floating. Dummerweise ratterte ein Koffer über den Asphalt. Die 24 Bit Aufnahme war nicht mehr zu retten. An der 32 Bit Aufnahme konnte ich das Rattern schön absenken und die Aufnahme verwenden.

  3. Profilbild
    falconi RED

    Sehr schöner Beitrag, danke.

    Ergänzend anzumerken ist vielleicht, dass ein importiertes Audiofile mit 24 Bit Fixed Point-Auflösung für eine 32/64Bit Floating Point DAWs ein eher unpraktisches Format ist, weil bei jeglicher Bearbeitung immer auf 32 Bit Floating Point umgerechnet werden muss. In digitaler Hardware mit internem 32 Bit Fixed Point Processing (ältere Digitalpulte und Harddiskrecorder) sind dagegen die letzten 8 Bit vor einer Berechnung stets mit Nullen aufgefüllt, hinterher stattdessen mit dem 32 Bit genauen Ergebnis der Berechnung. So zumindest meine Vorstellung der Vorgänge in beiden Gerätekategorien – ganz sicher bin ich nicht, denn ich kenne nur wenige und meist vage Abhandlungen zu dem Thema.

    Beim Speichern bleibt in jedem Falle der Vorteil, dass eine 24 Bit Fixed Point-Datei nur 3/4 so groß ist wie jegliche 32 Bit-Dateien.

    Möglicherweise wichtiger: Aktuelle 32 Bit-Wandler und -Interfaces („Steinberg UR22C“) haben per se keinen besseren Signal-Rauschabstand als ihre Pendants mit 24 Bit, sie geben einfach eine DAW-freundlichere „Kodierung“ aus. Bei besagtem Steinberg-Interface scheint (schien) die Situation besonders verwirrend, da das Interface dem Vernehmen nach nur als 24 Bit-Device aufscheint. Ob das von Bedeutung ist oder sich mittlerweile geändert hat, weiß ich nicht, ich besitze noch kein einziges Interface mit dem Aufdruck „32 Bit“. Vielleicht weiß jemand mehr…

    https://youtu.be/PSa27hkj3G8?t=329

    • Profilbild
      Flowwater AHU

      @falconi Ich muss dem von mir hochverehrten falconi widersprechen und ein wenig den Klugscheißer heraus hängen lassen (und mir ist bewusst, dass niemand Klugscheißer mag):

      Im 32-Bit-Floatingpoint-Format nach IEEE 754 (das ist das, mit dem heutige Prozessoren in Hardware und damit sehr schnell arbeiten) werden exakt 23 Bit für den eigentlichen Informationsgehalt und ein Bit für das Vorzeichen verwendet. Die restlichen 8 Bit sind der Exponent. Rechnet man nun 24 Bit Fixpoint in 32 Bit Floatingpoint um, dann verteilt man die 24 Bit auf das Vorzeichen-Bit und die 23 Bit und setzt den Exponenten auf Null. Da passiert kein Umrechnungsverlust.

      Umgekehrt, also 32 Bit Floatingpoint in 24 Bit Fixpoint, geschieht eine gewisse Umrechnung und damit ein Datenverlust nur dann, wenn die Gesamtaussteurung des Signals im roten Bereich ist. Dann ist der Exponent im Floatingpoint nicht Null. Da man das aber geflissentlich vermeidet, gibt es auch beim zurückrechnen keine Datenverfälschung.

      Sodele, Klugscheißer-Modus beendet. 😀

      • Profilbild
        falconi RED

        @Flowwater Dann schalte ich wieder ein.;)
        Ich wollte nur ausdrücken, dass das 24 Bit Fixed Point-Format für eine 32 oder 64 Bit-DAW „unpraktisch“ ist und eine einfache Umrechnung erfordert – die natürlich nicht verlustbehaftet ist.

        Nach meiner Vorstellung fällt die verfügbare Dynamik beim Eintritt in den „roten Bereich“ sprunghaft von 155 auf 144 dB.

  4. Profilbild
    falconi RED

    „Da wäre man bei einer Fixed 16 Bit Mix-Engine sehr schnell am Ende, denn bei 8 Spuren hat sich der Dynamikumfang schon auf 12 Bit Sampletiefe verschlechtert…“

    Ich brauche nur 3 Bit entsprechend „2 hoch 3“, 1 Bit mit jeder Verdoppelung der Kanalzahl, also 19 Bit. Die muss ich hinten von den 16 Bit abschneiden, bleiben 13 Bit.

  5. Profilbild
    Kazimoto

    Mir hat das Fazit gereicht. Wenn es um Bits, Bytes etc. geht stellt sich mein Hirn aus. Julian Kraus hatte dazu auch ein schönes Video, er sagte daß es echtes 32 Bit float nicht gibt, sondern 2 Chips getrennte Frequenzbereiche Wandeln und das Signal danach zu 32 Bit float kombiniert wird. Es wird bestimmt auch nicht viele Interfaces geben die das können. Zoom hat das angekündigte große Interface gestoppt, wegen zu viel Aufwand und Komponentenmangel. Andere Hersteller sind mir nicht bekannt.
    Mir reicht es wenn ich mein billiges UCA-202 ins Audiofuse digital-In stöpsel und alles ohne Probleme reinkommt, ob das 16, 24 oder 32 Bit ist, egal. Generell scheinen die digitalen Eingänge der Hersteller weniger problematisch geworden zu sein, früher kam da oft nur Müll raus, wenn man die Clock nicht sorgfältig angepasst hat. Keine Ahnung wie die das machen, bin nur froh daß ich nicht in irgendwelchen Mixer-Menüs suchen muss, wo denn wieder was nicht stimmt.

  6. Profilbild
    johnsonmonsen

    Vielen Dank für diesen Artikel mitsamt der praktischen Perspektive! Sofort wurden Erinnerungen an meine Amateurfunkprüfung und das damit verbundene Rechnen mit Pegeln geweckt. Es bestand schon damals eine kleine „Falle“ darin, Spannungs- und Leistungspegel zur Verwechslung anzubieten. Im Audiobereich setze ich auch schon fälschlicherweise die Bittiefe mit der Dynamik gleich, obwohl in diesem Fall selbstredend – wie schön gezeigt – mit dem doppelten Dezibel-Multiplikator (20) gerechnet werden muss, um das einzelne Quadrieren von Spannungswerten zu vermeiden. Immerhin geht es um eine hinter der Spannungsänderung steckende Leistung. Die reale Abstrahlleistung folgt prinzipiell dem Gesetz des umgekehrten Quadrats. Ob EM-Strahlung aus der Antenne heraus oder Schalldruckgradienten in das Mikrofon hinein, ist recht ähnlich. Aber Herleiten könnte ich alle Zusammenhänge auch nicht ;-)! Wieder einmal erstaunlich, wie streng die Audiotechnik mit der Funkerei zusammenhängt. Alles Gute und nochmals danke für den angestoßenen Flashback!

  7. Profilbild
    Yazz 2

    Lieber Markus, ein toller Artikel, sehr schön erklärt auch. Nachschlagewerk mäßig :)

    Eine Sache war mir tatsächlich grundlegend völlig neu: „Mischt man zwei formatidentische Audiospuren, dann geht dabei ein halbes Bit an Dynamikinformation verloren“.

    Darf ich dich noch um eine kurze Erklärung fragen? (Im Idealfall eher prinzipiell, anschaulich, weniger über Zahlen/Formeln – falls möglich….).
    So sehr ich drüber nachdenke, ich komme nicht auf die Logik dahinter….

    Das wäre echt toll. Danke in jedem Falle.
    Lg, Yazz

    • Profilbild
      Markus Schroeder RED

      @Yazz Hallo Yazz,

      Das hat damit zu tun, dass die Bits ja eigentlich Dezibels repräsentieren.
      Und nach der logarithmischen Mathematik auf denen Dezibel beruhen, ergibt sich beim Mischen (= Addieren) von zwei _gleichlauten_ aber _nicht_identischen_ Signalen eine Anhebung der Schallleistungssumme (grob: „Lautstärke“) um 3 dB.

      Also (X) dB + (X) dB = (X+3) dB.

      Diesem Zuwachs muss offensichtlich entgegengewirkt werden, in dem das Signal wieder um 3 dB (1/2 Bit) leiser gemacht wird. Bei vier gleichlauten, inkohärenten Tracks wäre der Anstieg der Schallleistungssumme 6 dB (1 Bit), die wieder abgezogen werden müssen, usw.

      Beim Mixen von zwei unterschiedlichen Signalen mit unterschiedlicher Lautstärke bleibt die Schallleistungssumme allerdings auf dem Level des lauteren Signals. Es erfolgt keine Anhebung.

      auch hier nachzulesen:
      sengpielaudio.com/Rechner-pegeladdition.htm

      Das verhält sich bei analogen wie digitalen Mixenvorgängen identisch.

      Greets,
      Markus :)

      • Profilbild
        Yazz 2

        @Markus Schroeder Perfekt, Danke Markus – jetzt macht’s auf einmal Sinn :)
        Den Link schau ich mir auch nochmal genau an.
        Hochachtungsvoll! Yazz

      • Profilbild
        falconi RED

        @Markus Schroeder Hi Markus,

        aber meiner Meinung brauchst Du nur „1/2 Bit mit jeder Verdoppelung der Anzahl zu summierender inkohärenter Signale“.

        2 Kanäle: ~3dB entsprechend 0,5 Bit
        4 Kanäle: ~6dB entsprechend 1 Bit
        8 Kanäle: ~9dB entsprechend 1,5 Bit

        Somit müsste es m.E. weiter oben heißen:

        „Da wäre man bei einer Fixed 16 Bit Mix-Engine sehr schnell am Ende, denn bei 8 Spuren hat sich der Dynamikumfang schon auf 14.5 Bit Sampletiefe verschlechtert…“
        Und bei Berücksichtung des „Worst Case“ für kohärente Signale auf 13 Bit…oder nicht?

        Steht übrigens auch beim Eberhard weiter unten in „Addieren von gleich starken inkohärenten Schallsignalen“

        https://sengpielaudio.com/Rechner-pegeladdition.htm

Kommentar erstellen

Die AMAZONA.de-Kommentarfunktion ist Ihr Forum, um sich persönlich zu den Inhalten der Artikel auszutauschen. Sich daraus ergebende Diskussionen sollten höflich und sachlich geführt werden. Politische Inhalte und Statements werden durch die Redaktion gelöscht.

Haben Sie eigene Erfahrungen mit einem Produkt gemacht, stellen Sie diese bitte über die Funktion Leser-Story erstellen ein. Für persönliche Nachrichten verwenden Sie bitte die Nachrichtenfunktion im Profil.

ANZEIGE
ANZEIGE
ANZEIGE
ANZEIGE
X
ANZEIGE X