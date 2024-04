Alles über das Arbeiten mit binauralem Audio

Jeder von uns, der mal ein halbwegs modernes Videospiel über Kopfhörer gespielt oder eine VR-Brille mit Audio genutzt hat, hat es schon mal gehört: Binaurales Audio (binaural = mit beiden Ohren). Dieser Begriff wird fälschlicherweise oft auch gleichgesetzt mit Begriffen wie Spatial Audio, Surround, Ambisonics, Dolby Atmos und 3D-Audio. Oder sogar Immersive Audio, was allerdings nur für ein „umschließendes“ Hören steht und für alle genannten Begriffe gilt. 3D-Audio kann man getrost so stehen lassen, aber alle anderen Formate weisen wesentliche Unterschiede zu binauralem Audio auf.

Im folgenden Workshop möchte ich alle Begriffe zum Thema „Binaurales Audio“ klären und euch zeigen, wie man es erstellt, wie man damit arbeitet sowie welche Software- und Hardware-Lösungen es dafür gibt.

Immersive, Spatial, 3D, Surround oder Binaural? Was denn nun?

Zum einen ist binaurales Audio ein Stereoformat, während die anderen alle mindestens 4 Kanäle oder gar mehr benötigen. Zudem benötigt man für diese Formate auch dementsprechend viele Lautsprecher und die Auflösung funktioniert nicht über Kopfhörer. Bei binauralem Audio ist es genau umgekehrt, denn es funktioniert prinzipiell nur über Kopfhörer, egal welche Art Kopfhörer man auch nutzt. Binaurale Tonaufnahmen sind bei weitem nichts Neues, finden aber vor allem durch Bereiche wie Gaming oder Virtual Reality zunehmend mehr Anwendung in heutigen Produktionen. Es gibt auch, wenn auch recht wenige, Hörspiele und Podcasts die als binaurales Audio vorliegen, wie z. B. eine einstündige Bonusfolge des Bayerischen Rundfunks zum 50. Geburtstag des Nationalparks Bayerischer Wald mit Waldgeräuschen. Für Filmproduktionen haben Dolby Atmos-Renderer eine Downmix-Funktion zum Erstellen einer binauralen Audiodatei und selbstverständlich wird mit binauralem Audio auch längst in der Musik experimentiert. Software-Synthesizer wie z. B. Spectrasonics Omnisphere bieten binaurale Presets an, das virtuelle Klavier Pianoteq von Modartt lässt sich binaural ausspielen und UDO Audio hat im Super 6 einen binauralen Signalpfad in einem Hardware-Synthesizer verwirklicht – um nur mal ein paar zu nennen. Edgar Froese war bereits 1974 mit seinem Album „Aqua“ einer der ersten, der ein ganzes Album in Kunstkopfstereofonie veröffentlichte. Der Begriff sollte wohlgemerkt nicht mit sogenannten binauralen Beats verwechselt werden. Des Weiteren kann die binaurale Technik auch bei Messungen, bei denen die menschlichen Höreigenschaften berücksichtigt werden müssen, genutzt werden.

Was ist räumliches Hören?

Das räumliche Hören ist ein psychoakustischer Effekt den wir alle etwas differenziert wahrnehmen. Aufgrund unserer unterschiedlichen Kopfgrößen bzw. Abstände der Ohren und unterschiedlichen Ohrmuscheln wird ein Klang auf seinem Weg zum Trommelfell bei jedem auch unterschiedlich gefiltert. Die Head-Related-Transfer-Function (kurz HRTF), zu Deutsch so etwas wie die „Außenohrübertragungsfunktion“ (das Ohrsignal), beschreibt diese Filterwirkung auf unser Gehör. Neben den Pegelunterschieden und Laufzeitdifferenzen zwischen unseren Ohren sind nämlich auch noch unser Kopf, das Außenohr und sogar der Torso und die Schultern dafür verantwortlich wie wir Klang wahrnehmen. Bereits im 19. Jahrhundert stellte man anhand eines Tests mit einer um den Kopf kreisenden Stimmgabel fest, dass der Mensch zwar den Winkel lokalisieren kann, die Verortung nach vorne und hinten aber gelegentlich verwechselt wird. Generell gibt es drei Ebenen auf denen wir Signale lokalisieren können:

Horizontal: Links / Rechts (Transversalebene)

Frontal: Vorne / Hinten (Frontalebene)

Vertikal: Oben / Unten (Sagittalebene)

Binaurale Tonaufnahmen

Binaurale Aufnahmen sind Stereoaufnahmen mit einer besonderen Technik, der sogenannten Trennkörper-Stereofonie. Diese ist eine Kombination aus Intensitäts- und Laufzeitstereofonie und soll zu einem immersiven Audioerlebnis führen. Man ahmt hier die Art und Weise, wie menschliche Ohren Schallwellen wahrnehmen, nach. Folglich geht es im Wesentlichen um den Abstand der Ohren und eine Trennung dieser durch einen absorbierenden Trennkörper. Bereits um 1920/1930 begann man die ersten Experimente mit Schaufensterpuppen und auch die Firma Schoeps widmete sich dem Thema in den 50er-Jahren. 1980 präsentierte Jürg Jecklin die OSS-Scheibe (OSS = Optimal Stereo Signal), heute besser bekannt als die Jecklin-Scheibe. Eine einfache und effiziente Weise, binaurale Aufnahmen zu erstellen. 2002 brachte dann schließlich noch die Firma Neumann mit dem KU-100 ein Kunstkopfmikrofon auf den Markt, das bis heute noch sehr häufig für Produktionen und Messungen verwendet wird. Auf die letzten beiden Aufnahmeverfahren würde ich gerne nochmal etwas näher eingehen:

Jecklyn-Scheibe

Hier wird ein Trennkörper in Scheiben- oder Ballform mit einem Durchmesser von mindestens 30 cm zwischen zwei möglichst identischen Mikrofonen platziert. Die Mikrofone sollten einen Abstand von mindestens 16,5 cm aufweisen und nicht weiter als 22 cm voneinander entfernt sein. Der Abstand entspricht in etwa dem durchschnittlichen Abstand menschlicher Ohren. Der Einfallswinkel sollte ebenfalls so gewählt werden, dass er dem eines menschlichen Ohrs entspricht. Die umschließende Ohrmuschel fehlt hier natürlich, aber das Ergebnis ist schon sehr deutlich als binaurales Audio wahrnehmbar.

Kunstkopfstereofonie

Ein Kunstkopf ist eine Nachbildung des menschlichen Kopfs mit Ohrmuscheln und integrierten Mikrofonen. Das bekannteste Modell ist sicherlich das KU-100 von Neumann, das allerdings aufgrund seines hohen Preises von aktuell 8.899,- Euro wahrscheinlich nicht für jedes Portemonnaie geeignet ist. Eine weitaus günstigere Variante wäre ein Dummy Head, entweder aus einem 3D-Drucker oder auch zum Beispiel vom Hersteller Soundman. Hierfür gibt es auch Originalkopfmikrofone (Headset-Mikrofone) zum Einsetzen in die Ohren. Die Firma DPA hat ebenso ein binaurales Headset-Mikrofon in ihrer Produktpalette, das Modell 4560. Ein Kunstkopf ist vor allem nützlich zur Aufnahme von Naturgeräuschen und kommt auch bei Messungen häufig zum Einsatz.

Es ist natürlich auch denkbar, binaurale Aufnahmen zum Erstellen von Impulsantworten zu nutzen, wie es bereits 2012 die TH Köln zusammen mit dem Westdeutschen Rundfunk getan hat. Eine weitere Möglichkeit wäre noch die Aufnahme mit einem Ambisonic-Mikrofon, von denen es eine recht überschaubare Anzahl gibt. Sennheiser und Rode bieten beispielsweise solche Modelle an und es gibt auch sehr günstige Ambisonic-Kapselsysteme für Zoom-Recorder oder deren Modell H3-VR.

Im Folgenden noch ein Aufnahmebeispiel, das ich als spontane Übung ein paar meiner Studenten zur Aufgabe gemacht hatte. Die Anordnung ist zwar, wie auf dem Bild zu sehen, nicht optimal, aber die Auflösung ist deutlich zu hören. Die sprechenden Personen waren im Raum verteilt und das Geräusch des Beatmungsgeräts lief einfach über einen Laptop aus einer beliebigen Ecke. Als Richtcharakteristik wurde eine breite Niere eingestellt.

Wiedergabe von binauralen Aufnahmen

Die räumliche Auflösung funktioniert bei der Wiedergabe, wie bereits erwähnt, nur über Kopfhörer. Diese Kopfhörer sollten nach ITU-Empfehlung (ITU-R BS.708) diffusfeldentzerrt sein, um Klangverfärbungen zu minimieren. Möchte man einen binauralen Effekt über Lautsprecher erreichen, müsste man dafür sorgen, dass die beiden Signale getrennt die beiden Ohren erreichen. Bei üblichen Lautsprecheraufstellungen hat man aber natürlich immer Übersprechungen. Für eine gelungene Auflösung über Lautsprecher gibt es zwar verschiedene Ansätze, davon ist aber keine optimal. So wären zum Beispiel zwei Lautsprecher, links und rechts vom Hörer positioniert, denkbar. Dann dürfte man aber weder sich noch seinen Kopf bewegen.

Ein anderer Ansatz ist der Einsatz von vier Lautsprechern im Raum, von denen die hinteren in den Höhen abgesenkt werden und phasengedreht sind. Außerdem müssten die hinteren Signale auch etwas zeitverzögert erscheinen. Aber auch in diesem Szenario dürfte man seine Position nicht verändern. Über ein Stereopaar in üblicher Anordnung abgespielt, führt die Wiedergabe schnell zu einem eher „dünnen“ Stereoklang. Mischt man aber beispielsweise in einem Musikstück nur einen Flächensound binaural und den Rest in Stereo, so kann das auch über Lautsprecher noch ganz interessant klingen. Das funktioniert nach eigenen Erfahrungen besser, wenn man dem binauralen Signal das hintere Feld überlässt, um dem Stereosignal nicht in die Quere zu kommen. In dem Fall gilt es natürlich, wie immer, das Signal sowohl über Lautsprecher als auch über die Kopfhörer zu überprüfen, um ein gesundes Mittelmaß zu finden.

Binauralsynthese

Der einfachste Weg, binaurales Audio zu erzeugen, ist seine Stereoaufnahmen in der DAW dementsprechend zu bearbeiten. Logic bietet zum Beispiel eine simple binaurale Panner-Funktion an. Aber auch ohne solch eine Funktion findet man mittlerweile mehrere kostenlose und kostenpflichtige Optionen.

Sennheiser dearVR Micro

Mit der Software dearVR Micro (früher AMBEO Orbit) von Sennheiser lässt sich ganz einfach eine binaurale Mischung vorhandener Spuren erstellen. In der kostenlosen Version findet man bereits alle Parameter, die man benötigt, während die kostenpflichtige Pro-Version noch Multikanal- und Ambisonic-Formate unterstützt. Es gibt auch einen Kurzfilm von Sennheiser zur Produktbewerbung, wobei ich persönlich finde, dass man das Thema hier noch wesentlich mehr hätte ausreizen müssen. Eine gute Alternative zu dearVR Micro ist der Energy Panner von Sound Particles.

Für das folgende Beispiel habe ich eine einfache Aufnahme von Fußschritten in meine DAW geladen und diese mit Hilfe von dearVR Micro per Automation um den Kopf herum bewegen lassen. Auch die Höhe (Elevation) habe ich gegen Ende aus Neugierde automatisiert. Der Effekt ist in der Regel nur sehr bedingt wahrnehmbar und verändert das Signal hier auch etwas unangenehm in seiner Klangfarbe. Das Gefühl, jemand würde um einen herumlaufen, ist allerdings sehr gut wahrnehmbar.

Für das zweite Beispiel habe ich zur Verdeutlichung vier unterschiedliche Synthesizer-Klänge, die alle die gleichen Noten spielen, wie zuvor bearbeitet und über Automationen des 360° Panners im Raum kreisen lassen. Eine Automation zu zeichnen, ist zu Beginn etwas ungewohnt, da sich der -180°-Winkel (Rückseite) sowohl auf dem höchsten als auch auf dem niedrigsten Wert der Automationsspur befindet.

Neuzeit Instruments Quasar

Eine weitere Möglichkeit ist der binaurale Audioprozessor und Zwei-Kanal-Mischer Quasar des Münchners Thomas Hutmann und seiner Firma Neuzeit Instruments. Allerdings liegt dieses Schmuckstück nur im Eurorack-Format vor. Hier liegen im Prinzip die gleichen Parameter zur Richtungslokalisierung vor, allerdings etwas funktionsreicher als bei deneben genannten Software-Lösungen.

Es gibt 2 Monoeingänge, 2 CV-Eingänge und 2 Stereoausgänge. Im Menü können Höhe, Winkel und Distanz eingestellt und mit den internen LFOs oder externen Signalen moduliert werden. Dazu gibt es noch Filter für die Eingänge und einen Hall, um die Signale frei nach Bedarf im (virtuellen) Raum herumzuwirbeln. Die beiden Eingänge werden auf 2 Positionen mit eigenen Reglern aufgeteilt (Quasar 1 und Quasar 2) und können auf eine oder beide der Positionen geroutet werden. Dazu gibt es noch einen Center-Regler mit dem man beispielsweise durch Filterung nur die Bassanteile der Signale mittig platzieren kann.

Für ein Beispiel mit Quasar habe ich einen Flächensound und ein einfaches Arpeggio genutzt. Die Signale sollten sich über Kopfhörer beide sehr deutlich von links nach rechts um den Kopf herumbewegen. Einen CV-Eingang habe ich genutzt, um mit einem LFO den Hallanteil des Arpeggiators zu modulieren. Beim Hall fällt natürlich auf, dass das Signal weiter entfernt wirkt, sobald sich der Anteil erhöht. Im Vergleich zum kostenlosen dearVR Micro, das man digital auf beliebig vielen Kanälen anwenden kann, ist Quasar natürlich sehr kostspielig für einen ziemlich speziellen Bereich der Audioproduktion. Die Auflösung ist hier aber wesentlich besser und nicht nur über die CV-Eingänge lassen sich allerhand verrückte Sachen machen. Wer sich für binaurale Elemente in seiner Musik begeistern kann, sollte es also zumindest mal auf dem Schirm haben und in einem Shop oder auf der Superbooth ausprobieren.

Synthesizer und Sampler mit binauralen Samples füttern

Über einen kleinen Umweg lässt sich auch jeder Sampler mit binauralem Audiomaterial füttern. Als Beispiel beschreibe ich mal den Vorgang für einen einfachen Flächensound (maßgeblich beeinflusst von Tom Wolfe, einem britischer Sound-Designer, der binaurale Presets für Spectrasonics Omnisphere und Arturia Pigments erstellt hat).

Hierfür nimmt man sich einfach einen Sound seiner Wahl zur Hand und fügt dessen Kanalspur einem Send-Reverb hinzu. Den Fader des Kanals stellt man auf -∞ und den Send-Effekt auf Pre-Fader, um nur noch das Hallsignal hörbar zu machen. Dem Send-Effekt fügt man einen weiteren Send-Effekt (ebenfalls Pre-Fader) hinzu und lädt in dessen Insert einen binauralen Prozessor wie beispielsweise das bereits erwähnte DearVR Micro. Nun hat man eine direkte Kontrolle über das Stereobild und die binaurale Auflösung. Möchte man, dass seine Sounds sowohl auf Lautsprechern als auch auf Kopfhörern möglichst gut funktionieren, ist dies die eleganteste Lösung. Es ist empfehlenswert, den binauralen Anteil eher auf die hinteren Kanäle zu verteilen und eine gesunde Mischung zum vorderen Stereoanteil zu finden.

In meinem Beispiel habe ich die Lautstärke des vorderen Stereosignals noch automatisiert, um den Effekt zu verstärken. Ein mittleres C über einen Zeitraum von circa 10-15 Sekunden zu exportieren, genügt erstmal, um es in einen Sampler oder Synthesizer zu laden und auszutesten. Ein Granular-Synthesizer kann hier für schöne Texturen sorgen. Dafür sollte man natürlich noch vor dem Export den „Azimuth“-Parameter automatisieren. Somit werden später, bei Nutzung der Spray-Funktion (Abspielposition wird permanent und zufällig geändert), die binauralen Anteile beliebig im Raum verteilt. Als Alternative möchte hier gerne noch den Software-Synthesizer SkyDust 3D von Sound Particles nennen. Hier gibt es eine Version für Stereo und Binaural und eine mit zusätzlichen Mehrkanalformaten.