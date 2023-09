Reine Kopfsache

Abmischen mit Kopfhörern – schwarze Kunst oder reine Kopfsache? Alle, die einen Mix ausnahmsweise mal mit Kopfhörern gemacht haben, werden sich wundern, warum dieser sich so gar nicht gut auf Monitorboxen anhört. Meistens ist das Stereopanorama viel zu weit draußen und der Reverb so gut wie nicht zu hören. Dahinter verbergen sich ganz einfache und manchmal auch nicht so einfache Dinge, die wir in diesem Workshop beleuchten wollen.

ANZEIGE

Denn Abmischen mit Kopfhörern ist nicht nur eine Verlegenheitslösung – ein Kopfhörer bietet durchaus Vorteile, sei es die Reproduzierbarkeit der Mischumgebung an verschiedenen Orten oder die Entdeckung von ungewollten digitalen Artefakten in der Aufnahme. Alles das wird genauer beleuchtet.

Am Ende des Workshops kennt ihr dann nicht nur das „Wie“ sondern auch das „Warum“, was – seien wir ehrlich – immer ein Vorteil ist. Eine weitere Tatsache ist, dass sehr gute Studiomonitore teilweise mehrere tausend Euro kosten können – pro Stück. Sehr gute Kopfhörer hingegen kosten selten über 500 Euro, in Ausnahmefällen vielleicht auch über 1.000 Euro (z. B. Sennheiser HD 820). Aber auch weit darunter finden sich exzellente Modelle, z. B. von Beyerdynamic.

Dabei lasse ich jetzt mal Wandler und Kopfhörer-Preamps außen vor und nehme einfach an, dass sie der Aufgabe gewachsen sind. Und gerade für das Heimstudio, wenn man sein Heim eben mit anderen teilt, kann ein Kopfhörer für Frieden und Ruhe in den eigenen vier Wänden sorgen. Würde man sich selber beim Abmischen zuhören, man würde vermutlich wahnsinnig werden und den Aus-Knopf suchen.

Abmischen mit Kopfhörern – Unterschiede zum Abmischen über Monitore

Um das zu ergründen, braucht es ein paar Grundlagen. Diese leiten sich meistens einfach intuitiv ab, sind aber auch manchmal etwas kniffeliger. Beginnen wir mit der Übersprechung. Damit wird nicht nur beim Abmischen in Stereo der Anteil des Signals eines Kanals auf dem anderen Kanal bezeichnet. Wird über Studiomonitore abgehört, gelangt immer auch etwas vom rechten Kanal auf das linke Ohr und umgekehrt – klar.

Bei Kopfhörern, insbesondere denen der geschlossenen Variante mit der maximalen Außendämmung, ist das aber nicht der Fall. Wird in Stereo gemischt, wird auch von einer dichotischen Wiedergabe gesprochen. Kleine Seitennote: Wird ein und dasselbe Signal auf beiden Ohrmuscheln ausgegeben, spricht man von einer „diotischen“ Wiedergabe.

Abmischen mit Kopfhörern – Intensitäts-Sterofonie

In der Literatur wird für eine Abhörsituation mit Studiomonitoren ein Unterschied von ca. 18 dBSPL (Quelle z. B. Sengpiel Audio: PraktischeDatenZurStereo-Lokalisation.pdf) angegeben, ab dem ein Signal ausschließlich auf der lauteren Monitorseite verortet wird.

Derselbe Unterschied von ca. 18 dB auf Kopfhörern lässt das Signal nicht ganz auf die Seite wandern. Es befindet sich dann mittig-seitlich. Erst bei ca. 24 dB (Zwicker, Fastl, Psychoacoustics, 2nd Ed., Seite 308, Fig. 15.12) ist das Signal ganz auf einer Seite verortet.

ANZEIGE

Hier ist also schon der erste Umstand klar: Wird auf Kopfhörern abgemischt und wird der Mix einfach auf Monitoren wiedergegeben, erscheinen die einzelnen Instrumentensignale viel weiter außen. Das gilt es zu kompensieren.

Abmischen mit Kopfhörern – Laufzeit-Stereofonie

In der Natur kommen Signale von tatsächlichen Objekten im 3D-Raum um uns herum. Die Schallwelle, die ein Objekt erzeugt, das links von uns ist, wird eben auch mit einer Verzögerung am rechten Ohr eintreffen. Dieser Laufzeit-Unterschied (also die Zeit die das Signal läuft, bis es auf das abgewandte Ohr trifft) ist zwar klein, dient aber auch zur Lokalisation. Bei Frequenzen unterhalb von 1,5 kHz wird die Schallquelle komplett auf der Seite verortet, wo das Signal 1,5 ms früher eintrifft.

Ich empfehle Laufzeit- und Intensitätssterefonie mal im Selbstversuch zu erkunden. Einfach zwei Kanäle mit identischen Signalen bestücken und einen Kanalfader herunterziehen. Im anderen Fall kann man einfach die Spurverzögerung verstellen.

Man ahnt es, hier spielen dann auch Phasenunterschiede, Phasenauslöschungen und damit eine Frequenzabhängigkeit herein; mehr davon bei der HRTF (Head Related Transfer Function). Dazu kann ein einfacher Test gemacht werden. Gibt man ein Sinussignal von 500 Hz auf beide Boxen und verzögert bei einem Kanal das Signal um 1 ms, so entsteht der Eindruck, das Signal käme nur von einer Box. Aber Vorsicht. Der Eindruck der einseitigen Darstellung des Signals bei der Phasenumkehr gilt auch nur für die ideale Hörpostition im 60-Grad-Dreieck und hier auch nur für meine konkrete Anordnung im Raum.

Wird dasselbe Signal über einen Kopfhörer abgehört, entsteht dieser seltsame Eindruck, dass in der Mitte ein Loch existiert, aber dennoch beide Seiten das Sinus-Signal tragen.

Der Grund der unterschiedlichen Wahrnehmung ist auch hier einfach wie einleuchtend. Im Fall der Monitore überlagern sich die beiden Sinusschwingungen im Raum vor einem und löschen sich mitunter physikalisch aus. Mit Kopfhörern gibt es eben keinen Raum vor einem – die Auslöschung findet rein im Kopf statt. Das eine ist quasi Hardware- und das andere im wahrsten Sinne Software-Auslöschung, bedenkt man die Konsistenz unseres bevorzugten Denkorgans.

Zurück zu dem Beispiel. Der Eindruck der einseitigen Darstellung des Signals bei Laufzeitunterschieden gilt auch nur für die ideale Hörpostition im 60-Grad-Dreieck.

Durch eine Bewegung von den Boxen weg und an verschiedene Positionen im Raum kann sehr schön der Interferenzeffekt gehört werden. Dieser äußert sich in diesem Fall darin, dass die Wahrnehmung des Signals an- und abschwillt.

Diffusfeld und Direktfeld

Das bringt uns also ohne Umschweife zum dritten Umstand: Im Kopfhörer gibt es keinen Raum davor, also auch keinen Raum drumherum – das alles muss künstlich erzeugt werden. Während bei der Wiedergabe über Monitore der Raum, in dem ich abmische, immer eine Rolle spielt (sonst würde die Industrie für Akustikbauteile auch nicht so florieren), fällt diese Ebene beim Abmischen mit Kopfhörern vollkommen weg. Es ist mehr so, als würde das Abmischen in einem schalltoten Raum stattfinden, vor allem bei geschlossenen Kopfhörern.

In diesem Zusammenhang ist auch interessant, dass die Wahrnehmung der Größe eines Raumes primär auf der Akustik und nicht der Optik beruht – alle, die schon mal in einem schalltoten Raum gestanden haben, wo sich riesiger Noppenschaumstoff an allen sechs Raumbegrenzungen befindet, können das bestätigen. Das Gehirn bringt die Optik nicht mit der Akustik in Einklang. „Dieser Raum klingt viel kleiner als er aussieht“, wird signalisiert. Manchen wird auch deshalb in solch einer Umgebung übel.

Das ist auch die Erklärung, warum beim Abmischen mit Kopfhörern Hallräume auf Boxen nicht so gut zu hören sind. Sie gehen einfach zum Teil in der Akustik des Raumes und dem von ihm erzeugten Diffusfeld unter.

Abmischen mit Kopfhörern – HRTF

Die HRTF, also die Head Related Transfer Function, beschreibt den Einfluss unserer Ohrmuscheln auf den wahrgenommenen Klang. Ohne unsere Lauscher würde unsere Wahrnehmung genau die Charakteristik eines Kugelmikrofons annehmen – und somit omnidirektional sein. Da es sich evolutionstechnisch aber als nicht von der Hand zu weisender Vorteil erwiesen haben muss zu wissen, von wo genau ein Geräusch kommt, sind wir alle mit Ohrmuscheln versehen worden. Durch die Biegungen, Brechungen und Reflektionen des Schalls, die von der Konstruktion der Ohrmuschel erzeugt werden, leitet das Gehirn dann später die 3D-Informationen der Schallquellen ab.

Persönlich empfinde ich das Außenohr ja als den ästhetisch anspruchsvollsten Teil des Körpers und genau wie die Stimme ist auch die Beschaffenheit der Ohrmuscheln individuell. Aus diesem Grund haben Misch-Plug-ins wie SKnote Mixing Room gleich mehrere HRTF-Profile, wenn es um das 3D-Hören, also die Ortung im Raum, geht. Die Nutzer müssen dann eben das Profil auswählen, das ihrem Empfinden nach am natürlichsten klingt.

Daraus ergibt sich der letzte Umstand, der beim Abmischen mit Kopfhörern beachtet werden muss. Denn die Ohrmuscheln des Kopfhörers liegen ja auf den Ohren auf und umgehen diese HRTF, indem sie direkt in den Ohrkanal tönen. Noch mehr auf der Hand liegt das bei In-Ear-Hörern. Aber auch bei ohrumschließenden Modellen bleibt die HRTF zum größten Teil außen vor.

Zusammenfassung

Nachdem nun die Hauptunterschiede erläutert wurden, kann es nun losgehen mit den konkreten Tipps für das Abmischen mit Kopfhörern. Selbstverständlich hätte das alles auch in eine einfache Formel verpackt werden können: Kopfhörer lassen die Akustik eines realen Raumes außen vor – die Gründe zu kennen, macht aber die Arbeit jedoch viel leichter.

Allgemeine Informationen zum Abmischen mit Kopfhörern

Zunächst einmal muss ein anständiges Kopfhörerpaar erworben werden. Mit Bügelkopfhörern für 30,- Euro wird man nicht weit kommen. Hier spielen aber noch mehr Faktoren als das bloße Klangerlebnis eine Rolle. Wie lässt sich der Kopfhörer tragen? Wie schwer ist er, wie angenehm die Bügelkonstruktion? Ich habe schon Kopfhörer erlebt, die besser Kopfschmerzen hätten heißen sollen, da schon nach kurzer Tragezeit der unangenehme Druck auf den Kopf alle anderen Sinneseindrücke überlagert.

Es müssen aber auch nicht zwingend die hochpreisigen Angebote der Marktführer sein. Ich denke, für unter 350,- Euro sind Kopfhörer zu bekommen, die der Aufgabe perfekt gewachsen sind.

Abmischen braucht Zeit und ist schon genug von Ermüdung geprägt. Wird diese Zeit unter Kopfhörern verbracht, macht es den Prozess nicht angenehmer. Nach einer 4 oder 5 Stunden Session würde ich keine kritischen Mix-Entscheidungen mehr treffen. Dann ist eher Probehören auf alternativen Wiedergabe-Systemen angesagt. Apropos – es gibt auch tatsächlich so etwas wie die NS-10 unter den Kopfhörern: einfache Apple Earpods. Einfach, weil sie ein Großteil der Konsumenten verwenden. Aus diesem Grund haben manche Mix-Plug-ins die Option, den Klang dieser EarPods zu simulieren, z. B. dSoniq Realphones.

Welcher generelle Kopfhörertyp – offen, halboffen oder geschlossen – bevorzugt wird, muss am besten ausprobiert werden. Für verschiedene Einsätze bieten sich eben verschiedene Typen an. Im Mixing und Mastering findet sich aber häufig der halboffene und der geschlossene Typ. Auch hier spielt wieder Ermüdung eine Rolle. Geschlossene Kopfhörer haben den höchsten Anpressdruck und wer diesen Typ lange Zeit trägt weiß, dass ein Satz warme Ohren eben nicht nur durch Schellen verteilt werden kann.

Es ist zwar eine Binse, kann aber nicht oft genug erwähnt werden – es braucht Zeit, sich an einen Kopfhörer zu gewöhnen. Genau dasselbe gilt für Monitorboxen. Es sollten viele Referenz-Tracks gehört werden und generell viel Audiomaterial, damit ein Gefühl für die Kopfhörer entsteht. Was bei neuen Monitorboxen übrigens oft empfohlen wird, ist das „Einrauschen“. Die Membranen benötigen eine Zeit, bis sie ihre endgültige Auslegung erreicht haben, genau wie neue Schuhe, die erst eingelaufen werden müssen. Dazu wird of für mehrere Stunden weißes Rauschen ausgegeben, vorzugsweise in einer kräftigen Lautstärke.

Der erste Mix auf Kopfhörern

Das Paradoxe ist, dass gerade am Anfang immer Monitorboxen zum Gegenhören genutzt werden sollten. Denn die einfachste Methode ist nun mal das Ausprobieren. Ideal wäre ein Stück, das bereits fertig abgemischt ist und von dem man genau weiß, wie es sich über die eigenen Studioboxen anhört. Viele DAWs bieten heutzutage Mix-Snapshots, wie z. B. Cockos Reaper mit den SWS-Extensions oder Cubase mit den MixConsole Snapshots. Es empfiehlt sich, eine Kopie des Projektes und zu allererst einen Snapshot anzulegen. Dieser repräsentiert den Lautsprecher-Mix.

Nun wird das ganze Stück mit dem Kopfhörer angehört und alle Einstellungen verändert, die den Mix „richtig“ klingen lassen. Anhand unserer Vorüberlegungen kann auch ganz analytisch an die Sache herangegangen werden

Wie verhalten sich die Instrumente im Panorama?

Durch den fehlenden Übersprechungseffekt fällt die Panoramabeurteilung anders aus. Im Kopfhörer rücken die Instrumente auf der Bühne näher zusammen, auch wenn im Lautsprecher-Mix alles stimmt.

Hier könnte als Mix-Hilfe eine künstlich hinzugefügte Übersprechung helfen. Ein Plug-in dafür ist beispielsweise Goodhertz CanOpener Studio 3. Das macht das Abmischen mit Kopfhörern zwar weniger ermüdend, hat für die Panoramabeurteilung aber den gegenteiligen Effekt. Instrumente müssen noch weiter außen im Panorama positioniert werden, um auf einer Seite des Kopfhörers lokalisiert zu werden.

Wie hören sich die Reverbs beim Kopfhörer-Mix an?

Für mich eines der komplizierteren Themen, denn dieser künstliche Diffusschall wirkt nun einmal sehr anders unter beiden Abmischmethoden. Auch hier ist ein Herantasten Stück-für-Stück die beste Vorgehensweise. Der Vorteil bei Kopfhörern ist, dass die verschiedenen Reverbs (heutzutage sind 5 oder mehr Hallräume im Mix keine Seltenheit) besser auseinander gehalten werden können.

Ist das Verhältnis der Reverbs untereinander stimmig, kann dann deren Gesamtlautstärke nach oben gebracht werden. Damit sind sie auch über Boxen hörbar. Am besten gelingt das über einen Bus, auf dem alle Reverbs zusammenlaufen.

Was aber, wenn Reverbs nicht als Send- sondern als Insert-Effekte genutzt werden? Hier wird es schwieriger. Ein externer MIDI-Controller könnte alle Dry/Wet-Mix-Einstellungen steuern – dann sind aber alle Dry/Wet-Verhältnisse gleich. Reaper kann über die Funktion Parameter Modulation / MIDI Link auch mit Offset und Scale arbeiten. Dann können die Dry/Wet-Verhältnisse individuell ein- aber gemeinsam verstellt werden.

Einige DAWs erlauben Parameter-Links über verschiedenen Spuren hinweg. Ansonsten bleibt hier nur die manuelle Kontrolle. Nutzern von vielen Insert-Reverbs auf verschiedenen Kanälen steht also einiges an Arbeit bevor.

Wie wirkt die allgemeine Frequenzverteilung im Kopfhörer?

Eine HRTF fällt ja flach – deswegen werden sich die Frequenzverteilungen auch ändern. Was gleich bleibt ist, dass jedes Instrument seinen Platz im Mix braucht. Also eine Gitarre und ein Synth, die beide bei 1 kHz viele Anteile haben, werden sich immer noch in die Quere kommen.

Bei einem normalen Stereomix spielt auch die HRTF eine untergeordnete Rolle. Nicht umsonst gibt es das Hördreieck, in dem sich der Sweetspot befindet. Weicht man davon ab, ändert sich auch die Wahrnehmung des Mixes. Das liegt an physikalischen Interferenzen und wie die Informationen der Boxenpositionierung im Gehirn verarbeitet werden. Nur im Sweetspot wird ein Signal, das auf beiden Seiten ausgegeben wird, in der Phantommitte verortet.

Am Schluss steht ein Mix, der dann wieder als Snapshot abgespeichert wird. Nun wird wieder über die Boxen abgehört und beide Snapshots miteinander verglichen. Kritisches Hören ist hier angesagt. Aber vor allem den drei genannten Punkten sollte Beachtung geschenkt werden.

Sind diese Unterschiede einmal verinnerlicht, kann man versuchen, Mischkompromisse einzugehen. Letztendlich sollte das in einen Mix-Snapshot enden, der sich sowohl auf Kopfhörern, als auch auf Monitorboxen gut anhört.

Wie gesagt – das ist nicht an einem Tag zu erreichen. Es empfiehlt sich sogar, am nächsten Tag noch mal das Abmischen mit Kopfhörern von null anzufangen, bis ein neuer Snapshot des Kopfhörer-Mixes steht. Nach einer Weile wird der Prozess von ganz alleine auf einen Kompromiss hinauslaufen. Das kann übrigens auch dem Lautsprecher-Mix guttun. Und einfach schon, um das Skill-Set zu erweitern, ist das Abmischen mit Kopfhörern eine gute Übung.

Plug-ins zum Abmischen mit Kopfhörern

Wir hatten gerade die kleine Testserie von Kopfhörer-Mix-Plug-ins. Die meisten dieser Plug-ins bieten eben auch Funktionen an, um das Abmischen auf Kopfhörern zu erleichtern. Und obwohl ich z. B. Optionen, die das Kanalübersprechen nachbilden, bescheinigen kann, dass sie die Ermüdung verzögern, stehe ich anderen Funktionen kritisch gegenüber.

Dazu gehört erstens die Auswahl eines kopfhörerspezifischen Frequenzprofils, das den Frequenzgang quasi linearisieren soll. Ich finde das wenig sinnvoll, denn ist das Plug-in nicht aktiv, steht man wie der Ochs vorm Berg und kann von vorne anfangen. Besser ist es, den eigenen Kopfhörer in- und auswendig zu kennen.

Weniger kritisch, wohl mehr gleichgültig stehe ich den Simulationen der Abhörposition im Raum gegenüber. Das mag für Immersive-Audio definitiv eine Rolle spielen, aber für das Thema des Workshops „Abmischen mit Kopfhörern in Stereo“ ist es völlig unerheblich.

Positiv wiederum empfinde ich die virtuellen Räume oder auch Kopfhörer als Gegenkontrolle, wie sich ein Mix wohl z. B. in einem Auto anhören würde. Obwohl ich das eher zum Aufdecken von groben Fehlern als zur Feinjustierung eines Mixes nutzen würde.