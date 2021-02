Gesangs-Recording: Ploppen, Phrasierung, Schnitt

Wer kennt es nicht: Die Gesangsaufnahmen sind im Kasten und jetzt geht es ans Auswählen der besten Takes und ans Schneiden und Editieren des aufgenommenen Materials. In der Ära vor dem Harddisk-Recording gab es hier noch deutliche Grenzen der Bearbeitung. Heute ist dank vielfältiger Software fast alles möglich, wenn man denn weiß, wo und wie man am besten ansetzt.

Unser Workshop „Gesang bearbeiten“ soll daher die ersten Schritte der Bearbeitung und einige Tipps aus der Praxis aufzeigen. Dabei sind die hier vorgestellten Ideen und Techniken für Gesang, Rap und Sprache anwendbar.

Sichten des Vocal- und Gesangmaterials

Die Aufnahmen liefen großartig, aber das Hochgefühl des gestrigen Takes hält nur bis kurz nach dem Laden der Session an. Störgeräusche in den Spuren, die Phrasierungen der verschiedenen Spuren/Stimmen passen nicht zusammen und in der zweiten Stimme war der Sänger meistens um ein paar Cent zu tief. Also wird die Kaffee-Maschine angeworfen und die Verabredung zum Mittagessen erst mal abgesagt, denn hier ist Handarbeit gefragt.

Störgeräusche in den Pausen oder am Ende einer Phrase waren bei Aufnahmen mit Bandmaschinen noch etwas ärgerlicher als heute. Besonders bei ungeübten Zeitgenossen scheint das ein Problem zu sein. Da wird ein „Ah“-Laut an den Refrain angehängt oder man tritt leicht gegen das Mikrofonstativ. Vom Rascheln des Kopfhörerkabels und der Kleidung sowie Atemgeräuschen in den Gesangspausen mal ganz abgesehen. Zu Zeiten der Bandmaschine arbeitete man hier mit programmierten Mutes (der Kanal wurde einfach automatisiert gemutet), Noise-Gates oder man nahm Stille an der akustisch verschmutzten Stelle auf. Bei letzterer Aktivität ist natürlich das Risiko gegeben, die Nutzsignale versehentlich zu löschen. Da gab und gibt es echte Meister im Spurputzen.

Glücklicherweise ist das alles Geschichte und die Bearbeitung ist im Sequencer gar kein Problem mehr. Ich persönlich schneide Vokalspuren immer sehr akribisch und schneide alle Gesangspausen weg und das so knapp und penibel wie möglich. Am Anfang und am Ende eines jeden Schnittes wird leicht geblendet. Diese Fade-Ins und Fade-Outs sind nur wenige Millisekunden lang und verhindern, dass der Schnitt hörbar ist (bspw. durch Knacksen) und das Ende der Aufnahme erscheint dann nicht mehr so abrupt (gerade bei Nebengeräuschen).

Hier die ungeschnittene und die geschnittene Version im Vergleich:

Es kann durchaus sinnvoll sein, nicht nur einzelne Phrasen freizustellen, sondern auch einzelne Worte oder Silben. Speziell wenn an der Phrasierung (Timing) noch etwas angepasst werden muss, ist das nötig. Was für die jeweilige Aufnahme und das gewünschte Klangergebnis richtig und passend ist, lässt sich nur durch Experimentieren eindeutig herausfinden.

Übrigens: Es klingt meist sehr steril, wenn die Atemgeräusche komplett herausgeschnitten werden. Bei einem Backgrundchor kann es trotzdem sinnvoll sein. Die Lead-Stimme sollte jedoch nicht komplett von Atemgeräuschen befreit werden. Am Anfang einer Phrase kann ein Einatmen dem Hörer signalisieren, dass nun eine neue Strophe, Zeile etc. beginnt. Bei erfahrenen Sängern ist hier weniger Handlungsbedarf, höchstens über Pegel und Klang des Atemgeräusches muss nachgedacht werden – Clip-Gain hilft dabei weiter. Pauschale Tipps oder gar eindeutige Rezepte gibt es leider nicht, da diese Schritte sehr vom Sänger, Stil und Inhalt abhängen.

Sehr oft ändere ich aber den Pegel eines Atemgeräusches. Dann meist recht drastisch so um 10-20 dB. So wird aus einem keuchenden Sänger wieder ein ruhig atmender. Ich kann mich erinnern, dass ich in einem kompletten satirischen Jahresrückblick (50-minütigen Hörstück) die Atemgeräusche der Sprecherin im Pegel angepasst habe. Das war sehr viel Arbeit, aber das Ergebnis klang gleich viel weniger atemlos bzw. gehetzt. Dieses Vorgehen verhindert auch, dass nach starker Kompression die Atemgeräusche dominieren oder zu stark auffallen. Atemgeräusche, die zu lang sind, könnte man zwar kürzen, ich bin aber nie wirklich zufrieden mit den Ergebnissen gewesen. Es klang in meinen Ohren nie überzeugend, sondern immer etwas künstlich. Am einfachsten ist es, die Atemgeräusche von anderen Passage zu kopieren oder den Anfang und das Ende eines Atemgeräusches mit einem Crossfade zusammenzusetzen.

So klingt der überzogene Atmer:

Und so klingen Atmer, die angeschnitten wurden:

Es wird hier gut deutlich, dass Atemgeräusche besser ersetzt als geschnitten werden.

Da ploppt was

Ich habe schon öfter Aufnahmen zu hören bekommen, in denen – trotz Ploppschutz – zu deutliche Explosivlaute zu hören waren. Unter Explosivlauten versteht man die Buchstaben P, B und ähnliche Laute, die einen hohen Luftausstoß beim Sprecher/Sänger erzeugen und dieses typische Ploppen bei der Aufnahme oder auf der PA erzeugen. Nun kann man trefflich über die korrekte Anwendung von Ploppschutz, Windschutz oder alternativen Mikrofonierungstechniken sprechen, die ohne die genannten Hilfsmittel auskommen. Dieser Fehler kommt relativ oft vor, da leichte Ploppgeräusche schnell überhört werden, gerade wenn die Aufnahmesession etwas länger dauert und das Gehör aller Beteiligten schon mit Ermüdungserscheinungen kämpft. Explosivlaute äußern sich als tieffrequente Übersteuerung, wie man auf dem Screenshot bereits gut erkennen kann.

Um es gleich klar zu sagen: Solche Aufnahmeergebnisse sollten vermieden werden, denn jede Bearbeitung der Aufnahmen ist bestenfalls der zweitbeste Weg und ersetzt niemals eine akkurate Aufnahme. Ist das Kind nun doch im Brunnen, haben wir prinzipiell zwei Möglichkeiten: Bearbeiten des Fehlers oder Ersetzen durch eine andere Aufnahme des gleichen Lautes von einer anderen Stelle des Projektes.

So klingt ein missglückter Ploppfilter-Einsatz:

Handelt es sich um eine Passage im Refrain, Prechorus oder dem Kehrvers, haben wir diese Stelle mit hoher Wahrscheinlichkeit von anderen Durchgängen mehrmals als Aufnahme vorliegen. Nun sollte der übersteuerte („geploppte“) Laut ersetzt werden und zwar nur dieser. Das ist ein wenig Gefummel (mit Crossfade und virtueller Schere), lohnt sich aber, da der individuelle Charakter (Performance) dieser konkreten Aufnahme erhalten bleibt und nur der fragliche Signalanteil – das Ploppen – ersetzt wird. Ich habe diesen Ansatz auch schon bei übersteuerten Aufnahmen (also ohne Ploppen, sondern total misslungen) verfolgt und das Ergebnis war tadellos. Es ist also kein Zeichen von Entscheidungsschwäche, die nicht genutzten Aufnahmen und Takes nicht gleich zu löschen, sondern für solche Zwecke in der Hinterhand zu halten. Das ist im Film bzw. in der Film-Postpro schon lange üblich. Sequencer wie ProTools, Cubase, Sequioa und Kollegen bieten dazu diverse Möglichkeiten, dies zu organisieren. Ich persönlich lösche meist die Spuren und Clips/Parts der nicht genutzten Aufnahmen recht fix, lösche aber nicht die Audiodateien, maximal am Ende, wenn das Editing fertig ist.

Wird der Laut ausgewechselt, klingt die Aufnahme so:

Ist keine Plopp-freie Aufnahme unter den anderen Durchläufen verfügbar, muss die bestehende bearbeitet werden. Ein Hochpass-Filter ist die einfachste Möglichkeit. Dieses muss vergleichsweise hoch greifen: bei 100-200 Hz mit einer Flankensteilheit von 12 dB pro Oktave (2. Ordnung bzw. 2-Pol), evtl. sogar mehr. Das kommt etwas auf den Sänger an. Alternativ kann mit einem entsprechenden Tool aus einer Restaurations-Suite (DeRumbler, DeHummer etc.) experimentiert werden. Je nach Plug-in sind die Ergebnisse manchmal etwas weniger auffällig. Ich empfehle nur den ploppenden Teil der Aufnahme zu bearbeiten, sonst wird die Gesangsspur dünn, da die tiefen Frequenzen fehlen. Ein dynamischer EQ kann alternativ ebenso eingesetzt werden. Dieser bearbeitet eine eingestellte Frequenz (Hochpass) nur, wenn ein vorher definierter Pegel überschritten wird, ähnlich einem DeEsser.

Mit dem EQ fällt das Ergebnis so aus:

Im Gleichschritt marsch…

Nicht erst seit den 1980ern ist es durchaus üblich, die Gesangsspuren mehrfach (Doppeln) und/oder weitere Stimmen aufzunehmen. Selbst wenn das jedes Mal derselbe Sänger erledigt, variiert das Timing der einzelnen Durchläufe (Phrasierung) praktisch immer, manchmal sogar extrem. Da wird beispielsweise der Vokal am Ende der Phrase in jeder Spur unterschiedlich langgezogen oder das T in jeder der 12 Spuren an einer anderen Stelle artikuliert. Das klingt dann in der Regel recht unkoordiniert.

Tückisch ist oft, dass, wenn man nur jeweils zwei Spuren zusammen abhört, der Gesang recht homogen klingt. So zeigt sich der ganze Handlungsbedarf erst beim Anhören aller Spuren. Manchmal wird empfohlen, dass man alle Spuren zusammen im Edit-Fenster bearbeitet. Für Backing-Vocals kann das funktionieren. Es sollte aber trotzdem jede Spur separat abgehört werden. Besser erscheint mir die Strategie, zunächst eine Spur herauszusuchen, die dem gewünschten Ideal am nächsten kommt und jede der anderen Spuren danach auszurichten. Manchmal reicht es schon, die 30% der Spuren zu editieren, die am extremsten abweichen.

Im Klartext bedeutet das, dass wort- oder silbenweise geschnitten und auf der Timeline verschoben wird. Gerade Laute wie T oder K am Ende einer Phrase sollten in allen Spuren zusammengelegt werden. Die Taktik, diesen Laut nur in einer Spur zu belassen und in allen anderen wegzuschneiden, wird zwar oft vorgeschlagen, klingt aber – in meinen Ohren – nicht stimmig. Gerade bei sehr vielen Gesangsspuren klingt das seltsam. Öfter (sogar bei alten Schlagerproduktionen aus den 1960er und 1970er) habe ich Bearbeitungen gehört, bei denen das T bzw. gleichartige Laute im Backgroundchor komplett weggelassen wurden. Das halte ich aber für keine gute Idee. Ein leider schon in Rente gegangener Kollege vom Radio konnte ewig über solche Fehler in Musikproduktionen monologisieren – zurecht.

Für die Anpassung der Vokale (beispielsweise in Melismen (Vokale, die über mehrere Töne gesungen werden)) gibt es gleich zwei Möglichkeiten, wenn man Melodyne & Co mal außen vor lässt. Zunächst kann man den Vokal freischneiden (Schnitt davor und danach) und diesen mittels Timestretching anpassen. Wenn man gute Timestretching-Algorithmen nutzt, ist das meist kein Problem. Mit den entsprechenden Warp/Elastic-Audio-Funktionen der jeweiligen Sequencer geht das oft sogar ohne Schnitt. Eine weitere Möglichkeit ist es, den Vokal zu kopieren, hintereinander zu setzen und mit einem geschickt gesetzten Crossfade zu verbinden und so zu verlängern. Das passiert garantiert ohne Timestretching-Artefakte, verlangt aber etwas Getüftel. Welche Technik man letztendlich nutzt, hängt vom Material, den persönlichen Präferenzen und dem zur Verfügung stehenden Timestretching-Algorithmus ab. Gerade bei Melismen wird oft nur eine Arbeitsweise mit Timetretching (Warp/Elastic-Audio) zum Ziel führen.

Vor und nach dem Edit:

(Die Intonation ist bei diesen Aufnahmen eher suboptimal. Das ist für unsern Workshop so gewollt. Die Lösung dazu schauen wir uns in einem anderen Workshop genauer an.)

Diese Editierungen können – speziell, wenn man ein solcher Pedant ist wie ich – schnell in endlos lange Arbeitssessions münden. Um hier etwas Erleichterung zu verschaffen, gibt es Tools wie Vocalign und Revoice Pro. Hierbei wird eine Spur als Master und eine als Slave definiert und das Ergebnis wird aneinander angepasst. Ich nehme dazu die Spur, die am ehesten am meiner Klangvorstellung dran ist und schneide diese sauber. Erst dann wird diese Spur als Master für ein solches Tool genutzt. Wie das genau funktioniert, könnt ihr in meinem Testbericht zur Revoice nachlesen. Trotzdem kann es nötig werden, hier noch mal per Hand nachzuarbeiten. Die Zeitersparnis ist jedoch extrem, das kann ich aus eigener Erfahrung bestätigen. Wenn man diese Werkzeuge mit extremen Einstellungen nutzt, kann die automatisch editierte Spur klanglich sehr zu nah an der Vorlage sein: Weniger ist auch hier oft mehr.

Live Gesang aufnehmen

Für die Gesangsaufnahmen dieses Workshops durfte ich wieder auf das Live-Gesangsmikrofon Special von Armin Bauer zurückgreifen. Wie man sehr gut hören kann haben die beiden Sänger/innen Akina Ingold und Patrick Heck sogar extra nicht sauber bzw. schief gesungen. Das stellte sich als gar nicht so einfach heraus. Danke an die beiden und vor allem an Armin Bauer, der die Aufnahmen für uns betreute.