Workshop: Gesang bearbeiten

21. Januar 2018

Waschen, schneiden, legen: Der perfekte Vocals-Schnitt

Wer kennt es nicht: Die Gesangsaufnahmen sind im Kasten und jetzt geht es ans Auswählen der besten Takes und ans Schneiden und Editieren des aufgenommenen Materials. In der Ära vor dem Harddisk-Recording gab es hier noch deutliche Grenzen der Bearbeitung. Heute ist dank vielfältiger Software fast alles möglich, wenn man denn weiß, wo und wie man am besten ansetzt.

Unser Workshop „Gesang bearbeiten“ soll daher die ersten Schritte der Bearbeitung und einige Tipps aus der Praxis aufzeigen. Dabei sind die hier vorgestellten Ideen und Techniken für Gesang, Rap und Sprache anwendbar.

Sichten des Materials



Die Aufnahmen liefen großartig, aber das Hochgefühl des gestrigen Takes hält nur bis kurz nach dem Laden der Session an. Störgeräusche in den Spuren, die Phrasierungen der verschiedenen Spuren/Stimmen passen nicht zusammen und in der zweiten Stimme war der Sänger meistens um ein paar Cent zu tief. Also wird die Kaffee-Maschine angeworfen und die Verabredung zum Mittagessen erst mal abgesagt, denn hier ist Handarbeit gefragt.

Störgeräusche in den Pausen oder am Ende einer Phrase waren bei Aufnahmen mit Bandmaschinen noch etwas ärgerlicher als heute. Besonders bei ungeübten Zeitgenossen scheint das ein Problem zu sein. Da wird ein „Ah“-Laut an den Refrain angehängt oder man tritt leicht gegen das Mikrofonstativ. Vom Rascheln des Kopfhörerkabels und der Kleidung sowie Atemgeräuschen in den Gesangspausen mal ganz abgesehen. Zu Zeiten der Bandmaschine arbeitete man hier mit programmierten Mutes (der Kanal wurde einfach automatisiert gemutet), Noise-Gates oder man nahm Stille an der akustisch verschmutzten Stelle auf. Bei letzterer Aktivität ist natürlich das Risiko gegeben, die Nutzsignale versehentlich zu löschen. Da gab und gibt es echte Meister im Spurputzen.

Glücklicherweise ist das alles Geschichte und die Bearbeitung ist im Sequencer gar kein Problem mehr. Ich persönlich schneide Vokalspuren immer sehr akribisch und schneide alle Gesangspausen weg und das so knapp und penibel wie möglich. Am Anfang und am Ende eines jeden Schnittes wird leicht geblendet. Diese Fade-Ins und Fade-Outs sind nur wenige Millisekunden lang und verhindern, dass der Schnitt hörbar ist (bspw. durch Knacksen) und das Ende der Aufnahme erscheint dann nicht mehr so abrupt (gerade bei Nebengeräuschen).

Mit dieser Mini-Blende sind Click-Geräusche und Probleme mit Atmo/Störgeräusche gut in den Griff zu bekommen!

Mit dieser Mini-Blende sind Click-Geräusche und Probleme mit Atmo-/Störgeräuschen gut in den Griff zu bekommen

Die Aufnahme in der Rohversion:

So klingt die Aufnahme fertig geschnitten:

Es kann durchaus sinnvoll sein, nicht nur einzelne Phrasen freizustellen, sondern auch einzelne Worte oder Silben. Speziell wenn an der Phrasierung (Timing) noch etwas angepasst werden muss, ist das nötig. Was für die jeweilige Aufnahme und das gewünschte Klangergebnis richtig und passend ist, lässt sich nur durch Experimentieren eindeutig herausfinden.

Dieser Atmer ist viel zu lang und klingt im Mix meist auffallend unpasend.

Dieser Atmer ist viel zu lang und klingt im Mix meist auffallend unpassend

Übrigens: Es klingt meist sehr steril, wenn die Atemgeräusche komplett herausgeschnitten werden. Bei einem Backgrundchor kann es trotzdem sinnvoll sein. Die Lead-Stimme sollte jedoch nicht komplett von Atemgeräuschen befreit werden. Am Anfang einer Phrase kann ein Einatmen dem Hörer signalisieren, dass nun eine neue Strophe, Zeile etc. beginnt. Bei erfahrenen Sängern ist hier weniger Handlungsbedarf, höchstens über Pegel und Klang des Atemgeräusches muss nachgedacht werden – Clip-Gain hilft dabei weiter. Pauschale Tipps oder gar eindeutige Rezepte gibt es leider nicht, da diese Schritte sehr vom Sänger, Stil und Inhalt abhängen.

Sehr oft ändere ich aber den Pegel eines Atemgeräusches. Dann meist recht drastisch so um 10-20 dB. So wird aus einem keuchenden Sänger wieder ein ruhig atmender. Ich kann  mich erinnern, dass ich in einem kompletten satirischen Jahresrückblick (50-minütigen Hörstück) die Atemgeräusche der Sprecherin im Pegel angepasst habe. Das war sehr viel Arbeit, aber das Ergebnis klang gleich viel weniger atemlos bzw. gehetzt. Dieses Vorgehen verhindert auch, dass nach starker Kompression die Atemgeräusche dominieren oder zu stark auffallen. Atemgeräusche, die zu lang sind, könnte man zwar kürzen, ich bin aber nie wirklich zufrieden mit den Ergebnissen gewesen. Es klang in meinen Ohren nie überzeugend, sondern immer etwas künstlich. Am einfachsten ist es, die Atemgeräusche von anderen Passage zu kopieren oder den Anfang und das Ende eines Atemgeräusches mit einem Crossfade zusammenzusetzen.

So könnte ein existierendes Atemgeräusch sinnvoll eingekürzt werden.

So könnte ein existierendes Atemgeräusch sinnvoll eingekürzt werden

So klingt der überzogene Atmer:

So klingen Atmer, die angeschnitten wurden:

Es wird hier gut deutlich, dass Atemgeräusche besser ersetzt als geschnitten werden.

Da ploppt was



Ich habe schon öfter Aufnahmen zu hören bekommen, in denen – trotz Ploppschutz – zu deutliche Explosivlaute zu hören waren. Unter Explosivlauten versteht man die Buchstaben P, B und ähnliche Laute, die einen hohen Luftausstoß beim Sprecher/Sänger erzeugen und dieses typische Ploppen bei der Aufnahme oder auf der PA erzeugen. Nun kann man trefflich über die korrekte Anwendung von Ploppschutz, Windschutz oder alternativen Mikrofonierungstechniken sprechen, die ohne die genannten Hilfsmittel auskommen. Dieser Fehler kommt relativ oft vor, da leichte Ploppgeräusche schnell überhört werden, gerade wenn die Aufnahmesession etwas länger dauert und das Gehör aller Beteiligten schon mit Ermüdungserscheinungen kämpft. Explosivlaute äußern sich als tieffrequente Übersteuerung, wie man auf dem Screenshot bereits gut erkennen kann.

Selbst mit Ploppschutz kann es passieren: Auffällige Ploppgeräusche!

Selbst mit Ploppschutz kann es passieren: auffällige Ploppgeräusche

Um es gleich klar zu sagen: Solche Aufnahmeergebnisse sollten vermieden werden, denn jede Bearbeitung der Aufnahmen ist bestenfalls der zweitbeste Weg und ersetzt niemals eine akkurate Aufnahme. Ist das Kind nun doch im Brunnen, haben wir prinzipiell zwei Möglichkeiten: Bearbeiten des Fehlers oder Ersetzen durch eine andere Aufnahme des gleichen Lautes von einer anderen Stelle des Projektes.

So klingt ein missglückter Ploppfilter-Einsatz:

 

Handelt es sich um eine Passage im Refrain, Prechorus oder dem Kehrvers, haben wir diese Stelle mit hoher Wahrscheinlichkeit von anderen Durchgängen mehrmals als Aufnahme vorliegen. Nun sollte der übersteuerte („geploppte“) Laut ersetzt werden und zwar nur dieser. Das ist ein wenig Gefummel (mit Crossfade und virtueller Schere), lohnt sich aber, da der individuelle Charakter (Performance) dieser konkreten Aufnahme erhalten bleibt und nur der fragliche Signalanteil – das Ploppen – ersetzt wird. Ich habe diesen Ansatz auch schon bei übersteuerten Aufnahmen (also ohne Ploppen, sondern total misslungen) verfolgt und das Ergebnis war tadellos. Es ist also kein Zeichen von Entscheidungsschwäche, die nicht genutzten Aufnahmen und Takes nicht gleich zu löschen, sondern für solche Zwecke in der Hinterhand zu halten. Das ist im Film bzw. in der Film-Postpro schon lange üblich. Sequencer wie ProTools, Cubase, Sequioa und Kollegen bieten dazu diverse Möglichkeiten, dies zu organisieren. Ich persönlich lösche meist die Spuren und Clips/Parts der nicht genutzten Aufnahmen recht fix, lösche aber nicht die Audiodateien, maximal am Ende, wenn das Editing fertig ist.

Das Ploppgeräsch wurde hier manuell mit einer nicht ploppenden Aufnahme getauscht. Mit den Crossfades soll verhindert werden, dass die Übergänge deutlich erkennbar sind.

Das Ploppgeräusch wurde hier manuell mit einer nicht ploppenden Aufnahme getauscht. Mit den Crossfades soll verhindert werden, dass die Übergänge deutlich erkennbar sind

Wird der Laut ausgewechselt, klingt die Aufnahme so:

Ist keine Plopp-freie Aufnahme unter den anderen Durchläufen verfügbar, muss die bestehende bearbeitet werden. Ein Hochpass-Filter ist die einfachste Möglichkeit. Dieses muss vergleichsweise hoch greifen: bei 100-200 Hz mit einer Flankensteilheit von 12 dB pro Oktave (2. Ordnung bzw. 2-Pol), evtl. sogar mehr. Das kommt etwas auf den Sänger an. Alternativ kann mit einem entsprechenden Tool aus einer Restaurations-Suite (DeRumbler, DeHummer etc.) experimentiert werden. Je nach Plug-in sind die Ergebnisse manchmal etwas weniger auffällig. Ich empfehle nur den ploppenden Teil der Aufnahme zu bearbeiten, sonst wird die Gesangsspur dünn, da die tiefen Frequenzen fehlen. Ein dynamischer EQ kann alternativ ebenso eingesetzt werden. Dieser bearbeitet eine eingestellte Frequenz (Hochpass) nur, wenn ein vorher definierter Pegel überschritten wird, ähnlich einem DeEsser.

So könnten die EQ-Einstellungen aussehen. Zu beachten: Es wurde die Funktion Crossfade (unten im Bild) genutzt, um das gefilterte un das ungefilterte Signal einzublenden. Somit ist der Übergang fast unhörbar!

So könnten die EQ-Einstellungen aussehen. Zu beachten: Es wurde die Funktion Crossfade (unten im Bild) genutzt, um das gefilterte und das ungefilterte Signal einzublenden. Somit ist der Übergang fast unhörbar

Mit dem EQ fällt das Ergebnis so aus:


Im Gleichschritt marsch…



Nicht erst seit den 1980ern ist es durchaus üblich, die Gesangsspuren mehrfach (Doppeln) und/oder weitere Stimmen aufzunehmen. Selbst wenn das jedes Mal derselbe Sänger erledigt, variiert das Timing der einzelnen Durchläufe (Phrasierung) praktisch immer, manchmal sogar extrem. Da wird beispielsweise der Vokal am Ende der Phrase in jeder Spur unterschiedlich langgezogen oder das T in jeder der 12 Spuren an einer anderen Stelle artikuliert. Das klingt dann in der Regel recht unkoordiniert.

Tückisch ist oft, dass, wenn man nur jeweils zwei Spuren zusammen abhört, der Gesang recht homogen klingt. So zeigt sich der ganze Handlungsbedarf erst beim Anhören aller Spuren. Manchmal wird empfohlen, dass man alle Spuren zusammen im Edit-Fenster bearbeitet. Für Backing-Vocals kann das funktionieren. Es sollte aber trotzdem jede Spur separat abgehört werden. Besser erscheint mir die Strategie, zunächst eine Spur herauszusuchen, die dem gewünschten Ideal am nächsten kommt und jede der anderen Spuren danach auszurichten. Manchmal reicht es schon, die 30% der Spuren zu editieren, die am extremsten abweichen.

So könnte eine sauber geschnittene Vocalaufnahme aussehen!

So könnte eine sauber geschnittene Vocalaufnahme aussehen

Im Klartext bedeutet das, dass wort- oder silbenweise geschnitten und auf der Timeline verschoben wird. Gerade Laute wie T oder K am Ende einer Phrase sollten in allen Spuren zusammengelegt werden. Die Taktik, diesen Laut nur in einer Spur zu belassen und in allen anderen wegzuschneiden, wird zwar oft vorgeschlagen, klingt aber – in meinen Ohren – nicht stimmig. Gerade bei sehr vielen Gesangsspuren klingt das seltsam. Öfter (sogar bei alten Schlagerproduktionen aus den 1960er und 1970er) habe ich Bearbeitungen gehört, bei denen das T bzw. gleichartige Laute im Backgroundchor komplett weggelassen wurden. Das halte ich aber für keine gute Idee. Ein leider schon in Rente gegangener Kollege vom Radio konnte ewig über solche Fehler in Musikproduktionen monologisieren – zurecht.

Für die Anpassung der Vokale (beispielsweise in Melismen (Vokale, die über mehrere Töne gesungen werden)) gibt es gleich zwei Möglichkeiten, wenn man Melodyne & Co mal außen vor lässt. Zunächst kann man den Vokal freischneiden (Schnitt davor und danach) und diesen mittels Timestretching anpassen. Wenn man gute Timestretching-Algorithmen nutzt, ist das meist kein Problem. Mit den entsprechenden Warp/Elastic-Audio-Funktionen der jeweiligen Sequencer geht das oft sogar ohne Schnitt. Eine weitere Möglichkeit ist es, den Vokal zu kopieren, hintereinander zu setzen und mit einem geschickt gesetzten Crossfade zu verbinden und so zu verlängern. Das passiert garantiert ohne Timestretching-Artefakte, verlangt aber etwas Getüftel. Welche Technik man letztendlich nutzt, hängt vom Material, den persönlichen Präferenzen und dem zur Verfügung stehenden Timestretching-Algorithmus ab. Gerade bei Melismen wird oft nur eine Arbeitsweise mit Timetretching (Warp/Elastic-Audio) zum Ziel führen.

Vor dem Edit:

Nach dem Edit:

(Die Intonation ist bei diesen Aufnahmen eher suboptimal. Das ist für unsern Workshop so gewollt. Die Lösung dazu schauen wir uns in einem anderen Workshop genauer an.)

Diese Editierungen können – speziell, wenn man ein solcher Pedant ist wie ich – schnell in endlos lange Arbeitssessions münden. Um hier etwas Erleichterung zu verschaffen, gibt es Tools wie Vocalign und Revoice Pro. Hierbei wird eine Spur als Master und eine als Slave definiert und das Ergebnis wird aneinander angepasst. Ich nehme dazu die Spur, die am ehesten am meiner Klangvorstellung dran ist und schneide diese sauber. Erst dann wird diese Spur als Master für ein solches Tool genutzt. Wie das genau funktioniert, könnt ihr in meinem Testbericht zur Revoice nachlesen. Trotzdem kann es nötig werden, hier noch mal per Hand nachzuarbeiten. Die Zeitersparnis ist jedoch extrem, das kann ich aus eigener Erfahrung bestätigen. Wenn man diese Werkzeuge mit extremen Einstellungen nutzt, kann die automatisch editierte Spur klanglich sehr zu nah an der Vorlage sein: Weniger ist auch hier oft mehr.

ReVoice Pro von Synchro Arts

ReVoice Pro von Synchro Arts

Ein Wort zum Schluss

Für die Gesangsaufnahmen dieses Workshops durfte ich wieder auf das Live-Gesangsmikrofon Special von Armin Bauer zurückgreifen. Wie man sehr gut hören kann haben die beiden Sänger/innen Akina Ingold und Patrick Heck sogar extra nicht sauber bzw. schief gesungen. Das stellte sich als gar nicht so einfach heraus. Danke an die beiden und vor allem an Armin Bauer, der die Aufnahmen für uns betreute.

Klangbeispiele
Forum
  1. Profilbild
    mhagen1  

    Vielen Dank für den interessanten Workshop – da sind wirklich sehr brauchbare Tipps dabei!
    Auch nach meiner Erfahrung kann gerade die Bearbeitung von Vokalaufnahmen beliebig aufwändig sein. Die Hörgewohnheiten der Zuhörer haben sich offenbar so geändert, dass perfekte Gesangsspuren erwartet werden. Ich finde aber, dass man nicht unbedingt alles machen muss was man mit modernen Verfahren machen kann. Ein bisschen weniger perfekt muss nicht unbedingt immer auch weniger gut sein. Richtige Fehler müssen natürlich korrigiert werden, aber wenn mal die Endkonsonanten nicht exakt übereinanderliegen, finde ich das nicht schlimm. Das gab es sogar bei den Beatles :-)

  2. Profilbild
    0gravity  

    Auch von mir vielen Dank für diesen Workshop.
    Ich hatte ja ein wenig gehofft, dass noch der „Supertrick“ kommt, wie man die ganzen lästigen vorbereitenden Arbeitsschritte drastisch verkürzt Andererseits bestätigt der Bericht auch im wesentlichen meine bisherige Arbeitsweise.
    Revoice werde ich mir mal anschauen.

  3. Profilbild
    Coin  AHU

    Thema Deesser gar nicht angeschnitten ?
    Diesen kann man nämlich automatisiert an problematischen Stellen einsetzen.
    Also nur dort einschalten wo er notwendig ist.

  4. Profilbild
    Ruby  

    Besten Dank. Der Workshop kommt genau richtig. Jetzt kann es nur noch besser werden/klingen.

Kommentar erstellen

Die AMAZONA.de-Kommentarfunktion ist Ihr Forum um sich persönlich zu den Inhalten der Artikel auszutauschen. Sich daraus ergebende Diskussionen sollten höflich und sachlich geführt werden. Haben Sie eigene Erfahrungen mit einem Produkt gemacht, stellen Sie diese bitte über die Funktion Leser-Story erstellen ein. Für persönliche Nachrichten verwenden Sie bitte die Nachrichtenfunktion im Profil.