Wie Musik und Sprache gut klingen

Die letzten Monate haben es eindrucksvoll gezeigt: Streaming-Konzerte, YouTube-Darbietungen und Videokonferenzen nehmen zu, ebenso Shows im neuen Audionetzwerk Clubhouse, das inzwischen auch für Android zur Verfügung steht. Für diese Situationen hält der Markt spannende Produkte bereit und Konferenzplattformen installieren Techniken zur Geräusch- und Echokompensation. Das reicht für ein gewöhnliches Meeting zwar aus, nicht aber für den guten Ton der eigenen Performance. Dabei muss es nicht unbedingt die beste Audio-Hardware sein, denn es lässt sich mit kleinen Stellschrauben selbst mit vorhandenen Mitteln einiges tun.

Diese Tipps gelten sicher nicht nur für Einsteiger und übrigens wenn auch eingeschränkt für Videoproduzenten, denn ein YouTube-Video mit größerem Abstand zur Kamera in akustisch nicht optimaler Umgebung ist natürlich ebenso schwer zu verstehen. Dabei erhebt dieser Workshop übrigens keinen Anspruch auf Vollständigkeit, denn Voraussetzungen und Budget sind bei jedem ebenso verschieden, wie die zur Verfügung stehenden Mittel. Hinterlasst deshalb gerne in den Kommentaren eure eigenen Erfahrungen und Tipps.

Im Folgenden befassen wir uns mit dem Raum, dem richtigen Mikrofon, der Performance und der Vorverarbeitung. Nicht eingehen wollen wir dabei auf Tonschnitt, Verluste, Latenzen und andere Faktoren, die bei der Aufnahme, Kompression und Übertragung im Internet entstehen. Aufgrund der Vielzahl an Apps, sozialen Netzwerken, Diensten und Codecs würde es sonst den Rahmen sprengen, außerdem ist nicht zuletzt die eigene Internetanbindung für die Übertragungsqualität verantwortlich. Zusammenfassend erreicht man beim Streaming die besten Ergebnisse, wenn man alle Filter und Optimierungsfunktionen der Konferenzsoftware deaktiviert und die höchstmögliche Tonqualität beispielsweise in der Zoom-App oder im Clubhouse auswählt. Zoom Meetings hält beispielsweise eine spezielle Option für professionelle Hardware vor. So hat man eine gute Basis, dass sich die folgenden Tipps auch bezahlt machen. Für alle anderen Aufnahmen sind sie natürlich genauso wichtig und sogar noch wichtiger, denn Unzulänglichkeiten bei der Aufnahme werden bei geringerer Kompression umso deutlicher.

Der Raum

Während Aufnahmeräume im Studio akustisch optimiert sind, damit die Schallquelle authentisch eingefangen werden kann, lassen sich Räume zuhause oder anderswo für ein Interview nicht immer auf die Schnelle umgestalten. Dabei gilt, dass viele Textilien durchaus eine dämmende Wirkung haben, das Schlafzimmer ist per se besser geeignet als das Badezimmer. Zu viel des Guten kann allerdings auch die Natürlichkeit nehmen, was insbesondere für schalltote Räume gilt. Kleine Räume mit glatten Begrenzungsflächen neigen außerdem zu Resonanzfrequenzen, die sich oft im Bereich der Sprache bewegen und zum Dröhnen führen können, Gleiches gilt, wenn man in einer Raumecke aufzeichnet. Bei Gesang kann der Raum allerdings auch als gestaltendes Stilelement eingesetzt werden, so soll Elvis seine Performances zuweilen im Treppenhaus aufgezeichnet haben.

Grundsätzlich entscheiden am Ende der persönliche Geschmack und das gewünschte Ergebnis, dennoch sollte man sich bei der Raumauswahl einige Gedanken machen. Aufgezeichnete Raumreflexionen lassen sich nämlich hinterher nicht oder kaum verändern, während sich eine trockene Sprachaufnahme mit Plug-ins nach Belieben um einen Raum ergänzen lässt.

Werden bei der Aufnahme zu viele Rauminformationen mit eingefangen, würden sich die Effekte überlagern und es klingt am Ende unnatürlich, vor allem bei Verortung im Stereobild. In einem eher kahlen Raum hilft es, für akustische Ruhe zu sorgen. Im Idealfall erreicht man dies mit Schallabsorbern, die man an Decke und Wänden installiert, was bei größeren Räumen auch schnell ins Geld gehen kann.

Die Kernfrage neben der Raumgröße ist also, wo findet das Schallereignis statt. Wenn man nur sich selbst aufzeichnet, muss man keinen Raum für ein Blasorchester optimieren. Als Hausmittel gelten Eierpappen an den Wänden, die allerdings nur hochfrequenten Schall absorbieren und daher ungeeignet sind. Besser wären beispielsweise Teppiche, dicke Vorhänge oder ähnliches. Reine Sprache lässt sich auch gut im Kleiderschrank aufzeichnen, ein alter Podcasting-Trick. Auch nicht schlecht könnte der Innenraum eines Wagens in ruhiger Lage sein, hier würden Umweltgeräusche allerdings nicht gedämmt. Im folgenden Beispiel habe ich Sprache mit dem Olympus LS-P4 Audiorecorder in verschiedenen Räumen aufgezeichnet.

Kostspieliger und in Teilen besser sind spezielle Gesangs- und Sprecherkabinen, wie die hier gezeigte ISOVOX Vocal Booth V2. Allerdings auch nicht ganz kompromisslos, weil je nach Mikrofon auch der Sound eines Karton entstehen kann. Es hängt also davon ab, womit man aufzeichnet und was man erwartet.

Alternativ gibt es Akustikschirme, Micscreens und Reflexionsfilter. Von Aston Microphones beispielsweise den Halo für Mikrofonstative, der an eine offene Telefonzelle vergangener Tage erinnert. Bei diesem Konzept wird das Schallereignis beruhigt, so dass weniger Raumreflexionen auftreten und diese wiederum zugleich vom Mikrofon ferngehalten werden.

Will man einen Teil des Raums abtrennen, gibt es mobile Akustikstellwände und weitere Tools, die sicherlich eine gute Wirkung erzielen können. Neben der Raumakustik ist es aber genauso wichtig, dass die Umgebung auch außerhalb des Gebäudes nicht stört. Ein laufender Rasenmäher lässt sich im Nachgang ebenso schwer entfernen, wie die LKWs auf der stark befahrenen Landstraße. Hier hilft nur eine fest installierte In-Raum-Konstruktion, der Aufnahmeraum sollte daher zur beruhigten Seite des Hauses zeigen. Natürlich lassen sich Tipps zur Umweltberuhigung schwer geben, weshalb wir uns lieber auf den Raum selbst konzentrieren wollen.

Üblicherweise wird der Raum durch Instrumente und lauten Gesang stärker angeregt, als durch leise Sprache. Das liegt an den Reflexionen des Schallereignisses an den Begrenzungsflächen, die wir möglichst vermeiden wollen. Darunter versteht man Wände, Decken und Gegenstände, die den Schall reflektieren oder schlucken.

Schall breitet sich eher kugelförmig aus und die ersten Raumreflexionen werden als RT60 bezeichnet. Weiche Flächen schlucken den Schall und absorbieren ihn, harte Flächen reflektieren und geben einen Teil der Energie zurück in den Raum und diffuse Reflexionen setzen sich fort, bis die Energie versiegt. Dies nehmen wir als Raumhall oder Echo wahr und geschieht abhängig von der Lautstärke, Raumgröße und Beschaffenheit der Begrenzungsflächen. In großen Kirchen hallt es bekanntermaßen lange nach, beispielsweise beträgt die Nachhallzeit im Kölner Dom bei 230 m³ etwa 13 Sekunden. In einem akustisch optimierten Konzertsaal entstehen kaum Reflexionen und mehr noch, selbst leise Töne sind fast an jeder Stelle im Saal zu hören.

Kann man den Raum selbst nicht optimieren, lohnt es sich zu experimentieren. Gute Erfahrungen habe ich mit dem Rücken zur Wand gemacht. In den Raum gesprochen mit einem rückseitig gut gedämpften Mikrofon oder Reflexionsfilter erzielt man schon gute Ergebnisse. Wie auch die eigene Stimme nimmt man die Raumreflexionen beim Monitoring anders wahr, als wenn man später die Aufnahme abhört. Gibt es keine Möglichkeit zur Raumeinmessung, hilft auch das einfache in die Hände klatschen, um die Art der Reflexionen besser einzugrenzen. Eine Testaufnahme und anschließendes Abhören an verschiedenen Positionen im Raum ist daher ratsam und spiegelt die tatsächliche Aufnahmesituation wieder, das gilt natürlich genauso für Musikdarbietungen mit einem Instrument. Führt man ein Interview, wird man es kaum ein zweites Mal führen können, weshalb eine gute Auswahl des Gesprächsorts wichtig ist.

Mikrofone und Mikrofonierung für Sprach- und Gesangsaufnahmen

Neben der Raumakustik ist der Schallwandler die wichtigste Größe, das perfekte Mikrofon gibt es jedoch nicht. Dabei spielen der Einsatzzweck und Grundklang von Stimmen und Instrumenten eine wesentliche Rolle. Nicht grundlos liegen in professionellen Tonstudios unzählige Mikrofone bereit, denn sie klingen einerseits verschieden, andererseits haben viele Sänger ihr Lieblingsmodell. Daher eignet sich nicht jedes gleichermaßen zur Abnahme von Stimmen, Gesang und Instrumenten, gleichwohl kann sich ein Sprechermikrofon durchaus für die Instrumentenabnahme eignen, siehe das Shure SM7B.

Technisch betrachtet sind typische Gesangsmikrofone dynamisch, so genannte Tauchspulen und werden vom Ende hin besprochen. Sie sind dadurch äußerst robust und können auch nicht übersteuern. Manche Sprechermikrofone sind ähnlich aufgebaut und benötigen keine Phantomspeisung, das Shure SM7B nutzt beispielsweise die Kapsel des SM57. Das freut die Akkus mobiler Fieldrecorder und sie vertragen hohe Schallpegel.

Ihr Frequenzgang ist häufig auf Sprache und Gesang abgestimmt. Die enge Richtcharakteristik, oft Superniere, sorgt in Verbindung mit der unempfindlichen Kapsel dafür, dass Rauminformationen und andere Störeinflüsse weniger eingefangen werden. Allerdings liefern sie auch eine im Vergleich zu Kondensatoren geringere Ausgangsspannung, weshalb man die Vorverstärker in Audiointerfaces und Mischpulten weiter aufdrehen muss. Hieraus ergeben sich zwei Effekte, zum einen wird bei voll aufgedrehtem Gain das Signal häufig verzerrt und es klingt dadurch anders als bei geringerem Pegel, zum anderen nimmt das Eigenrauschen zu und könnte reine Sprachaufnahmen stören. Gesang und Instrumente sind per se lauter, weshalb Gain und Eigenrauschen dann eine untergeordnete Rolle spielen. Von der Handhabung sind Sprechermikrofone unkomplizierter und oft intern gegen Vibrationen entkoppelt

Ist der Mikrofonverstärker im Mischpult zu schwach, eignen sich externe FET-Amps, die den Pegel anheben und das Signal auf diese Weise entzerren. Sie benötigen allerdings Phantomspeisung und verstärken das Signal, in Teilen aber auch das Eigenrauschen. Ob und welches Mikrofon und Lösung besser geeignet ist, hängt auch vom gewünschten Ziel ab. Einige Gesangsmikrofone für Einsteiger haben wir euch im folgenden Artikel zusammengestellt und miteinander verglichen:

Im folgenden Klangbeispiel vergleiche ich das Shure SM7B mit dem RODE NT1000 am Tascam Model 12.

Häufig wird für Sprachaufnahmen das Großmembran-Kondensatormikrofon RODE NT1-A empfohlen. Die Vorteile sind ein tendenziell voller Grundsound und geringes Eigenrauschen, dafür ist es auch recht empfindlich gegenüber tiefen Frequenzen. Im Klangbeispiel wird deutlich, dass gerichtete Kapseln von Sprechermikrofonen Vorteile bringen können, auch bezogen auf die seitliche Dämpfung.

Ein Kompromiss ist beispielsweise das RODE Broadcaster, es nutzt die HF2-Kapsel des NT1000, aber mit Richtwirkung. Vergleichen wir doch mal das Broadcaster mit dem NT1 (ohne A) am RODE RODECaster Pro mit den vorbelegten Presets. Bitte beachten Sie, dass der Klangcharakter entsprechend angepasst ist und nicht dem Grundsound des Mikrofons entspricht. Auch lässt sich der Unterschied bei der rückseitigen Dämpfung aufgrund der Nähe zur Wand nicht gut wahrnehmen.

Darüber hinaus gibt es Kleinmembran-Kondensatormikrofone, die tendenziell linearer als die großen Vertreter sind und sich gut für die Instrumentenabnahme eignen. Bändchen- und Röhrenmikrofone sind eine Besonderheit und eignen sich für Sprachaufnahmen mit warmem Klangcharakter. Ein Röhrenklassiker ist das Neumann U67, welches auch als günstiger Nachbau zu haben ist.

Welches USB-Mikrofon eignet sich für Sprach- und Gesangsaufnahmen?

Während man zwischen Mikrofonen und verschiedenen Vorverstärkern bzw. Audiointerface frei kombinieren kann, ist bei USB-Mikrofonen nicht immer klar, welcher Kapseltyp verbaut ist. Das gilt auch für günstige Großmembran-Kondensatormikrofone.

Hier entscheidet der Kapseldurchmesser: Großmembraner haben eine Membranfläche von rund 2,54 cm, also mindestens 1 Zoll. In der Praxis spielt der Kapseltyp für USB-Mikrofone eine untergeordnete Rolle, denn sie bilden ein festes Gespann aus Audiointerface und Mikrofon in Einem. Außer bei der Nachbearbeitung ist somit der gesamte Audiostrang festgelegt. Wie bei Audiorecordern werden auch hier unterschiedliche Abtastraten und Bittiefen beworben, diese Angaben kann man aufgrund der eher einfachen Technik getrost vernachlässigen.

Das Elgato WAVE:3 ist ein spannender Vertreter, denn es liefert einen guten Grundsound und ist technisch so ausgestattet, dass es sich nicht übersteuern lässt.

Auch interessant ist das neue Shure MV5C, dieses bringt integrierte Features mit, so dass die Sprache direkt aufgezeichnet und weitergegeben werden kann.

Ein Kompromiss bietet Shure mit dem MV7, das technisch kein SM7B ist. Es lässt sich wahlweise per USB- oder XLR-Anschluss verbinden. Wer unterschiedliche Einsatzszenarien benötigt und es beispielsweise zuhause am Audiointerface und unterwegs per USB nutzen will, findet hier eine praktische Lösung. Es eignet sich sowohl für Sprache, als auch für Gesangsaufnahmen.

Ein universelles Mikrofon, das auch für räumliche Atmo-Aufnahmen genutzt werden kann, ist das AKG C44 Lyra mit vier Kapseln. Dieses bietet auch einen Interview-Modus, so dass man sich gegenüber sitzend mit einem Mikrofon aufzeichnen kann.

Wer eine elektrische Gitarre oder anderes Instrument spielt, kann sich stattdessen für ein Mikrofon mit wählbaren Charakteristika entscheiden. Mackie bietet mit dem EM-Chromium ein Mikrofon mit integriertem Audiointerface an, so dass man beispielsweise eine E-Gitarre direkt anschließen könnte. Wer akustische Instrumente spielt, sollte eher zu einem raumtauglichen oder gar zwei Mikrofonen greifen.

Als letzter Tipp darf das RODE NT-USB Mini als günstiger Einstieg nicht fehlen, welches einen guten Gesamtklang liefert, allerdings ohne interne Bearbeitungsfunktionen auskommen muss.

Camcorder- und Kamera-Mikrofone für Vlogger, YouTube-Videos und Social Media

Wer sich selbst filmt und einen günstigen Camcorder einsetzt, wird sich vermutlich über fehlende Mikrofoneingänge ärgern. Die internen sind oft für räumliche Aufnahmen konzipiert, ähnlich wie typische Audiorecorder sind sie ungünstig bei schlechter Raumakustik. Während man sich allerdings nah vor einen Audiorecorder setzen kann, gelingt dies bei einer Kamera aus verständlichen Gründen nicht.

Bei vorhandenen Eingängen sind Richtrohrmikrofone für die entfernte Aufnahme von Sprechern zu empfehlen. Sie haben eine enge Charakteristik und bündeln den Schall wie ein Hörrohr, damit werden Störungen aus dem Raum vom Mikrofon ferngehalten, quasi ein akustisches Teleobjektiv.

Auch geeignet sind Lavaliermikrofone, die man am Körper trägt und sich auch mit Funkstrecken kombinieren lassen. Recht unempfindliche Kugelkapseln nehmen den Schall aus der unmittelbaren Nähe auf und der Sprechabstand bleibt auch bei hektischen Bewegungen in der Regel gleich. Das RODE SmartLav+ kann direkt am Smartphone betrieben werden, als RODE Lavalier Go gibt es auch eine Version mit dreipoligem Stecker zum Anschluss an Audiorekorder und Kameras.

Die richtige Einsprache

Während der Sprechabstand bei Lavalier- und Headset-Mikrofonen konstruktionsbedingt definiert ist, muss man gegebenenfalls bei anderen Mikros etwas üben, bis man den richtigen Sound gefunden hat. Bei zu weitem Abstand klingt die Stimme wie im obigen Beispiel dünner, beim nahen Besprechen erreicht die Kapsel mehr Energie und die Stimme klingt voller, aber nicht immer besser. Bewegen sich Sprecher aktiv vor dem Mikrofon auch seitlich, können Lautstärkeschwankungen auftreten, so dass ein grundsätzlich gleicher Abstand eingehalten werden sollte. Geht man weiter weg, wird man die Eingangslautstärke erhöhen und feststellen, dass zugleich mehr Rauminformationen eingefangen werden.

Ein sehr unkompliziertes Mikrofon ist das dynamische ElectroVoice RE20, das so konstruiert ist, dass die Stimme selbst bei verschiedener Einsprache recht ähnlich klingt. Hörer von RPR1 werden es kennen, denn es wird abgesehen vom Nachrichtenstudio für die Alltagsmoderation verwendet.

Mit geringem Abstand erhöht sich auch die Gefahr von Wind- und Poppgeräuschen. Dabei dringen Plosivlaute direkt zur Kapsel vor und werden selbst von integrierten Popfilter nicht immer effektiv abgehalten. Externe Windschirme liegen nicht direkt am Mikrofonkorb an und sorgen dafür, dass sich der Windstoß schon vorher verteilt. Außerdem zwingen sie den Sänger oder Sprecher zu einem Mindestabstand zum Einsprechkorb. Für aufsteckbare Windschütze gilt, die aus Fell verfärben weniger und leiten Windstöße besser um, sind allerdings auch teurer in der Anschaffung. Für Innenräume reichen jene aus Schaumstoff vollkommen aus. Wie im obigen Beispiel zu hören ist, muss ein integrierter Windschutz nicht immer genügen, siehe RODE Broadcaster.

Für Interviews eignen sich Mikrofone mit Achter-Charakteristik, die man von Vorne und Hinten gleichermaßen besprechen kann. Der Vorteil dabei ist, dass seitliche Raumreflexionen durch die Phasenlage ausgelöscht werden, man spart sich außerdem zwei Mikrofone. Nachteilig ist, dass der Abstand je nach Sitzposition nicht immer passt.

Während Sprache zumeist leiser ist, singt und rappt man für Gewöhnlich lauter. Der Abstand zum Mikrofon sollte daher nicht zu gering sein, um Plosivlaute und Nahbesprechungseffekte zu vermeiden. Generell sind Atem- und Schmatzgeräusche bei geringerem Abstand problematischer, ein Glas Wasser ohne Kohlensäure in der Nähe kann dabei hilfreich sein. Auch Rapper und Sänger sollten sich vor dem Mikrofon nicht zu viel bewegen und einen möglichst gleichmäßigen Abstand einhalten, außerdem sollte man die Performance besser stehend präsentieren.

iPhone und iPad – Risiken und Nebenwirkungen

Während für GarageBand und alle anderen Musikanwendungen die Nutzung eines Audiointerfaces unproblematisch ist, gibt es hingegen bei iDevices mit Lightning-Anschluss eine Einschränkung. Die Interfaces müssen Made-for-iPhone-zertifiziert sein und die 3,3 Volt bei 40 mAh Nutzlast einhalten, ansonsten funktionieren sie nicht oder nur mit externer Stromzufuhr. Außerdem unterscheidet Apple zwischen dem Regular und Telephony Audio Mode, letzterer wird beispielsweise für Zoom, FaceTime, Clubhouse und Co. genutzt. In diesem Modus schaltet das iPhone auf interne Lautsprecher und Mikrofon um, sofern eine App diesen aktiviert. In Clubhouse passiert dies beispielsweise, wenn man von der Audience auf die Stage geholt wird. Als Lösung lässt sich bei modernen Geräten ohne Klinkenanschluss der Lightning- auf Klinke-Adapter nutzen, dann kann man beispielsweise ein Pult mit TRRS-Klinkenbuchse einsetzen. Das ist zur Echovermeidung wichtig, hier bieten sich der TC Helicon GO XLR, der RODE RODECaster Pro, die Podtrak- oder LiveTrak-Serie von Zoom oder die Model-Serie von Tascam an.

Mit Geräten wie dem iPad Air und Pro mit USB Type-C-Anschluss fällt diese Einschränkung weg, hier lassen sich gewöhnliche USB-Audiointerfaces und -Mikrofone mit ganz wenigen Einschränkungen betreiben, dies gilt ebenso für Android-Devices mit Type-C-Buchse. Das Elgato WAVE:1 und WAVE:3, RODECaster Pro und die LiveTrak-Serie funktionieren hier auch bei der Sprachkommunikation, passender Adapter bzw. Kabel vorausgesetzt. Wer sich auf Sprache fokussiert, findet im Sortiment von Jabra und Plantronics unterschiedliche Headsets, die je nach Budget und Anspruch auch eine Lösung sein können.

Effekte und Nachbearbeitung für Gesangs- und Sprachaufnahmen

Sicher würde es den Rahmen sprengen, an dieser Stelle ausführlich auf komplexe Software einzugehen und deren Besonderheiten. Daher beschränken wir uns auf grundsätzliche Effekte, die bei der Sprachaufzeichnung auf verschiedene Weise eingesetzt werden können. Das Shure MV5 und der RODE RODECaster Pro bieten bereits von Haus aus passende Effekte an, die in Teilen auch sehr weitreichend einstellbar sind. Andere Pulte, wie das Zoom LiveTrak L-8, beschränken sich auf einen Equalizer. Ob sinnvoll oder nicht, hängt vom Sprech- oder Gesangsstil, dem Equipment und der Raumakustik ab. Werden Effekte direkt mit aufgezeichnet, weil sie beispielsweise im Channelstrip des Mikrofonkanals oder im Mikrofon selbst eingebaut sind, lassen sich diese Aufzeichnungen nicht nachbearbeiten. Wenn möglich ist es daher ratsam, die Effekteinstellungen in der DAW erst bei der Nachbearbeitung anzuwenden. Kostenlose Software wie Audacity reichen für viele Zwecke aus, für den Mac ist Amadeus Pro eine spannende Alternative. Hier ein kurzes Beispiel, wie sich Effekte auf den Sound auswirken.

Der RODE RODECaster Pro ist ein schönes Paradebeispiel dafür, dass man sich die Nachbearbeitung bei optimaler Einstellung durchaus sparen kann. Kurz um, was mit aufgezeichnet wird, ist so, wie es ist. Was nachbearbeitet wird, lässt sich im Nachgang natürlich auch verändern. Betrachten wir zum Schluss nun stichpunktartig die wichtigsten Effekte, die für die Sprachaufzeichnung sinnvoll sind: