Warum eine Talkbox kein Vocoder ist

Vorwort der Redaktion

Im Zuge unserer Serie über Klangsynthesen haben wir uns nun auch entschlossen, einen genauen Blick auf die sogenannte Talkbox zu werfen, da diese gerne mit einem Vocoder verwechselt wird. Und obwohl beide Stimmen in „Roboter-ähnliche“ Laute verwandeln können, liegt ihnen ein vollkommen unterschiedliches Funktionsprinzip zu Grunde.

Bevor wir nun loslegen, hier noch die restlichen Ausgaben unserer Serie zu Klangsynthesen:

Die Geschichte der Talkbox

Die ersten Vorläufer der Talkbox stammen bereits aus den 1930er Jahren. Der US-Amerikaner Alvin McBurney (*1. Juli 1908 in Oakland, bekannter unter seinem Künstlernamen Alvino Rey) war sowohl ein guter Steel-Gitarrist als auch ein versierter Elektronik-Bastler, der sich schon in seiner Jugend mit dem Bau von Tonabnehmern und Verstärkern beschäftigte. 1927 baute er die erste elektrische Gitarre, 1935 entwickelte er den ersten elektrischen Tonabnehmer für Gibson. 1939 hatte er eine Art Puppe in Gitarrenform namens „Stringy, the Talking Guitar“ mit auf der Bühne, die elektrisch verzerrt zur Performance auf seiner Steelguitar sang, während er anscheinend Stringys Stimme durch sein Spiel steuerte.

Allerdings schummelte Rey dabei ein wenig: Während der Aufführung stand nämlich seine Frau Luise King (die früher zur Gesangstruppe „Kings Sisters“ gehörte) mit einem Carbon-Halsmikrofon, das an einem Plastikschlauch befestigt war, der wiederum zu Reys Verstärker führte. Nicht also die Steel-Gitarre von Alvino, sondern die Stimme seiner Frau Luise erzeugte den Sound und ließ Stringy singen; das Prinzip ähnelte aber schon ein wenig der heutigen Talkbox, so dass man hier schon von einem Vorläufer derselben sprechen kann. Hier ein Video, das Rey mit seinem Orchester und Stringy im Jahr 1944 zeigt.

Alvino Rey – Talking Guitra „Stringy“

Ebenfalls im Jahr 1939 entwickelte Gilbert Wright den Sonovox, die ebenfalls Mundraum und Kehle nutzte, um Töne zu manipulieren. Statt eines Kehlkopfmikrofons kam hier ein kleiner Wandler zum Einsatz, der am Hals des Interpreten befestigt wurde. Vermarktet wurde es damals von der Firma Wright-Sonovox; besonders beliebt war die Sonovox Talkbox bei Radiosendern, die damit Jingles und Station-IDs produzierten, aber auch die Filmindustrie fand Gefallen am Stimmverfremder. So wurde der Sonovox zum Beispiel im Boris-Karloff Film „You’ll find out“ eingesetzt, in der Filmmusik im Paramountfilm „The Ghost Breakers“ oder als Stimme des Zuges Casey im Zeichentrickfilm „Dumbo“. Hier ein Ausschnitt aus dem Film „You’ll find out“ (1940) mit Kay Kyser.

Sonovox – Kay Kyser – 1940 im Film „You’ll Find Out“

Die erste Talkbox für den Massenmarkt war 1969 „The Bag“ von Kustom Electronics, entwickelt von Doug Forbes. Der Name „The Bag“ kam von der Tasche, die mit zum Lieferumfang gehörte und mit der das Gerät über die Schulter gehängt wurde. The Bag verwendete einen 30 Watt Treiber plus Plastikschlauch, der in den Mund gesteckt wurde – das klassische Talkbox-Prinzip also. Seinen ersten großen Auftritt hatte der „Kustom Bag“ 1972 in der David Frost Show, als Stevie Wonder dort mit der Talkbox ein Medley aus Carpenters und Jackson-5 Songs präsentierte. Später nutzten auch u. a. Pink Floyd und Jeff Beck den Kustom Bag.

Stevie Wonder 1972 in der David Frost Show

Die erste bühnentaugliche „High-Power“-Talkbox – die dann auch endlich der Namensgeber für den Gattungsbegriff „Talkbox“ wurde – war 1973 die Box von Bob Heil, der mit seinem Unternehmen „Heil Sound“ Tontechnik speziell für Rockkonzerte fertigte und dabei – neben der Talkbox – auch ein modular aufgebautes Mischpult und ein Quadrophonie-Mischpult entwickelte, die heute in der Rock and Roll Hall of Fame zu bewundern sind. Seine Talkbox mit dem (bei uns in Deutschland etwas merkwürdig klingenden) Namen „Heil Talkbox“ besaß/besitzt – anders als die moderne Dunlop MXR-M 222 – keinen eigenen Verstärker und wird daher zwischen Amp und Box geschaltet, so dass die eine Menge Schalldruck durch den Schlauch jagt (Es gibt durchaus auch Stimmen, die behaupten, dass diese Bauform gar nicht gut für die Zähne wäre – da würden die Nerven absterben.)

Die Heil Talkbox wurde speziell für eine Tournee des Gitarristen Joe Walsh (James Gang, Barnstorm, Eagles) erfunden. Später wurde sie auch u. a. sehr ausgiebig von Peter Frampton genutzt, der sich das Teil 1974 von seiner Freundin zu Weihnachten schenken ließ – und sich nach eigener Aussage anschließend erst einmal für zwei Wochen in den Übungsraum einschloss, um die Talkbox einigermaßen beherrschen zu können. Was – wie ich dann selber feststellen musste – tatsächlich nicht verkehrt ist. Aber dazu gleich mehr. Hier ein Konzertausschnitt von 1975 mit Peter Frampton, der (ab 5:45) die Heil Talkbox für ein längeres Solo nutzt. 1988 verkaufte Heil die Fertigung und die Rechte an Dunlop Manufacturing, die die Box – wie unsere MXR M222 hier auch – bis vor Kurzem noch produziert und vertrieben hat.

Peter Frampton, der „Gott der Talkbox“, 1975 in Burt Sugarmans Midnight Special. Ab 5’50 kommt die Talkbox zum Einsatz.

Aktuelle Talkboxen

Das aktuelle Angebot an Talkboxen ist überschaubar; das ist halt ein Nischenprodukt, an dem anscheinend nur weniger Hersteller Interesse haben. Die Dunlop Heil Talkbox HT-1 (215 Euro) ist ein simpler Bodentreter ohne weitere Einstellmöglichkeiten, der (dank passiver Arbeitsweise) kein Netzteil erfordert; sie ist zwar noch im Handel, wird aber mittlerweile nicht mehr produziert. Die MXR M 222 Talkbox (186 Euro), die ich hier teste, besitzt dagegen Regler für Volume, Gain und Tone und ist seit 2013 auf dem Markt. 2018 brachte Harley Benton – eine Eigenmarkte vom Musikhaus Thomann – mit der Harley Benton Talkbox eine preiswerte Version (119 Euro) mit schmucken Holzseitenteilen, ebenfalls mit Reglern für Volume, Gain und Tone, und ebenso mit einem integrierten Verstärker (8 W). Und schließlich ist da noch die (etwas ältere) Rocktron Banshee 2 Talkbox (209 US Dollar), die es aber anscheinend nur noch vereinzelt neu im Versand gibt – da ist eBay die bessere Adresse, wo sie schon für unter 100 Dollar angeboten wird. Und auch die Danelectro DTB-1 Free Speech Talkbox habe ich nur noch auf dem Gebrauchtmarkt entdeckt.

Eine schlauchlose Alternative stellt der TC-Helicon Talkbox Synth (99 Euro) dar, ebenfalls ein Bodentreter, aber kleiner als die übrigen Vertreter und im klassischen Effekt-Look. Hier wird der klassische Talkbox-Klang elektronisch emuliert und nicht über Mund und Rachenraum verändert.

So funktioniert eine Talkbox

Bei der Talkbox trifft man immer wieder auf zwei größere Irrtümer: „Das ist so ähnlich wie ein Vocoder“ und „Da singt man in einen Schlauch“. Über die Funktionsweise des Vocoders will ich mich an dieser Stelle gar nicht lange auslassen, dazu haben hier meine Kollegen Erik Steckmann und Peter Grandl (aka Tyrell) einen sehr umfassenden Artikel verfasst („Was ist ein Vocoder? Geschichte, Funktionsweise, Varianten“). Nur eben ganz kurz für alle, die jetzt nicht zwischendurch zu dem lesenswerten Bericht springen möchten: Bei einem Vocoder wird das Eingangssignal (die menschliche Stimme) in definierte Frequenzteile zerlegt, indem es durch eine Reihe von Bandpassfiltern geleitet und mit Hilfe von Gleichrichtern in Spannungswerte gewandelt wird. Daraus werden in einem Envelope-Follower dann die Modulationssignale erstellt und diese dann auf den Carrier angewendet. Dieser wird dazu in gleichartige Frequenzbestandteile zerlegt, wobei die Lautstärke der Bänder durch die vorher gewonnenen Modulationssignale dynamisch verändert wird. Wer es genauer wissen möchte, sei an den oben genannten Artikel verwiesen.

In einer Talkbox dagegen wird nichts elektronisch in Bestandteile zerlegt und umgewandelt. Um ihre Funktionsweise zu verstehen, müssen wir zuvor einen kurzen Abstecher in die menschliche Anatomie unternehmen und schauen, auf welche Weise unsere Stimme Töne erzeugt. Dazu müssen wir zuerst einmal einatmen, um dann die eingeatmete Luft über den Kehlkopf wieder nach draußen zu befördern. Dort befinden sich die elastischen Stimmlippen, deren bindegewebigen Anteil man übrigens als Stimmbänder bezeichnet, die die mediale Kante der Stimmlippen bilden und so die Stimmritze einfassen. Die ausströmende Luft drückt die Stimmlippen auseinander, wodurch dort ein Unterdruck entsteht, der dafür sorgt, dass die Stimmlippen wieder zusammengepresst werden. Durch den schnellen Wechsel von Öffnen und Schließen geraten die Stimmbänder in Schwingung, es wird ein Primärklang – auch Kehlkopfklang genannt – erzeugt. Durch die Anspannung der Muskeln des Kehlkopfes werden auf diese Weise dann hohe Töne erzeugt, erschlaffen die, gibt’s tiefere Töne. Die bei Männern aufgrund der längeren Stimmlippen (bis zu 25 mm gegenüber ca. 15 mm bei Frauen) dann noch tiefer sind als bei Frauen.

Nun ähnelt der Kehlkopfklang eher einem Geräusch und muss erst noch verstärkt werden. Das geschieht in den Resonanzräumen unseres Kopfes, also Mund- und Nasenhöhlen und der Rachenraum – unsere körpereigenen Lautsprechersysteme. Beim Singen oder Schreien wird dann sogar der ganze Körper zum Resonanzraum.

Ok, Töne haben wir, aber noch keine Worte. Die notwendige Artikulation erfolgt im Mundraum mit Hilfe von Zunge, Lippen und Zähnen. Zahnstellung, Zungengröße und Lippenform, aber auch die Beschaffenheit der Resonanzräume sind daher auch entscheidend für den individuellen Klang unserer Stimme.

Der Aufbau einer Talkbox

Nachdem wir das geklärt haben, schauen wir uns mal den Aufbau einer Talkbox näher an. Der eigentlich ziemlich simpel ist: Ein massives Metallgehäuse (stabil, weil Bodentreter), ein Verstärker (zumindest in den neueren Versionen), ein in einer Druckkammer montierter Lautsprecher (in der Form eines Kompressionstreibers mit einem Hornlautsprecher/Hochtöner, wie sie in Bühnenmonitoren oder JBL-Studiomonitoren verwendet werden) mit einer möglichst luftdichten Verbindung zu einem Plastikschlauch, eine Eingangsbuchse, um ein Audiosignal aus Keyboard oder Gitarre aufzunehmen, eine Ausgangsbuchse, um da Signal bei Bedarf auch unbearbeitet weiter an den Mixer/Amp zu schicken und einen Umschalter, mit dem ich das Signal eben entweder an den Talkbox-Lautsprecher oder an den externen Lautsprecher umleiten kann (ebenfalls nur bei den neueren Modellen wie die MXR).

Schalte ich nun um auf den internen Lautsprecher, wird das in der Talkbox verstärkte Signal in den Schlauch geleitet, dessen anderes Ende im Mund des Musikers steckt. Der dann durch die im Abschnitt „Anatomie“ beschriebenen Artikulationswerkzeuge – also Zunge, Lippen, Zähne etc. – die auftreffenden Schallwellen formt. Der Schlauch ersetzt also die ausströmende Luft und die Stimmlippen – die haben nämlich jetzt Pause (Was in Coronazeiten den Vorteil hat, dass man singen kann, ohne vermehrt Aerosole in die Luft zu blasen.) Womit wir dann beim zweiten Talkbox-Irrtum angekommen wären: Man spricht oder singt nicht in den Schlauch, sondern formt lautlos (!) die ankommenden Töne, die dann über die körpereigenen Resonanzräume verstärkt werden. Um die aufzunehmen, muss man sich aber direkt vor ein Mikrofon stellen; der Audioausgang an der Talkbox ist lediglich dazu da, das Signal bei Bedarf am Schlauch vorbei unbearbeitet zum externen Speaker zu schicken.