Schlauer Reverb Hall mit künstlicher Intelligenz
August 2020: Die Firma Sonible aus Österreich wartet mit einem neuen Reverb Plugin auf. Es hört auf den Namen Smart Reverb und nutzt u. a. künstliche Intelligenz. In der für Sonible typischen Schreibweise mit hippem Doppelpunkt, smart:reverb, wird das Plugin den Audioschaffenden angeboten und soll mit K.I. schnelle Lösungswege in Sachen maßgeschneiderter Verhallung anbieten.
Sonible
Mit knapp unter 20 Köpfen präsentiert man sich auf der Sonible Website, ein Viertel davon zuständig für die Software-Entwicklung. 2013 von 3 Absolventen der TU Graz gegründet, arbeitet man an praxisbezogenen Innovationen und eigenen Problemlösungen mit weiter gedachten Ansätzen. Die Sonible Produktpalette umfasst Hardware wie auch Software, zu Ersterem zählen mehrkanalige Leistungsverstärker, 3D Audio-Speaker, DI bzw. Medienkonverter. Die Software umfasst Plugins für DAWs unter Mac und Windows.
Nutzerorientierte Technologien sollen mit unkompliziertem Workflow die Visionen und Ideen der Anwender unterstützen, Ausdruck und Interaktion durch Klang ermöglicht werden. Der Test zeigt sowohl die nötige Technik als auch das resultierende Klangergebnis.
Smart Reverb Plugin
Die Philosophie, sich künstlicher Intelligenz K.I. zu bedienen, ist für das österreichische Unternehmen zu einer Art Aushängeschild geworden. Im Bild unten ist die FX-Palette zu sehen, die es aktuell (Stand August 2020) zu kaufen gibt. Allen K.I.-gestützten Software-Produkten ist der Zusatz „smart“ beigestellt. Wer gerne querlesen möchte, anbei der Link zum Test des smart:comp von Sonible.
Bedienoberfläche
Das smart:reverb Plugin arbeitet mit einer zentralen Oberfläche, gegliedert in drei Matrix-Fenster: der weiße Pfeil zeigt die Reverb-Matrix, die vier Charakteristika wählen lässt, der gelbe Pfeil das Partikel-Display, der rosa Pfeil den Temporal Shaper. Ferner einen Tachometer-ähnlichem Reverb und Pre-Delay-Anzeiger, darauf zeigt der blaue Pfeil. Das alles ist auf dem linken Bild zu sehen.
Den drei Fenstern zugeordnet sind Unterfunktionen, die die Werte der jeweiligen und vorherigen Matrix verändern. Das Plugin kann sowohl standalone als destruktiv gerenderter Effekt und auch in Echtzeit betrieben werden. Zum Ausprobieren ist der Real-Time-Einsatz sinnvoll, im Hintergrund läuft dann das Originalsignal von der DAW und man schraubt so lange an den Einstellungen, bis man zufrieden ist.
Außer den Parametern im Partikel Display und der Temporal Shaper Matrix können alle anderen Parameter in der jeweiligen DAW genutzten Audio-Software automatisiert werden. Ist die Reverb-Matrix erst eingestellt, so ergeben sich die Hallereignisse entsprechend dieser Vorgabe.
Funktionen, Parameter, Signal-Flow
Das Sonible smart:reverb Plugin scannt bzw. lernt das Audiosignal der zugrunde liegenden Spur und bietet dem User sieben voreingestellte Optionen an. Universal, Drums, Snare, Guitar, Keys, Vocals, Speech stehen zur Auswahl, wobei universal alles abdecken soll, was nicht in die Kategorie der anderen sechs Vorschläge fällt. Grundsätzlich sind das melodische, rhythmische, lange, kurze und modulierende Signale, die das Plugin per Scan analysiert und deren Struktur lernt. Genau hier greift die K.I. und schlägt dem Audiosignal ein Hallereignis vor. Die Parameter dazu haben die Erfinder geschmacklich definiert. Soweit der Überblick der Hauptfunktionen.
Das smart:reverb Plugin bietet Features wie A/B-Vergleich, mehr als ausreichende Undo-Schritte, Veränderung der Reverb-Time und des Pre-Delay für eine passende Raumgröße zum Audiosignal. Für kreative Spielereien sind Freeze und Infinite Button zu bedienen: Freeze friert einen kleinen Teil des Signals ein und Infinite macht den Hall quasi unendlich klingend, das kann bei Musikproduktionen nette Effekt hervorrufen, wenn mit mehrschichtigen Layern gearbeitet wird. In den Klangbeispielen habe ich das mit dem Keys Sound ausprobiert.
Eine wichtige Info seitens Sonible ist auch, dass das originale Dry-Signal nicht verändert wird und die Scan-Funktion stets dieselbe ist, wenn man zehn Mal am Stück dasselbe spielt und wieder scannen lässt.
So kann eine Regelmäßigkeit und Reproduzierbarkeit gewährleistet werden und man ist keiner Willkür ausgeliefert. Jedoch ist der Lernprozess ein Mal pro Scan aktiv, das Hall-Ereignis kann im selben Plugin dann nicht noch mal neu gescannt werden, um weiter zu lernen.
Tipps und Tricks
Ich persönlich höre mir immer zu Beginn den 100 % Wet-Wert eines Effekts an, um das Maximum des Sounds zu kennen. So kann ich beurteilen, wie weit das Signal zum Rest der Klangumgebung passt und wie viel Anteil zum trockenen Signal dazugegeben werden müssen. Das smart:reverb bietet diese Möglichkeit. Sowohl das Dry- als auch das Wet-Signal können stufenlos von 0 – 100 skaliert werden. Daraus ergeben sich alle Mischverhältnisse.
Der Halleffekt als solcher kann auch verstärkt werden, wenn die Haupt-Durchsetz-Frequenz des Input-Signals zusätzlich mit dem Plugin EQ geboostet wird. So bleibt der gesamte Hallanteil unten, aber der Halleffekt ist trotzdem gut hörbar. Gerade bei kleinen FX-Räumen ist das oft sinnvoll.
Anmerkung: Zu sehen ist das Popout-EQ-Fenster im rechten Bild der Bedienoberfläche, weiter oben im Test das rechte Bild mit dem weißen Pfeil.
Es ist unbedingt sinnvoll, das gescannte Signal einer Feinjustierung zu unterziehen. Möchte man Hall auf ein Stereo-Drum-Signal geben, aber nur die Mitten und Höhenanteile anders verhallt darstellen, kann sogar die Verbreitung des Hallanteils, Spread, frequenzabhängig geregelt werden, ganz intuitiv mit farblich klarer Darstellung. So erreicht das smart:reverb Situationen, die sonst nur mit zusätzlichem EQ bzw. Kompressor erreicht werden können.
Das gescannte Signal kann per Reverb-Matrix in vier Reverb-Grundrichtungen verändert werden Nutzt man zusätzlich zu diesem Sound noch die Feinjustierung Width, Colour und Clarity, ist der Weg zum komplett zufriedenstellenden Sound noch schneller gewährleistet, denn oftmals verändert der Hallanteil auch die EQ-Kurve und die drei besagten Regler greifen helfend ein. Width ist ein statischer Mid-Side-Encoder, jedoch ohne zeitliche Relevanz.
Das Plugin könnte auch als Standalone-Hallgerät, beispielsweise auf einem Aux-Weg genutzt werden. Ganz ohne dass ein Recording oder eine Postproduktion passieren muss. Die Schnittstellen VST, AU und AAX könnten ja das Plugin auch via Hardware-Controller fernbedienbar machen. Das konnte ich hier leider nicht testen, da mit eine entsprechende Hardware fehlt, solltet ihr so was haben, dann immer her mit den Kommentaren dazu.
Ab ins Extreme
Mit dem smart:reverb Plugin kann man so einiges anstellen:
Die Partikel Display Matrix ist eine Kombination aus der Darstellung von Decay, Spread und Density, grüne, orange und rote Darstellung im Plugin. Das Decay (Zeitdauer des Nachhalls x-Achse) ist mit der Frequenzdarstellung (y-Achse, 20 Hz – 20 kHz) kombiniert. Vier feste Frequenzpunkte der y-Achse sind drei hin- und herschiebbaren Punkten der x-Achse zugeordnet.
In der Praxis bedeutet dies, dass man sich vom komplett dargestellten Hallereignis die vier Frequenzen 20 Hz, 200 Hz, 2 kHz und 20 kHz schnappen kann und diese zeitlich früher oder später kommen lassen kann, genau das ist im realen Leben bzw. in realen Hallsituationen nicht möglich.
Auch kann die Decay Zeit in der anderen Matrix per Kurve von 100 % auf 0 % und wieder auf 100 % gezogen werden. Das klingt in etwa so, als wenn jemand eine Metallschüssel im Bad fallen lässt, diese dann lautstark scheppert, man dann eine dicke Wolldecke drauf wirft, aber dann die Wolldecke wegnimmt und die Schüssel weiter scheppert.
Editiert man im Partikel Display Matrix noch die orange Kurve Spread, kann die Ausbreitung des Hallsignals zusätzlich wie ein Highpass-Filter beschnitten werden. Liegt die Kurve ganz unten bei 20 Hz an, ist der Spread Faktor (Panorama) im vollen Frequenzgang vorhanden. Wandert die Kurve nach oben, ist der darunter liegende Hall-Frequenzanteil nicht mehr als Ausdehnung zu hören. Wenn man die Kurve auf 20 kHz schiebt, ist die Funktion Spread unbeschnitten.
Die rote Kurve Density (Dichte) kann nur in der Temporal Shaper Matrix editiert werden, nicht aber in der Partikel Display Matrix. Dort sieht man die Dichte, die mit sich bewegenden roten Bubbles dargestellt ist. Density ist die Anzahl der Reflektionen, die im echten Raum im Zeitverlauf immer weiter zunimmt.
Generell gilt für die Temporal Shaper Matrix: Die Kurven für Decay, Spread und Density können an zwei frei wählbaren Punkten der x-Achse individuell verändert werden.
Sofort werden die Hallwerte, die optisch durch sich bewegende Kugeln dargestellt werden, intensiver oder schwächer in der Partikel Display Matrix.
Die K.I. Komponente und das Sonible Know-how
Es klingt schon spannend, wenn ein Plugin K.I. zum aufgenommenen Signal hinzufügt bzw. das Signal unter K.I. Aspekten scannt. Doch wie wird denn K.I. für das Signal definiert, wer bestimmt denn, was am Ende schön klingt und ob das gescannte denn wirklich zu meinen Vorstellungen passt?
Ich sehe die Herangehensweise mit K.I. nur als weiteren Weg oder Angebot, Sounds zu verfremden oder neu zu schaffen. Die Wege zum Endmix sind verschieden, entweder man hat eine genaue Vorstellung, was man will und sucht solange, oder man lässt Vorschläge wie etwa Presets auf sich wirken und macht dann mit diesen Vorgaben weiter.
Sonible ist jedoch mit diesem Ansatz zu diesem Plugin ohne Konkurrenz. Wie es geht? Der Scan errechnet gewisse Statistiken aus dem Signal, dazu die zeitlich und spektrale Entwicklung. Basiert auf diesen Werten wird dann gezaubert und ist Firmengeheimnis.
Klangbeispiele
Die Klangbeispiele sind wie folgt aufgenommen worden:
- 12 String: Taylor, Beyerdynamic MC930, XY
- Drums: John Glynn Methode, 3 Großmembran Condenser Mics, danke an Kai Bergerin
- Sprache: U87, danke an Michael Betz
- Vocals: Aufnahmegerät in heimischer Umgebung, danke an Nicole Schmiedeke
- Vocals: Jochen, TLM 192 via Drawmer 1960
Ihr hört pro Track das trockene Signal, das gescannte Signal von Sonible ohne Edition, mache danach mit individueller Edition nach Gusto bzw. bis zur Extremverfälschung und Soundvergleiche zu anderen Plugins.
KI – das aktuelle buzzword. eine künstliche intelligenz hat – kraft definition – die fähigkeit, selbst zu lernen. dh nach einer weile kann sie mehr als am anfang. das ist hier zweifelsohne nicht der fall. also ist das hier keine KI, sondern ein schlichter algorithmus.
@mdesign Das stimmt. Oder aber eben, dass ein Netzwerk genutzt wird, das vorher gefüttert wurde. Jedes neue sample ist daher eine Abfrage eines solchen. Das Netzwerk selber muss nicht zwangsläufig dadurch neu lernen. Es hat halt also schon KI in der Entwicklung gegeben. So steht es aber ja eben auch da, wenn man sagt „Nutz KI für Blabla“. Insgesamt finde ich es aber auch richtig, dass KI als Buzzwort irgendwie momentan echt ein Verkaufsschlingel ist. Mich lockt das jetzt nicht. Der Klang des Halls ist letztlich entscheidend. Egal ob die Software vorher krass programmiert wurde die richtigen Settings zu finden. Das sagt nichts über den Hall. Und warum sollten die besser klingen als ZB Lexicon…
Preis ist aber ja fair, und wie der Autor sagte, man kann das Ding ja einfach mal testen, schaden tut es nicht. Interessant finde ich die Möglichkeit, Hall so zu steuern, wie es klassische Plugins nicht können. Ob das aber was bringt, ist ein anderes Buch….
@mdesign > KI […] kraft definition – die fähigkeit, selbst zu lernen.
Ähm, nein. Es gibt eine „Lernphase“ und eine „Anwendungsphase“. Das lernen erfolgt immer vorher, und dann gibt man das trainierte neuronale Netz weiter, ohne dass dieses weiter lernt.
Wäre es anders, würde ich meinen Popo niemals in ein selbstfahrendes Auto hieven.
Egal ob nun KI oder nicht – mich nervt das »KI« auch langsam, aber schlussendlich kommt es dann eben doch auf das Einsatzgebiet an – mit dem PlugIn, das nebenbei bemerkt auch nun alles andere als teuer ist, kann man spannende Effekte erzeugen. Ich empfehle hierzu wieder einmal das Video von Onkel Wytse auf dem YouTube-Kanal »White Sea Studio« (auf seinen Gesichtsausdruck achten):
https://www.youtube.com/watch?v=pCa6_p8XpYQ
@Flowwater Von künstlicher Intelligenz zu sprechen entspringt nur der Hybris des Menschen. Es ist nichts weiter als ein Schlagwort. Bis heute ist nicht mal klar, was Intelligenz eigentlich ist und welche Voraussetzungen diese hat. Manche Experten meinen, dazu zähle ein Bewusstsein. Auch ein selbstfahrendes Auto ist nur ein Algorithmus. Erkläre dem selbstfahrenden Auto per Spracheingabe, wie man Schach spielt und fordere es dann auf, am Rastplatz eine Runde zu spielen. Sollte das mal funktionieren, werde ich meine Meinung ändern. Ich bin mir sicher, dass ich das nicht mehr erleben werde. Auch die Menschen in der Zukunft werden dies nicht mehr erleben, denn sie werden sich vorher im Kampf um die nötigen Ressourcen gegenseitig den Garaus machen.
@tantris Ich bin voll auf Deiner Seite.
> […] Auch ein selbstfahrendes Auto ist nur ein Algorithmus. […]
Jein. Es gibt noch einen kleinen aber sehr feinen Unterschied zwischen »KI« (wie sie jetzt schon mit Hilfe von neuronalen Netzen funktioniert) und einem »Algorithmus«. Letzteres ist ein von einem Menschen (zum Beispiel einem »Programmierer«) konstruiert, um einen gewisse Aufgabe zu bewältigen (zum Beispiel mit Hilfe einer Programmiersprache). Der programmierte Code bildet ab, wie auch ein Mensch eine Aufgabe angehen würde.
Die Vorgänge in einem neuronalen Netz sind aber nicht »konstruiert« und nicht »programmiert«. Sie sind »erlernt«. Man weiß nicht, wie und warum ein Neuronales Netz so funktioniert, wie es funktioniert. Man weiß nur, DASS es geht. Die eigentliche Funktionsweise, also wie die Ausgabewerte eines neuronalen Netzes entstehen, das kann man mit einem »Algorithmus« eben nicht nachbilden (oder nur schlecht oder nur beinahe). Es ist auch nicht sinnvoll, denn die »Eleganz« eines neuronalen Netzwerkes besteht ja eben genau darin, dass man es nicht »programmiert«, sondern solange »trainiert«, bis das gewünschte Ergebnis heraus kommt.
Warum und wie ein neuronalen Netz funktioniert, das ist übrigens Gegenstand von ernsthaften Forschungen in der IT-Wissenschaft. Man will das Monster ja auch verstehen können, was man da erschafft.