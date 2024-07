Unmix as unmix can

Mit Steinberg SpectraLayers Pro 11 versucht das Hamburger Softwarehaus bei dem beliebten Spektral-Audio-Editor noch eine Schippe draufzulegen. Gerade die Unmix-Funktionen haben ein deutliches Upgrade bekommen und bieten schon auf den ersten Blick mehr Features als die üblichen Mitbewerber. Hier lohnt es sich, der Software mal ordentlich auf den Zahn zu fühlen.

Steinberg SpectraLayers Pro 11: Installation des Audio-Editors

Neben der kleinen Version von SpectraLayers, die den Namenszusatz „One“ trägt und sich mit Cubase und Nuendo den Weg auf den Studiorechner bahnt, gibt es zwei kostenpflichtige Versionen: Die große Variante mit allen Features hört auf den Namen Steinberg SpectraLayers Pro 11, die abgespeckte Variante nutzt statt Pro schlicht Elements. Der Preisunterschied liegt bei 200,- Euro.

ANZEIGE

Die Elements-Version ist nur für Stereo-Material geeignet (die Pro-Version kann bis zu 7.1) und es müssen Abstriche bei der Bildschirmauflösung, FFT-Anzeige, Undo-Schritten (8 statt 64), Restauration (bspw. Audio Heal), dem Auswählen von Obertönen und – vor allem – bei den Unmix-Funktionen hingenommen werden. Eine genaue Gegenüberstellung findet sich auf der Website von Steinberg als Tabelle.

Die Installation gestaltet sich gewohnt einfach und lautlos über den Steinberg Download Assistenten. 8 GB RAM sollten es sein (16 GB werden empfohlen), mindestens eine Dual Core CPU (bzw. Apple Silicon), 8 GB Festplattenspeicher, mindestens 1280 x 720 Pixel auf dem Monitor und (unter Windows) mindestens OpenGL 3.3-Support (Direct X 11 wäre empfohlen). Das schaffen praktisch alle Rechenknechte, die heute noch produktiv zur Tonproduktion eingesetzt werden.

An Betriebssystemen werden alle aktuellen unterstützt: Mit Windows 10 geht es bei PCs los, Apple-Rechner können ab macOS 11 (Big Sur) bis einschließlich macOS 14 (Sonoma) mit dabei sein – aktuelle Updates sollten allerdings installiert sein. An die Audio-Hardware werden keine besonderen Anforderungen gestellt, aus offensichtlichen Gründen sollten wir hier allerdings nicht mit dem Onboard-Sound der jeweiligen Computer arbeiten, sondern ein entsprechendes Interface nutzen.

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden. Mehr Informationen Inhalt entsperren Erforderlichen Service akzeptieren und Inhalte entsperren

Steinberg SpectraLayers Pro 11 startet direkt nach der Installation erfreulich schnell und präsentiert sich mit einer deutlich aufgeräumteren Oberfläche, als das noch bei Version 10 der Fall war. Die Werkzeuge sind nun übersichtlich organisiert, das erinnert etwas an iZotope RX. Die Layers-Liste am rechten Bildschirmrand lässt sich nun auch kleiner darstellen, das hilft bei der Übersicht, wenn viele Ebenen involviert sind.

ANZEIGE

Künstliche Intelligenz und Unmixing

Nicht erst seit der DNA-Option in Melodyne und Music Rebalance in der iZotopes RX-Suite steht die Frage im Raum, wie ein fertiger Mix noch musikalisch verändert (bspw. mit Melodyne) oder der Mix nachträglich variiert werden kann. Auch das Extrahieren einzelner Spuren – um bspw. Remixe umsetzen zu können – ist schon immer ein gefragtes Feature. In der noch nicht so fernen Vergangenheit musste diese Frage immer mit „das klappt so nicht“ beantwortet werden (ja, die Referenz an Klassiker der Point&Click-Adventures ist hier Absicht). In Hörsälen und Foren wurde oft erklärt, dass die einzelnen Zutaten aus einem Kuchen eben auch nicht wieder zurückgewonnen werden könnten. Ob die Chemie hier weitergekommen ist, ist (mir) nicht bekannt, aber in der Tontechnik sind wir ein großes Stück weitergekommen. Schon früh haben verschiedene Software-Unternehmen Machine-Learning eingesetzt, um Geräusche vom Nutzsignal zu trennen oder einzelne Instrumenten(gruppen) in einer Musikmischung erkennen zu können. Ich schreibe hier bewusst nicht KI, da nicht jede KI auf Deep-Learning oder Machine-Learning basiert. Der KI-Begriff kann deutlich weiter gefasst werden, so dass er in diesen Kontexten nicht immer ganz adäquat erscheint. Bereits in den 1990ern wurden (z. B. für die Gesichtserkennung) solche Systeme eingesetzt. Die Rechen-Power ist heute ungleich größer geworden und manche Computer beherbergen spezielle Chips, die solche „KI“-Prozesse beschleunigen können. Auch der aktuelle Aktienkurs der Firma Nvidia spricht dazu eine sehr deutliche Sprache.

Wer nun keine Vorerfahrung mit den Unmix-Funktionen solcher Programme hat, sollte die Erwartungen nicht allzu hoch schrauben. Das Extrahieren einer Gesangsspur oder einer Bassspur hat klanglich bei Weitem (noch) nicht den Effekt, als würde am Mischpult in der betreffenden Spur Solo gedrückt werden. Um allerdings einen Mix anzupassen oder einem Instrument einen extra Effekt wie Hall oder Delay zu spendieren, reichen die Werkzeuge allemal aus. Auch um für einen Remix die Vocals (oder andere Instrumente) freizustellen, reichen die Tools (meist) aus.

Unmixing von fertigen Stereo-Mixes

Wie bereits angeschnitten, ist das Unmixing von Musik ein lang gehegter Wunsch in unseren Kreisen. Spätestens mit dem Projekt Falco Symphonic wurde gezeigt, was 2007/2008 bereits mit Algorithmix Renovator möglich war. Mittlerweile sind die Prozesse, um einen Musikmix in seine Bestandteile zu zerlegen, deutlich weiter gediehen und augenfällig weiter automatisiert.

iZotope RX bietet mit Music Rebalance eine gute Lösung, der Ultimate Vocal Remover bietet sogar eine kostenlose Lösung, die sich wirklich hören lassen kann. Üblich ist bei diesen Werkzeugen, die Musik in 4-5 Stems zerlegen zu können. Oft angelegte Stems sind Vocals, Bass, Drums/Percussion sowie der Rest. Hier legt nun Steinberg SpectraLayers Pro 11 einen ordentlichen Gang zu! Musikstücke können hier mit Unmix Song in sage und schreibe sieben Stems entmischt werden: Vocals, Bass, Drums, Guitar, Piano, Sax & Brass sowie Other. Mit zwei weiteren Unmix-Funktionen kann hierbei sogar noch weiter aufgeteilt werden. Das bietet nicht mal der direkte Konkurrent iZotope RX.

Die Rechenzeit ist – sofern alle Stems angewählt werden – deutlich bemerkbar. Je nachdem, welcher Rechner eingesetzt wird, ein gutes Vielfaches der Abspielzeit des Songs. SpectraLayers arbeitet mit der Host-CPU oder auch der GPU (sofern eine entsprechende verbaut ist) – bestätigt der Hersteller auf Nachfrage. Um hier Zeit zu sparen, kann die Qualität in drei Stufen reduziert werden: Extreme bietet die beste Qualität, High eine recht gute und die Einstellung Fast legt mehr Wert auf Geschwindigkeit, denn auf Qualität.

Das Klangergebnis bzw. die Separationsgenauigkeit hängt nicht nur von diesen Einstellungen ab, sondern selbstverständlich auch vom Songmaterial selbst. Teilweise werden Zischlaute dem falschen Stem bzw. dem falschen Layer zugewiesen. Wichtig zu erwähnen ist, dass SpectraLayers Pro 11 keine Klanganteile verwirft: Werden alle Layers zusammen wiedergegeben, ist das Musikstück in voller Klangqualität zu hören.

Soweit die Theorie und die konnte bei dem Klangmaterial, das ich zum Testen genutzt habe, nur bestätigt werden. Beim Test tauchten manche Instrumente in einzelnen Teilen bei Klavier und weitere auf, auch wenn es sich dabei gar nicht um ein Klavier handelt. Selten ist dieses Verhalten auch bei manchen Gitarrensounds zu beobachten. Das dürfte auch den verwendeten Gitarren-Effekten geschuldet sein.

Sollen nur die Pegelverhältnisse der einzelnen Stems zueinander etwas angepasst werden, ist meist kein zusätzliches Editing notwendig, auch wenn bzw. der Sängerin noch etwas Hall spendiert werden soll. Werden die Stems jedoch zur Grundlage einer neuen Produktion genutzt, kann etwas Nachbearbeitung erforderlich werden. Dazu ist es möglich Klanganteile von einem Layer auf ein anderes zu transferieren. Sind wirklich nur ein paar Zischlaute (etc.) auf die falsche Ebene gewandert, ist das mit ein wenig Bearbeitung (die übrigens durchaus an das Werkeln mit Photoshop erinnert) zu bewerkstelligen. Mit dem Grad an Perfektionismus steigt auch die Bearbeitungszeit, die investiert werden muss. Der Clou am Transferieren auf ein anderes Layer ist, dass keine Signalanteile verschwinden, sondern (im Idealfall) dem jeweils korrekten Layer zugeordnet werden.

Ob SpectraLayers Pro 11 nun generell besser ist als iZotope RX11, kann so allgemein nicht beantwortet werden. Wenn berücksichtigt wird, dass SpectraLayers nun deutlich mehr Stems extrahieren kann als RX, gewinnt die Steinberg-Software hier auf der ganzen Linie. Wenn es um Separationsgenauigkeit geht, ist diese mindestens gleich auf – das Audiomaterial hat eben auch einen Einfluss auf das Ergebnis. Wenn nun noch die Korrekturmöglichkeit mit dem Transferieren auf andere Layers berücksichtigt wird, gewinnt SpectraLayers sehr deutlich.



Hier ein Audiobeispiel zum Thema Song-Entmischen. Ein Vergleich mit früheren Tests zu iZotope RX und SpectraLayers ist erwünscht:

Drum- und Vocal-Demixing in Steinberg SpectraLayers Pro 11

Die Funktion Unmix Song kann sich bereits hören lassen. Allerdings ist Steinberg noch weiter gegangen, und spendiert der elften Version des Spektraleditors weitere Entmisch-Funktionen:

Drum-Loops (oder ein entmischter Schlagzeug-Stem) können noch weiter separiert werden. Es lassen sich Bass-Drum, Snare, HiHat und Becken als einzelne Layer extrahieren. Klanglich ist diese Unmix-Funktion nicht mit der Unmix Song-Option auf Augen- bzw. Ohrenhöhe, aber um Instrumente einer Drum-Loop unterschiedlich zu bearbeiten, reicht es in aller Regel locker aus. So kommt der Hall auf die Snare oder der Kompressor auf die HiHat und das zu laute Ride-Becken wird endlich leiser. Warum das nicht gleich in die Unmix Song Funktion integriert wurde, ist allerdings unklar. Um aus fertigen Loops oder Aufnahmen wertige Samples zu generieren, reicht Unmix Drums allerdings (meistens) bei Weitem nicht immer aus, es kommt eben auf das Audiomaterial an. Shaker wandern meist auf den HiHat-Stem, Toms auf den Snare-Stem und im Test gab es auch ein Fall, bei dem der Attack der Snare-Drum im Bass-Drum Layer zu finden war. Percussion wurde im Test oft zwischen dem HiHat und Becken-Layer aufgeteilt – je nach Ausgangsmaterial.

Gerade wer Remixe von Songs erstellen will, wird sich wünschen, die Lead-Vocals und den Chor-Gesang sauber trennen zu können. Steinberg SpectraLayers Pro 11 bietet auch hier eine Funktion an: Unmix Chorus. Damit lassen sich aus einem Gesangs-Stem die Backing-Vocals von den Lead-Vocals trennen. Auch diese Separation arbeitet bei Weitem nicht so gut wie die Unmix Song Funktion, allerdings schon erschreckend gut – je nach Ausgangsmaterial. In manchen Fällen wurden selbst zweite Stimmen in enger Lage vom selben Sänger sauber erkannt, in manchen der komplette Chor im Refrain als Backing-Vocals. In 1-2 Jahren dürften sich bei den neuen Unmix-Funktionen sehr deutliche Verbesserungen abzeichnen! Geht es „nur“ darum die Pegelverhältnisse zu korrigieren oder dem Chor mehr Hall zu verpassen oder auch Backing-Vocals neu einsingen zu lassen, hilft diese Funktion definitiv (meist) weiter. Wer supercleane Studio-Spuren haben möchte, wird sich genau diese geben lassen müssen. Je nach Audiomaterial sind aber auch diese Separationen wirklich sehr gut.

Beispiele zum Entmischen von Drums und Gesang:

Audio-Restauration mit Steinberg SpectraLayers Pro 11

Zwei Unmix-Funktionen in Steinberg SpectraLayers Pro 11 lassen sich auch gut als Restaurationsfunktion begreifen: Unmix Crowd Noise und Unmix Multiple Voices.

Unmix Crowd Noise kann die Geräusche, die ein Publikum bei Konzerten, Podiumsdiskussionen und Live-Podcasts produziert, recht zuverlässig von Restsignal trennen. Mit Musik klappt es – nach unseren Tests – besser als bei Wortproduktionen. Auch hier können natürlich Signalanteile im falschen Layer landen, aber das lässt sich ja korrigieren. Auch hier gilt: Soll das Publikum leiser gemacht werden (oder in die Surround-Kanäle gemischt werden), ist die Bearbeitung mit einem Handgriff erledigt. Soll das Publikum komplett entfernt werden, kann es – je nach Audiomaterial – auch hier zu Artefakten kommen. Bei den Tests mit Musikaufnahmen sind allerdings keine echten Probleme aufgetreten.

Wer in der Podcast-Szene unterwegs ist und oft Talkgäste hat, live die Podcasts produziert oder unter nicht gerade idealen Bedingungen aufzeichnen muss, könnte öfter in die Verlegenheit kommen, dass die Stimmen zusammen auf einer Audiospur landen. Mit Unmix Multiple Voices lässt sich das nachträglich korrigieren. Gerade hier fallen falsch zugeordnete Zischlaute am deutlichsten auf und auch eine Korrektur muss sehr behutsam angegangen werden, da Fehler bei diesem Anwendungsfall am meisten auffallen werden. Zwar dürfte diese Unmix-Funktion diejenige sein, die am deutlichsten von zukünftigen Entwicklungen und Updates profitiert, aber schon jetzt kann sie wichtige Dienste leisten. Wenn eine oder mehrere Personen im Recording zu leise oder zu laut sind, lässt sich das sehr einfach schon jetzt korrigieren. Besonders im Bereich Doku, Feature und aktueller Berichterstattung (TV, Radio und On Demand) dürften diese beiden Unmix-Funktionen am meisten weiterhelfen können, tolle Features. Beim Test ist allerdings aufgefallen, dass es nicht für alle Stimmpaarungen gut funktioniert! Manche Audiodateien, bei denen zwei Stimmen ununterbrochen sprechen, wurden fast vollständig sauber getrennt, andere – wo sich die Sprechenden nur ins Wort fallen – wimmelten nur so von Fehlern, bei denen dann manchmal das Layer von Stimme 1 beide Sprecher enthielt oder keine. Evtl. sollte Steinberg den Unmix-Funktionen mehr Parameter und Trainingsmöglichkeiten für die Endanwender zur Verfügung stellen.

Klartext, hier hängt das Ergebnis besonders stark vom Ausgangsmaterial ab! Wenn die Stimmen (aus Sicht der KI) zu viele Gemeinsamkeiten haben, wird es schwer. Gepitchte Stimmen sind allerdings wohl nochmal schwerer für die KI – so Steinberg auf Rückfrage.

Das Voice DeNoise Modul wurde verbessert und verkürzt den Abstand zu den Marktbegleitern nochmal deutlich. Obwohl iZotope in den letzten Updates nicht so stark nachgelegt hat wie Steinberg, wird gerade mit dem neuen Tool aus dem Hause Waves das Feld wieder diverser und härter umkämpft – gut so.

Das Voice DeNoise Modul hat im Test sehr gute Ergebnisse erzielt, ohne dass der Geräuschanteil trainiert („gelernt“) werden musste – bravo. Allerdings drängt sich beim Testen der Eindruck auf, dass iZotope RX noch ein wenig die Nase vorne hat. Klar ist auch, dass der Abstand kleiner geworden ist.

War es früher praktisch unmöglich, eine stärker übersteuerte Aufnahme wirksam zu retten, sind mittlerweile einige Tools auf dem Markt, die sich genau das auf die Fahnen geschrieben haben. Und Steinberg SpectraLayers Pro 11 bietet mit Voice DeClip nun auch ein Tool an, das auf Machine Learning basiert und diese Aufgabe bewältigen soll. Um es kurz zu machen: Das Modul erzielt teils erstaunliche Klangverbesserungen bei übersteuerten Sprachaufnahmen. Allerdings auch wieder abhängig vom Ausgangsmaterial. Eine klare Verbesserung brachte Voice DeClip bei Übersteuerungen im Test immer. Klar sollte aber auch sein, dass eine korrekt ausgesteuerte Aufnahme deutlich besser klingt als die gerettete. Bei allen Härtefällen ist die Rekonstruktion nicht perfekt, kann aber einen nicht nutzbaren O-Ton (gerade im Doku-Bereich oder in der aktuellen Berichterstattung) „retten“ – gut so.

Beispiele zum Entfernen von Störgeräuschen, Voice DeClip und Beseitigung von Verzerrung:

Werkzeugpalette und Modulansicht

Wie bereits angedeutet, wurde in Steinberg SpectraLayers Pro 11 die Werkzeugpalette deutlich übersichtlicher gestaltet. Die Modulansicht lässt sich nun nach Aufgaben filtern. Es können alle Werkzeuge oder nur die Unmix-, Restaurations- oder sonstige Utilities angezeigt werden. Das schafft Ordnung und erübrigt Suchereien. Das dürfen die Mitbewerber gerne kopieren. Bei Bedarf können nun auch ganze Modul-Ketten angelegt und auf unterschiedliche Layers angewandt werden.

Etwas schade ist, dass Steinberg WaveLab noch immer keinen ARA-Support anbietet und Steinberg SpectraLayers Pro 11 auch keinen „internen“ Zugang zur Direktintegration in WaveLab bietet. Das ist insofern unverständlich, da diese Kombination – gerade durch die guten Ergebnisse und der durch eine vollständige Integration gegebenen Bequemlichkeit – ein echtes „Killer-Duo“ für die Marktbegleiter wäre. Immerhin legt Steinberg auf Nachfrage nahe, dass die Zusammenarbeit mit WaveLab in künftigen Versionen verbessert werden soll. Das ist auch dringend notwendig.

Im Rahmen des Tests wurde auch eine Audiodatei mit sogenannten Bereichsmarkern zu SpectraLayers exportiert. Nachdem die Audiodatei bearbeitet und wieder in WaveLab geöffnet wurde, waren aus den Bereichsmarkern simple Standardmarker geworden. Das ist nicht akzeptabel, zumal beim gleichen Vorgehen mit iZotpe RX die Marker immer erhalten geblieben sind.

Anmerkung: Der Test wurde, aus redaktionellen Gründen, mit der Version durchgeführt, die vor dem Hotfix am 01.07.2024 veröffentlicht wurde.